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Przedmowa 


Encyklopedia fizyki współczesnej jest pierwszą w Polsce próbą przeglądu za¬ 
gadnień fizyki współczesnej na poziomie, który umożliwi korzystanie z niej 
tym wszystkim czytelnikom, którzy fizykę i matematykę znają w zakresie szkoły 
średniej. Nie jest to encyklopedia w tradycyjnym znaczeniu tego słowa. Nie ma 
w niej bowiem haseł definicyjnych dotyczących poszczególnych pojęć, zjawisk 
i praw, są natomiast dłuższe artykuły przeglądowe, obejmujące pewną całość 
tematyczną (np. Cząstki elementarne, Magnetooptyka, Kwasy nukleinowe). 
Artykuły są pogrupowane tematycznie w działy. Czytelnik, który chciałby 
sobie wyjaśnić jakieś pojęcie czy termin, może korzystać ze szczegółowego sko¬ 
rowidza terminów, pojęć i wzorów, ułatwiającego znalezienie odpowiedniego 
miejsca w artykule przeglądowym. 

Fizykę współczesną stanowi zespół zagadnień, które w obecnej dobie są te¬ 
matem zainteresowań i badań fizyków. W Encyklopedii zostały omówione prze¬ 
de wszystkim zagadnienia najciekawsze, bądź ze względu na ich wartość poz¬ 
nawczą, bądź też ze względu na nowe i ważne zastosowania w fizyce szeroko 
pojętej, w technice i w życiu codziennym. 

Spotykamy się często z poglądem, że na pograniczu fizyki i innych nauk przy¬ 
rodniczych powstało szereg specjalności, jak astrofizyka, biofizyka, geofizyka, 
chemia kwantowa itd. Piszącemu te słowa wydaje się, że są to właściwie nowe 
gałęzie fizyki, która w postępującym od dawna procesie integracji wchłania 
dyscypliny uważane przez jakiś czas za niezależne gałęzie wiedzy. I tak np., gdy 
w latach trzydziestych naszego stulecia dzięki rozwojowi fizyki jądrowej udało 
się wskazać źródło energii gwiazd, częścią fizyki stała się astrofizyka, natomiast 
część astronomii zajmująca się badaniem ruchu ciał niebieskich stała się częścią 
fizyki jeszcze w czasach Newtona. Podobnie, gdy dzięki mechanice kwantowej 
udało się zrozumieć budowę atomów i cząsteczek oraz istotę wiązań chemicz¬ 
nych przez sprowadzenie procesów chemicznych do kwantowych elektromagne¬ 
tycznych oddziaływań elektronów, gałęzią fizyki stała się w znacznej mierze 
chemia. 

Wracamy więc pęwolido pierwotnego znaczenia fizyki jako wszechogarnia¬ 
jącej nauki o całej przyrodzie (gr. physis natura’). W taki właśnie sposób 
pojmowano fizykę przez stulecia. Na przykład typowy siedemnastowieczny 
podręcznik fizyki Traite de physiąue Jacąuesa Rohaulta, wydany w Paryżu 
w 1671 r., zawiera nie tylko fizykę sensu stricto, lecz także kosmologię, astro¬ 
nomię, meteorologię, geografię, fizjologię i medycynę. Z piśmiennictwa pol¬ 
skiego przypominamy piękną definicję fizyki z gimnazjalnego podręcznika fizyki 
wydanego w Wilnie w 1825 r., napisanego przez Feliksa Drzewińskiego, pro¬ 
fesora Uniwersytetu Wileńskiego: 
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„Fizyka nazwisko nauki pochodzące od wyrazu greckiego Physis , natura, przyrodzenie, 
oznacza nauką poznawania natury. Przyrodzeniem, albo naturą zmysłową, zowiemy to wszys¬ 
tko cokolwiek działa na zmysły nasze, i sprawuje w nas czucie. Wszystkie więc rzeczy nas 
otaczające, których się dotykamy, na które patrzymy, to co słyszymy, co działa na zmysły 
smaku, i powonienia, wszystko to stanowi naturę zmysłową, i poznawanie tego wszystkiego 
do Fizyki należy. Przeto Fizyka jest nauką poznawania rzeczy świat składających, badania 
i dochodzenia ich własności. 

Rzeczy składające świat fizyczny, to jest zmysłom naszym dostępny, są niezmiernie liczne, 
i rozmaitemi własnościami obdarzone. Cała ziemia i części ją składające, istoty na niey i we¬ 
wnątrz jey umieszczone, niebo i to co na niem postrzegamy, powietrze w którem żyjemy, bu¬ 
dowa nas samych i innych podobnych nam jestestw, to wszystko stanowi świat zmysłowy. 
W epokach zaczęcia nauk, badania tych wszystkich rzeczy stanowiły jedną naukę, mającą 
ogólne nazwisko Fizyki: taką miały fizykę starożytne narody Egipcyan, Greków i Rzymian. 

Poznawaniem coraz bliżey tylu rozlicznych przedmiotów, i odkrywaniem w nich coraz 
więcej nowych własności, gdy nauka z czasem uzrosła, i stała się bardzo obszerną, uczeni 
wieków późnieyszych podzielili ją na wiele odnog, albo części, z których głównieysze są na¬ 
stępujące: lód Nauka uważania nieba, albo raczey położeń, ruchów, i postaci brył światłych 
widzianych, w przestrzeni niebios; tę część fizyki Astronomiją nazywamy. 2re Oznaczanie 
kształtów istot znaydujących się na ziemi i w ziemi, w wodzie i powietrzu, należy do oddziału 
Fizyki, zwanego Historyą nataralną. 3cie Uważanie wewnętrzney budowy tych istot, stanowi 
naukę zwaną Anatomiją. 4te Dochodzenie pierwiastków, czyli nayprostszych części, z jakich 
się składają istoty w naturze, i na jakie ostatecznie rozebrać się, rozdzielić, albo rozłożyć mogą, 
jest przedmiotem Chemii 

Wzorem naszych przodków sprzed 150 lat przedstawiamy zatem Czytelni¬ 
kom encyklopedię traktującą o tak szeroko pojętej fizyce, a także ojej wielora¬ 
kich związkach z techniką. 

Jak powiedzieliśmy wyżej, zakładamy u Czytelnika w zasadzie znajomość 
fizyki i matematyki na poziomie szkoły średniej. Nie ma.więc w Encyklopedii 
wyjaśnienia takich pojęć i zagadnień, jak np. siła, prędkość, prawo Ohma, pra¬ 
wo Coulomba, co nie oznacza, że elementarne pojęcia nie są czasem przypomi¬ 
nane w kontekście omawiania innych zagadnień. Encyklopedia fizyki współ¬ 
czesnej stanowi w pewnym sensie uzupełnienie trzytomowej Ekcyklopedii fizyki 
w tradycyjnej formie, jaką wydało Państwowe Wydawnictwo Naukowe przed 
kilku laty. 

Encyklopedię otwiera kilka artykułów wprowadzających w podstawowe 
pojęcia, prawa i strukturę fizyki oraz charakteryzujących fundamentalne 
wielkie teorie fizyki współczesnej. Następne artykuły są uporządkowane w dzia¬ 
ły traktujące o obiektach fizycznych w porządku wzrastających rozmiarów i zło¬ 
żoności, od cząstek elementarnych, przez jądro atomowe, atom, cząsteczkę do 
złożonych struktur biologicznych, za którymi następują działy obejmujące 
artykuły o Ziemi jako planecie oraz o Wszechświecie. 

Pomysł opracowania Encyklopedii fizyki współczesnej narodził się w końcu 
1973 r. We wstępnym stadium opracowania założeń programowych Państwo¬ 
we Wydawnictwo Naukowe uzyskało obszerne wypowiedzi ankietowe od kilku¬ 
dziesięciu wybitnych specjalistów z różnych dziedzin fizyki. Zebrane cenne 
uwagi pozwoliły na opracowanie wstępnego zestawu artykułów hasłowych, 
który w trakcie pracy nad Encyklopedią nabrał ostatecznego kształtu. Dodajmy, 
że w ciągu kilku lat przygotowywania artykułów następował postęp w wielu 
działach fizyki tu omawianych, co nakładało na autorów poważny obowiązek 
uaktualniania tekstów. Encyklopedia fizyki współczesnej , pierwsza publikacja 
tego typu na naszym rynku księgarskim, mogła powstać tylko dzięki życzli¬ 
wemu stosunkowi i pomocy wielu osób, których nie sposób wymienić, a którym 
składamy w tym miejscu gorące podziękowanie. Ostateczny osąd wartości dzie¬ 
ła należy do Czytelników, którym życzymy przyjemnej i pożytecznej lektury. 

Andrzej Kajetan Wróblewski 
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drowych 203 
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Widmo wodoru 286 
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Zderzenia wymienne 296 
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magnetycznym 316 
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Spektroskopia rezonansów magnetycznych 
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Fundamentalne zasady 
p rzy rorioznawstwa 


Fizyka jest najbardziej podstawową nauką przyrod- 
niczą, zajmującą się badaniem strukturalnych i dy¬ 
namicznych praw przyrody. Jednym z najważniej¬ 
szych zadań fizyki jest poznanie fundamentalnych 
i uniwersalnych własności materii wspólnych wszyst¬ 
kim lub przynajmniej wielu różnym jej formom. 
Z zadania tego wynika podstawowa, integrująca całe 
przyrodoznawstwo rola fizyki. 

Możliwość wykonania tego zadania przez fizykę 
opiera się na dwóch niezwykle ważnych i płodnych 
ogólnych zasadach: jednolitości materii i powszech¬ 
ności praw fizyki. W rozumieniu większości fizyków 
pierwsza zasada odnosi się do strukturalnych, druga 
— do bardziej dynamicznych własności materii. Zgod¬ 
nie ze współczesną fizyką można by im nadać nastę¬ 
pujące brzmienie: 

jednolitość I. Wszystkie ciała materialne, nieożywione i oży- 
materii wionę, na Ziemi i gdziekolwiek indziej we Wszech- 
świecie są zbudowane z takich samych elementar¬ 
nych składników (np. odpowiednich cząstek i pól), 
powszech- II. Oddziaływania między elementarnymi skład- 
ność praw nikami materii i wynikające z nich własności materii 
fizyki oraz prawa fizyki są wszędzie takie same. 

Obie te zasady są dziś wszechstronnie potwierdzo¬ 
ne przez doświadczenie. Oczywiście nie oznaczają 
one bynajmniej, że świat jest pod każdym względem 
jednorodny (co byłoby jawnie sprzeczne z naszym 
doświadczeniem), zasady te nie wykluczają bowiem 
występowania materii w różnych formach i stanach. 

Zilustrujemy to na przykładzie Ziemi i Słońca. Ma¬ 
teria we wnętrzu Słońca i na Ziemi występuje nie¬ 
wątpliwie w bardzo różnych stanach. Różnice włas¬ 
ności materii ziemskiej i słonecznej wynikają z ogrom¬ 
nych różnic wartości takich parametrów stanu jak 
temperatura, ciśnienie, natężenie pola grawitacyjnego, 
pola promieniowania itd. Niemniej jest to taka sama 
materia, podlegająca tym samym prawom. Należy to 
rozumieć tak, że np. materia ziemska o odpowiednim 
składzie chemicznym, poddana takiemu samemu jak 
we wnętrzu Słońca ciśnieniu, temperaturze, promie¬ 
niowaniu itp., będzie się zachowywała identycznie jak 
materia słoneczna. Weźmy inny przykład: Organizmy 
żywe zbudowane są z takich samych atomów, między 
którymi występują takie same oddziaływania i reak¬ 
cje jak te, które badają fizycy i chemicy w laborato¬ 
riach w warunkach wprawdzie sztucznych, ale za to 
dobrze kontrolowanych. Oczywiście występujące w 
żywych komórkach bardzo duże drobiny przysparzają 
kłopoty wskutek skomplikowanej budowy i wynikają¬ 
cych stąd specyficznych własności, ale jest to kompli¬ 
kacja w pełni zrozumiała na gruncie fizyki. 


Całe współczesne przyrodoznawstwo opiera się 
więc na założeniu, że wszelkie, nieraz bardzo skom¬ 
plikowane struktury i procesy chemiczne, biologicz¬ 
ne, geologiczne i astronomiczne są wynikiem działa¬ 
nia uniwersalnych praw fizyki. Fundamentalne prawa 
fizyki są względnie proste i ogólne, ale zastosowane 
do różnych złożonych układów i sytuacji mogą impli¬ 
kować bardzo różnorodne i skomplikowane własności 
szczególne. 

Weryfikacja tego podstawowego założenia współ¬ 
czesnego przyrodoznawstwa może być w pewnych 
wypadkach dość prosta, ale na ogół jest bardzo trud¬ 
na, gdyż wymaga długiego łańcucha obserwacji, 
wnioskowań i rachunków. Bezpośrednie sprawdzenie 
pewnych konsekwencji jest czasem praktycznie nie¬ 
możliwe. Nie potrafimy np. przenieść badanego ka¬ 
wałka materii ziemskiej do wnętrza Słońca w celu 
sprawdzenia, czy będzie się ona tam rzeczywiście za¬ 
chowywała tak jak materia słoneczna. Jednakże iden¬ 
tyczność materii na Ziemi i na Słońcu można po¬ 
twierdzić w inny sposób, który wprawdzie nie jest 
bezpośredni, ale mimo to jest przekonywający. A mia¬ 
nowicie — w widmie promieniowania Słońca wy¬ 
stępują linie absorpcyjne charakterystyczne dla zna¬ 
nych również na Ziemi pierwiastków. Ba, jeden 
z nich, hel, został właśnie w ten sposób odkryty naj¬ 
pierw na Słońcu, a dopiero potem został znaleziony 
na Ziemi. Dalej — Słońce promieniuje nie tylko fale 
elektromagnetyczne, lecz także różne cząstki, które 
można dziś dobrze zidentyfikować (np. przy użyciu 
odpowiednich detektorów umieszczonych na sput¬ 
nikach). Okazuje się, że są one identyczne z cząstkami 
poznanymi przez fizyków w ich laboratoriach na 
Ziemi. 

Można podać tysiące faktów, zarówno z zakresu 
właściwej fizyki, jak i chemii, biologii, geologii i astro¬ 
nomii, potwierdzających zasady jednolitości materii 
i powszechności praw fizyki, natomiast nie znamy 
naukowo potwierdzonych faktów sprzecznych z nimi. 
Zasady te okazały się niezmiernie ważne, płodne 
i stymulujące dla wszystkich nauk przyrodniczych. 
Bez nich wiele tych nauk nie mogłoby po prostu ist¬ 
nieć albo ograniczyłoby się do bardzo powierzchow¬ 
nych obserwacji i czysto opisowego podejścia. Na 
przykład dopiero przyjęcie zasady jednolitości ma¬ 
terii , i powszechności praw przyrody pozwala na 
wykorzystanie licznych wiadomości z zakresu fizyki 
jądrowej i cząstek elementarnych, teorii promienio¬ 
wania, termodynamiki, teorii grawitacji, mechaniki 
itd. w celu wyjaśnienia obserwowanych zjawisk astro¬ 
nomicznych. 

Warto zwrócić uwagę na zmiany, jakie w pojmo¬ 
waniu obu zasad zachodziły w toku rozwoju nauki. 
Rodowód tych zasad jest niewątpliwie bardzo stary 
i sięga z pewnością starożytnych greckich filozofów 
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Relacje między 
chemią, biologią 
i fizyką dawniej 
i dziś 


przyrody, a może czasów jeszcze dawniejszych. Nie 
wdając się tu w szczegółowe historyczne rozważania, 
należy zwrócić uwagę na bardzo istotny przełom, 
który się dokonał w ostatnich 100 latach. Otóż 
ugruntowany już bardzo dawno i właściwie nie zmie¬ 
niany przez długie wieki sens obu zasad był pier¬ 
wotnie znacznie skromniejszy. Polegały one właści¬ 
wie tylko na stwierdzeniu, że wszystkie ciała material¬ 
ne mają pewne wspólne cechy, zwane fizycznymi, np. 
rozciągłość, położenie, prędkość, masę, pęd, tempe¬ 
raturę, barwę. Było oczywiste, że ze względu na wy¬ 
stępowanie tych cech wszystkie ciała materialne mu¬ 
szą oczywiście podlegać odpowiednim prawom fi¬ 
zycznym. Uważano jednak, że oprócz cech fizycz¬ 
nych ciała materialne mogą posiadać zupełnie nieza¬ 
leżne od praw fizyki własności chemiczne, biologicz¬ 
ne (witalne), astralne czy spirytualne. Przez długie 
wieki uważano, że zjawiska fizyczne, chemiczne, bio¬ 
logiczne, geologiczne i astronomiczne są wywoływane 
przez specyficzne, odrębne i niezależne siły fizyczne, 
chemiczne, witalne, geologiczne, astralne itd., podle¬ 
gające niezależnym prawom. Dziś jesteśmy głęboko 
przekonani, że nie ma potrzeby przyjmowania istnie¬ 
nia takich odrębnych sił i praw. Wszystkie te zja¬ 
wiska staramy się dziś sprowadzić — na ogół z do¬ 
brym skutkiem — do odpowiednich zjawisk i praw 
czysto fizycznych, zachodzących w specyficznych dla 
danej gałęzi nauki układach (obiektach, procesach, 
sytuacjach, stanach). Współczesne przyrodoznaw¬ 
stwo bardzo pogłębiło więc znaczenie obu zasad, roz¬ 
ciągając je na wszystkie niemal obiekty i zjawiska 
przyrody. 

Współczesna fizyka łączy i zespala w jedną całość 
wszystkie nauki przyrodnicze. Chemia, geologia 
i astronomia oraz pokrewne, bardziej szczegółowe 
nauki przyrodnicze, jak np. krystalografia, minera¬ 
logia, meteorologia, są dziś uważane po prostu za 
działy fizyki zajmujące się badaniem pewnych szcze¬ 
gólnych klas obiektów za pomocą uniwersalnych 
metod, pojęć i praw fizyki. W naszych oczach również 
biologia staje się coraz bardziej „fizyką materii oży¬ 
wionej”, czy krócej — „fizyką życia”. Postępująca 
coraz głębiej i szerzej integracja wszystkich nauk 
przyrodniczych na bazie fizyki jest jedną z najbar¬ 
dziej charakterystycznych cech nowożytnej nauki. 


nazywamy w fizyce zjawiskami. Badanie zjawisk 
przyrody może polegać na ich biernym oglądaniu 
w warunkach naturalnych, w których nie mamy wpły¬ 
wu na oglądane zjawiska. Ograniczenie się do bier¬ 
nego oglądania, zwanego często obserwacją, jest ko- obserwacja 
nieczne, jeśli obiekty obserwacji są bardzo wielkie lub 
bardzo odległe w przestrzeni lub czasie, jak to ma 
miejsce np. w astronomii lub geologii. 

Wiele zjawisk zachodzących w mniejszej skali moż¬ 
na jednak wywołać sztucznie, umyślnie, w warun¬ 
kach laboratoryjnych. Takie postępowanie nazywamv 
eksperymentowaniem. Czynny eksperyment ma oczy¬ 
wiście wiele zalet. Przede wszystkim jest znacznie eksperymen- 
bardziej elastyczny niż bierna obserwacja, da się towanie 
powtórzyć na życzenie i łatwiej go kontrolować 
ilościowo. Możliwość powtórzenia zjawiska dowolną 
liczbę razy, w ilościowo identycznych warunkach, 
pozwala na usunięcie przypadkowych lub nawet sys¬ 
tematycznych błędów, na zwiększenie dokładności 
i pewności wyników badań, na uściślenie, sprawdze¬ 
nie i korygowanie dotychczasowej wiedzy. Wyko¬ 
nanie eksperymentów w różnych, celowo zmienio¬ 
nych warunkach pozwala na bardziej wszechstronne, 
pełniejsze i głębsze poznanie badanych zjawisk. 

Zastąpienie biernej obserwacji przez czynny ekspe¬ 
ryment przynosi więc zawsze istotny postęp w pracy 
badawczej. 

Zjawiska powtarzające się często, ale tylko w wa¬ 
runkach naturalnych, trudniej jest kontrolować, gdyż 
na ogół nie możemy być pewni identyczności tych 
warunków, nie możemy też dobrze określić wartości 
parametrów, zmieniających się za każdym razem. 

Jeszcze gorzej przedstawia się sprawa ze zjawis¬ 
kami niepowtarzalnymi lub bardzo rzadkimi. Można 
je również badać za pomocą odpowiednich metod 
fizycznych, ale wiedzy o takich zjawiskach nie mo¬ 
żemy pogłębiać, sprawdzać ani korygować przez po¬ 
wtórzenie ich i wykonanie nowych badań. 

Fizyka właściwa zajmuje się niemal wyłącznie 
zjawiskami, które można badać eksperymentalnie 
w w-arunkach laboratoryjnych. Inne nauki przyrod¬ 
nicze, jak np. astronomia, geologia oraz niektóre 
działy biologii, muszą się z natury rzeczy ograniczać 
do biernych obserwacji. W astronomii układu pla¬ 
netarnego era czynnego eksperymentowania zaczęła 
się bardzo niedawno, dopiero wówczas, gdy zasto¬ 
sowano rakiety kosmiczne. 


Metoda naukowa fizyki 


Zasady jednolitości materii i powszechności praw 
fizyki otwierają wprawdzie bardzo szerokie horyzon¬ 
ty, ale są same w sobie zbyt ogólnikowe. Konkretne 
zastosowanie tych zasad w pracy badawczej wyma¬ 
ga— z jednej strony — znajomości odpowiednich 
zjawisk, praw i teorii fizycznych, z drugiej — stoso¬ 
wania w całym przyrodoznawstwie tego samego ję¬ 
zyka i tej samej metody badawczej. Ta ostatnia 
sprawa jest szczególnie ważna, warto się więc zasto- 
nowić nieco dokładniej nad metodą naukową fizyki, 
ponieważ stała się ona dziś metodą wszystkich nauk 
przyrodniczych. 

Otóż najważniejsze i najbardziej charakterystyczne 
cechy metody naukowej fizyki są następujące: 

— możliwie szerokie stosowanie eksperymentu, 

— ścisłe, ilościowe formułowanie wyników ekspe¬ 
rymentu i wniosków ogólnych, 

— poszukiwanie praw przyczynowych, 

— silne obustronne sprzężenie doświadczenia (eks¬ 
perymentu) z teorią. 


Obserwacja i eksperyment 

Fizyka jest nauką o realnych faktach przyrodniczych, 
które możemy poznać jedynie (bezpośrednio lub po¬ 
średnio) za pomocą naszych zmysłów. Fakty takie 
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Wielkości fizyczne 

Metoda naukowa fizyki jest ścisła, tj. ilościowa. 

Oznacza to przede wszystkim, że każde zjawisko sta¬ 
rają się fizycy opisać za pomocą odpowiednich mie¬ 
rzalnych cech, zwanych wielkościami fizycznymi. 

Metoda ta okazała się niezwykle skuteczna i płodna. 

Stopniowo przyjmowały ją i nadal w większym lub 
mniejszym zakresie przyjmują inne nauki empiryczne. 

Wiele ludzi, w tym spora liczba naukowców, broni 
się przed wprowadzaniem metod ilościowych. Uwa- jakość a ilość 
żają oni, że ilościowe podejście gubi istotne różnice w fizyce 
jakościowe, które nie dają się zmierzyć, ponieważ 
możemy porównywać ilościowo tylko te same jakości, 
a więc ilościowe podejście rzekomo zuboża ludzkie 
poznanie. To obronne stanowisko wynika z niezro¬ 
zumienia znaczenia metod ilościowych i możliwości 
pomiaru oraz matematycznego zapisu. 

Otóż trzeba podkreślić z naciskiem, że pomiar nie 
gubi żadnych różnic jakościowych. Przeciwnie — 
uściśla je i wzbogaca, czyni je komunikatywnymi, 
obiektywnymi i odtwarzalnymi. Jest faktem, że nie¬ 
które różnice, które naszym zmysłom wydają się 
czysto jakościowe, udało się fizykom sprowadzić do 
różnic czysto ilościowych. Tak np. barwa żółta jest 
dla naszego oka jakościowo odmienna od barwy zie¬ 
lonej. Fizycy odkryli jednak, że światło jest falą 
elektromagnetyczną i że każdej czystej barwie odpo¬ 
wiada określona długość fali. Jakościowe różnice 
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co, jak i czym 
mierzyć? 


przykład: 
związek ru¬ 
chu z siłą 



między barwami zostały wyrażone przez ilościowe 
różnice tej samej jakości, którą jest długość fali 
elektromagnetycznej. Ludzkie doznania i wrażenia 
odbierane przy oglądaniu barwnych przedmiotów nie 
zostały przez to odkrycie zubożone, lecz wręcz prze¬ 
ciwnie, wzbogacone przez możliwość dokładnej fizycz¬ 
nej analizy i reprodukcji barwnych obrazów. 

Najczęściej jednak różnice jakościowe nie dają się 
sprowadzić do różnic często ilościowych w ramach 
tej samej jakości. Dźwięki np. mają też naturę falową. 
Wysokości czystego tonu przyporządkowana jest 
znowu określona długość fali, ale tym razem jest to 
fala akustyczna, która ma zupełnie inne własności 
niż fala elektromagnetyczna. Chociaż czysta barwa 
i czysty ton określone są przez długość fali, wiadomo 
jednak, że chodzi o zupełnie odmienne rodzaje fal 
(które mierzymy w zupełnie inny sposób), więc 
stwierdzenie takie bynajmniej nie lekceważy zasad¬ 
niczych różnic jakościowych. Zatem ilościowe podejś¬ 
cie nie zuboża, lecz wzbogaca, uściśla i upraszcza 
nasze poznanie, stwarza możliwości zupełnie nowego, 
syntetycznego spojrzenia na świat zjawisk, daje nowe 
możliwości rozlicznych praktycznych zastosowań. 

Analiza badanego zjawiska przy użyciu adekwat¬ 
nych wielkości fizycznych bywa nieraz zadaniem nader 
trudnym, polega ona bowiem na konkretnej odpo¬ 
wiedzi na 3 zasadnicze pytania eksperymentatora: co, 
jak i czym należy mierzyć? Trzeba więc wybrać takie 
ilościowe cechy badanego zjawiska, które są istotne 
i nieodzowne, a jednocześnie możliwie wygodne do 
jego zrozumienia i opisu. Następnie trzeba się zasta¬ 
nowić, jak mierzyć wybrane cechy. Wreszcie trzeba 
skonstruować odpowiednie przyrządy pomiarowe, 
wybrać jednostki, wycechować przyrządy, no i wresz¬ 
cie wykonać pomiary z pożądaną dokładnością. Nie 
są to bynajmniej proste zadania, o czym świadczą 
liczne przykłady z historii fizyki. 

Od niepamiętnych np. czasów ludzie obserwowali 
rozmaite ruchy mechaniczne polegające na zmianie 
położenia i prędkości ciał materialnych. Mieli też 
pewne — choć raczej niejasne — pojęcie o sile jako 
przyczynie sprawczej. A jednak bardzo długo nie 
potrafili znaleźć popiawnego związku między siłą 
a ruchem, ponieważ nie umieli wybrać odpowiednich 
wielkości do opisu ruchu. Największy uczony staro¬ 
żytności, Arystoteles, nie doceniał znaczenia pomiaru 
ani ilościowego, ścisłego opisu zjawisk. Opierając się 
na powierzchownych obserwacjach ruchów, w któ¬ 
rych występuje tarcie, doszedł do błędnego prawa 
ruchu, według którego stała siła wywołuje zawsze 
ruch ze stałą prędkością. Choć przez dwa tysiące lat 
fizyka Arystotelesa miała wielu krytyków, to jednak 
aż do XVII w. nikt nie potrafił podać właściwego 
rozwiązania tego problemu. 

Dopiero Galileusz zwrócił uwagę na przyspieszenie 
jako na wielkość bardzo istotną dla zrozumienia 
związku ruchu z siłą. Wreszcie Newton wprowadził 
pojęcie masy inercjalnej i podał poprawne sformuło¬ 
wanie prawa ruchu, według którego siła jest równa 
zmianie pędu ciała (punktu materialnego) w jednostce 
czasu. Przy pełnym, kinetycznym opisie ruchu punktu 
materialnego istotnymi wielkościami są składowe 

wektora położenia r(0, które są na ogół funkcjami 

czasu. Pomiary r(t ) ciał na Ziemi są wykonywane za 
pomocą stosunkowo prostych przyrządów, a miano¬ 
wicie miarki służącej do pomiaru położeń i zegara — 
do pomiaru czasu. Wyznaczenia położeń planet, ko¬ 
met, Słońca i gwiazd praktycznie nie da się wykonać 
jedynie za pomocą miarki i zegara. Wymaga ono 
pomiarów odpowiednich kątów i wykonania specjal¬ 
nych rachunków. W celu zwiększenia ostrości widze¬ 
nia i dokładności oraz w celu zobaczenia wielu nie¬ 
dostrzegalnych gołym okiem obiektów astronomicz¬ 
nych stosuje się ponadto lunety, teleskopy, refraktory, 
interferometry itp. Do obserwacji i pomiaru bardzo 
małych obiektów stosuje się lupy, mikroskopy op¬ 
tyczne, elektronowe itp. Liczne przyrządy fizyczne 


służą więc do zwiększenia dokładności pomiaru, a na¬ 
wet rozszerzenia zasięgu naszych zmysłów poza ob¬ 
szar ich naturalnych możliwości postrzegania. 


Detektory zjawisk 

Istnieje wiele zjawisk (nawet makroskopowych), na 
które nasze zmysły wcale lub prawie wcale nie rea¬ 
gują. Nie odczuwamy np. w ogóle pola elektrycznego 
i magnetycznego, promieniowania elektromagnetycz¬ 
nego (poza wąskim zakresem widma widzialnego) ani 
promieniować korpuskularnych (a, /?, neutronowego), 
chociaż duże dawki promieniowania mogą nawet wy¬ 
wołać groźne schorzenia lub śmierć. Bez odpowied¬ 
nich przyrządów fizycznych, zwanych detektorami, 
odkrycie i poznanie tego typu zjawisk byłoby w ogóle 
niemożliwe. Zostałyby one poza granicami naszego 
poznania, jako tajemne, nieznane moce „z innego 
świata”, których istnienia człowiek mógłby się tylko 
domyślać, nie mając jednak żadnych możliwości ich 
zbadania, zrozumienia i wykorzystania. 

Nasze zmysły są więc nie tylko bardzo niedokładne 
i subiektywne, a czasem wręcz zwodnicze (przywi¬ 
dzenia, złudzenia, halucynacje, majaki, stany otępie¬ 
nia itp.), ale również mają pod względem jakościo¬ 
wym bardzo wąski zakres. Detektory fizyczne po¬ 
zwalają nam uwolnić się od subiektywności, niedo¬ 
kładności i zawodności naszych zmysłów, a ponadto 
umożliwiają nieograniczone rozszerzenie ludzkiego 
poznania na jakościowo nowe zjawiska, niedostępne 
bezpośredniej zmysłowej obserwacji. Potęga współ¬ 
czesnych nauk fizycznych polega na konstrukcji coraz 
bogatszego zestawu coraz bardziej wszechstronnych, 
coraz czulszych i wygodniejszych detektorów. 

Ogólna zasada działania wszelkich detektorów fi¬ 
zycznych sprowadza się do zamiany (konwersji) zja¬ 
wisk słabo dostrzegalnych lub wręcz bezpośrednio, 
zmysłowo niedostrzegalnych — na inne, łatwo obser- 
wowalne przez nasze zmysły. Najdokładniejszym 
i najważniejszym narzędziem poznawczym człowieka 
jest z pewnością zmysł wzroku, który wsparty odpo¬ 
wiednimi urządzeniami w postaci podziałek, wskaźni¬ 
ków i różnych wzmacniaczy — potrafi zauważyć 
nawet bardzo niewielkie zmiany wzajemnego poło¬ 
żenia odpowiednio skonstruowanych części detek¬ 
tora (np. wskazówki przesuwające się względem nie¬ 
ruchomej skali, cyfry licznika automatycznego rosną¬ 
ce o jeden po każdym zarejestrowanym błysku optycz¬ 
nym czy innym sygnale). Bez żadnych istotnych ogra¬ 
niczeń możemy więc określić detektory fizyczne jako 
urządzenia (przyrządy) zamieniające różne zjawiska 
fizyczne na dające się łatwo obserwować zjawiska 
mechaniczno-wizualne: w końcu obserwujemy zawsze 
tylko wzajemne położenie pewnych części detektora. 
Detektorami są zarówno tak proste przyrządy, jak np. 
zegar i waga, jak i bardziej złożone, w rodzaju ter- 
moskopu, busoli, baroskopu, elektroskopu, galwano- 
skopu, spektroskopu, mikroskopu, teleskopu. 


Przyrządy pomiarowe 

Dobrze skonstruowany detektor reaguje na występo¬ 
wanie lub zmianę w badanym zjawisku jakiejś jednej 
wielkości fizycznej. Detektor taki można więc wy- 
wzorcować, tj. zaopatrzyć w skalę odpowiednią do 
wybranego układu jednostek. Z jakościowego wykry¬ 
wacza danego zjawiska staje się on wówczas ilościo¬ 
wym przyrządem pomiarowym, a więc termoskop 
staje się termometrem, galwanoskop — woltomie¬ 
rzem lub amperomierzem, spektroskop — spektro¬ 
metrem, wykrywacz promieniowania staje się licz¬ 
nikiem określonego rodzaju mikrocząsteczek itd. 
Zbudowanie i wy wzorcowanie odpowiedniego zestawu 
detektorów stanowi definitywną i konkretną odpo¬ 
wiedź na trzy sakramentalne dla każdego kierunku 
badań pytania: co, jak i czym mierzyć? 
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Problem wzorcowania detektora i przeistoczenia 
go w pełnosprawny przyrząd pomiarowy jest często 
bardzo trudny — nawet w pozornie prostych przy¬ 
padkach. Weźmy za przykład termometr, tj. przyrząd 
do pomiaru temperatury. Nasz wrodzony zmysł tem¬ 
peratury jest wysoce niedokładny, subiektywny i ma 
ponadto mały zasięg, uwarunkowany chociażby fak¬ 
tem, że nasze ciało może żyć i funkcjonować tylko 
w bardzo wąskim przedziale temperatur. Termoskop 
wykrywający zmiany temperatury na podstawie zmia¬ 
ny objętości ustalonej ilości gazu skonstruował w koń¬ 
cu XVI w. Galileusz. Wybór najwygodniejszej sub¬ 
stancji termometrycznej, wybór jednostki i punktu 
zerowego skali temperatur itp. trwał właściwie parę 
wieków. W połowie XVIII w. powstały względnie do¬ 
kładne i wygodne termometry rtęciowe i wprowadzono 
do dziś stosowane skale, oparte na punktach krzep¬ 
nięcia i wrzenia wody lub innych cieczy, a dopiero 
w 2. połowie XIX w. usunięto dowolność tego typu 
skal, wprowadzając pojęcie absolutnego zera i termo¬ 
dynamiczną skalę temperatur. 

Ponieważ jednak nawet najlepiej wzorcowany ter¬ 
mometr rtęciowy nie działa ani w zbyt niskich, ani 
w zbyt wysokich temperaturach, powstał więc problem 
konstrukcji innych typów termometrów, działających 
poza zakresem termometru rtęciowego, problem roz¬ 
szerzenia zakresu mierzonych temperatur. Skonstruo¬ 
wano termometry oporowe, radiacyjne, termopary 
itp., które pozwalają na ekstrapolację pojęcia tempe¬ 
ratury daleko poza wąski obszar bezpośrednio uch¬ 
wytny zmysłowo. Chociaż dzięki znajomości zasad 
termodynamiki nie mamy zasadniczych kłopotów 
z ekstrapolacją skali temperatur, to jednak trudności 
techniczne związane z konstrukcją coraz dokładniej¬ 
szych i czulszych termometrów o coraz większym 
zakresie są bardzo duże i prace nad udoskonaleniem 
termometrów prowadzi się nadal. 

Zagadnienie przygotowania dostosowanych do 
badanego zjawiska przyrządów pomiarowych wyma¬ 
ga nie tylko pracy techniczno-konstrukcyjnej, lecz 
także pracy koncepcyjnej, pojęciowej. Przyrząd po¬ 
miarowy jest ściśle związany z pojęciem wielkości 
fizycznej, którą mierzy. Na czym polega ten związek? 

Wiele ludzi sądziło dawniej, że wprowadzenie 
adekwatnych do badanego zjawiska wielkości fizycz¬ 
nych jest przede wszystkim procesem koncepcyjnym, 
dokonującym się w umyśle badacza, który dopiero 
po wypracowaniu w drodze abstrakcyjnego rozumo¬ 
wania najstosowniejszych według niego pojęć po¬ 
winien przystąpić do konstrukcji odpowiednich przy¬ 
rządów pomiarowych. Jaką gwarancję może mieć 
tak postępujący badacz, że przyrząd pomiarowy mie¬ 
rzy rzeczywiście tę samą wielkość fizyczną, która zo¬ 
stała określona czysto abstrakcyjnie i a priori (np. 
przez podanie z góry logicznej definicji pojęcia)? 
W historii fizyki wiele pojęć wprowadzono a priori, 
a dopiero później przystąpiono do konstrukcji od¬ 
powiednich przyrządów pomiarowych. Nierzadko 
okazywało się potem, że postulowany obiekt, proces 
czy nawet pozornie prosta wielkość fizyczna wcale nie 
ma narzuconych a priori własności. Na przykład ato¬ 
my wprowadzono do fizyki i chemii jako niezniszczal¬ 
ne, niepodzielne i najmniejsze cząstki materii, które 
mogą się łączyć w drobiny związków chemicznych. 
Wszechstronne badania i pomiary własności atomów 
wykazały, że nie są one ani niezniszczalne, ani nie¬ 
podzielne, ani nie stanowią najmniejszych cegiełek 
składowych materii, że zatem pierwotne koncepcje 
można traktować jedynie jako przybliżenie przydatne 
w pewnym wąskim zakresie zjawisk. 

Na początku XX w. Einstein wykazał, że newto¬ 
nowskie definicje nawet tak podstawowych pojęć 
fizycznych jak odległość, czas, równowczesność, ko¬ 
lejność czasowa zdarzeń itd. nie zgadzają się z po¬ 
miarami wykorzystującymi własności światła. Im¬ 
plikują one zupełnie inne własności tych wielkości 
niż te, które postulował Newton. 

Nauczeni tymi i wieloma innymi doświadczeniami 
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fizycy przypisują obecnie znacznie większą rolę przy¬ 
rządowi pomiarowemu. Przyjmuje się mianowicie, 
że wielkość fizyczna jest z reguły dobrze określona 
dopiero przez podanie pełnego przepisu jej pomiaru. 
Dopiero analiza sposobu i wyników pomiaru daje nam 
możliwość adekwatnej do rzeczywistości konstrukcji 
pojęciowej badanej wielkości czy złożonego zjawiska. 
Takie określenie wielkości fizycznej przez podanie 
sposobu jej pomiaru nazywa się określeniem opera¬ 
cyjnym. Prócz wielkości określonych operacyjnie, 
a więc związanych bezpośrednio z pomiarami, fizyka 
współczesna używa także pojęć, które mają charakter 
konstrukcji matematycznych, związanych z pomia¬ 
rem tylko pośrednio (np. funkcja stanu w mechanice 
kwantowej) lub wymagających do pełnego określenia 
bardzo wielu, a nawet nieskończenie wielu pomiarów. 

W każdym razie warto jeszcze raz podkreślić, że 
przyrząd pomiarowy odgrywa we współczesnej fizyce 
ważną rolę koncepcjotwórczą. 

Szukanie związków (praw fizycznych) 

Wynik pomiaru zawsze można zapisać w postaci licz¬ 
by lub zbioru liczb, funkcji itp., dających się przed¬ 
stawić w postaci wykresu, diagramu, tabeli itp. Trzeba 
przy tym pamiętać, że są to liczby obdarzone jakością, 
która jest określona przez przepis wykonywania po¬ 
miaru. To często nie uwidaczniane w zapisie „miano” 
wielkości jest bardzo ważne dla fiżyka, choć może 
mało obchodzić matematyka. 

Między różnymi wielkościami występującymi w da¬ 
nym zjawisku mogą występować pewne związki, zwa¬ 
ne prawami fizycznymi. Ponieważ wielkości fizyczne 
wyrażają się przez liczby lub bardziej złożone twory 
matematyczne, związki między nimi dają się zapisać 
w postaci relacji matematycznych między symbolami 
reprezentującymi poszczególne wielkości. Najcen¬ 
niejsze dla fizyka są związki mające postać matema¬ 
tycznych równań, choć nie do pogardzenia są również 
nierówności i inne relacje matematyczne. Znajdowa¬ 
nie praw fizyki i badanie na drodze matematycznej ich 
różnych konsekwencji jest głównym celem teorii 
fizycznych. 

Przystępując do badania jakiegoś nowego, złożo¬ 
nego zjawiska, staramy się przede wszystkim dokład¬ 
nie i wszechstronnie zmierzyć różne występujące w 
nim wielkości fizyczne. Lepiej jest zmierzyć raczej 
za dużo niż za mało różnych wielkości fizycznych. 
Posiadając bowiem za mało informacji, na pewno nie 
możemy w pełni opisać badanego zjawiska. Jeśli na¬ 
tomiast wprowadzimy za dużo wielkości, to dosta¬ 
tecznie dokładne pomiary wykażą, że nie są one nie¬ 
zależne i że można wszystkie wielkości wyrazić alge¬ 
braicznie przez pewne wielkości podstawowe. Żadna 
z wielkości podstawowych nie da się — ogólnie bio¬ 
rąc— wyrazić jako funkcja pozostałych, ale mogą 
między nimi występować bardziej złożone związki, 
np. w postaci równań różniczkowych lub całkowych. 
Taką postać mają równania ruchu Newtona, rów¬ 
nania Maxwella czy równania wielu innych teorii. 

Rozpatrzmy względnie prosty przykład klasycznej 
mechaniki punktu materialnego (cząstki). Podstawo¬ 
wymi wielkościami fizycznymi w tym problemie są 

masa cząstki m oraz wektory położenia r(/> i siły 

F(t). Jeśli znamy te wielkości w interesującym nas 
przedziale czasu, to znamy właściwie wszystko: wie¬ 
my, jak się cząstka porusza, wiemy, jaka jest jej masa 
i jaka siła na nią działa. Algebraicznie wielkości te są 
niezależne, tzn. nie ma ogólnego słusznego dla do¬ 
wolnego ruchu związku funkcyjnego, który by wy¬ 
rażał r(t) jako funkcję m i F(ł) (lub F(t) jako funkcję 

m i"r (/)). Łatwo jednak zauważyć, że siła F(t) w jakiś 
sposób wpływa na ruch, choć nie określa go jedno¬ 
znacznie. Na przykład stała siła grawitacyjna powo¬ 
duje, że wszelkie możliwe tory cząstek są parabolami 
o osiach skierowanych zgodnie z kierunkiem siły. 
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Znając funcję wektorową r(t) w w pewnym prze¬ 
dziale czasu, możemy obliczyć jej kolejne pochodne: 

dr — d~ r — d z r 

Pierwsze dwie pochodne nazywamy odpowiednio 
prędkością i przyspieszeniem cząstki w chwili /. 
Z pierwotnych wielkości oraz powyższych pochodnych 
możemy utworzyć teraz dalsze bardziej złożone wiel¬ 
kości, jak np. pęd, moment pędu, moment siły: 

P = , j = rxp , D = rxF , ... 

j/ 1 _ v 2 /c 2 

Szukany związek między ruchem, czyli funkcją r(r), 
a siłą znalazł Newton w postaci równości siły i po¬ 
chodnej pędu: 



Czysto matematyczną konsekwencją tego prawa jest 
analogiczny związek między momentami: 



Prawo ruchu Newtona ma postać niezależną ani od 
konkretnej wartości siły, ani od konkretnego toru 

r(/), ani od wartości masy. Dotyczy więc dowolnych 
sił, dowolnych wartości masy i całej klasy torów do¬ 
puszczalnych przez to prawo. Z matematycznego 
punktu widzenia prawo dynamiki Newtona jest ukła¬ 
dem 3 równań różniczkowych drugiego rzędu na nie¬ 
znane funkcje czasu *(/), y(/), z(t). Nawet przy okre¬ 
ślonej wartości F(t ) i m równania te dopuszczają jesz¬ 
cze nieskończenie wiele rozwiązań. Rozwiązanie, tj. 

funkcja r(t\ będzie jednoznacznie określone dopiero 
po sprecyzowaniu warunków początkowych, tj. po 

podaniu wektorów położenia r(/ 0 ) i prędkości v 0 =r(/ 0 ) 
w chwili początkowej t 0 . 

Prawa fizyki mają bardzo często różniczkową lub 
całkową postać, która jak widzieliśmy na powyższym, 
stosunkowo prostym przykładzie — nie dotyczy jed¬ 
nego szczególnego ruchu, ale podaje związki praw¬ 
dziwe w odniesieniu do całej klasy fizycznie dopusz¬ 
czalnych ruchów. Innymi słowy — różniczkowe pra¬ 
wa fizyki dopuszczają nieskończenie wiele rozwiązań. 
Wybór konkretnego rozwiązania jest zależny od in¬ 
teresującej nas konkretnej sytuacji fizycznej. Prawa 
fizyki opisują więc tylko ogólne związki, które odno¬ 
szą się do nieskończonej liczby fizycznie dopuszczal¬ 
nych sytuacji, mają zatem bardzo syntetyczny, ogól¬ 
ny i powszechny charakter. Językiem adekwatnym 
do zapisu tych ogólnych związków oraz do ich anali¬ 
zy i wyciągania różnorodnych wniosków jest ścisły 
i ogólny język matematyki. 


Teorie fizyczne 

Fizyka interesują takie obiekty jak cząstki elementar¬ 
ne, jądra, atomy, jony, molekuły oraz makroskopowe 
układy takich cząstek jak np. gazy, ciecze, ciała stałe, 
planety i gwiazdy tudzież pola. Teorią fizyczną na¬ 
zywamy zbiór zapisanych w postaci matematycznej 
praw fizycznych odnoszących się do obiektów okre¬ 
ślonego typu, uzupełniony warunkami stosowalności, 
warunkami wyboru fizycznie dopuszczalnych roz¬ 
wiązań oraz omówieniem precyzującym znaczenie 
fizyczne występujących symboli matematycznych. 
Teoria powinna podawać związki przyczynowe i opi¬ 
sywać występujące w rozważanym obiekcie (układzie) 
zjawiska i prawa możliwie kompletnie, ogólnie i z wy¬ 
starczającą dokładnością. Kryterium przydatności 
teorii fizycznej jest zawsze ilościowa zgodność jej 
przewidywań z faktami doświadczalnymi. Każda 


teoria fizyczna ma ograniczony zasięg stosowalności 
i ograniczoną dokładność. Jednym z głównych celów 
badań fizycznych jest więc konstrukcja coraz dosko¬ 
nalszych teorii, tzn. teorii, które są coraz głębsze 
i ogólniejsze, mają coraz większy zasięg stosowalności 
i coraz lepszą zgodność z doświadczeniem. 

Rozpatrzymy dla przykładu sukcesywne teorie ru¬ 
chów planet. Teoria geocentryczna Ptolemeusza była 
czysto opisowym, kinematycznym, niedynamicznym 
i nieprzy czy nowym schematem rachunkowym. Znacz¬ 
nie uprościł i ufizycznił opis ruchów planet Kopernik, 
wprowadzając konsekwentnie układ heliocentryczny. 
Stosując ten układ, Kepler odkrył 3 ważne kinema¬ 
tyczne prawa ruchu. Pierwszą ogólną, przyczynową 
i dynamiczną teorię podał Newton. Składają się na 
nią uniwersalne prawa dynamiki Newtona oraz pra¬ 
wo powszechnego ciążenia. Następnym udoskona¬ 
leniem było uwzględnienie na początku XX w. re¬ 
latywistycznej zależności masy od prędkości. Najdo¬ 
kładniejszą w tej chwili teorią ruchów planet jest 
teoria grawitacji Einsteina (tzw. ogólna teoria względ¬ 
ności), która przewiduje drobne odstępstwa od wyni¬ 
ków teorii Newtona (np. ruch perihelionowy Merku¬ 
rego). Teoria Einsteina jest ponadto najgłębszą — 
w sensie przyczynowego tłumaczenia zjawisk — te¬ 
orią grawitacji i ruchów planetarnych. Paradoksalnie 
wręcz brzmi stwierdzenie, że dokładność teorii Einstei¬ 
na przekracza ciągle doświadczalne możliwości. Wie¬ 
le przewidywanych przez tę teorię efektów, np. pewne 
poprawki do ruchów planet, promieniowanie grawi¬ 
tacyjne itd., są tak małe, że nie dadzą się wykryć przy 
zastosowaniu znanych dotychczas detektorów. Inne 
przewidywane przez tę teorię efekty, jak np. czarne 
dziury, mogą występować jedynie w dużych, kosmicz¬ 
nych obiektach i też nie zostały jeszcze definitywnie 
wykryte. 

Historia różnych dziedzin fizyki toczyła się różnie. 
Przeważnie rozpoczynała się od doświadczalnego od¬ 
krycia jakiegoś nowego zjawiska (obiektu, procesu, 
własności). W takiej sytuacji w pierwszym okresie 
badawczym dominował eksperyment, a więc kon¬ 
strukcja odpowiednich detektorów, pomiary różnych 
charakterystycznych wielkości, szukanie fenomeno¬ 
logicznych reguł, korelacji, struktur i związków. 
Oczywiście i na tym etapie—jak już wspominaliśmy 

— dużą rolę odgrywa tworzenie nowych pojęć i kon¬ 
strukcji myślowych, bez których eksperyment byłby 
ślepy i przypadkowy. Koncepcje teoretyczne wpro¬ 
wadzane wówczas są więc nieodzowne dla właściwego 
ukierunkowania doświadczeń. Nie stanowią one jesz¬ 
cze teorii, ale są przygotowaniem teorii, której celem 
jest wykrycie istotnych dla danego typu obiektów 
czy zjawisk, strukturalnych i dynamicznych związków 
przyczynowych oraz zapisanie ich w odpowiedniej 
matematycznej formie. 

Z chwilą skonstruowania takiej teorii zaczyna się 
badanie i sprawdzanie jej konsekwencji. Od metody 
indukcyjnej, stosowanej na poprzednim konstruk¬ 
cyjnym etapie, przechodzi się do metody dedukcyjnej, 
polegającej na wyciąganiu logicznych wniosków z za¬ 
łożeń i równań teorii. Dobra teoria nie powinna za¬ 
wierać logicznych i matematycznych sprzeczności, 
powinna tłumaczyć przyczynowo znane już fakty 
i przewidywać nowe. Za szczególnie cenne osiągnięcie 
teorii uważa się potwierdzenie przez doświadczenie 
wszystkich przewidywań nieznanych uprzednio fak¬ 
tów. Oczywiście zgodność z faktami doświadczalnymi 
musi być ilościowa, a nie tylko jakościowa. Ważną 
zaletą każdej teorii fizycznej jest więc możliwie do¬ 
kładna zgodność z doświadczeniem. 

Zdarzyło się niejednokrotnie w historii fizyki, że 
pewne nieoczekiwane przewidywania teorii dawały 
asumpt do wykrycia zupełnie nowych zjawisk i do 
powstania nowych działów fizyki. Czasem więc i do¬ 
świadczenie wyprzedza teorię, czasem — na odwrót 

— teoria wyprzedza doświadczenie. Maxwell np. 
przewidział na podstawie skonstruowanej przez sie¬ 
bie teorii elektryczności i magnetyzmu istnienie fal 
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elektromagnetycznych i zbadał teoretycznie ich wła¬ 
sności. Fale te wykrył doświadczalnie H. Hertz wiele 
lat później. Szczególna teoria względności Einsteina 
przewidywała szereg zaskakujących efektów, jak np. 
wzrost masy lub wydłużanie się czasu życia nietrwa¬ 
łych cząstek będących w ruchu względem obserwa¬ 
tora, co zostało później potwierdzone doświadczalnie. 

Można podać bardzo wiele takich przykładów swo¬ 
istego wyprzedzania doświadczenia przez teorię. 
Z drugiej jednak strony — wszystkie teorie fizyczne 
powstały w wyniku analizy odpowiednich danych 
doświadczalnych. Nie ma w fizyce sprawdzonych te¬ 
orii, które byłyby „wymyślone” na drodze czysto 
racjonalnych rozważań, nie opierających się na żad¬ 
nych faktach doświadczalnych. Jest to możliwe w ma¬ 
tematyce, która jako nauka czysto racjonalna nie 
musi się opierać na żadnych realnych faktach. Ale 
fizyka jest nauką empiryczną, nie może być zatem 
czysto racjonalna, lecz musi być racjonalno-empi- 
ryczna. 


Sprzężenie teorii z doświadczeniem 

Czasami po pewnym okresie badań eksperymental¬ 
nych i przygotowawczej działalności koncepcyjnej 
dobra teoria powstawała stosunkowo szybko, tj. bez 
wielu nieudanych prób. Niejednokrotnie powstanie 
dobrej teorii poprzedzał szereg próbnych hipotez, 
które po konfrontacji z doświadczeniem trzeba było 
odrzucać lub modyfikować, usuwając stopniowo zau¬ 
ważone braki i luki. 

Racjonalno-empiryczna metoda naukowa, stoso¬ 
wana w fizyce i innych naukach empirycznych, opiera 
się na bardzo charakterystycznych cyklach badaw- 
cyk! czych. Typowy cykl badawczy składa się z następu- 
badawczy jących etapów (rys. 1): stan początkowy (wyjściowy) 
wiedzy, postawienie problemu, wysunięcie hipotezy 
rozwiązującej ten problem (przynajmniej częściowo). 



Rys. 1. Struktura typowego cyklu badawczego. Strzałki niebieskie 
przedstawiają sprzężenia zwrotne 


testowanie hipotezy (logiczne, matematyczne i em¬ 
piryczne), analiza hipotezy i problemu w świetle wy¬ 
ników testów (odrzucenie, korekta lub przyjęcie hipo¬ 
tezy), nowy stan wiedzy. 

Jeśli testy nie potwierdzają w pełni hipotezy, należy 
ją poprawić lub zastąpić nową hipotezą, albo też 
skorygować sam problem, rozpoczynając w ten sposób 
nowy cykl badawczy. Jeśli po pewnej liczbie takich 
cykli dojdziemy do zgodnej z wszystkimi faktami 
hipotezy rozwiązującej nasz problem, możemy ją 
uznać za dobrą teorię i włączyć do zasobu sprawdzo¬ 
nej wiedzy naukowej. Wynikiem takiego postępowa¬ 
nia jest więc osiągnięcie nowego, wyższego poziomu 
wiedzy. 

Punktem wyjściowym każdego cyklu badawczego 
jest zastany przez badacza stan wiedzy, z którego 
wyłania się problem (pytanie). Czasem rozwiązanie 
problemu wynika z już znanych faktów oraz już 
istniejących teorii i nie wymaga nowych hipotez ani 
stosowania podanego cyklu badawczego. Innymi sło¬ 
wy, odpowiedź na tego typu pytanie tkwi implicite 
w zastanej wiedzy, ale wymaga zebrania i przetwo¬ 
rzenia pewnych informacji. Jeśli np. zapytamy astro¬ 


noma, jakie będzie położenie planety Wenus jutro 
o godzinie 23, to z pewnością nie odpowie nam z miej¬ 
sca, lecz najpierw zajrzy do odpowiednich tablic astro¬ 
nomicznych, następnie wykona konieczne obliczenia 
i dopiero potem będzie mógł podać współrzędne pla¬ 
nety w żądanej chwili. Tego rodzaju problemy wy¬ 
stępują z reguły w nauczaniu oraz w zastosowaniach 
wiedzy naukowej, gdzie odgrywają bardzo istotną 
rolę. Do poznania nie wnoszą jednak nic istotnie 
nowego, ponieważ właściwie nie doskonalą i nie roz¬ 
szerzają zasobu naszej wiedzy, wydobywają tylko 
z ogromu tej wiedzy aktualnie interesującą nas in¬ 
formację. 

Z poznawczego punktu widzenia znacznie waż¬ 
niejszy jest inny typ problemów, które są impliko¬ 
wane przez aktualną wiedzę naukową, ale których 
rozwiązanie nie wynika z tej wiedzy, lecz wymaga jej 
rozszerzenia. Na przykład — po odkryciu możli¬ 
wości wzbudzania atomów oraz jonizacji, tj. wyry¬ 
wania elektronów z atomów lub molekuł, powstały 
następujące problemy: Jakie siły trzymają elektrony 
w atomie? Jakie ruchy może wykonywać elektron 
w atomie? Jakie jest pochodzenie dodatniego ładun¬ 
ku, który neutralizuje ujemny ładunek elektronów? 
Jak rozłożone są ładunki dodatnie i ujemne w atomie? 

Pierwsze hipotezy opierały się na założeniu, że 
elektrony trzymane są w atomie siłami elastycznymi 
(niewiadomego pochodzenia) i mogą wykonywać 
drgania o stałej częstości dokoła położenia równowagi. 
Dodatni ładunek i masa atomu miały być rozmazane 
po całym jego wnętrzu. Taki prosty model teoretyczny 
tłumaczył sporo zjawisk, ale nie potrafił dać odpo¬ 
wiedzi na dwa ostatnie z podanych wyżej pytań. Poza 
tym nie potrafił wyjaśnić wielkiej liczby częstości 
drgań występujących nawet w najprostszym jednoelek- 
tronowym atomie wodoru. Dopiero z przeprowadzo¬ 
nej przez Rutherforda analizy rozproszeń cząstek a 
przez atomy wynikło, że cały dodatni ładunek ato¬ 
mu i prawie cała jego masa skupione są w jądrze 
o rozmiarach ok. 10 5 razy mniejszych od rozmiarów 
atomu i że elektrony krążą dokoła jądra trzymane na 
uwięzi przez siły kulombowskiego przyciągania po¬ 
chodzące od dodatniego ładunku jądra. Dwa lata 
później (1913 r.) Bohr zaproponował swój model ato¬ 
mu wodoru, w którym uwzględnił wyniki Rutherfor¬ 
da, dodał przy tym do mechaniki Newtona trzy nowe 
kwantowe postulaty. Również model Bohra nie był 
w pełni zadowalający, gdyż nie dawał możliwości 
obliczenia natężeń linii widmowych, nie nadawał się 
do obliczeń poziomów cięższych atomów itd. Wresz¬ 
cie w 1925 r. powstała mechanika kwantowa (falowa) 
atomu, którą po pewnych udoskonaleniach, związa¬ 
nych z wprowadzeniem spinu i statystyki, uwzględ¬ 
nieniem efektów relatywistycznych itp., można było 
uznać za dobrą teorię atomów, molekuł i wszelkich 
ciał z nich złożonych. 

Widać na tym przykładzie, że w celu rozwiązania 
drugiego rodzaju problemów należy wysunąć od¬ 
powiednią hipotezę teoretyczną, której zasadność 
i poprawność trzeba wszechstronnie sprawdzić. Zgo¬ 
dne z hipotezą wyniki testów uzasadniają ją, tzn. 
umacniają przekonanie o jej słuszności, ale z logicz¬ 
nego punktu widzenia jedynie jej nie wykluczają i nie 
stanowią nigdy niezbitego dowodu jej prawdziwości. 
Dotyczy to nawet bardzo dobrze ugruntowanych, 
wszechstronnie sprawdzonych i empirycznie po¬ 
twierdzonych teorii. Ani więc próbne, robocze hipo¬ 
tezy, ani też dobrze sprawdzone teorie fizyczne nie 
są niepodważalne i absolutnie prawdziwe. Nawet 
najlepsze teorie mają ograniczony zasięg stosowal¬ 
ności, tzn. tłumaczą i opisują w zgodzie z doświad¬ 
czeniem tylko pewien ograniczony zakres realnych 
faktów; ponadto opis ten ma zawsze ograniczoną 
dokładność. Nawet najlepiej sprawdzone teorie nie 
mają więc charakteru ostatecznej, dokładnej i abso¬ 
lutnej prawdy, przedstawiają jedynie prawdy cząstko¬ 
we, oparte na pewnych przybliżeniach. I tak np. 
wspomniana mechanika kwantowa atomu też nie jest 
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uniwersalną i bezwzględnie dokładną teorią, choć jej 
zasięg stosowalności jest naprawdę ogromny. Zasięg 
ten nie obejmuje jednak ani cząstek elementarnych, 
ani wnętrza jądra, ani licznych procesów promienio¬ 
wania, kreacji i anihilacji cząstek itd. 

Scharakteryzowana wyżej metoda badawcza, opar¬ 
ta na powtarzaniu stopniowo doskonalonych cykli 
badawczych, ma tę zaletę, że świetnie pasuje do przy¬ 
bliżonego i stopniowego charakteru naszego pozna¬ 
nia. Pozwala ona bowiem na systematyczne doskona¬ 
lenie naszej wiedzy, która polega nie tylko na odkry¬ 
waniu nowych faktów, lecz także na tworzeniu no¬ 
wych coraz lepszych teorii, opisujących przyczynowo 
coraz większy zakres faktów z coraz większą dokład¬ 
nością. Metoda naukowa fizyki nie jest więc metodą 
zdobywania prawd absolutnych, lecz metodą dosko¬ 
nalenia prawd cząstkowych, metodą kolejnych przy¬ 
bliżeń. 


Rola teorii w poznaniu przyrody 

Doskonalenie wiedzy naukowej jest możliwe dzięki 
zawartym w cyklu badawczym sprzężeniom zwrot¬ 
nym między hipotezą i realnymi faktami, czyli między 
teorią i doświadczeniem. Struktura tego cyklu uwzglę¬ 
dnia również ogromną rolę teorii w poznaniu świata. 
Może się wydawać, że teoria jest niepotrzebnym, bo 
jak stwierdziliśmy wyżej — nie całkiem pewnym ele¬ 
mentem poznania. Realne fakty są niewątpliwie pew¬ 
niejsze i ich znajomość stanowi oczywiście niezwykle 
cenną część wiedzy naukowej. Wiedza uznająca tylko 
realne fakty, a odrzucająca wszelkie teorie wykracza¬ 
jące poza porządkowanie faktów, byłaby jednak 
wiedzą często opisową, nie wchodzącą w przyczyny 
zjawisk, pozbawioną możliwości tłumaczenia i prze¬ 
widywania. Byłaby to zatem wiedza zdecydowanie 
uboższa — zarówno w sensie poznawczym, jak i prak¬ 
tycznym — od wiedzy naukowej, która również opie¬ 
ra się na realnych faktach, ale w celu ich zrozumienia, 
wyjaśnienia, przewidywania i praktycznego wykorzy¬ 
stania posługuje się teoriami. 

Okazuje się zresztą, że nawet samo uporządkowa¬ 
nie i klasyfikacja faktów oparta na odpowiednich 


teoriach jest z reguły znacznie lepsza, prostsza, lepiej 
uzasadniona i głębsza. Koncepcje, prawa i zasady 
teoretyczne tworzą poza tym konieczny dla głębszego 
poznania język pojęć i wytyczają sposób myślenia 
oraz sposób patrzenia na badane zjawiska. Koncepcje 
teoretyczne sugerują często, co należy badać, czym 
i jak. Innymi słowy, teorie bardzo często zarówno 
sugerują kierunki i obiekty dalszych badań empirycz¬ 
nych, jak też wskazują możliwe narzędzia i metody 
badawcze. Warto sobie np. uświadomić ogromną 
stymulującą rolę hipotezy atomowej w XIX w., kiedy stymulująca 
to przez długi czas opierała się ona jedynie na prostej rola hipotezy 
interpretacji kilku makroskopowych praw zaobser- atomowej 
wowanych głównie w procesach chemicznych. Hipo¬ 
teza atomowa dała jednak liczne konkretne wskazów¬ 
ki dotyczące badań doświadczalnych, sugerując, jak 
szukać innych, coraz wszechstronniejszych i coraz 
bardziej bezpośrednich eksperymentalnych metod 
badania atomów, molekuł i jonów. 

Teorie naukowe są więc podstawową formą, spo¬ 
sobem i narzędziem poznania. Niemożliwe byłoby 
głębsze, przyczynowe poznanie i szersze praktyczne 
zastosowanie zj‘awisk przyrody, gdybyśmy się ogra¬ 
niczyli wyłącznie do spisów i opisów obserwowanych 
faktów. Naukowe poznanie i wykorzystanie praw 
przyrody'odbywa się za pomocą ustawicznie dosko¬ 
nalonych i sprawdzanych przyczynowych teorii, a nie 
za pomocą najbardziej nawet skrupulatnych katalo¬ 
gów faktów. Niech ktoś spróbuje skonstruować dzia¬ 
łający samochód bez żadnej teorii, nie znając w ogóle 
praw fizyki, mając tylko do dyspozycji dokładny ka¬ 
talog wszystkich części samochodu! 

Zbudowanie możliwie dokładnej, przyczynowej, po¬ 
twierdzonej przez realne fakty teorii naukowej jest 
więc w pewnym sensie głównym celem i uwieńczeniem 
określonego etapu badań. Z reguły etap taki zawiera 
nie tylko jeden cykl badawczy, lecz całą spiralę, 
a nawet wiele spiral składających się z szeregu cykli 
badawczych, zbliżających się poprzez różne nieudane 
i częściowo udane, bezpłodne i płodne hipotezy ro¬ 
bocze do zadowalającej teorii badanego zakresu 
zjawisk. 

Oczywiście określenie „zadowalająca teoria'’ jest teoria 
względne. Teoria oddająca w zadowalający sposób zadowalająca 
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Rys. 2. Hierarchiczna struktura współczesnych teorii fizycznych. Zaznaczono tylko najważniejsze teorie fizyczne. Na szarym tle podano 
teorie w zasadzie zadowalające, dobrze sprawdzone, na niebieskim — teorie w budowie, czyli jeszcze niezadowalające. Relacje imph - 
kacji przedstawione są strzałkami; strzałki czarne oznaczają implikacje dobrze sprawdzone, niebieskie — implikacje spodziewane. 
Linie poziome oznaczają związki (często obustronne) między teoriami tego samego poziomu 


23 


klasyczne teorie makroskopowe kwantowe teorie mikroskopowe 

















































































pewien zakres zjawisk może się stać niezadowalająca, 
gdy zwiększymy wymagania dokładności lub po¬ 
większymy zakres faktów, np. przez odkrycie nowych 
zjawisk nie objętych przez dotychczasową teorię. 
Trzeba wtedy szukać nowej, ogólniejszej i dokład¬ 
niejszej teorii. W fizyce zdarzało się już wielokrotnie, 
że ta nowa, doskonalsza teoria nie była sprzeczna 
z poprzednimi (starymi) teoriami i wcale nie obalała 
ich, lecz tworzyła nowy, ogólniejszy, szerszy i głęb¬ 
szy punkt widzenia. Stare teorie okazywały się przy¬ 
padkami szczególnymi lub granicznymi, tj. pewnymi 
przybliżeniami nowej. Teorie fizyczne są dziś ściśle 
powiązane w bardzo ciekawą hierarchiczną strukturę, 
która przypomina trochę drzewo genealogiczne. 
Wiele gałązek i konarów tego drzewa już znamy, ale 
do centralnego pnia, z którego wszystko wyrasta, 
jeszcześmy się nie dostali (rys. 2 ). 

Rys. 2 przedstawia schemat powiązań między dob¬ 
rze sprawdzonymi teoriami fizycznymi i teoriami 
obecnie tworzonymi. 


Przy czy nowość i rieterminizm 

Fizyka interesuje się szczególnie prawdami, które mają 
charakter związków przyczynowych, tzn. określają 
pewną sytuację zwaną skutkiem, jeśli tylko spełnione 
są warunki zwane przyczyną. Rozumienie charakteru 
związku przyczynowego nie jest w nauce ani w filo¬ 
zofii zupełnie jasne i jednoznaczne. Niektórzy uwa- 
związki żają, że związek przyczynowy dotyczy tylko zmian 
przyczynowe w czasie, a więc zdarzeń i procesów. W tym ujęciu 
przyczyna p jest zdarzeniem (lub procesem) poprze¬ 
dzającym w czasie inne zdarzenie s , zw. skutkiem. Przy 
tym zawsze, jeśli w chwili t zajdzie p, to w późniejszej 
chwili t'>t zajdzie również s. Liczne równania ruchu 
(np. równania Newtona, Maxwella, Schrodingera, 
równania przewodnictwa cieplnego, dyfuzji) opisują 
takie czasowe związki przyczynowe. Podanie stanu 
początkowego układu w chwili t i wartości wszystkich 
oddziaływań (sił) w przedziale czasu od t do t'>t 
określa jednoznacznie stan układu w dowolnej chwili 
późniejszej /'. Skutek można uznać w tym przypadku 
za zdarzenie polegające na tym, że układ znajduje się 
w określonym stanie w chwili t\ Natomiast za przy¬ 
czynę trzeba uznać cały zespół warunków, a mianowi¬ 
cie zdarzenie polegające na wystąpieniu określonego 
stanu początkowego w chwili t oraz zadziałanie okreś¬ 
lonych sił i praw ruchu w przedziale od / do t'. Stan 
końcowy układu jest zdeterminowany przez stan po- 
determinizm czątkowy i równania ruchu w przedziale od t do t\ 
Tak rozumiana przyczynowość wiąże się więc ściśle 
z determinizmem. 

Zamiast pojęciami przyczyny i skutku determi- 
nizm operuje pojęciami stanu początkowego i końco¬ 
wego oraz pojęciem równań ruchu. Przy tych samych 
oddziaływaniach stan początkowy wyznacza jedno¬ 
znacznie stan końcowy. Natomiast przy różnych 
oddziaływaniach różne stany początkowe mogą 
prowadzić do tego samego stanu końcowego i na 
odwrót — z tego samego stanu początkowego może¬ 
my otrzymać różne stany końcowe, 
zdarzenia Głębsze podejście do zagadnienia przyczynowości 
elementarne oparte jest na dokładniejszej analizie oddziaływań 
między parami zdarzeń elementarnych ę(A) i <p(A') 
zachodzących w punktach A = (/, x, y, z) i A' — 
= ( t ', x', y', z') czasoprzestrzeni. (Zdarzeniem ele¬ 
mentarnym może być np. określona wartość jakie¬ 
goś pola (p(A) w punkcie A. Mając teorię opisującą 
rozchodzenie się pola 9 ?, możemy powiedzieć, czy 
i jak wartość pola <p(A) w punkcie A wpływa na war¬ 
tość pola <p(A') w punkcie A'.) Stawiamy pytanie jaki 
jest zbiór zdarzeń elementarnych <p(A), które stanowią 
łącznie przyczynę zdarzenia <p(A'). 

Dokładna odpowiedź zależy od rodzaju interesu¬ 
jących nas zdarzeń elementarnych <p(A). Najistotniej¬ 
sze ogólne ograniczenia daje teoria względności, która 
podaje następujące warunki konieczne istnienia przy- 
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czynowego związku między zdarzeniami zachodzą¬ 
cymi w A i zdarzeniem zachodzącym w A': 

t'X, 

Jeśli któryś z tych warunków nie jest spełniony, zda¬ 
rzenia zachodzące w A nie mogą mieć wpływu na 
zdarzenia zachodzące w A'. Mówimy wtedy, że punk¬ 
ty A i A' są przyczynowo nie powiązane. Znaczenie zdarzenia 
pierwszej nierówności jest oczywiste. Natomiast dru- przyczynowo 
ga nierówność oznacza, że prędkość rozchodzenia się nie powiąza- 
wszelkich realnych oddziaływań fizycznych nie może ne 
być większa od prędkości światła c w próżni. W wy¬ 
padku oddziaływań elektromagnetycznych prędkość 
ta wynosi dokładnie c, dla innych oddziaływań — 
może być mniejsza lub równa c. 

W nieco luźniejszym sformułowaniu związek przy¬ 
czynowy łączy się zawsze z jakimś pytaniem typu: 
dlaczego? W zależności od rodzaju dopuszczalnych dlaczego...? 
pytań otrzymamy różne „rodzaje” przyczyn. W od¬ 
niesieniu do ruchu punktu materialnego możemy np. 
zadać pytanie: Dlaczego pęd cząstki zmienia się 
w taki, a nie inny sposób? Gdy znamy równania dy¬ 
namiki Newtona, odpowiedź na takie pytanie jest 
łatwa: Pęd zmienia się w określony sposób, ponie¬ 
waż na cząstkę działa odpowiednia siła. Gdyby na 
cząstkę nie działały żadne siły, pęd jej nie zmieniałby 
się w ogóle. Bezpośrednią przyczyną sprawczą zmia¬ 
ny pędu jest więc siła. Jeśli jednak nieco inaczej za¬ 
pytamy: Dlaczego przyspieszenie wynosi w chwili t 
tyle a tyle? — to odpowiedź będzie inna. A miano¬ 
wicie o wartości przyspieszenia w danej chwili de¬ 
cyduje nie tylko siła, lecz także masa cząstki i chwi¬ 
lowa wartość jej prędkości. Za przyczynę określonej 
zmiany prędkości (czyli określonej wartości przyspie¬ 
szenia) wypada więc uznać nie tylko siłę, lecz także 
masę i prędkość w interesującej nas chwili. 

Widać z tego przykładu, że określenie przyczyny 
i skutku zależy od sposobu stawiania pytań. Pytania 
typu „dlaczego” mogą w ogóle nie dotyczyć zmian 
zachodzących w czasie ani żadnych zmian. Możemy 
np. zadać pytanie: Dlaczego jądro helu ma podwójny 
ładunek dodatni i spin równy zeru? Odpowiedź bę¬ 
dzie brzmiała: Ponieważ składa się ono z dwóch do¬ 
datnio naładowanych protonów i dwóch neutronów, 
przy tym wszystkie one są w stanie podstawowym 
z momentem orbitalnym równym zeru, a spiny obu 
protonów i obu neutronów muszą być wtedy — 
zgodnie z zakazem Pauliego— skierowane przeciw¬ 
nie. Podane przyczyny mają teraz charakter nie dy¬ 
namiczny, lecz czysto strukturalny. Pytanie nie do- Mode i j ądra 
tyczy zmian w czasie, więc nie było potrzeby odwo- helu 
ływania się do sił jądrowych i równań ruchu. Wy¬ 
starczyło podanie prostych informacji o strukturze 
jądra i prostego prawa w postaci zakazu Pauliego. 

Fizycy są skłonni traktować determinizm i przy¬ 
czynowość raczej szeroko, stosując te pojęcia do sy¬ 
tuacji, w których własności obiektów wynikają te¬ 
oretycznie z ich struktury lub odpowiednich dyna- przy czy no- 
micznych praw. Związek przyczynowy w tym szer- wość jako 
szym ujęciu przypomina więc logiczną relację wyni- relacja 
kania p->s, a więc: jeśli zachodzi p, to musi także wynikania 
zachodzić Szczególnie poglądowe i ciekawe jest 
wynikanie z odpowiednich teorii własności obiektów 
złożonych z własności ich części składowych. 

Bardzo wygodny i poglądowy jest podział obiektów 
fizycznych według stopnia złożoności, co odpowiada 
z grubsza ich wzrastającym rozmiarom. Mamy więc 
poziom: cząstek elementarnych, jąder, atomów, mo¬ 
lekuł i jonów, zwykłych ciał makroskopowych. Ziemi 
i planet, gwiazd, galaktyk i Wszechświata. Do chemii 
należy poziom atomów i drobin; fizyka klasyczna 
zajmuje się głównie ciałami makroskopowymi o nie¬ 
zbyt wielkich rozmiarach; geologia i geofizyka zaj¬ 
mują się Ziemią, jej składem i budową; astronomia 
zajmuje się ostatnimi czterema poziomami; biologia 
sięga od poziomu cząsteczek do poziomu ciał makro¬ 
skopowych. 

Zasada, że prawa i własności obiektów należących 










do wyższego poziomu wynikają z odpowiednich praw 
i własności ich części składowych należących do 
niższego poziomu, jest w fizyce w wielu wypadkach 
bardzo dobrze i dokładnie potwierdzona; niekiedy 
dokładność pozostawia jeszcze wiele do życzenia. 
Na przykład wynikanie własności jąder z własności 
nukleonów' i innych cząstek elementarnych nie budzi 
wątpliwości, ale wobec braku zadowalającej ogólnej 
teorii cząstek elementarnych przewidywania są jesz¬ 
cze mało dokładne. Natomiast bardzo dokładnie po¬ 
trafimy wytłumaczyć i obliczyć wszystkie fizyczne 
i chemiczne własności atomów, ponieważ mechanika 
kwantowa jest bardzo dobrą teorią atomu. Okazuje 
się, że skomplikowane własności atomów są ściśle 
określone przez stosunkowo proste, czysto elektro¬ 
magnetyczne i mechaniczne własności jąder i otacza¬ 
jących je elektronów (jak masy i ładunki elektryczne 
oraz momenty magnetyczne jądra i elektronu). Oczy¬ 
wiście wynikanie to możemy wykazać jedynie za po¬ 
mocą teorii fizycznych — w tym wypadku za pomocą 
mechaniki kwantowej. 

Z kolei struktura geometryczna i inne fizyczne 
i chemiczne własności molekuł wynikają z budowy ze¬ 
wnętrznych powłok elektronowych atomów wcho¬ 
dzących w skład tych molekuł. Dalej — fizyka sta¬ 
tystyczna, teoria ciała stałego i inne teorie ukazują, 
jak własności ciał makroskopowych (gazów, cieczy, 
ciał stałych) wynikają z ich struktury atomowej, mo¬ 
lekularnej lub jonowej. Od czasów Newtona wiemy, 
że ruchy planet, komet i gwiazd wynikają z tych sa¬ 
mych praw mechaniki, które obowiązują makrosko¬ 
powe ciała na Ziemi. Wiele własności Słońca i innych 
gwiazd jest wynikiem występujących w nich reakcji 
między jądrami i cząstkami elementarnymi. Wyjaśnio¬ 
no m.in., że źródłem ogromnej energii promieniowa¬ 
nia wysyłanego przez Słońce i inne gwiazdy są reakcje 
jądrowe. 

Liczne i różnorodne relacje wynikania, które już 
znamy, dają bardzo głębokie i ciekawe powiązania 
między różnymi gałęziami właściwej fizyki a innymi 
naukami przyrodniczymi. Związki te sprawiają, że 
mimo powstawania nowych specjalności naukowych, 
Jedność mimo odkrywania nowych zjawisk, z teoretycznego 
nauk punktu widzenia nauki przyrodnicze tworzą coraz 
przyrodni- bardziej jednolitą całość. Ten niezwykle ważny i fra- 
czych pujący proces jednoczenia wszystkich nauk przyrod¬ 
niczych na bazie fizyki nie został zakończony. Spo¬ 
dziewamy się odkrycia jeszcze wielu zupełnie nowych, 
fundamentalnych związków po powstaniu zadowa¬ 
lającej teorii cząstek elementarnych. Również orga¬ 
nizmy żywe nadal kryją wiele tajemnic. Nie ma jednak 
powodów do niecierpliwości. Trzeba bowiem pamię¬ 
tać, że fizyka cząstek elementarnych powstała dopiero 
ok. 30 lat temu i że ciągle odkrywamy w tej dziedzinie 
nowe zjawiska i nowe prawa. Niemal równie młoda 
jest biologia molekularna, badająca fizykochemiczne 
podstawy życia. 


Matematyka jako język fizyki 

Matematyka jest nauką czysto racjonalną, która nie 
zajmuje się odkrywaniem i badaniem empirycznych 
faktów, lecz tworzeniem i doskonaleniem specjalnych 
języków formalnych. Języki te są potrzebne do ścisłe¬ 
go, jasnego i komunikatywnego przedstawienia ab¬ 
strakcyjnych pojęć i relacji, których opisanie i zba¬ 
danie za pomocą języka potocznego byłoby zbyt 
kłopotliwe, niedokładne, niejasne, czy wręcz nie¬ 
możliwe. 

Dla uniknięcia ewentualnych nieporozumień na¬ 
leży podkreślić, że twórcza praca matematyków nie 
ma nic wspólnego z propozycjami sztucznych języ¬ 
ków w rodzaju esperanto. W tym ostatnim wypadku 
chodzi tylko o wierne tłumaczenie zdań występują¬ 
cych w językach naturalnych (narodowych) na nowy 
język, który dzięki swej prostocie miałby szanse sta¬ 
nia się językiem światowym. W twórczych badaniach 


matematyków nie chodzi o tłumaczenie znanych już 
zdań i relacji na nowy ystem słów czy innych zna¬ 
ków, lecz o poszukiwanie i badanie nowych, niezna¬ 
nych uprzednio relacji, do których opisu trzeba two¬ 
rzyć specjalne języki symboli (znaków) i reguł po¬ 
stępowania. 

Teorie matematyczne nie muszą się odnosić do re¬ 
alnej rzeczywistości ani wynikać z badania realnych 
faktów; nie podlegają więc empirycznej weryfikacji, 
lecz jedynie sprawdzeniu logicznej poprawności. 

W tej sytuacji jest oczywiste, że nie wszystkie możli¬ 
we, logicznie dopuszczalne teorie matematyczne i re¬ 
lacje nadają się do opisu rzeczywistości. W fizyce np. 
zwykle spośród wielu matematycznie dopuszczalnych 
rozwiązań równań opisujących dane zjawisko trzeba 
wybrać te, które spełniają jeszcze pewne dodatkowe 
warunki czysto fizyczne. Rozwiązania równań nie 
spełniające tych warunków odrzuca się jako nieprzy¬ 
datne dla fizyka. Tak więc dopiero nauki empiryczne 
oraz praktyka (technika) stwierdzają, które z utwo¬ 
rzonych przez matematykę języków, relacji, twierdzeń, 
zdań i pojęć znajdują zastosowanie do opisu rzeczy¬ 
wistości. 

Ze względu na abstrahowanie od realnych faktów 
symboliczny język matematyki jest prawdziwie uni¬ 
wersalny, tzn. nadaje się do opisu bardzo wielu 
formalnie identycznych relacji między jakościowo 1 d*f 

zupełnie odmiennymi zjawiskami. Identyczne pod 
względem formalnym (tj. czysto matematycznym) RównanJe 
równania falowe mogą opisywać tak różne zjawiska falowe 
jak rozchodzenie się głosu, światła lub fal radiowych. 

Odmienna treść fizyczna wynika dopiero z wyboru 
rozwiązań oraz interpretacji wielkości spełniających 
te równania i odpowiednie dodatkowe warunki 
fizyczne. 

Jako uniwersalny, a przy tym bardzo bogaty i ścisły 
język, matematyka ma ogromne znaczenie dla całej 
nauki. Proces matematyzacji nauki zaczął się histo¬ 
rycznie od astronomii i fizyki, gdzie ilościowy opis 
zjawisk przyrody i związane z tym szerokie stosowa¬ 
nie matematyki są najbardziej naturalne. Sformuło¬ 
wanie większości praw i wszystkich teorii fizycznych 
byłoby wręcz niemożliwe bez wszechstronnej pomocy 
matematyki. Potrzeby fizyki wielokrotnie inspirowały 
powstanie nowych działów matematyki. Tak było 
w czasach nowożytnych z geometrią analityczną, 
teorią równań różniczkowych i całkowych, rachun¬ 
kiem wariacyjnym czy teorią dystrybucji, które 
powstały niejako na zamówienie fizyki i przy współ¬ 
udziale fizyków. 


Modele mechaniczne i matematyczne 

Hipotezy robocze, a także dobrze sprawdzone teorie 
fizyczne opierały się dawniej na poglądowych mo¬ 
delach geometryczno-mechamcznych. Modelem mo¬ 
lekuły np. był układ odpowiednio przestrzennie roz¬ 
mieszczonych punktów masowych odpowiadających 
atomom. Odległości między atomami miały być stałe, 
tak że pod wieloma względami molekuła zachowy¬ 
wała się jak bryła sztywna, mogąca wykonywać 
tylko ruchy postępowe i obrotowe dokoła środka 
masy. Modelem gazu był w teorii kinetycznej układ 
bardzo wielu sztywnych kulek o określonych promie¬ 
niach i masach, poruszających się bezładnie (ruchem 
termicznym), mogących się zderzać oraz oddziaływać 
na odległość siłami van der Waalsa. 

Stosowanie takich mechanicznych modeli było wy¬ 
nikiem podstawowej dla całej fizyki roli pojęć i praw 
mechaniki, co jest z pewnością także związane z fak¬ 
tem, że używane w fizyce detektory i przyrządy po¬ 
miarowe dokonują z reguły konwersji badanych zja¬ 
wisk na zjawiska mechaniczno-wizualne, które potra¬ 
fimy bezpośrednio obserwować i mierzyć. Można 
wyróżnić kilka podstawowych elementów, z których 
złożone są modele mechaniczne. Są to: punkty ma¬ 
sowe (korpuskuła, cząstka), bryły sztywne, ciągłe 
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ośrodki materialne i pola (np. pola sil działających na 
cząstkę lub pola różnych innych wielkości fizycznych, 
fale). Ż elementów tych można złożyć bardzo wiele 
klasycznych, mechanicznych modeli. Teoria oparta 
na takim mechanicznym modelu jest zwykle dość 
poglądowa, a wiele własności można wydedukować, 
zrozumieć i opisać prawie bez użycia matematyki. 
Dopiero gdy pytamy o konkretne wartości wielkości 
fizycznych lub bardziej złożone prawa, musimy sko¬ 
rzystać z pomocy matematyki. Koncepcji podstawo¬ 
wych dostarcza więc w takich modelach mechanika, 
a matematyka odgrywa tylko rolę pomocniczą; 
służy mianowicie do ścisłego sformułowania modelu 
mechanicznego i dokonywania obliczeń. 

W XX w', odkryto zjawiska kwantowe, powstały 
teorie kwantowe, w których związek stosowanych 
symboli matematycznych (np. operatorów, wekto¬ 
rów stanu, pól kwantowych) z pomiarem jest po¬ 
średni i bardzo złożony. Okazało się m.in., że elek¬ 
tron nie jest ani czystą korpuskułą, ani falą, lecz 
w pewnych sytuacjach przejawia własności korpu- 
skularne, w innych — pozornie sprzeczne z tamtymi — 
własności falowe. Korpuskularno-falowy, dualny cha- 
charakter elektronu, protonu i innych ,,cząstek” 
nie da się wytłumaczyć za pomocą żadnego klasycz¬ 
nego modelu mechanicznego. Jeszcze gorzej przed¬ 
stawia się sytuacja w zjawiskach, w których obser¬ 
wujemy kreację i anihilację elektronów i innych czą¬ 
stek kwantowych. 

Modele mechaniczne okazały się więc w XX w. 
nieprzydatne do opisu przynajmniej niektórych zja- 
modele wisk. Zmusiło to fizyków do coraz częstszego stoso- 
matematycz- wania tzw. modeli matematycznych. Model matema- 
ne tyczny to układ równań wraz z określeniem fizycznego 
charakteru występujących w nim symboli i ich związ¬ 
ku z pomiarami. Sprawa interpretacji tych równań 
za pomocą odpowiednich mechanicznych wyobrażeń 
staje się sprawą drugorzędną. Najważniejszą sprawą 
jest, by założone równania modelu matematycznego 
dawały wyniki ilościowo zgodne z doświadczeniem. 
Model jest tym lepszy, im większy jest zakres jego 
stosowalności i dokładności oraz im więcej jego prze¬ 
widywań potwierdziło doświadczenie. We współcze¬ 
snej fizyce stosuje się — z jednej strony (w charakte¬ 
rze hipotez roboczych) — modele matematyczne 
o bardzo wąskim zakresie i małej dokładności, 
z drugiej — modele bardzo dokładnie oddające 
rzeczywistość w szerokim zakresie zjawisk. W tym 
ostatnim przypadku mówimy raczej o teorii, a nie o 
modelu, gdyż tę nazwę rezerwuje się zwykle dla moc¬ 
no przybliżonych, fragmentarycznych, próbnych sche¬ 
matów teoretycznych, głównie takich, które dotyczą 
jakiegoś szczególnego, konkretnego obiektu lub 
zjawiska. 

Modele matematyczne są zazwyczaj znacznie mniej 
poglądowe od mechanicznych. Poglądowość nie jest 
jednak najważniejszą zaletą teorii. Nie możemy żądać 
od wszystkich praw natury, by były poglądowe w sen¬ 
sie mechanicznym. Zresztą uznanie teorii za poglą¬ 
dowy zależy trochę od przyzwyczajenia, rozwoju 
nauki, przyswojenia odpowiednich pojęć itp. W każ¬ 
dym razie rozwój fizyki zmusił badaczy do zarzuce¬ 
nia w pewnych sytuacjach klasycznych modeli 
mechanicznych, ponieważ okazały się one sprzeczne 
z rzeczywistością. 


Zarys rozwoju fizyki 


Od niepamiętnych, prehistorycznych czasów człowiek 
obserwował zjawiska przyrody, powodowany zarówno 
naturalną ciekawością, jak i chęcią praktycznego 
wykorzystania zauważonych regularności. Od bier¬ 
nej, przypadkowej obserwacji do celowego, czynnego, 
racjonalno-empirycznego działania naukowego droga 
jest jednak bardzo daleka. Nie da się ustalić okre¬ 


ślonej daty, czy nawet stulecia, które można by uznać 
za początek fizyki, ponieważ działalność badawcza 
człowieka nabierała bardzo powoli cech zwanych 
dziś naukowymi. Niewątpliwie można jednak wy¬ 
różnić w historii pewne przełomowe okresy, w których 
zaszły istotne i raczej trwałe zmiany warunkujące 
postęp nauki. 

Przełomowym dla fizyki i wielu innych nauk był 
z pewnością okres między VI a III w. p.n.e., kiedy to 
w starożytnej Grecji powstała filozofia rozumiana 
jako niezależne od religii i magii, racjonalne poszu¬ 
kiwanie prawdy o przyrodzie i o człowieku. Nie¬ 
zmiernie ciekawa jest historia myśli greckiej tego okre¬ 
su, która od stosunkowo prymitywnych rozważań 
Talesa nad prapoczątkiem świata przechodziła do 
coraz bardziej dociekliwych pytań i coraz wnikliw¬ 
szych i wszechstronniejszych odpowiedzi. W okresie 
tym powstały liczne racjonalne modele, mające 
wyjaśnić różne zjawiska przyrody. Choć często pro¬ 
pozycje greckich filozofów wydają się dziś bardzo 
naiwne, to jednak są i takie, które zadziwiają swoją 
trafnością. Zdecydowanie wyróżnia się wśród nich 
atomowy model materii, zapoczątkowany przez 
Leukippa, a rozwinięty przez Demokryta w IV w. 
p.n.e. Model ten jest stosunkowo bliski atomistycz- 
nym ideom współczesnej fizyki. 

Wszystkie modele przyrody filozofów greckich 
opierały się jednak na powierzchownych, jakościo¬ 
wych obserwacjach i spekulatywnych, nie sprawdzo¬ 
nych przesłankach. Były to więc modele czysto racjo¬ 
nalne i jakościowe, nastawione na wyjaśnienie, a nie 
na ilościowe przewidywanie. Brak odpowiednich 
kryteriów doświadczalnych nie pozwalał odróżnić 
propozycji trafnych od nietrafnych, płodnych od 
bezpłodnych. Wprawdzie występowali w bogatej 
kulturze greckiej również zwolennicy empiryzmu, 
był to jednak empiryzm raczej czysto obserwacyjny, 
bierny i jakościowy, który też nie zdołał się prze¬ 
kształcić w ścisłą racjonalno-empiryczną naukę. 

Wydaje się, że filozofowie greccy byli zbyt nie¬ 
cierpliwi i ambitni, że chcieli od razu znaleźć uniwer¬ 
salne i fundamentalne prawa przyrody, struktury 
i przyczyny; nie zdawali sobie sprawy, że trzeba 
przedtem lepiej i dokładniej poznać zjawiska przy¬ 
rody. Najpierw trzeba wiedzieć, „co i jak”, a potem 
można próbować głębszych odpowiedzi na pytanie 
typu „dlaczego”. 

Wielką zasługą i trwałą zdobyczą filozofii greckiej 
było jednak samo postawienie problemu racjonalnej 
teorii przyrody, która by tłumaczyła nawet bardzo 
złożone zjawiska za pomocą niewielkiej liczby sto¬ 
sunkowo prostych elementów składowych i praw. 
W filozofii i nauce greckiej można znaleźć także pod¬ 
stawowe idee dotyczące jedności materii oraz istnie¬ 
nia uniwersalnych praw przyrody. Znajdziemy tam 
także niemal wszystkie elementy dzisiejszej metody 
naukowej, jak indukcja i dedukcja, analiza i kon¬ 
strukcja pojęć, hipoteza, przyczynowość, racjonalizm, 
empiryzm, pomiar, eksperyment, obserwacja, ma¬ 
tematyczny zapis. Jednak znajdziemy tam również 
wiele koncepcji i tendencji niepotrzebnych lub wręcz 
błędnych. 

Dysponując w zasadzie wszystkimi potrzebnymi 
elementami składowymi procesu badawczego, filo¬ 
zofowie i uczeni greccy nie doszli do odpowiedniej ich 
syntezy, która jest potrzebna do skutecznego funkcjo¬ 
nowania metody naukowej. Nie opracowali w do¬ 
statecznym stopniu koniecznych dla rozwoju fizyki 
technik eksperymentalnych, nie zwrócili należytej 
uwagi na rolę pomiaru i eksperymentu, na ścisły, 
matematyczny opis zjawisk ani ilościową zgodność 
teorii z doświadczeniem. Toteż nie udało im się 
uruchomić tak istotnego sprzężenia zwrotnego między 
teoretyczną hipotezą a faktami doświadczalnymi, 
które jest podstawą samodoskonalącego mechanizmu 
empirycznej kontroli, sprawdzania i korygowania 
wysuwanych hipotez. 

I tak np. idealista Platon wysoko cenił matematykę. 
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ale lekceważył zmysłowe poznanie, a empiryk Ary¬ 
stoteles doceniał wprawdzie wagę zmysłowego poz¬ 
nania i logicznego rozumowania, ale posługiwał się 
głównie metodami jakościowymi i nie doceniał ści¬ 
słego matematycznego opisu zjawisk. Żaden z nich 
nie zdawał sobie sprawy z roli pomiaru i eksperymen¬ 
tu. 

W nauce i filozofii starożytności, a także później, 
aż do końca średniowiecza, brakowało więc pod¬ 
stawowych uzgodnień, co się objawiło w skrajnie 
przeciwnych postawach filozofów (uczonych) w spra¬ 
wach zasadniczych dla rozwoju metody naukowej 
i samych badań. Jeszcze dziwniejsze jest dziś dla nas 
pomieszanie w działalności tych samych ludzi ele¬ 
mentów racjonalnych z irracjonalnymi, materializmu 
z idealizmem, wyrafinowania logicznego z naiwnością 
i prymitywizmem przesłanek, grubego zmysłowego 
empiryzmu z metafizyczną, oderwaną od rzeczywi¬ 
stości spekulacją. 

Z fizyków starożytności niewątpliwie największym 
i najbliższym nam ideowo był Archimedes. Jego 
wielkość polegała nie tylko na odkryciu kilku pod¬ 
stawowych praw mechaniki, lecz także na umiejęt¬ 
ności łączenia teorii z praktyką i matematyki z ekspe¬ 
rymentem. Wydaje się, że Archimedes trafił już na 
trop właściwej, skutecznej metody naukowej, ale nie 
zdążył jej należycie opracować i rozpowszechnić. 
Nie znalazł też godnych następców i po jego śmierci 
rozwój fizyki właściwie zatrzymał się na kilkanaście 
stuleci. 

Jedynym działem fizyki, w którym starożytność 
przekazała wiekom późniejszym wiele cennych, kon¬ 
kretnych wiadomości, była statyka. Natomiast w za¬ 
gadnieniach ruchu i dynamiki panowały przez nie¬ 
mal 2000 lat zupełnie błędne koncepcje Arystotelesa. 
To samo można powiedzieć o błędnym fizycznym 
modelu świata Eudoksosa-Arystotelesa, który był 
sprzeczny z zasadami jedności materii, powszech¬ 
ności praw fizyki i przyczynowości, a ponadto miał 
raczej jakościowy i zamknięty charakter. Ogromny 
autorytet Arystotelesa jako filozofa i twórcy wielu 
nauk sprawił niestety, iż fizyczna astronomia zatrzy¬ 
mała się w rozwoju. 

Dopiero w okresie późnego średniowiecza i potem 
w okresie odrodzenia coraz więcej ludzi zaczęło 
sobie zdawać sprawę ze słabości ówczesnej, czysto 
racjonalnej, spekulatywnej nauki. Niektórzy, np. 
Roger Bacon oraz — dużo później — Francis Bacon, 
napisali nawet specjalne filozoficzne traktaty, za¬ 
wierające propozycje nowej empirycznej metody 
naukowej i wizje nowego społeczeństwa zorganizo¬ 
wanego na naukowych podstawach. Sami jednak nie 
zastosowali proponowanych metod do systematycz¬ 
nych badań naukowych, nie zdołali więc porwać 
współczesnych wielkimi odkryciami lub teoriami nau¬ 
kowymi. Inni, jak np. Leonardo da Vinci, dokonali 
wielu szczegółowych, ale niesystematycznych odkryć 
i wynalazków, które również nie zostały podjęte, 
kontynuowane i rozpowszechnione. Ani jedni, ani 
drudzy nie odegrali więc większej roli w powstaniu 
nowożytnego przyrodoznawstwa. Decydujące dla 
jego powstania i rozwoju okazały się dopiero fascy¬ 
nujące przykłady skuteczności nowego stylu myślenia 
w postaci wielkiej i stymulującej teorii lub w postaci 
dłuższej i systematycznej serii ważnych i ciekawych 
odkryć doświadczalnych. Tak więc nie R. Bacon ani 
F. Bacon i nie Leonardo da Vinci, lecz Kopernik, 
Galileusz i Newton są ojcami nowożytnej fizyki 
i całego przyrodoznawstwa. 

Największy przełom w historii nauk fizycznych 
dokonywał się w XVI i XVII w. dzięki rozwinięciu 
w tym okresie skutecznej i niemal całkowicie dojrzałej 
metody naukowej. Proces rozwijania nowej, racjo- 
nalno-empirycznej metody badawczej rozpoczął Mi¬ 
kołaj Kopernik. Jego dzieło okazało się wielką, nie¬ 
zwykle ważną i płodną syntezą renesansowego empi¬ 
ryzmu ze średniowieczną metafizyką. Od humanistów 
odrodzenia przejął Kopernik antydogmatyczną i em¬ 


piryczną, dociekliwą i poszukującą, krytyczną posta¬ 
wę, która była wolna od wszelkiego mistycyzmu 
i walczyła otwarcie z więzami tradycji, wątpliwymi 
dogmatami i autorytetami. Od swoich filozofujących 
poprzedników przejął racjonalny i ścisły, a przy tym 
śmiały teoretyczny sposób myślenia, umożliwiający 
głębsze poznanie i zrozumienie świata zamiast 
poprzestawania na jakościowym, czysto zmysłowym 
poznaniu i powierzchownym opisie obserwowanych 
zjawisk. Kopemikańska płodna synteza tych uprzed¬ 
nio rozdzielonych i przeciwstawnych lub źle wymie¬ 
szanych nurtów, postaw i sposobów myślenia sta¬ 
nowiła narodziny nowożytnego przyrodoznawstwa. 

Znajdujemy więc w dziele Kopernika niemal wszy¬ 
stkie podstawowe zasady dzisiejszej metody naukowej, 
bez tak częstych u jego poprźedników domieszek 
religijnych, magicznych, mistycznych itp. Kopernik 
wierzył w sposób oczywisty w realność świata i jego 
poznawalność za pomocą zmysłowych obserwacji 
i rozumowania. Jego metoda jest ścisła, oparta na 
pomiarach i matematyce. W przytaczanych argumen¬ 
tach fizycznych na rzecz układu heliocentrycznego 
korzystał w sposób widoczny z założenia jednolitości 
materii i powszechności praw fizyki. Unikał wszel¬ 
kich irracjonalnych i idealistycznych interpretacji 
obserwowanych zjawisk. 

Kopernik był przekonany o wyższości swojej 
metody naukowej i krytykował dowolność i aprio- 
ryczność, jakościowy charakter i brak uzasadnienia 
założeń u wielu swych poprzedników. Był przekona¬ 
ny, że dobra teoria powinna być nie tylko ilościowo 
zgodna z doświadczeniem, ale powinna być również 
zgodna z „naturą rzeczy”. Choć nie jest całkowicie 
jasne, jak rozumiał to wymaganie, to z jego własnych 
rozważań można sądzić, że dobra teoria powinna 
uwypuklać proste symetrie i prawa oraz powinna mieć 
jakieś głębsze, np. dynamiczne znaczenie. W sposób 
widoczny Kopernik szukał fizycznego uzasadnienia 
swojej heliocentrycznej teorii i zaproponował sam 
ciekawą wielograwitacyjną hipotezę, która była 
pierwszym krokiem w kierunku prawa powszechnego 
ciążenia. 

Zasługi Kopernika dla rozwoju fizyki polegają 
jednak nie tyle na wadze jego własnych odkryć i hi¬ 
potez, co na wadze problemów fizycznych, jakie 
dzieło jego otworzyło dla następnych pokoleń astro¬ 
nomów i fizyków. W przeciwieństwie do zamkniętych 
od strony fizycznej systemów Eudoksosa-Arystote¬ 
lesa oraz Ptolemeusza teoria Kopernika stanowiła 
system otwarty. Stała się więc przebogatym źródłem 
fundamentalnych i płodnych dla rozwoju fizyki 
pytań dotyczących: kinematycznych i dynamicznych 
praw i zasad mechaniki, fizycznej struktury układu 
planetarnego i Wszechświata oraz podstawowych 
zasad metody naukowej przyrodoznawstwa. 

Tak więc na samym progu ery nowożytnej astrono¬ 
mia, jako najbardziej ilościowa z ówczesnych nauk 
fizycznych, stała się dzięki Kopernikowi inspiratorką 
rozwoju całej fizyki. Dzieło Kopernika kontynuował 
świadomie Galileusz. Uznając i popierając system 
heliocentryczny Kopernika — ugruntowany na po¬ 
czątku XVII w. przez odkrycia Keplera — Galileusz 
skoncentrował swe wysiłki głównie na ziemskiej 
fizyce. Przeprowadził systematyczne i wnikliwe po¬ 
miary i obserwacje różnych zjawisk. On pierwszy 
zrozumiał, że wbrew pozorom siła wiąże się z przy¬ 
spieszeniem, a nie z prędkością. Skonstruował szereg 
nowych detektorów (termoskop, luneta, waga hy¬ 
drostatyczna). Odkrył prawo ruchu wahadła, księ¬ 
życe Jowisza, fazy Wenus itp. Przede wszystkim jed¬ 
nak pogłębił metodę naukową w zakresie detekcji 
i pomiarów zjawisk oraz wprowadził szereg ważnych 
dla dalszego rozwoju dynamiki pojęć. 

W XVII w. zostały położone doświadczalne i teore¬ 
tyczne podwaliny wielu działów fizyki. Zaczęto sy¬ 
stematyczne badania gazów i cieczy oraz ciał sprę¬ 
żystych, zjawisk optycznych i falowych (W. Snęli, 
R. Boyle, B. Pascal, Ch. Huygens, O. Romer, P. de 
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Fermat, Torricelli, Otto von Guericke i in.). Następcy 
Galileusza skonstruowali w XVII w. wiele nowych 
detektorów, np. baroskop do badania zmian ciśnie¬ 
nia, spektroskop pryzmatyczny do badania składu 
światła, zegary astronomiczne. 

Nowe, ilościowe metody fizyki, rozwijane przez 
Galileusza i jego następców, wymagały adekwatnych 
metod matematycznych. Niejako na zamówienie 
fizyki stworzył R. Descartes geometrię analityczną, 
a I. Newton i G.W. Leibniz — rachunek różniczkowy 
i całkowy. 

Słynne dzieło I. Newtona Philosophiae naluralis 
principia mathematica (1687) zawiera już kompletną 
koncepcję nowożytnej fizyki jako nauki ścisłej, 
zarazem eksperymentalnej i teoretycznej, opartej 
na pomiarach i szerokim stosowaniu matematyki. 
W pracy tej Newton sprecyzował pojęcia przestrzeni, 
czasu, układu odniesienia, masy, siły, pędu itd. 
Podał też trzy podstawowe prawa dynamiki, zwane 
często ze względu na ich wagę zasadami mechaniki. 
Pierwsza zasada postuluje istnienie inercjalnych ukła¬ 
dów' odniesienia; druga podaje równanie wiążące siłę 
z pochodną pędu; trzecia dotyczy pewnych ogólnych 
własności symetrii sił wzajemnego oddziaływania 
między ciałami fizycznymi. Newton odkrył również 
prawo powszechnego ciążenia jako uniwersalne 
prawo natury, dotyczące wszelkich ciał fizycznych. 
Korzystając z podanych przez siebie praw ruchu, wy¬ 
rażonych w ścisłej matematycznej postaci, rozwiązał 
w-iele konkretnych problemów właściwej fizyki oraz 
astronomii. Szczególnie ciekawe rezultaty dały prawa 
Newtona zastosowane do ruchu planet. Okazało się, 
że ruch punktu masowego w centralnym polu sił 
grawitacyjnych odwrotnie proporcjonalnych do kwa¬ 
dratu odległości odbywa się po krzywych stożkowych 
(koło, elipsa, parabola, hiperbola) w zależności od 
warunków początkowych. Newton nie tylko fizycznie 
uzasadnił system Kopernika i trzy prawa Keplera, 
ale podał jednolitą teorię ruchów ciał na Ziemi oraz 
planet, komet i innych ciał niebieskich. W ten sposób 
astronomia stała się po prostu częścią fizyki, a jedno¬ 
cześnie prawa ziemskiej mechaniki objęły co najmniej 
cały układ planetarny. Zasady jedności materii 
i powszechności praw fizyki znalazły w mechanice 
układu planetarnego swoje pierwsze ścisłe potwier¬ 
dzenie. 

Newton przyczynił się również niezwykle do rozwo¬ 
ju optyki, nauki o cieple, mechaniki ośrodków ciąg¬ 
łych itd. Choć jego zasługi dotyczą głównie teorii, 
to jednak dokonał on także wielu odkryć ekspery¬ 
mentalnych (np. odkrycie dyspersji światła, rozszcze¬ 
pienia światła białego, dyfrakcji i interferencji w cien¬ 
kich płytkach, odkrycie prawa stygnięcia ciał, praw 
lepkości). 

Newton podał w jasnej i ścisłej postaci zasady 
nowoczesnej, cmpiryczno-racjonalnej metody nauko¬ 
wej, która jest stosowana bez zasadniczych zmian 
do dziś. Dopiero wiek XX przyniósł pewne pogłę¬ 
bienie jego metody naukowej. W ciągu minionych 
prawie 300 lat metodę tę przejęły bez większych zmian 
inne nauki przyrodnicze i technika, a ostatnio adap¬ 
tują ją również nauki społeczne i humanistyczne. 

Mechanika Newtona stanowiła przez niemal 200 
lat wzór teorii fizycznej, źródło inspiracji dla filozo¬ 
fów i przedmiot powszechnego zainteresowania ludzi 
wykształconych. Następcy Newtona rozw-ijali przez 
cały XVIII w. mechanikę teoretyczną, stosując 
prawa Newtona do różnych typów sił i różnych ukła¬ 
dów, np. układów wielu punktów i ośrodków' ciąg¬ 
łych (gazów, cieczy, ciał sprężystych). W związku 
z potrzebami doskonalonej mechaniki teoretycznej 
powitały w tym okresie now r e działy matematyki, np. 
teoria równań różniczkowych zwyczajnych i cząstko¬ 
wych, teoria równań całkowych, rachunek waria¬ 
cyjny itp. Wielu spośród następców Newtona (np. 

L. Euler, J.L. Lagrange, J. d’Alembert, J.D. Bemoulli, 
P.S. Laplace, C.G.J. Jacobi, W.R. Hamilton) przy¬ 
czyniło się tak jak on do rozwoju zarówno fizyki. 
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jak i matematyki. Jeśli chodzi o ścisłą i niezwykle 
owocną współpracę fizyki z matematyką, był to 
z pewnością złoty wiek nauki, który trwał do połowy 
XIX stulecia. 

Wiek XVIII cechuje nie tylko wspaniały rozwój 
mechaniki teoretycznej, znamionują go także ważne 
osiągnięcia eksperymentalne w innych działach fizyki. 
Skonstruowano lub w istotny sposób udoskonalono 
wiele nowych detektorów i przyrządów pomiarowych 
(np. termometr, barometr, kalorymetr, teleskopy 
różnych typów, waga analityczna, waga skręceń). 
Poznano podstawowe prawo elektrostatyki (Ch.A. 
Coulomb), odkryto prawo zachowania masy w reak¬ 
cjach chemicznych (A.L. Lavoisier, M.W. Łomono¬ 
sow), rozwinęła się szybko kalorymetria. Rewolucja 
przemysłowa w Anglii przyspieszyła rozwój badań 
eksperymentalnych. 

Pierwszą połowę XIX w. charakteryzuje znaczna 
liczba przełomowych odkryć doświadczalnych z za¬ 
kresu nauk o cieple, elektryczności, magnetyzmie 
oraz optyki i chemii — przy jednoczesnym braku 
dobrych teorii badanych zjawisk. W dziedzinie zja¬ 
wisk cieplnych odkryto równoważność pracy i ciepła 
(B. Rumford, H. Davy, J.P. Joule). Stwierdzono też, 
że praca może się przemieniać w ciepło bezradnych 
ograniczeń, natomiast ciepło można przemienić 
w pracę tylko z pewnymi ograniczeniami (S. Carnot). 
Odkrycia te zadały pierwszy poważny cios błędnej 
hipotezie cieplika, przypisującej ciepłu substancjalny, 
niezniszczalny charakter. W chemii odkryto prawa 
stosunków wielokrotnych, stosunków równoważni¬ 
kowych i stosunków stałych (J.L. Proust, J.B. Rich¬ 
ter, L.J. Gay-Lussac, J. Dalton, A. Avogadro). 
W celu wytłumaczenia tych praw Dalton przypomniał 
starą hipotezę atomową. W optyce dokładne zbadanie 
zjawisk interferencji i dyfrakcji światła (T. Young, 
AJ. Fresnel) obaliło korpuskularny model światła, 
którego zwolennikiem był sam Newton. Konstrukcja 
siatki dyfrakcyjnej (J. Fraunhofer) i różnych typów 
spektrometrów oraz odkrycie linii absorpcyjnych 
w widmie słonecznym stało się początkiem spektro¬ 
metrii optycznej. Astronomia otrzymała nowe, 
potężne narzędzia do badania chemicznego składu 
zewnętrznych warstw Słońca, gwiazd i planet 
oraz procesów ^chodzących w tych warstwach, jak 
również procesów zachodzących w przestrzeni mię- 
dzygwiazdowej. Spektrometria znalazła też rychło 
liczne zastosowania do badania składu chemicznego 
i zanieczyszczeń różnych substancji, dzięki możli¬ 
wości bardzo dokładnego wykrywania charaktery¬ 
stycznych dla poszczególnych pierwiastków linii 
widmowych. Innym ważnym dla optyki osiągnięciem 
było odkrycie polaryzacji światła odbitego (E.L. Ma- 
lus). Po skonstruowaniu efektywnych polaryzatorów 
(W. Nicol) rozpoczął się okres intensywnych badań 
zjawiska polaryzacji światła (A.J. Fresnel, T. Young, 

E. Malus, D.F.J. Arago, D. Brewster). J.B.L. Foucault 
zmierzył prędkość światła w wodzie i wykazał, że 
jest ona zgodna z modelem falowym, natomiast 
zdecydowanie sprzeczna z modelem korpuskulamym 
światła. Zjawisko polaryzacji świadczyło, że światło 
jest falą poprzeczną. 

W dziedzinie elektryczności skonstruowano wiele 
nowych urządzeń służących do wytwarzania pól 
i prądów elektrycznych oraz pól magnetycznych 
(np. stosy, ogniwa, akumulatory, maszyny elektro¬ 
statyczne, kondensatory, cewki) oraz do pomiaru 
wielkości elektrycznych i magnetycznych (galwano- 
metr, woltomierz, amperomierz, busola stycznych). Za 
pomocą ogniw odkryto i zbadano zjawisko elektrolizy 
(H. Davy, M. Faraday), a następnie za pomocą elek¬ 
trolizy wykryto ważne pierwiastki nie występujące na 
Ziemi w stanie wolnym (np. potas i sód) oraz stwier¬ 
dzono złożony charakter niektórych substancji (np. 
wody). W 1820 r. H.Ch. Oersted, badając własności 
prądów stałych, odkrył, że prąd elektryczny ma coś 
wspólnego z magnetyzmem, ponieważ odchyla igłę 
busoli. Wkrótce A.M. Ampere odkrył wzajemne mag- 
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netyczne oddziaływanie dwóch prądów. G.S. Ohm 
wykrył prawo przewodnictwa metali, zwane dziś jego 
imieniem. 

Największe zasługi dla rozwoju nauki o elektrycz¬ 
ności i magnetyzmie położył jednak w 1 połowie 
XIX w. M. Faraday. Odkrył on w 1831 r. bardzo 
ważne prawo indukcji, wg którego zmienne w czasie 
pole magnetyczne powoduje wystąpienie zamkniętych 
linii sił pola elektrycznego. W tym samym czasie Fa¬ 
raday odkrył zjawisko indukcji prądów przez zmienne 
prądy, co było zresztą naturalną konsekwencją zja¬ 
wiska Oersteda i pierwotnego prawa indukcji. Odkry¬ 
cia te wykazywały istnienie głębokich związków 
między elektrycznością i magnetyzmem, wprowadzały 
nowe obiekty badań: zmienne w czasie prądy i pola 
elektryczne oraz magnetyczne, inspirowały konstruk¬ 
cje nowych ważnych urządzeń w postaci cewki, 
elektromagnesu, galwanoskopu, transformatora, któ¬ 
re wkrótce zrewolucjonizowały technikę, a z nią całą 
naszą cywilizację. Faraday dokonał jeszcze wielu 
innych wiekopomnych odkryć, zdobywając sławę 
najlepszego eksperymentatora, jeśli nie w całej historii 
fizyki, to przynajmniej XIX w. Wystarczy wymienić 
jeszcze prawa elektrolizy (stała Faradaya), skroplenie 
gazów, odkrycie diamagnetyków i paramagnetyków, 
zbadanie dielektryków, odkrycie skręcenia polaryza¬ 
cji światła przy przechodzeniu przez namagnesowane 
ośrodki. 

Faraday był nie tylko genialnym eksperymentato¬ 
rem, był równie genialnym teoretykiem. Wprawdzie 
nie sformułował matematycznie teorii zjawisk elektro¬ 
magnetycznych, ale wprowadził podstawowe kon¬ 
cepcje teoretyczne. Wyniki jego doświadczeń skło¬ 
niły go do odrzucenia panującego wówczas mecha- 
nistycznego obrazu zjawisk elektromagnetycznych, 
w którym podstawową rolę odgrywały ładunki elek¬ 
tryczne i magnetyczne działające na odległość siłami 
centralnymi odwrotnie proporcjonalnymi do kwadra¬ 
tu odległości. Faraday wprowadził inny opis, oparty 
na pojęciu lokalnego działania pola elektrycznego 
i magnetycznego na znajdujący się w nim ładunek 
elektryczny lub prąd. Taki model stał się bardzo płod¬ 
ny w przyszłości, kiedy się okazało, że szybko zmienne 
pola elektromagnetyczne mogą się oderwać od wy¬ 
twarzających je ładunków i rozchodzić niezależnie od 
chwilowych położeń tych ładunków. 

Mimo tak wielu, tak fundamentalnych odkryć 
eksperymentalnych, konstrukcji wielu nowych de¬ 
tektorów, urządzeń i aparatów pomiarowych,we wszy¬ 
stkich działach fizyki, oprócz właściwej mechaniki, 
brak było zadowalających teorii i panował w nich 
dość duży nieład. Dopiero w połowie XIX w. na¬ 
stąpił przełom pod tym względem. Zaczęło się od 
sformułowania w latach czterdziestych I zasady 
termodynamiki, a wkrótce, w latach 1850-51 — 
II zasady (S. Carnot, R. Mayer, J.P. Joule, H. Helm- 
holtz, R. Clausius, W. Thomson-Kelvin). I zasada 
jest uogólnieniem prawa zmiany energii, znanego 
z mechaniki, na procesy, w których oprócz pracy 
występuje wymiana ciepła. II zasada określa kierunek 
zachodzących w przyrodzie procesów termodyna¬ 
micznych. Z zasad tych wynika istnienie temperatury 
bezwzględnej i entropii. Obie zasady termodynamiki 
implikują ścisły związek między zjawiskami mecha¬ 
nicznymi i cieplnymi, które przez długie wieki były 
uważane za niezależne od siebie. Choć zasady termo¬ 
dynamiki są sformułowane zupełnie ogólnie (abstra¬ 
hują od szczególnych własności układów) oraz czy¬ 
sto fenomenologicznie, to jednak zastosowanie ich 
do konkretnych ciał implikuje wiele ciekawych związ¬ 
ków między bardzo różnorodnymi zjawiskami i pro¬ 
cesami. 

W połowie XIX w. została ostatecznie przyjęta 
przez chemików hipoteza atomowo-molekulama 
(St. Cannizzaro), a — w związku z powstaniem ter¬ 
modynamiki i ze wzrastającym zainteresowaniem zja¬ 
wiskami cieplnymi — stała się ona domeną teore¬ 
tycznych badań fizyków. Zarówno bowiem termo¬ 


dynamika, jak i powstała kilkanaście lat później 
elektrodynymika były teoriami czysto fenomenolo¬ 
gicznymi i makroskopowymi. Występowały w nich 
liczne empiryczne parametry i funkcje stanu (np. 
temperatura, ciśnienie, równanie stanu, entropia, 
energia wewnętrzna, stała dielektryczna, przewod¬ 
nictwo elektryczne), których teorie te nie potrafiły 
ani zinterpretować, ani obliczyć. 

Problem wyjaśnienia zjawisk makroświata jako 
wypadkowych odpowiednich własności atomów i mo¬ 
lekuł (czyli mikroświata) podjął w 1845 r. J.J. Water- 
ston. Szybki rozwój tego kierunku badań datuje 
się jednak dopiero od prac A.K. Króniga i R.E. Clau- 
siusa rozpoczętych w 1856 r. Badacze ci zbudowali 
bardzo poglądowy model atomowo-molekulamy 
gazów, zwany teorią kinetyczną gazów. Począwszy 
od 1860 r. do szybkiego rozwoju tej teorii przyczy¬ 
nił się J.C. Maxwell. Na gruncie tej pieiwszej ilościo¬ 
wej teorii mikroświata zinterpretowano temperaturę, 
ciśnienie, entropię i inne makroskopowe funkcje 
stanu, wyrażając je przez wartości średnie odpowied¬ 
nich wielkości mikroskopowych. W ten sposób 
zjawiska cieplne zostały sprowadzone do odpowied¬ 
nich zjawisk mechanicznych zachodzących w mikro- 
świecie. Wychodząc z założenia, że między molekuła¬ 
mi gazu występuje proste oddziaływanie, udało się 
też wytłumaczyć postać równania stanu gazów (van 
der Waals). Zastosowanie znalezionego przez Maxwel- 
la rozkładu prędkości w jednorodnym gazie o stałej 
temperaturze pozwoliło na uściślenie obliczeń wielu 
parametrów i uczyniło teorię kinetyczną znacznie 
bardziej realistyczną. Maxwell podał też prostą 
mikroskopową teorię takich zjawisk jak przewodni¬ 
ctwo cieplne, lepkość i dyfuzja gazów. 

Stworzenie zadowalającej matematycznej teorii 
zjawisk elektromagnetycznych i magnetycznych jest 
również zasługą Maxwella. Dokonał on tego w serii 
prac rozpoczętych w 1861 r., a uwieńczonych ogło¬ 
szeniem w 1873 r. wielkiego dzieła Treatise on Eleclri- 
city and Magnetism. W pracach tych Maxwell prze¬ 
łożył najpierw prawa Gaussa, Ampere*a-Oersteda 
i Faradaya na ścisły język matematycznych równań 
różniczkowych, posługując się przy tym polowymi 
koncepcjami Faradaya. Równanie odpowiadające 
pierwotnemu prawu Oersteda okazało się w przy¬ 
padku gęstości ładunku zależnej od czasu sprzeczne 
z prawem zachowania ładunku. Maxwełl zmienił to 
równanie i doszedł do niesprzecznego układu, zwa¬ 
nego dziś równaniami elektrodynamiki klasycznej 
albo po prostu równaniami Maxwella. Z równań 
elektrodynamiki wynikało istnienie nowego, nie 
znanego wówczas zjawiska fal elektromagnetycznych. 
Maxwell wykazał, że powinny to być fale poprzeczne 
o ściśle określonych właściwościach. Zwrócił też 
uwagę na to, że fale elektromagnetyczne mają wszy¬ 
stkie znane wówczas własności światła. Założył więc 
w zgodzie ze wspomnianymi doświadczeniami Fa¬ 
radaya, że światło jest po prostu falą elektromagne¬ 
tyczną o stosunkowo małej długości fali. Istnienie 
fal elektromagnetycznych o dużych długościach 
zostało potwierdzone przez H.R. Hertza wiele lat 
później, dopiero w 1888 r. 

Po licznych i bardzo różnorodnych weryfikacjach 
teorii Maxwełla, w końcu XIX w. nikt już nie wątpił 
w jej poprawność. Podobnie jak w końcu XVII w. me¬ 
chanika Newtona, tak w 2 połowie XIX w. elektro¬ 
dynamika Maxwe!la oznaczała niezwykle ważny 
przewrót w strukturze fizyki. W ramach jednej 
wspólnej teorii zostały połączone trzy wielkie klasy 
zjawisk (elektryczne, magnetyczne i optyczne), które 
przez długi okres były uważane za niezależne. Pomi¬ 
nąwszy elektrostatykę i magnetostatykę, pola elek¬ 
tryczne i magnetyczne są zawsze nierozłączne, a związ¬ 
ki między nimi są opisane przez równanie Maxwel!a. 
Dlatego mówi się obecnie poprawniej o zjawiskach 
elektromagnetycznych. Optyka przestała istnieć jako 
niezależny dział fizyki, a stała się działem elektro- 
dynamiki( -► Elektrodynamika). 
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ziarnistość W ostatniej ćwierci XIX w. zaczęły się mnożyć 
elektrycz- doświadczenia wykazujące coraz bardziej przekony- 
ności wająco, że elektryczność występuje w postaci ziar¬ 
nistej, a nie jest ciągłym fluidem jak sądzono dawniej. 
Wskazywały na to już prawa elektrolizy. Znacznie 
większą rolę odegrały tu jednak badania wyładowań 
elektrycznych w rozrzedzonych gazach (J. Plucker, 
H. Geissler, J. Hittorf, W. Crookes, E. Goldstein). 
Wykazano m.in., że promienie katodowe składają 
się z ujemnie naładowanych cząstek. Dokonane po 
1897 r. pomiary stosunku masy do ładunku (J.J. 
Thomson, W. Kaufmann, E. Wiechert) doprowadziły 
do wniosku, że cząstki te, nazwane elektronami, są 
przeszło 1800 razy lżejsze od najlżejszego atomu wo¬ 
doru. Przeprowadzone niezależnie pomiary ładunków 
elektrycznych (R.A. Millikan) wykazały, że są one 
zawsze całkowitymi wielokrotnościami ładunku elek¬ 
tronu. 

Wyładowania w rozrzedzonych gazach stały się 
pierwszą bardziej bezpośrednią metodą eksperymen¬ 
talnego badania mikroświata. Zastosowanie niskich 
pierwsze ciśnień, a tym samym małych gęstości, oznaczało po- 
badania ważne zmniejszenie wzajemnych oddziaływań, czyli 
mikroświata stworzenie warunków coraz lepszej wzajemnej izo¬ 
lacji mikrocząstek. Poza tym w eksperymentach 
tych udało się po raz pierwszy wytworzyć wiązki 
jednakowych naładowanych mikrocząstek (proto¬ 
nów, elektronów, jonów) o bardzo zbliżonych pędach. 
Wprawdzie historia fizyki niskich ciśnień zaczęła się 
już w XVII w., od Torricellego i Guerickego, ale do¬ 
piero w 2 połowie XIX w. nastąpił jej gwałtowny 
rozwój — głównie dzięki temu, że stała się ona pod¬ 
waliną niemal wszystkich metod badania mikroświata. 

Jeszcze przed definitywnym doświadczalnym od¬ 
kryciem elektronu H.A. Lorentz stworzył podwaliny 
pierwszej mikroskopowej, statystycznej teorii zjawisk 
elektronowa elektromagnetycznych, nazwanej później elektronową 
teoria teorią Lorentza. Lorentz przyjął, zgodnie z później- 
Lorentza szymi odkryciami doświadczalnymi, że atomy i mo¬ 
lekuły zbudowane są z elektrycznie naładowanych 
cząstek. Założył dalej, że w mikroświecie słuszne 
są równania Maxwella w postaci znanej dla próżni — 
z tym zastrzeżeniem, że jedynym prądem elektrycz¬ 
nym jest prąd konwekcyjny, wywołany ruchem ła¬ 
dunków. Wprowadzając jeszcze kilka innych po¬ 
glądowych założeń i utożsamiając makroskopowe 
wielkości z wartościami średnimi odpowiednich wiel¬ 
kości mikroskopowych, z modelu Lorentza można 
było otrzymać wiele wniosków dotyczących elektro¬ 
magnetycznych własności ciał. 

W tym samym okresie do rozwoju kinetycznej 
teorii gazów w kierunku coraz głębszej i coraz wszech¬ 
stronniejszej statystycznej teorii materii ogromnie się 
przyczynili przede wszystkim L. Boltzmann, a potem 
J.W. Gibbs. Po odkryciu elektrycznej struktury ma¬ 
terii oraz powstaniu teorii Lorentza i statystycznej 
fizyki zaczął się na przełomie XIX i XX w. nowy etap 
atomistyka unifikacji całej makroskopowej fizyki na bazie ato- 
podstawą mistyki, zakładającej, że wszystkie ciała makrosko- 
unifikacji powe składają się z określonych mikrocząstek (ato- 
fizyki mów, molekuł, jonów, elektronów). Własności tych 
mikrocząstek i prawa nimi rządzące miały determi¬ 
nować wszystkie własności ciał makroskopowych 
i prawa makroświata. 

Program ten był w owym czasie bardzo trudny do 
zrealizowania. Nie znano jeszcze struktury atomów, 
molekuł i jonów, nie znano najważniejszych praw 
mikroświata. Wnioskowanie o własnościach mikro¬ 
świata na podstawie ich hipotetycznego wpływu na 
zjawiska makroświata było bardzo trudne, ponieważ 
średniowanie nie jest procedurą jednoznacznie 
określoną ani odwracalną. W tej sytuacji na przeło¬ 
mie XIX i XX stulecia powstała silna opozycja prze¬ 
ciwko całej atomistyce, wskazująca na brak bezpo¬ 
średnich metod doświadczalnych, które by potwier¬ 
dziły realne istnienie i pozwoliły na zbadanie struktury 
atomów i innych mikrocząsteczek. Wielkim, ale 
krótkotrwałym triumfem przeciwników atomistyki 


było wykrycie w tym okresie wielu fundamentalnych 
sprzeczności między przewidywaniami teorii staty¬ 
stycznych a faktami doświadczalnymi. W rezultacie 
sprzeczności te doprowadziły do powstania ok. 1925 r. 
nowej, poprawnej teorii atomu i molekuły — mecha¬ 
niki kwantowej. 

Również żądanie bardziej bezpośrednich, doświad¬ 
czalnych dowodów istnienia mikrocząstek zostało 
wkrótce spełnione dzięki konstrukcji nowych detek¬ 
torów i innych narzędzi badawczych, jak np. komory 
Wilsona, pęchrzykowe, iskrowe, liczniki różnego 
rodzaju naładowanych i neutralnych cząstek, czułe 
emulsje fotograficzne, mikroskopy elektronowe, da¬ 
lej — liczne akceleratory przygotowujące strumie¬ 
nie pożądanych mikrocząstek o określonym pędzie 
itp. (-* Detekcja cząstek wielkiej energii. Akcelera¬ 
tory). Urządzenia te pozwoliły nie tylko na mierzenie 
nowych, statystycznych wielkości odnoszących się bez¬ 
pośrednio do określonych mikrocząstek (jak przekroje 
czynne, rozkłady kątowe i energetyczne oraz inne 
rozkłady prawdopodobieństwa), lecz także na wizual¬ 
ne oglądanie torów pojedynczych naładowanych 
mikrocząstek oraz ich zderzeń, procesów tworzenia 
się i rozpadów, a nawet obserwację większych drobin 
(w mikroskopie elektronowym). 

W ten sposób odpowiedź na trzy fundamentalne 
pytania eksperymentatora: Co, jak i czym mierzyć 
v/ fizyce mikroświata — stawała się stopniowo coraz 
bogatsza i głębsza. 

Inny ważny kierunek badań z końca XIX i początku 
XX w. wiązał się z narastającą sprzecznością między 
dwoma największymi teoriami makroświata: mecha¬ 
niką Newtona a elektrodynamiką Maxwella. Według 
elektrodynamiki prędkość rozchodzenia się fal 
elektromagnetycznych w próżni c jest stała i izotro¬ 
powa. Newtonowska koncepcja przestrzeni i czasu 
prowadzi do wniosku, że jest to możliwe tylko w jed¬ 
nym wyróżnionym układzie inercjalnym. W innych 
poruszających się względem niego układach prędkość 
c powinna zależeć od kierunku rozchodzenia się fali. 

W końcu XIX w. A.A. Michelson i E.W. Morley 
wykonali serię doświadczeń, które miały wykazać, jak 
prędkość Ziemi dodaje się do prędkości światła. 

Okazało się — wbrew fizyce Newtona — że prędkość 
światła w dwóch poruszających się wzajemnie ukła¬ 
dach jest taka sama i że jest izotropowa w obu ukła¬ 
dach. Usiłowania pogodzenia obu teorii bez zmienia¬ 
nia żadnej z nich nie udały się. W 1905 r. A. Einstein 
zrobił zgodne z wynikiem doświadczeń Michelsona- 
Morleya założenie, że prędkość światła jest stała 
i jednakowa we wszystkich układach inercjalnych, 
oraz, że wszystkie układy inercjalne są fizycznie 
równoprawne i nie ma układu wyróżnionego (eteru). 

Einstein wykazał, że współrzędne przestrzenne i cza¬ 
sowe tego samego zdarzenia, mierzone za pomocą 
sygnałów świetlnych w dwóch poruszających się wza¬ 
jemnie ruchem jednostajnym układach inercjalnych, 
są związane tzw. transformacją Lorentza, odmienną 
od dotychczas stosowanej transformacji Galileusza. 

Z transformacji Lorentza wynikały zaskakujące kon¬ 
sekwencje, np. względność takich pojęć jak przedział 
czasowy, kolejność czasowa, odległość, masa, które 
w fizyce Newtona były uważane za bezwzględne, tj. 
niezależne od wyboru układu inercjalnego. Einstein 
pogodził elektrodynamikę Maxwella z mechaniką 
Newtona zmieniając tę ostatnią, gdyż jej równania 
nie były niezmiennicze względem transformacji 
Lorentza. Najważniejszą zmianą było zastąpienie 
w prawie dynamiki Newtona stałej masy masą za¬ 
leżną od prędkości. Ze zmienionej w ten sposób 
mechaniki wyniknął słynny wzór wyrażający równo¬ 
ważność masy i energii. Einstein założył, że wzór ten 
jest słuszny w przypadku układów zawierających nie 
tylko cząstki, lecz również pola (-► O niektórych pod¬ 
stawowych pojęciach fizycznych). 

Transformacja Lorentza implikuje skomplikowane 
prawo dodawania prędkości, które jednakże dla Albert Einstein 
prędkości małych w porównaniu z nieprzekraczalną (1879-1955) 
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szczególna według Einsteina prędkością światła c przechodzi 
teoria w dawne proste prawo dodawania wektorów. To 
względności samo dotyczy innych równań, tak że można powie¬ 
dzieć, że teoria Einsteina, zwana też szczególną teorią 
względności, nie jest sprzeczna z dawną mechaniką, 
tylko obejmuje szerszy zakres zjawisk. Dawna me¬ 
chanika pozostaje słuszna w zakresie prędkości dużo 
mniejszych od c. 

Zaskakujące konsekwencje szczególnej teorii 
względności zostały potwierdzone w tysiącach ekspe¬ 
rymentów i w praktycznym zastosowaniu (np. w akce¬ 
leratorach szybkich cząstek, w reakcjach między czą¬ 
stkami elementarnymi i jądrami, w reaktorach i bom¬ 
bach atomowych). Do tych sukcesów doprowadziła 
Einsteina systematyczna rewizja podstawowych pojęć 
dawnej fizyki i wprowadzenie — zamiast starych, 
apriorycznych definicji — określeń operacyjnych, 
opartych na użyciu fal elektromagnetycznych jako 
optymalnego środka przesyłania sygnałów i wszelkiej 
informacji. Z przykładu tego wynika, że po pierwsze— 
trzeba być bardzo ostrożnym z pojęciami, które nie są 
wprowadzone operacyjnie, lecz apriorycznie, po 
drugie — nie należy zakładać pochopnie stosowalno¬ 
ści teorii w zakresie jeszcze nie sprawdzonym. 

Kilkanaście lat później Einstein zaproponował 
nową, wysoce zgeometryzowaną teorię grawitacji, 
która nosi też nazwę ogólnej teorii względności 
ogolna teoria ( 0 pj era się ona na lokalnej równoważności zjawisk 
względności występujących w przywieszonym układzie i w polu 
grawitacyjnym). W teorii tej postuluje się, że obecność 
mas grawitacyjnych zakrzywia przestrzeń, która już 
nie jest prostą przestrzenią Euklidesa, lecz przestrze¬ 
nią typu Riemanna. Teoria ta daje w pierwszym 
przybliżeniu te same wyniki co mechanika Newtona. 
Otrzymane w następnym przybliżeniu odstępstwa 
od teorii Newtona są bardzo małe, tak że do dziś 
zostały potwierdzone jedynie w paru przypadkach. 
Teoria grawitacji Einsteina stała się jednak podstawą 
nowoczesnej kosmologii i prowadzi do wielu cieka¬ 
wych wyników (-► Kosmologia). 

Jak już wspomniano wyżej, po długim stosunkowo 
okresie rozwoju i coraz większych sukcesów, na 
przełomie XIX i XX stulecia atomistyka znalazła się 
kryzys na gi e w stanie głębokiego kryzysu. Przede wszystkim 
atomistyki okazało się, że wbrew pierwotnej koncepcji atomu — 
na początku odkryte przez chemików i fizyków realne atomy nie 
XX w. S ą aJ1 i niepodzielne, ani niezniszczalne, ani nie są 
najmniejszymi cząstkami materii. Wskazywało na 
to odkrycie elektronu jako składnika atomu oraz od¬ 
krycie naturalnej promieniotwórczości szeregu pier¬ 
wiastków (H. Becąuerel, M. Skłodowska-Curie i P. 
Curie). Rychło wykazano, że promienie alfa i beta 
występujące w tych zjawiskach są korpuskularne 
i że emitujący je pierwiastek przekształca się w inny 
pierwiastek (E. Rutherford, W. Crookes, W. Ramsay, 
K. Fajans, F. Soddy). 

Z drugiej strony zwrócono uwagę na szereg faktów 
doświadczalnych (np. kształt widma promieniowania 
ciała doskonale czarnego, ciepło właściwe wieloato- 
mowych gazów i ciał stałych, mnogość linii widmo¬ 
wych nawet najprostszych atomów, zjawisko foto- 
elektryczne), które się nie dały pogodzić z ówczesnymi 
prawami fizyki makroskopowej postulowanymi w fizy¬ 
ce statystycznej również w odniesieniu do obiektów 
mikroświata. Zaczęto więc szukać dodatkowych 
ograniczeń, które by z jednej strony — usunęły 
powstałe rozbieżności, a z drugiej — nie były rażąco 
sprzeczne ze znanymi prawami, choć może obce 
i niepotrzebne w fizyce makroświata. 

Ten nowy etap rozwoju atomistyki zapoczątkował 
w 1900 r. M. Planck, proponując rozwiązanie pro¬ 
blemu promieniowania ciała doskonale czarnego za 
kwant p 0m0C ą dodatkowego założenia kwantów energii 
energii określonych porcji), które może wypromieniować 
lub zaabsorbować oscylator harmoniczny. Następny 
krok zrobił w 1905 r. Einstein wprowadzając pojęcie 
fotonu (cząstki lub kwantu światła) dla wytłumaczenia 
foton efektu fotoelektrycznego. 


Tymczasem badano pilnie widma promieniowania 
i inne własności atomu, odkrywając szereg empirycz¬ 
nych reguł (np. reguła kombinacyjna Ritza). Przeło¬ 
mowe znaczenie miało jednak dopiero odkrycie 
w 1911 r. dodatnio naładowanego jądra atomowego 
przez Rutherforda. Opierając się na tym odkryciu, 
N. Bohr już w 1913 r. zaproponował nowy model 
atomu. Model Bohra był półklasyczny, tzn. opierał 
się na równaniach mechaniki Newtona uzupełnio¬ 
nych trzema dodatkowymi kwantowymi postulatami. 
Model Bohra wyjaśniał częściowo podstawowe wła¬ 
sności atomów z jednym elektronem, ale nie odpo¬ 
wiadał na wiele istotnych pytań, nie pozwalał na 
obliczenie wielu ważnych własności atomów, nie 
nadawał się do obliczeń bardziej złożonych ukła¬ 
dów. 

W 1924 r. L. de Broglie wysunął śmiałą hipotezę, 
że podobnie jak światłu (fotonom) przypisano włas¬ 
ności korpuskularne w oddziaływaniu z materią, tak 
i typowym cząstkom (np. elektronom) należy przy¬ 
pisać własności falowe. De Broglie podał wzór wią¬ 
żący długość fali z pędem elektronu, ale nie podał 
równania falowego. Zrobił to wkrótce E. Schródin- 
ger, proponując swoje słynne równanie, które się 
stało filarem nowej mechaniki mikroświata, zwanej 
mechaniką kwantową (lub falową). Inne, nieco ogól¬ 
niejsze, bardziej abstrakcyjne (operatorowe), ale 
w zasadzie równoważne sformułowanie mechaniki 
kwantowej podał W. Heisenberg. W następnych 
paru latach ewolucja mechaniki kwantowej polegała 
na wprowadzeniu probabilistycznej interpretacji 
funkcji falowej, na uwzględnieniu świeżo odkrytego 
spinu elektronu, zakazu Pauliego lub statystyki 
Bosego-Einsteina w przypadku układów wieloczą- 
stkowych oraz efektów relatywistycznych (P.A.M. Di¬ 
rac) i na wprowadzeniu innych formalnych i fizycz¬ 
nych uogólnień i udoskonaleń. 

Nowa teoria świata atomów, molekuł, jonów i elek¬ 
tronów dawała znakomite rezultaty. Pozwoliła na do¬ 
kładne obliczenie energii wiązania, poziomów wzbu¬ 
dzonych, prawdopodobieństw przejścia, czasów życia 
i wielu innych efektów, wobec których dawne teorie 
i modele były bezradne. Gdy mamy do czynienia 
z prostszymi układami, rachunki nie są nawet spe¬ 
cjalnie trudne, a ich zgodność z danymi doświadczal¬ 
nymi znakomita. W przypadku wielocząstkowych 
układów równania mechaniki kwantowej są wpraw¬ 
dzie bardzo skomplikowane, ale numeryczne ra¬ 
chunki wszędzie dają dobrą zgodność teorii z doświad¬ 
czeniem. 

Mechanika kwantowa dokonała poważnych zmian 
w podstawowych pojęciach fizyki. W fizyce przed- 
kwantowej, zwanej dziś klasyczną, przez symbole 
oznaczające w równaniach teorii pęd, położenie, 
moment pędu itp. należało rozumieć dostatecznie 
dokładne wyniki pomiarów tych wielkości, czyli 
liczby. W mechanice kwantowej wielkości fizyczne są 
reprezentowane w równaniach przez operatory, 
których związek z pomiarem jest dość złożony, a mia¬ 
nowicie dopiero wartości własne operatora reprezentu¬ 
jącego daną wielkość są liczbami, które się po¬ 
krywają z możliwymi wynikami pomiaru. Niepraw¬ 
dziwe okazują się w związku z tym dwa milczące 
założenia teorii pomiaru robione w fizyce klasycznej: 
a) zakłócenie stanu dowolnego obserwowanego ciała 
spowodowane przez przyrząd pomiarowy można 
uczynić dowolnie małym; b) można przeprowadzić 
jednoczesne pomiary dwóch dowolnych, algebraicznie 
niezależnych wielkości fizycznych z dowolną dokła- 
nością i tak, by pomiar jednej nie zakłócał pomiaru 
drugiej. O nieprawdziwości tych założeń świadczą 
m.in. znane relacje nieokreśloności Heisenberga. 
Metodologiczne i filozoficzne konsekwencje mecha¬ 
niki kwantowej są nawet ciekawsze i dalej idące 
niż teorii względności. 

Z biegiem czasu okazało się, że mechanika kwan¬ 
towa nie opisuje całkiem poprawnie oddziaływania 
elektronów, atomów itp. z polem promieniowania 
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elektromagnetycznego (np. nie daje możliwości 
obliczenia efektu Comptona czy anihilacji pary ne- 
gaton-pozyton). W celu opisania takich i wielu innych 
efektów trzeba było wprowadzić tzw. drugie kwanto¬ 
wanie, w wyniku którego powstała w połowie XX w. 
kwantowa elektrodynamika (S. Tomonaga, F.J. Dy- 
son, R.P. Feynman, J. Schwinger). Teoria ta opisuje 
wszelkie układy złożone z elektronów i pola elek¬ 
tromagnetycznego w doskonałej zgodzie z doświad¬ 
czeniem. 

Jest rzeczą niezwykle interesującą, że równania 
mechaniki kwantowej Schródingera można wypro¬ 
wadzić z równań elektrodynamiki kwantowej jako 
pewne przybliżenie. Inne przybliżenie, zwane kla¬ 
sycznym, prowadzi od elektrodynamiki kwantowej 
do klasycznych równań Maxwella i równań Newto¬ 
na. Elektrodynamikę kwantową można więc uznać 
za najbardziej fundamentalną z istniejących spraw¬ 
dzonych teorii fizycznych. Jest ona teorią, która opi¬ 
suje w sposób jednolity ogromny zakres zjawisk. 
Dla większości zjawisk zachodzących w świecie 
atomów, molekuł, jonów oraz złożonych z nich ciał 
makroskopowych wystarczająco dokładną teorią 
jest zresztą już mechanika kwantowa. Opisuje ona 
nie tylko wszystkie fizyczne i chemiczne własności 
wymienionych mikrocząstek, ale za pośrednictwem 
fizyki statystycznej opisuje doskonale również wła¬ 
sności ciał makroskopowych. Tak to już w XX w. 
dokonał się następny bardzo ważny krok w kierunku 
zjednoczenia coraz większej liczby działów fizyki 
i innych nauk przyrodniczych w ramach wspólnej, 
jednolitej teorii. Objęcie niemal całej makroskopowej 
fizyki oraz chemii, a przypuszczalnie także biologii, 
przez jedną fizyczną teorię, którą jest elektrodynamika 
kwantowa lub w nieco skromniejszym wymiarze 
mechanika kwantowa, ma bardzo proste i poglądowe 
uzasadnienie. Jest nim atomowa struktura wszystkich 
normalnych ciał oraz czysto elektromagnetyczny 
charakter wszystkich istotnych w tym zakresie od¬ 
działywań elementarnych. 

Poza zasięgiem elektrodynamiki kwantowej znaj¬ 
dują się tylko fizyka jądrowa i fizyka cząstek elemen¬ 
tarnych oraz niektóre zjawiska zachodzące w skali 
kosmicznej, np. we wnętrzu gwiazd, gdzie zresztą 
oprócz grawitacji istotną rolę odgrywają własności 
jąder i cząstek elementarnych. 

Jądro atomowe zostało odkryte już w 1911 r. 
przez Rutherforda przy okazji jego badań wnętrza 
atomu. Jednakże rozwój fizyki jądrowej jako odręb¬ 
nej dyscypliny rozpoczął się właściwie dopiero w la¬ 
tach trzydziestych. Jak zwykle w fizyce, nowe obiekty 
badań wymagają najpierw stworzenia nowych na¬ 
rzędzi i metod pomiarowych. Podstawową metodą 
badania jąder stało się ich bombardowanie różnymi 
cząstkami i śledzenie zachodzących przy tym roz¬ 
proszeń oraz reakcji. Rozwój fizyki jądrowej, a na¬ 
stępnie fizyki cząstek elementarnych, wymagał kon¬ 
strukcji coraz potężniejszych akceleratorów oraz coraz 
czulszych liczników i detektorów cząstek. Pierwsze 
systematyczne badania sztucznie wywołanych reakcji 
jądrowych rozpoczęto ok. 1930 r. (I. i F. Joliot-Curie, 
J. Chadwick i in.). W r. 1932 odkryto drugi obok 
protonu składnik jądra — neutron. Od tego czasu 
nasza wiedza empiryczna o stanach podstawowych 
i wzbudzonych jąder oraz o reakcjach jądrowych 
wzrosła ogromnie, a jednak nie ma jeszcze zadowa¬ 
lającej ogólnej teorii jądra. Zgodnie z hipotezą 
H. Yukawy przyjmuje się, że oddziaływania między 
nukleonami przenoszone są głównie przez tzw. pole 
mezonowe (mezony n). Jednakże oddziaływań tych 
nie udało się dotychczas opisać teoretycznie w za¬ 
dowalający sposób ( Oddziaływania silne. Siły 
jądrowe). Zamiast tego stosuje się w fizyce jądrowej 
liczne fragmentaryczne modele, które oddają dość 
dobre usługi, pozwalając zrozumieć podstawowe 
własności jąder (-> Modele jądrowe). Ponieważ 
nukleony oddziałują silnie nie tylko między sobą 
i z mezonami 7 r, lecz także z innymi cząstkami ele¬ 


mentarnymi, trudno uwierzyć, by zadowalająca fizyka 
teoria jądra mogła powstać przed powstaniem teorii cząstek 
cząstek elementarnych. elenraentar- 

Fizyka cząstek elementarnych jest właściwie naj- nych 
młodszym z wielkich działów fizyki; w odrębną dyscy¬ 
plinę wydzieliła się z fizyki jądrowej dopiero w latach 
pięćdziesiątych, po odkryciu, oprócz cząstek n i me¬ 
zonów 7i y szybko rosnącej liczby nowych, z reguły 
nietrwałych cząstek (hiperony: A y E, S 9 12, mezony: 
ky v,co t q i cała plejada tzw. rezonansów). Obiekty te obserwowany 
traktuje się na równi z elektronami, protonami i neu- Wszechświat io* 
tronami, ponieważ mają one wiele własności cząstek 
elementarnych (podobne elementarne oddziaływania 
i symetrie oraz niepodzielność, małe rozmiary itp.). 

Znamy już bardzo wiele takich obiektów i ciągle 

odkrywamy nowe. Znamy też sporo ciekawych empi- Galaktyka io 2C 

rycznych praw i reguł oraz ogromną liczbę reakcji 

między cząstkami elementarnymi. Nie ma jednak 

jeszcze zadowalającej teorii cząstek elementarnych 

(-* Cząstki elementarne i ich oddziaływania). 

Ponieważ cząstki elementarne są najmniejszymi 
(ok. 10” 13 cm) znanymi cegiełkami, z których zbudo- . 9 

wane są wszystkie znane nam formy materii, fizycy Słonce 
przypuszczają, że ich własności powinny wyznaczać Ziemia io 
własności wszystkich obiektów zarówno mikroświata, 
jak i makroświata, a więc zarówno jąder, jak i materii 
gwiezdnej. O własnościach atomów istotnych dla 
chemii i fizyki normalnych ciał makroskopowych człowiek io 
decydują — na szczęście — tylko bardzo nieliczne 
globalne własności jąder, jak ładunek, masa i spin. 

Struktura samego jądra, osłoniętego bardzo grubą bakteria 10 -e 
otoczką elektronową, jest nieistotna dla wspomnia- 
nego zakresu zjawisk; ważna jest tu tylko struktura at '^ J 

zewnętrznych powłok elektronowych atomów i ich wodoru 10 
masy. Natomiast, aby obliczyć własności samych 
jąder (którymi możemy się interesować niezależnie) , 

oraz badać konsekwencje pewnych ekstremalnych proton 
stanów w makroświecie, konieczna jest dobru teoria p or ó wn anie 
cząstek elementarnych. rozmiarów 

Przyszła teoria cząstek elementarnych ma więc 
wszelkie szanse stania się najbardziej ogólną i fun¬ 
damentalną teorią fizyczną, zawierającą kwantową 
elektrodynamikę i teorię jądra jako przypadki szcze- przyszła 
gólne lub graniczne. Według obecnego stanu fizyki teoria cząs- 
możemy powiedzieć, że cała materia w jej wszystkich tek elemen- 
znanych nam stanach jest zbudowana z tych samych tarnych 
cząstek elementarnych, których oddziaływania podle¬ 
gają tym samym prawom. Jest to niezwykle poglądo¬ 
we i przekonywające fizyczne uzasadnienie zasad 
jedności materii i powszechności praw przyrody. 

Powstaje frapujące pytanie, czy teoria cząstek 
elementarnych obejmuje swoim zasięgiem całą ma¬ 
terię, czy też będzie ona tylko następnym krokiem 
po nieskończonej drabinie poznania. 

W niniejszym, z natury rzeczy bardzo pobieżnym, 
szkicu uwzględnione zostały tylko te działy fizyki, 
które się znalazły w głównym nurcie poznawczym 
fizyki, wyznaczonym przez powstawanie coraz 
ogólniejszych i coraz głębszych przyczynowych teorii. 

Jest wiele działów fizyki, które mają ogromne zna¬ 
czenie praktyczne i są również ciekawe pod względem 
poznawczym, ale nikt nie spodziewa się po nich od¬ 
kryć o fundamentalnym dla rozwoju całej fizyki 
znaczeniu poznawczym czy też konstrukcji zupełnie 
nowej ogólnej teorii. Takimi działami są: fizyka ciała 
stałego, fizyka cieczy, fizyka plazmy, optyka, termo¬ 
dynamika procesów nieodwracalnych itd. Nikt nie ma 
wątpliwości, że istniejące teorie — mechanika kwan¬ 
towa i elektrodynamika kwantowa oraz fizyka sta¬ 
tystyczna — opisują dobrze wymienione działy fizyki, 
ale wobec skomplikowanego charakteru występują¬ 
cych w nich układów ścisła teoria jest przydatna 
tylko jako punkt wyjścia do licznych uproszczonych 
modeli. Ze względu na bogactwo występujących 
w takich układach różnorodnych zjawisk praca ba¬ 
dawcza jest tu nie tylko bardzo ciekawa, ale ma 
przede wszystkim kapitalne znaczenie praktyczne. 

Zarys niniejszy ogranicza się do właściwej fizyki. 
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O chemii czy astronomii wspomniano tylko wówczas, 
gdy nauki te przyczyniły się w sposób istotny do 
rozwoju głównego nurtu fizyki. Trzeba jednak pod¬ 
kreślić, że w astrofizyce odkryto w XX w. wiele no¬ 
wych, fascynujących zjawisk, które mogą mieć 
ogromne znaczenie dla poznania struktury i ewolucji 
Wszechświata. Ogromne znaczenie zarówno poznaw¬ 
cze, jak i praktyczne ma też fizyka życia, a w szcze¬ 
gólności biologia molekularna. 


Praktyczne i kulturotwórcze 
znaczenie fizyki 


Technika jest z pewnością dużo starsza od nauki; 
stniała i rozwijała się, gdy nauki jeszcze nie było. 
Wobec braku naukowej, teoretycznej i empirycznej 
podbudowy techniki, jej rozwój był w dawnych cza¬ 
sach niezmiernie powolny, zależał najczęściej od 
szczęśliwego przypadkowego odkrycia, niekiedy — 
technika od genialnego pomysłu. Również utrwalanie i prze- 
a nauka kazywanie nabytych praktycznych umiejętności było 
w tych warunkach bardzo utrudnione. Zresztą nawet 
przez pierwsze paręset lat historii nowożytnej fizyki 
jej szybki rozwój w niewielkim zaledwie stopniu 
oddziaływał na technikę. Z wyjątkiem wynalazku 
maszyny parowej technika tego okresu opierała się 
niemal wyłącznie na osiągnięciach mechaniki sta¬ 
rożytnej, a więc głównie na statyce i teorii mecha¬ 
nizmów. 

Przełom nastąpił dopiero w 2 połowie XIX w., 
po powstaniu elektrodynamiki, a także termodyna¬ 
miki. Praktyczne wykorzystanie termodynamiki do 
budowy silników cieplnych i wielu zagadnień prze¬ 
mysłowej chemii, ciepłownictwa itp. postępowało 
stosunkowo wolno. Natomiast zastosowanie elektro¬ 
dynamiki potoczyło się od razu lawinowo. Rozpoczął 
się „wiek elektryczności”, który trwa nadal. Szerokie 
wiek elek- wykorzystanie zjawisk elektromagnetycznych spo- 
tryczności wodowało przede wszystkim zupełną rewolucję sił 
wytwórczych i podniesienie poziomu materialnego 
i kulturalnego społeczeństw. Rewolucja ta opierała 
się głównie na wprowadzeniu wydajnych, niezawod¬ 
nych i ogólnie dostępnych elektromagnetycznych 
metod przetwarzania, przesyłania, akumulowania 
i coraz bardziej zróżnicowanego wykorzystania taniej 
energii. Z drugiej strony — nie mniejszą rewolucję 
społeczno-kulturalną spowodowały elektromagne¬ 
tyczne metody zbierania, zapisu, przesyłania, prze¬ 
twarzania, odtwarzania i powielania wszelkiej infor¬ 
macji, w tym także informacji czysto kulturalnej 
Trzeci zakres zastosowania elektrodynamiki dotyczy 
automatyzacji procesów produkcyjnych i nieproduk¬ 
cyjnych, zdalnego kierowania itp. 

Aż do drugiej wojny światowej technika wykorzy¬ 
stywała tylko makroskopowe zjawiska i prawa kla¬ 
sycznej fizyki. W ostatnich 30 latach coraz częściej 
wykorzystuje się zjawiska kwantowe z zakresu fizyki 
atomu, molekuły i ciała stałego, kwantowej optyki 
oraz fizyki plazmy, które się zajmują zjawiskami 
elektromagnetycznymi na poziomie fizyki mikro- 
świata. 

W tym samym wprawdzie czasie wzrosła liczba 
nowych zastosowań mechaniki i termodynamiki, ale 
ich wagi nie da się porównać z wagą zastosowań 
zjawisk elektromagnetycznych. Prymatu pod tym 
zastosowa- względem nie zdołała też odebrać elektrodynamice 
nie fizyki fizyka jądrowa — mimo swego wielkiego wpływu 
jądrowej na politykę (bomby jądrowe). Zastosowanie izotopów, 
reaktorów jądrowych, różnego typu promieniowania, 
choć bardzo ważne, nie jest jeszcze tak powszechne 
i tak istotne ani dla przemysłu, ani dla praktyki 
pozaprzemysłowej jak zastosowanie elektrodynamiki. 
Warto zresztą podkreślić, że fizyka jądrowa nie wy¬ 
stępuje bynajmniej w roli konkurenta elektrodyna¬ 
miki, tzn. nie ma mowy o wypieraniu metod elektro¬ 


magnetycznych przez jądrowe. Chodzi z reguły o do¬ 
danie do możliwości elektrodynamiki nowych możli¬ 
wości, wynikających z wykorzystania fizyki jądrowej. 

Warto wspomnieć tu także o drugiej, równoczesnej 
rewolucji, którą spowodowało w ostatnim stuleciu 
zastosowanie chemii. Chemia nie tylko udoskonaliła 
technologię wytwarzania wielu „starych” materiałów, 
ale wprowadziła do produkcji ogromną liczbę nowych 
tworzyw sztucznych, paliw, leków, nawozów, deter¬ 
gentów, środków spożywczych itp. 

Dzięki coraz szerszemu wykorzystaniu zdobyczy 
fizyki i chemii oraz w pewnym stopniu biologii na¬ 
stąpił w ostatnich 100 latach niebywale szybki roz¬ 
wój przemysłu. Zrodzona przez te nauki nowa tech¬ 
nika zmienia w zawrotnym tempie oblicze świata, 
decyduje o bogactwie materialnym i o poziomie kul¬ 
turalnym narodów, zmienia siły wytwórcze, rodzaj 
i skalę wytwarzanych dóbr, zmienia stosunki społecz¬ 
ne i polityczne we wszystkich częściach naszego globu. 

W pierwszym okresie unaukowienia techniki, któ¬ 
ry trwał z grubsza do połowy XX w., technika korzy¬ 
stała niemal wyłącznie z końcowych rezultatów badań 
naukowych, czyli z gotowej wiedzy naukowej w po¬ 
staci odkrytych zjawisk, skonstruowanych aparatów 
i teorii. Był to okres dominacji indywidualnych wyna¬ 
lazców, którzy eksploatowali fizykę w sposób „cha¬ 
łupniczy”, polegający na wielokrotnych próbach 
albo opartych na zasadzie „chybił trafił”, albo na 
tzw. genialnych pomysłach wynalazczych, albo też na 
dość nieuchwytnej i niepowtarzalnej „technicznej 
smykałce”. 

Rozpoczętą w połowie XX w. rewolucję naukowo- 
techniczną charakteryzuje zerwanie z poprzednimi, 
„chałupniczymi” i nienaukowymi metodami wyko¬ 
rzystania fizyki do celów praktycznych. Współczesna 
fuzja techniki z fizyką polega więc na powszechnym 
stosowaniu metod naukowych w intensywnie i sys¬ 
tematycznie prowadzonych pracach zespołowych, 
zmierzających do optymalnego wykorzystania pozna¬ 
nych przez nauki fizyczne zjawisk i praw natury. 

Dopiero bardzo niedawno zdano sobie sprawę, że 
do praktycznego wykorzystania nadaje się nie tylko 
produkt końcowy pracy fizyków, którym jest gotowa 
wiedza naukowa, lecz także stosowana przez fizyków 
metoda naukowa, styl myślenia i działania. Fizyka 
bowiem nie tylko zaspokaja nasz głód poznania i na¬ 
turalną ciekawość świata, jest nie tylko przebogatą 
skarbnicą aparatów, materiałów, zjawisk, praw 
i teorii tworzących szeroką bazę techniki, fizyka 
stworzyła również nowy styl myślenia i wszelkiego 
działania opartego na racjonalno-empirycznej, ścisłej 
metodzie naukowej. Okazuje się, że metody opraco¬ 
wane pierwotnie w badaniach naukowych do celów 
czysto poznawczych można zaadaptować w coraz 
szerszym zakresie do praktycznego działania. Adapta¬ 
cja ta zasadza się m.in. na podobieństwie struktury 
omówionego wyżej cyklu badawczego i typowego 
cyklu planowego działania praktycznego, który się 
składa z następujących elementów: stan początkowy, 
zadanie, plan, realizacja planu, analiza planu i jego 
realizacji (ewentualność zmian i korekt), stan końco¬ 
wy. Uruchomienie skutecznie działających sprzężeń 
zwrotnych między zadaniem a planem i jego realizacją, 
na wzór sprzężenia między problemem, hipotezą 
i testami empirycznymi, jest dziś jednym z podsta¬ 
wowych problemów rewolucji naukowo-technicznej. 

Podstawą i warunkiem skuteczności wszelkiej 
działalności praktycznej jest umiejętność trafnego 
przewidywania przebiegu ważnych dla praktyki 
procesów oraz rezultatów ludzkiego działania. Dobrze 
uzasadnione podstawy maksymalnie trafnego prze¬ 
widywania daje dziś tylko nauka. W skomplikowanym 
i szybko zmieniającym się świecie dawne źródła 
umiejętności przewidywania, a mianowicie doświad¬ 
czenie życiowe, praktyka, tradycja i historia, są dziś 
wysoce niewystarczające. 

Ogromna rola fizyki w tworzeniu kultury material¬ 
nej jest — mimo wszelkie nieporozumienia i wypacze- 
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wkład fizyki nia — znacznie lepiej znana i utrwalona w świado- 
do kultury mości społecznej niż znaczenie fizyki dla kultury 
umysłowej duchowej (zwanej też często kulturą właściwą), 
a ściślej — kultury umysłowej. 

Fizyka odgrywa ogromną rolę kulturotwórczą; 
niestety, na ogół nie docenianą. Fizyka stworzyła 
przede wszystkim nowy, niezależny od religii i magii, 
naukowy obraz całej przyrody nieożywionej. Wpraw¬ 
dzie fizyczny, materialistyczny obraz świata nie jest 
ani absolutnie dokładny, ani ostateczny, ale jest 
z pewnością dokładniejszy i bliższy rzeczywistości 
od wszelkich obrazów nienaukowych. Obraz ten jest 
nie tylko sprawdzalny, ale także ustawicznie roz¬ 
szerzany, pogłębiany i korygowany. Ten niepełny, 
ale ciągle doskonalony obraz świata urzeka już dziś 
swoją prostotą, jednolitością oraz jasnością i komuni¬ 
katywnością. 

Wiele elementów fizycznego obrazu świata weszło 
już do kultury ogólnej szerokich rzesz społeczeństwa. 
Pojęcia cząstki elementarnej, atomu, molekuły, jądra, 
masy, prędkości, przyspieszenia, siły, prądu elektrycz¬ 
nego, pól elektrycznych i magnetycznych, fal, praw 
ruchu, prawa powszechnego ciążenia, układu helio- 
centrycznego itp. są powszechnie używane i rozumiane 
(choć nie zawsze całkiem poprawnie) przez większość 
ludzi nie tylko ze średnim lub wyższym wykształce¬ 
niem, lecz nawet przez ludzi o wykształceniu podsta¬ 
wowym. Język pojęć fizyki i ilościowy, racjonalno- 
empiryczny styl myślenia fizyków stał się w znacznym 
stopniu dobrem powszechnym, wszedł do języka 
ogólnego, jest używany potocznie, w prasie, w ra¬ 
dio i telewizji, a nawet w ... poetyckich porówna¬ 
niach. 

Dobrze sprawdzony i sprawdzalny, obiektywny 
obraz całego świata, materialnego oraz naukowy styl 
myślenia są niezwykle cennymi dobrami kulturalnymi, 
które fizyka oferuje społeczeństwu. Już w XVIII w. 
powstanie mechaniki Newtona, tłumaczącej w jedno¬ 
lity sposób ruchy planet i ciał na Ziemi, stało się 
przedmiotem powszechnego zainteresowania ludzi 
wykształconych w kulturalnie zaawansowanych kra¬ 
jach. Fizyka Newtona stała się źródłem inspiracji dla 
filozofów i działaczy, przyczyniła się walnie do po¬ 
wstania ważnego prądu umysłowego, zwanego oświe¬ 
ceniem. Dzisiaj bezpośrednie oddziaływanie fizyki 
na kulturę umysłową jest jeszcze większe, choć brak 
perspektywy czasu utrudnia nam często wykrycie 
głównych nurtów i kierunków. 

Podobnie jak oddziaływanie fizyki na produkcję 
i konsumpcję dóbr materialnych odbywa się za po¬ 
średnictwem techniki, tak też część oddziaływania 
fizyki na kulturę właściwą odbywa się za pośrednic¬ 
twem literatury i sztuki. Do literatury zaczęła wcho¬ 
dzić fizyka i inne nauki przyrodnicze już w 2 połowie 
XIX w. Odkrycia naukowe i oparte na nich wyna¬ 
lazki i pomysły techniczne pobudzały fantazję pisarzy, 
fizyka Rozpoczął się trwający do dziś bujny rozwój litera- 
a literatura tury fantastyczno-naukowej oraz powieści przy¬ 
godowej i detektywistycznej, zawierającej dużo 
informacji i pomysłów z zakresu fizyki tudzież innych 
nauk przyrodniczych oraz techniki. Wick XX przy¬ 
niósł znaczne pogłębienie tego kierunku, który znajdu¬ 
je wyraz także w rozkwicie tzw. literatury faktu. 
W społeczeństwach XX w. wystąpił bowiem stymu¬ 
lowany przez naukę głód szeroko pojętej wiedzy, 
opartej nie na dyletanckich obserwacjach oraz oso¬ 
bistych, subiektywnych przeżyciach pisarzy z bożej 
laski, lecz na rzetelnych, naukowo stwierdzonych 
faktach. Coraz częściej bestsellerem staje się w na¬ 


szym wieku nie powieść, lecz pamiętnik interesującej 
osoby, zbiór reportaży, esejów, rozpraw czy książka 
popularnonaukowa z zakresu archeologii, historii, 
psychologii, biologii, socjologii, medycyny, chemii, 
fizyki, astronomii, a nawet matematyki. Ba, niejedno¬ 
krotnie bestsellerami stają się ładnie napisane książki 
o wyraźnie naukowym charakterze. 

Tworzenie dobrych dzieł literatury faktu jest trud¬ 
niejsze niż tworzenie dobrych fikcji powieściowych. 
Oprócz piękna języka, polotu i fantazji wymaga 
się dobrego przygotowania fachowego, znajomości 
i dobrego zrozumienia przedstawionych zjawisk, kon¬ 
cepcji i teorii, zdolności syntetycznego widzenia oraz 
daru prostego wyjaśniania spraw nader skompli¬ 
kowanych. Połączenie piękna słowa i formy pisar¬ 
skiej z głęboką, konkretną, a przecież fascynującą 
treścią, opartą na faktach dostarczanych przez naukę 
i praktykę, wydaje się realistycznym i pociągającym 
programem rozwoju literatury. 

Jeszcze większy i łatwiejszy do prześledzenia jest 
wpływ fizyki na kulturę artystyczną. Na bazie fizyki 
i chemii powstały i nadal powstają nowe dziedziny 
twórczości artystycznej, których w ogóle nie było 
200, 100 czy nawet 50 lat temu. Jako najważniejsze 
przykłady można tu podać fotografię, kino, radio, 
telewizję i rodzącą się dopiero sztukę holografii. 
Są to uznane dziś, nowe dziedziny twórczości, które 
pozornie wypierają stare — w rodzaju malarstwa, 
muzyki, śpiewu, tańca i teatru — ale w gruncie rzeczy 
przyczyniają się do niebywałego ich upowszechniania. 

Również muzyka i sztuki plastyczne zmieniają się 
bardzo dzięki zastosowaniu opartych na fizyce i chemii 
nowych technik i nowych materiałów. Wystarczy 
przypomnieć zastosowanie elektroniki i akustyki 
w muzyce albo rolę nowych materiałów w architek¬ 


turze. . . . 

Należy też podkreślić, że fizyka i chemia stworzyły 
iczne możliwości wiernego zapisu, utrwalenia, prze¬ 
syłania i dowolnie częstej, wiernej reprodukcji nie¬ 
trwałych dóbr kultury. To, co dawniej ginęło bez¬ 
powrotnie, możemy teraz utrwalić i powtórzyć 
w dowolnym czasie. Na fotografii, filmie, płycie gra¬ 
mofonowej lub taśmie magnetycznej możemy utrwa¬ 
lić dowolny występ muzyczny, taneczny, teatralny 
lub wokalny i odtworzyć kiedy mamy tylko czas 
i ochotę. Możemy w krótkim czasie porównać wyko¬ 
nanie tego samego utworu przez różne, może nie 
istniejące już zespoły, możemy oglądać i słuchać 
zmarłych już wykonawców, brać niemal bezpośredni 
udział w minionych lub geograficznie odległych, 
a ważnych i ciekawych zdarzeniach kulturalnych 
i politycznych. Czy nie jest to wspaniałe rozszerzenie 
i wzbogacenie możliwości kulturalnych każdego 
człowieka? Czy nasi dziadowie mieli takie możliwo¬ 


ści? 

Nauka jest dziś nie tylko ważną częścią kultury 
ogólnej, nie tylko oddziałuje coraz silniej na wszy¬ 
stkie niemal formy kultury materialnej i duchowej, 
ale staje się w naszych oczach główną, dominującą 
siłą kulturotwórczą, wyznaczającą kierunki rozwoju 
kulturalnego oraz inspirującą powstawanie nowych 
prądów umysłowych i nowych form działalności 
kulturalnej. Przodującą rolę odgrywa w tym procesie 
fizyka, jako najbardziej podstawowa nauka przyrod¬ 
nicza i baza nowoczesnej techniki. 

M. Bunge Foundations of Physics, Berlin 1967; L.N. Cooper 
Istota i struktura fizyki y Warszawa 1975; A. Einstein i L. Infeld 
Ewolucja fizyki , Warszawa 1959; R.P. Feynman i »n. łeynmana 
wykłady z fizyki t. 1-3, Warszawa 1972-74; J. Werle Rozwoj 
i perspektywy fizyki y Warszawa 1969. 
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O niektórych podstawowych pojęciach 
fizycznych 

Andrzej Staruszkiewicz 


Fizyka klasyczna 

Terminem „fizyka klasyczna” określa się zespół pojęć 
i praw ruchu uważanych za prawdziwe od połowy 
XVII do końca XIX w. Za początek fizyki klasycznej 
należy uważać rozpoznanie przez fizyków XVII w., 
I prawo zwłaszcza I. Newtona, prawdziwości prawa ruchu 
Newtona nazwanego później pierwszym prawem Newtona: 

ciało, na które nie działa żadna siła, pozostaje w spo¬ 
czynku lub porusza się ruchem jednostajnym i pro¬ 
stoliniowym. Twierdzenie to nie jest ani oczywiste, 
ani nawet zrozumiałe bez dalszych wyjaśnień. 

Człowiek płynący statkiem porusza się względem 
przedmiotów na brzegu, lecz pozostaje w spoczynku 
względem statku. O jakim więc ruchu i jakim spo¬ 
czynku mówi pierwsze prawo? Jak można stwierdzić, 
że na ciało nie działa żadna siła? Jeszcze w drugiej 
połowie XIX w. Ernst Mach uznał, że pytania te pod¬ 
ważają cały gmach mechaniki klasycznej; krytyka 
Macha wywarła pewien wpływ na Alberta Einsteina — 
twórcę szczególnej i ogólnej teorii względności. 

Newton rozumiał pierwsze prawo w sposób, który 
być może —jak utrzymywali krytycy od G.W. Leib¬ 
niza do Macha—jest filozoficznie niedorzeczny, lecz 
za to trafnie ujmuje fizyczną istotę zagadnienia: 
gdyby usunąć wszystkie rzeczy wypełniające prze¬ 
strzeń, tak jak usuwa się płyn z naczynia, to po¬ 
zostałby pusty pojemnik przedmiotów materialnych — 
przestrzeń Euklidesowa; gdyby następnie do prze¬ 
strzeni tej wprowadzić małą cząstkę i nadać jej pręd¬ 
kość, to kolejne położenia cząstki ułożyłyby się wzdłuż 
linii prostej; gdyby wreszcie na prostej tej zaznaczyć 
ciąg punktów tak, by między dwoma sąsiednimi była 
zawsze ta sama odległość, to chwile przebywania 
cząstki w tych punktach byłyby oddzielone jednako¬ 
wymi odstępami czasu. 

Krytyka newtonowskiego rozumienia pierwszego 
prawa jest łatwa, lecz jałowa; chwalebne skądinąd 
dążenie do ścisłości logicznej musi być poprzedzone 
wiedzą o faktach; w mechanice klasycznej podsta¬ 
wowym faktem jest bezwładność ciał, z której zdaje 
sprawę pierwsze prawo ruchu. 

Współcześnie w celu jasnego ujęcia zasad mecha¬ 
niki wprowadzamy pojęcie czterowym i arowej czaso- 
czasoprze- przestrzeni Galileusza. Jest to zbiór wszystkich 
strzeń zdarzeń, tj. procesów fizycznych zachodzących w ściś- 
Galileusza !e określonym miejscu i ściśle określonym czasie, 


jak np. zderzenie dwu nieskończenie małych cząstek. 
Za zdarzenie uważamy przy tym nie sam proces 
fizyczny, lecz wyłącznie jego miejsce w czasie i prze¬ 
strzeni. G.W. Leibniz uważał taką abstrakcję za nie¬ 
dopuszczalną i na tej zasadzie odrzucał mechanikę 
Newtona. Czasoprzestrzeń Galileusza ma określoną 
strukturę afiniczną i metryczną. Struktura afiniczna 
polega na tym, że można wyróżnić pewne linie jako 
linie proste i pewne pary prostych jako proste równo¬ 
ległe. Struktura metryczna polega na tym, że istnieje 
wyróżniona rodzina równoległych hiperpłaszczyzn, 
zwanych hiperpłaszczyznami równoczesności. Każda 
z nich jest trójwymiarową przestrzenią Euklidesową. 
Nadto z każdą parą hiperpłaszczyzn równoczesności, 
np. z hiperpłaszczyznami 1 i 2 y związana jest liczba 
* 12 —upływ czasu newtonowskiego między 1 i 2; 
dla trzech hiperpłaszczyzn l y 2 , 3, / 13 = *i 2 +* 23 - 

Mówimy, że współrzędne czasoprzestrzenne t, 
■x u x 2 , są dostosowane do struktury czasoprze¬ 
strzeni Galileusza, jeżeli hiperpłaszczyzny równocze¬ 
sności dane są równaniem t = const, jeżeli upływ 
czasu newtonowskiego między dwiema takimi hi¬ 
perpłaszczyznami jest równy różnicy współrzędnej t 
i jeżeli kwadrat odległości dwu równoczesnych i nie¬ 
skończenie bliskich zdarzeń wynosi (,dxjf J r{dx i ) z -r 
+{dxj) 2 . O współrzędnych czasoprzestrzennych do¬ 
stosowanych mówimy, że tworzą układ inercjalny. 

Terminu „układ inercjalny” używa się w dwu róż¬ 
nych znaczeniach. Oznacza on albo współrzędne cza¬ 
soprzestrzenne dostosowane do struktury metrycznej 
czasoprzestrzeni — rozumie się wtedy, że współrzędne 
te pokrywają całą czasoprzestrzeń — albo niewielkie 
ciało, np. laboratorium, wolne w dostatecznym stop¬ 
niu od wpływu innych ciał i nie wykonujące ruchu 
obrotowego. Gdy mówimy: równania Newtona 
przyjmują najprostszą postać w układzie inercjalnym, 
to mamy na myśli pierwsze znaczenie; gdy mówimy: 
dla czasów rzędu kilku sekund laboratorium spoczy¬ 
wające na Ziemi może być uważane za układ iner¬ 
cjalny, to mamy na myśli drugie znaczenie. W dal¬ 
szym ciągu artykułu używamy terminu „układ iner¬ 
cjalny” w obu znaczeniach. 

Pierwsze prawo ruchu mówi, że w układzie iner¬ 
cjalnym ruch cząstki, na którą nie działają żadne siły, 
spełnia równanie: 


hiperpłasz¬ 
czyzny rów¬ 
noczesności 


układ 

inercjalny 


35 













klasyczne 

określenie 

równoczes- 

ności 


II prawo 
Newtona 


teoria 

grawitacji 


masa 
bezwładna 
masa ciężka 


Jeżeli współrzędne /, x l9 x i9 x 3 tworzą układ iner¬ 
cjalny, to współrzędne: 

t' = /, X[ = Xi +Vi t 

(gdzie vi są stałymi) też tworzą układ inercjalny; jest to 
matematyczny wyraz zasady względności Galileusza, 
która mówi, że przy pomocy żadnego doświadczenia 
mechanicznego nie można odróżnić spoczynku od 
ruchu po prostej ze stałą prędkością. 

Jak można wyznaczyć hiperpłaszczyzny równocze- 
sności? Newton nie powiedział tego jasno. Wyzna¬ 
czenie hiperpłaszczyzn równoczesności nabrało jednak 
wielkiej wagi w XVIII w. w związku z rozwojem żeglu¬ 
gi; znając bowiem hiperpłaszczyzny równoczesności 
można z położenia gwiazd oznaczyć długość geogra¬ 
ficzną. Parlament angielski wyznaczył nagrodę za 
opracowanie metody oznaczania długości; połowę na¬ 
grody dostał zegarmistrz londyński Harrison, którego 
zegar przewieziony z Londynu do Singapuru i z po¬ 
wrotem wskazywał czas różniący się tylko o kilka se¬ 
kund od czasu wskazywanego przez podobny zegar 
pozostawiony w Londynie. Przyznając nagrodę Harri- 
sonowi parlament zgodził się milcząco na następujące 
określenie równoczesności: niech w układzie iner¬ 
cjalnym spoczywają dwa jednakowe zegary spręży¬ 
nowe wskazujące ten sam czas; jeżeli jeden z nich prze¬ 
nieść w inne miejsce, to wskazanie czasu / przez zegar 
przeniesiony pozostanie zdarzeniem równoczesnym 
ze wskazaniem czasu / przez zegar pozostawiony 
w spoczynku. 

Określenie to nie ogranicza ani drogi przeniesienia, 
ani prędkości, a więc zakłada, że upływ czasu newto¬ 
nowskiego dt wskazywany przez zegar sprężynowy 
jest różniczką zupełną; rzecz jasna, zmiany prędkości 
przy przenoszeniu powinny być tak łagodne, by nie 
powstały uszkodzenia mechaniczne zegara. Powyż¬ 
szym określeniem równoczesności posługujemy się 
do dziś w życiu codziennym. 

Drugie prawo ruchu Newtona rozwija myśl za¬ 
wartą w pierwszym: skoro ciało oddzielone zupełnie 
od innych porusza się ze stałą prędkością, to każda 
zmiana prędkości wywołana jest obecnością innych 
ciał. Każde ciało ma wg Newtona masę bezwładną, 
która jest tym większa, im trudniej jest zmienić jedno¬ 
stajny i prostoliniowy ruch ciała. Drugie prawo we 
współczesnym ujęciu mówi, że iloczyn masy bez¬ 
władnej i przyspieszenia równy jest w każdej chwili 
sile przyłożonej do ciała: 

d 2 xt . 

ł = 1 > 2 > 3 - 

Sądzi się czasem, że drugie prawo jest tylko okre¬ 
śleniem pojęcia siły za pomocą czysto kinematycz¬ 
nego pojęcia przyspieszenia. Newton i tu rozumiał 
rzecz głębiej; w dziele Optyka napisał: „całe zadanie 
filozofii przyrody polega na tym, by z obserwowanych 
zjawisk odczytać siły, a następnie z sił wyprowadzić 
dalsze zjawiska”. 

Pięknym rozwiązaniem tak rozumianego podsta¬ 
wowego zadania fizyki jest newtonowska teoria 
grawitacji. Newton znał prawa ruchu planet Keplera. 
Udowodnił, że prawa te wynikają z założenia, że 
między Słońcem a planetą działa siła przyciągająca 
odwrotnie proporcjonalna do kwadratu odległości 
planety od Słońca i skierowana wzdłuż prostej łączą¬ 
cej oba ciała. Na tej zasadzie przyjął, że między każ¬ 
dymi dwoma ciałami we Wszechświecie działa siła 
przyciągająca proporcjonalna do iloczynu mas, 
odwrotnie proporcjonalna do kwadratu odległości 
i skierowana wzdłuż prostej łączącej oba ciała. 

Masa, o której mówi prawo grawitacji, jest po¬ 
jęciem różnym od pojęcia masy bezwładnej, o której 
mówi drugie prawo ruchu. Jest jednak faktem do¬ 
świadczalnym, że obie te masy są zawsze równe. 
Najprostszym dowodem tego jest ruch wahadła 
matematycznego, którego okres nie zależy od ma¬ 
teriału, z którego wykonano wahadło. Równość 


masy ciężkiej i masy bezwładnej, będąca jedynie 
faktem w teorii grawitacji Newtona, stała się dla Ein¬ 
steina punktem wyjścia do sformułowania ogólnej 
teorii względności. Odległość występująca w prawie 
grawitacji jest odległością wzdłuż hiperpłaszczyzn 
równoczesności; stąd widać, że sformułowanie prawa 
grawitacji zakłada opisaną wcześniej strukturę 
metryczną czasoprzestrzeni Galileusza. 

Prawo grawitacji pozwala przewidzieć na drodze 
czysto dedukcyjnej zjawiska nie objęte prawami 
Keplera, np. perturbacje, które do ruchu planety 
wprowadza sąsiedztwo innej planety. 

Trzecie prawo ruchu mówi, że jeżeli ciało A działa * ^ WO 

na ciało B siłą / ab 9 to ciało B działa na ciało A siłą 

/ba — —fAB. Status trzeciego prawa jest wyraźnie 
niższy niż status pierwszego i drugiego prawa. Po 
pierwsze, np. dla układu ciał oddziaływających gra¬ 
witacyjnie, trzecie prawo jest zawarte w prawie gra¬ 
witacji. Po drugie, w szczególnej teorii względności, 
która jest uogólnieniem fizyki klasycznej, pierwsze 
prawo pozostaje bez zmian, drugie wymaga tylko 
niewielkiej zmiany, podczas gdy trzecie może się 
ostać tylko po znacznych zmianach w sposobie ro¬ 
zumienia oddziaływań między ciałami. 


Szczególna teoria względności 

„Szczególna teoria względności” jest to wyjątkowo 
niefortunny termin, którym obejmujemy zespół pojęć 
i praw ruchu uważanych od początku XX w. za do¬ 
kładniejsze od praw fizyki klasycznej. Zasady szcze¬ 
gólnej teorii względności zostały podane przez 
Einsteina w 1905 r. Einstein stwierdził, że o ile równo- 
czesność zdarzeń nieskończenie bliskich jest koincy¬ 
dencją przestrzennc-czasową i może być stwierdzona 
przez prostą obserwację, o tyle równoczesność 
zdarzeń odległych nie jest czymś oczywistym. Einstein r< >wnocies- 
określił równoczesność zdarzeń odległych (rys. 1) no * c 
następująco: jeśli w układzie inercjalnym spoczywa 
zegar i jeśli sygnał świetlny wysłany w chwili t x 
7 miejsca spoczynku zegara i odbity od jakiejś przesz¬ 
kody powraca w chwili t z , to odbicie sygnału jest 
zdarzeniem równoczesnym ze wskazaniem przez 
zegar czasu 1 / z (t l +t z ). Z określenia tego wynika, że 
zdarzenia równoczesne w jednym układzie inercjal¬ 
nym nie są na ogół równoczesne w innym układzie 
inercjalnym. Istotnie, niech prosta ^ = 0 na rys. 2 
przedstawia zegar spoczywający, a prosta x — vt — 
zegar poruszający się z prędkością v; jeśli nadto 
łamana ABC przedstawia bieg światła, to w punkcie 
B następuje odbicie. W układzie zegara spoczywają¬ 
cego zdarzenie B jest równoczesne ze zdarzeniem D 
określonym równością AD — DC, natomiast w ukła¬ 
dzie zegara poruszającego się zdarzenie B jest równo¬ 
czesne ze zdarzeniem D r określonym równością: 

AD' — D'C , gdzie zdarzenie C' jest odebraniem przez 
zegar poruszający się sygnału odbitego. 

Względność równoczesności wynikająca z określe¬ 
nia Einsteina, tj. zależność równoczesności od układu 
inercjalnego, została odebrana przez współczesnych 
Einsteina jako coś całkowicie zmieniającego pojęcie 
czasu; wrażenie to zostało utrwalone w niefortunnej 
nazwie „teoria względności”. Obecnie, z perspektywy 
przeszło siedemdziesięciu lat, uderza nas ciągłość 
przejścia od fizyki klasycznej do szczególnej teorii 
względności. W porównaniu z teoriami rzeczywiście 
i głęboko zmieniającymi fizyczny obraz świata - 
ogólną teorią względności i mechaniką kwantową — + 

zmiany, które wprowadza do fizyki klasycznej szcze- 2 
gólna teoria względności, są nieznacznymi uzupełnie¬ 
niami tego samego w zasadzie obrazu rzeczywistości. 

W trzy lata po ukazaniu się pracy Einsteina H. Min- 


Rys. 1. Odbicie sygnału jest zdarzeniem równoczesnym ze wska- - .—-h 

zaniem czasu Vj(*i + *i) przez zegar spoczywający w układzie położenie 

inercjalnym 
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przekształce¬ 
nie Lorentza 


czasoprze¬ 
strzeń Min- 
kowskiego 


kowski podał prostą interpretację geometryczną 
zasad szczególnej teorii względności. Interpretacja 
Minkowskiego jest tak przekonywająco trafna, że 
współcześnie za szczególną teorię względności nie¬ 
którzy uważają właśnie interpretację Minkowskiego. 

Wróćmy do rys. 2; zdarzenia leżące na prostej 
D'B są równoczesne w układzie zegara poruszającego 



się, podobnie jak zdarzenia na każdej prostej równo¬ 
ległej do D'B. Prosta równoległa do D'B i przechodzą¬ 
ca przez punkt A jest więc w układzie zegara poru¬ 
szającego się odpowiednikiem osi x; nazwijmy ją 
osią x'. Podobnie prosta * = vt jest odpowiednikiem 
osi t\ nazwijmy ją osią Łatwo stwierdzić, że zda¬ 
rzenie o współrzędnych /, x ma w układzie porusza¬ 
jącym się współrzędne: 

t , _ t — (vjc 2 )x _ — vt+x 

]/l — v 2 jc 2 \/\ — V 2 je 2 

gdzie c jest prędkością światła; związki te nazywamy 
przekształceniem Lorentza. Otóż: 

(c/') 2 -(*O 2 - (cty-(x)\ 

Minkowski interpretuje formę kwadratową (c/) 2 — (x ) 2 
jako kwadrat odległości zdarzenia o współrzędnych 
/, x od początku układu, przekształcenie Lorentza 
zaś jako odpowiednik obrotu. Interpretacja Minkow¬ 
skiego polega więc na przypisaniu czasoprzestrzeni 
struktury metrycznej różnej od struktury metrycznej 
czasoprzestrzeni Galileusza. Strukturę tę można 
opisać następująco: z każdymi dwoma zdarzeniami 
związana jest liczba będąca czasoprzestrzennym od¬ 
powiednikiem kwadratu odległości między dwoma 
punktami w geometrii Euklidesowej. Dla dwu nie¬ 
skończenie bliskich zdarzeń liczba ta ma postać: 

ds 2 = c 2 dt 2 -dx 2 -dy*-dz\ 

gdzie / jest czasem mierzonym przez zegar spoczy¬ 
wający w wybranym układzie inercjalnym, c — pręd¬ 
kością światła, zaś współrzędne x> y> z mają to samo 
znaczenie, co w fizyce klasycznej (są to współrzędne 
kartezjańskie prostokątne na każdej płaszczyźnie 
równoczesności, ct — const); płaszczyzny równocze- 
sności są zbiorami zdarzeń równoczesnych w wybra¬ 
nym układzie inercjalnym. O ile jednak płaszczyzny 
równoczesności zmieniają się wraz ze zmianą układu 
inercjalnego, o tyle liczba (ds ) 2 dla dwu ustalonych 
zdarzeń ma tę samą wartość we wszystkich układach 
inercjalnych. 

Treść fizyczną szczególnej teorii względności 
można ująć w następującą zasadę: wszystkie prawa 
fizyki dotyczące czasu i przestrzeni powinny być 
twierdzeniami geometrii metrycznej Minkowskiego. 

Zbadamy dokładniej strukturę metryczną czaso¬ 
przestrzeni Minkowskego. O współrzędnych ?, x , y, z 
takich, że kwadrat odległości dwu bliskich zdarzeń 
ma postać: 

c 2 dt 2 — dx 2 — dy 1 — dz 2 

mówimy, że są dostosowane do struktury metrycznej 


czasoprzestrzeni; mówimy też, że tworzą układ iner¬ 
cjalny. Omawiając czasoprzestrzeń Galileusza zwró¬ 
ciliśmy uwagę na owa różne znaczenia terminu „układ 
inercjalny”. Pojęcie układu inercjalnego jako nie¬ 
wielkiego ciała, wolnego w dostatecznym stopniu 
od wpływu innych ciał i nie wykonującego ruchu 
obrotowego, przenosi się bez zmiany do szczególnej 
teorii względności; ulega natomiast zmianie pojęcie 
układu inercjalnego jako układu współrzędnych 
dostosowanych do struktury metrycznej czasoprze¬ 
strzeni, bo zmienia się właśnie sama struktura me¬ 
tryczna. 

Obierzmy dowolne zdarzenie O jako początek ukła¬ 
du współrzędnych czasoprzestrzennych. Kwadrat 
odległości zdarzenia X o współrzędnych /, x , y, z 
od początku układu: 

s 2 — c 2 t 2 — x 2 —y 2 —z 2 

może być dodatni, ujemny lub równy zeru. Mówimy, 
że zdarzenia O , X tworzą wektor czasowy — gdy stożek 
s 2 > 0 , przestrzenny — gdy .y 2 < 0 i zerowy — gdy świetlny 
s 2 — 0. Zbiór wektorów zerowych o początku O two¬ 
rzy stożek świetlny zdarzenia O. Stożek ten dzieli 
czasoprzestrzeń na trzy rozłączne podzbiory (rys. 3): 


Rys. 3. Stożek świetlny zdarzenia O 

wnętrze górnej części stożka zwane przyszłością 
zdarzenia O, wnętrze dolnej części stożka zwane 
przeszłością zdarzenia O i zewnętrze stożka. Stożki 
światła każdego zdarzenia stanowią absolutny ele¬ 
ment czasoprzestrzeni Minkowskiego, podobnie jak 
hiperpłaszczyzny równoczesności stanowią absolutny 
element czasoprzestrzeni Galileusza. 

Stożek świetlny określa przeszłość i przyszłość 
jednego zdarzenia, a nie przeszłość i przyszłość 
w ogóle; tych ostatnich pojęć nie da się określić 
w czasoprzestrzeni Minkowskiego. K. Godeł, sławny 
matematyk, zwraca uwagę, że kryje się tu ciekawa 
filozoficznie różnica między fizyką klasyczną a szcze¬ 
gólną teorią względności. Intuicja nasza zdaje się 
dostrzegać różnicę w sposobie istnienia rzeczy prze¬ 
szłych i przyszłych. Ma to dobre oparcie w strukturze 
metrycznej czasoprzestrzeni Galileusza, która jest 
pocięta płaszczyznami równoczesności na rozłączne 
zbiory zdarzeń; o zdarzeniach leżących na jednej przeszłość 
płaszczyźnie równoczesności możemy powiedzieć, że * przyszłość 
współistnieją, o innych — że były lub będą. W cza¬ 
soprzestrzeni Minkowskiego nie da się wykonać 
żadnej takiej geometrycznie uzasadnionej konstrukcji. 

Godeł wyciąga stąd wniosek, że wszystkie zdarzenia 
istnieją tak samo, jedynie nasza intuicja, przestając 
spostrzegać pewne z nich, uznaje je za minione. 

Ciekawe, czy przekonanie, że świat „staje się”, a nie 
„istnieje w czasie i przestrzeni”, jest wrodzone 
umysłowi ludzkiemu, czy też ukształtowało się wy¬ 
raźnie pod wpływem fizyki Newtona. 

Rozważymy trzy stereotypowe poglądy łączone 
niekiedy ze szczególną teorią względności. 

„Żaden sygnał w przyrodzie nie może mieć pręd¬ 
kości większej niż prędkość światła”. Nie wykluczone, 
że zdanie to jest prawdziwe; nie jest ono jednak ani 
potrzebne dla uzasadnienia szczególnej teorii względ¬ 
ności ani z niej nie wynika. Przeciwnie, w ramach 
szczególnej teorii względności można łatwo zbudować 
modele teoretyczne, w których występują sygnały 
o prędkości większej niż prędkość światła. 

„Dwa zdarzenia tworzące wektor przestrzenny nie 
mogą być powiązane przyczynowo”. Pojęcie więzi 
przyczynowej jest antropomorfizmem, któremu bar- 
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dzo trudno nadać znaczenie fizyczne. Jeżeli za więź 
przyczynową uznać istnienie zależności funkcyjnej, 
to pogląd ten nie jest na ogół prawdziwy. Twierdzenie 
Gaussa-Ostrogradskiego mówi np., że strumień pola 
elektrycznego przez zamkniętą powierzchnię jest 
proporcjonalny do ładunku elektrycznego wewnątrz 
powierzchni, a więc ustala zależność funkcyjną między 
zjawiskami oddzielonymi przestrzennie dowolnie 
dużą odległością. 

„Ciała nie mogą oddziaływać na odległość, lecz 
za pośrednictwem pola, tj. materii istniejącej w prze¬ 
strzeni między ciałami i mogącej istnieć także pod 
nieobecność samych ciał”. Nie wykluczone, że twier¬ 
dzenie to jest prawdziwe, niemniej nie wynika ono 
ze szczególnej teorii względności. W ramach tej osta¬ 
tniej można z powodzeniem budować teorie działa¬ 
nia na odległość na wzór newtonowskiej teorii gra¬ 
witacji. 

działanie z Różnicę między działaniem z bliska, tj. przez okre- 

bliska i na ślone środowisko, a działaniem na odległość, tj. przez 
odległość „próżnię”, rozumiano dobrze już w XVII wieku. 

Ch. Huygens i G.W. Leibniz odrzucali newtonowską 
teorię grawitacji jako opartą na wykluczonym a priori 
działaniu na odległość. Newton, zgadzając się w za¬ 
sadzie z krytyką, rozumiał jednak, że dokładny opis 
zjawisk jest równie ważny jak znajomość ich mecha¬ 
nizmu. Przykład ten powinien być ostrzeżeniem przed 
pochopnym odrzucaniem działania na odległość jako 
sposobu opisu. 


Ogólna teoria względności 

„Ogólna teoria względności” jest nazwą równie nie¬ 
fortunną jak „szczególna teoria względności”. Nazy¬ 
wamy w ten sposób współczesną teorię grawitacji od¬ 
krytą przez Einsteina w latach 1911-16. Newtonow¬ 
skie prawo grawitacji zakłada strukturę metryczną 
czasoprzestrzeni Galileusza, a więc jest niezgodne ze 
strukturą metryczną czasoprzestrzeni Minkowskiego. 
Jeżeli tę ostatnią uważamy za bliższą rzeczywistości, 
to musimy zmienić prawo grawitacji. Klucz do nowej 
teorii grawitacji Einstein widział w równości masy 
bezwładnej i ciężkiej — fakcie przypadkowym w te¬ 
orii Newtona. Z faktu tego wynika m.in., że masa nie¬ 
wielkiego ciała poruszającego się w polu grawitacyj¬ 
nym nie występuje w równaniach Newtona, tj. że 
ruch wszystkich ciał w polu grawitacyjnym ma to 
samo przyspieszenie. Daleko idący wniosek Einsteina 
polega na przyjęciu, że skoro ruch wszystkich ciał 
jest taki sam, to ruch ten jest własnością czasoprze¬ 
strzeni, a nie samych ciał. Jest to hipoteza o strukturze 
metrycznej czasoprzestrzeni, którą można opisać na¬ 
stępująco. 

rzeczywista Rzeczywista czasoprzestrzeń ma się tak do czaso- 
czaso- przestrzeni Minkowskiego, jak zakrzywiona powierz- 
przestrzeń chnia w trójwymiarowej przestrzeni Euklidesa do 
płaszczyzny: małe kawałki każdej gładkiej powierz¬ 
chni można uważać za kawałki płaszczyzny; podobnie 
kawałki czasoprzestrzeni dostępne w doświadczeniu 
są małe w skali kosmosu i mogą być uważane za część 
czasoprzestrzeni Minkowskiego; większe części czaso¬ 
przestrzeni wykazują jednak własności metryczne 
różne od odpowiednio dużych części czasoprzestrzeni 
Minkowskiego. 

Jak można znaleźć rzeczywisty kształt czasoprze¬ 
strzeni? Jest to zadanie technicznie trudne, lecz bardzo 
proste pojęciowo, niczym nie różniące się od zadania 
znalezienia np. kształtu powierzchni Ziemi. Należy 
jedynie wprowadzić określenia i hipotezy wiążące 
nieznaną geometrię ze zjawiskami dostępnymi ob¬ 
serwacji. 

Kształt Ziemi można znaleźć umawiając się, że 
łańcuch napięty między dwoma bliskimi punktami 
powierzchni Ziemi tworzy odcinek prostej o długości 
równej liczbie ogniw. Mówimy tu, rzecz jasna, o po¬ 
jęciowej zasadzie mierzenia, a nie o rzeczywistych po¬ 
miarach, które znacznie wygodniej robić przy po- 
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mocy teodolitu. Wykonując triangulację, tj. mierząc 
szereg stykających się bokami trójkątów, znajdziemy 
łatwo odstępstwa od hipotezy, że badana powierzch¬ 
nia jest płaszczyzną. 

Kształt czasoprzestrzeni można znaleźć umawiając 
się, że zegar spadający swobodnie w polu grawitacyj¬ 
nym wskazuje upływ czasu równy długości linii czaso¬ 
przestrzennej, którą tworzy jego ruch. Niech linie AB, 
AC i BC na rys. 4 przedstawiają swobodne spadanie 
trzech jednakowych zegarów. W czasoprzestrzeni 
Minkowskiego, znając czas AB, czas AC i prędkość, 
z jaką zegary mijają się w punkcie A, można obliczyć 
czas BC, podobnie jak w geometrii Euklidesa oblicza 
się bok z dwu pozostałych boków i kąta między nimi. 
Jeżeli czas BC okaże się różny od obliczonego w ra¬ 
mach geometrii Minkowskiego, to będzie to znaczyć, 
że obszar czasoprzestrzeni zawierający trójkąt ABC 
nie może być uważany za część czasoprzestrzeni Min¬ 
kowskiego. Przy pomocy takiej triangulacji czasoprze¬ 
strzennej można wyznaczyć dokładny kształt każdej 
części czasoprzestrzeni. 

Czy jest uzasadnione przyjąć, że swobodnie spada¬ 
jący zegar odmierza czas równy długości linii, którą 
tworzy jego ruch? Można by odpowiedzieć, że jest to 
definicja długości krzywej czasoprzestrzennej, którą 
przyjmujemy nie tłumacząc jej racjonalności; jest to 
jednak odpowiedź niesłuszna. Prawidłowa odpowiedź 
brzmi: intuicja oparta na wiedzy fizycznej i matema¬ 
tycznej każe nam przypuszczać, że czas mierzony 
przez swobodnie spadający zegar jest istotnie bardzo 
dobrą miarą długości krzywej czasoprzestrzennej. 
Samo pojęcie długości jest w ramach ogólnej teorii 
względności pojęciem podstawowym; jest nam ono 
znane przed każdym rzeczywistym pomiarem. Wyko¬ 
nując rzeczywiste pomiary nie tylko nie uzależniamy 
mierzonych długości od ich roboczych definicji, lecz 
przeciwnie — przeprowadzamy analizę i krytykę 
wyników opierając się na znajomości ogólnej teorii 
względności i innych działów fizyki jako hipotez pod¬ 
stawowych. 

Krzywizna czasoprzestrzeni nie jest dowolna, lecz 
ograniczona równaniami Einsteina. Równania te 
dopuszczają szeroki zbiór rozwiązań, a każde roz¬ 
wiązanie jest a priori dopuszczalną formą czasoprze¬ 
strzeni. Problemy, które nastręcza interpretacja roz¬ 
wiązań równań Einsteina zobrazujemy na dwu przy¬ 
kładach. 

Niech współrzędne t, x, y, z tworzą układ inercjalny 
w czasoprzestrzeni Minkowskiego. Utożsamiając 
punkty hiperpłaszczyzny z = Oz odpowiednimi punk¬ 
tami hiperpłaszczyzny z — a>0 otrzymamy czaso¬ 
przestrzeń różną od czasoprzestrzeni Minkowskiego, 
lecz spełniającą równania Einsteina tak jak sama cza¬ 
soprzestrzeń Minkowskiego. Można też utożsamić 
punkty hiperpłaszczyzny / — 0 z odpowiednimi punk¬ 
tami hiperpłaszczyzny / = b> 0; otrzymamy czaso¬ 
przestrzeń o cyklicznym czasie, tj. czasoprzestrzeń, 
w której wszystkie zdarzenia okresowo się powtarzają. 
Istnienie zamkniętych linii czasowych tak dalece 
komplikuje i tak niełatwą analizę rozwiązań równań 
Einsteina, że wielu fizyków zajmujących się tymi za¬ 
gadnieniami jest skłonnych uznać, iż rozwiązania 
z zamkniętymi liniami czasowymi są a priori niedo¬ 
puszczalne. 


Mechanika kwantowa 

Mechanika kwantowa powstała w latach 1925-2 
w wyniku długotrwałych prób znalezienia opisu zja¬ 
wisk atomowych, np. liniowego widma emisyjnego 
gazów. Próby te utrwaliły pogląd, że opis taki jest 
niemożliwy w ramach tradycyjnych pojęć. Na przy¬ 
kład teoria Bohra atomu wodoru pozwala w zasadzie 
prawidłowo opisać widmo atomu wodoru zakładając, 
że w atomie tym elektron krąży wokół protonu tak jak 
planeta wokół Słońca, lecz po niektórych tylko orbi¬ 
tach Keplera, co jest niezrozumiałą innowacją. 
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Tytuł pierwszej z prac E. Schrodingera: Kwanto¬ 
wanie jako problem wartości własnych , dobrze oddaje 
kierunek myśli autora. Od dawna, wiedziano, że rów¬ 
nania różniczkowe opisujące ruch drgający, np. rów¬ 
nanie struny, mają przy pewnych warunkach brzego¬ 
wych rozwiązania tylko dla niektórych częstości, 
zw. częstościami własnymi. Skoro atom wodoru wy¬ 
syła promieniowanie o ściśle określonych często¬ 
ściach, to widocznie atom ten wykonuje ruch drgający, 
a celem fizyki jest znalezienie równania opisującego 
ten ruch. 

Schródinger podał równanie, zwane od tego czasu 
równaniem Schrodingera, które pozwala odtworzyć 
teorię Bohra atomu wodoru w sposób matematycznie 
zrozumiały, tj. znaleźć charakterystyczne dla tego 
atomu częstości mniej więcej tak, jak znajduje się 
częstości drgającej struny. Równanie Schrodingera 
dla atomu wodoru jest równaniem różniczkowym 
funkcji falowej elektronu y < x> y * z )> gdzie współ¬ 
rzędne- t, x y y f z tworzą układ inercjalny w czasoprze- 
strzenLGalileusza. Równanie Schrodingera dla ato¬ 
mu helu, który zawiera dwa elektrony, jest równa¬ 
niem określającym funkcję falową dwu elektronów 
* 1 , yu z u y 2 , z 2 ) itd. Jądra atomowe, które są 
znacznie cięższe od elektronów, uważamy za nie¬ 
ruchome centra sił, można jednak zbudować równa¬ 
nie Shródingera uważając jądro za ruchomą część 
atomu. Jakie jest znaczenie fizyczne funkcji falowej? 
Odpowiedź na to pytanie dał M. Born; ażeby jednak 
właściwie ocenić charakter tej odpowiedzi, rozpatrzy¬ 
my proste doświadczenie, które w różnych wersjach 
było wielokrotnie wykonywane. 

Elektron pada na płytkę z dwoma małymi otworka¬ 
mi, przez które może on przejść na drugą stronę 
(rys. 5); za otworkami jest klisza fotograficzna, która 
rejestruje każdy przechodzący elektron. Doświadcze¬ 
nie daje następujące wyniki: miejsca zaczernione 
przez elektron w kolejnych doświadczeniach są różne, 
a różnicy nie da się powiązać z jakąkolwiek niejedno¬ 
litością stanów elektronu poprzedzających przejście 
przez otworki; przy wielokrotnym powtarzaniu do¬ 
świadczenia liczba śladów na kliszy układa się w ob¬ 
raz o kilku maksimach i minimach, jak przy inter¬ 
ferencji światła na dwu otworkach. 
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Rys. 5. Przejście pojedynczego elektronu przez płytkę z dwoma 
otworami 


Wydaje się, że przed teorią można by postawić dwa 
zadania: przewidzieć, w któprn miejscu na kliszy 
powstanie zaczernienie w pojedynczym doświadcze¬ 
niu ; wyjaśnić, skąd biorą się maksima i minima przy 
wielokrotnym powtarzaniu doświadczenia. 

Interpretacja Borna funkcji falowej elektronu daje 
wyczerpującą odpowiedź na drugie pytanie, lecz jed¬ 
nocześnie wyklucza danie odpowiedzi na pierwsze 


pytanie. Mianowicie liczba |y> (/, x 9 y , z) i 2 dxdydz jest 
wg Borna proporcjonalna do prawdopodobieństwa 
znalezienia elektronu w objętości dxdydz w chwili 
/, jeżeli poszukiwanie takie zostanie przedsięwzięte. 
Postępowanie teoretyczne, które wraz z interpretacją 
Borna doprowadziło do odkrycia ogromnej liczby 
nowych faktów, zobrazujemy na przykładzie opisa¬ 
nego wyżej doświadczenia. Zakładamy, że ruch elek¬ 
tronu jest opisany — cokolwiek by to znaczyło — 
funkcją falową y (/, x , y , z). Równanie Schrodingera 
dla tej funkcji rozwiązujemy przy warunkach brzego¬ 
wych odpowiadających założonej nieprzepuszczalności 
płytki, np. przyjmując, że funkcja falowa znika na 
brzegu płytki. Jest to postępowanie od dawna znane 
w fizyce teoretycznej, identyczne w istocie z postępo¬ 
waniem zastosowanym przez A. J. Fresnela w po¬ 
czątkach XIX w. w celu objaśnienia ugięcia światła. 
Wreszcie przyjmujemy, że proces oddziaływania 
elektronu z kliszą można traktować jako lokalizację 
elektronu w niewielkiej objętości i stosujemy inter¬ 
pretację Borna, by przewidzieć natężenie lokalizacji 
przy wielokrotnym powtarzaniu doświadczenia. 


Mechanika kwantowa a szczególna teoria 
względności 

Bohr i Heisenberg rozwinęli i zaostrzyli interpretację 
probabilistyczną Borna do postaci zwanej kopenhaską 
interpretacją mechaniki kwantowej. Wolimy nie 
wchodzić w szczegóły tej interpretacji, wydaje się nam 
bowiem, że interpretacja kopenhaska jest przykładem 
i wynikiem filozoficznej emfazy, której w fizyce lepiej 
unikać, o ile tylko jest to możliwe. Nie zaostrzona 
filozoficznie interpretacja Borna wystarcza w zupeł¬ 
ności do praktycznego stosowania mechaniki kwan¬ 
towej. 

Einstein — będący jednym z twórców mechaniki 
kwantowej — nigdy nie przyjął interpretacji kopen¬ 
haskiej, ponieważ przypuszczał, że interpretacja ko¬ 
penhaska może prowadzić do istnienia sygnałów 
o prędkości większej niż prędkość światła. Jak wyja¬ 
śniliśmy wcześniej, istnienie takich sygnałów nie uwa¬ 
żamy dziś za coś a priori niemożliwego lub sprzecz¬ 
nego z teorią względności; ta ostatnia jest tylko hipo¬ 
tezą o strukturze metrycznej czasoprzestrzeni i nie¬ 
wiele mówi o własnościach materii wypełniającej cza¬ 
soprzestrzeń. 

Nie wypowiadając się w sprawach niejasnych, chcie¬ 
libyśmy podkreślić jednak to, co jest jasne (przynaj¬ 
mniej dla nas). 

Spekulacje filozoficzne związane z mechaniką 
kwantową są wątpliwej wartości przede wszystkim 
ze względu na prowizoryczny charakter samej me¬ 
chaniki kwantowej. Mechanikę kwantową należy 
bowiem uzgodnić ze szczególną teorią względności. 
Jedyną współczesną teorią, która jest syntezą mecha¬ 
niki kwantowej i szczególnej teorii względności jest 
tzw. elektrodynamika kwantowa. Są trzy (co naj¬ 
mniej) powody, by uważać elektrodynamikę kwan¬ 
tową za teorię wymagającą dopracowania. Po pierw¬ 
sze, w rachunkach związanych z tą teorią pojawiają 
się wyrażenia matematycznie nieokreślone (całki 
rozbieżne); istnieje wprawdzie sposób jednoznaczne¬ 
go obliczania tych wyrażeń, lecz sam fakt jest sygna¬ 
łem trudności pojęciowych teorii. Po drugie, zasady 
mechaniki kwantowej w zastosowaniu do pola elek¬ 
tromagnetycznego prowadzą do sprzeczności z rów¬ 
naniami Maxwella, które są równaniami ruchu tego 
pola. Większość badaczy nie przywiązuje wagi do 
tego, lecz np. G. Kallen, jeden z najlepszych znawców 
elektrodynamiki kwantowej, napisał wyraźnie: „jest 
to w najlepszym wypadku brak elegancji w teorii”. 
Po trzecie, w elektrodynamice kwantowej występuje 
stała bezwymiarowa hcje z = 137,036..., gdzie h jest 
stałą Plancka, c — prędkością światła, a e —ła¬ 
dunkiem elektronu. Stała ta wg jednomyślnej opinii 
wielu fizyków powinna być obliczona teoretycznie. 
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lecz zdaje się to być niemożliwe w ramach elektrody¬ 
namiki kwantowej. 

Jasne jest także, że w ostatnich kilkunastu latach 
zmieniła się wyraźnie atmosfera intelektualna wokół 
zagadnienia podstaw mechaniki kwantowej. Atmo¬ 
sferę z końca lat trzydziestych opisuje L. Infeld, któ¬ 
remu Einstein powiedział „tu w Princeton uważają 


mnie za starego durnia”; chodziło oczywiście o opo¬ 
zycję Einsteina wobec interpretacji kopenhaskiej. 
Dziś nikt zapewne nie pomyślałby czegoś takiego. 

E.J. Dijksterhuis The Mechanization of the World Picture , 
Ojrford 1969; L. Infeld Szkice z przeszłości , Warszawa 1966; 
A. Trautman Teoria względności , Wrocław 1971; E.T. Whitta- 
ker A History of the Theories of Aether and Ełectricity , New York 
1960. 


Zasady zachowania 

Wojciech Kopczyński 


Zasady zachowania dotyczą tych wielkości * fizycz¬ 
nych, o których można powiedzieć, że nie dają się 
zniszczyć, tzn., które podczas procesów jakim pod¬ 
legają układy fizyczne izolowane od otoczenia (zwane 
też układami odosobnionymi) pozostają niezmienio¬ 
ne. Zachowanie wielkości fizycznych może przy tym 
być słuszne bezwzględnie, lub też obowiązywać jedy¬ 
nie dla niektórych procesów. Zasady zachowania 
określają warunki, których spełnienie zapewnia sta¬ 
łość tych wielkości fizycznych. Ich przegląd rozpocz¬ 
nijmy od zasad poznanych najwcześniej. 


Zasady zachowania w mechanice 
Newtona 

Pęd pojedynczej cząstki określamy jako iloczyn jej 
masy przez prędkość 


p = mv. 

Gdy na cząstkę nie działa żadna siła, to z I zasady 
dynamiki Newtona wynika, że jej pęd jest zachowany, 
zasada Pęd układu fizycznego złożonego z n cząstek jest 
zachowania sumą pędów poszczególnych cząstek. Z II zasady 
pędu Newtona wynika, że jest on stały, gdy suma sił dzia¬ 
łających na cząstki jest równa zeru: 

Pi+/> 2 + ••• +Pn = const, gdy F x -}-F 2 + ... +F n = 0. 
Załóżmy, że wszystkie siły działające w tym układzie 
są siłami wewnętrznymi, tzn. F\ = ^12 + ^13 — + 

+F lny Fz = -^ 21 +^ 23 + ... +F tn itd.., przy czym F i} 
oznacza siłę działającą na /-tą cząstkę a pochodzącą 
od cząstki /-tej. Przyjmijmy też, że siły te spełniają 

III zasadę Newtona, Fi] = — F]i. Wtedy suma wszy¬ 
stkich sił działających na cząstki będzie równa zeru, 

gdyż siła F 12 odejmie się od siły F 21 , F 13 od F 31 itd. 
Zatem, całkowity pęd układu cząstek będzie zacho¬ 
wany. 

Z zasady zachowania pędu oraz z zasady zachowa¬ 
nia masy wynika, że środek masy układu porusza się 
ruchem jednostajnym i prostoliniowym. 

Moment pędu L cząstki względem pewnego punktu 
O określa się jako iloczyn wektorowy promienia wo¬ 
dzącego cząstki r, poprowadzonego z O , przez pęd tej 
cząstki p y L — rXp. Moment pędu spełnia równanie 



gdzie M = rxF nazywa się momentem siły F wzglę¬ 
dem punktu O . Siła F jest siłą centralną, gdy istnieje 
punkt O taki, że siła ta jest w każdym punkcie rów¬ 
noległa do promienia wodzącego r poprowadzonego 
z tego punktu O . Nazywa się on centrum siły F. Mo¬ 
ment siły centralnej F względem centrum znika, a za¬ 
tem moment pędu względem tego punktu jest stały; 

L = const, gdy F|| r. 


Przedstawiona powyżej zasada zachowania mo¬ 
mentu pędu dla pojedynczego punktu materialnego 
niesie dwie informacje. Po pierwsze, wektory r i v, 
spełniające związek rxv = L/m, muszą stale pozosta¬ 
wać w płaszczyźnie przechodzącej przez centrum 
i prostopadłej do wektora JL, a zatem ruch cząstki 
powinien się odbywać w tej płaszczyźnie. Po drugie, 
prędkość połowa cząstki, wynosząca F/2w, pozostaje 


Rys. 1. Gdy moment pędu L jest 
stały, ruch jest płaski i wartość 
prędkości polowej dSJdt jest stała 
(5 — pole zakreślone przez wek¬ 
tor wodzący cząstki) 
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stała (rys. 1). II prawo Keplera oraz informacja, że tor 
planety jest krzywą płaską oznaczają właśnie, że mo¬ 
ment pędu planety w ruchu wokół Słońca spełnia zasa¬ 
dę zachowania. Zasada ta jest słuszna w przybliżeniu, 
gdy pomijamy wpływ innych ciał niebieskich na ruch 
planety. W lepszym przybliżeniu zachowany jest mo¬ 
ment pędu całego Układu Słonecznego. 

Gdy mamy układ złożony z dwóch cząstek, oddzia¬ 
ływających między sobą siłami spełniającymi III za¬ 
sadę Newtona, suma momentów sił działających na 
te cząstki wynosi 

M = r x x F x -f r 2 X F 2 = (r x — r 2 ) X F x . 

Uogólniając definicję podaną dla pojedynczej cząstki, zasada 
siłę F x nazwiemy centralną, jeśli jest ona równoległa zachowania 
do prostej łączącej cząstki. Jeśli F x jest centralna, to pęd u 
M = 0, a więc całkowity moment pędu układu, okre¬ 
ślony jako suma momentów pędu cząstek, jest za¬ 
chowany, L — L 1 Ą-L Z = const. Nietrudno uogólnić 
zasadę zachowania momentu pędu na sytuację, gdy 
układ składa się z n cząstek: 


L — ŁiĄ-L z -\- ... -f*j Cn — const, 

gdy Afi-f M t + ... +M» = 0. 

Podkreślamy, że ostatnia równość zachodzi wtedy, 
gdy siły pomiędzy każdą parą cząstek spełniają za¬ 
sadę równej akcji i reakcji oraz skierowane są wzdłuż 
prostej łączącej cząstki danej pary. 

Rozważmy pojedynczą cząstkę poruszającą się w 

niezależnym od czasu polu sił F(r). Jednym z wnio¬ 
sków z II zasady Newtona jest stwierdzenie, że przy¬ 
rost energii kinetycznej cząstki jest równy wykonanej 
nad nią pracy, tzn. 

± m ? s -±m? A -fx/7: 
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Rys. 2. Gdy pole 
sil jest potencjalne, 
to praca wzdłuż 
drogi 1 równa jest 
pracy wzdłuż drogi 
2 


Pole sił nazywamy potencjalnym, jeżeli praca wyko¬ 
nana nad cząstką przy jej przesunięciu z punktu A 
do punktu B nie zależy od wyboru toru łączącego te 
punkty (rys. 2): 

/ f Fd7. 

wzdłuż 1 wzdłuż 2 

Wtedy możemy wprowadzić pojęcie potencjału V. 

Potencjał V(/a) pola sił F(r ) w punkcie ta jest to pra¬ 
ca wykonana przy przesunięciu cząstki od tego punk¬ 
tu do pewnego dowolnie wybranego punktu r 0 , czyli 

o 

v( 7 a ) = / Fd7. 

A 


Definicja ta ma sens, dzięki założeniu o potencjal- 
ności pola F(r). Potencjał V jest wyznaczony nieje¬ 
dnoznacznie; wybierając inny punkt r 0 , dodajemy do 
potencjału stałą. Stwierdziwszy następnie, że praca 
wykonana przy przesunięciu cząstki z punktu A do B 
równa się różnicy potencjałów między tymi punktami, 

H 

f Fc/7= V(7a)-V(7b), 

A 

zasada dochodzimy do wniosku, że suma energii kinetycznej 
zachowania j potencjalnej cząstki nie zależy od punktu, w którym 
energii znajduje się cząstka, 

£ = 2 mvl A + v ( r *) = y mv B + 

a więc pozostaje stała w czasie. 

Ze sformułowanej powyżej zasady zachowania 
energii dla jednego punktu materialnego wynika, że 
prędkość punktu materialnego o ustalonej energii 
jest funkcją jego położenia. 

Pojęcie potencjału uogólnia się na dwie lub więcej 
cząstek. Jest on wówczas funkcją położeń tych czą¬ 
stek: r„ r 2 , itd. Na przykład, potencjał dwóch ładun¬ 
ków Q u Qz oddziaływających elektrostatycznie zależy 

od ich wzajemnej odległości r = |rj—r 2 j w następujący 
sposób: V = —QiQ 2 l4Tce 0 r, gdzie e 0 jest przenikal- 
nością elektryczną próżni. Prawo zachowania energii 
dla n cząstek wyraża się formułą 


» ^ 

ć = + r 2 ,... ,r n ) = const. 

i-l 

Istnieje wiele sił nie mających potencjału. Zalicza 
się do nich wszystkie siły zależne od prędkości czą¬ 
stek. Jednakże nie wszystkie siły tego typu powodu¬ 
ją niezachowanie energii. Przykład: siła Lorentza F — 
= QvxB działająca na ładunek Q poruszający się 

w polu indukcji magnetycznej B , jest prostopadła do 
kierunku ruchu cząstki, nie wykonuje więc żadnej 
pracy, a co za tym idzie, nie wpływa na zmianę energii 
cząstek. 

Występują jednak siły niepotencjalne prowadzące 
do rozpraszania energii mechanicznej. Są to przede 
wszystkim siły tarcia i oporu ośrodka. Siły te są po¬ 
chodzenia międzycząsteczkowego, a więc mają na¬ 
turę. elektromagnetyczną. A zatem, w zjawiskach, 
w których występują te siły, zasada zachowania ener¬ 
gii obowiązuje na poziomie mikroskopowym. Opór 
ośrodka powoduje zamianę energii kinetycznej ciała 
jako całości na energię kinetyczną cząsteczek lub 
na inne postacie energii wewnętrznej. Przekonanie 
o niezniszczalności energii prowadzi do sformuło¬ 
wania I zasady termodynamiki. Zawiera ona naj- 
I zasada ogólniej wyrażoną zasadę zachowania energii: ener- 
termo- gi a układu odosobnionego jest zachowana. Termody- 
dynamiki namika pozwala przy tym teoriom szczegółowym na 


dokładne określenie tego czym jest energia różnora¬ 
kich typów układów fizycznych. 

Zasady zachowania są często pomocne w rozwią¬ 
zywaniu równań ruchu. Pozwalają one zmniejszyć 
liczbę równań, a także zastąpić niektóre równania 
różniczkowe drugiego rzędu równaniami pierwszego 
rzędu. Oto dwa przykłady, w których ta rola zasad 
zachowania jest szczególnie wyraźna. Zasada zacho¬ 
wania pędu pozwala zmniejszyć liczbę równań ruchu 
o trzy — dzięki temu rozwiązywanie równań ruchu 
2 ciał sprowadza się do badania ich ruchu względne¬ 
go, a więc do rozwiązywania równań analogicznych 
do równań Newtona dla 1 ciała. Rozwiązując zagad¬ 
nienie ruchu cząstki po zadanej krzywej, możemy 
zastąpić równanie Newtona, będące równaniem róż¬ 
niczkowym drugiego rzędu, równaniem pierwszego 
rzędu, wyrażającym zasadę zachowania energii. 

Zasady zachowania mają szczególne znaczenie, 
gdy nie znamy sił działających między cząstkami, 
a także wtedy, gdy siły działają przez krótki okres, 
a zainteresowani jesteśmy zachowaniem się układu 
przed i po tym okresie; tak jest np. podczas zderzeń 
i rozpadów cząstek. Teoria tych zjawisk opiera się nie 
na równaniach ruchu, lecz wyłącznie na prawach za¬ 
chowania. Dobitnym przykładem takiego zastosowa¬ 
nia zasad zachowania jest zasada działania silnika 
odrzutowego, gdy nie wnikając w charakter oddziały¬ 
wania pomiędzy rozpalonymi gazami a ściankami ko¬ 
mory spalania, a posługując się jedynie zasadą zacho¬ 
wania pędu, potrafimy zrozumieć zjawisko odrzutu. 


Energia, pęd i masa w fizyce newtonowskiej 
i w szczególnej teorii względności 

W fizyce nierelatywistycznej, zasada zachowania ma¬ 
sy jest konsekwencją zasady zachowania pędu. Aby 
uzasadnić to stwierdzenie, rozpatrzmy rozpad spo- 



m 



Rys. 3. Rozpad cząstki o masie m wg mechaniki Newtona: 
a) w układzie, w' którym cząstka ta spoczywa, b) w układzie poru¬ 
szającym się względem poprzedniego z prędkością V 


czywającej cząstki o masie m na dwie cząstki o masach 
m l i m 2 (rys. 3). Zgodnie z zasadą zachowania pędu 


0 = «2 1 v 1 4-/n 2 v 2 . 


Rozważmy następnie ten sam proces w układzie od¬ 
niesienia poruszającym się ze stałą prędkością — V 
względem układu pierwotnego. Zasada zachowania 
pędu w tym układzie ma postać 

mV = m 1 (v l ^-V)+m 2 (v 2 Ą-V). 

Z powyższych równań wynika zasada zachowania 
masy 

m — 

W fizyce nierelatywistycznej zasady zachowania 
masy i pędu są nierozłącznie związane. W fizyce rela¬ 
tywistycznej podobny związek, oparty na einsteino- 


rola zasad 
zachowania 
w mechanice 


zasada 
zachowania 
masy nierela- 
tywi stycznej 
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wskim prawie dodawania prędkości, obowiązuje dla 
energii i pędu. Energię liczoną w jednostkach masy 
masa relaty- nazywamy masą relatywistyczną, 
wistyczna f 

nirel — 

C~ 

Wielkość ta spełnia tę samą funkcję, co masa niere- 
latywistyczna w równaniu wiążącym pęd cząstki 
z jej masą 



Masa relatywistyczna, w odróżnieniu od masy nierela- 
tywistycznej, zależy od wyboru układu odniesienia. 
Z tego powodu bliższa masie nierelatywistycznej jest 
masa spoczynkowa 

--vWW 

Z zasad zachowania energii i pędu wynika, że masa 
spoczynkowa rozpadającej się cząstki jest większa 
niż suma mas spoczynkowych cząstek, na które się 
ona rozpada, m > m x +m 2 . 

W fizyce relatywistycznej mamy o jedną zasadę 
zachowania (masy) mniej niż w fizyce newtonowskiej. 
Zasady zachowania energii i pędu są w niej nieroz¬ 
łączne, toteż często nazywa się je zasadami zachowa¬ 
nia energii-pędu. 


Zasady zachowania w klasycznej 
teorii pola 

III zasada Newtona, Fi) = —Fji, jest ściśle związana 
z zasadami zachowania pędu i momentu pędu w nie¬ 
relatywistycznej mechanice. Zasada ta wymaga, aby 

zmiany, którym podlegają siły Fi) i F)t, działające 
na oddalone od siebie cząstki, zachodziły równocze¬ 
śnie. Odrzucenie przez teorię względności koncepcji 
równoczesności niezależnej od układu odniesienia, 
pociąga za sobą rezygnację z III zasady Newtona. 
W związku z tym, suma np. pędów cząstek nie jest 
na ogół wielkością zachowaną. 

III zasada W polowym obrazie świata cząstki nie oddziałują 
Newtona na siebie bezpośrednio — na odległość. Oddziaływa- 
a teoria nie między cząstkami następuje za pośrednictwem 
względności pól fizycznych. Typowym polem fizycznym jest pole 
elektromagnetyczne opisane wektorami natężenia 

pola elektrycznego E i indukcji magnetycznej B , bę¬ 
dącymi funkcjami czasu i położenia. 

Podobnie jak cząstkom, polom fizycznym można 
przypisać energię, pęd i moment pędu. Na przykład, 
energia pola elektromagnetycznego w próżni przy¬ 
padająca na jednostkę objętości wynosi: 

C 1 - 1 - 

-v- t* e ' + - 2Z b '- 

gdzie yw 0 oznacza przenikalność magnetyczną próżni, 
natomiast jego pęd na jednostkę objętości jest opi¬ 
sany wzorem 

~p — — 

yr = e 0 FxB. 

Moment pędu przypadający na jednostkę objętości 
określamy tak jak dla cząstki. Dla układu izolowa¬ 
nego, złożonego z pola i cząstek, energia całkowita, 
będąca sumą energii cząstek i energii pola jest wiel¬ 
kością zachowaną. Podobnie się dzieje dla pędu i mo¬ 
mentu pędu. 

W elektrodynamice prawa zachowania przybierają 
formę lokalnych zasad zachowania. Lokalna zasada 
zachowania np. energii podaje, że jeśli pewna porcja 
energii pola znika z danego obszaru, to dzieje się tak 
dlatego, że wypływa ona przez granice tego obszaru. 
Z lokalnych zasad zachowania wynikają zasady za¬ 


chowania dla układów izolowanych — globalne za 
sady zachowania. Wydaję się, że lokalne sformułowa¬ 
nie zasad zachowania jest wręcz koniecznością w te¬ 
orii relatywistycznej. Energia nie może znikać w pew¬ 
nym obszarze i, zamiast wypływać przez jego granice, 
pojawiać się jednocześnie w innym miejscu, gdyż po¬ 
jęcie jednoczesności zależy w teorii względności od 
układu odniesienia. Gdyby owa jednoczesność za¬ 
chodziła w pewnym układzie odniesienia, to w ukła¬ 
dzie odniesienia poruszającym się względem niego 
energia pojawiałaby się w innej chwili, wcześniej lub 
później. A więc w tym innym układzie energia cał¬ 
kowita byłaby przez pewien czas inna niż na począt¬ 
ku i na końcu tego energetycznego hokus-pokus, co 
jest nonsensem. 

Dość niespodziewanie, teorią, w której nie można 
sformułować lokalnych zasad zachowania jest ein- 
steinowska teoria grawitacji, jakkolwiek globalne 
zasady zachowania w tej teorii obowiązują. Nie znamy 
zadowalających wyrażeń na gęstość energii i pędu pola 
grawitacyjnego, jakie istnieją np. dla pola elektro¬ 
magnetycznego. 


lokalne zasa 
dy zachowa 
nia 




Zasady zachowania a symetria 
praw fizyki 

Zasady zachowania wiążą się z symetriami teorii 
fizycznych. Związek ten dla teorii niekwantowych 
jest opisany w twierdzeniu E. Noether. 

Symetrią teorii fizycznej nazywamy to przekształ¬ 
cenie podstawowych dla niej wielkości fizycznych 
(jak położenia cząstek, pola fizyczne itp.), które prze¬ 
prowadzą rozwiązania równań tej teorii w inne ich 
rozwiązania. Uznaje się także, że teoria jest niezmien¬ 
nicza względem przekształceń będących symetriami. 
Rozważmy jednoparametrową rodzinę symetrii (ć> a ). 
Rodzinę tę nazywamy jednoparametrową grupą sy¬ 
metrii, gdy złożenie dwóch symetrii z tej rodziny S a 
i Sp jest symetrią należącą do tej rodziny odpowiada¬ 
jącą parametrowi a-}-/?: 


' <Sp *Soc Ą-fl* 

Na przykład, złożenie obrotów wokół ustalonej osi 
o kąty a i /?jest obrotem o kąt a-f-/?. 

Twierdzenie Noether głosi, że każdej jednopara- 
metrowej grupie symetrii teorii fizycznej odpowiada 
zasada zachowania. Dotyczy to m.in. zasad zachowa¬ 
nia energii, pędu i momentu pędu. Jeśli przesunięcia 
w czasie są symetriami danej teorii, to w jej ramach 
obowiązuje zasada zachowania energii. Jeśli teoria 
jest niezmiennicza względem przesunięć w przestrzeni 
w pewnym kierunku, to składowa pędu w tym kie¬ 
runku jest zachowana; zasada zachowania wektora 
pędu obowiązuje w danej teorii, jeśli przesunięcia 
w przestrzeni we wszystkich kierunkach są jej sy¬ 
metriami. Obroty wokół pewnej osi są związane przez 
twierdzenie Noether ze składową momentu pędu 
skierowaną wzdłuż tej osi; jeśli obroty wokół 
pewnego punktu są symetriami teorii, to wektor 
momentu pędu względem tego punktu jest w niej 
zachowany. 

Spróbujmy zbadać sens niezmienniczości teorii 
względem przesunięć w czasie, rozważając ruch gwiazd 
o masach m x i m 2 (znajdujących się w odległości r ) 
oddziałujących na siebie siłą grawitacyjną 

F = 

Wyniki rozważań dotyczących ruchu tych gwiazd 
nie będą zależeć od tego, czy ruch odbywał się 10 min 
lat temu, odbywa się obecnie, czy też będzie się od¬ 
bywał za milion lat. Wynika to z uniwersalnego cha¬ 
rakteru newtonowskiego prawa grawitacji. Przesu¬ 
nięcia W czasie są więc symetriami newtonowskiej 
teorii dwóch ciał niebieskich. 

To, że niemal wszystkie poważniejsze teorie fizycz¬ 
ne są niezmiennicze względem przesunięć w czasie 


twierdzenie 

Noether 
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i przestrzeni oraz obrotów, jest spowodowane z jed¬ 
nej strony wiarą, iż przekształcenia te są symetriami 
realnego świata, z drugiej zaś tym, że nie znamy 
odstępstw od praw zachowania energii, pędu i mo¬ 
mentu pędu. Nie jest natomiast prawdą, że byłoby 
niemożliwe zbudowanie teorii, która nie byłaby nie¬ 
zmiennicza względem wymienionych przekształceń. 
Przypuśćmy, że astronomowie śledzący ruch planet 
doszli do wniosku, iż stała grawitacyjna G wolno 
zmienia się w czasie. Wówczas przesunięcia w czasie 
nie byłyby symetriami mechaniki ciał niebieskich, 
a więc energia mechaniczna układu gwiazd nie 
zostałaby zachowana.. Nikt jednak nie mówiłby 
wtedy o odkryciu astronomicznego perpetuum mo¬ 
bile. Fizycy staraliby się zbudować teorię, w której G 
byłaby traktowana nie jako stała, lecz jako pewne 
pole. Niezmienniczość tej teorii względem przesunięć 
w czasie zapewniałaby zachowanie całkowitej energii 
układu, będącej sumą energii cząstek i pola grawita¬ 
cyjnego, w tym pola G. Warto nadmienić, że istnieje 
teoria pola grawitacyjnego tego typu, nie mająca 
wszakże potwierdzenia w obserwacjach astronomicz¬ 
nych. 

grupa Przesunięcia w czasie i przestrzeni oraz obroty 
Galileusza wchodzą w skład zbioru wszystkich symetrii czaso- 
i grupa przestrzeni, który w fizyce nierelątywistycznej nazywa 
Poincarśgo się grupą Galileusza, a w fizyce relatywistycznej grupą 
Poincarćgo. Do grup tych zalicza się też transforma¬ 
cje mieszające współrzędne czasowe i przestrzenne, 
noszące odpowiednio nazwy specjalnych transforma¬ 
cji Galileusza, albo specjalnych transformacji Lo¬ 
rentza. Niezmienniczość względem tych przekształ¬ 
ceń oznacza, że prawa fizyki są takie same dla dwóch 
obserwatorów, z których jeden porusza się względem 
drugiego ruchem jednostajnym i prostoliniowym. 
Symetriom tym też odpowiadają pewne zasady za¬ 
chowania, są one jednak konsekwencją zasad roz¬ 
ważanych już poprzednio. Na przykład, w fizyce 
nierelatywistycznej wynikająca stąd zasada głosi, że 
prędkość środka masy układu jest zachowana, co jak 
wiemy, jest wnioskiem wynikającym z zasady zacho¬ 
wania pędu. 

Symetriami czasoprzestrzeni są też odbicia w cza¬ 
sie i inwersje — inaczej odbicia względem wyróżnio¬ 
nego punktu. Niezmienniczość teorii względem in¬ 
wersji i obrotów łącznie jest równoważna niezmien- 
niczości względem odbić zwierciadlanych. Wynika 
to z tego, że inwersję i obrót można otrzymać jako 
złożenie odpowiednio trzech lub dwóch odbić zwier¬ 
ciadlanych, natomiast odbicie zwierciadlane można 
otrzymać jako złożenia obrotu i inwersji. Dlatego 
niezmienniczość względem inwersji nazywamy sy¬ 
metrią zwierciadlaną. 

symetria Symetria ta oznacza, że wraz z każdym procesem 
zwierciadlana dozwolonym w ramach teorii jest też możliwy proces 
będący jego zwierciadlanym odbiciem względem do¬ 
wolnej płaszczyzny. Zjawiskiem, w którym symetria 
zwierciadlana wydaje się być łamana, jest odchylenie 
igły magnetycznej umieszczonej równolegle do prze¬ 
wodnika prostoliniowego, w którym płynie prąd. 
Płaszczyzna, w której znajdują się igła i przewodnik 
przed włączeniem prądu jest z makroskopowego 
punktu widzenia płaszczyzną symetrii. Zatem fakt, 
że po włączeniu prądu płaszczyzna ta przestaje być 
płaszczyzną symetrii układu, zdaje się świadczyć 
o tym, że oddziaływanie elektromagnetyczne pomiędzy 
prądem w przewodniku a igłą magnetyczną nie jest 
niezmiennicze względem odbić zwierciadlanych. Aby 
się przekonać, że tak nie jest, należy wziąć pod uwagę 
mikroskopową budowę igły magnetycznej. Jej na¬ 
magnesowanie polega na tym, że wypadkowa momen¬ 
tów pędu elektronów jest skierowana równolegle do 
osi igły ze zwrotem od bieguna południowego do bie¬ 
guna północnego. Mikroskopowy, wirowy ruch elek¬ 
tronów i jonów powoduje, iż płaszczyzna przecho¬ 
dząca przez oś igły nie jest jej płaszczyzną symetrii. 
Odbicie zwierciadlane względem takiej płaszczyzny 
polega na zamianie miejscami biegunów igły magne¬ 


tycznej. Igła z biegunami zamienionymi miejscami 
odchyli się po włączeniu prądu w przewodniku w kie¬ 
runku przeciwnym w stosunku do igły w pierwotnym 
położeniu (rys. 4). Świadczy to o tym, że oddziaływa¬ 
nia elektromagnetyczne nie łamią symetrii zwiercia¬ 
dlanej. 




Rys. 4. Zjawiska przedstawione na rysunku są przed włączeniem 
prądu nawzajem swymi zwierciadlanymi odbiciami względem 
płaszczyzny przechodzącej przez oś igły magnetycznej i przewodnik 

Odbicia w czasie są symetriami teorii, jeśli wraz odbicia 
z każdym procesem jest możliwy w jej ramach proces w cza sie 
zachodzący w odwrotnej kolejności. Na przykład 
teoria rzutów w ziemskim polu grawitacyjnym bez 
uwzględnienia oporu powietrza jest niezmiennicza 
względem odbić w czasie (rys. 5). Powszechnie ob- 



Rys. 5. Odbicia w czasie są symetriami teorii rzutów w polu siły 
ciężkości (z pominięciem oporu powietrza). Ruchy przedstawione 

na rysunku związane są zależnością r 2 (t) = z,(—/) 

serwuje się istnienie zjawisk nieodwracalnych, jakimi 
są np. rzuty z uwzględnieniem oporu powietrza. Nie¬ 
odwracalność procesów makroskopowych wiążemy 
z dużą liczbą obiektów mikroświata biorących w nich 
udział. Procesy w mikroświecie są natomiast prawie 
zawsze odwracalne. 

Odbicia różnią się od takich symetrii czasoprze¬ 
strzeni jak przesunięcia bądź obroty tym, że nie są 
sparametryzowane wielkościami tego rodzaju co kąt 
obrotu lub wektor przesunięcia, które mogą przy¬ 
bierać wartości dowolnie małe. Ponieważ nie ma ma¬ 
łych odbić, a więc nie wchodzą one w skład jednopa- 
rametrowach grup symetrii, nie można tu zatem za¬ 
stosować twierdzenia Noether. W fizyce klasycznej 
z odbiciami nie wiążą się żadne zasady zachowania. 
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Zasady zachowania w fizyce kwantowej 

związek Związek symetrii z zasadami zachowania tkwi w sa- 
zasad mych podstawach teorii kwantowych. W fizyce kwan- 
zachowania towej stanom układu odpowiadają wektory w pew- 
z symetriami nej abstrakcyjnej przestrzeni (przestrzeni Hilberta), 
natomiast mierzalnym wielkościom fizycznym takim 
jak położenie, pęd itp. — operatory, działające na te 
wektory. Przekształcenia układu takie jak przesu¬ 
nięcia, obroty itp. są tu także reprezentowane przez 
operatory. Wśród nich ważną rolę odgrywają opera¬ 
tory przesunięcia w czasie Hu 

Niech <p oznacza pewien stan układu odosobnio¬ 
nego, natomiast S*(p — stan układu po wykonaniu 
przekształcenia S x . Przekształceniem 5, może być 
np. obrót układu o kąt a wokół osi z (rys. 6). Po upły- 
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Rys. 6. Przemienność operatorów obrotu S* wokół osi z z ope¬ 
ratorami ewolucji (5« Ht Hi S<x ) oznacza, że z-owa składowa 
momentu pędu J t jest zachowana 


wie czasu t stany te przejdą odpowiednio w stany 
Ht<p i HtS a <p . Jeśli S x jest symetrią, to ten ostatni stan 
można także otrzymać w wyniku działania Ó^na Ht<p, 
a zatem H t S z <p — S* Ht <p. Równość ta powinna za¬ 
chodzić dla wszystkich wektorów <p, a więc warunek 
na to, aby przekształcenie 5* było symetrią, możemy 
zapisać następująco: 

HtSa = SaHu 


Operatory reprezentujące przekształcenia układów 
kwantowych nie odpowiadają na ogół żadnym mie¬ 
rzalnym wielkościom fizycznym (wyjątkiem jest tu 
operator inwersji). Natomiast z każdą jednopara- 
metrową grupą przekształceń (S 3 ) jest ściśle związany 
operator S reprezentujący mierzalną wielkość fizycz¬ 
ną. Operator ten jest proporcjonalny do granicy wy¬ 
rażenia (Sd~ l)/a przy a dążącym do 0. Na przykład, 
z obrotami wokół osi z jest związany operator z-owej 
składowej momentu pędu J Zy a z przesunięciami w 
czasie H t — operator energii H , zwany też operato¬ 
rem Hamiltona itd. Warunek przemienności 

HS = SH, 

V- 
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oznacza, że wielkość fizyczna odpowiadająca ope¬ 
ratorowi S jest zachowana. 

W fizyce kwantowej wiele wielkości fizycznych może 
przybierać ściśle określone, skwantow f ane wartości. 
Do wielkości tych należy przede wszystkim energia 
i moment pędu, przy czym kwantyzacja energii doty¬ 
czy tylko układów związanych, takich jak atomy i czą¬ 
steczki, natomiast kwantyzacja momentu pędu ma 
znaczenie uniwersalne. 

Moment pędu J pojedynczej cząstki jest w mecha¬ 
nice kwantowej sumą orbitalnego momentu pędu 

L — rxp i spinu S : 

7= Z+7 

Długość wektora spinu |S| nie zależy przy tym ani od 
stanu ruchu cząstki, ani od wyboru układu odnie¬ 
sienia. Wielkość ta, podobnie jak masa, charaktery¬ 
zuje samą cząstkę. 

Dopuszczalnymi wartościami długości momentu 
pędu dowolnego układu są 

1^1 = gdzie j = O, 1 /*. 1, 3 /a. 2 ,... 

Podobna reguła kwantyzacji dotyczy spinu i orbital¬ 
nego momentu pędu, z tą różnicą, że liczba kwantowa 
orbitalnego momentu pędu może przybierać tylko 
wartości całkowite. Jeśli długość wektora momentu 

pędu \ J\ jest zadana, to rzut wektora J na wybraną oś 

— np. oś z — może przybierać wartości 

J z = hm, gdzie m = — /, — 7 + 1 ,1,/. 

Liczba kwantowa j całkowitego momentu pędu i licz¬ 
ba kwantowa m jego rzutu na oś z w pełni charakte¬ 
ryzują moment pędu układu — układ kwantowy nie 
może mieć jednocześnie określonych wartości rzutów 
wektora momentu pędu na dwie różne osie, np. J x 
i Jz. 

Duże znaczenie w interpretacji kwantowej zasady 
zachowania momentu pędu ma kwantowe prawo 
dodawania momentów pędu. W fizyce klasycznej 

moment pędu układu złożonego / jest sumą momen¬ 
tów pędu jego podukładów / = / l +/ 2 . W fizyce 
kwantowej prawo to dotyczy operatorów momentu 
pędu. Liczba kwantowa m jest addytywna, m ~ 

— natomiast liczba kwantowa j może przy¬ 
bierać następujące wartości: 

j = IA—Al, IA—M+l, -. ,A+Jf 

Regufa ta dotyczy także dodawania orbitalnego mo- 
mentu pędu i spinu. 

Klasyczna zasada zachowania orbitalnego momen¬ 
tu pędu L została w fizyce kwantowej uogólniona na 
zasadę zachowania całkowitego momentu pędu /. 

Właśnie dzięki uwzględnieniu spinu 5, zasada za¬ 
chowania momentu pędu pozostaje słuszna. Rozpa¬ 
trzmy jeden z wniosków płynący z kwantowej wersji 
tej zasady. Ponieważ liczba kwantowa orbitalnego 
momentu pędu jest całkowita, z reguły dodawania 
momentów pędu wynika, że j jest liczbą połówkową 
wtedy i tylko wtedy, gdy układ zawiera nieparzystą 
liczbę cząstek o spinie połówkowym, zwanych fer¬ 
mionami. Zatem, gdy mamy układ izolowany zło¬ 
żony z samych bozonów, tj. cząstek o spinie całkowi¬ 
tym, fermiony mogą się w nim pojawiać wyłącznie 
parami. Z tego samego powodu mogą one ginąć 
(przekształcać się w bozony) tylko parami. 


Parzystość 

W fizyce kwantowej operatorowi inwersji Podpowia¬ 
da wielkość fizyczna — parzystość. Dwukrotne pod¬ 
danie układu fizycznego inwersji daje układ wyjścio¬ 
wy, a zatem P 2 = 1. Wynika z tego, że parzystość 
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wartości układów fizycznych może przybierać tylko dwie war- 
parzystości tości: +1 lub — 1. Parzystość jest wielkością multi- 
plikatywną, gdyż parzystość układu złożonego z nie 
oddziałujących między sobą podukładów jest iloczy¬ 
nem parzystości podukładów. Właściwość ta w istotny 
sposób odróżnia parzystość od addytywnych wielkości 
zachowanych, takich jak energia lub ładunek elek¬ 
tryczny. Określoną parzystość mogą mieć tylko te 
układy, które zawierają parzystą liczbę fermionów — 
pojedynczy fermion nie ma określonej parzystości. 



Rys. 7. Próbka kobaltu umieszczona w silnym jednorodnym polu 
magnetycznym w temperaturze bliskiej 0 K emituje prawie wszy¬ 
stkie elektrony na jedną stronę płaszczyzny P 

W przyrodzie, jak się okazuje, występują takie pro¬ 
cesy, w których symetria zwierciadlana jest łamana, 
a w konsekwencji parzystość nie jest zachowana. 
Należy do nich rozpad p. Łamanie symetrii zwiercia¬ 
dlanej w rozpadzie fi jest widoczne w doświadczeniu 
pani C.S.Wu, którego koncepcja jest przedstawiona 
na rys. 7. W środku przewodnika kołowego umiesz¬ 
czono próbkę radioaktywnego kobaltu. Jądra kobaltu 
nie są początkowo w żaden sposób uporządkowane, 
toteż elektrony P są emitowane równomiernie we 
wszystkich kierunkach. Dopiero pole magnetyczne 
wytworzone przez prąd elektryczny płynący w koło- 
doświadcze- wym przewodniku ustawia momenty pędów jąder 
nie Wu kobaltu, tak jak małe igły magnetyczne — prosto¬ 
padle do płaszczyzny 9, w której znajduje się prze¬ 
wodnik. Na podstawie rys. 4 nietrudno zauważyć, 
że odbicie zwierciadlane igły magnetycznej względem 
płaszczyzny prostopadłej do osi igły i przechodzącej 
przez jej środek pozostawia bieguny na swoich miej¬ 
scach — jest więc ono symetrią igły magnetycznej. 
Zatem po uporządkowaniu jąder kobaltu przez pole 
magnetyczne, 9 pozostaje płaszczyzną symetrii ca¬ 
łego układu. To, że elektrony powstałe w wyniku 
rozpadu p są emitowane nierównomiernie na obie 
strony płaszczyzny 9, łamiąc w ten sposób zwiercia¬ 
dlaną symetrię układu względem 9, dowodzi, iż od¬ 
działywania słabe wywołujące rozpad p nie są nie¬ 
zmiennicze względem inwersji. 

Próbą obrony uniwersalności symetrii zwierciadla¬ 
nej jest hipoteza, że geometryczną operację inwersji 
P należy składać z operacją sprzężenia cząstka-anty- 
cząstka C, aby otrzymać „fizyczną” inwersję CP, 
która byłaby symetrią wszystkich oddziaływań, w tym 
oddziaływań słabych. „Fizycznym” zwierciadlanym 
odbiciem układu przedstawionego na rys. 7 byłby 
wtedy układ, w którym kobalt byłby zastąpiony an- 
tykobaltem, natomiast elektrony płynące w prze¬ 
wodniku — pozytonami. Emisja pozytonów, po¬ 
wstałych w wyniku rozpadu antykobaltu w kierunku 
przeciwnym niż zaznaczony na rysunku kierunek emi¬ 
sji elektronów świadczyłaby o tym, że CP jest sy¬ 
metrią oddziaływań słabych. 


Przekształcenia C i CP mają właściwości analo¬ 
giczne do właściwości inwersji P, toteż odpowiada¬ 
jące im wielkości fizyczne, noszące odpowiednio na¬ 
zwy parzystości ładunkowej i parzystości kombino¬ 
wanej, mają właściwości analogiczne do właściwości 
parzystości zwykłej. Liczne doświadczenia przez długi 
czas potwierdzały, iż CP jest uniwersalną symetrią 
przyrody, a więc, że parzystość kombinowana jest 
bezwzględnie zachowana. Ponieważ parzystość nie 
jest zachowana w oddziaływaniach słabych, oznacza 
to, że w oddziaływaniach tych nie jest też zachowana 
parzystość ładunkowa. Analiza rozpadu mezonów K 
doprowadziła jednak do stwierdzenia, że również 
parzystość kombinowana nie jest, co prawda nie-, 
znacznie, zachowana w oddziaływaniach słabych. 


Wielkości zaohowane typu ładunku 
elektrycznego 

Zasada zachowania ładunku elektrycznego jest naj¬ 
wcześniej poznaną zasadą zachowania nie związaną 
z symetriami czasoprzestrzeni. Zasada ta, inaczej niż 
zasady omawiane poprzednio, powstała nie dzięki 
rozważaniom teoretycznym, lecz została stwierdzona 
doświadczalnie. Ładunek elektryczny jest wielkością 
addytywną; jego cechą charakterystyczną jest ziarni¬ 
stość— występuje on zawsze w ilościach będących 
całkowitą wielokrotnością ładunku elementarnego. 

Zasada zachowania ładunku jest związana, za po¬ 
mocą twierdzenia Noether, z transformacjami cecho¬ 
wania. W klasycznej teorii pola cząstki określonego 
rodzaju (np. elektrony) opisujemy za pomocą pola 

Vi = V>i(*, Ot ich antycząstki zaś (np. pozytony) za 

pomocą pola y> 2 — rp 2 (x y t). Pole yr = (yf u y 2 ) opi¬ 
sujące układ złożony z cząstek i ich antycząstek mo¬ 
żemy sobie wyobrazić jako punkt na płaszczyźnie 
(rys. 8); pola rp Xy y 2 są przy tym odłożone na osiach 



Rys. 8. Transformacja cechowania 


prostopadłych. Transformacją cechowania (pierw¬ 
szego rodzaju) nazywa się obrót o pewien kąt a wo¬ 
kół punktu przecięcia tych osi. Niezmienniczość teorii 
względem wszystkich transformacji cechowania za¬ 
pewnia zachowanie ładunku elektrycznego. W teorii 
kwantowej, operator ładunku elektrycznego jest zwią¬ 
zany z operatorami cechowania — obrotu w płasz¬ 
czyźnie par cząstka-antycząstka— w podobny spo¬ 
sób jak operator J z z obrotami w płaszczyźnie pro¬ 
stopadłej do osi r. Wynika z tego, że skwantowanie 
ładunku elektrycznego jest analogiczne do skwanto- 
wania z-owej składowej momentu pędu. Zatem, po¬ 
wiązanie zachowania ładunku elektrycznego z trans¬ 
formacjami cechowania, tłumaczy jego ziarnistość. 

Niezmienniczość względem transformacji cecho¬ 
wania zależnych od punktu czasoprzestrzeni, a = 

= <x(x> /), zwanych transformacjami cechowania dru¬ 
giego rodzaju, jest możliwa tylko wtedy, gdy uwzględni 
się oddziaływanie pola y z polem elektromagnetycz¬ 
nym. Przy tym charakter tego oddziaływania, jak 
i niektóre właściwości pola elektromagnetycznego — 
np. prawo indukcji Faradaya — są jej konsekwencją. 
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Liczbę barionową B różną od zera przypisujemy 
tym cząstkom elementarnym, które są fermionami 
i oddziaływają silnie. Przy czym cząstki o liczbie ba- 
rionowej +1, zwane barionami, są związane proce¬ 
sami rozpadu ze swym najlżejszym reprezentantem — 
protonem. Antybariony mają liczbę barionową — 1. 
Liczba barionowa jest wielkością addytywną. Liczba 
barionowa atomów, będąca sumą liczby protonów 
i neutronów zawartych w ich jądrach, pokrywa się 
zachowanie z ich liczbą masową. Zasada zachowania liczby ba- 
liczby rionowej jest zatem uogólnieniem zasady zachowania 
barionowej liczby masowej, obowiązującej w reakcjach chemicz¬ 
nych. Liczne obserwacje i doświadczenia doprowa¬ 
dziły do przekonania, że liczba barionowa jest wiel¬ 
kością zachowaną bezwzględnie. Przemawiają za tym 
przede wszystkim dwa następujące fakty: po pierw¬ 
sze, nie zaobserwowano nigdy żadnego z ciężkich 
barionów — neutronu, hiperonów A°, Ż7 + , 

y lub rezonansów barionowych — który nie 
rozpadłby się w końcu na proton (albo związany 
w jądrze neutron) i cząstki lżejsze mające liczbę ba¬ 
rionową 0. Po drugie, ze względu na obfitość pro¬ 
tonów, rozpad protonu byłby zjawiskiem nietrudnym 
do zauważenia, tymczasem zjawiska takiego nigdy 
nie zaobserwowano. 

Fermiony, które nie biorą udziału w oddziaływa¬ 
niach silnych, nazywa się leptonami lub antylepto- 
nami. Liczbę leptonową L = +1 mają leptony: 
elektron neutrino elektronowe v e , mion 
i neutrino mionowe v u . Ich antycząstki mają liczbę 
zachowanie leptonową L-— 1. Liczba leptonową jest wielko- 
ficzby ścią addytywną. Zasada zachowania liczby leptono- 
Isptonowej wej jest wynikiem analizy reakcji z udziałem lepto¬ 
nów i antyleptonów. Jak wiadomo, fermiony mogą 
powstawać i znikać wyłącznie parami. Z zasad za¬ 
chowania liczby barionowej i liczby leptonowej wy¬ 
nika, że pary te muszą składać się z barionu i anty- 
barionu, albo z leptonu i antyleptonu. 

Wspólnymi cechami liczby barionowej, liczby lep¬ 
tonowej i ładunku elektrycznego są: addytywność, 
ziarnistość oraz zmiana znaku przy zastąpieniu czą¬ 
stki antycząstką. Dlatego zasady zachowania liczby 
barionowej i leptonowej są, podobnie jak zasada za¬ 
chowania ładunku, związane z transformacjami ce¬ 
chowania. Nie można ich jednak wiązać z transfor¬ 
macjami cechowania drugiego rodzaju, gdyż liczby 
barionowa i leptonową, w odróżnieniu od ładunku 
elektrycznego, nie są bezpośrednimi źródłami pól 
o właściwościach analogicznych do właściwości pola 
elektromagnetycznego. 


Zachowanie izospinu 

Przeglądając tabelę cząstek elementarnych (str. 84), 
widzimy że mezony i bariony, a więc cząstki od¬ 
działywające silnie, tworzą grupy o bliskich sobie 
masach i jednakowych spinach. Grupy te noszą naz¬ 
wę multipletów izospinowych. Multiplet izospinowy 
tworzy np. grupa pionów: n~> k° i ; inny przykład 
to multiplet nukleonów, złożony z protonu p i neu¬ 
tronu n. Liczne dane doświadczalne świadczą o tym, 
że oddziaływania silne cząstek należących do jednego 
multipletu są jednakowe. Uzasadnia to formalne 
traktowanie tych cząstek jako jednej cząstki mogącej 
znajdować się w różnych stanach. Stany te numeruje¬ 
my liczbą 7 3 , przybierającą 27+1 wartości (27+1 
jest więc liczbą cząstek w multiplecie), 7 3 = —7, 
—7+1,...,/, dbając przy tym o to, aby najmniejsza 
wartość 7 3 odpowiadała cząstce o najmniejszym ła¬ 
dunku. Tak określone liczby kwantowe 7 i 7 3 mają 
właściwości analogiczne do liczb kwantowych całko¬ 
witego spinu i jego trzeciej składowej. Z tego powodu 
nazywa się je odpowiednio izospinem i trzecią skła¬ 
dową izospinu. 

Okazuje się, że analogia pomiędzy izospinem a spi- 
izospin a spin nem jest bliższa. Jeśli bowiem umówimy się, aby 
obliczać 7 i 7 3 dla układów cząstek zgodnie z kwanto- 
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wym prawem dodawania momentów pędu, to izo¬ 
spin i jego trzecia składowa będą zachowane w reak¬ 
cjach wywoływanych przez oddziaływania silne. Izo¬ 
spin jest zachowany wyłącznie w tych reakcjach, to¬ 
też cząstkom nie oddziaływającym silnie nie przypi¬ 
suje się żadnej wartości izospinu. Zasadę zachowania 
izospinu tłumaczymy niezmienniczością teorii silnych 
oddziaływań względem obrotów w abstrakcyjnej, 
trójwymiarowej przestrzeni, zwanej przestrzenią izo- 
spinową. 


Znaczenie zasad zachowania w fizyce 
cząstek elementarnych 

Zasady zachowania liczby barionowej, liczby lepto- wykorzysta- 
nowej i izospinu powstały w wyniku analizy reakcji ni© zasad 
pomiędzy cząstkami elementarnymi, jako usankcjono- zachowania 
wanie występowania jednych a niewystępowania 
innych reakcji. Zasady te wraz z zasadami poznany¬ 
mi wcześniej wprowadziły pewien porządek w licz¬ 
nej rodzinie cząstek elementarnych. Pozwoliły one 
m.in. sklasyfikować cząstki wg posiadanych przez 
nie liczb kwantowych. Zasady zachowania zawierają 
też przepis na określanie liczb kwantowych cząstek 
nowo odkrywanych. Przypuśćmy np., że chcemy okre¬ 
ślić liczby kwantowe rezonansu >4(1815), który ulega 
tzw. rozpadowi szybkiemu 

A{m5)-*p+K~. 

Znając liczbę barionową, ładunek i izospin protonu: 

B = 1, Q = e, 7 = 1 / 2 , I z = — V* oraz mezonu K~ : 

B = 0, Q = —e, I = 1 / 2 , 7 3 = — 1 / 2 , bez trudu do¬ 
chodzimy do wniosku, że >4(1815) ma B — 1, <2 = 0, 

I z = 0. Izospin tego rezonansu, który powinien być 
zachowany w tym procesie wywołanym przez od¬ 
działywania silne, mógłby przybierać wartości 7=0 
lub 7=1. Gdyby / = 1, rezonans ten musiałby mieć 
dwóch towarzyszy o bliskich masach, czego jednak 
nie zaobserwowano; a zatem 7=0. Masę tego re¬ 
zonansu 1815 MeV można wyznaczyć, mierząc 
energię i pędy protonu i mezonu K~, a następnie sto¬ 
sując zasadę zachowania energii-pędu. Wyznaczenie 
spinu wymaga subtelniejszych metod. 

Związane z zasadami zachowania symetrie praw symetria a 
fizyki prowadzą często do wniosków wykraczających zasady zacho- 
poza same zasady zachowania. Nie wszystkie zresztą wania 


Zasada zachowania i symetrie w zależności od typu 
oddziaływania 


Wielkość 

fizyczna 


Czy zasada zachowania 
obowiązuje w oddziały¬ 
waniach 

Symetria 

silnych? 

elektro- 

magne- 

tycz- 

nych? 

sła¬ 

bych? 

Energia 

przesunięcie 
w czasie 

tak 

tak 

tak 

Pęd 

przesunięcia 
w przestrzeni 

tak 

tak 

tak 

Moment pędu 

obroty 

tak 

tak 

tak 

Ładunek 

elektryczny 

transformacje 

cechowania 

tak 

tak 

tak 

Liczba barionowa 

transformacje 

cechowania 

tak 

tak 

tak 

Liczba leptonową 

transformacje 

cechowania 

tak 

tak 

tak 

Parzystość 

inwersja 

tak 

tak 

nie 

Parzystość 

ładunkowa 

sprzężenie 

cząstka-anty- 

cząstka 

tak 

tak 

nie 

Parzystość 

kombinowana 

inwersja 

kombinowana 

tak 

tak 

tak 

3-cia składowa 
izospinu 

obroty wokół 
3-ciej osi w 
przestrzeni izo¬ 
spinu 

tak 

tak 

nie 

Izospin 

obroty w prze¬ 
strzeni izospinu 

tak 

nie 

nie 


_ 



















zasady symetrie są związane z zasadami zachowania. Na 
zachowania przykład niezmienniczości względem odbicia w cza- 
a oddziały- sie T, zapewniającej odwracalność zjawisk na po- 
wania ziemie mikroskopowym, nie odpowiada żadna za¬ 
sada zachowania. To samo dotyczy złożenia inwersji 
kombinowanej i odbicia w czasie CPT. Wykazano 
teoretycznie, że symetria CPT powinna obowiązy¬ 
wać w każdej teorii relatywistycznej. Symetria ta 
prowadzi do wielu sprawdzanych doświadczalnie 
wniosków, m.in. zapewnia ona równość mas cząstki 
i antycząstki. 

Jest wiele zasad zachowania, które obowiązują nie 
przy wszystkich, a tylko przy niektórych oddziały¬ 
waniach. Najwięcej wielkości jest zachowanych w od¬ 
działywaniach silnych, nieco mniej w elektromagne¬ 
tycznych, najmniej w słabych (tabela). A więc, im 


oddziaływanie jest słabsze, tym mniej zasad zacho¬ 
wania obowiązuje w wywoływanych przez nie zjawi¬ 
skach. Nie jest jeszcze znane zadowalające wytłuma¬ 
czenie tej prawidłowości. Nie wiadomo także, czy 
dotyczy ona najsłabszego z oddziaływań, mianowicie 
grawitacyjnego, gdyż nie zaobserwowano żadnych 
reakcji między cząstkami elementarnymi, których by 
ono było przyczyną. 

Badania teoretyczne wskazują jednak na to, że 
w bardzo silnych polach grawitacyjnych, w pobliżu 
czarnych dziur, są możliwe procesy kreacji cząstek 
łamiące zasady zachowania liczby barionowej i liczby 
leptonowej. 

G. Białkowski. R. Sosnowsxi Cząstki elementarne. War¬ 
szawa 1971 ; W. Rubinowicz, W. Królikowski Mechanika teo¬ 
retyczna , Warszawa 1980. 


Termodynamika fenomenologiczna 

Stanis/aw Piasecki 


Przedmiotem badan termodynamiki są właściwości 
układów makroskopowych rozpatrywane z punktu 
widzenia ich zależności od temperatury. Ten olbrzymi 
dział fizyki rozwinął się początkowo jako teoria fe¬ 
nomenologiczna, nie uwzględniająca atomowej (mi¬ 
kroskopowej) struktury materii. Zasady termodyna¬ 
miki fenomenologicznej, sformułowane w XIX w., 
przetrwały po dzień dzisiejszy. Stanowią one uogól¬ 
nienie wyników niezliczonych obserwacji zachowania 
układ s ję makroskopowych ilości materii. Za typowy układ 
makrosko- makroskopowy można przyjąć 1 mol określonej sub- 
powy stancji. Zawiera on niewyobrażalnie wielką liczbę od¬ 
powiednich składników mikroskopowych (np. dla 
wody — cząsteczek H 2 0, dla gazu elektronowego — 
elektronów), równą liczbie atomów tworzących 
0,012 kg węgla 12 C. Liczba ta, zwana liczbą Avo- 
gadra, wynosi Na — (6,022 1 69 ± 0,000040) • 10 23 
mol -1 . W zależności od struktury układu rolę skład¬ 
ników mikroskopowych mogą odgrywać cząstki ele¬ 
mentarne, atomy, cząsteczki, jony itp. W opisie ter¬ 
modynamicznym tak ogromnych zbiorowisk oddzia¬ 
łujących mikrocząstek uwzględnia się jedynie te wła¬ 
ściwości, które dają się zaobserwować na poziomie 
makroskopowym. Charakteryzują je parametry ma¬ 
kroskopowe, takie jak objętość, ciśnienie, tempera¬ 
tura. Powiązaniem tych wielkości ze strukturą mi¬ 
kroskopową materii zajmuje się termodynamika 
statystyczna (-► Termodynamika statystyczna). Należy 
podkreślić, że pojęcia oraz prawa termodynamiki fe¬ 
nomenologicznej tworzą spójną całość, dostateczną 
do rozwiązania wielu praktycznych problemów. Ten 
klasyczny dział fizyki nadal się żywo rozwija, obej¬ 
mując swym zakresem coraz więcej zjawisk. Na przy- 
termodyna- kład współcześnie są podejmowane próby zastoso- 
mika czarnej wania pojęć termodynamicznych do opisu właści- 
dziury wości czarnych dziur (—► Czarne dziury i grawitacyjne 
zapadanie). Odkryto bowiem niezmiernie interesujące 
właściwości brzegu czarnej dziury, zwanego horyzon¬ 
tem zdarzeń. Okazuje się, że w procesach pochłania¬ 
nia materii lub promieniowania pole powierzchni ho¬ 
ryzontu zdarzeń zawsze rośnie. Nasunęło to myśl 
o możliwości interpretowania go jako entropii czarnej 
dziury (analogia z II zasadą termodynamiki). Aby tę 
tezę rozwinąć, należało jednak najpierw zbadać, czy 
jest możliwe występowanie stanów równowagi ter¬ 
modynamicznej czarnej dziury z otoczeniem (entropię 
definiuje się w termodynamice dla stanów równo¬ 
wagi). Problem ten okazał się trudny, gdyż zgodnie 
z prawami fizyki klasycznej czarna dziura może je¬ 
dynie pochłaniać promieniowanie, jest zaś niezdolna 
do wysyłania go, co wyklucza równowagę z otocze¬ 
niem. Możliwość emisji cząstek przez czarne dziury 
została jednak udowodniona przez S.W. Hawkinga 
na podstawie praw mechaniki kwantowej. W ten 


sposób zostały stworzone podstawy do rozwoju dal¬ 
szych badań nad możliwością termodynamicznego 
opisu tych niezwykłych układów. 

Innym przykładem dynamicznie rozwijającego się teoria prze- 
działu termodynamiki jest teoria przemian fazowych, mian fazo 
Dotyczy ona wielu rozmaitych zjawisk, takich jak wych 
nadciekłość, nadprzewodnictwo, zmiany stanu sku¬ 
pienia, zmiany struktury krystalicznej, przejście od 
stanu paramagnetycznego do ferro- lub antyferro¬ 
magnetycznego i wielu innych (-► Przejścia fazowe 
i zjawiska krytyczne). Wszystkie one zależą w sposób 
istotny od temperatury i stanowią naturalny przed¬ 
miot badań termodynamiki. 

Stwierdzono doświadczalnie, że układy makrosko- stan równo- 
powe izolowane od wpływu otoczenia osiągają po wagi termo- 
dostatecznie długim czasie szczególnie proste stany, dynamicznej 
w pełni scharakteryzowane przez wartości niewielkie¬ 
go zespołu parametrów makroskopowych. Stany te, 
w razie braku jakichkolwiel systematycznych zmian, 
nazywa się stanami równowagi termodynamicznej. 

W opisie ich szczególną rolę odgrywa odpowiadająca 
im energia układu. Energię zgromadzoną w układzie 
będącym w stanie równowagi nazywa się w termody¬ 
namice energią wewnętrzną i oznacza przez U. Po¬ 
nieważ sens fizyczny mają jedynie różnice energii, 
określa się ją przyjmując, że w wybranym stanie 
U — 0. Energia wewnętrzna jest parametrem eksten¬ 
sywnym. Oznacza to, że np. w układzie złożonym 
z dwu podukładów makroskopowych o energiach U x 
i U z całkowita energia wewnętrzna wynosi U = 

= l/i -f V a. Wzór ten jest ścisły, gdy nie ma oddzia¬ 
ływania między podukładami. Stanowi on jednak 
również bardzo dobre przybliżenie przy oddziaływa¬ 
niach krótkozasięgowych. Energia oddziaływania jest 
wówczas efektem powierzchniowym, który dla do¬ 
statecznie dużych (makroskopowych) podukładów 
jest pomijalny. Przykładami parametrów ekstensyw¬ 
nych są również objętość układu V i liczby moli N u 
N 2 ,"-Nr tworzących go składników. Jakkolwiek ter¬ 
modynamika stosuje się do układów o złożonych 
właściwościach mechanicznych, elektromagnetycznych 
i cieplnych, jej istotny sens można wyjaśnić, rozpa- prosty układ 
trując tzw. proste układy termodynamiczne. Z de- termody- 
finicji ich stany równowagi są całkowicie określone Rasniczny 

przez wartości zespołu parametrów (l/, V, N X . N r ). 

Przykładem fizycznym prostego układu jednoskład¬ 
nikowego może być wypełniona N molami gazu 
szlachetnego objętość V . Stany równowagi takiego 
układu można przedstawiać za pomocą punktów 
o współrzędnych (17, V y N) w trójwymiarowej prze¬ 
strzeni parametrów stanu. 

Stan równowagi termodynamicznej ustala się 
zawsze w określonych warunkach zewnętrznych. Od¬ 
działywanie układu z otoczeniem charakteryzuje się 
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kontakt 
termodyna¬ 
miczny 
układu z oto¬ 
czeniem 


przez wprowadzenie pojęcia odpowiednich ścianek. 
Ściankę, która wyklucza jakąkolwiek formę oddzia¬ 
ływania układu z otoczeniem, nazywamy izolującą. 
Układ izolowany jest oczywiście daleko posuniętą 
idealizacją. Łatwiej uzyskać osłonięcie nie dopusz¬ 
czające do wymiany cząstek z otoczeniem, wówczas 
układ nazywamy zamkniętym. Z kolei układ otwarty 
to taki, który może wymieniać cząstki z otoczeniem. 
Osłonięciu ściankami adiabatycznymi towarzyszy 
ograniczenie wpływu otoczenia na układ do możli¬ 
wości wykonania nad nim pracy mechanicznej. Ich 
bardzo dobrą przybliżoną realizacją są ścianki naczy¬ 
nia Dewara, np. w postaci dwu posrebrzanych płytek 
szklanych przedzielonych obszarem wysokiej próżni 
(rys. 1, 2). Z doświadczeń wiadomo, że poza przepły¬ 
wem cząstek i wykonaniem pracy mechanicznej wy¬ 
stępują jeszcze inne formy oddziaływania powodu¬ 
jące wymianę energii między układami i zmianę ich 


- próżnia 


posrebrzone 
- powierzchnie 
wewnętrzne 


ciecz izolowana 
— termicznie 
od otoczenia 


Rys. 1. Naczynie Dewara używane do 
pracy w niskich temperaturach. Na¬ 
czynia takie (nazwa pochodzi od naz¬ 
wiska J. Dewara, który pierwszy skro¬ 
plił wodór w 1898 r.) są podobne do 
termosów, izolują termicznie od oto¬ 
czenia zawarty w nich płyn. Mogą być 
wykonane ze szkła, albo metalu, np. 
stali nierdzewnej. Izolację stanowi 
próżnia panująca wewnątrz podwójnej 
ścianki. W szklanych naczyniach De¬ 
wara zwykle pokrywa się wewnętrzne 
powierzchnie ścianek odbijającą war¬ 
stwą srebra, aby zmniejszyć straty 
ciepła na promieniowanie 



- do pompy 


otoczenie (295 K) 
ciekty azot (77 K) 


ciekły hel 

(4,2K przy 10 5 Pa) 


próbka ochłodzona 
do niskiej 
temperatury 


Rys. 2. Podwójne naczynie Dewara uży¬ 
wane do pracy w temperaturze rzędu 1 K. 
Wewnętrzne naczynie Dewara, wypełnio¬ 
ne ciekłym helem, jest zanurzone — w celu 
zmniejszenia strat ciepła — w drugim na¬ 
czyniu Dewara, wypełnionym ciekłym 
azotem 


I zasada ter- 


parametrów stanu. Określa się je mianem oddziały¬ 
wania termicznego. Ścianki dopuszczające jedynie 
kontakt termiczny z otoczeniem nazywają się ścian¬ 
kami diatermicznymi. 

I zasada termodynamiki jest formułowana zazwy- 
modynaitiiki czaj jako zasada zachowania energii dla układów 
osłoniętych adiabatycznie. Jej treść stanowi stwier¬ 
dzenie, że praca nad układem osłoniętym adiabatycz¬ 
nie wykonana w procesie przejścia od początkowego 
stanu równowagi A do stanu końcowego B jest cał¬ 
kowicie określona przez te stany, niezależnie od 
przebiegu procesu. Oznaczając tę pracę symbolem 
^ad ( A > 5 ) możemy napisać, że 

W &a (A,B) = U(B)-U(A), 

przy czym z prawej strony występuje różnica między 
energią stanu końcowego i początkowego. Jeżeli pro¬ 
ces nie przebiega adiabatycznie, to zasada zachowa¬ 
nia energii dla układów zamkniętych przybiera po¬ 
stać * r 

U(B)— U(A) = W(A,B)+Q(A,B\ 

gdzie Q(A y B) przedstawia zmianę energii związaną 
z kontaktem termicznym układu z otoczeniem. Wiel¬ 
kość Q{A,B), zwana ciepłem przekazanym układowi 
w procesie przejścia ze stanu A do B, jest więc tego 
samego typu wielkością co praca mechaniczna. Mie¬ 
rzy się ją w dżulach. Zarówno praca jak i ciepło za¬ 
leżą nie tylko od stanów A i B ale również od kon¬ 
kretnej realizacji procesu powodującego zmianę 
stanu układu. Różnią się tym zasadniczo od energii 
wewnętrznej będącej funkcją stanu. 

Fakt, że jedynie część procesów zgodnych z zasa¬ 


dą zachowania energii zachodzi w rzeczywistości, 
ujmuje precyzyjnie II zasada termodynamiki. Stwier- 
dza.ona, że dla każdego układu termodynamicznego 
istnieje funkcja stanu S, zwana entropią, o następu¬ 
jących właściwościach: 

— S jest wielkością ekstensywną, 

— w procesach zachodzących w układach izolowa¬ 
nych entropia nigdy nie maleje. 

Jeśli więc układ izolowany przechodzi ze stanu A do 
B 9 to S(B)^S(A). W nierówności tej, wyrażającej 
prawo wzrostu entropii, jest zawarta informacja o nie¬ 
odwracalnym charakterze procesów przebiegających 
w warunkach izolacji od otoczenia (procesy samo¬ 
rzutne). W szczególności wynika z niej, że spośród 
wszystkich możliwych wartości entropii w obecności 
ścianek wewnętrznych — stanowi równowagi bez 
ścianek odpowiada wartość maksymalna (usunięcie 
ścianki powoduje ewentualnie samorzutny proces pro¬ 
wadzący do wzrostu entropii). Znajomość zależności 
entropii od parametrów ekstensywnych charaktery¬ 
zujących stany równowagi oznacza pełną informację 
o właściwościach termodynamicznych układu. 

Na przykład dla prostego jednoskładnikowego 
układu termodynamicznego (zwanego płynem pro¬ 
stym) entropia jest funkcją trzech parametrów S = 
*7 S(U,V>N). Związek tego typu nazywa się równa¬ 
niem podstawowym. Dla rzeczywistych układów fi¬ 
zycznych entropia jest funkcją rosnącą energii we¬ 
wnętrznej. Można więc rozpatrywać równoważne rów¬ 
nanie postaci U — U(S y V y N). Przy niewielkich zmia- 
nach dS , dV,, dN parametrów S y V y N zmiana energii 
wewnętrznej dU jest określona przez różniczkę dU = 
= (eU/dS)v,N dS + ( du/dV) s ,n dv + (dU/dN)s vdN. 
Wielkości T= (eU/dS)v t N, -p = (dU/dV) s , Ny p = 
= (dUjdN) s ,v nazywane są parametrami intensyw¬ 
nymi układu. Charakteryzują one układ lokalnie i nie 
zależą od jego rozmiarów, przy czym T nazywamy 
temperaturą termodynamiczną, p — ciśnieniem, p — 
potencjałem chemicznym. Z definicji pochodnej czą¬ 
stkowej potencjał chemiczny obliczamy ze wzoru 


P = lirn^-o [U(S, V y N+dN)- U(S, V y N)} /dN. 


Określa on szybkość wzrostu energii wewnętrznej 
przy wzroście liczby cząstek układu (entropia i obję¬ 
tość pozostają ustalone). Podobnie ciśnienie mierzy 
stosunek zmian energii do zmian objętości (przy usta¬ 
lonej entropii i liczbie cząstek), temperatura zaś 
określa szybkość wzrostu energii przy wzroście 
entropii, gdy stała jest liczba cząstek i objętość. 
Znaczenie fizyczne parametrów T y p i p można zrozu¬ 
mieć lepiej na podstawie II zasady termodynamiki. 
Wiąże się ono bezpośrednio z warunkami równowagi 
układu. 

Rozważmy np. płyn prosty z izolującą ścianką, 
rozdzielającą go na dwa podukładly o liczbach moli 
N i> ^ 2 , objętościach V ly V 2 i energiach U ly U z . Za¬ 
stąpienie ścianki izolującej ścianką diatermiczną 
wprowadzi podukłady w kontakt termiczny (rys. 3). 
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Rys. 3. W układzie izolowanym złożonym z dwu podukładów 
rozdzielonych ścianką izolującą (stan A) po zastąpieniu tej ścianki 
ścianką diatermiczną zachodzi nieodwracalny proces przepływu 
energii w postaci ciepła od podukładu cieplejszego do zimniej¬ 
szego. Końcowy podział energii między podukłady odpowiada 
równości ich temperatur termodynamicznych (stan B ) 






































Zgodnie z zasadą wzrostu entropii, w wyniku prze¬ 
pływu ciepła ustali się taki podział energii między 
podukłady, któremu odpowiada wartość maksymalna 
entropii całkowitej przy ustalonych parametrach N u 
N 2 , V u V 2 oraz U = Ut+ U 2 . Ze wzoru na róż¬ 
niczkę energii wewnętrznej wynika, że przy ustalonej 
objętości i liczbie cząstek różniczki entropii podukła- 
dów mają postać: 

dSy\v\, Nx = dUJTu dS 2 \V2,Nz = dUJTz. 

Ponieważ energia całkowita jest również stała, więc 
zmiany energii podukładów muszą się wzajemnie 
kompensować, tzn. 

dU = dU x +dU % = 0. 


Dla entropii całkowitej, będącej sumą entropii pod¬ 
układów, znajdujemy zatem 

J(5 1 +AS' 2 )|ri,iVi,F2,^2 ł t;-i;i+i;2 — dUJT^i—dU^/Tz. 


stanu (rys. 4). Dzięki stałości entropii proces może 
przebiegać w dowolnym kierunku (odwracalność). 

Rozważmy przykładowo prosty układ termodyna¬ 
miczny w kontakcie termicznym i mechanicznym 
z otoczeniem o temperaturze T 0 i ciśnieniu p 0 . W pro¬ 
cesie odwracalnym ciśnienie p i temperatura T tego 
układu spełniają warunki równowagi p = p 0 , T =T 0 . 
Zgodnie z prawami mechaniki praca elementarna 
związana ze zmianą objętości wynosi dW = — p 0 dV — 
= —pdV. Symbol d został tu użyty w celu podkreśle¬ 
nia, że dW nie jest różniczką funkcji stanu. Praca 
związana ze zmianą stanu układu jest bowiem zależna 
nie tylko od stanów początkowego i końcowego, ale 
i od sposobu realizacji procesu. Ponieważ dN = 0 
(liczba cząstek jest stała), więc dU — TdS—pdV , 
a uwzględniając I zasadę termodynamiki otrzymuje¬ 
my dQ+dW = TdS—pdV. Zatem w procesach 
odwracalnych ciepło dQ przekazane przez otoczenie 
do układu jest dane wzorem 


Warunkiem koniecznym osiągania przez entropię 
wartości maksymalnej jest znikanie jej różniczki. 
Równowaga termiczna pociąga więc za sobą równość 
(\fTx- \/T 2 )dU 1 = 0, oznaczającą równość tempe¬ 
ratur termodynamicznych T x = T 2 . W procesie sa¬ 
morzutnego wyrównywania się temperatur energia 
w postaci ciepła przepływa od ciała o wyższej tem¬ 
peraturze (cieplejszego) do ciała o niższej tempera¬ 
turze (zimniejszego), np. przy małych różnicach tem¬ 
peratur, zgodnie z uzyskanym wzorem, zmiana 
entropii wynosi dS = (l/Ti— 1/TJdU^ Ponieważ 
dS>0, więc jeśli T x >T Zt to dU x < 0 (ciało cieplejsze 
traci energię). Definicja termodynamiczna jest zatem 
zgodna z intuicyjnym pojęciem temperatury. W po¬ 
dobny sposób stwierdzamy, że dwa układy, między 
którymi jest możliwy przepływ cząstek, mogą pozo¬ 
stawać w równowadze jedynie wówczas, gdy ich po¬ 
tencjały chemiczne są równe p x = p z . Jeżeli T x — T 2 , 
zaś materia przepływa z obszaru o potencjale 

p t do obszaru o potencjale p 2 . W różniczce dU wy¬ 
stępuje też znany z mechaniki parametr intensywny — 
ciśnienie p. Zasada wzrostu entropii prowadzi do 
wniosku, że warunkiem równowagi mechanicznej 
płynu jest stałość ciśnienia w całej objętości V. 
procesy n zasada termodynamiki wprowadza doniosłe roz- 
odwracalne różnienie między procesami odwracalnymi i nieod- 
nieodwra- wracał nymi. Procesy odwracalne w układach izolo- 
calne wanych to takie, w których układ przechodzi przez 


dQ = TdS. 

Jest to podstawowy związek wiążący zmiany entropii 
z energią wymienianą z otoczeniem przez kontakt 
termiczny. Kwazistatyczne dostarczenie ciepła do 
układu przy stałej objętości powoduje zmianę tempe¬ 
ratury zgodnie ze wzorem (< dQ)v = ( TdS)v = 
= T(3SldT)vdT . Współczynnik CV = T(dS/dT)v na¬ 
zywamy pojemnością cieplną, cv = CvjN zaś molo¬ 
wym ciepłem właściwym przy stałej objętości. Po¬ 
dobnie określa się ciepło właściwe przy stałym ciś¬ 
nieniu c p = T{cSjdT) p . Jeżeli proces jest cykliczny, 

ri 


t 2 


s, s 2 s 

Rys. 5. Cykl Carnota na płaszczyźnie (T, S ) 




Rys. 4. Proces odwracalny w układzie izolowanym. Kwazista- 
tyczna zmiana parametrów ekstensywnych (X u podukła¬ 

dów powoduje przejście złożonego z nich układu izolowanego 
przez kontinuum stanów równowagi tworzących krzywą na 
powierzchni stałej entropii 

ciąg stanów równowagi przy stałej entropii całkowi¬ 
tej. Jest to idealizacja, którą jedynie w przybliżeniu 
można realizować doświadczalnie. Proces odwracalny 
musi mieć kwazistatyczny przebieg, tzn. na każdym 
jego etapie poszczególne makroskopowe części układu 
pozostają ze sobą w równowadze. W opisie takiego 
procesu nie trzeba brać pod uwagę czasu, wystarcza 
podanie kontinuum stanów równowagi, reprezento¬ 
wanego przez krzywą w przestrzeni parametrów 


to stan początkowy pokrywa się ze stanem końco¬ 
wym — wówczas całkowita zmiana entropii AS — 
= j dQ/T = 0, przy czym całka jest obliczana wzdłuż 
krzywej zamkniętej, reprezentującej proces w prze¬ 
strzeni parametrów stanu. Zastosujmy ten wzór do 
cyklu Carnota (rys. 5), w którym układ podlega ko¬ 
lejno przemianie izotermicznej przy temperaturze T x 
od stanu A do B, ochłodzeniu adiabatycznemu do 
stanu C o temperaturze T t < T u przemianie izoter¬ 
micznej do stanu D, po czym wraca na drodze adia¬ 
batycznej do wyjściowego stanu A. Wykorzystując 
fakt, że odwracalny proces adiabatyczny zachodzi 
bez zmiany entropii, otrzymujemy związek 

AS = Q(A, B)ITt+Q(C,D)IT 2 = 0, 

w którym Q(A,B\ Q(C,D) oznaczają ciepło przeka¬ 
zane układowi w procesach izotermicznych. Wynika 
z niego, że ciepło Q{AJB) i ciepło Q(C,D ) są zawsze 
przeciwnego znaku. Ponieważ zmiana energii we¬ 
wnętrznej w cyklu wynosi zero, więc praca wykonana 
przez układ jest równa [0(/4,l?)-f-(KC,Z>)]. J e J sto " 
sunek do ciepła pobranego określa sprawność cyklu r\. 
Zakładając, że Q{A,B)> 0, otrzymujemy *7 = 0 - 
— TJTt). Pomiar sprawności odwracalnego cyklu 
Carnota oznacza więc pomiar stosunku temperatur 
termodynamicznych, odpowiadających procesom izo- 
termicznym. Wynik nie zależy od układu, który pod¬ 
lega przemianie cykłicznej. 


pojemność 

cieplna 


cykl 

Carnota 
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bezwzględna Przypisując określonemu stanowi fizycznemu pewną 
skala tempe- wartość temperatury, określamy tym samym skalę 
ratur Ke£vina temperatur. Powszechnie stosowana bezwzględna 
skala Kelvina przypisuje punktowi potrójnemu wody 
(stan, w którym współistnieją w równowadze lód, 
woda i para wodna) temperaturę 273,16 K. Jednostka 
tej skali jest zwana kelwinem (oznaczenie K). Iloczyn 
TS ma wymiar energii. Wprowadzając stałą Boltz- 
manna k = (1,380622±0,000059)-lO^JK” 1 , okre¬ 
ślającą stosunek dźula do kelwina, możemy więc entro¬ 
pię dowolnego układu zapisać w postaci S = Ś-k y 
gdzie S jest wielkością bezwymiarową. 

Iloczyn k -N A = R = (8,31434±0,00035)JK-hnol” 1 
jest zwany stałą gazową. Pojawia się on np. w rów¬ 
naniach stanu jednoatomowego gazu doskonałego: 
U = 3NRTj2, pV — 2U/3 = NRT. Doświadczalnie 
stwierdzono, że związki te stanowią bardzo dobre 
przybliżenie dla realnych gazów jednoatomowych 
w obszarze wysokich temperatur i małych gęstości. 


ramiona manometru rtęciowego 


Rys. 6. Schemat termometru 
gazowego o stałej objętości, 
i Gaz wypełnia zbiornik będą¬ 
cy w kontakcie termicznym ze 
środowiskiem o mierzonej 
temperaturze T. Menisk rtęci 
w ramieniu A manometru do¬ 
prowadza się do poziomu 
wskaźnika, tak aby mierzyć 
ciśnienie p zawsze tej samej 
objętości gazu termometrycz- 
nego (hel, azot lub wodór). 
Wartość p znajduje się z po¬ 
miaru różnicy poziomów 
rtęci h przy uwzględnieniu 
ciśnienia atmosferycznego. 
Znając ciśnienie p 0 odpowia¬ 
dające znanej temperaturze 
T 0 = 273,16 K punktu po¬ 
trójnego wody możemy ob¬ 
liczyć wartość T ze wzoru 
T = T 0 (p/ Po ). Dokładne po¬ 
miary wymagają uwzględ¬ 
nienia odchyleń własności 
gazu termometrycznego od 
własności gazu doskonałego, 
zmian objętości zbiornika itp. 

Wykorzystuje się je do pomiaru temperatury bez¬ 
względnej (termodynamicznej) za pomocą termome¬ 
trów gazowych (rys. 6). Odpowiadający im wzór na 
różnicę entropii między stanami B i A można zna¬ 
leźć następująco: przy małych zmianach energii 
i objętości (przy ustalonej liczbie moli) zmiana entro¬ 
pii ma postać dS = dU/T+pdV/T y jest to wynik 
przekształcenia wzoru na różniczkę energii wewnętrz¬ 
nej; zatem w rozważanym przykładzie 

3 dU dV 

dS = ~2 NR ' ~TT +NR '~~v~ = 

= A7J</|yhil/+lnKj = NRd(\aVU^). 

Przy przejściu ze stanu A do B przyrost entropii wy¬ 
nosi więc 

S(B)—S(A) = NR\n {[U(B)jU(A)f\ V(B)I V(A)]}. 

zagadnienie Z II zasady termodynamiki wynika wniosek o du- 
pracy żym znaczeniu praktycznym: w procesie przejścia ze 
maksymalnej stanu A do B układ wykonuje maksymalną pracę 
(JPma *A,B) wówczas, gdy proces jest odwracalny. 
W tym wypadku zmianę entropii układu AS = S(B)— 
—S(A) kompensuje zmiana entropii otoczenia (—AS). 
Natomiast gdy proces jest nieodwracalny, przyrost 
entropii układu jest taki sam, przyrost entropii oto¬ 
czenia zaś jest większy (zasada wzrostu entropii). 
Ponieważ zmiana energii układu jest w obu wypad¬ 
kach taka sama, równa [U(B) — U(A)] y więc większa 
entropia końcowa otoczenia oznacza, iż więcej 


termometr 

gazowy 



wpłynęło do niego energii z układu w postaci ciepła, 
czyli że układ wykonał mniejszą pracę. Praca jest 
więc maksymalna, gdy proces jest odwracalny. 
W szczególności maksymalna sprawność cyklu jest 
osiągana przy jego odwracalnym przebiegu, toteż 
dla cyklu Carnota nie może ona przekroczyć wartości 
(1 —7V7i). Wiążą się z tym wprost dawne sformuło¬ 
wania II zasady termodynamiki stwierdzające niemoż¬ 
liwość zachodzenia procesów, których jedynym rezul¬ 
tatem byłoby przekazanie ciepła od ciała zimniejszego 
do cieplejszego (sformułowanie Clausiusa) lub całko¬ 
wite zamienienie na pracę ciepła pobranego z układu 
o stałej temperaturze (sformułowanie Kelvina). 

Jeśli otoczenie zachowuje w trakcie procesu stałą 
temperaturę T 0 (nazywa się je wówczas termostatem) 
i stałe ciśnienie p 0 , to otrzymujemy prosty wzór na 
pracę maksymalną W m3 . x (A y B) = T<>AS-AU y obo¬ 
wiązuje on dla układów zamkniętych (AN = 0). 
Wielkość (T 0 AS—AU—p 0 AV) jest to maksymalna 
praca użyteczna (z pominięciem pracy objętościowej 
p 0 AV). Postać tego wyrażenia pozwala w ciekawy 
sposób sformułować warunki stabilności stanów 
równowagi. Fizyczna treść tych warunków sprowadza 
się do stwierdzenia, że zaburzenie stanu równowagi 
wymaga wykonania pracy nad układem, co wyraża 
nierówność (T 0 AS—AU—p 0 AV)< 0. Wynikają stąd 
podstawowe zasady ekstremalne termodynamiki. 
Przy stałych S, V i N z odchyleniem od stanu równo¬ 
wagi układu wiąże się wzrost energii AU > 0. Energia 
wewnętrzna osiąga więc w tych warunkach minimum 
w stanie równowagi. Zasada minimum energii we¬ 
wnętrznej (przy ustalonej entropii) jest równoważna 
zasadzie maksimum entropii (przy ustalonej energii). 
Z kolei, porównując stany układu o tej samej tempe¬ 
raturze T = T 0 oraz V i N stwierdzamy, że odchy¬ 
leniu od stanu równowagi odpowiada nierówność 
A(U— TS) > 0. Zatem w stanie równowagi minimum 
osiąga potencjał Helmholtza (energia swobodna) 
F = U— TS. Podobnie przy stałych T y /?, N obowią¬ 
zuje zasada minimum dla potencjału Gibbsa (entalpia 
swobodna) G = U—TS+pV y zaś przy stałych p, V y N 
dla entalpii H = U+pV. Posługując się którąkolwiek 
z powyższych zasad minimum, można wyznaczyć 
wszystkie własności równowagowe układu termody¬ 
namicznego. Funkcje U , F y G y H nazywa się w związku 
z tym potencjałami termodynamicznymi (analogia 
z potencjałem w mechanice). Wszystkie wymienione 
zasady ekstremalne są zawarte w podstawowej nie¬ 
równości (AU— ToAS+p 0 AV) > 0. Gdy układ jest 
w równowadze, jego temperatura T i ciśnienie p 
przyjmują wartości odpowiednich parametrów oto¬ 
czenia T = T 0y p = Pq. Zatem dla małych odchyleń 
entropii i objętości od wartości równowagowych 
jest spełniony wzór 

AU- TAS+pAV= (^) 2 + 

Z prawej strony występuje tu różniczka drugiego 
rzędu energii wewnętrznej obliczona dla odchyleń 
AS i AV, różniczka pierwszego rzędu (TAS—pAV) 
znosi się z wyrazem (— TAS+pAV). Przy ustalonej 
objętości warunek (AU—TAS+pAV) > 0 prowadzi 
więc do nierówności (d z U/dS 2 )v n > 0. Ponieważ 
(dU!8S)v,N = r, więc (d z U}dS*)v n = (dT/dS)v n = 

« nnes/dDy^r 1 = t/c v . 

Stan równowagi jest zatem stabilny, gdy ciepło wła¬ 
ściwe przy stałej objętości jest dodatnie cv > 0, 
(cv = Cv/N). W podobny sposób można wykazać, że 
warunkiem stabilności mechanicznej jest dodatnia war¬ 
tość ściśliwości izotermicznej Kt = — (dY/Bp^Y* 1 > 
> 0. Reakcją układu na izotermiczny wzrost ciśnienia 
jest zmniejszenie objętości. W zakresie wartości para¬ 
metrów stanu, w którym warunki stabilności nie 
mogą być spełnione, układ nie może występować w 
postaci fazy jednorodnej. Wniosek ten potwierdza do- 
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dla potencja* 
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świadczenie. Równania stanu postaci T = T(U, V, N), 
p — p{U, K, N ), p = V , N ), podobnie jak wy¬ 

nikające z nich równanie p = p{T,V y N ), muszą być 
zgodne z warunkami stabilności. Rozważmy przykła¬ 
dowo równanie stanu van der Waalsa 

(p+aW/Y 2 ) ( V- bN ) = NRT, 

Wynika z niego, iż małej izotermicznej zmianie ciś¬ 
nienia dp\T towarzyszy zmiana objętości zgod¬ 
nie ze wzorem 

dplr = d(NRT(V - WV)~ ł - tf/W 2 )jr = 

= (-A^R7 , (K-óN)- 2 4-^ 2 K- 3 ).^Ffr. 



Rys. 7. Izotermy van der Waalsa. Do wyznaczenia punktów A 
i D izoterm poniżej temperatury krytycznej 7* i do otrzymania 
krzywej współistnienia stosuje się konstrukcję równych pól 
Maxwella (pole ABE >= pole ECD). Wprowadza się przy tym 
część płaską izoterm (odcinek AD), której punkty reprezentują 
stabilne stany równowagi, odpowiadające współistnieniu pary 
i cieczy. Oryginalne izotermy van der Waalsa zawierają części 
o ujemnej ściśliwości izotermicznej (odcinek BC), co narusza 
warunek stabilności mechanicznej 


Ściśliwość izotermiczna zatem ma postać 
Kt = -1 ]V(dVldp) T = 

= [NVRT(V-bN)’ 2 -2aN 2 V~ 2 ]- 1 = 

= [nRT(\-bn~ 2 )-2an 2 ]-\ 

gdzie n = NI V jest gęstością molową gazu. Nierów¬ 
ność Kt > 0 jest tu równoważna warunkowi RT > 
> 2an{\—bń) 2 . Maksymalna wartość funkcji/(«) = 
= 2an{\ — bti ) 2 w przedziale l/ó > n > 0 (zakres zmien¬ 
ności gęstości gazu) wynosi 8#/27ó. Jest ona osiągana 
w punkcie n — l/3ó, toteż dla dostatecznie niskich 
temperatur {RT < Sa/27b ), izotermy zawierają części 
o Kt < 0 (naruszenie warunku stabilności mechanicz¬ 
nej, rys. 7). Interpretacja tego obszaru, jako odpo¬ 
wiadającego współistnieniu cieczy i pary (układ nie¬ 
jednorodny), stanowi podstawę teorii Maxwella-van 
der Waalsa przejścia fazowego gaz-ciecz. 
równowaga Jeżeli układ r-składnikowy jest niejednorodny 
układów i rozpada się na a faz, równowaga termodynamiczna, 
wielofazo- poza stałością temperatury i ciśnienia w całym ukła- 
wych dzie wymaga dla każdego składnika równości jego 
potencjałów chemicznych we wszystkich fazach 

Ą = - = /Ą = /*!> J =l,...,r. 

Po uwzględnieniu tych związków okazuje się, że liczba 
termodynamicznych stopni swobody (liczba para¬ 
metrów intensywnych mogących się zmieniać nie¬ 
zależnie) wynosi / = r+2—a. Ponieważ 0, więc 
w stanie równowagi może współistnieć co najwyżej 
(r+2) faz (reguła faz Gibbsa). Dla układu jedno¬ 
składnikowego liczba ta wynosi 3 (rys. 8). Fakt, iż 
wówczas / = 0, oznacza, że stan taki występuje przy 
ściśle określonych wartościach parametrów intensyw¬ 
nych. Znajdujemy je rozwiązując równania pKpyT) = 
= p 2 {p y T) = p?(p,T), gdzie p\ p z oznaczają po¬ 


tencjały chemiczne trzech współistniejących faz. Uzy- punkty 
skujemy w ten sposób tzw. punkty potrójne danej potrójne 
substancji. Współistnieniu jedynie dwu faz odpowiada 
krzywa ^{p.T) = p 2 (p y T). Zbiór krzywych współ¬ 
istnienia na płaszczyźnie ( p,T ) tworzy wykres fazowy, 
który, w zależności od właściwości danej substancji, 
może mieć bardzo różny przebieg. Niezwykła jest np. 
jego postać dla helu, mogącego występować w stanie 
ciekłym w dowolnie niskich temperaturach. Nie 
pojawia się tu bowiem w ogóle punkt potrójny faz 
gazowej, ciekłej i stałej (rys. 9), natomiast ciekły hel 
4 He dla temperatur T < 2,172 K podlega przejściu 
fazowemu do stanu nadciekłego (-> Nadpłynność). 



Rys. 8. Schematyczny wykres' fazowy wody 


10° Pa 



Rys. 9. Wykres fazowy helu 3 He 


wykresy 

fazowe 



Rys. 10. Przebieg izoterm i adiabat w niskich temperaturach. 
Izoterma T = 0 pokrywa się z adiabatąS = 0. Zatem żaden proces 
adiabatyczny, rozpoczęty przy temperaturze T > 0, nie może 
doprowadzić do stanu o T — 0 
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III zasada Podstawowe właściwości układów makroskopo- 
termodyna- wych w niskich temperaturach ujmuje III zasada 
miki termodynamiki. W sformułowaniu Plancka stwier¬ 
dza ona, że w stanach równowagi o zerowej tempera¬ 
turze termodynamicznej wartość entropii wynosi zero 
(rys. 10). Wynika stąd, że zmiana entropii w dowol¬ 
nym procesie izotermicznym dąży do zera, jeżeli 
temperatura, przy której proces przebiega, dąży do 
zera (twierdzenie Nemsta). III zasada pozwala jedno¬ 
znacznie przypisać stanom równowagi układu okre¬ 
ślone wartości entropii (II zasada wyznacza entropię 
z dokładnością do stałej addytywnej). Wynika też 
z niej dążenie do zera w granicy T-+0 ciepła wła¬ 
ściwego cv i c p , współczynnika rozszerzalności 
termicznej a = (dV/dT) p V~ x oraz współczynnika 
temperaturowego ciśnienia ( dp/dT)v . Wyjaśnienie 
tych faktów i w ogóle zjawisk występujących w niskich 
temperaturach, wymaga zastosowania teorii kwanto¬ 
wej. Interpretację fizyczną III zasady termodynamiki 
uzyskuje się na gruncie kwantowej fizyki statystycznej 
(”*■ Termodynamika statystyczna). 

termodyna- Omówione trzy zasady termodynamiki są uniwer- 
nisczny opis salnym narzędziem do badania właściwości układów 
procesów makroskopowych w stanie równowagi. Wynika też 
nieodwracal- z nich wiele istotnych wniosków na temat procesów 
nych termodynamicznych. Tak więc II zasada orzeka, iż 
są możliwe wyłącznie te procesy, które są zgodne 
z zasadą wzrostu entropii. W wypadku wyidealizo¬ 
wanych, kwazistatycznie przebiegających procesów 
odwracalnych stany pośrednie można uznać za stany 
równowagi, można więc je przedstawić w przestrzeni 
parametrów stanu (rys. 4). Zasady termodynamiki nie 
wystarczają jednak do opisu przebiegu rzeczywistych 
procesów nieodwracalnych. Dlatego zbudowana na 
ich podstawie teoria jest często nazywana termosta- 
tyką (nie występuje w niej w ogóle czas). Ażeby móc 
badać ewolucję w czasie stanu układu, rozważa się 
procesy, w czasie trwania których o każdej dosta¬ 
tecznie małej (ale makroskopowej) części układu 
można założyć, że jest w równowadze. Wtedy pa¬ 
rametry intensywne, takie jak temperatura, ciśnienie 
czy potencjał chemiczny, mają w różnych częściach 
układu na ogół różne wartości, podlegające zmianom 
w czasie. Lokalnie, w określonej chwili czasu, para¬ 
metry te wiążą się ze sobą przez równowagowe rów¬ 


nania stanu. Okazuje się, że tego rodzaju założenie 
o lokalnej równowadze doskonale stosuje się do 
różnorodnych zjawisk (jest ono np. istotnym elemen¬ 
tem hydrodynamiki). Określenie zmian w czasie 
lokalnych wartości parametrów makroskopowych 
wymaga sformułowania nowych praw. Jako przykład 
rozważymy tu proces przewodnictwa cieplnego przewód 
w układzie, ktorego różne części mają w chwili po- nictwo 
czątkowej różne temperatury. ZII zasady termodyna- cieplne 
miki wynika, że przepływ energii wewnętrznej z ob¬ 
szarów o wyższej temperaturze do obszarów o niższej 
temperaturze doprowadzi układ do stanu równowagi 
który charakteryzuje się stałą temperaturą w całej 
objętości układu. „Siłą termodynamiczną” powodu¬ 
ją przepływ energii (przewodnictwo cieplne) jest 
więc niejednorodność rozkładu temperatury. W punk¬ 
cie r w chwili / miarą tej niejednorodności jest wektor 
grad T(r* t) = (dT/dx t dT/dy, dTjdz). Wektor ten 
znika, gdy temperatura nie zależy od r. Przepływ 
energii w układzie można scharakteryzować za po¬ 
mocą gęstości strumienia energii Jest to wek¬ 

tor, którego długość określa ilość energii przepły¬ 
wająca w jednostce czasu przez jednostkową powierz¬ 
chnię do niego prostopadłą. Doświadczalnie stwier¬ 
dzono, że w procesach przewodnictwa cieplnego 
w ciałach izotropowych (przewodzących tak samo we 
wszystkich kierunkach) gęstość strumienia energii 
jest^ proporcjonalna do gradientu temperatury 

/a(r, i) — —X grad T(r, t). Współczynnik X jest zwany 
współczynnikiem przewodnictwa cieplnego, a prawo 
powyższe — prawem Fouriera. Jest ono przykładem 
liniowych praw fenomenologicznych, ustalających 
liniowe związki między gęstościami strumieni róż¬ 
nych wielkości fizycznych a odpowiednimi siłami 
termodynamicznymi. Powiązanie tych praw z pra¬ 
wami zachowania (energii, pędu, ładunku elektrycz¬ 
nego itp.) oraz z założeniem o lokalnej równowadze 
pozwala uzyskać pełny opis ewolucji w czasie 
stanu układu podlegającego procesowi nieodwracal¬ 
nemu. 

Sz. Szczeniowski, Fizyka doświadczalna cz. U. Ciepło i fizyka 
cząsteczkowa , Warszawa 1976; J. Werle, Termodynamika feno¬ 
menologiczna, Warszawa 1957; K. Zalewski, Wykłady z termo¬ 
dynamiki fenomenologicznej i statystycznej , Warszawa 1976. 


Termodynamika statyczna 

Jerzy Czerwonko 


Termodynamika statystyczna jest działem termody¬ 
namiki, który uzupełnia i uzasadnia termodynamikę 
fenomenologiczną. Na czym polega to uzupełnienie? 
Po pierwsze, na możliwości otrzymania, na podstawie 
założeń o budowie ciał, ich równania stanu, np. rów¬ 
nania stanu gazu doskonałego, które do termodyna¬ 
miki fenomenologicznej wchodziło jako prawo empi¬ 
ryczne. Po drugie, na wprowadzeniu fluktuacji, tj. 
odchyleń wielkości fizycznych od ich wartości śred¬ 
nich, rozpatrywanych w termodynamice fenomenolo¬ 
gicznej. Skoncentrujemy się tu raczej na omówieniu 
termodynamiki statystycznej stanów równowagi, 
ze względu na to, że jej podstawy teoretyczne tworzą 
logiczną całość oraz fakt, że stanowi ona punkt wyjścia 
dla termodynamiki procesów nieodwracalnych. Na- 
uzasadnienie tomiast uzasadnieniem termodynamiki statystycznej 
termodyna- są prawa dynamiczne opisujące ruch cząstek, a więc 
miki staty- równania Newtona lub równania Schródingera dla 
stycznej układów niekwantowych bądź kwantowych przy 
rezygnacji z dokładnego opisu układu fizycznego. 

Aby zrozumieć o co chodzi w ostatnim zdaniu, 
zwróćmy uwagę, że termodynamika zajmuje się z re¬ 
guły układami makroskopowymi, zawierającymi 
bardzo wiele atomów. Interesujemy się przy tym nie¬ 
widoma parametrami charakteryzującymi układ, tj. 
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takimi, które mają sens makroskopowy jak: objętość, 
energia, ciśmenie, polaryzacja dielektryczna, nie zaś 
położeniami czy prędkościami poszczególnych ato¬ 
mów. Dlatego też istnieje bardzo wiele układów fizycz¬ 
nych o tej samej strukturze, istotnie różnych w opisie 
mikroskopowym, tj. o różnych rozkładach położeń 
i prędkości cząstek, ale identycznych makroskopowo 
(rys. 1 i 2). 



powierzchni 


Pozwala to na wprowadzenie ważnego pojęcia ze- zespól 
społu statystycznego, który jest zbiorem wszystkich statystyczny 
układów o identycznej budowie i identycznej wartości 
określonych parametrów makroskopowych. Para¬ 
metry te i ich wartości służą jakby za szyld zespołu 
statystycznego, możemy mówić np. o zespole sta¬ 
tystycznym 1 mola neonu (liczba atomów równa 

















liczbie Avogadra) znajdującym się w objętości 10 1. 
Ponieważ określony stan makroskopowy odpowiada 
wielu stanom mikroskopowym, więc sensowne staje 





Rys. 2. Dwa różne uk¬ 
łady 11 cząstek nic od¬ 
działujących ze sobą, 
o tej samej energii całko¬ 
witej. Poziomy energety¬ 
czne mają energie od 0 
do 9 jednostek, energia 
całkowita wynosi 41 jed¬ 
nostek. Liczba kółek na 
poziomach odpowiada 
liczbie cząstek o danej 
energii 


pomiar 

wielkości 

makrosko¬ 

powych 


wartość 
średnia 
w zespole 
statystycz¬ 
nym układów 
kwantowych 


się pytanie o prawdopodobieństwo występowania 
określonego stanu mikroskopowego w danym stanie 
makroskopowym. Do kwestii tej powrócimy jeszcze 
przy omawianiu konkretnych przykładów. 

Zobaczmy teraz, jak wygląda pomiar wielkości 
makroskopowych w warunkach równowagi—jako 
przykładow-y parametr weźmy objętość układu. 
Cząstki układu znajdują się w bezustannym ruchu, 
tym samym zmienia się również bezustannie objętość 
układu, nawet układu znajdującego się w równowa¬ 
dze, która oznacza jedynie brak systematycznych 
zmian parametrów makroskopowych. Przyrządy sto¬ 
sowane do pomiaru parametrów makroskopowych 
mają określoną czułość i określoną bezwładność, 
tak że z reguły nie są w stanie śledzić chaotycznych 
zmian, którym podlegają parametry makroskopowe. 
Stąd, przyrządy pomiarowe podają nam nie chwilowe, 
ale uśrednione w czasie wartości parametrów makro¬ 
skopowych, przy czym wzór na wartość średnią ma 
postać 

A = lim - f (1) 

T-SO T J 

gdzie A(t) oznacza chwilową, a A — średnią wartość 
parametru A; czas / — 0 oznacza czas początku 
pomiaru. Granica r oo nie musi być traktowana 
zbyt dosłownie, chodzi tu wyłącznie o uśrednienie po 
okresie znacznie dłuższym od okresu charaktery¬ 
stycznego dla chaotycznych zmian parametru A. 

Jeśli wprowadzić prawdopodobieństwo w zespole 
statystycznym, to można również mówić o warto¬ 
ściach średnich w tym zespole. Pojęcie wartości śred¬ 
niej szczególnie łatwo wprowadzić dla układów 
opisywanych przez mechanikę kwantową. Niech 
zespół statystyczny stanowi zbiór stanów kwanto¬ 
wych M. Każdemu stanowi kwantowemu / należą¬ 
cemu do M (/ € M) przypisujemy prawdopodobień¬ 
stwo Pi, przy czym 

co oznacza, że prawdopodobieństwo znalezienia 
układu gdziekolwiek w zespole jest równe jedności. 
Równość ta jest prostą konsekwencją tego, że do ze¬ 
społu statystycznego wchodzą wszystkie układy fi¬ 
zyczne o identycznej wartości określonych parame¬ 


trów makroskopowych. W każdym stanie kwanto¬ 
wym / ś M dowolna wielkość fizyczna A ma okre¬ 
śloną wartość średnią Au Występowanie tej wartości 
średniej nie jest związane z istnieniem zespołu sta¬ 
tystycznego, lecz z kwantowym charakterem rozpa¬ 
trywanego układu. (Jeśli wziąć pod uwagę np. paczkę 
fal odpowiadających jednej cząstce, to ze względu na 
rozmycie przestrzenne, położenie cząstki nie będzie 
ściśle określone, można będzie natomiast mówić 
o wartości średniej składowych wektora położenia 
cząstki). Zgodnie z powyższym, średnia wartość 
wielkości A w zespole statystycznym M wyniesie 

<A} = £a,Pi. (2) 

Nieco trudniej wprowadzić pojęcie średniej w ze¬ 
spole statystycznym układów opisywanych przez 
mechanikę klasyczną, mimo że mechanika klasyczna 
opisuje układy fizyczne zawsze w sposób mniej do¬ 
kładny od mechaniki kwantowej. Stan układu kla¬ 
sycznego można określić znając wektory położeń 

f i, r 2 ,..., ry i pędów p ly p 2y ...>pn wszystkich N cząstek. 
Uwzględniając fakt, że wektor w przestrzeni K- wy¬ 
miarowej to uporządkowany zbiór K liczb, można 
uznać, że stan układu klasycznego jest określony 
przez wektor w przestrzeni 6iV-wymiarowej, zwanej 
przestrzenią fazową lub przestrzenią układu N czą¬ 
stek. Oznaczamy ten wektor przez R y jego składo¬ 
wymi są współrzędne wektorów położenia i pędu 
wszystkich N cząstek w prostokątnym układzie współ¬ 
rzędnych, będziemy je wszystkie nazywali składowymi 

Rk(k = 1,2,..., 6W) wektora R. Zmienne /^zmienia¬ 
ją się w sposób ciągły i można wprowadzić dla nich 
funkcję gęstości prawdopodobieństwa. Prawdopo¬ 
dobieństwo znalezienia układu w nieskończenie małej 
6A r -wymiarowej kostce określonej przez nierówność 
R k o < Rk < R k o^rdRk, k - 1,2, ..., 6N y będzie dane 

przez f(R) dr y gdzie dr jest objętością owej kostki, 

a nieujemna funkcja /(/?) — gęstością prawdopodo¬ 
bieństwa. Wielkość dr można zapisać jako iloczyn 
dR x dR 2 ... dR 6N , czyli dx 1 dy 1 dz 1 ... dxNdy 1 \dz\dp xx dp Vx 
dpz \... dp x ydp yN dpz N , gdzie x it yi, z t ; px iy p V{ , Pz X ozna¬ 
czają współrzędne wektorów położenia i pędu /-tej 
cząstki w prostokątnym układzie współrzędnych. 

Aby funkcja f(R) miała sens gęstości prawdopodo¬ 
bieństwa musi spełnić warunek 

f f(R)dr = i, 

r 

w którym występuje całka 6A^-krotna po całej prze¬ 
strzeni jT. Wielkości makroskopowe, stanowiące 
przedmiot zainteresowania termodynamiki staty¬ 
stycznej, są zazwyczaj funkcjami wektora R w prze¬ 
strzeni r. Na przykład, energię kinetyczną układu 
określa wzór 

v 1 

£kin = ^ -^-(pli+Pyj+Pzj)’ 

i-i 

w którym m jest masą cząstek, przy czym energia 
całkowita to 

Ącin-1- V(r ly r Zy ..., ry) y 

gdzie Kjest energią potencjalną. 

Teraz możemy już określić średnią wartość w ze¬ 
spole statystycznym układów klasycznych dowolnej 

wielkości fizycznej A będącej funkcją R: 

<A(R)> = jA(R)f(R)dr. 

Opis układów kwantowych i klasycznych można 
formalnie ujednolicić, dzieląc przestrzeń fazową na 
komórki o równej objętości O y na tyle małe, aby za¬ 
równo gęstość prawdopodobieństwa, jak i rozpa¬ 
trywane wielkości makroskopowe zmieniały się zni¬ 
komo mało w granicach jednej komórki. Wtedy, 
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wartość 

średnia 


jeśli ponumerować komórki wskaźnikiem / i wybrać 

po jednym wektorze Ri z każdej komórki, to prawdo¬ 
podobieństwo znalezienia układu w /-tej komórce 

będzie równe Pi = f(Ri ) Q, wartość średnia zaś będzie 
określona następująco 

<^)> = % A(Ri)f{R,)Q = £ At Pi. 

l£Al M 


Konkretyzacja pojęcia zespołu statystycznego 

Poprzednie rozważania były z konieczności dość 
abstrakcyjne. Obecnie dostosujemy pojęcie zespołu 
statystycznego do warunków oddziaływania makro¬ 
skopowego układu z otoczeniem. Zacznijmy od przy¬ 
padku najprostszego — układu izolowanego od oto¬ 
czenia i zajmującego określoną objętość V. Taki 
układ ma energię E ustaloną z dokładnością do błędu 
pomiaru SE, przy założeniu, że SE <ś [£’{. Wskaźnik 
/ oznacza tym razem różne stany kwantowe układu 
o energii E < Ei < E+SE, bądź też numeruje ko¬ 
mórki przestrzeni fazowej, których energie spełnia¬ 
ją taką nierówność. Zakładamy, że SE jest na tyle 
duże, iż w przedziale E, E+SE znajduje się bardzo 
wiele stanów o energii Ei. Jest to łatwe do spełnienia 
przy podziale przestrzeni fazowej na odpowiednio 
małe komórki, albo przy odpowiednio dużych ukła¬ 
dach kwantowych, których poziomy energetyczne są 
prawie ciągłe. Sprawdźmy to na przykładzie pojedyn¬ 
czej cząstki zamkniętej w pudle sześciennym o krawę¬ 
dzi L, gdy pęd cząstki p spełnia warunki Borna-Kńr- 

r t ^ ^ _ ¥ 

mana, tj. p = hn/L , gdzie h jest stałą Plancka, a n — 

wektorem o całkowitych współrzędnych. Dla dużych 
L siatka wektorów p = hnjL staje się bardzo gęsta, 

podobnie jak i zbiór wartości energii £(p), jeśli tylko 
jest to funkcja ciągła. Podobnie będzie dla układu 
wielu cząstek, co szczególnie łatwo uzasadnić, jeśli 
cząstki ze sobą nie oddziałują i energia ich układu 
jest sumą energii poszczególnych cząstek, 
prawdopodo- Przyjmijmy chwilowo, że układ niekoniecznie znaj- 
bieństwo duje się w równowadze; wtedy prawdopodobieństwo 
znalezienia znalezienia go w /-tym stanie powinno zależeć od 
układu czasu, oznaczamy je Pi(t). Zakładamy wtedy, że 
w /-tym prawdopodobieństwo to spełnia zależność 

Pi{1+i f) = JT Pk(t)Ak-»i(A), (3) 

k£M 

w której Ak—iOf) oznacza prawdopodobieństwo 
przejścia ze stanu k do stanu / po upływie czasu A. 
Zależność ta oznacza, że jeśli układ znalazł się w sta¬ 
nie k w chwili /, to z prawdopodobieństwem A k -*i(A ) 
znajdzie się w chwili t+A w stanie /, że zaś w stanie k 
układ znalazł się z prawdopodobieństwem P*(/), więc 
pomnożenie A k ~*i(A) przez nie i zsumowanie 
takich wyrażeń dla wszystkich różnych wartości k 
daje pełne prawdopodobieństwo znalezienia układu 
w stanie / w chwili t+A. Zależność ta ma więc sens 
bilansu prawdopodobieństwa, przy czym jedynym 
istotnym założeniem przyjętym przyjej wprowadzaniu 
jest założenie o niezależności zdarzeń polegających na 
znalezieniu się układu w stanie k i na jego przejściu 
z k do /, co prowadzi do mnożenia prawdopodo¬ 
bieństw. Prawdopodobieństwa A k ->i(A) muszą speł¬ 
niać związek 

£ A k -.i(A) = 1 (4) 

oznaczający, że jeśli układ znalazł się w stanie k, 
to jest pewne, że znajdzie się w jakimkolwiek innym 
stanie po chwili A. Przeprowadzając sumowanie za¬ 
leżności (3) po wszystkich / ę M i korzystając z rów¬ 
ności (4), łatwo udowodnić, że jeżeli suma wszystkich 
prawdopodobieństw Pi(t) była równa jedności, to 
będzie to spełnione automatycznie również w chwili 
t+A. Podobnie, z równości (3) i (4), w prosty sposób 
wynika, że jeśli prawdopodobieństwa wszystkich 
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stanów k są w pewnej chwili sobie równe (to znaczy 
niezależne od k ), to będą również spełniały ten zwią¬ 
zek dowolnie długo, co oznacza stan równowagi. 
Przy stanie równowagi — z równości prawdopo¬ 
dobieństw wszystkich stanów /ęM—otrzymujemy 
zatem 

Pi = M- 1 (E, SE), (5) 

gdzie M jest liczbą stanów (lub komórek), których 
energia ( Ei ) spełnia nierówność E < Ei < E+SE. 
Dla pozostałych stanów, oczywiście, P k = 0. 

Można wykazać, że jeśli A k ->i(A) > 0 dla do¬ 
wolnej pary stanów k, l i A > 0, co oznacza możli¬ 
wość przejścia od każdego stanu k do każdego stanu 
/, to wyrażenie (5) jest jedynym wyrażeniem nieza¬ 
leżnym od czasu spełniającym zależność (3). W takiej 
sytuacji mamy również 

lim Pi(t) = Pi = M- 1 (E, SE ), (6) 

t —*00 

co oznacza, że przy / -> oo rozkład prawdopodobień¬ 
stwa stanów dąży do rozkładu występującego w rów¬ 
nowadze, i to niezależnie od tego, jakie prawdopodo¬ 
bieństwa Pi{t') były w pewnej chwili początkowej t'. 
Równość (6) oznacza, że Pi(t) różni się dowolnie 
mało od Pi po odpowiednio długim czasie. Powoduje 
to, że dowolna wielkość fizyczna A , uśredniona w cza¬ 
sie zgodnie ze wzorem (1), równa jest równowagowej 
średniej 

^ = M(E, SE) JĘ Al ’ W 

przy czym sumowanie ogranicza się do takich /, że 
E < Ei< E+SE. 

W ten sposób określiliśmy zespół statystyczny 
układu izolowanego od otoczenia, dla którego wszy¬ 
stkie prawdopodobieństwa stanów kwantowych o 
energiach w podanym przedziale są równe. Zespół 
taki nazywa się zespołem mikrokanonicznym. Wyka¬ 
zaliśmy również, że średnia po czasie (1) jest równa 
średniej w takim zespole (7). Wniosek ten znany 
jest pod nazwą twierdzenia ergodycznego. Zostało 
ono wprowadzone przez L.E. Boltzmanna dla ukła¬ 
dów opisywanych przez mechanikę Newtona. Boltz- 
mann podał wiele istotnych argumentów przemawia¬ 
jących za prawdziwością twierdzenia ergodycznego, 
ścisły zaś matematyczny dowód tego twierdzenia 
został podany przez G. Birkhoffa i J. von Neumanna 
dopiero w latach trzydziestych naszego wieku. 
Rozkład mikrokanoniczny nie wyróżnia ani stanów 
kwantowych ani też punktów w przestrzeni fazowej. 
Taki stan często określa się mianem „chaosu mole¬ 
kularnego”. Dla układów klasycznych tor wektora ~R 
w przestrzeni fazowej przy t -+ oo pokrywa wówczas 
powierzchnię ustalonej energii w sposób ciągły 
i równomierny. 

Jak już wyjaśniono, lim Pi(t) = Pi niezależnie 

t — ><x> 

od początkowego rozkładu prawdopodobieństwa. 
Jest to stwierdzenie istnienia relaksacji, tj. procesu 
dochodzenia do równowagi. Zjawisko to ma nie¬ 
odwracalny charakter, ponieważ stan równowagi raz 
osiągnięty trwać będzie nieograniczenie długo i nie ma 
możliwości powrotu do wyjściowego rozkładu praw¬ 
dopodobieństw. Do faktu tego doszliśmy już jako do 
wniosku zależności (3) przy uwzględnieniu warunku 
(4). Zwróćmy uwagę, że wniosek ten jest prawdziwy 
nawet wtedy, gdy A k -^i(A) = Ai-+ k (A), co ozna¬ 
cza, że prawdopodobieństwo przejścia ze stanu k 
do / jest równe prawdopodobieństwu przejścia z / 
do fc, i co można by nazwać warunkiem odwra- 
calności mikroskopowej. 

Należy podkreślić, że nie sposób traktować przy¬ 
toczonego wyprowadzenia równości wartości śred¬ 
nich po czasie i średnich w zespole mikrokanonicz¬ 
nym jako dowodu twierdzenia ergodycznego dla 
układów kwantowych. Zależność (3) została bowiem 
tylko przyjęta, nie zaś wyprowadzona na podstawie 
m.in. równania Schrodingera. Wyprowadzenie takie 
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wymaga z reguły dodatkowych założeń o układzie 
fizycznym. Dlatego też rozważania niniejsze mają, 
przynajmniej częściowo, charakter tylko wyjaśnia¬ 
jący pojawianie się takich własności procesów fizycz¬ 
nych, jak relaksacja, nieodwracalność itp. Rozważa¬ 
nia te pozwalają również zrozumieć statystyczny 
charakter podstaw termodynamiki. 


Entropia i granica termodynamiczna 

Na podstawie wyrażenia (7) można znaleźć wartości 
obserwowane tych wielkości fizycznych, które mają 
określone wartości średnie bądź w stanie kwanto¬ 
wym, bądź też dla funkcji R, tj. n oraz/?* w układzie 
klasycznym. Do wielkości tego rodzaju nie należy 
ani wymiana ciepła AQ , ani też entropia, zdefiniowana 
w termodynamice przez równanie AS = AQ/T, gdzie 
Tjest temperaturą w skali Kelvina. Podana definicja 
jest słuszna przy nieskończenie małych różnicach 
AQ i AS. Wymianę ciepła określa się jako różnicę 
energii stanu końcowego i początkowego układu, 
jeśli nie wykonano nad nim pracy. Taka sama róż¬ 
nica energii może powstać w wyniku jednoczesnej 
wymiany ciepła z otoczeniem i wykonania pracy 
nad układem. Dlatego można mówić raczej o wy¬ 
mianie ciepła niż o cieple i nie można wyrazić tej 

wielkości w funkcji R ani też przypisać jej wartości 
stanowi kwantowemu. Z tego także powodu nie można 
wyrazić entropii jako wartości średniej pewnej 

funkcji od R lub też funkcji wskaźnika stanu kwanto¬ 
wego, tylko jest konieczne podanie osobnej staty¬ 
stycznej definicji entropii. Zostało to dokonane przez 
Boltzmanna. 

granica Ograniczymy się teraz do wprowadzenia entropii 
termodyna- dla układów makroskopowych, a nawet tylko dla 

miczna układów w tzw. granicy termodynamicznej, tj. przy 
objętości Ki liczbie N dążących do nieskończoności 
tak, aby iloraz N/V (gęstość cząstek) pozostawał 
skończony i niezerowy. Założymy również, że istotne 
w opisie układu makroskopowego wielkości dzielą 
się na dwie klasy: wielkości ekstensywne i wielkości 
intensywne. 

Pierwsze z nich, przy wzroście liczby cząstek 
dużego układu, rosną wraz z N prawie liniowo, dru¬ 
gie — prawie nie zmieniają swojej wartości. Uściśla¬ 
jąc to matematycznie, można uznać, że wielkości 
ekstensywne są rozbieżne przy N -> oo tak, że dla 
dowolnej takiej wielkości E, granica EjN istnieje 
wielkości i jest niezerowa. Wielkości intensywne są natomiast 
ekstensywne przy N -> oo zbieżne do liczby. Do wielkości eksten- 
i intensywne sywnych należą np.': energia, objętość i ładunek elek¬ 
tryczny, do intensywnych zaś: ciśnienie, tempera¬ 
tura, stała dielektryczna itd. W granicy termodyna¬ 
micznej— podanie jednej wielkości ekstensywnej 
i wielu wielkości intensywnych pozwala określić każdą 
inną wielkość ekstensywną, np. zamiast wielkości 
ekstensywnych wymienionych wyżej można podać: 
objętość, gęstość energii (£/K) oraz gęstość ładunku. 
Przyjęcie układów w granicy termodynamicznej 
prowadzi do rezygnacji z rozpatrywania efektów 
powierzchniowych. Dlatego też, w granicy termody¬ 
namicznej, wielkości ekstensywne stają się makro¬ 
skopowo addytywne, co oznacza, że np. energia ciała 
makroskopowego jest równa sumie energii jego 
makroskopowych części. Wniosek ten, oczywisty 
w odniesieniu do ilości cząstek, ładunku, czy objęto¬ 
ści, dla energii wymaga pewnego uzasadnienia. Jeśli 
w układzie działają siły o skończonym zasięgu rzędu 
n odległości międzycząsteczkowych, to energia 
oddziaływania makroskopowych podukładów kon¬ 
taktujących się przez powierzchnię powinna być 
rozbieżna wraz z W jak nN 2 / 3 , nie zaś jak N. Poprawka 
do energii, a więc wielkości ekstensywnej, rzędu 
n N 2 / 3 jest w granicy termodynamicznej pomijalna, 
co uzasadnia makroskopową addytywność energii. 
Warto dodać, że ekranowanie ładunku przez elektro¬ 


ny w ośrodkach ciągłych sprawia, że siły Coulomba, 
działające między elektronami i jonami, stają się 
również siłami o skończonym zasięgu. 

Dodajmy, że wnioski, do których poprzednio 
doszliśmy, dotyczące nieodwracalności i dochodzenia 
do równowagi są słuszne jedynie w granicy termody¬ 
namicznej. W dużych ale skończonych układach ma¬ 
my do czynienia z ruchem zbliżonym do okresowego, 
o niezwykle dużych okresach. Dlatego też, przy do¬ 
świadczeniach np. nad molem gazu, trwających do¬ 
wolnie długo w ludzkiej skali czasu, możemy śmiało 
potraktować procesy tam zachodzące jako procesy 
nieodwracalne. Na kłopoty związane z przybliżoną 
okresowością ruchu układów skończonych zwracano 
uwagę już w dziewiętnastym stuleciu. 

Ponieważ wymiana ciepła jest określona przez entropia 
różnicę energii, więc jest również wielkością eksten¬ 
sywną. Stąd, jak i z definicji — entropia jest również 
wielkością ekstensywną. Entropia układów opisywa¬ 
nych przez mechanikę kwantową będzie zdefinio¬ 
wana następująco: 

S = k\nM(E, <5Zs)> W 

gdzie k jest stałą Boltzmanna, M(£, óE) zaś zostało 
określone wzorem (5). Wzór (8) jest jedynie definicją 
entropii. Później uzasadnimy, że „entropia staty¬ 
styczna” (8) ma wszelkie własności entropii termody¬ 
namicznej. W podanym wcześniej termodynamicznym 
określeniu entropii, AS = AQ/T , występuje wyłącz¬ 
nie różnica entropii, a więc można ją określić jedynie 
z dokładnością do stałej; statystyczna definicja okre¬ 
śla entropię bez jej dowolności. Z drugiej strony, 
niepokoi zależność S nie tylko od E i innych parame¬ 
trów, od których M zależy w sposób niejawny, ale 
również od dE. Można wykazać, że zależność ta jest 
nieistotna w granicy termodynamicznej. 

Jak można zdefiniować entropię dla układów opi¬ 
sywanych przez mechanikę klasyczną? Objętości 

przestrzeni fazowej obszaru E < E(R) < E-\-&E, 

gdzie E(R) jest energią układu klasycznego, nie można 
traktować jako odpowiednika M(£, óE) y ponieważ 
jest to wielkość wymiarowa i jej logarytm jest nie¬ 
określony poza wybranym układem jednostek. 

Ale jeśli tę objętość fazową podzielić przez /t 3iV , gdzie 
h jest stałą Plancka, to otrzymamy wielkość bezwy¬ 
miarową. . . 

Gibbs zauważył ponadto, że jeśli objętości fazowej paradoks 
nie podzielić przez A!, to S będzie zależała od N sil- Gibbsa 
niej niż liniowo przy N — *■ oo, a więc nie będzie wiel¬ 
kością ekstensywną. Co gorsze, powstaje przy tym 
niemożność jednoznacznego określenia entropii. 

Wykażemy to na podstawie następującego rozumo¬ 
wania: wyobraźmy sobie dwa naczynia, wypełnione 
identycznym gazem, o tym samym ciśnieniu i tempe¬ 
raturze. Niech S x i S z będą entropią gazu znajdującego 
się w pierwszym i drugim naczyniu. Entropia S ukła¬ 
du naczyń połączonych ze sobą, równa jest Ą-f S 2 
ze względu na odwracalność mieszania gazu w takich 
warunkach. Jeśli S x i S 2 są ekstensywne, to S x = N x s 0 , 

S 2 = N 2 s 0 , gdzie wielkość s 0 oznacza entropię na 
jedną cząstkę i jest intensywna. Wtedy S = (,N x -r 
+N 2 ) s 0 = Ns 0 i entropia naczyń połączonych zależy 
jedynie od stanu układu. Jeśli jednak S x ,* ^ N Xi2 Sq, 
to do określenia S jest jeszcze potrzebne podanie 
N x lub N z , a więc historii układu. 

Dlatego też entropia połączonego układu zależa¬ 
łaby od miejsca, z którego wyciągnięto przegródkę 



Rys. 3. Entropia połączonego układu zależy od miejsca, z którego 
wyciągnięto przegródkę A oddzielającą jednakowe i. znajdujące 
się w jednakowych warunkach gazy w naczyniach 1 i 2 
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A (rys. 3) oddzielającą dwa jednakowe i znajdujące 
się^w jednakowych warunkach gazy w naczyniach 

I iczba stanów ^ Z niniejszych rozważań wynika, że właściwa postać 
w warstwie * wyrażenia na liczbę stanów w warstwie energetycznej 

energetycznej o grubości SE ma postać 

\ r dr — 

M{Ey ÓE) = ~N\ J ' E <EW < E + 6E • W 

Wyrażenie to można również otrzymać przez przej¬ 
ście graniczne od mechaniki kwantowej do klasycz¬ 
nej. Ponieważ NI to liczba wszystkich możliwych 
permutacji N elementów, więc podzielenie przez N\ 
oznacza odpowiednie zredukowanie liczby stanów 
z uwagi na to, że permutacja położeń i pędów czą¬ 
stek jednakowych nie powoduje zmiany sytuacji 
fizycznej, co stanowi jakby klasyczną zapowiedź 
nierozróżnialności jednakowych cząstek w mecha¬ 
nice kwantowej. 

Pokażemy teraz, jak znaleźć własności termodyna¬ 
miczne układu, jeśli znamy S w funkcji E i V. Za¬ 
łóżmy dla uproszczenia, że nad układem można 
wykonywać jedynie pracę objętościową. Jeśli więc 
objętość V będzie stała, to praca nie będzie wykony¬ 
wana i AQ — AE. Stąd oraz z termodynamicznej 
definicji entropii wynika, że ( dS/dE) = 1/T, co poz¬ 
wala wyrazić energię (a tym samym — entropię) 
przez objętość i temperaturę. Ponadto, jeśli E jest 
stałe, to praca objętościowa układu pAV , gdzie p 

— ciśnienie, równa się zmianie ciepła. Powstaje to 
stąd, że (dS/ dV) = pj Ti jeśli podstawić tu E w funkcji 
objętości i temperatury, to otrzymamy zależność 
typu p == f{V, T), a więc równanie stanu, co byłoby 
niemożliwe bez użycia metod termodynamiki sta¬ 
tystycznej. 

prawo Statystyczna definicja entropii (8) pozwala łatwo 
wzrostu uzasadnić prawo jej wzrostu. Weźmy w tym celu dwa 
entropii układy o energiach E x i E 2 i liczbie stanów M x {E ly SE) 
oraz M 2 (E 2 , SE). Jeśli układy te nie mogą wymieniać 
między sobą energii, to liczba stanów całego układu 
będzie po prostu iloczynem M X M 2 , bowiem stany 
każdego z podukładów określają stan układu. Na¬ 
tomiast jeżeli podukJady mogą wymieniać energię 
między sobą, to aby otrzymać liczbę stanów całego 
układu, trzeba jeszcze wysumować iloczyn M 1 {E 1 — 

— mSE ', <5 JE) M 2 (E 2 +mSE, SE) po wszystkich całko¬ 

witych k takich, że E x —mSE oraz E 2 +mSE są do¬ 
puszczalnymi energiami obydwu podukładów. 
Zauważmy, że w podanym wyżej iloczynie suma 
energii podukładów musi być równa E x +E 2 , tzn, 
uwzględniono tu prawo zachowania energii. Gdy 
podany iloczyn osiąga maksimum dla m = 0, to 
w granicy termodynamicznej można wykazać, że 
entropia układu będzie równa sumie entropii pod¬ 
układów. Jeśli jednak maksimum tego iloczynu jest 
osiągnięte przy 0, to wspomniana suma iloczynów 

jest większa od M X (E U SE) M 2 (E 2 , SE), co oznacza 
wzrost entropii połączonego układu. Nietrudno rów¬ 
nież zauważyć, że warunek na maksimum iloczynu 
jest równoważny warunkowi równości temperatury 
w obydwu podukładach. 

Należy przy tym podkreślić nieco inny charakter 
prawa wzróstu entropii w termodynamice statystycz¬ 
nej niż w fenomenologicznej. Polega to na możliwości 
nawet przejściowego zmniejszania się entropii w pro¬ 
cesie wymiany energii między podukładami, ponieważ 
Af 1 (E 1 —mSE, SE)M 2 {E 2 +mSE, SE) może być mniej¬ 
sze od M x (E ly SE) M 2 (E 2 . SE) przy odpowiednim m. 
Zmiana energii właśnie o mSE jest — dla dużych 
układów — wysoce nieprawdopodobna, nie jest jed¬ 
nak całkowicie wykluczona. Widzimy więc, że prawo 
wzrostu entropii traci, przy statystycznym podejściu 
do termodynamiki, swój absolutny charakter. Ujmu¬ 
jąc rzecz ogólnie, podejście statystyczne charaktery¬ 
zuje występowanie fluktuacji — odchyleń parametrów 
fizycznych od ich wartości średnich A(t)—A. 
Miarą fluktuacji nie może być wartość średnia A (t)— 


—A> wielkość ta bowiem znika; za miarę tę przyj¬ 
muje się pierwiastek ze średniego kwadratu (A ( t)-A ), 
tj. zgodnie z (1) 

o 

czyli średnie odchylenie kwadratowe wielkości A(t). 

Ze względu na równość średniej w czasie i średniej 
w zespole statystycznym, miarę fluktuacji można 
wyrazić również w postaci średniej w zespole staty¬ 
stycznym. Doświadczalne obserwacje fluktuacji wiel¬ 
kości fizycznych potwierdziły statystyczny charakter 
termodynamiki. Wielki wkład do tego zagadnienia 
wniósł polski fizyk Marian Smoluchowski. 

Z wyrażeń na entropię oraz prawdopodobieństwo 
w zespole mikrokanonicznym można, w stosunkowo 
prosty sposób, otrzymać prawdopodobieństwa stanów 
makroskopowego podukładu należącego do znacznie zespól 
większego od niego układu i wymieniającego z nim kanoniczny 
energię. Zespół statystyczny opisujący taki podukład • makroka- 
nazywa się zespołem kanonicznym lub zespołem noniczny 
kanonicznym Gibbsa. Funkcja prawdopodobieństwa 
dla podukładu kwantowego ma postać 

Q ~EilkTj Zt (JO) 

gdzie Z otrzymuje się z warunku, że prawdopodo- suma stanów 
bieństwo zsumowane po / daje jedność, czyli 

Z = c~ K iJ kT . 

i 

Wielkość Z nazywa się sumą stanów. Znalezienie jej, 
co jest z reguły łatwiejsze niż określenie M(E, SE), 
pozwala obliczyć wszystkie funkcje termodynamiczne 

układu. Jeśli zamiast Ei podstawić E{R ), a zamiast 
sumy po /— całkę po dr, to otrzymamy odpowiednio 
gęstość prawdopodobieństwa oraz sumę stanów dla 
układu klasycznego pomnożoną przez h* N N\, Równie 
często używa się w termodynamice statystycznej 
zespołu statystycznego podukładu makroskopowego 
wymieniającego zarówno energię, jak i cząstki, ze 
znacznie większą od siebie resztą układu. Zespół 
taki nazywany jest zespołem makrokanonicznym. 

Ostatnie zdania wydają się sugerować, że istnieje 
osobna termodynamika „mikro” i „makro” oraz po 
prostu „kanoniczna”. Okazuje się jednak, że nieza¬ 
leżnie od ustalenia energii, liczby cząstek czy też 
możliwości ich wymiany, wielkości te są i tak prak¬ 
tycznie stałe, ponieważ ich średnie odchylenia kwa¬ 
dratowe są rzędu N 1 ! 2 , dzięki czemu względne odchy¬ 
lenia energii czy liczby cząstek są rzędu N~ 1 l\ co jest 
pomijalne w granicy termodynamicznej. 

Z postaci wzoru (10) widać, że przy T -> 0 prawdo- 111 zasada 
podobieństwo stanu o najniższej energii dąży do termodyna* 
jedności, pozostałe zaś prawdopodobieństwa dążą miki 
do zera. Zatem przy T — 0 układ będzie znajdował 
się w stanie podstawowym. Stan ten jest bądź niezwy- 
rodniały, bądź też jego zwyrodnienie jest skończone 
przy N -*• oo. Powoduje to, że przy T — 0 entropia 
jest zerowa w granicy termodynamicznej, co stanowi 
treść trzeciej zasady termodynamiki. Była ona uza¬ 
sadniana początkowo wyłącznie empirycznie, widzi¬ 
my jednak, że wynika ona w nie dający się zaprzeczyć 
sposób z definicji entropii (8) i kwantowości układu. 


Gazy klasyczne i kwantowe 

Po raczej abstrakcyjnych rozważaniach przejdźmy 
do zastosowań, czyli do teorii gazów doskonałych — 
klasycznych i kwantowych. Przez gaz doskonały 
rozumie się układ, którego energię całkowitą można 
zapisać w postaci 

l 

gdzie Ni jest liczbą cząstek w stanie o energii Ei. 
Stan o energii Ei wygodniej będzie potraktować nie 
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jako oddzielny stan kwantowy, ale jako zbiór liczby 
stanów wielkości ekstensywnej o bliskich energiach. 
Ei zaś będzie oznaczać pewną energię średnią. Dla 
odpowiednio dużych układów kwantowych bądź też 
dla układów klasycznych, jeśli tylko przedział energii 
SE wokół Ei jest wielkością — tym razem — inten¬ 
sywną, liczba stanów jest wielkością ekstensywną. 
Nałóżmy na pęd warunki Boma-Kdrmana (założenie 
przyjmowane zwykle w teorii ciała stałego), tj. 

przyjmijmy, że pęd spełnia warunki p = hnjL y gdzie 

n jest wektorem o współrzędnych równych liczbom 
całkowitym, a L — długością krawędzi sześcianu 
zajmowanego przez układ. W tym wypadku różnym 

stanom kwantowym odpowiadają różne wektory n y 
czemu z kolei odpowiada sieć regularna prosta 
w przestrzeni pędów o długości krawędzi A/L. 
Dlatego właśnie gęstość stanów kwantowych w prze¬ 
strzeni pędu wynosi F/A 3 . Zatem pomnożenie obję¬ 
tości obszaru przestrzeni pędów przez F/A 3 daje 
liczbę stanów w tym obszarze, przy czym będzie to 
wielkość ekstensywna. Taki sam rezultat daje wyra¬ 
żenie (9) na liczbę stanów układu klasycznego przy 
N = 1, gdyż występująca tam całka po zmiennych 
przestrzennych daje czynnik V. Widzimy więc, że 
podzielenie klasycznej objętości fazowej przez A 3 * v , 
zastosowane ze względów wymiarowych, ma znacznie 
głębsze uzasadnienie. 

Oznaczmy liczbę stanów o średniej energii Ei 
(wielkość ekstensywna) przez gi. Zastanówmy się, na 
ile sposobów można rozmieścić Ni cząstek w gi 
stanach. W tym celu trzeba ustalić, które rozmiesz¬ 
czenia uznajemy za różne i jakie dodatkowe własności 
muszą spełniać rozmieszczenia. W mechanice kla¬ 
sycznej cząstki jednakowe są rozróżnialne, ponieważ 
można prześledzić tor każdej z nich, nie wpływając 
na ruch cząstki. Nie ma przy tym żadnych ograniczeń 
na liczbę cząstek w poszczególnych stanach. W takim 
wypadku będziemy mówili, że cząstki podlegają 
statystyce Maxwella-Boltzmanna (M.B.). W mecha¬ 
nice kwantowej cząstki są nierozróżnialne, ale możli¬ 
we są dwa przypadki: albo nie ma ograniczeń na 
liczbę cząstek w danym stanie kwantowym, albo też 
liczba cząstek w danym stanie kwantowym nie może 
przewyższać jedności. W pierwszym z nich mówimy 
o statystyce Bosego-Einsteina (B.E.) lub po prostu 
Bosego, a cząstki nazywamy bozonami, w drugim — 
o statystyce Fermiego-Diraca (F.D.) lub po prostu 
Fermiego, a cząstki nazywamy fermionami. Aby 
zrozumieć różnicę między tymi trzema możliwościa¬ 
mi, popatrzmy na rys. 4, gdzie przedstawiono roz¬ 
mieszczenie dwóch cząstek w trzech stanach. Dla 
cząstek podlegających statastyce F.D. możliwe są 
tylko trzy stany A, B y C, dla cząstek podlegających 
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statystyce B.E. — wszystkie stany A-F. Jak widzimy, 
każdemu ze stanów A, B y C odpowiadają po dwa 
stany układu klasycznego. Razem mamy 3 różne 
rozmieszczenia w wypadku statystyki F.D., 6 w wy¬ 
padku — B.E. i 9 w razie — M.B. Ogólne wyrażenia 
na liczbę Wi rozmieszczeń cząstek w zależności od 
gi i Ni mają postać: 


Wi 


(d,a ^ * N,) ~ RD - 

to+M-W -p p 
m(e,-iy. ~ at - 

— M.B. 


Wyprowadzenie tych wzorów można znaleźć w każ¬ 
dej niemalże książce poświęconej kombinatoryce czy 
rachunkowi prawdopodobieństwa, dlatego też pozwo¬ 
limy je sobie opuścić. 

Ogólna liczba sposobów rozmieszczenia cząstek 
nierozróżnialnych jest równa iloczynowi wszystkich 
Wi dla wszystkich różnych wartości /, natomiast dla 
cząstek rozróżnialnych trzeba taki iloczyn jeszcze po¬ 
mnożyć przez czynnik N\IN X \N 2 l ... Nil ... (N = 
= N l +N 29 .») 9 określający na ile sposobów można 
wydzielić z N rozróżnialnych cząstek grupy po N u 
A/ 2 ,..., Ni... cząstek. Zgodnie z tym co zauważył 
Gibbs, rezultat dla cząstek rozróżnialnych należy poza 
tym podzielić przez N\. Zatem wzory na liczbę możli¬ 
wych stanów będą miały postać: 


M — 


n 

1 

n 

1 

n 

1 


gi ! 

Ni\(gi-Ni)l 

(gi+Ni- 1)! 
Ni\(gi- 1)! 


Nil 


— F.D. 

— B.E. 

— M.B. 


przy spełnieniu warunku, że 2 E 1 N 1 = E oraz że 

L 

£ Ni — N. Wielkość M oznacza liczbę stanów przy 
1 

określonych liczbach cząstek A^, N 2y ..., Ni ... . Aby 
otrzymać całkowitą liczbę stanów trzeba zsumować 
takie wyrażenia na M po wszystkich możliwych Ni 
spełniających dwa wypisane warunki. Skorzystamy 
teraz ze wzoru Stirlinga, który ma postać: 

ln (jc!) x(lnx— 1) przy x -> 00 , 

co oznacza, że iloraz obydwu stron dąży do jedności 
przy x -> 00 . Związek taki zachodzi dla ekstensyw¬ 
nych Ni i gi {Ni y gi -> 00 ): ze wzoru Stirlinga zasto¬ 
sowanego do M podanych wyżej wynika, że ln M 
jest również wielkością ekstensywną. Aby to udo¬ 
wodnić zauważmy, że nawet gdy M' jest równe M to 
ln(M+MO = ln MĄ -In 2 « ln M. 

Warunek na maksimum M (równoważny warun¬ 
kowi na maksimum \nM) przy ustalonej energii 
i całkowitej liczbie cząstek można zapisać jako zni¬ 
kanie różniczki (stosujemy tutaj metodę mnożników 
Lag rangę’a): 

£ EiNi+fiia £ Ni) = O, 

l l 

gdzie zmienne Ni można traktować obecnie jako nie¬ 
zależne oraz ze względu na ich ekstensywność — 
ciągłe. Wielkość lnM osiąga maksimum przy AT* = J/i y 
gdzie 

gi / F * D *\ 

Nl ~ e-**e» B i± 1 ’ \B. E./ ’ 


Rys. 4. Możliwe rozmieszczenia dwóch cząstek w trzech stanach — „ _ 

zależą od statystyki, której te cząsteczki podlegają Ni — g Ł Q p Q~ p i, M.B. 
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Stale pip należy określić z warunków 

JP Ei Ni =* E, %Ni=>N. 

I l 

Pomnożenie In M przez stałą Boltzmanna i podsta¬ 
wienie Ni zamiast Ni daje wartość entropii. Jeśli po¬ 
służyć się układem otrzymanych równości i obliczyć 

i/f przy stałym N * t0 dostaniem y stąd fi = 

zapełnienie Wielkości Nijgi mają sens najbardziej prawdo- 

jednego podobnego i, ze względu na makroskopowość Ni 
poziomu r t — 

oraz wielkość ich fiuktuacj i ~ ]/ Ni , również średniego 
zapełnienia jednego poziomu. Na to, ażeby Ni dla 
statystyki B.E. były dodatnie, jeśli —jak zazwyczaj — 
przyjąć, że najniższa wartość Ei = 0, potrzeba aby 
q-ph < 1, tj. /i < 0. Jeśli nie obowiązuje prawo za¬ 
chowania liczby bozonów, jak np. dla fotonów, które 
podlegają emisji i absorpcji, to warunku £ Ni = N 

nie trzeba wprowadzać, dzięki czemu fi = 0. Podob¬ 
nie jak można się przekonać, anharmoniczność 
drgań sieci prowadzi do niezachowania liczby fono¬ 
nów, dzięki czemu dla nich również fi = 0. Jeśli 
e -^ > 1, co odpowiada, wysokim temperaturom 

i małym gęstościom, to Ni dla obydwu statystyk 
kwantowych dążą do wartości klasycznej statystyki 
M.B. Nie jest to bynajmniej własność wyróżniająca 
gazy doskonałe, bowiem wszystkie ciała makrosko¬ 
powe wykazują odstępstwa od klasycznego opisu 
w granicy niskich temperatur i dużych gęstości oraz 
zachowują się klasycznie w sytuacji odwrotnej. Gra¬ 
nica ta, dla różnych zjawisk i ciał, może odpowiadać 
różnym zakresom temperatur i gęstości. 

Należy odróżnić rozkład kanoniczny Gibbsa, w któ¬ 
rym Ei jest ekstensywną energią układu, od rozkła¬ 
dów F.D., B.E. i M.B., w których Ei jest intensywną 
energią jednej cząstki. Dzięki temu nie ma sprzecz¬ 
ności między rozkładami F.D. i B.E. a rozkładem 
kanonicznym. Jeśli zamiast Ei podstawić p z !2m y 
uwzględnić fakt, że 


JT giREi) = Ej cPpf( p '-l2m) 


i obliczyć wielkość e^ dla rozkładu M.B., to można 
otrzymać rozkład Maxwel!a w postaci 


f(p z !2m) = - 71 ) Q-p z hmkT . 

V \ 2mkT] 


Ponadto, jeśli dla rozkładu M.B. In M jest wielkością 
ekstensywną, to łn(7V!Af), a więc przed podzieleniem 
przez Nl y zawiera składnik N(\nN—l) i wielkością 
ekstensywną nie jest. Fakt ten uprawomocnia para¬ 
doks Gibbsa, rozważany poprzednio. 


Aktualne problemy termodynamiki 
statystycznej 

Trudno byłoby stwierdzić, że udało się nam tutaj 
przedstawić współczesne oblicze termodynamiki 
statystycznej, zajęliśmy się raczej zapoznaniem Czy¬ 
telnika z niezbędnym arsenałem środków najpow¬ 
szechniej w niej używanych. Przejdziemy teraz do 
zagadnień bardziej aktualnych. Ograniczymy się na 
razie do termodynamiki statystycznej stanów równo¬ 
wagi. Do otrzymania równowagowych funkcji termo¬ 
dynamicznych wystarcza obliczenie sumy stanów Z 
lub też M(E , óE). Niestety, dla układów cząstek 
oddziałujących jest to, ogólnie biorąc, niemożliwe. 
Dlatego też oblicza się te wielkości w sposób przy¬ 
bliżony dla pewnego zakresu temperatur lub gęstości 
bądź też dla pewnych szczególnych modeli oddziały¬ 
wania. Rozwinięto ponadto metody pozwalające 
obliczyć funkcje termodynamiczne, gdy odziaływa- 
nie międzycząstkowe jest słabe. 
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Omówimy pokrótce przybliżone metody oblicza¬ 
nia funkcji termodynamicznych. Dla niskich tempera¬ 
tur, a więc w układzie słabo wzbudzonym, jego wzbu¬ 
dzenia można opisać w języku kwazicząstek (->- Wzbu¬ 
dzenia elementarne w ciałach stałych). Kwazicząstki te 
podlegają określonej statystyce kwantowej — B.E. 
lub F.D. Stąd obliczenie pewnych funkcji termodyna¬ 
micznych w granicy niskotemperaturowej daje się 
sprowadzić do obliczenia analogicznych funkcji dla 
gazu kwazicząstek. Dlatego właśnie gaz kwantowy 
doskonały ma tak doniosłe znaczenie w wyjaśnianiu 
niskotemperaturowych własności układów z silnym 
oddziaływaniem międzycząstkowym. Z kolei, przy 
dostatecznie wysokich temperaturach, kwantowość 
przestaje odgrywać istotną rolę, co pozwala znacznie 
uprościć obliczenie funkcji termodynamicznych. 
Jeśli przyjąć normalną postać energii, tj. E(R) = 
— ^kin + £4 to wykonanie w sumie stanów Z (zob. 10) 
całki po pędach staje się trywialne i obliczenie Z 
sprowadza się do obliczenia całki z funkcji e~ v l kT po 
współrzędnych położenia cząstek. Energia potencjalna 
gazów V jest z dobrą dokładnością sumą energii 
potencjalnej oddziaływania wszystkich par cząstek. 
Dla takich V znaleziono bardzo efektywne metody 
obliczania Z, zwane metodami rozwinięć grupowych. 
Nie pozwalają one wprawdzie obliczyć Z dowolnej 
funkcji oddziaływania dwóch cząstek, ale umożli- 
wiają, poza dowodem pewnych własności ogólnych, 
np. rozwiązanie zagadnienia przy granicznie małej 
gęstości. W tym wypadku zasięg oddziaływania dwu- 
cząstkowego jest znacznie mniejszy od średniej 
odległości między cząstkami. 

Dzięki temu dowolna wybrana cząstka oddziałuje 
z pozostałymi stosunkowo rzadko, co daje możliwość 
rozwiązania zagadnienia przy granicznie małych war¬ 
tościach NJV. Zagadnienie obliczania Z w sytua¬ 
cjach granicznych nie zostało tu wyczerpane. Cho¬ 
dziło bowiem tylko o uwidocznienie podstaw fizycz¬ 
nych takich obliczeń. 

Przejdźmy do omówienia pewnych modeli oddziały¬ 
wania. Oczekuje się wówczas, że ln Z da się obliczyć 
asymptotycznie dokładnie w granicy termodyna¬ 
micznej. Takich modeli może można znaleźć i dużo, 
niestety niewiele z nich ma coś wspólnego z rzeczy¬ 
wistością fizyczną. Wśród tych chlubnych wyjątków 
wymieńmy międzyelektronowe oddziaływanie Bardee- 
na-Coopera-Schrieffera, opisujące całkiem poprawnie 
termodynamikę nadprzewodników oraz model Isinga. 
Model ten może opisywać własności magnetyczne 
niektórych substancji lub też stop dwuskładnikowy. 
Omówimy niektóre cechy tego modelu. 

Wyobraźmy sobie regularną sieć krystaliczną. 
W każdym jej węźle j znajduje się moment magne¬ 
tyczny S s , przyjmujący dwie wartości ±1 (rys. 5). 


Rys. 5. Układ 16 mo¬ 
mentów magnetycznych; 
strzałka do góry oznacza 
wartość Sj = -f 1, w dół 
S} *= —1. Węzły ozna¬ 
czone kółkami. Energia 
układu wynosi —H—4j 



Oddziaływanie momentów ze sobą oraz z zewnętrz¬ 
nym polem magnetycznym H ma postać 

E=- % HSj-J% S,S k> 

j Uk) 

gdzie pierwsza suma przebiega wszystkie N węzłów 
sieci krystalicznej, druga zaś — wszystkie pary (Jk) 
najbliższych sąsiadów w sieci. Aby obliczyć sumę 


metody 

rozwinięć 

grupowych 


model Isinga 




















stanów Z należy E podstawić na miejsce Ei i wysu- 
mować po wszystkich możliwościach Sj — ±1, 
liczba tych możliwości jest dana przez 2 N . Jeżeli H > 0 
i J > 0, to najniższa wartość E jest osiągana, gdy 
wszystkie Sj — 1, natomiast przy H= 0 również 
średni wtedy, gdy wszystkie Sj = — 1. Obliczmy średni mo* 
moment sieci ment sieci przypadający na jeden węzeł (wielkość 

intensywna). W tym celu wielkość a = Sj)/N 

i 

trzeba pomnożyć przez Z~ 1 e~ EltcT i wysumować po 
wszystkich Sj = ±1. Jeśli H = 0, to przy skończo¬ 
nych N wielkość ta znika, ponieważ prawdopodobień¬ 
stwo dowolnego układu momentów Sj jest wtedy 
dokładnie równe prawdopodobieństwu układu Sj 
zorientowanych przeciwnie. Stąd przy skończonych 
N lim = 0 (gdzie <...) A v oznacza wartość 

H —>0 

średnią przy ustalonym N) ze względu na ciągłą 
zależność prawdopodobieństwa od H. Może się jed¬ 
nak zdarzyć, że granica termodynamiczna i granica 
H -► 0 są nieprzemienne, tj. że 

lim lim <<r)isr ^ lim lim <<r)jsr = 0, 

JT-+0 N — N—>00 H-+ 0 

przy T < Tk zwanej temperaturą krytyczną. Przykład 
zależności od //,„ przy różnych N i przy usta¬ 
lonej temperaturze w zakresie 0 < T < Tk, poka¬ 
zano na rys. 6. Mniejszym N odpowiadają krzywe 
położone bliżej osi poziomej. Krzywa najdalsza, nie¬ 
ciągła w punkcie H = 0 granica ciągu funkcji ciąg¬ 
łych odpowiada granicy termodynamicznej. 



Rys. 6. Zależność średniego momentu sieci przypadającego na 
jeden węzeł <<7>.v od poła magnetycznego H 


Jeśli wielkość lim lim <<r> A v nie znika, to nazy- 

//—.0 N -+ oo 

wamy ją momentem spontanicznym na jeden węzeł. 
Pojawienie się momentu spontanicznego przy T — Tk 
oznacza przejście fazowe od fazy paramagnetycznej 
do ferromagnetycznej. W punkcie T — Tk drugie po¬ 
chodne ln Z względem H i T, związane z podatnością 
magnetyczną i ciepłem właściwym, mają osobliwość. 
Dla skończonych N jest to niemożliwe, bowiem Z 
jest wtedy sumą 2 N dodatnich funkcji zmiennych H 
i r, ciągłych i różniczkowalnych dowolną ilość razy. 
Widzimy z tego, że poza granicą termodynamiczną 
przejście fazowe nie istnieje. W rzeczywistości mamy 
do czynienia z bardzo dużą, ale skończoną liczbą 
cząstek. W tym wypadku np. biegun funkcji termo¬ 
dynamicznej przechodzi w bardzo ostre maksimum, 
o wartości zależnej od N. Zbadanie tej zależności jest 
interesujące zarówno z teoretycznego jak i doświad¬ 
czalnego punktu widzenia. Niestety, dokładność po¬ 
miarów jest na ogół niewystarczająca do jej wyja¬ 
śnienia. 

W latach dwudziestych E. Ising wykazał, że łań¬ 
cuch jednowymiarowy nie ma przejścia fazowego. 
W latach czterdziestych L. Onsager otrzymał do¬ 
kładne funkcje termodynamiczne modelu Isinga dla 
sieci kwadratowej płaskiej. Okazało się, że przejście 
fazowe występuje przy kTk = 2/[ln(j/2 -fi)]”" 1 » 


# 2,269185/. Było to pierwsze przejście fazowe 
obliczone w sposób ścisły na podstawie modelu 
oddziaływania. 

Wiadomo również, że przejście fazowe występuje 
w wypadku sieci trójwymiarowych, choć dokładnych 
funkcji termodynamicznych i Tk dotychczas dla nich 
nie znaleziono. 

Osobliwości funkcji termodynamicznych prowadzą 
do wzrostu fluktuacji momentu magnetycznego przy 
T -> Tk. Ponadto w otoczeniu Tk momenty magne¬ 
tyczne zaczynają się porządkować. Stąd, jeśli w jakim¬ 
kolwiek miejscu pojawi się fluktuacja momentu, to 
spowoduje ona uporządkowanie w dużym obszarze 
wokół tego miejsca. Można więc stwierdzić, że pro¬ 
mień korelacji fluktuacji momentu rośnie przy T Tk. 

Ze względu na wzrost fluktuacji i ich promienia kore¬ 
lacji, fluktuacje stają się makroskopowe przy T -> Tk. 

Daje to możliwość niekwantowego potraktowania 
pola fluktuacji i operowania nim jako obiektem 
wyjściowym dla teorii. Pozwoliło to wyznaczyć postać 
asymptotyczną funkcji termodynamicznych przy 
T Tk i stało się źródłem szybkiego rozwoju teorii 
przejść fazowych w ostatnim dziesięcioleciu, mimo 
braku wyraźnego postępu w zakresie modeli dokład¬ 
nie rozwiązalnych. Zasadnicza rola klasycznego pola 
fluktuacji w pobliżu Tk powoduje, że przejścia fazowe, 
niezależnie od różnicy ich mechanizmów, stają się 
do siebie bardzo podobne. 

Omawialiśmy dotychczas termodynamikę staty¬ 
styczną stanów równowagi. Na zakończenie dołączmy 
parę słów o nierównowagowej termodynamice sta¬ 
tystycznej. Wyobraźmy sobie, że na znajdujący się nierównowa- 
w równowadze układ makroskopowy podziałaliśmy gowa termo- 
polem zewnętrznym, wywołującym zaburzenia stanu dynamika 
równowagi. Prawdopodobieństwa znalezienia stanu statystyczna 
kwantowego / w zespole zaczynają zależeć wtedy od 
czasu, podobnie jak i wartości średnie wielkości 
fizycznych. Równania opisujące zmiany tych wielkości 
pod wpływem przyłożonych pól zewnętrznych wy¬ 
wodzą się, podobnie jak równowagowa termodyna¬ 
mika statystyczna, z równań ruchu oraz podejścia 
statystycznego, związanego z niepełnym opisem ukła¬ 
du. Ostatnia kwestia wynika z zainteresowania jedy¬ 
nie wielkościami makroskopowymi opisującymi 
układ. Otrzymane równania nie mają, z reguły, 
zamkniętej postaci układu skończonej liczby n rów¬ 
nań dla n niewiadomych funkcji. Układ taki udaje 
się doprowadzić do postaci zamkniętej w szczególnych 
warunkach fizycznych. Dotyczy to przede wszystkim 
gazów rozrzedzonych, tj. takich, dla których promień 
oddziaływania międzycząsteczkowego jest znacznie 
mniejszy od średniej odległości między cząsteczkami. 

Równania dla takiego układu, w przypadku klasycz¬ 
nym, zostały podane przez Boltzmanna w latach 
siedemdziesiątych ubiegłego stulecia. Mają one kształt 
równań bilansu prawdopodobieństwa w przestrzeni 
fazowej jednej cząstki, przy czym zderzenia między- 
cząstkowe grają istotną rolę w bilansie. Podobnie 
można z reguły podać zamknięty układ równań 
dla układów słabowzbudzonych, kiedy możemy 
posłużyć się obrazem kwazicząstek, przy czym wła¬ 
sności kwantowe ich gazu są bardzo istotne. Można 
wreszcie mówić o zamknięciu układu równań dla 
niektórych modeli oddziaływania. Podobnie można 
przewidzieć nierównowagowe własności układów 
w pobliżu punktu krytycznego Tk. Dodajmy jeszcze, 
że listę tę trudno jest wyczerpać. 

We wszystkich sytuacjach równania istotnie uprasz- słabe pole 
czają się, gdy pole zaburzające jest na tyle słabe, zaburzające 
że odchylenie od równowagi można uznać za liniową 
funkcję pola. Prawa Ohma czy Fouriera wynikają 
z nierównowagowej termodynamiki statystycznej 
właśnie jako rezultat takiego zlinearyzowanego 
podejścia. Podobnie, jeśli pole zmienia się bardzo 
słabo na średniej odległości międzycząstkowej, to 
reakcję układu na pole można potraktować w sposób 
makroskopowy, co znakomicie upraszcza zarówno 
równania jak i ich rozwiązania. 
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Należy stwierdzić, że bardziej ścisłe lub dokładne 
rozwiązanie zagadnienia wielu oddziałujących cząstek 
jest bardzo często trudne lub wręcz niemożliwe. Jest to 
przyczyną rozwoju wszelkiego rodzaju metod ekstra¬ 
polacyjnych w termodynamice statystycznej, których 


dokładność dość trudno oszacować. Wspomniane 
trudności sprawiają, że bada się również nierówności 
dla funkcji termodynamicznych. 

L. Landu, E. Lifszic Fizyka teoretyczna, Fizyka statystycz¬ 
na, Warszawa 1959; F. Reif Fizyka statystyczna. Warszawa 1971. 


Przejścia fazowe i zjawiska krytyczne 

Bogusław Mrygoń 


Układy fizyczne złożone z wielu cząstek (atomów, 
molekuł) możemy podzielić na dwa rodzaje. Do pier- 
układy wszej kategorii zaklasyfikujemy takie układy, które 
cząstek można opisać traktując je jako zbiory cząstek nie- 
nieoddzia- oddziałujących ze sobą. Przykładem takiego układu 
fujących jest gaz idealny złożony z nieoddziałujących atomów 
lub paramagnetyk, w którym oddziaływanie momen¬ 
tów magnetycznych atomów jest na tyle słabe, że nie 
wpływa na właściwości magnetyczne układu. Drugą 
grupę stanowią układy, których nawet w przybliżeniu 
nie można opisać teoretycznie, nie uwzględniając 
mikroskopowych oddziaływań. Jeżeli układ taki 
znajduje się w odpowiednich warunkach zewnętrz- 
układy nych, to mikroskopowe oddziaływania mają charakter 
cząstek zjawiska kolektywnego, które w zależności od rodzaju 
oddziałują- oddziaływań przejawia się jako określone właści- 
cych wości makroskopowe układu. Dla zilustrowania tego 
wymienimy kilka najbardziej typowych układów, 
których specyficzne właściwości są wynikiem kolek¬ 
tywnych oddziaływań mikroskopowych. Sponta¬ 
niczne namagnesowanie kryształu ferromagnetyczne¬ 
go jest rezultatem oddziaływania wymiany spinów 
atomowych. 

W metalach w niskich temperaturach pojawia się 
stan nadprzewodnictwa, który jest wynikiem specy¬ 
ficznego (niekulombowskiego) oddziaływania elek¬ 
tronów. Krystaliczny stan skupienia wynika z oddzia¬ 
ływań międzyatomowych. 

W wymienionych tutaj przykładach kolektywne 
oddziaływania mikroskopowe powodują powstawa¬ 
nie określonych stanów układu, którym ogólnie 
można przypisać pewien rodzaj mikroskopowego 
uporządkowania. Wyjątek stanowi kondensacja ideal¬ 
nego gazu Bosego. Stan układu — lub jego części — 
charakteryzujący się przestrzenną jednorodnością 
makroskopową i określonym mikroskopowym upo- 
faza układu rządkowaniem nazywamy fazą. Układ może się znaj¬ 
dować w danej fazie tylko w ściśle określonych prze¬ 
działach wartości zmiennych termodynamicznych, 
takich jak: temperatura, ciśnienie, natężenie pola 
magnetycznego. W ogólności możliwe jest istnienie 
kilku faz danego układu. Przejście układu od jednej 
do drugiej fazy, nazywane ogólnie przejściem (prze¬ 
mianą) fazowym, zachodzi w określonych warunkach 
termodynamicznych, np. gdy temperatura osiąga 
wartość krytyczną 7*, nazywaną też punktem kry¬ 
tycznym układu. Przejścia fazowe należą do zjawisk 
występujących powszechnie w różnych układach 
fizycznych. Najważniejsze z nich to: zmiany stanu 
skupienia, przejścia magnetyczne typu ferromagne- 
tyk-paramagnetyk, przejścia typu porządek-niepo- 
rządek w stopach podwójnych oraz przejścia do stanu 
nadprzewodnictwa. Lista ta nie wyczerpuje wszyst¬ 
kich przejść fazowych, które występują szczególnie 
w ciałach stałych. Z przejściami fazowymi związane 
są zjawiska nazywane krytycznymi, których przeja¬ 
wem jest charakterystyczne zachowanie się w pobliżu 
punktu krytycznego niektórych właściwości układu, 
np. ciepła właściwego. Mimo ogromnych różnic 
między naturą mikroskopowych oddziaływań w róż¬ 
nych układach, przejścia fazowe i zjawiska krytyczne 
zachodzące w tych układach wykazują wiele wspól¬ 
nych cech i analogii. Fakt ten umożliwia podanie 
ogólnego, jednolitego opisu wszystkich przejść 
fazowych i zjawisk krytycznych. 


W fenomenologicznym opisie zachowania się ukła- termodyna* 
du fizycznego posługujemy się zbiorem zmiennych micznyopis 
termodynamicznych. Dla każdego szczególnego ukła- przejścia 
du możemy wyodrębnić wiele zmiennych termodyna- fazowego 
micznych, ale do kompletnego opisu jednoskładniko¬ 
wego układu znajdującego się w jednej fazie wystarczą 
trzy zmienne termodynamiczne, przy czym tylko 
dwie z nich są zmiennymi niezależnymi. Liczbę 
zmiennych niezależnych n zwaną liczbą termodyna¬ 
micznych stopni swobody wyraża się wzorem 

n = c+2— r, (1) 

gdzie c jest liczbą niezależnych składników układu, 
a r — liczbą faz współistniejących w równowadze. 

W zależności od wyboru zmiennych niezależnych 
określona jest charakterystyczna funkcja stanu. Jeżeli 
do opisu gazu złożonego z atomów wybierzemy jako 
zmienne niezależne temperaturę T i ciśnienie p y to 
wszystkie informacje o zachowaniu się i właściwo¬ 
ściach układu zawarte są w funkcji stanu G(T y p) 
i możemy je otrzymać z odpowiednich związków 
termodynamicznych. Funkcja G(T,p) jest często na¬ 
zywana potencjałem Gibbsa. Jeżeli parę zmiennych 
niezależnych tworzy temperatura T i objętość V 
układu, to funkcją stanu jest F(T y V) — zwana energią 
swobodną. Wszystkie możliwe termodynamiczne 
funkcje stanu są ogólnie nazywane potencjałami ter¬ 
modynamicznymi, ponieważ pracę związaną z przej¬ 
ściem układu od stanu a do stanu b można wyrazić 
przez spowodowany tym przejściem przyrost funkcji 
stanu. 

Warunkiem równowagi termodynamicznej układu 
jest minimum potencjałów termodynamicznych 
(—► Termodynamika fenomenologiczna) przy ustalo¬ 
nych wartościach odpowiednich zmiennych niezależ¬ 
nych. Każdy układ zamknięty osiąga po pewnym 
czasie stan równowagi termodynamicznej. Jeżeli przej¬ 
ście fazowe zachodzi w dostatecznie długim cza¬ 
sie, to możemy założyć, że wszystkie stany pośrednie 
układu w otoczeniu punktu krytycznego są stanami 
równowagi, a więc do opisu przejścia fazowego mo¬ 
żemy stosować formalizm termodynamiki procesów 
odwracalnych. 

Rozpatrzmy przy ustalonej temperaturze T i ci- układ 
śnieniu p jednoskładnikowy układ (rys. 1), który znaj- dwufazowy 
duje się w stanie równowagi dwu faz (układ dwufa¬ 
zowy). Może to być faza ciekła w kontakcie z fazą 
gazową. Ciecz i gaz mogą współistnieć w równowadze, 
jeżeli temperatura i ciśnienie obydwu faz są sobie 
równe. Przyjmijmy, że N x i N 2 oznaczają odpowiednio 
liczby atomów, a i p 2 — wartości potencjału Gib¬ 
bsa na jeden atom w obydwu fazach (p — G/N jest 
potencjałem chemicznym). Funkcję G{T y p) możemy 
więc wyrazić wzorem: 

G(T y p) = Nito+Ntftt. (2) 

Ponieważ ciśnienie i temperatura układu są stałe, 
warunek na minimum potencjału termodynamicznego R ys . i. 

(w tym wypadku dG = 0) zredukuje się do postaci: 

PidN x - +p 2 dN 2 = 0. (3) 

W rozpatrywanym układzie całkowita liczba atomów 
jest zachowana (dN 1 +dN 2 = 0) zatem 

f*i = łh- ( 4 ) 
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potencjał Gibbsa 


Jest to jeden z ważniejszych wniosków termody¬ 
namiki przejść fazowych: w obszarze współist¬ 
nienia, a tym samym również w punkcie krytycz¬ 
nym, potencjały chemiczne obydwu faz są sobie 
równe. 

przejścia Analizując fakty doświadczalne, Ehrenfest wprowa- 
f azowe dził klasyfikację przejść fazowych; przemianę nazy- 
/7-tego wa się przejściem fazowym n-tego rodzaju, jeżeli ko- 
rodzaju lejne pochodne potencjału Gibbsa aż do (n— l)-szcj 
włącznie są funkcjami ciągłymi, natomiast n-ta po¬ 
chodna ma w punkcie przejścia nieciągłość skokową. 
Zgodnie z takim określeniem, potencjał G i jego po¬ 
chodne będą miały następujący przebieg względem 
każdej zmiennej niezależnej: przy przejściu I rodzaju 
funkcja G jest ciągła załamana (rys. 2a), natomiast 
jej pochodne są nieciągłe; przy przejściu II rodzaju 
funkcja G jest ciągła gładka (rys. 2b), jej pierwsza 
pochodna jest ciągła załamana, natomiast wyższe po¬ 
chodne są nieciągłe. Opis przejść fazowych zastoso¬ 
wany w definicjach Ehrenfesta należy traktować jako 




a) b) 

Rys. 2. Przykłady możliwych przebiegów potencjału termody¬ 
namicznego w obszarze przejścia fazowego: a) I rodzaju, b) II ro¬ 
dzaju 

idealizację rzeczywistych przebiegów funkcji G i jej 
pochodnych. Pochodne te mają określony sens fi¬ 
zyczny, np. ciepło właściwe przy stałym ciśnieniu 
wyraża się przez drugą pochodną funkcji G wzglę¬ 
dem temperatury: 



Obserwowane w otoczeniu punktu krytycznego prze¬ 
biegi wielkości fizycznych w układach rzeczywistych 
o skończonych rozmiarach są co najwyżej zbliżone 
przejścia do teoretycznie przewidywanych w klasyfikacji 
fazowe Ehrenfesta. Za typowe przejścia I rodzaju uważa się 
liIIrodzaju zmiany stanu skupienia oraz zmiany struktury kry¬ 
stalicznej. Najczęściej wymienianymi przykładami 
przejść II rodzaju są przejścia od stanu ferromagne¬ 
tycznego do paramagnetycznego w punkcie Curie 
oraz przejście od stanu nadprzewodnictwa do stanu 
zwykłego przewodzenia, zachodzące w temperaturze 
krytycznej przy nieobecności zewnętrznego pola 
magnetycznego. Wiele przejść fazowych nie mieści 
się w ogóle w klasyfikacji Ehrenfesta. Znane są rów¬ 
nież inne klasyfikacje przejść fazowych, np. oparta 
na przebiegu ciepła właściwego w pobliżu tempera¬ 


tury krytycznej. Istnieje przy tym dość duża dowol¬ 
ność zaszeregowania konkretnych przejść fazowych 
do określonego rodzaju. 

Na rys. 3 przedstawiono schematycznie wykres fa¬ 
zowy wszystkich, z wyjątkiem helu (-► Nadpłynność), 
substancji jednoskładnikowych. Krzywe 7, 2 i 3 od¬ 
dzielają obszary, w których substancja występuje 
w określonym stanie skupienia i nazywane są krzy¬ 
wymi równowagi faz. Dla wartości zmiennych ter¬ 
modynamicznych, określonych przez te krzywe, 
możliwe jest współistnienie odpowiednich faz w rów¬ 
nowadze. W punkcie wspólnym trzech krzywych rów¬ 
nowagi mogą zatem współistnieć trzy fazy. Punkt 
ten nazywany jest punktem potrójnym. 

Jak już wspomniano, zmiany stanu skupienia są 
przejściami fazowymi I rodzaju. Przejścia te połą¬ 
czone są z wydzieleniem lub pochłonięciem ciepła 
(tzw. utajone ciepło przemiany: ciepło parowania, 
ciepło topnienia, ciepło sublimacji). Wyjątek stanowi 
przejście fazowe w punkcie K> które jest ciągłe, tzn. 
w punkcie K można przemienić ciecz w gaz i odwrot¬ 
nie w sposób ciągły. Ciepło przemiany w punkcie K , 
zwanym punktem krytycznym, znika. W obszarach 
fazy ciała stałego różnych substancji obserwujemy 
wiele innych przejść fazowych, których przykłady 
podano na wstępie. Zachowanie się substancji w po¬ 
bliżu punktów krytycznych zlokalizowanych w fazie 
stałej (np. krytyczne zachowanie magnetyków, ferro¬ 
elektryków, nadprzewodników) wykazuje wiele ana¬ 
logii do zachowania się gazu w pobliżu punktu kry¬ 
tycznego K. Z tego względu omówimy tu bardziej 
szczegółowo krzywą równowagi faz w układzie ciecz- 
-gaz. 

Przejście ciągłe w układzie ciecz-gaz odkryte zo¬ 
stało w 1869 r. przez Andrewsa, który badał zacho¬ 
wanie się krytyczne dwutlenku węgla. Zachowanie 
się gazu opisąne jest przez równanie stanu. Zakłada¬ 
jąc, że znamy potencjał oddziaływania U(r) między 
atomami, możemy dla gazu złożonego z N atomów 
w objętości V napisać ścisłe równanie stanu w po¬ 
staci : 


NkT , W 
P ~ V + 3V ’ 


( 6 ) 


gdzie k oznacza stałą Boltzmanna, a W jest wielko¬ 
ścią związaną z siłami międzyatomowych oddziały¬ 
wań, nazywaną wiriałem sił wewnętrznych: 


N N 

w = — F„ę ( -Ol - (7) 

<-l J -1 

Wektory n i rj oznaczają położenia atomów, a Fu 
jest siłą, z jaką te atomy oddziałują. Wyrażenie (7) 
uwzględnia oddziaływania wszystkich par atomów 
w układzie, przy czym aby każda para była liczona 
tylko raz, przed znakiem sumy występuje współczyn¬ 
nik 1 / 2 * Siła F zależy od potencjału £/(r), którego 
kształt jest przedstawiony na rys. 4, przy czym 
F — —dU(r)!dr. Pierwszy wyraz równania (6), tzw. 
ciśnienie kinetyczne, jest związane z energią kine¬ 
tyczną atomów i opisuje zachowanie się gazu ideal¬ 
nego, w którym przejście fazowe nie zachodzi. 
Drugi wyraz — ciśnienie statyczne — stanowi po¬ 
prawkę do równania stanu związaną z energią po- 


zmiany stanu 
skupienia 


punkt 

potrójny 


przejście 
fazowe 
w gazie 
rzeczywis¬ 
tym 



Rys. 3. Schematyczny 
wykres fazowy substan¬ 
cji jednoskładnikowej 


Rys. 4. Potencjał oddzia¬ 
ływania międzyatomo- 
wego w gazie rzeczywis¬ 
tym. Widać,że przyr>r 0 
c Uf dr > 0, zatem działają 
siły przyciągające, nato¬ 
miast przy r<r 0 działają 
siły odpychające 
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równanie van tencjalną wzajemnego oddziaływania atomów. W opi- 
der Waalsa sie gazu rzeczywistego posługujemy się różnymi przy¬ 
bliżeniami równania stanu (6). Rozpatrzymy jedno 
z najbardziej znanych przybliżeń tego równania, hi¬ 
storycznie znacznie od niego wcześniejsze, półempi- 
ryczne równanie van der Waalsa 

= NkT, (8) 

gdzie stałe a i b określane są dla każdego gazu eks¬ 
perymentalnie. Stała a związana jest z oddziaływa¬ 
niem między atomami (molekułami), b — ze skoń¬ 
czonymi rozmiarami atomów. Na rys. 5 przedsta¬ 
wiona jest typowa izoterma otrzymana z równania 
(8). Warunek równowagi (minimum potencjału ter¬ 
modynamicznego) można, wykorzystując tożsamo¬ 
ściowe związki termodynamiki, zapisać w postaci 



warunek Nierówność ta, nazywana warunkiem stabilności 
stabilności mechanicznej, oznacza, że jeżeli przy stałej tempera- 
mechanicz- turze ciśnienie układu wzrasta, to jego objętość musi 
nej maleć. Z rys. 5 widać, że na odcinku BC izoterma van 
der Waalsa nie spełnia warunku (9). Oznacza to, że 
izotermy otrzymane z równania (8) są przynajmniej 



Rys. 5. Izoterma opisana równaniem van der Waalsa 



Rys. 6. Wykres fazowy gazu rzeczywistego 


Waalsa odpowiadają stany cieczy przegrzanej i gazu 
przechłodzonego — możliwe w szczególnych warun¬ 
kach. 

Rys. 6 przedstawia rodzinę izoterm (8) wykreślo¬ 
nych przy wykorzystaniu konstrukcji Maxwella. 
Miejscem geometrycznym końcowych punktów fi¬ 
zycznych gałęzi izoterm jest krzywa BKC (rys. 6) 
ograniczająca obszar, w którym układ nie może 
w żadnym wypadku występować jako jednofazowy. 
Podobnie otrzymuje się krzywą równowagi faz AKD 
ograniczającą obszar, w którym dwie fazy współ¬ 
istnieją w równowadze. W obszarach między krzywą 
AKD i BKC możliwe jest występowanie cieczy prze¬ 
grzanej lub gazu przechłodzonego. Punkt K, w któ¬ 
rym krzywe BKC i AKD są styczne, tzn. punkt okre¬ 
ślony współrzędnymi pk, Vk y Tk , któremu odpo¬ 
wiada nieskończenie mała długość odcinka AD — 
nazywamy punktem krytycznym. W punkcie krytycz¬ 
nym 



Aby stan układu w punkcie krytycznym był stanem 
równowagi, musi znikać również druga pochodna, 
tzn. 



Warunek ten wynika z ogólniejszych rozważań termo¬ 
dynamicznych. Spełnienie obu warunków zostało po¬ 
twierdzone doświadczalnie, w granicach dokładności 
pomiarów. Z warunków równowagi stanu krytycz¬ 
nego wynika, że ciepło właściwe gazu przy stałym ci¬ 
śnieniu dąży w punkcie krytycznym do nieskończo¬ 
ności. Równania (8), (10) i (11) pozwalają wyrazić 
temperaturę krytyczną Tk, ciśnienie krytyczne pk 
i objętość krytyczną Vk przez stałe a i b: 


Tk = 


_8 

27 


a 

~bk y 


K*=3M>, p k = 


27 


a 

1W' 


( 12 ) 


Wprowadzając następnie bezwymiarowe zmienne 
zredukowane 


p = piPk\ V=V/Vk, T ~ T/Tk, (13) 


otrzymujemy zredukowane równanie van der Waalsa: 




(14) 


W równaniu tym nie ma żadnych stałych charaktery¬ 
zujących dany gaz. Zatem jest to równanie stanu 
wszystkich układów, do których można stosować rów¬ 
nanie van der Waalsa. Stany dwóch układów, któ¬ 
rych zmienne zredukowane mają takie same wartości, 
nazywamy stanami odpowiednimi lub stanami od¬ 
powiadającymi sobie. Zredukowane izotermy okre¬ 
ślone równaniem (14), są jednakowe dla wszystkich 
gazów. Wynik taki jest znany jako prawo stanów 
odpowiednich. Stany krytyczne wszystkich gazów 
też są oczywiście stanami odpowiednimi. Na pod¬ 
stawie wyznaczonych wartości Tk, Pk i Vk znajdu¬ 
jemy, że dla jednego mola gazu zachodzi 


p k Vk = 3 
RTk 8 ’ 


(15) 


w części niefizyczne. Wynika to z faktu, że równanie 
(8) jest tylko przybliżeniem równania (6). Niefizycz- 
ną izotermę van der Waalsa można poprawić, posłu- 
konstrukcja gując się tzw. konstrukcją Maxwella. Polega ona na 
Maxwel!a wykreśleniu poziomego odcinka AD (linia przery¬ 
wana), który łączy dwie gałęzie izotermy FA i DG 
odpowiadające fazie ciekłej i fazie gazowej układu. 
Z warunku (4) wynika, że odcinek AD należy tak wy¬ 
kreślić, aby powierzchnie S x i S 2 były sobie równe. 
Między punktem A i D układ jest niejednorodny, 
tzn. podzielony na dwie fazy współistniejące w rów¬ 
nowadze. Odcinkom AB i CD izotermy van der 


gdzie R jest stałą gazową niezależną od rodzaju 
gazu. Zostało stwierdzone doświadczalnie, że stosu¬ 
nek (15), nazywany krytycznym, rzeczywiście jest 
prawie taki sam dla różnych gazów. Np. wartość sto¬ 
sunku krytycznego wyznaczona doświadczalnie dla 
neonu wynosi 0,295, dla argonu 0,290, ksenonu 0,293, 
azotu 0,291, tlenu 0,292, etanu 0,288. Średnia dla 
wielu gazów wynosi 0,292. Wprawdzie niezgodność 
między teoretycznym wynikiem (15) i wartością do¬ 
świadczalną stosunku krytycznego jest dość duża (ok. 
25%), ale trzeba pamiętać, że równanie van der 
Waalsa jest tylko przybliżeniem ścisłego równania 
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stanu. Niemniej jednak równanie to daje ogólny 
i zgodny jakościowo z faktami doświadczalnymi opis 
przejścia fazowego w gazie rzeczywistym. 

Można podać analogiczne opisy przejść fazowych 
w innych układach fizycznych. Dla każdego rodzaju 
układu fizycznego istnieją charakterystyczne zmienne 
termodynamiczne, ale ogólna postać związków ter¬ 
modynamicznych jest wspólna dla wszystkich ukła¬ 
dów. Jeżeli dokonamy np. następującej zamiany 
zmiennych: V —M,p H (M oznacza namagneso¬ 
wanie układu, a H — natężenie pola magnetycznego), 
to funkcje termodynamiczne wyrażone w nowych 
zmiennych będą opisywały układ magnetyczny. Po¬ 
tencjał termodynamiczny G układu magnetycznego 
jest więc funkcją temperatury T i natężenia pola H. 
Wzór (5) określa w tym wypadku magnetyczne ciepło 
właściwe. Dla każdego układu możemy również 
wyprowadzić odpowiednie równanie stanu. Poniżej 
podamy tylko ogólne charakterystyki różnych przejść 
fazowych w wybranych układach fizycznych, 
przejścia W temperaturze Curie w ferromagnetykach lub 
magnetyczne temperaturze Nećla w antyferromagnetykach układ 
magnetyczny przechodzi od stanu paramagnetycznego 
do ferro- lub antyferromagnetycznego (-> Teoria 
magnetyzmu). Spiny atomów zorientowane chaotycz¬ 
nie w fazie para- tworzą poniżej punktu krytycznego 
odpowiednie uporządkowanie magnetyczne. W ferro- 
magnetyku powstaje spontaniczne namagnesowanie 
układu. W antyferromagnetyku wypadkowy moment 
magnetyczny układu równy jest zeru, można nato¬ 
miast mówić o spontanicznym namagnesowaniu pod¬ 
sieci. Są również znane przejścia typu paramagnetyk- 
-ferrimagnetyk (ferryty), w których faza odpowiada¬ 
jąca uporządkowaniu magnetycznemu spinów ma 
wypadkowe namagnesowanie wynikające z niepełnej 
kompensacji momentów magnetycznych dwu pod¬ 
sieci. 

W punktach przejścia magnetycznego niektóre 
wielkości termodynamiczne wykazują anomalie (rys. 
7, punkt 7c), mające ten sam charakter w różnych 
magnetykach. Bardzo podobne przejścia fazowe ob¬ 
serwuje się w ferroelektrykach, 
przejścia W wielu kryształach występują przejścia fazowe 
strukturalne polegające na zmianie symetrii struktury krystalicznej. 
w kryształach Zachodzą one przy zmianie temperatury lub ciśnienia 
i są najczęściej przejściami fazowymi I rodzaju. To¬ 
warzyszy im wydzielenie lub pochłonięcie ciepła 
(rys. 7, punkty T kl i 7**). 



Rys. 7. Ciepło właściwe żelaza w funkcji temperatury. Punkt Tc 
odpowiada temperaturze Curie (przejście magnetyczne). W punk¬ 
tach Tki i Tkz zachodzą przejścia strukturalne. Żelazo w fazie 
P i S tworzy sieć regularną przestrzennie centrowaną, a w fazie 
y — płasko centrowaną 


uporządko- W dwuskładnikowych stopach o składzie stechio- 
wanie metrycznym powstają w określonych temperaturach 
stopów stany mające cechy związku chemicznego. Oznacza 
to, że poniżej temperatury przejścia fazowego pow¬ 
staje faza o całkowitym, wzajemnym uporządkowa¬ 
niu dwóch rodzajów atomów A i B, np. ABABAB _ 

Wzajemne położenia atomów A i B powyżej tempera¬ 
tury krytycznej są zupełnie przypadkowe. 


Wiele metali i stopów ochłodzonych do dostatecz¬ 
nie niskich temperatur staje się nadprzewodnikami. 
Zjawisko to stwierdzono w próbkach ponad 30% 
pierwiastków i więcej niż 1000 stepów. W fazie nad¬ 
przewodzącej znika opór elektryczny (-*» Nadprze¬ 
wodnictwo), przy czym przejście od stanu przewo¬ 
dzenia normalnego do stanu nadprzewodnictwa jest 
bardzo ostre. Ponadto nadprzewodnik umieszczony 
w słabym polu magnetycznym zachowuje się jak do¬ 
skonały diamagnetyk, tzn. indukcja magnetyczna 
wewnątrz nadprzewodzącego kryształu jest równa 
zeru (zjawisko Meissnera). Przejście od stanu nad¬ 
przewodnictwa do stanu przewodzenia normalnego 
może być spowodowane wzrostem temperatury po¬ 
wyżej wartości krytycznej 7* lub zewnętrznym polem 
magnetycznym o natężeniu większym od wartości 



Rys. 8. Wykres fazo- T k 

wy nadprzewodnika temperatura T 


krytycznej 77*. Temperatury krytyczne zbadanych 
nadprzewodników znajdują się w przedziale 0,1-20 K. 
Natężenie pola krytycznego Hic jest funkcją tempera¬ 
tury (rys. 8). 

Charakterystyczną, doświadczalnie stwierdzoną 
cechą wszystkich przejść fazowych jest anomalne za¬ 
chowanie się niektórych wielkości termodynamicz¬ 
nych, gdy układ zbliża się do punktu krytycznego. 
Charakter anomalnego przebiegu wielkości termody¬ 
namicznej /(a) w otoczeniu punktu krytycznego moż¬ 
na przedstawić w ogólnej postaci: 

/(e)~e v , gdy £->0, (16) 

gdzie e = 17—7*1/7* oznacza zredukowaną odległość 
od punktu krytycznego na osi temperatury, a v jest 
tzw. wykładnikiem krytycznym. Zależność (16) nie 
oznacza, że wartość wielkości f(e) jest proporcjonalna 
do prostego wyrażenia potęgowego e v , a określa jedynie 
charakter zachowania się tej wielkości, gdy 7->7*. 
Przy założeniu, że f(e) jest funkcją dodatnią, wykład¬ 
nik krytyczny jest zdefiniowany następująco: 


v — lim 

t —>o 


ln/(e) 

)ne 


(17) 


Z zależności (16) widać, że jeżeli v>0, to funkcja 
/(e) dąży do zera, gdy 7->7*. Dla v < 0 funkcja f(s) 
w punkcie krytycznym jest rozbieżna do nieskoń¬ 
czoności. Gdy funkcja f(e) jest w temperaturze kry¬ 
tycznej rozbieżna logarytmicznie lub ma wartość 
skończoną, to v = 0. Dia danego przejścia fazowego 
można wprowadzić zbiór wykładników krytycznych, 
przypisując każdej zachowującej się krytycznie wiel¬ 
kości termodynamicznej odpowiedni wykładnik kry¬ 
tyczny. Wartości wykładników krytycznych wyznacza 
się albo doświadczalnie, albo teoretycznie, rozpatru¬ 
jąc odpowiedni model oddziaływań w danym układzie 
fizycznym. Tak więc za pomocą jednej ogólnej relacji 
typu (16) można w sposób przybliżony opisać w oto¬ 
czeniu punktu krytycznego przebieg wszystkich wiel¬ 
kości termodynamicznych zachowujących się kry¬ 
tycznie, niezależnie od rodzaju układu fizycznego 
i typu przejścia fazowego. 

Istnienie wykładników krytycznych nie wynika 
z ogólnych zasad termodynamiki. Relację (16) można 
wyprowadzić z jednego założenia dotyczącego poten¬ 
cjału termodynamicznego. Wyraża się ją w formie 
hipotezy, że potencjał Gibbsa jest funkcją jednorodną 
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zredukowanej temperatury e oraz drugiej zmiennej 
A — właściwej dla tej funkcji stanu i danego układu 
fizycznego. Jeżeli G(e , ^4) jest funkcją jednorodną, to 
zachodzi dla dowolnych wartości X następująca rów¬ 
ność: 

G(X°e, X*A) = XG(e t A) (18) 

(a i b — pewne parametry). Funkcja jednorodna ma 
tę właściwość, źe jeżeli znamy jej wartości wzdłuż 
dowolnej krzywej otaczającej początek układu, to 
możemy wyznaczyć jej wartość w dowolnym punkcie 
przestrzeni drogą przeskalowania układu współrzęd¬ 
nych, gdy znamy wartości parametrów skalujących 
a i b. Stąd też założenie (18) nazywane jest hipotezą 
skalowania. Hipoteza skalowania pozwala wyrazić 
wszystkie wykładniki krytyczne dla układu opisanego 
funkcją stanu G(e y A) przez dwa parametry skalujące 
a i b. Z faktu tego wynika, że wykładniki krytyczne nie 
są wzajemnie niezależne. Związki między różnymi 
wykładnikami krytycznymi otrzymane z hipotezy 
skalowania są ogólnie nazywane prawami skalowa¬ 
nia. Jeden z bardziej znanych związków między wy¬ 
kładnikami krytycznymi opisującymi przejście fa¬ 
zowe w ferromagnetyku ma np. postać: 

a+2£+y=2, (19) 

gdzie a, /?, y są wykładnikami krytycznymi opisują¬ 
cymi zgodnie z relacją (16) zachowanie w pobliżu 
temperatury Tk odpowiednio magnetycznego ciepła 
właściwego, spontanicznego namagnesowania i po¬ 
datności magnetycznej. W praktyce, prawa skalowa¬ 
nia typu (19) stanowią bardzo użyteczny sprawdzian 
dokładności przy wyznaczaniu wartości wykładników 
krytycznych z danych doświadczalnych. Hipoteza 
skalowania nie daje możliwości wyznaczenia wartości 
wykładników krytycznych, a jedynie pozwala okre¬ 
ślić ogólne związki między nimi. Założenie, że po¬ 
tencjały termodynamiczne są funkcjami jednorod¬ 
nymi, nie zostało udowodnione. Tym niemniej, jed¬ 
nolity i w przybliżeniu zgodny z doświadczeniami 
opis zjawisk krytycznych, jaki uzyskujemy zakładając 
potencjał termodynamiczny w postaci (18), pozwala 
sądzić, że hipoteza skalowania zawiera w sobie pewną 
ogólną właściwość wyidealizowanych układów fizycz¬ 
nych. 

Dla pewnych modeli (np. modelu Isinga, -> Termo¬ 
dynamika statystyczna) możliwe jest ścisłe obliczenie 
funkcji termodynamicznych, jeżeli z układem prze¬ 
chodzimy do granicy termodynamicznej, tzn. dla 
jV->oo, V->oo t NjV= const. Przejścia fazowe w ta¬ 
kich modelach związane są z punktami osobliwymi 
funkcji termodynamicznych. Hipoteza skalowania 
opisuje układy w granicy termodynamicznej. 

Szczególnie ciekawą grupę zjawisk krytycznych 
tworzą efekty związane z rozpraszaniem promienio¬ 
wania przez układ znajdujący się w obszarze przej¬ 
ścia fazowego. Ośrodki, które w normalnych warun¬ 
kach są optycznie przezroczyste, w pobliżu punktu 
krytycznego stają się mętne. Natężenie promienio¬ 
wania rozproszonego przez układ pod kątem wzglę¬ 
dem kierunku fali padającej gwałtownie rośnie, gdy 
T-* T k . Zjawisko to, wyraźne w gazie rzeczywistym 
lub w cieczach podwójnych, nazywane jest krytyczną 
opalescencją. Temperaturowy przebieg zjawiska po¬ 
kazany jest na rys. 9. Zjawisko krytycznej opales- 


cencji zostało wyjaśnione po raz pierwszy przez pol¬ 
skiego fizyka M. Smoluchowskiego, który wykazał, 
że wzrost natężenia światła rozproszonego pod pew- 



temperatura 7 


Rys. 9. Krytyczna opalescencja w gazie 

nym kątem spowodowany jest przez fluktuacje gę¬ 
stości. (Pojęcie fluktuacji gęstości wprowadził do 
fizyki Smoluchowski; podał on wyrażenie na prawdo¬ 
podobieństwo ich powstawania). W stanach dale¬ 
kich od punktu krytycznego fluktuacje są bardzo małe 
i w opisie właściwości układu można je pominąć. 
Gdy temperatura zbliża się do punktu krytycznego, 
lokalne fluktuacje gwałtownie rosną, dzięki czemu 
układ staje się przestrzennie niejednorodny i wyka¬ 
zuje strukturę „ziarnistą”. Fluktuacje w pobliżu 
punktu krytycznego można traktować jako pojawia¬ 
jące się zarodki nowej fazy. Krytyczna opalescencja 
jest wynikiem rozpraszania światła na fluktuacjach 
gęstości. Analogiczne zjawiska występują także w in¬ 
nych układach fizycznych. Na przykład, w magnety¬ 
kach obserwuje się krytyczne rozpraszanie neutro¬ 
nów na fluktuacjach momentu magnetycznego w po¬ 
bliżu temperatury Curie; w stopach podwójnych 
i ferroelektrykach — krytyczne rozpraszanie promie¬ 
ni rentgenowskich. 

Teoria krytycznego rozpraszania oparta na modelu 
Smoluchowskiego nie jest jedyną teorią wyjaśniającą 
te zjawiska. Opis teoretyczny krytycznego rozprasza¬ 
nia można np. uzyskać na podstawie hipotezy ska¬ 
lowania. 

W wynikach doświadczalnych dotyczących przejść 
fazowych i zjawisk krytycznych jest wiele niejasności, 
a teoria tych zjawisk zawiera liczne luki i kontro¬ 
wersje. W tej dziedzinie fizyki prowadzi się intensywne 
badania, a każdy rok przynosi nowe osiągnięcia. 
W ostatnich latach główny wysiłek badawczy skiero¬ 
wany był na teoretyczne i doświadczalne wyznacza¬ 
nie wskaźników krytycznych. Jedną z metod wyzna¬ 
czania tych wskaźników jest metoda grupy renorma- 
lizacyjnej, podana przez K. Wilsona (1971 r.); sta¬ 
nowi ona konsekwentny etap rozwoju teorii skalo¬ 
wania. 

H.E. Stanley Jntroduction to Phase Transitions and Critical 
Phenomena , Oxford 1971 (tłum. ros., Moskwa 1973). 


Elektrodynamika 

Jan Mostowski 


Trudno jest wyobrazić sobie współczesne życie bez 
elektryczności. Urządzenia wykorzystujące zjawiska 
elektryczne spotyka się dosłownie na każdym kroku 
i nie można podać dziedziny życia, w której urządze¬ 
nia elektryczne nie odgrywają roli. 


Tymczasem historia prac nad poznaniem i wykorzy¬ 
staniem elektryczności w zasadzie nie jest długa, ma 
dopiero ok. 200 lat. Wprawdzie najprostsze zjawiska, 
takie jak elektryzowanie się niektórych ciał, znane 
były już w starożytności, ale nie było wówczas mowy 
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o ich głębszym zrozumieniu lub wykorzystaniu. Do¬ 
piero w drugiej połowie XVIII w. rozpoczęto iloś¬ 
ciowe badania elektryczności. Punktem wyjścia było 
stwierdzenie Charlesa Coulomba, że punktowe ła¬ 
dunki działają na siebie siłą odwrotnie proporcjonalną 
do kwadratu odległości między nimi. 

Wiek XIX to okres niesłychanie intensywnych prac 
zmierzających do wyjaśnienia zjawisk elektrycznych 
i magnetycznych. Ich ukoronowaniem stała się teoria 
Maxwella, porządkująca i systematyzująca wszystkie 
zjawiska elektryczne i magnetyczne. 

Niemal równocześnie z badaniami podstawowymi 
pojawiły się urządzenia wykorzystujące zjawiska elek¬ 
tryczne do celów praktycznych. 

W XX w. powstała nowa gałąź elektrodynamiki — 
elektrodynamika kwantowa, która opisuje oddziały¬ 
wanie pola elektromagnetycznego, m.in. o wielkiej 
częstotliwości, z mikroskopowymi obiektami, głów¬ 
nie elektronami. 

Elektrodynamikę można obecnie uważać za najdo¬ 
skonalszą teorię fizyczną. Jej prawom podlegają za¬ 
równo pola elektromagnetyczne w przestrzeni mię- 
dzygalaktycznej i międzygwiezdnej, jak i we wnętrzu 
atomu. Elektrodynamika opisuje olbrzymie bogactwo 
zjawisk z dziedziny spektroskopii atomów i molekuł, 
fizyki plazmy i wszystkich innych dziedzin nauki, 
w których występują ładunki elektryczne. Należy pod¬ 
kreślić, że w żadnym dotychczas przeprowadzonym 
eksperymencie nie stwierdzono odstępstw od przewi¬ 
dywań elektrodynamiki, mimo iż niektóre doświad¬ 
czenia były przeprowadzane z dokładnością do 10“ *%. 
Żadna inna teoria fizyczna nie może się szczycić po¬ 
dobnymi sukcesami. Nie oznacza to bynajmniej, że 
wszelkie efekty elektromagnetyczne są zrozumiałe, 
wiele pozostało do zrobienia w tej dziedzinie. Mo¬ 
żna tu wymienić kilka ważnych tematów, nad któ¬ 
rymi współcześnie pracują fizycy. 

Pierwsza sprawa wiąże się z optyką i dotyczy sil¬ 
nych pól elektromagnetycznych otrzymywanych z la¬ 
serów. Duże natężenie pola elektromagnetycznego 
panujące w wiązce światła laserowego może powodo¬ 
wać występowanie tzw. zjawisk nieliniowych. Mimo 
że podstawowe prawa oddziaływania światła z materią 
są zrozumiałe, to jednak ich zastosowanie do opisu 
konkretnych zjawisk jest sprawą trudną i nie jest jesz¬ 
cze jasne, jaki jest mechanizm powstawania niektó¬ 
rych efektów. Nowo odkryte nieliniowe zjawiska op¬ 
tyczne zachęciły do ogólnych badań nad silnymi wiąz 
kami światła i ich oddziaływaniem z materią (-► 
Optyka nieliniowa). 

Drugie bardzo ważne zagadnienie to zakres stoso¬ 
walności elektrodynamiki. Jak każda teoria fizyczna, 
tak i elektrodynamika została oparta na doświadcze¬ 
niach przeprowadzonych z określoną dokładnością. 
Zwiększanie dokładności pomiarów rozszerza zakres 
stosowalności teorii lub nakłada na nią ograniczenia. 
W dalszym ciągu wykonuje się szereg bardzo subtel¬ 
nych doświadczeń, mających na celu sprawdzenie po¬ 
prawności elektrodynamiki. Nigdzie nie znaleziono 
odstępstw od elektrodynamiki, rozszerzył się tylko 
zakres jej stosowalności. 

Trzecia dziedzina współczesnych prac nad elektro¬ 
dynamiką to kwestia pewnych sprzeczności tkwiących 
w teorii Maxwella. Chodzi tu o zrozumienie nieskoń¬ 
czonej energii oddziaływania punktowego ładunku, 
np. elektronu, na siebie. Próby modyfikacji teorii 
Maxwella, które by pozwoliły usunąć te trudności, 
nie dały dotąd pozytywnych rezultatów, lecz są ciągle 
na nowo podejmowane. 


Co to jest elektrodynamika klasyczna 

Elektrodynamika jest teorią pola elektromagnetycz¬ 
nego i ładunków elektrycznych. Wiemy, że między 
ładunkami elektrycznymi działają siły. Wyrażenie opi¬ 
sujące te siły jest dość zawiłe, więc dla wygody wpro¬ 
wadzono pojęcie pola elektromagnetycznego. 


Wyobraźmy sobie dowolny układ ładunków elek- siła 
trycznych, w którym ładunki mogą się poruszać, działająca 
Układ taki wytwarza wokół siebie pole elektryczne na ładunek 
i magnetyczne. Pola te charakteryzujemy przez po- znajdujący 


danie dwóch wektorów: E (natężenie pola elektrycz- s j ę ^ po,u 
—» ol6ktroni3 a 

nego) i B (indukcja pola magnetycznego). Istnienie gnetycznym 
pola elektromagnetycznego wokół ładunków ozna¬ 
cza, że na dowolny inny ładunek e działa siła: 


F = eE-\-ev X B y 

gdzie v oznacza prędkość ładunku. Wzór ten stanowi 
definicję wektorów E i B (rys. 1). 



Rys. 1. Siła działająca na cząstkę o ładunku e poruszającą się 
z prędkością v jest sumą dwóch składowych eE i ev X B 


Widzimy, że siła działająca na ładunek składa się 
z dwóch członów: pierwszy pochodzi od pola elek¬ 
trycznego, drugi — od magnetycznego. Jeśli się ła¬ 
dunek e nie porusza, to działa na niego tylko siła 

ze strony pola elektrycznego, eE. Jest to dobrze znana 
siła, za pomocą której definiuje się wektor natężenia 
pola elektrycznego 

Jeśli się ładunek e porusza, działa na niego dodat¬ 
kowo siła ze strony pola magnetycznego, evxB y na¬ 
zywana siłą Lorentza. Jest ona prostopadła do kie¬ 
runku prędkości ładunku i definiuje wektor indukcji 
poia magnetycznego. 

Znając siłę działającą na cząstkę obdarzoną ładun- równanie 
kiem, można określić jej ruch. Wyznaczony on jest Newtona 
przez równanie Newtona: 


-j-mv — eE+evxB y 
at 


gdzie m jest masą cząstki. 

Jeśli przez m rozumiemy zależną od prędkości ma¬ 
sę m — mj j/1 —v 2 jc 2 , a przez m 0 — masę spoczynko¬ 
wą cząstki, to równanie powyższe opisuje poprawnie 
ruch cząstki o prędkości zbliżonej do prędkości 
światła. 

Z tej dość zawiłej postaci równania ruchu wynika, 

że w zależności od konkretnej postaci pól E i B ruch 
ładunków odbywa się po różnych, często bardzo 
skomplikowanych krzywych. Powyższe równanie 
ruchu opisuje więc olbrzymie bogactwo zjawisk za¬ 
chodzących np. w rozrzedzonej plazmie. 

Zajmijmy się teraz dokładniej samym polem elek- pole elektro- 
tromagnetycznym. Zastanówmy się, czy w ogóle ko- magnetyczne 
nieczne jest wprowadzanie tego pojęcia. W istocie nie 
powiedzieliśmy nic ponad to, że ładunki działają na 
siebie siłami. Przyjmowanie, że jeden ładunek wy¬ 
twarza pole elektryczne, a drugi doznaje ze strony pola 
działania siły, może się wydać sztuczną komplikacją. 

Podobnie jest z siłami magnetycznymi: przewodnik, 
przez który płynie prąd, działa siłą na poruszające się 
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równania 

EVfaxwella 


ładunki lub na igłę magnetyczną, ale czy koniecznie 
trzeba tu mówić, że prąd elektryczny powoduje po¬ 
wstanie pola magnetycznego? 

Pole elektromagnetyczne, pojęcie wprowadzone 
przez M. Faradaya (1830 r.) w sposób trochę sztuczny, 
jako pewna interpretacja oddziaływań elektromagne¬ 
tycznych ładunków elektrycznych, okazało się jednak 
niesłychanie głębokie. Pełne zrozumienie konsek¬ 
wencji płynących z postulatu istnienia pola elektro¬ 
magnetycznego zawdzięczamy J. C. Maxwellowi 
(1861 r.). Maxwell uogólnił wcześniej znane wyniki 
Faradaya, Ampera i in. oraz sformułował słynne rów¬ 
nania, zwane równaniami Maxwella, opisujące pole 
elektromagnetyczne. 

Pełny układ równań Maxwella jest następujący: 


e 0 divE= q. 

o) 

- SB 


rot E= -p o-^p 

(2) 

div B = 0, 

(3) 

— SE -* 


rot B = +/» 

(4) 


gdzie E oznacza wektor natężenia pola elektrycznego, 

B — wektor indukcji pola magnetycznego, s 0 — 
przenikalność dielektryczną próżni, fi 0 — przenikal- 
ność magnetyczną próżni, q — gęstość ładunku elek¬ 
trycznego, j — gęstość prądu elektrycznego. 

Treść fizyczna równań Maxwella jest następująca: 
Z pierwszego równania wynika, że strumień pola elek¬ 
trycznego przechodzącego przez powierzchnię otacza¬ 
jącą ładunek jest proporcjonalny do wartości tego 
ładunku. Ponadto strumień ten nie zależy od wielko¬ 
ści powierzchni ani od jej odległości od ładunku. 
Innymi słowy, liczba linii sił pola elektrycznego prze¬ 
chodzącego przez powierzchnię otaczającą ładunek 
jest stała. Jeśli będziemy oddalać tę powierzchnię od 
ładunku nie zmieniając jej kształtu, to jej pole będzie 
rosnąć proporcjonalnie do kwadratu odległości od 
ładunku. A zatem pole elektryczne ładunku musi być 
odwrotnie proporcjonalne do kwadratu odległości. 
Prawidłowość ta zwana jest prawem Gaussa. 

Z drugiego równania Maxwella wynika, że zmienne 
w czasie pola magnetyczne wytwarza wirowe pole 
elektryczne. Prawo to znane jest też jako prawo in¬ 
dukcji Faradaya. 

Z trzeciego równania Maxwella wynika, że w przy¬ 
rodzie nie istnieją ładunki magnetyczne. Linie sił pola 
magnetycznego są zawsze zamknięte — w przeciwień¬ 
stwie do linii sił pola elektrycznego, które mogą się 
zaczynać i kończyć na ładunkach elektrycznych. Ten 
brak symetrii między polem elektrycznym i magne¬ 
tycznym stał się punktem wyjścia hipotezy istnienia 
monopoli magnetycznych. 

Czwarte równanie Maxwella ma najbardziej złożo¬ 
ną postać. Powiada ono, że źródłami pola magnetycz¬ 
nego są: zmiana w czasie pola elektrycznego i prąd 
elektryczny. 

Nie możemy tu rozważać wszystkich wniosków 
płynących z tych równań, powiemy jedynie, że rów¬ 
nania Maxwella pozwalają znaleźć pole elektromag¬ 
netyczne E i B wówczas, gdy znane jest położenie 
i prędkość ładunków. I tak np., gdy szukamy pola 
elektromagnetycznego w otoczeniu pojedynczego spo- 
prawo ożywającego punktowego ładunku elektrycznego e, 
CouEoroba to równanie Maxwella dają: 


e(7) = 


e r 
4n£ 0 r z r 9 


B = 0. 


Jest to znane prawo Coulornba. 

Wokół poruszających się ładunków oprócz pola 
elektrycznego istnieje również pole magnetyczne. 
Równania Maxwella pozwalają wyznaczyć to pole 
i odtworzyć np. prawa magnetycznego działania prą¬ 
dów 
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Omówiliśmy dwa odrębne zagadnienia: jakie pole 
elektromagnetyczne powstaje wokół ładunków oraz 
jak się poruszają ładunki w danym polu elektromag¬ 
netycznym. Pełna teoria elektromagnetyzmu powinna 
opisywać oba te procesy łącznie: poruszające się ła¬ 
dunki wytwarzają pola, które z kolei wpływają na ich 
ruch.'A więc konieczna jest teoria samozgodna, opi¬ 
sująca ruch ładunków w polach, które są wytworzone 
prżez te same ładunki. Warunki te spełniają równania 
Maxwella oraz równania ruchu ładunków Newtona, 
traktowane jako jeden układ równań. Pola powodu¬ 
jące ruch ładunków powstają w wyniku istnienia 
i ruchu ładunków, a ruch ładunków odbywa się pod 
wpływem sił pola elektromagnetycznego. 

Równania Maxwella i równania ruchu ładunku 
w polu elektromagnetycznym stanowią komplet praw 
elektrodynamiki w próżni. 

Olbrzymim osiągnięciem teorii Maxwella było to, fale elektro* 
że przewidziała ona istnienie fal elektromagnetycz- magnetyczne 
nych (rys. 2). O ich istnieniu może przekonać nastę¬ 
pujące rozumowanie: Z równań Maxwella wynika, że 



Rys. 2. W fali elektromagnetycznej źródłem pola elektrycznego 
są zmiany pola magnetycznego, a źródłem pola magnetycznego — 
zmiany pola elektrycznego 


w obszarach, w których nie ma ładunków ani prądów 
elektrycznych, pola elektryczne i magnetyczne speł¬ 
niają równania falowe: 


1 d 2 E 
c 2 dt 2 


+ AE= 0, 


i d 2 B 
c 2 dt 2 


+AB = 0, 


gdzie c = l/e 0 f* 0 • 

Z tych równań wynika, że w próżni pola elektryczne 
i magnetyczne mogą istnieć w postaci fal rozchodzą¬ 
cych się z prędkością c. Doświadczalne potwierdzenie 
istnienia fal elektromagnetycznych jest dziełem 
H. Hertza, który też zbadał ich podstawowe własno¬ 
ści. Wkrótce też stwierdzono, że fale świetlne są fa¬ 
lami elektromagnetycznymi o dużej częstości. Tak to 
dokonano syntezy dwóch dziedzin: nauki o elektrycz¬ 
ności i magnetyzmie z optyką. Należy podkreślić, że 
równania Maxwella poprawnie opisują zjawiska 
optyczne — takie jak dyfrakcja i interferencja fal 
świetlnych. 

Fale elektromagnetyczne poruszają się z olbrzymią prędkość fa 
prędkością (2,997924562±0,000000011)• 10 8 m-s" 1 efektroma- 
w próżni, przy czym prędkość ta nie zależy od dłu- gnetycznycl 
gości fali. Z taką prędkością rozchodzą się wszystkie 
zaburzenia pola elektromagnetycznego. Skończona 
prędkość rozchodzenia się zaburzeń pola elektromag¬ 
netycznego stała się punktem wyjścia szczególnej teorii 
względności (-> O niektórych podstawowych poję¬ 
ciach fizycznych). 

Podamy kilka prostych, ale fundamentalnych wnio¬ 
sków wynikających ze skończonej prędkości rozcho¬ 
dzenia się zaburzeń pola elektromagnetycznego. 

Wyobraźmy sobie dwa poruszające się ładunki 
(rys. 3). Ładunek 2 znajduje się w polu wytworzonym 
przez ładunek 1. Ale wartość pola w punkcie 2 jest 



Rys. 3. Siły elektryczne działające między ładunkami w ruchu. 

Siła działająca na ładunek 2 jest skierowana w stronę punktu 1\ v 
w którym znajdował się ładunek 1 we wcześniejszej chwili. Zatem O ■ — I 

siły elektromagnetyczne nie są centralne f 












taka, jaką wytworzył ładunek 1 będąc we wcześniej¬ 
szej chwili w punkcie 1\ W efekcie siła działająca .na 
ładunek 2 nie jest skierowana do ładunku 1, ale 
w kierunku V. A więc siły elektryczne działające mię¬ 
dzy ładunkami w ruchu nie są centralne i ich suma 
algebraiczna nie jest równa zeru. Jak wiemy (-► Za¬ 
sady zachowania), oznacza to, że pęd układu ładun¬ 
ków nie jest zachowany. I tak doszliśmy do para¬ 
doksu, że w izolowanym układzie dwóch ładunków 
pęd nie jest zachowany. 

pęd pola elek- Paradoks można usunąć, ale trzeba przyjąć, że pole 
tromagne- elektromagnetyczne wytwarzane przez ładunek ma 
tycznego pewien pęd. Pęd pola elektromagnetycznego dokład¬ 
nie kompensuje nadmiar pędu ładunków. Tak więc 
pęd samych ładunków nie jest wielkością stalą (nie 
jest zachowany), afó pęd układu składającego się z ła¬ 
dunków i pola elektromagnetycznego jest zachowany, 
moment pędu 7 doświadczenia przedstawionego na rys. 4 wynika, 
pola elektro- że pole elektromagnetyczne ma pewien moment pędu. 
magnetycz- Powyższe rozważania wykazują, że pole elektro- 
nego magnetyczne nie jest jedynie abstrakcyjnym tworem, 



Rys. 4. Na obwodzie tarczy znajdują się naładowane, izolowane 
kulki. Współosiowo z tarczą umieszczony jest solenoid, przez 
który płynie prąd z baterii. Gdy przepływ- prądu ustanie, tarcza 
zacznie się obracać. Moment pędu zostanie przekazany tarczy 
przez pole elektromagnetyczne wytworzone przez solenoid (wg 
R. P. Feynmana) 


służącym do opisu oddziaływań ładunków. Jest ono 
obiektem materialnym, mającym określone parame¬ 
try, jak energię, pęd i moment pędu. Materialność 
pola występuje jeszcze wyraźniej w elektrodynamice 
kwantowej, gdzie polu elektromagnetycznemu przy¬ 
pisujemy własność cząstek, kwantów y (fotonów), 
i obserwujemy przemianę kwantów y w inne cząstki. 

Zauważyliśmy, że spoczywający ładunek wytwarza 
pole elektryczne, natomiast poruszający się ładunek 
jest źródłem również pola magnetycznego. Ale pręd¬ 
kość ładunku zależy od wyboru układu odniesienia. 
Jeśli więc w układzie, w któiym ładunek spoczywa, 
pole magnetyczne nie występuje, to w innym układzie, 
poruszającym się ruchem prostoliniowym jednostaj¬ 
nym względem pierwszego, wystąpi niezerowe pole 
magnetyczne. Podobnie jeśli w jednym układzie wy¬ 
stępuje tylko pole magnetyczne, to w innym wystąpi 
również pole elektryczne. Tak więc pole elektryczne 
i magnetyczne nie mają charakteru bezwzględnego, 
lecz są składowymi jednej wielkości fizycznej — pola 
elektromagnetycznego; podział tego pola na pole 
elektryczne i magnetyczne zależy od wyboru układu. 

Warto zwrócić uwagę na fakt, że rozważania tego 
rodzaju stały się punktem wyjścia dla sformułowania 
szczególnej teorii względności. Aby prawa elektrody¬ 
namiki nie zależały od wyboru inercjalnego układu 
odniesienia, transformacja między układami musi być 
transformacją Lorentza. Należało więc tak zmodyfi¬ 
kować prawa mechaniki klasycznej, aby teoria ruchu 
ładunków i pola elektromagnetycznego nie zależała 
od wyboru układu odniesienia. 


Co to jest elektrodynamika kwantowa 

Oddziaływanie pola elektromagnetycznego z materią, 
szczególnie zaś fal o wielkiej częstości z atomami, 
jest bardziej złożone, niż to wynika z klasycznych 
równań Maxwella. Nie ma w tym nic dziwnego; 
atomy nie są obiektami klasycznymi i do analizy ich 
zachowania się koniecznie trzeba stosować opis 
kwantowy. Zatem analiza oddziaływania pola elek¬ 
tromagnetycznego z atomami także wymaga spójnego 
kwantowego opisu. Teoria kwantowa opisująca od¬ 
działywanie pola elektromagnetycznego z atomami 
nosi nazwę elektrodynamiki kwantowej. Jej początki 
datują się na rok 1900, kiedy to M. Planck ogłosił 
teorię promieniowania ciała doskonale czarnego; 
pełne sformułowanie zasad elektrodynamiki kwanto¬ 
wej nastąpiło na przełomie lat czterdziestych i pięć¬ 
dziesiątych, w pracach R. Feynmana i J. Schwingera. 

Trudno jest w tym miejscu podać choćby przybli¬ 
żony zarys formalizmu matematycznego używanego 
w elektrodynamice kwantowej (-* Teoria pola). 

Ograniczymy się do podania najważniejszych cech fi¬ 
zycznych odróżniających elektrodynamikę kwantową 
od elektrodynamiki klasycznej. 

Z elektrodynamiki klasycznej wynika, że przekazy- eiektro- 
wanie energii między układami ładunków i polem dynamika 
elektromagnetycznym ma charakter ciągły. Porusza- kwantowa 
jące się ładunki wysyłają lub pochłaniają promienio- a klasyczna 
wanie elektromagnetyczne; ilość energii pochłoniętej 
lub wysłanej zależy od ruchu ładunków i może przy¬ 
bierać dowolną wartość. Taki wynik jest zgodny 
z faktami doświadczalnymi w dziedzinie fal długich — 
radiowych czy mikrofal. Jednakże w dziedzinie fal 
krótkich, np. rentgenowskich, wynik ten nie jest 
zgodny z obserwacjami. Oddziaływanie pola elektro¬ 
magnetycznego o wielkiej częstości z atomami ma 
charakter wybitnie nieciągły. Okazało się, że atomy 
nie mogą przekazać dowolnej ilości energii polu 
elektromagnetycznemu, lecz tylko określoną jej 
ilość, równą różnicy energii poziomów atomu, między 
którymi zachodzi przejście. Energia ta pojawia się 
jako najmniejsza ilość pola elektromagnetycznego — 
foton. 

Oddziaływanie pola elektromagnetycznego z ła- fotony 
dunkami polega na emisji i absorpcji fotonów, od¬ 
bywa się więc porcjami, w sposób nieciągły. Jak wia¬ 
domo, tylko takie podejście prowadzi do popraw¬ 
nego, to znaczy zgodnego z doświadczeniem opisu 
takich procesów jak zjaw-isko fotoelektryczne, zja¬ 
wisko Comptona i in. (rys. 5, 6). 


Rys. 5. Zjawisko foto- 
elcktryczne polega na 
wybijaniu elektronów 
z katody przez wiązkę 
światła. Poprawną za¬ 
leżność natężenia 
w obwodzie od natę¬ 
żenia światła i jego 
częstości otrzymuje 
się przy założeniu, że 
elektron zostaje wybi¬ 
ty z metalu przez poje¬ 
dynczy foton 



fiu 
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foton elektron 
padający 



Rys. 6. Zjawisko Comptona — foton o częstości o „zderza się” 
z elektronem i w wyniku tego powstaje foton o innej częstości co' 
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Elektrodynamika kwantowa przypisuje więc polu 
elektromagnetycznemu pewne właściwości cząstkowe. 
Fale elektromagnetyczne są interpretowane jako stru¬ 
mień cząstek — fotonów. Fala o możliwie najmniej¬ 
szym natężeniu zawiera jeden foton. 

Fotony pod niektórymi względami różnią się za¬ 
sadniczo od innych „zwykłych” cząstek. Fotony mają 
zerową masę spoczynkową. Mimo to niosą one ze 
sobą strumień energii, pędu oraz momentu pędu. 

Takie właściwości fotonów są zgodne z mechaniką 
relatywistyczną. Związek między energią E i pędem 
cząstki o masie spoczynkowej m jest następujący 
E — |//w 2 c 4 +p 2 c 2 . Jeśli masa spoczynkowa jest równa 
zeru, to E—pc. Związek ten oznacza, że fotonów nie 
można zatrzymać, innymi słowy — fale elektromag- 
zerowa masa netyczne nie mogą być nieruchome. Gdyby bowiem 
spoczynkowa pęd fotonu był zerem, to jego całkowita energia by- 
fotonu łaby zerowa i foton po prostu nie istniałby. 

O zerowej masie spoczynkowej fotonu możemy się 
też przekonać na podstawie innego rozumowania. 
Jak wspomnieliśmy, z praw Maxwella wynika, że 
pole elektryczne i pole magnetyczne w pełni spełniają 
równania falowe. Równanie falowe jest identyczne 
z równaniem pola cząstki o zerowej masie (-► Teoria 
pola). Dlatego też założenie, że fotony, czyli cząstki 
związane z polem elektromagnetycznym, mają zero¬ 
wą masę, jest konieczne do tego, aby uzyskać zgod¬ 
ność praw elektromagnetyzmu za pomocą teorii pól 
i z uwzględnieniem istnienia fotonu. 

Istotną kwestią jest zrozumienie, jak elektrodyna¬ 
mika kwantowa opisuje zjawiska falowe takie jak 
dyfrakcja i interferencja fal. Jednoczesny opis zjawisk 
falowych i cząstkowych jest zgodny z duchem teorii 
kwantowych; inne cząstki, np. elektrony, również 
wykazują jednocześnie właściwości cząstkowe i fa¬ 
lowe (-> O niektórych podstawowych pojęciach fi¬ 
zycznych). 

Właściwości cząstkowe fotonów ujawniają się wy¬ 
raźnie wtedy, gdy mamy do czynienia z bardzo małą 
liczbą fotonów — możemy wtedy mówić o reakcji 
pojedynczego fotonu z pojedynczym elektronem. TaJk 
jest w wiązkach fal o dużej częstości, np. fal ultrafio¬ 
letowych czy rentgenowskich; w tym zakresie fal naj¬ 
częściej obserwujemy efekty kwantowe. Kiedy roz¬ 
ważamy wiązki fal elektromagnetycznych o dużym 
natężeniu, w reakcji bierze udział z reguły wielka 
liczba fotonów. Właściwości cząstkowe pola elektro¬ 
magnetycznego zacierają się, ujawniają się nato¬ 
miast wyraźnie efekty falowe. 

Ciekawa sytuacja występuje w optyce. Wiązki świa¬ 
tła o częstości widzialnej uzyskiwane z laserów mogą 
mieć bardzo duże natężenie, mogą nieść wiele foto¬ 
nów. Z drugiej jednak strony energia pojedynczego 
potwierdzę- fotonu może być bardzo bliska różnicy dwóch pozio- 
nie słusz- mów energetycznych atomu, co sprzyja reakcji atomu 
ności prawa z pojedynczym fotonem. Tak więc w oddziaływaniach 
Gaussa wiązek laserowych z atomami ujawniają się często 
zarówno cząstkowe, jak i falowe właściwości pola 
elektromagnetycznego. 

Dlaczego uważamy elektrodynamikę 
za najdoskonalszą teorię fizyczną 

Klasyczna i kwantowa teoria elektromagnetyzmu zo¬ 
stała stworzona na podstawie szeregu doświadczeń 
i pomiarów. Były to przede wszystkim mało precy¬ 
zyjne doświadczenia dziewiętnastowieczne. Współ¬ 
cześnie wykonuje się liczne eksperymenty i pomiary 
mające na celu dokładniejsze zbadanie zakresu sto¬ 
sowalności elektrodynamiki. Opiszemy tu kilka z nich. 
Zaczniemy od doświadczeń potwierdzających słusz¬ 
ność elektrostatyki i magnetostatyki. Dotyczą one 
samych podstaw elektrodynamiki. 

Według jednego z ważniejszych twierdzeń elektro¬ 
statyki — we wnętrzu naładowanej powierzchni pole 
elektryczne znika. Twierdzenie to wynika bezpośred¬ 
nio z pierwszego równania Maxwella, nazywanego 
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też prawem Gaussa. Dlatego badanie, czy istnieje pole 
wewnątrz naładowanej powierzchni, jest bezpośred¬ 
nim sprawdzianem prawa Gaussa. Dokładność, z jaką 
można stwierdzić, że natężenie pola jest zerowe, 
ogranicza dokładność sprawdzenia słuszności prawa 
Gaussa. Pierwsze doświadczenie tego typu wykonał 
H. Cavendish w 1773 r. Schemat jego współczesnej 
wersji, opracowanej w 1971 r. przez E.R. Williamsa, 
J.E. Fallera i H.A. Hilla w USA, jest przedstawiony 
na rys. 7. Doświadczenia tego typu pozwalają osza¬ 
cować słuszność prawa Gaussa, czy też wynikającego 



Rys. 7. Współczesna aparatura do sprawdzania prawa Gaussa 
składa się z pięciu metalowych powierzchni w kształcie dwu- 
dziestościanów. Do dwóch zewnętrznych powierzchni przykłada 
się zmienne wysokie napięcie, które powoduje powstawanie ła¬ 
dunku na tych powierzchniach. Gdyby pole elektryczne istniało 
we wnętrzu powierzchni metalowych, to powodowałoby ono 
powstanie napięcia między dwiema wewnętrznymi powierzch¬ 
niami. Celem doświadczenia jest stwierdzenie, czy istnieje między 
powierzchniami wewnętrznymi zmienne napięcie o tej samej czę¬ 
stości, co napięcie przyłożone do powierzchni zewnętrznych. 
Obecność takiego napięcia świadczyłaby o istnieniu pola elek¬ 
trycznego wewnątrz powierzchni metalowych 


z niego prawa Coulomba. Gdyby np. pole ładunku 
punktowego nie było odwrotnie proporcjonalne do 
kwadratu odległości od ładunku, lecz było proporcjo¬ 
nalne do e~ br /r 2 , to wynik cytowanego doświadczenia 
nakładałby na parametr b ograniczenie b< 2 *10“ 8 
cm -1 . A zatem prawo Coulomba jest słuszne przy 
odległościach r mniejszych odó" 1 = 5 -10 7 cm, wtedy 
bowiem czynnik e -br jest z dobrym przybliżeniem 
równy jedności. 

Badanie pól magnetycznych dostarcza też infor- badanie pól 
macji na temat słuszności praw Maxwella. Pola mag- magnetycz- 
netyczne są o tyle łatwe do badania, że w przyrodzie nych 
występują one w naturalny sposób w olbrzymiej 
skali; mowa tu oczywiście o polu magnetycznym 
Ziemi i innych planet. Pomiary linii sił pola magne¬ 
tycznego dostarczają informacji, czy pole wokół mag¬ 
nesu, którym jest planeta, spełnia równania Maxwella, 
czy nie. Bardzo subtelnych pomiarów pola magne¬ 
tycznego ziemskiego dokonują sztuczne satelity. Po¬ 
zwoliły one stwierdzić słuszność praw Maxwella 
w odległościach rzędu 10® m. 

Doświadczenia te, potwierdzające słuszność elek¬ 
trodynamiki klasycznej, stanowią też sprawdzenie 
elektrodynamiki kwantowej. W teorii kwantowej na¬ 
bierają one nowej interpretacji, nakładają ogranicze¬ 
nia na ewentualną masę fotonów. Wynika z nich, 
że masa fotonu wynosi mniej niż 10" 47 kg (dla po¬ 
równania: masa elektronu, najlżejszej cząstki, wy¬ 
nosi ok. 10" 30 kg). 

Dalsze doświadczenia dotyczą typowo kwanto- pomiary 
wych efektów. Jednym z bardzo subtelnych efektów przesunięcia 
przewidzianych przez elektrodynamikę kwantową Lamba 
jest istnienie tak zwanego przesunięcia Lamba. Jest 
to różnica między poziomami energetycznymi w ato¬ 
mie wodoru oznaczanymi przez 2S t / 2 i 2P 1 ; 2 (rys. 8). 

Gdyby nie kwantowa natura promieniowania elek- 
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Rys. 8. Struktura stanów energetycznych atomu wodoru. Prze¬ 
sunięcie Lamba to różnica poziomów 2£j/ t i 2P X /* 


tromagnetycznego, stany te miałyby tę samą energię. 
Dlatego też pomiary przesunięcia Lamba i porówny¬ 
wanie wielkości eksperymentalnych z teoretycznymi 
mają podstawowe znaczenie w kwantowej teorii pola 
elektromagnetycznego. Pierwsze obliczenie tego efektu 
wykonał w 1947 r. H.A. Bethe, a pomiary zostały 
w tym samym roku wykonane przez W.E. Lamba 
i R.C. Retherforda. Przy pomiarach autorzy wyko¬ 
rzystali rezonans magnetyczny między mierzonymi 
poziomami (-* Spektroskopia atomowa), co na 
owe czasy było bardzo nowoczesnym pomysłem. Po¬ 
nieważ częstości radiowe, których tu użyto, dają się 
mierzyć z bardzo dużą dokładnością, również prze¬ 
sunięcie poziomów można w ten sposób wyznaczyć 
dokładnie. 

Już pierwsze pomiary wykazały bardzo dobrą zgod¬ 
ność wyników doświadczalnych z teoretycznymi. 
Obecnie zarówno dokładność obliczeń, jak pomia¬ 
rów niepomiernie wzrosła. Pomiary przesunięcia 
Lamba wykonali ostatnio R. Robiscoe i T. Shyn 
z USA (1970); należy podkreślić, że nie stwierdzono 
tu żadnych odstępstw od wartości teoretycznej, wy¬ 
noszącej (1057,911 ± 0,12) MHz. 

Jednym z piękniejszych osiągnięć potwierdzających 
słuszność elektrodynamiki kwantowej jest obliczenie 
momentu magnetycznego elektronu. W myśl elektro¬ 
dynamiki kwantowej elektron, mimo że jest cząstką 
punktową, zachowuje się podobnie jak obracająca się 
naładowana kulka. Taka obracająca się kulka to 
jakby igła magnetyczna — oś obrotu kulki wykonuje 
precesję w polu magnetycznym wokół linii sił pola 
(rys. 9). Częstość tej precesji zależy od wartości mo¬ 
mentu magnetycznego. Tak więc elektron ma mo¬ 
ment magnetyczny fi. Teoretyczne obliczenie tego 
momentu wykonał P.A.M. Dirac, otrzymał on wynik 
fi = 2(ehlmc). Dokładniejsze wyniki uwzględniające 
kwantową strukturę pola elektromagnetycznego uzy¬ 
skał J. Schwinger (1943), a później inni autorzy. 


Rys. 9. Elektron w 
polu magnetycznym 
jest w pewnym sensie 
podobny do obraca¬ 
jącej się naładowanej 
kuleczki, wykonuje 
precesję wokół pola 
magnetycznego. Ob¬ 
liczenie częstości pre¬ 
cesji, a zatem momen¬ 
tu magnetycznego 
elektronu to jedno z 
największych osiąg¬ 
nięć elektrodynamiki 
kwantowej 

Pomiarów momentu magnetycznego elektronu do¬ 
konywały liczne grupy badaczy, ale wszystkie do¬ 
świadczenia opierały się na tej samej zasadzie: spola¬ 
ryzowane elektrony (tzn. o równoległych momentach 
magnetycznych) przelatywały przez pole magnetycz¬ 
ne, mierzony był kąt skręcenia momentów magne¬ 
tycznych. 

Jednym z najdokładniejszych wyników było j* = 
= (2,0011596577±0,0000000035)e/i/we; jest on zgo¬ 
dny z obliczeniami teoretycznymi, a uzyskali go J.C. 
Wesley i A. Rich w 1971 r. 

Mierzono także momenty magnetyczne innych czą¬ 
stek — pozytonów i mionów, a wyniki porównywano 
z wartościami obliczonymi teoretycznie. Odstępstw 
od nich nie stwierdzono, ale wyniki pomiarów były 
znacznie mniej dokładne. 

Wykazaliśmy na przykładach, że elektrodynamika 
jest teorią opisującą z wielką precyzją szeroki zakres 
zjawisk fizycznych. O innych zastosowaniach elek¬ 
trodynamiki w różnych dziedzinach fizyki można 
znaleźć informacje w innych hasłach niniejszej En¬ 
cyklopedii. Przykłady te dobitnie dowodzą, że elektro¬ 



dynamika jest teorią o niesłychanie szerokim zakresie 
stosowalności. 

Ale nie tylko zgodność z eksperymentem świadczy 
o doskonałości elektrodynamiki. Ma ona również 
daleko idące zalety formalne. Na podobieństwo 
elektrodynamiki, szczególnie kwantowej, próbowano 
formułować teorie innych oddziaływań elementar¬ 
nych (-* Cząstki elementarne i ich oddziaływania). 
Pewne sukcesy odniesiono przy takim podejściu do 
opisu oddziaływań słabych. Powstała w ten sposób 
teoria Fermiego rozpadu /?, a ostatnio bardzo burzli¬ 
wie rozwijają się tzw. zunifikowane teorie oddziały¬ 
wań elektromagnetycznych i słabych. Metody zbli¬ 
żone do użytych w elektrodynamice kwantowej pró¬ 
bowano też stosować do opisu oddziaływań silnych, 
w szczególności oddziaływań pionów (—► Oddziały¬ 
wania silne). 


Wewnętrzne sprzeczności elektrodynamiki 


Pomimo, że elektrodynamika dobrze wyjaśnia wiele 
zjawisk, nie można zapominać o zasadniczych jej 
niekonsekwencjach. W samym bowiem sformułowa¬ 
niu elektrodynamiki tkwią wewnętrzne sprzeczności, 
o których istocie tu powiemy. 

Zastanówmy się, jaka jest energia pola elektrycz¬ 
nego w otoczeniu ładunku e w kształcie kuli o pro¬ 
mieniu a. Ponieważ pole elektryczne w punkcie od¬ 
ległym o r od środka kuli wynosi E—el4Tze 0 r 2 ^ to ener¬ 
gia pola dana jest przez wzór W = 1 U j £W> przy 
czym po wykonaniu łatwego rachunku otrzymujemy 
W = ez/ela. Energia kuli jest odwrotnie proporcjo¬ 
nalna do jej promienia. Na pierwszy rzut oka nic 
nas tu nie razi. Trudność zaczyna się wtedy, gdy roz¬ 
ważany ładunek jest punktowy, to znaczy, gdy jego 
promień jest zerem. Wtedy bowiem energia pola 
elektrycznego otaczającego ładunek staje się nie¬ 
skończenie wielka. Ta „nieskończoność” jest pod¬ 
stawową trudnością elektrodynamiki. Nie można 
się jej pozbyć zakładając, że w przyrodzie nie wystę¬ 
pują ładunki punktowe, mamy bowiem powody uwa¬ 
żać elementarne ładunki — elektrony, za cząstki 
punktowe. Gdyby elektron nie był punktowy, lecz 
był jakąś kulką o skończonym promieniu, trudno 
byłoby go uznać za elementarną cząstkę. Wszystko 
świadczy o tym, że elektron jest cząstką punktową. 

Nieskończoność, o której mówiliśmy, przejawia 
się i w innych, bardziej jeszcze drastycznych miejscach. 
Jeśli np. chcemy nadać elektronowi przyśpieszenie, 
to oprócz pokonania zwykłej bezwładności elektronu, 
pochodzącej od jego masy, musimy pokonać bez¬ 
władność pola elektrycznego otaczającego elektron. 
Niestety — siła, jakiej trzeba użyć do pokonania 
bezwładności pola, jest nieskończenie wielka. Wy¬ 
gląda to tak, jakby masa elektronu była nieskoń¬ 
czenie wielka, nie można bowiem oddzielić elektronu 
od pola, które wytwarza. Wiemy jednak, że masa 
elektronu wynosi ok. 9*10- 31 kg i na pewno nie jest 
nieskończona. 

Wydawać by się mogło, że trudności te powinny 
zniknąć w elektrodynamice kwantowej, która kon¬ 
sekwentnie uwzględnia wszelkie efekty kwantowe 
w małych odległościach od ładunku. Do pewnego 
stopnia istotnie tak jest. W elektrodynamice kwan¬ 
towej można się nie posługiwać wielkościami nie¬ 
skończonymi. Jednakże w takim sformułowaniu masa 
i ładunek elektronu nie mogą być obliczone w ramach 
teorii, lecz muszą być wzięte z doświadczenia. 

Tak więc, mimo że potrafimy z wielką precyzją 
obliczać przebieg różnych procesów elektromagne¬ 
tycznych, a wyniki naszych obliczeń zgodne są z do¬ 
świadczeniami, to jednak nie bardzo rozumiemy, dla¬ 
czego się tak dzieje, nie rozumiemy bowiem do końca 
podstaw elektromagnetyzmu. 

L.N. Cooper Istota i struktura fizyki, Warszawa 1975; 
R.P. Feynman i in. Feynmana wykłady z fizyki. Warszawa 1974; 
R.H. March Fizyka dla poetów , Warszawa 1974. 
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Teoria pola 

Marian Kopczyński 

Teoria pola jest jednym z najtrudniejszych i najcie¬ 
kawszych działów fizyki. Stosuje się w niej bardzo 
zaawansowane metody matematyczne, a przeprowa- 
wadzane obliczenia są długie i żmudne. Należą do 
niej najwspanialsze osiągnięcia fizyki teoretycznej — 
ogólna teoria względności oraz elektrodynamika kla¬ 
syczna i kwantowa (-* Elektrodynamika). 

Na gruncie kwantowej teorii pola przewidziano 
istnienie antymaterii, a ostatnio cząstek powabnych 
(-> Cząstki elementarne i ich oddziaływania). Cała 
teoria cząstek elementarnych oparta jest na ideach 
kwantowej teorii pola. Metody teorii pola są ostat¬ 
nio szeroko stosowane w fizyce statystycznej. 

Kwantowa teoria pola nie jest teorią zamkniętą. 
Problemów nie rozwiązanych i trudnych jest bardzo 
wiele. Po ostatnich sukcesach nowej teorii oddziały¬ 
wań słabych (-► Oddziaływania słabe) teoria pola 
jest działem fizyki, w którym są prowadzone najinten¬ 
sywniejsze badania teoretyczne. 

Fizyka jest nauką, która szuka wyjaśnienia obser¬ 
wowanych zjawisk (-► Czym jest fizyka). Podstawowe 
idee teorii fizycznych można sformułować dość pro¬ 
sto, podobnie jak prosto można sporządzić plan naj¬ 
trudniejszej wspinaczki w Himalajach, 
modele Typowe dla fizyki jest tworzenie modeli dwojakiego 
w fizyce rodzaju. Pierwszy rodzaj to modele jakościowe zja¬ 
wisk (obrazy) odwołujące się do intuicji i wyobraźni. 
Stają się one elementem języka, którym fizycy mówią 
potocznie o rzeczywistości. Drugi — to abstrakcyjne 
modele matematyczne, które umożliwiają obliczanie 
porównywalnych z doświadczeniem liczb. Zgodność 
przewidywań modelu z doświadczeniem decyduje 
o sukcesie lub niepowodzeniu modelu. Ten drugi ro¬ 
dzaj modeli to właściwe modele tworzone przez fizy¬ 
kę. Związek obrazu jakościowego z modelem ścisłym 
jest dość luźny. Często niewłaściwy model jakościowy 
bardzo utrudnia sformułowanie właściwego modelu 
abstrakcyjnego. Rozwój metod stosowanych w fizyce 
zmierza wyraźnie w kierunku coraz bardziej abstrak¬ 
cyjnego opisu zjawisk fizycznych. Mimo wszystko 
tworzenie obrazów (które nie są rozumiane jak wierne 
odbicie procesów rzeczywistych) jest często pomocne 
w konstruowaniu czy modyfikowaniu schematu ma¬ 
tematycznego. 

Tak więc omawiając teorię pola będziemy przed¬ 
stawiać zarówno obrazy zjawisk jak i zarys schematu 
matematycznego teorii. Bez tego schematu byłaby 
to nie opowieść o teorii, lecz tylko bajka o niej. 


O czasoprzestrzeni, polu 
temperatury i pochodnych 
cząstkowych 


Podstawowym pojęciem w fizyce jest czasoprzestrzeń 
i od niej zaczniemy nasze rozważania o polu (-*■ O nie¬ 
których podstawowych pojęciach fizycznych). Cza¬ 
soprzestrzeń jest to zbiór wszystkich możliwych zda¬ 
rzeń. Zdarzeniem nazywamy takie wydarzenie, które 
można scharakteryzować przez podanie czterech Jiczb 
/, x 9 y , z, gdzie x> y> z są współrzędnymi wektora po¬ 
łożenia r, a / jest czasem, w którym to zdarzenie za¬ 
chodzi. Na przykład (rys. 1) jeśli o godz. 15 00 mała 
muszka siada w kącie prostopadłościennego pokoju 
o wymiarach axbx c i jeśli umówimy się, że określimy 
położenia przedmiotów podając ich odległość od 
trzech krawędzi ścian wychodzących z kąta wybrane- 
czasoprzes- go przez naszą muszkę, to omawiane zdarzenie z jej 
trzeń i punkty życia w wybranym przez nas układzie odniesienia ma 
materialne współrzędne: 15 00 , 0, 0, 0. Można by się dziwić, że 
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wybraliśmy muszkę, a nie stół. Ale widać od razu, że 
położenia stołu nie można określić przez podanie 
trzech liczb. Stół w pokoju o godz. 15 00 to zbiór bar- 



Rys. 1. W pokoju o wymiarach axbxc znajduje się mucha. Po¬ 
nieważ mucha nie jest punktowa, zaznaczamy na jej tułowiu 
punkt, którego położenie określa położenie muchy o godz. 15 x0 . 
Zdarzenie przedstawione na rysunku ma współrzędne (15 10 , 
x 0 , *o) 


dzo wielu zdarzeń w czasoprzestrzeni, z których każde 
jest położeniem odpowiedniego punktu stołu o tej 
godzinie. Małą muszkę możemy traktować jako punkt 
materialny, najprostszy obiekt fizyczny poruszający 
się w czasoprzestrzeni. 

Reprezentowanie obiektu fizycznego przez punkt 
materialny okazuje się b. dobrą idealizacją w opisie 
wielu zjawisk. Ruch planet wokół Słońca i naładowa¬ 
nych cząstek elementarnych w zewnętrznym polu 
elektromagnetycznym można przedstawić jako ruch 
punktów materialnych. Wróćmy do ruchu punktu ma¬ 
terialnego w czasoprzestrzeni. Ruch ten jest w pełni 
określony, jeśli znamy trzy funkcje zależne od czasu 
x(t), y(0, z(t\ tworzące razem funkcję o wartościach 

wektorowych #■(/). Minimalna liczba zmiennych w 
czasie parametrów koniecznych do opisu układu fi¬ 
zycznego nazywa się liczbą stopni swobody układu. 
Tak więc punkt materialny (gdy nie ma więzów) ma 
trzy stopnie swobody. 

Wyobraźmy sobie teraz nieskończoną liczbę punk¬ 
towych obserwatorów wyposażonych w punktowe 
i niezwykle czułe termometry i zsynchronizowane 
zegary, którzy umówili się notować mierzoną tempe¬ 
raturę w każdym punkcie przestrzeni w każdej chwili 
(czyli w każdym punkcie czasoprzestrzeni). Zebrane 
wyniki pomiarów można zapisać jako funkcję okre¬ 
śloną na czasoprzestrzeni. Każdemu punktowi /, r 
przyporządkowana jest liczba T(J y r) — temperatura 



X 

Rys. 2. Wybrane wartości pola temperatury T (16 00 , Jt, y, 0) przed¬ 
stawione w postaci izoterm — krzywych, na których funkcja 
T(ł = const, jc, y , 0) jest stała 
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w punkcie r w chwili t (rys. 2). Mówimy, że T(t y r) 
określa pole temperatury w przestrzeni. Załóżmy te¬ 
raz, że pomiary są wykonywane na przykład w pokoju, 
w którym rozmieszczono odpowiednie grzejniki i ter¬ 
mostaty utrzymujące na wszystkich ścianach, podło¬ 
dze i suficie tę samą stałą temperaturę T 0 . Zastanów¬ 
my się, jakie pytanie, czy też jakie zadanie może posta¬ 
wić sobie fizyk w tej sytuacji. Podobnie jak w mecha¬ 
nice punktów materialnych na podstawie znajomości 
początkowych położeń i prędkości chcemy przy po¬ 
mocy równań Newtona wydedukować położenia 
punktów materialnych w przyszłości, tak w naszym 
problemie chcielibyśmy — na podstawie znajomości 
pola w chwili / = 0 i znajomości warunków doświad¬ 
czalnych — umieć przewidywać pole temperatury w 
poszukiwa- przyszłości. Aby to zadanie zrealizować, musimy 
nie równań dojść, jakie jest równanie pola, i rozwiązać je przy 
P°* a danych warunkach początkowych: 

mo=/(7), (i) 

gdzie / jest znaną funkcją, oraz warunkach brzego¬ 
wych: 

T(t y O y y y z) = T(t,x,O y z) = T(t,x,y, 0) = 

= T(t,a y y y z) = T(t,x,b,z ) = T(t,x,y,c ) = T 0 . (2) 

Ponieważ pokój ma wymiary axbxc , szukamy roz¬ 
wiązania dla r takich, że: 

0 ^ x ^ a y 0 ^ y ^ b i 0 ^ z ^ c. 

Poszukiwanie równań pola poprzedzimy przypomnie¬ 
niem równań ruchu punktu materialnego (równań 

Newtona). Mają one dobrze znaną postać F(r y v y t) = 

= ma. Prędkość v i przyspieszenie a wyrażają się 
przez pochodne względem czasu wektora położenia 

r(r), a mianowicie: 

r i:_ r(t+4t)-r(t) ć! dr 

At-+Q At dt 


oraz 


7— lim v (t+dt)—v(t) dr dv _ d 2 r 
At-> o At dt dt 2 


Po skorzystaniu z tych związków równanie Newtona 
można zapisać: > 


d 2 r 


dr 


-zzr=F(r,—,0. 


dt 2 


dt 


(3) 


Równanie to jest równaniem różniczkowym zwyczaj¬ 
nym drugiego rzędu. Jednoznaczne rozwiązanie tego 
równania otrzymuje się przy warunkach początko¬ 
wych 

r (t = 0) = r 0 oraz v (t = 0) = v 0 . 

Ponieważ pole T(t y r) zależy od czterech zmiennych, 
w równaniach pola mogą się pojawić pochodne wzglę¬ 
dem wszystkich tych zmiennych. Są to tzw. pochodne 
cząstkowe. Na przykład pochodna cząstkowa wzglę¬ 
dem czasu /, oznaczana dTjdt y jest określona wzorem: 

— = lim x < ?> z)~ r V>x,y, z) 

dt At 

pochodne Podobnie definiuje się pochodne cząstkowe wzglę- 
ciąstkowe dem innych zmiennych: dTldx y BTfdy , dT(dz oraz 
drugie pochodne cząstkowe (jest ich 10): 

o 2 T d 2 T d 2 T d 2 T d 2 T d 2 T 
dt 2 9 dx 2 ’ dy 2 9 dz 2 9 dxdy 9 dydz* 
d 2 T o 2 T d 2 T d 2 T 
dtdx 9 dtdy 9 dt dz 9 dxdz' 


Pochodne te określone są wzorem analogicznym do 
wzoru (4), w którym zamiast funkcji T występują 
funkcje (czterech zmiennych) dTfdt, dT}dx y dTjdy , 


dTJdz. Najogólniejsze równanie pola T(t y r) mogłoby 
mieć postać: 

P łdT dT BT dT 

F \$r* ~dx~ 9 ~dy 9 ~~dz~ 9 wjrzsze pochodne cząstko¬ 
wej = 0. (5) 

Równanie typu (5) jest równaniem różniczkowym 
cząstkowym. Aby opisać w pełni zmienność w czasie 

pola dla każdego ustalonego wektora r, musimy znać 

funkcję T(t, r). Ponieważ wszystkich wektorów r jest 
tyle, ile punktów w przestrzeni, czyli nieprzeliczalnie 
wiele (pole jest układem fizycznym o nieprzeliczalnej 
liczbie stopni swobody), więc warunek (1) jest poję¬ 
ciowo równoważny daniu położenia początkowego 
dla punktu materialnego. Ponieważ chcemy, aby 
warunek początkowy (1) wystarczał do wyznaczenia 
rozwiązania (w przyszłości), równanie (5) może 
zawierać pochodne cząstkowe względem czasu tylko 
pierwszego rzędu. Dokładna analiza problemu pro¬ 
wadzi do równania na pole temperatury: 

1 dT d 2 T d 2 T d 2 T 
* dt ~ dx 2 dy 2 dz 2 

gdzie x(t y x y y y z) jest pewną funkcją dodatnią charak¬ 
teryzującą ośrodek. Jest to równanie przewodnictwa 
cieplnego. 

Innym rodzajem pola jest pole, które otrzymaliby 
punktowi obserwatorzy mierzący zamiast tempera¬ 
tury prędkość wiatru w punkcie r. Prędkość wiatru V 
w punkcie r jest wektorem o trzech współrzędnych 

nu ri = (y x {t y o, v y (t, o, ncu o). 

Informacja zebrana z całej przestrzeni z różnych 

chwil daje się zapisać jako pole prędkości V(t , r) 
w czasoprzestrzeni (w każdym punkcie zaczepiony 
jest odpowiedni wektor). 

Przykład ten, podobnie jak poprzedni, nie da się 
zrealizować praktycznie. Nie jesteśmy w stanie 
nigdy zmierzyć temperatury i prędkości w punkcie. 
Mierzymy zawsze tylko pewne wartości średnie w od¬ 
powiednio małych obszarach przestrzeni. Pole jest 
wygodną idealizacją, która te małe obszary ściąga 
do pojedynczych punktów. 

W ten sposób wprowadziliśmy pole jako pewien 
obiekt matematyczny, który służy do wygodnego za¬ 
pisu obserwacji dokonywanych w czasoprzestrzeni. 
Teraz przejdziemy do pól, które są obiektami fizycz¬ 
nymi (mówiąc inaczej, są one formą istnienia materii). 


O polach, które niosą energię, 
obiektach geometrycznych 
i zasadzie wariacyjnej 


Spójrzmy na równanie (3); jeśli siła F działająca na 
obiekt materialny w punkcie r nie zależy od prędkości 

tego obiektu, to w każdym punkcie przestrzeni r, 
w którym znajdzie się ten obiekt, mamy jednoznacz¬ 
nie określony wektor siły F(t y r), czyli pole sił. Pole 
F(t, r) zawiera informację o przyspieszeniu, jakie zo¬ 
stanie nadane cząstce o masie m w punkcie r. W tym 
ujęciu pole F{t y r) nie jest traktowane jako obiekt 

fizyczny, lecz jako twór podobny do T{t y r) i V(t y r). 

Istotną cechą równań Newtona jest ich nielokal- 
ność. Na przykład w problemie dwóch ciał przy opi¬ 
sie ruchu planety wokół Słońca przyspieszenie pla¬ 
nety w chwili t zależy od położenia Słońca w tej samej 
chwili. Zmiana położenia Słońca w chwili t+At 
zmienia siłę działającą na planetę w chwili tĄ-At. 
Zdumiewające jest, że przyczyna i skutek są tak od- 
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dalone. Teoria Newtona zajmuje się tylko wyznacza¬ 
niem ruchu ciał bez wnikania w mechanizm uzysk- 
wania przez nie przyspieszeń. Spróbujemy wyjaśnić 
ten mechanizm. 



Rys. 3. Niefortunny przypadek na stole bilardowym. Litery A 
B, C, D i E oznaczają punkty, w których lokalnie następuje 
zmiana prędkości bili. Odcinki ruchu swobodnego zaznaczone 
są linią przerywaną 


Doświadczenie dnia codziennego uczy, że najpro¬ 
ściej jest zmienić prędkość ciała oddziałując na nie 
bezpośrednio. Wyobraźmy sobie np. kulę porusza¬ 
jącą się po stole bilardowym (rys. 3). Prędkość jej 
ulegnie zmianie wtedy i tylko wtedy, gdy uderzymy ją 
kijem, trafimy ją drugą kulą lub też ona sama wpad¬ 
nie na przeszkodę, którą może być ściana stołu, druga 
kula lub grzybek. Nadanie przyspieszenia następuje 
jedynie w momencie odpowiedniego zderzenia i uzy¬ 
skiwane jest w określonym punkcie stołu, 
pole jako Naturalną tendencją jest próba redukcji niezna- 
obiekt nego do czegoś prostego i dobrze rozumianego. Taką 
fizyczny próbą jest wprowadzenie pola jako obiektu fizycz¬ 
nego, istniejącego niezależnie od cząstek, które od¬ 
grywa rolę niewidzialnego sprawcy uzyskiwanych 
przez te cząstki przyspieszeń. Ponieważ energia i pęd 
pojedynczych cząstek ulegają zmianie (a wiadomo, że 
całkowita energia i pęd układu powinny być zacho¬ 
wane), należy ze zmianą energii i pędu cząstki w punk¬ 
cie r wiązać zmianę energii i pędu hipotetycznego 
pola. Ilustruje to jeszcze jeden mechaniczny model 
dokładniej opisany pod rys. 4. 

pole 


* / 



Rys. 4. Mechaniczny model pola — zbiór bardzo małych mas 
połączonych sprężynkami: a) kula A z prędkością V x zbliża się 
do obszaru, w którym jest pole, b) widzimy kulę A ze zmienioną 
energią i pędem oraz pole, któremu energia i pęd zostały przeka¬ 
zane, poruszające się z prędkością v i drgające przy tym zawzięcie. 
Widać, że po pewnym czasie nastąpi oddziaływanie tego pola 
z kulą B 


Program opisu oddziaływań cząstek za pośrednic¬ 
twem pola został uwieńczony sukcesem — wspania¬ 
łym rozwojem elektrodynamiki (-> Elektrodynamika, 
Oddziaływania elektromagnetyczne), a następnie sfor¬ 
mułowaniem einsteinowskiej teorii grawitacji. Przy¬ 
pomnimy tu kilka etapów tego rozwoju, 
pole elektro- Podstawowe wielkości charakteryzujące pole elek- 
magnetyczne tromagnetyczne to E i B, występujące we wzorze 
Lorentza na siłę działającą na ładunek ą : 

F — q{E- f v X B). 


Natężenie pola elektrycznego E(r)oraz wektor in¬ 
dukcji magnetycznej B(r) są polami bezpośrednio 
mierzalnymi. W elektrostatyce w wypadku stacjonar¬ 
nego pola B wprowadza się bezpośrednio niemie¬ 
rzalne pola <p{r ) i ~A(r), zw. potencjałem skalarnym 
i wektorowym. Związki między E i <p oraz między B 
i A są następujące: 

— , df I d<p d<p S<p\ 

E = -grady = -Kj. - d j, - 


B = rot A = 


/ 8Ai 8A y 8Ax 
\ dy dz dz 


dAy dAx \ 
dz dy ) 


dAz 

dx 


(dla pól zmiennych w czasie związki te mają bardziej 
skomplikowaną postać). 

Okazuje się, że znajomość pola elektrostatycznego 
w całej przestrzeni dają pełną informację o rodzaju 
i rozmieszczeniu ładunków, a mianowicie gęstość 

rozkładu ładunku e(r) jest określona przez potencjał 
<p za pośrednictwem równania Poissona: 

A<p(r)= —(6) 
s 


(e — przenikalność elektryczna ośrodka). Gdy ładunek 
punktowy znajduje się w punkcie R, (p ma osobliwość: 

cp{r = K) = co. Tak więc miejsce, w którym pole ma 
osobliwość, odpowiada miejscu, w którym znajduje 
się ładunek punktowy. Operacja A we wzorze (6) 
nazywa się laplasjanem i zdefiniowana jest jak na¬ 
stępuje: 


Aę>(r) 


df d~(p d z g> d 2 q> 
“ ~d^~ + dy? + oz 2 


Jeszcze jedną operacją występującą w elektrodynami¬ 
ce jest dywergencja pola wektorowego: 


div£ s 

dx dy cz 

Maxwell doszedł do swoich równan wyobrażając 
sobie pole elektromagnetyczne jako odkształcenie 
idealnego niewidzialnego sprężystego ośrodka zwa¬ 
nego eterem. Odkrycie przewidzianych przez jego 
teorię fal elektromagnetycznych i interpretacja świa¬ 
tła jako fali elektromagetycznej to jedno z najwięk¬ 
szych odkryć w fizyce. Subtelne doświadczenia do¬ 
prowadziły do odrzucenia koncepcji eteru. Po od¬ 
rzuceniu tej koncepcji w zasadzie nie mamy na gruncie 
elektrodynamiki klasycznej żadnego intuicyjnego 
obrazu rozchodzenia się fali elektromagnetycznej. 
Mimo to, potrafimy przewidywać wyniki eksperymen¬ 
tów optycznych ze światłem, zachowanie ładunków 
próbnych pod wpływem fali elektromagnetycznej 
i wiele innych efektów. Otrzymujemy to wszystko 
z abstrakcyjnego modelu matematycznego, którym 
są równania Maxwella. Spotyka się często sformuło¬ 
wanie „fala elektromagnetyczna rozchodzi się w próż¬ 
ni”. Wydaje się wskazanym wyjaśnić, jak to należy 
rozumieć, by uniknąć zbędnych metafizycznych dy¬ 
skusji. Próżnia w tym sformułowaniu jest rozumiana 
jako obszar przestrzeni, z którego usunięte zostały 
wszystkie cząstki materialne mające masę spoczynko¬ 
wą. Tak właśnie, rozrzedzając gaz do granic technicz¬ 
nych możliwości, otrzymuje się w technice stany wy¬ 
sokiej próżni. Usuwając cząstki nie usuwamy jednak 
pola, które może zmieniać swój stan w czasie. Jed¬ 
nym z rodzajów tych zmian jest fala elektromagne¬ 
tyczna. Przeto zamiast mówić „fala elektromagne¬ 
tyczna może rozchodzić się w próżni”, lepiej jest po¬ 
wiedzieć: „stan pola zwany falą elektromagnetyczną 
może ewoluować w przestrzeni pod nieobecność 
cząstek materialnych”. Termin „próżnia” pojawia 
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się jeszcze w innym znaczeniu w kwantowej teorii 
pola. 

Tak jak sygnalizowaliśmy, polu elektromagnetycz¬ 
nemu możemy przypisać energię i pęd. Wzór na ener¬ 
gię pola elektromagnetycznego w próżni ma postać: 

W = \ f L£ 2 + —B 2 

2 

gdzie £ 0 i f*o S3 stałymi, zw. przenikalnością elektrycz¬ 
ną i magnetyczną próżni. 

Z wielu eksperymentów wynikło, że fala elektro¬ 
magnetyczna może przekazywać swą energię w ściśle 
określonych porcjach, tzw. kwantach. Najmniejsza 
porcja, czy kwant pola elektromagnetycznego, nazy¬ 
wa się fotonem. Odkrycie to doprowadziło do sfor¬ 
mułowania elektrodynamiki kwantowej, a następnie 
kwantowej teorii pola. Kwantowa teoria pola z każdą 
obserwowaną cząstką wiąże pole. Skoro cząstki mają 
atrybuty takie jak masa, ładunek, spin itp., to i po¬ 
lom wiązanym z nimi nadaje się te same atrybuty. 
Tak więc wyprzedzając rozdział o kwantowej teorii po¬ 
la będziemy mówić o klasycznych polach masowych 
naładowanych itp. Ponieważ nie udało się dotych¬ 
czas stworzyć w pełni zadowalającej teorii cząstek 
elementarnych, prowadzi się wiele badań modelo¬ 
wych wprowadzając różne hipotetyczne pola i pró¬ 
bując przy ich pomocy wyjaśnić wyniki eksperymen¬ 
tów. Badanie różnorodnych pól klasycznych ma więc 
duże znaczenie, choć często sens fizyczny zostaje im 
nadany dopiero po ich skwantowaniu. Omówimy 
teraz krótko klasyczne pola swobodne i oddziału¬ 
jące. Pola klasyczne nazywamy oddziałującymi, jeśli 
w równaniu każdego z nich występują inne pola. Od¬ 
działywanie pól występuje np. przy rozchodzeniu się 
fali elektromagnetycznej i fali akustycznej w ośrodku 
sprężystym, którego stan wpływa na pole elektro¬ 
magnetyczne. Wówczas równania pola elektromagne¬ 
tycznego będą oczywiście zawierały parametry fali 
akustycznej. 

Przed ogólnym omówieniem metod otrzymywania równań 
pól klasycznych oddziałujących między sobą zrobimy dygresję 
o obiektach geometrycznych stowarzyszonych z czasoprzestrzenią. 

Wiemy, że w różnych układach odniesienia otrzymujemy różne 
współrzędne zdarzeń. Struktura czasoprzestrzeni jest dana przez 
określenie klasy równoważnych układów odniesienia i podanie 
związków między współrzędnymi dowolnego zdarzenia dla do¬ 
wolnej pary układów O i O' z klasy równoważnej. Oznaczmy 
współrzędne zdarzenia p w układzie O : p 0 = (x°, x l t x 2 , x*), 
gdzie = ct . Oznaczmy współrzędne tego samego zdarzenia 
w układzie odniesienia O': p 0 * = (* 0 ', x 1 ' ,x*\ x 9r ). Związek 
między tymi współrzędnymi ma postać: 

x»' = B»'x 0 + B^x x + Bfx z -f B%'x 3 -ra»'. 

Przyjmując umowę, że powtarzające się te same indeksy —jeden 
„na górze”, a drugi „na dole” — oznaczają sumowanie, możemy 
powyższy wzór zapisać w prostszej postaci: 

x»' = Bfaft+a*' 

(zbiór 16 liczb B%' nazywa się macierzą transformacji). Wyróż¬ 
nioną klasę układów odniesienia w teorii Newtona i w szczególnej 
teorii względności tworzą układy inercjalne. Obie te teorie różnią 
się wyborem macierzy B£ . W obu teoriach występują macierze 
obrotów w trzech wymiarach, które oznaczymy A\ . W teorii 
Einsteina w miejsce transformacji Galileusza występują transfor¬ 
macje Lorentza, które oznaczymy A%' (-*> O niektórych podsta¬ 
wowych pojęciach fizycznych). 

Obiektem geometrycznym stowarzyszonym z czasoprzestrze¬ 
nią nazywamy obiekt określony w każdym układzie współrzęd¬ 
nych przez tabelę liczb, które przy zmianie układu współrzędnych 
zmieniają się w ściśle określony sposób. Wyróżniamy następu¬ 
jące obiekty geometryczne: 
skalary — 7o = To ; 

wektory (kartezjańskie) — a *(przy b\ — A\ ), a* *= A i — A\ a*; 
czterowektory — a u (przy B%' = A u ^) t a* = A £ a*; 
tensory kartezjańskie drugiego rzędu — T= A\ A^ T^' 
tensory lorentzowskie drugiego rzędu — T** v = A^ A l T*" m 
Analogicznie wprowadza się tensory wyższego rzędu. Przykładem 

skalara kartezjańskiego jest iloczyn skalamy wektorów a ; b, 
przykładem zaś wektora kartezjańskiego są wektory takie, jak 
wektor siły, prędkości, przyspieszenia. W przyjętej notacji su- 
macyjnej 

a ' b = a^br. i = 1, 2, 3. 

Przykładem skalara lorentzowskiego jest 
= a°a°-aV—a*o*— 

gdzie a 0 = o°, ai = —a 1 , a 2 — —a* i a 3 = —a 3 . 



Własności geometryczne określają wskaźniki, po których nie ma 
sumowania. Wskaźniki tensorów- lorentzowskich będziemy ozna¬ 
czać literami greckimi, kartezjańskich — łacińskimi. Zgodnie 
z tymi ustaleniami wektorami są wielkości 

f MV g v . l mns r n s, y ", 
a skalarami — wielkości 

/»% y. y*V 

Skalary, które przy transformacji odbicia przestrzennego r—>—r 
zmieniają znak, nazywa się pseudoskalarami, a wektory nie 
zmieniające znaku — pseudowektorami (np. moment pędu). 

Wprowadza się też bispinory — kolumienki y/A czterech liczb ze¬ 
spolonych, o specyficznym prawie transformacji. Z bispinorów 
zbudować można skalar lorentzowski y/A y/ A . 

Einstein wysunął postulat, że w każdym z równo- postulat 
ważnych układów odniesienia równania fizyki po- Einsteina 
winny mieć tę samą postać. Winny być one związkami 
między obiektami geometrycznymi 4-wektorami, ten¬ 
sorami itp. Taką postać mają równania Newtona 

(3), w których zarówno d 2 r/dt 2 jak i F są wektorami 
kartezjańskimi. Czysta (bez obrotów) transformacja 
Galileusza nie zmienia współrzędnych tych wektorów. 

Zbiór transformacji współrzędnych zdarzeń w szcze¬ 
gólnej teorii względności (określonych macierzami 
Bf) nazywamy grupą Lorentza, a po dołączeniu prze¬ 
sunięć czasoprzestrzennych — grupą Poincarego. 

Ponieważ czasoprzestrzeń ma strukturę wyznaczoną 
przez tę grupę (nazywa się ją grupą symetrii czaso¬ 
przestrzeni), przeto wszystkie równania powinny 
mieć formę współzmienniczą (tensorową) ze względu 
na transformacje tej grupy. Taki postulat doprowa¬ 
dził Einsteina do zmodyfikowanej postaci równań 
Newtona (3): 



W równaniach tych p» = (E/c y p ) i 

F-v _ F_ 

i/i-r'/c* ’ ynw 

gdzie wielkości E y p, F i v są odpowiednio energią, 
pędem, siłą i prędkością, zaś z jest skalarem loren¬ 
tzowski m (czasem własnym, mierzonym na zegarze 
poruszającym się z punktem materialnym). Postu¬ 
lat Einsteina ułatwia znalezienie właściwych równań 

P° la - . 

Efektywną metodą otrzymywania rownan pola 
o dobrze określonych własnościach transformacyj¬ 
nych jest metoda wariacyjna. Wywodzi się ona z sie¬ 
demnastowiecznej zasady Fermata, która brzmi: 
między dowolnymi dwoma punktami A i B światło 
wybiera drogę, dla której czas przebiegu jest naj¬ 
krótszy lub — rzadziej — najdłuższy. Ponieważ pręd¬ 
kość światła w punkcie r w ośrodku o współczynniku 

załamania n{r) wynosi c/«(r), to światło przebywa 

dl ndl wariacyjna 

odcinek łuku krzywej dl w czasie dt = ^ =■ c • postać 
Czas Tab[K), w którym światło przebiega krzywą K 9 równań ruchu 
dany jest wzorem: 

/ f2-. 

K 

Metoda matematyczna zwana rachunkiem wariacyj¬ 
nym umożliwia otrzymanie równania różniczkowego 
krzywej K , dla której wielkość Tab[K] ma wartość 
najmniejszą lub największą. Równanie to zapisuje się 
w postaci 

ÓT = 0; (8) 

odczytujemy je: wariacja T równa jest zeru. Korzy¬ 
stając z rachunku wariacyjnego i znając wyrażenie na 
T można otrzymać z równania (8) równanie szukanej 
krzywej. 

Wykazano, że równanie ruchu układu punktów 
materialnych również można zapisać w formie wa- 
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zasada na]- riacyjnej <5/ = O, gdzie /, zwane działaniem, ma po¬ 
mniejszego stać: 

działania / = j Ldt , 

a L jest funkcją Lagrange’a (lagrangianem): 

L = energia kinetyczna — energia potencjalna. 
Znajdowanie równań ruchu metodą wariacyjną ma 
kilka zalet. Otrzymane równania mają dobrze okre¬ 
ślone właściwości tensorowe, o ile działanie jest ska- 
larem ze względu na odpowiednią dla problemu gru¬ 
pę symetrii. Z każdą transformacją zmiennych wy¬ 
stępujących w funkcji L nie zmieniającą działania 
związane jest istnienie odpowiedniej całki równań 
ruchu. Twierdzenie Noether daje efektywną metodę 
znajdywania tych całek równań ruchu. Na przykład 
z niezmienniczości ze względu na przesunięcia w cza¬ 
sie wynika całka energii, ze względu na przesunięcia 
w przestrzeni — całka pędu, ze względu na obroty 
— całka momentu pędu (—► Zasady zachowania). 

Te wszystkie zalety metody wariacyjnej spowodo¬ 
wały, że się ją najczęściej stosuje do wyprowadzania 
równań pola. Ponieważ właściwą grupą symetrii cza¬ 
soprzestrzeni jest grupa Poincarego, działanie / za¬ 
pisuje się w relatywistycznej teorii pola w trochę innej 
postaci: 



gdzie £(x) jest gęstością lagrangianu, a a oznacza 
wszystkie indeksy pola <p , łącznie z indeksami ten¬ 
sorowymi ze względu na grupę Lorentza. Ponieważ 
element objętości czasoprzestrzeni d i x jest skalarem 
lorentzowskim, to aby działanie było skalarem, gę¬ 
stość lagrangianu musi też być skalarem. 

Dla układu pól oddziałujących gęstość lagrangianu 
składa się z sumy gęstości lagrangianów odpowiada¬ 
jących polom swobodnym i gęstości lagrangianu 
oddziaływania £ 1 . W £/ występują przeważnie 
najprostsze skalary loręntzowskie skonstruowane 
z pól swobodnych występujących w rozważanym 
problemie. 


Zanim podamy najważniejsze gęstości lagrangianów i równania 
pola, wprowadzimy pewne upraszczające oznaczenia: 


a 

dx» 


a* = a M a v 


A v », 


-S— a v = e u a\ 

8xu 


1 a 2 

2 8t * 


—dpS 11 . 


gęstości 
lagrangianów 
i równania 
pól swobod¬ 
nych 


Operację □ nazywa się operatorem d’Alemberta. Pola można 
reprezentować również przez funkcje o wartościach zespolonych; 
sprzężenie zespolone oznaczamy gwiazdką, np. ę* jest funkcją 
sprzężoną zespoloną do (p. Pola takie służą do opisu cząstek na¬ 
ładowanych. 

Podstawowe gęstości lagrangianów i równania pól swobod¬ 
nych są następujące: 

Naładowane pola skalarne U^ o masie m i spinie 0 

£ « , (9) 

(□-m*)ę> = 0. (10) 

Naładowane pole wektorowe o masie m i spinie 1 


£ = - 4 - FWFw + Uu. U* 
4 2 


Podamy teraz kilka podstawowych gęstości lagrangianów £z 
opisujących oddziaływania pól. W elektrodynamice 

£i — —eAnj^y 

gdzie F nazywa się prądem elektromagnetycznym. Prąd F może 
być klasyczny lub kwantowy; jeśli jest kwantowy, to./ 4 wyraża się 
przez bispinorowe pole elektronowe: 

F = yF V, 

czyli F to najprostszy wektor lorentzowski zbudowany z y t y 
i y 4 . Podobnie najprostszym oddziaływaniem pola bispinorowego 
ty z polem skalarnym q> jest 

£x = gyy(p y 

a z polem pseudoskalamym <p ’: 

£i = gyy b yę' 

gdzie transformuje się jak pseudoskalar. To ostatnie oddziały¬ 
wanie zwie się oddziaływaniem Yukawy i zaproponowane było 
do opisu oddziaływania np. nukleonów z pionami. Stałą g nazy¬ 
wa się stałą sprzężenia. 

Oprócz indeksów lorentzowskich dodaje się polom 
indeksy określające ich własności ze względu na inne 
grupy symetrii, np. określające izospin, spin unitarny, 
kolor, zapach itp. (-* Zasady zachowania). Wtedy, 
kiedy oddziaływanie łamie symetrię, £i nie może 
być skalarem ze względu na grupę określającą tę sy¬ 
metrię. Jest to pewna wskazówka przy poszukiwaniu 
odpowiedniej gęstości lagrangianu. Dodatkowe ogra¬ 
niczenie daje żądanie renormalizowalności teorii po 
skwantowaniu, do czego wrócimy później. 

Bardzo wa 2 ną symetrią, która odegrała kluczową 
rolę w konstruowaniu najnowszej teorii oddziaływań 
słabych i elektromagnetycznych, jest symetria cecho¬ 
wania. Zilustrujemy ją na przykładzie skalarnego pola 
naładowanego (9). Pole to, jako najprostsze najczę¬ 
ściej jest stosowane w rozważaniach modelowych. 
Widać, że gęstość lagrangianu w tym wzorze jest 
niezmiennicza ze względu na transformację zw. glo¬ 
balną transformacją cechowania: 

<p' = e i<3 V, (13) 

gdzie Q to ustalony, aż — dowolny rzeczywisty pa¬ 
rametr niezależny od *. Dowód jest oczywisty, bo ze 
wzoru (13) wynika, że <p'* = e -l ‘« A ^* i odpowiednie 
czynniki fazowe się znoszą. Pole <p jest polem o war¬ 
tościach zespolonych, czyli y = Re<p-fiTm<p. Trans¬ 
formacja (13) ma interpretację obrotu na wykresie, 
na którym na osi * odkłada się Re<p, a na osi y odkła¬ 
da się Im y. 

Lokalną transformację cechowania wprowadza się 
wzorem 

<p' = e <QA( *V- (14) 

Okazuje się, że stała Q we wzorze (14) ma interpre¬ 
tację elektrycznego ładunku pola. Widać, że gęstość 
(9) nie jest niezmiennicza ze względu na tę transfor¬ 
mację, ponieważ: 

d^y' = e iQ ^ z) (c tŁ yFiQd fŁ }.(x)). 

Zastanówmy się, jak należy zmienić gęstość (9), żeby 
nowa gęstość lagrangianu była niezmiennicza ze 
względu na transformację (14). Jedno z rozwiązań 
jest następujące: dodajemy do operatora d* pole 
wektorowe A» pisząc: 

Du = (15) 


(gdzie F' tv = ć 4 u v -8 v Ł/ 4 ), 

(□-m*)l/ 4 =0. 

Swobodne pole elektromagnetyczne 

£ _ ( 11 ) 
(gdzie /«*• = a'M v -£ v /ł<‘), 

DA 4 =0; 

pole A u wyraża się przez potencjał elektrostatyczny <p i potencjał 

wektorowy A w następujący sposób: A M = (ctp y A). 

Pole o spinie 1 / i i masie m 

£ = - 1 J 4 (yy tl y,M — y,My tt y)-myy>0Y t, 2*'-'n)y(x) = 0; (12) 

y i w oznaczają pola bispinorowe, a y 4 Ga = 0,1, 2, 3) — cztery 
macierze 4x4 transformujące się jak składowe czterowekiora 
przy zmianie układu odniesienia (dla uproszczenia opuszczamy 
we wzorze 12 i następnych wysumowane wskaźniki bispinorowe). 


wtedy w miejsce wzoru (9) otrzymujemy 

£ = (DnyYD^cp—m 2 yy*. ’ (16) 

Aby £ było niezmiennicze ze względu na (14), mu¬ 
simy określić, jak pole A» transformuje się przy trans¬ 
formacji cechowania. Jeśli: 

A' u = Au— d M A(x) 9 (17) 

to łatwo wykazać, że £>' D' 4 = A*D 4 , czyli £' = £. 
(Elementarną ilustracją lokalnych i globalnych trans¬ 
formacji cechowania jest rys. 5). Z tego wynika wnio¬ 
sek, że z niezmienniczością ze względu na lokalną 
transformację cechowania naładowanych pól (trans¬ 
formacje (14) tworzą grupę U( 1)), związane jest w na¬ 
turalny sposób wektorowe pole cechowania A u sprzę 


globalna 

transforma¬ 

cja 

cechowania 


lokalna 

transforma* 

cja 

cechowania 


74 





06 obrotu 



b) 

Rys. 5. Ilustracja lokalnej grupy cechowania 0(2) obejmującej 
obroty wokół osi z. a) Sześcian ułożony z identycznych klocków, 
b) sześcian złożony z prętów i odpowiednio naciętych kul, tak 
aby wygląd kuli nie zależał od obrotu wokół osi z , oraz aby 
każda kula mogła być obracana niezależnie bez psucia konstrukcji. 
Obie bryły są niezmiennicze ze względu na globalną grupę ce¬ 
chowania— czyli na obroty bryły jako całości wokół osi z. 
Przy przejściu do lokalnej grupy cechowania — niezależne 
obroty klocków i kul — bryła pierwsza ulegnie deformacji, 
a druga zachowa swój kształt 


pole gające się z polem naładowanym tak, jak we wzorze 
cechowania (16). e>o jS musimy dodać gęstość lagrangianu swo¬ 
bodnego pola cechowania A». Widać, że pole Au musi 
. być bezmasowe, ponieważ tylko gęstość lagrangianu 
swobodnego pola wektorowego bezmasowego (11) 
jest niezmiennicza ze względu na transformację (17). 
Po dodaniu tej swobodnej gęstości i rozpisaniu wzoru 
(16) przy pomocy wzoru (15), otrzymujemy gęstość 
lagrangianu, którą przez analogię do elektrodyna¬ 
miki wypisalibyśmy dla naładowanego pola skalarne¬ 
go oddziałującego z polem elektromagnetycznym. 
Pozwala to utożsamić w tym przypadku pole cecho¬ 
wania Au z polem elektromagnetycznym (nieprzypad¬ 
kowa zbieżność oznaczeń). Podobnie startując z na¬ 
ładowanego pola bispinorowego (którego kwanty 
odpowiadają elektronom) i szukając najprostszej 
gęstości lagrangianu niezmienniczej ze względu na 
lokalną grupę cechowania, otrzymujemy gęstość 
lagrangianu elektrodynamiki. Stąd bierze się idea 
poszukiwania nowych interesujących fizycznie pól 
jako pól cechowania. 

teorie z wyż- Wyposażając pola w dodatkowe własności można 
szymi grupa- budować gęstości lagrangianu niezmiennicze ze wzglę- 
mi lokalnymi du na grupy bardziej złożone, takie jak SU(2), SU( 3) 
cechowania (-> Cząstki elementarne i ich oddziaływania). Trans¬ 
formacje np. z grupy SU( 2) można przedstawić w po¬ 
staci : 

t !i>i U l + (A J J r 9+ 1 /*(A</ , ) 2 +.... 

gdzie / 2 , h są pewnymi macierzami zwanymi ge¬ 
neratorami grupy SU( 2). Dla grupy 5C/(3) mamy 8 ge¬ 
neratorów. Żądając, aby gęstość lagrangianu była 
niezmiennicza ze względu na lokalną grupę SU( 2), 
czyli ze względu na transformacje: 

otrzymuje się w naturalny sposób (analogiczny do 
dyskutowanego wyżej) 3 bezmasowe wektorowe pola 
cechowania. Ponieważ w przyrodzie nie są znane żad¬ 
ne cząstki wektorowe bezmasowe poza fotonem, wy¬ 
dawało się przez wiele lat, że teorie z wyższymi gru¬ 
pami lokalnymi cechowania nie znajdą zastosowania 
w fizyce. Subtelne rozważania na gruncie kwantowej 
teorii pola wykazały, że jest inaczej. 


Czym zajmuje się mechanika 
kwantowa 


Podstawowym przesłankami powstania mechaniki 
kwantowej były następujące obserwacje. Zauważono, 
że w mikroświecie pewne wielkości fizyczne, takie jak 


energia E i moment pędu J, mogą zmieniać się tylko 
skokowo. Stwierdzono poza tym, że pewne wielkości 
fizyczne, .zwane komplementarnymi, mają tę wła¬ 
sność, że ich jednoczesny dokładny pomiar jest nie¬ 
możliwy (np. im bardziej precyzyjny będzie' pomiar 
położenia mikrocząstki, tym większą niekontrolo¬ 
waną zmianę jej pędu pomiar ten spowoduje). Mimo 
silnego wpływu pomiarów na stan mikrocząstki ob¬ 
serwuje się wiele regularności w eksperymentach prze¬ 
prowadzanych z bardzo dużą liczbą identycznie przy¬ 
gotowanych mikrocząstek. Na przykład, nie jesteśmy 
w stanie przewidzieć, kiedy rozpadnie się obserwo¬ 
wana mikrocząstka nietrwała; natomiast okazuje się, 
że czas, w jakim rozpada się połowa cząstek z próbki 
materiału radioaktywnego, nie zależy od wielkości 
próbki, tylko od wybranego pierwiastka i wszystkie 
eksperymenty dają bardzo zbliżoną jego wartość. 
Podobnie promienie rentgenowskie, elektrony lub 
neutrony po przejściu przez kryształ tworzą piękne 
obrazy dyfrakcyjne (rys. 6), natomiast zachowania 
się wybranej mikrocząstki nie jesteśmy w stanie prze¬ 
widzieć. Tak więc regularności obserwowane w mi¬ 
kroświecie mają charakter statystyczny, to znaczy, 
jeśli w pewnym eksperymencie mamy dużą liczbę 
identycznie przygotowanych mikroukładów fizycz¬ 
nych (w stanie początkowym /), to z reguły w wyniku 
eksperymentu otrzymamy grupy układów różniące 
się od siebie (w różnych stanach końcowych f). Re¬ 
gularność przyrody polega na tym, że powtarzając 
ten sam eksperyment wiele razy zawsze otrzymujemy 
te samą częstość występowania mikroukładu w sta¬ 
nie końcowym f\ jeśli był on w stanie początkowym 
i; prawdopodobieństwa Pif występowania stanów/ 
spełniają związek 

N 

/-A 

(N oznacza liczbę stanów końcowych). Celem me¬ 
chaniki kwantowej jest wyznaczanie wartości praw¬ 
dopodobieństw Pif odnoszących się do różnych 
eksperymentów, jak również znajdowania dopuszczal¬ 
nych wartości wielkości fizycznych charakteryzują¬ 
cych stan mikroukładów (np. poziomy energetyczne 
atomów). 

Jeśli podzielimy przestrzeń na bardzo wiele (N 
bliskie nieskończoności) sześcianików, możemy za 
stan/mikrocząstki uznać fakt obserwacji jej w/-tym 
sześcianiku. Wyobraźmy sobie, że mamy urządzenie 
wysyłające mikrocząstki (źródło promieniotwórcze, 
wyjście z akceleratora itp.) i interesuje nas położenie 
mikrocząstki po czasie T od chwili wyjścia z urządze¬ 
nia. Stanem / jest teraz wyjście cząstki z określonego 
urządzenia, a PiĄT )— prawdopodobieństwem reje¬ 
stracji jej po czasie Tw/-tym sześcianiku. Aby obli¬ 
czyć prawdopodobieństwa Pif{T) wprowadza się 

w mechanice kwantowej funkcję falową P(r y t). Praw¬ 
dopodobieństwa PifiT) otrzymuje się przy pomocy 
wzoru 

p it (T) = f T)vif, r)~ 

*V 

gdzie Vf oznacza sześcianik, r/—jego środek, a | Vf \— 

jego objętość. Funkcja falowa ^(rj) jest obiektem 
abstrakcyjnym. Jest to funkcja o wartościach ze¬ 
spolonych, a ponieważ służy do obliczania prawdo¬ 
podobieństw, nazywa się ją amplitudą prawdopodo¬ 
bieństwa ; oczywiście musi mieć własność 

f P*(r > t)P(r,i)d^= 1. 

R* 

Zmienność w czasie funkcji falowej cząstki o masie 
m jest dana przez równanie Schródingera: 

08) 

dt 2 m 


statystyczny 

charakter 

mechaniki 

kwantowej 



promieniowanie 

rentgenowskie 



elektrony 


• • 



• • 

neutrony 


Rys. 6. Obrazy dy¬ 
frakcyjne Lauego 
wytworzone przez: 
promieniowanie 
rentgenowskie, 
elektrony i neutrony 


funkcja 

falowa 


równanie 

Schródingera 
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Równanie to zapisuje się również w postaci: Ten postulat odegrał podstawową rolę w sformuło- 

d A waniu mechaniki kwantowej przez Feynmana. Opie- 

*** = ra J4 na rozważania w artykule „Oddziaływa¬ 

nia elektromagnetyczne”. Jeśli procesów jest nieprze- 
zasada gdzie operator różniczkowy H nazywa się hamilto- wiele, suma we wzorze (21) musi być zastą- 

korespon- nianem. Ważną rolę przy wypisywaniu równania (18) P , l 0 ? a . ca j?’ , a * ca stru ^ tura amplitud przejścia jest 
dencji Bohra dla konkretnego problemu odgrywa zasada korespon- właściwa dla kwantowej teorii pola, którą buduje się 
dencji Bohra, zgodnie z którą, jeżeli dokonujemy w P°dobny sposób jak mechanikę kwantową. 


pomiary z dokładnością makroskopową (np. obser¬ 
wujemy tor cząstki elementarnej w komorze pęche¬ 
rzykowej, iskrowej czy w emulsji), to wartość mierzo¬ 
na wielkości fizycznej musi się zmieniać zgodnie z pra¬ 
wami mechaniki klasycznej (położenie „makrosko¬ 
powe” musi zmieniać się w czasie zgodnie z równa¬ 
niami Newtona dla danego problemu). Panuje prze¬ 
konanie, że w funkcji falowej danego układu fizycz¬ 
nego jest zawarta najpełniejsza możliwa informacja 
o własnościach mikrocząstek. W ostatnim rozdziale 
wspomnimy o poglądach odmiennych. W istocie przy 
pomocy funkcji tp można przewidzieć wyniki bardzo 
różnych eksperymentów. Na przykład jeśli zamiast 
położenia mierzylibyśmy w omawianym powyżej 
eksperymencie średni pęd mikrocząstek w kierunku 
osi x w chwili T, <^(7’)), to dany on byłby wzorem 

W))=* f T)d r r. 

R* 

Podobnie z każdą inną wielkością fizyczną O można 
skojarzyć operator Ó tak, żeby średnia mierzona 
wartość (0(T)y była dana wzorem: 

<0(r» = J v*(r, T)ó<F(r, T)db. (19) 

Ponieważ funkcję falową można zapisywać jako funk¬ 
cję innych zmiennych niż r, na przykład pędu p y używa 
się ściślejszego i bardziej abstrakcyjnego języka mó¬ 
wiąc, że każdemu stanowi mikrocząstki odpowiada 
wektor stanu ^ należący do przestrzeni Hilberta, 
a każdej wielkości fizycznej O — operator samosprzę- 
żony ó w tej przestrzeni taki, że średnia wartość 
<0> wynosi: 

<o> = <!F, óry, 

gdzie 0'F'y oznacza iloczyn skalamy; dla W = 
= 5F(r, /) ma on postać (19). Intuicje klasyczne są istot¬ 
ne przy wyborze H. Na przykład dla atomu wodoru 
(który klasycznie wyobrażamy sobie jako oddziału¬ 
jące punktowe cząstki: lekki elektron i ciężki proton, 
tworzące stan związany) w równaniu Schródingera 

(18) w pierwszym przybliżeniu w miejsce V(r) pojawi 
się klasyczny potencjał elektrostatyczny. Równanie 
to umożliwi wyznaczenie poziomów energetycznych 
atomu wodoru i wielu zjawisk dotyczących tego ato¬ 
mu, nie da nam jednak żadnego wyobrażenia o bu¬ 
dowie atomu. Nie wiemy, co się dzieje z elektronem 
w atomie. Wszelkie rysunkowe wyobrażenia są nie¬ 
prawdziwe. 

prawdopo- Jak już wspominaliśmy, mechanika kwantowa 
dobienstwo umożliwia również obliczenie prawdopodobieństw 
przejścia przejścia /fy: 

Pif = \<Vf,ŚYi> W ( 20 ) 


O kwantowaniu pól 
swobodnych 

Jak już wspominaliśmy, fale elektromagnetyczne 
w wielu eksperymentach (efekt fotoelektryczny, zja¬ 
wisko Comptona) zachowują się jak strumienie czą¬ 
stek — fotonów o dobrze określonej energii, pędzie 
i o zerowej masie. Cząstki te biorą udział w wielu 
oddziaływaniach z elektronami i pozytonami (anihi- 
lacja par e+e~ y kreacja par, produkcja dodatkowych 
fotonów przy zderzeniach e+e~ i e~e~ itp.). Dla opi¬ 
sania tych oddziaływań powstała elektrodynamika 
kwantowa. Służy ona do znajdowania amplitud praw¬ 
dopodobieństwa wyżej wymienionych procesów. Dla 
opisania procesów oddziaływania cząstek elementar- kwantowa 
nych powstała kwantowa teoria pola. Według kwan- teoria pola 
towej teorii pola z każdą obserwowaną w przyrodzie 
cząstką elementarną jest stowarzyszone pole. Od¬ 
działywania cząstek to oddziaływania odpowiednich 
pól. Pole będąc obiektem fizycznym może znajdować 
się w różnych stanach, np. 1 foton to stan jednofoto- 
nowy, 2 fotony to stan dwufotonowy. W kwantowej 
teorii pola, podobnie jak w mechanice kwantowej, 
stanom układu przyporządkowuje się wektory stanu 
w przestrzeni Hilberta, a wielkościom mierzalnym, 
tzw. obserwablom — operatory. Pomocą przy znaj¬ 
dowaniu takiej reprezentacji matematycznej jest 
znajomość teorii klasycznej, wyników doświadczeń 
oraz zasada korespondencji. Podstawowymi obser- 

wablami w mikroświecie są energia E i pęd p. Energia 
pola i pęd są w teorii klasycznej funkcjami samych 
pól (np. wzór 13). Dla pól bez analogii klasycznej 

wzory na. E i p otrzymuje się z twierdzenia Noether. 

Ponieważ E ip w teorii kwantowej mają być operato¬ 
rami, więc pola kwantowe, z których zgodnie z zasadą 
korespondencji są one zbudowane, muszą być ope¬ 
ratorami. Mówiąc ściślej, operatorami są pola po 
wycałkowaniu ich z funkcją odpowiednio regularną. 

W matematyce obiekty takie nazywa się dystrybucja¬ 
mi o wartościach operatorowych. 

Prześledzimy strukturę matematyczną teorii na 
przykładzie swobodnego bezmasowego pola skalar¬ 
nego. Stan pola, w którym jest n kwantów o energii 

fi(o i pędzie hk jest z definicji stanem o określonej 
energii i pędzie. Oznaczmy wektor z przestrzeni Hil¬ 
berta reprezentujący ten stan przez <P n = \ w,&>. 

Wartości oczekiwane energii i pędu są równe: 

rr H oczekiwane 

E nho> i (py nhk , (22) energii i pędu 

uwzględniając (20) i wprowadzając oznaczenia 


gdzie i oznaczają początkową i końcową funkcję 
falową, S — pewien operator dający się wyznaczyć 
z równania Schródingera. Jeśli stan końcowy można 
otrzymać w wyniku N różnych procesów, a eks¬ 
peryment nie pozwala na rozstrzygnięcie, który 
proces zaszedł w danym wypadku, to amplituda 
Afi == <¥7, SWi} daje się przedstawić jako suma N 
amplitud A^(A^ { jest amplitudą odpowiadającą/?-te- 
mu procesowi): 

A n = £ A fi- ( 21 ) 

2>-l 


<«,T|£|/i,A> 21 <0„, £<?>„>, 

<n, k\p\n, ky = <0„,/><?>„>, 
można to zapisać w postaci 

<«, k \E\n y ky — nh<o y (23) 

<w, k \p\n , ky = nhk , (24) 

gdzie wielkości co i k = \k\ związane są równością 
co^lc^—k 1 — 0. Wielkości E i p tworzą razem cztero- 
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wektor, zatem (22) można zapisać krótko 

</?*> = nhk*, fi — 0,1,2,3, 

gdzie k* = (co/c, Jc). Najprostsze rozwiązanie rów¬ 
nania (10) dla m = 0 ma postać: 

<p k = c '(T)e*<<**-^> = (25) 

gdzie c' to dowolna stała, która może zależeć od k . 
Energia pola klasycznego odpowiadająca (na pod¬ 
stawie twierdzenia Noether) temu rozwiązaniu wyno- 
si: _ _ _* 

E (q> k ) = ć+(k)ć(k)<t>(k) = c*(k)c(k)fio>(k). 

Najprostszym sposobem przyporządkowania energii 
E —operatora —(w zgodzie ze wzorem 23) jest za¬ 
stąpienie współczynnika c*(k) c(k) operatorem liczby 
cząstek o pędzie k, mającym własność: 

h(k)\n, ky = n\n, ky. 

Operator n{k) ma żądane własności, jeśli współczyn¬ 
nikom c* i c przyporządkujemy operatory c i c+ ta¬ 
kie, że 

c{k)\n, ky = |//T|ii—1, ky, (26) 

c+(k)\n,ky = |/S+T|j»+1 > *>• < 27 > 

operatory Operatory (26) i (27) nazywamy odpowiednio opera- 

kreacja torem anihilacji i kreacji cząstek o pędzie k. Najogól- 
i anihilacji niejsze rozwiązanie równania (10) dla m = 0 jest 
kombinacją liniową rozwiązań (25): 

<f(x)= f (28) 

J R , V 2a > 
a energia 

E(<p) = h f c*(k)c(k)wd*~k. (29) 

R* _ _ 

Zastępując we wzorach (28) i (29) stałe c(k ) i c*(k) 
przez operatory (26) i (27) otrzymujemy operator 
pola q> i operator energii E: 

9>(X)= f -^rfi(Ć(k)e~^+c*(k)e<^), (30) 
J ylco 

R 5 r 

E = fij ć+(k)c(k)co(k)d 3 k. 

R* 

kwantowanie Podobnie wszystkie inne obserwable wyrażające się 
poła przez pole <p(x) stają się po uwzględnieniu wzoru (30) 
operatorami 

O (<p) -> :0 (?):. 

Procedurę przyporządkowywania polom klasycznym 
pól kwantowych nazywa się kwantowaniem. Symbol 
: : oznacza tzw. normalne uporządkowanie iloczy¬ 

nów operatorów kreacji i anihilacji występujących w 
0(?); uporządkowanie musi być takie, aby wszystkie 
operatory anihilacji stały na prawo od operatorów 
kreacji, np.: 

icijkJc+OciicikJc+ikz): = c+(k 1 )c+(k z )c(k 2 )c(k 1 ). 


Przy takim opisie okazuje się, że stany pola klasycz¬ 
nego mogą być reprezentowane przez wektory stanu 
z nieskończoną liczbą cząstek, które nazywa się sta¬ 
nami koherentnymi. Wartość oczekiwana pola kwan¬ 
towego ? w tych stanach równa jest poju klasycz¬ 
nemu. Z doświadczenia wiadomo, że w stanach o nie¬ 
wielkiej liczbie kwantów pole przejawia własności 
cząstkowe, natomiast w stanach o bardzo wielkiej 
liczbie kwantów (np. klasyczna makroskopowa fala 
elektromagnetyczna) pole przejawia własności fa¬ 
lowe. Na tym polega dualizm falowo-korpuskulamy. 

Aby wartość oczekiwana pola kwantowego y(x) (30) 
dla stanu koherentnego spełniała równanie pola kla¬ 
sycznego, przyjmuje się taką samą postać równania 
pola kwantowego ?, jak pola klasycznego ?. Przy 
takim założeniu wektory stanu pola nie zależą od 
czasu. Tego rodzaju opis ewolucji układu w czasie 
nazywamy obrazem Heisenberga. Inny możliwy opis 
to obraz Schródingera, w którym operatory pola nie 
zależą od czasu, a wektory stanu 4> spełniają rów¬ 
nanie: 

at 

gdzie przeważnie za operator H można przyjąć ope¬ 
rator energii E. Dygresja ta będzie rozszerzona po 
wprowadzeniu oddziaływań pól kwantowych. 

Kwantowanie innych swobodnych pól klasycznych 
przebiega podobnie, z tym że dopuszczalne stany pól 
są bogatsze, kwanty ich charakteryzuje ładunek, nie- 
zerowy spin (całkowity dla pól wektorowych i dla pól 
bispinorowych) oraz dodatkowe własności takie jak 

izospin, spin unitarny itp. Tak więc operatory ć(k) 
przechodzą w ć a (k), a wskaźnik a oznacza dodatkowe 

własności. „ 

Okazuje się, że dla każdego kwantu pola, który is*. 
charakteryzuje masa m , czteropęd fik*, ładunki qt anty cząstek 
(ładunek, hiperładunek, liczba barionowa), rzut spinu 
S 2 na oś z, istnieje kwant pola (zwany antycząstką) 
o masie m, czteropędzie fik*, ładunkach —qi i rzucie 
spinu — Sz. Często spotyka się w literaturze popular¬ 
nonaukowej zdanie, od którego zwykłemu czytelni¬ 
kowi jeżą się włosy:,,Antycząstką to cząstka o energii 
ujemnej poruszająca się wstecz w czasie”. W przy¬ 
rodzie nic nie porusza się wstecz w czasie. Zdanie 
powyższe należy rozumieć w następujący sposób: 
jeśli w równaniu opisującym cząstkę zmienimy wy¬ 
stępujący tam parametr energii E na — E oraz / na —/, 
to otrzymamy równanie opisujące antycząstkę o ener¬ 
gii E(E> 0), poruszającą się w przód w czasie. Bez 
tego wyjaśnienia zdanie przytoczone (które jest wła¬ 
ściwie rozumiane przez fizyków) zmienia się w zdanie 
nonsensowne. Należy go więc unikać. 

Konieczność porządkowania normalnego wymaga 
w pewnych sytuacjach znajomości własności opera¬ 
torów ć(k) i c + (k) przy ich przestawieniu, czyli znajo¬ 
mości tzw. związków przemienności. Aby wyrażenie 
mające interpretację energii było dodatnie, muszą za¬ 
chodzić następujące związki: 

[ć„(£), cJ(F)] ± = ć t {k)c + 0 (k')±c + f (k ; )c tl (k) = 

= S, fi d(k-V), (31) 


Szczególne znaczenie ma stan pola Q zwany próżnią, 
zdefiniowany równościami 

ć(k)Q = 0 dla każdego k. 

stan próżni Za pomocą Q i operatorów kreacji można przedsta¬ 
wić każdy stan pola jako stan otrzymany z próżni 
przez działanie operatorów kreacji: 

|1 ,ky=c + (k)D, 

|2 ,ky = 1 l*c + (k)c+(k)Q, 


!«,*> = 




gdzie ó a(f ó(k-k') znika dla i k*k'. Znak plus związki 
odpowiada polom o spinie połówkowym, a minus — przcmienno- 
polom o spinie całkowitym. Mówimy, że kwanty tych ści 
pól podlegają odpowiednio statystyce Fermiego-Dira- 
ca lub Bosego-Einsteina (—> Termodynamika sta¬ 
tystyczna). . .... 

Za pomocą operatorów budujemy z próżni rożne 
stany m-cząstkowe o ustalonych pędach, np. 

\m,ky = A{ci x (k)) T ' ... (ciM) rvQ > 
gdzie r 1 -fr 2 + ••• ~ł~ r P ~ M* a(X i’ ••• oznaczają róż¬ 
niące się zbiory parametrów. Dla cząstek o spinach 
połówkowych n = 0 lub 1 — wynika to ze związków 
przemienności i nazywa się zakazem Pauliego. 
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O diagramach Feyrunana, renor- 
maiizaciś i kłopotach z silnymi 
oddziaływaniami 

Doświadczenie sugeruje, że oddziaływania pól wiążą 
tworzenie się z tworzeniem i znikaniem cząstek. Na przykład 
£ znikanie zderzenie neutronu o wielkiej energii z jądrem srebra 
cząstek zarejestrowane zostało w emulsji jądrowej (rys. 7) 
w postaci „gwiazdy” — tor protonu zakończony jest 
pękiem torów wychodzących z jednego punktu. To, 
co wydarzyło się w czasie właściwego oddziaływania 
na odległościach rzędu 10“ 13 cm i w czasie rzędu 10 -23 s, 
jest dla nas tylko źródłem domysłów. Jedno jest pewne: 
szybko zmieniające się w obrazie Schródingera stany 
pola oddziałującego nie mogą być stanami o ustalonej 
liczbie cząstek. Nie jest w pełni jasne, jak należy kon¬ 
struować wektory odpowiadające tym stanom, ani jak 



Rys. 7. Neutron z promieniowania kosmicznego zderza się 
z jądrem srebra w emulsji jądrowej. Można rozróżnić 169 na¬ 
ładowanych cząstek, z których co najmniej 130 jest cząstkami 
wyprodukowanymi. Strzałka oznacza kierunek padającego 
neutronu, który jako cząstka nienaładowana nie pozostawił 
śladu w emulsji 

przedstawiać operatory pola. Najogólniej postawiony 
problem to zapisanie w obrazie Heisenberga równań 
klasycznych oddziałujących pól i szukanie rozwiązań 
tych równań w postaci funkcji (dystrybucji), których 
wartościami są operatory działające na przestrzeni 
Hilberta stanów pól oddziałujących. Podkreślmy, 
że nie znamy zarówno przestrzeni Hilberta jak i ope¬ 
ratorów. Równania oddziałujących pól są skompliko¬ 
wanymi operatorowymi równaniami nieliniowymi. 
Dotychczas nikomu nie udało się ich rozwiązać dla 
realistycznej teorii. 

Sukcesy i to duże osiągnięto jedynie w wypadku, 
gdy oddziaływanie między polami jest słabe (jak np. 
w elektrodynamice kwantowej), dzięki czemu można 
rachunek stosować metodę rachunkową zw. rachunkiem za- 
zaburzeń burzeń. Metodę tę można stosować wtedy, kiedy gę¬ 
stość lagrangianu oddziaływania J2i zawiera małą stałą 
sprzężenia oraz kiedy procesy fizyczne obserwowane 
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w przyrodzie wyglądają tak, jakby oddziaływanie się 
włączało i wyłączało. Innymi słowy — kiedy można 
wyróżnić trzy fazy: pierwszą i ostatnią, w których 
występują kwanty pól swobodnych, oraz środkową, 
w której odbywa się oddziaływanie. Wygodne jest 
wówczas stosowanie opisu zw. obrazem oddziały¬ 
wania. W obrazie tym zarówno operatory pola jak obraz oddzia- 
i wektory stanu zależą od czasu. Operatory pola speł- tywama 
niają równania pola swobodnego, zaś wektory stanu 
równanie następujące: 

ih-^0 = Hj4>, (32) 

gdzie Hi , zwany hamiltonianem oddziaływania, wy¬ 
raża się w prosty sposób przez gęstość lagrangianu 
oddziaływania J2r, jeśli £i nie zależy od pochodnych 
pól, to 

Hi = — f :£i:d 3 x. 

R 3 

Podstawowymi wielkościami, które chcemy obli¬ 
czać, są amplitudy prawdopodobieństwa przejścia Aji 
ze stanów początkowych |/> do stanów końcowych 
|/). Amplitudy te można otrzymać w postaci 

^ = </|5|/>. (33) 

] Unitarny operator Ś zw. macierzą rozpraszania (lub 
macierzą S) można przedstawić w postaci rozwinięcia 
perturbacyjnego, czyli nieskończonego szeregu zw. macierz S 
perturbacyjnym: 

S = '+ (i) TT /**. - #x.Tl.hM: 

«-1 ' ' 

i?/(*«):]» (34) 

gdzie 1— macierz jednostkowa, zaś T[...], zw. iloczy¬ 
nem chronologicznym, oznacza czasowe uporządko¬ 
wanie wyrażeń w nawiasie kwadratowym od najwięk¬ 
szej współrzędnej czasowej (na lewym końcu) do naj¬ 
mniejszej (na prawym). Wyrażenie (34) jest formalnym 
rozwiązaniem równania (32). Ponieważ w każdym 
J2i (*t) zawarta jest mała stała sprzężenia g , tak więc 
n -ty wyraz szeregu S n zawiera czynnik g n « 1. 

To jednak nie wystarcza do rozstrzygnięcia, czy for¬ 
malny szereg (34) jest zbieżny, tzn. czyjego suma jest 
dobrze określonym operatorem. Aby się o tym prze¬ 
konać, należałoby oszacować wszystkie wkłady do 
amplitud </|S n !/>, co nie jest możliwe. Dotychczas 
nie ma dowodu zbieżności szeregu (34), nawet w elek¬ 
trodynamice. Nie zmienia to faktu, że już kilka pierw¬ 
szych wyrazów tego szeregu (po renormalizacji, 
o której za chwilę będzie mowa) daje w elektrodyna¬ 
mice wyniki wspaniale zgodne z doświadczeniem 
(-* Elektrodynamika, Oddziaływania elektromagne¬ 
tyczne). 

Operator S n po wyrażeniu przez operatory pola 
staje się kombinacją operatorów kreacji i anihilacji, 
a po przeprowadzeniu uporządkowania normalnego 
staje się sumą normalnie uporządkowanych składni¬ 
ków. Otrzymujemy sumę, bo na mocy związków prze- 
mienności (31) każde przestawienie operatorów pola 
powoduje konieczność dodania pewnej funkcji, np. 
dla pola bispinorowego: , 

vfc)vW = V 7 (* 2 )V(* 1 ) +S(x 1 - x 2 ), 

/ 

gdzie S fo— x 2 ) jest pewną dobrze określoną funkcją. 

Tak więc wyrażenie, w którym było n operatorów po¬ 
la, przechodzi po jednokrotnym przestawieniu dwóch 
odpowiednich operatorów na sumę dwóch wyrażeń — 
jednego z n operatorami pola i drugiego z n— 2 ope¬ 
ratorami. Wykonując wszystkie wymagane przez 
operację : : przestawienia otrzymujemy S n w postaci 
złożonej sumy. Każdy wyraz tej sumy jest graficznie 
przedstawiony przez diagram zw. diagramem Feyn¬ 
mana. Ograniczymy się tylko do omówienia diagra- 





diagramy 

Feynmana 




mów Feynmana dla amplitud A/i (33) w reprezentacji 
pędowej. Diagramy te są reprezentacją rysunkową 
składników sumy, którą staje się A fi po uporządkowa¬ 
niu normalnym każdego «S«. Diagramy składają się 
z wierzchołków, linii wewnętrznych i linii zewnętrz¬ 
nych. Rodzaj wierzchołków zależy od gęstości Jagran- 
gianu oddziaływania £i. Jeśli £i jest sumą n gęstości 
£* i = 1, ..., w, takich, że jest iloczynem normal¬ 
nym pi operatorów pola, to w diagramach występuje n 
typów wierzchołków takich, że z wierzchołka /'-tego 
typu wychodzi pt linii. Każdej linii i każdemu wierz¬ 
chołkowi odpowiada w sposób wzajemnie jedno¬ 
znaczny wyrażenie analityczne. Rysunki 8 i 9 przed¬ 
stawiają przykładowo kilka diagramów dla amplitudy 
opisującej elastyczne rozpraszanie dwóch elektronów. 
Jako stan początkowy przyjmujemy dwa elektrony 
o czteropędach p x i p 2 , a jako stan końcowy te 
same elektrony o czteropędach p 2 i P\ takich, że 
p x -\-p 2 = ps+pi. Przypominamy, że A/i jest amplitudą 
prawdopodobieństwa zajścia wyżej omawianego 
procesu. Wkłady do amplitudy A/i dają wszystkie 
operatory S n . Wkłady pochodzące od S n nazywamy 
w-tego rzędu względem stałej sprzężenia. Na rys. 8 
przedstawione są wszystkie wkłady do omawianego 
procesu drugiego rzędu, a na rys. 9 — kilka wkładów 
czwartego rzędu względem stałej sprzężenia e. Dia¬ 
gramy c), d) i e) z rys. 9 nazywa się poprawkami pro¬ 
mienistymi do diagramu a) z rys. 8. Całkowanie po 
czteropędzie c, konieczne przy obliczaniu wyrażeń 
odpowiadających tym diagramom, prowadzi do war¬ 
tości nieskończonych. Procedura, która pozwala z tych 


Rys. 8. Diagramy Feynmana 2. rzędu względem stałej sprzę¬ 
żenia c dla procesu Pi+Pj—tPs+Py Różnym rodzajom lmn 
przyporządkowane są odpowiednie wyrażenia analityczne. 
Zewnętrznym liniom elektronowym (czarne ze strzałkami) od¬ 
powiadają funkcje zależne od czteropędów pt\ wewnętrznej lmn 
fotonowej z w. propagatorem (wężyk niebieski) jest przyporząd¬ 
kowane wyrażenie analityczne zależne od czteropędu tak do¬ 
branego, aby w każdym wierzchołku czteropęd był zachowany. 
Tak więc dla rysunku (a) k = p»—p x , a dla rysunku (b) k >= Pt~Pi- 
Wyrażenie przypisane wierzchołkowi zawiera czynnik e (ładunek 
elektronu). Po wykonaniu wszystkich obliczeń obu diagramom 
odpowiadają wyrażenia postaci aftpi, ...p 4 ), gdzie a = e J /4n£o”C « 
« i/ m . Odwrócenie strzałki czasu pozwala interpretować oba 
grafy jako wkłady do amplitudy elastycznego rozpraszania po¬ 
zytonów 



Rys. 9. Kilka diagramów- 4. rzędu względem stałej sprzężenia 
e (drugiego rzędu względem stałej sprzężenia a). Na diagramach 
tych pojawia się nowy element — wewnętrzna linia elektronowa, 
propagator elektronu (czarna linia prosta ze strzałką). Po czte¬ 
ropędach związanych z liniami wewnętrznymi zawsze musi być 
wykonane całkowanie z uwzględnieniem ograniczeń wynikają¬ 
cych z zachowania czteropędu w wierzchołkach. Ograniczenia te 
umożliwiają w grafach a) i b) wykonanie całek po wszystkich 
czteropędach k , /, m, n, zaś w grafach c), d) i e) pozostaje jedna 
całka do wykonania, np. po czteropędzie / (bez żadnych ograni¬ 
czeń na wartości /). Całki te są rozbieżne. W diagramie e) wy¬ 
stępuje również wewnętrzna linia pozytonowa —jest to linia, na 
której strzałka ma przeciwny kierunek niż kierunek biegu czasu 


nieskończoności wydobyć w sposób jednoznaczny 
wartości skończone, nazywa się renormalizacją. 

Renormalizację przeprowadza się poczynając od 
modyfikacji rozbieżnych całek przez wprowadzenie 
odpowiednich parametrów, tak aby całki te były zbież¬ 
ne, a rozbieżności można było otrzymać przez odpo¬ 
wiednie przejście graniczne z wprowadzonymi para¬ 
metrami—jest to tzw. regularyzacja. Ostatnio naj¬ 
częściej używa się regularyzacji wymiarowej, która 
polega na potraktowaniu czteropędu, po którym wy¬ 
stępuje całkowanie w rozbieżnej całce, jako wektora n- 
wymiarowego, n > 4 (dla n = 4 otrzymuje się roz¬ 
bieżność). Ze zregularyzowanej całki staramy się wy¬ 
dobyć część, która w granicy, gdy n -> 4, pozostaje 
skończona. W elektrodynamice w jednoznacznym 
wydobyciu tej części pomaga żądanie, aby teoria była 
niezmiennicza ze względu na transformacje cechowa¬ 
nia pól. Aby usunąć część osobliwą przy przejściu 
n -> 4 dodajemy do wyjściowej gęstości lagrangianu 
odpowiedni wyraz £ c > zw. kontrezłonem, tak aby ge¬ 
nerował on diagram, którego osobliwa część znosiłaby 
się z osobliwą częścią diagramu znormalizowanego. 
Procedurę tę można przeprowadzić przy dowolnej 
gęstości £i. W celu usuwania coraz to nowych osobli¬ 
wości pojawiających się w wyższych rzędach rachunku 
zaburzeń trzeba w ogólności wprowadzać nieskończe¬ 
nie wiele kontrezłonów. Wprowadzenie każdego kontr- 
członu prowadzi do pojawienia się w teorii stałej do¬ 
wolnej. Jeśli wystarczy wprowadzić skończoną liczbę 
typów kontrezłonów, teorię nazywamy renormalizo- 
walną. 

W elektrodynamice wyrażenia operatorowe w 
kontrczłonach są tego samego typu, co w wyjściowej 
gęstości lagrangianu jG 0 +ii/* W rezultacie dotknie 
kontrezłonów zmienia parametry stojące w wyjścio¬ 
wej teorii przy wyrażeniach operatorowych, np. za¬ 
miast masy m stojącej w elektrodynamice przy wiel¬ 
kości we wzorze (12) pojawi się m = m — J£<Si(#w). 
Stałe <5i(m) > 0 dążą do nieskończoności, gdy n -> 4. 
Widzimy, że wyjściowy parametr m zw. gołą masą 
musi być nieskończony, aby m' zw. masą zrenorma- 
lizowaną mógł być skończony. Ponieważ masę elek¬ 
tronu znamy z doświadczenia, przyjmujemy, że m' 
to ta dobrze znana masa. Podobnie dzieje się z ładun¬ 
kiem. Teorię renormalizowalną można tak wprowa¬ 
dzić, aby renormalizacja sprowadzała się tylko do 
zmiany mas i stałych sprzężenia. Warunek renormali- 
zowalności narzucony na kwantową teorię pola jest 
bardzo ograniczający. Wyróżnia on kilka typów te¬ 
orii wśród nieskończonej liczby teorii pola, jakie by 
można sformułować. Nieprzypadkowo okazuje się, że 
teorie renormalizowalne odgrywają dużą rolę w fizyce. 

Nie będziemy omawiać sukcesów elektrodynamiki 
kwantowej, gdyż są one omówione w innych artyku¬ 
łach. Przejdziemy teraz do porównania otrzymanego 
formalizmu obliczania amplitud A/i z obrazem fizycz¬ 
nym oddziaływania elektronów z fotonami. 

W klasycznym polowym obrazie oddziaływania 
elektronów oddziałują one za pośrednictwem pola, 
tak więc nie widać powodów, dla których całkowita 
energia elektronów miałaby być zachowana. Podsta¬ 
wowym procesem jest proces, w którym energia ta 
maleje, ponieważ w wyniku oddziaływania jest ona 
przekazywana polu, inaczej mówiąc — wypromicnio- 
wana. To właśnie jest przyczyną, że klasyczny atom 
wodoru nie może być trwały. Z drugiej strony wiemy, 
że obserwuje się elastyczne rozpraszanie elektronów 
i innych ładunków. Elastyczne rozpraszanie elektro¬ 
nów jest możliwe wtedy i tylko wtedy, gdy całkowita 
energia i pęd przekazane polu przez jeden elektron 
są pobrane z pola przez drugi elektron. Wiedząc już, 
że przekazy energii i pędu są skwantowane, można 
powiedzieć, że elektron zmienia pęd i energię emitu¬ 
jąc odpowiedni kwant pola, czyli foton, który zostaje 
pochłonięty przez drugi elektron. Foton ten jest prze¬ 
ważnie fotonem wirtualnym, tzn. jego czteropęd k» nie 
spełnia warunku kjc* = 0, który to warunek określa 
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fotony swobodnej fali elektromagnetycznej. W istocie 
k* — {PfY—{piY> gdzie (piY i (PfY określają począt¬ 
kowy i końcowy czteropęd elektronu, czyli 

k»k* = (pi\( P iY +(pfMpfY-(2pi) u (p f Y 

i zwykle kjd 1 ^ 0. Tak więc widzimy, że podstawo¬ 
wymi aktami oddziaływania są emisje i absorpcje 
fotonów. Elektron może również absorbować fotony, 
które wcześniej sam wyemitował. Elastyczne rozpra¬ 
szanie elektronów: Pi+p z P 3 +P 4 , może wystąpić 
w wyniku wielu z tych procesów. Każdemu z nich 
przyporządkowana jest amplituda prawdopodobień¬ 
stwa. Jeśli dany stan końcowy f może być osiągnięty 
ze stanu początkowego i w wyniku różnych, nieroz- 
różnialnych w eksperymencie procesów fizycznych, 
to amplitudę prawdopodobieństwa A/i należy przed¬ 
stawić jako sumę amplitud (21) odpowiadających 
każdemu z tych procesów. Widzimy, że otrzymana 
w elektrodynamice kwantowej amplituda reakcji 
w postaci sumy ma żądaną strukturę. Diagramy odpo¬ 
wiadające wyrazom sumy umożliwiają stworzenie 
prostego obrazu fizycznego, który nazwiemy procesem 
wirtualnym. Musimy tu podkreślić z całą mocą, że 
proces wirtualny nie daje żadnej informacji dlaczego 
i w jaki sposób należy obliczać odpowiadającą mu 
amplitudę. Informacja ta zawarta jest tylko w forma¬ 
lizmie matematycznym. Proces wirtualny nie jest 
realnym procesem, gdyż przy założeniu, że każdy 
obserwowany przypadek jest konkretną realizacją 
jednego z tych procesów, całkowite prawdopodobień¬ 
stwo reakcji powinno być sumą prawdopodobieństw, 
z których każde byłoby prawdopodobieństwem otrzy¬ 
mania stanu końcowego w wyniku odpowiedniego 
procesu wirtualnego. Dodawanie prawdopodobieństw 
prowadzi często do innych wyników niż dodawanie 
amplitud prawdopodobieństwa. Tak więc zwrotu: 
elektrony oddziałują ze sobą wymieniając fotony — 
nie należy rozumieć dosłownie. 

Obraz fizyczny okazuje się jednak pomocny nie 
tylko wówczas, gdy mówimy o zjawiskach fizycznych, 
lecz również przy formułowaniu nowych ściślejszych 
modeli. Po tym, jak stwierdzono istnienie krótkoza- 
sjęgowego (rzędu 10“ 13 cm) oddziaływania wiążącego 
silnie protony i neutrony w jądrze atomowym, 
H. Yukawa zaproponował opisywanie tego oddziały¬ 
wania przez wymianę hipotetycznych kwantów pola, 
które nazwano mezonami. 

oszacowanie Proste rozumowanie, prowadzące do oszacowania 
masy mezonu masy mezonu, jest na tyle ciekawe, że warto je tu 
przytoczyć. Wyobraźmy sobie spoczywające dwa nu¬ 
kleony w odległości od siebie R rzędu 10“ 12 cm (z do- 
brym przybliżeniem nukleony w jądrze spoczywają). 
Jeśli ich oddziaływanie polega na wymianie mezonu, 
to w stanie pośrednim powinny istnieć dwa nukleony 
i dodatkowo jeszcze mezon. Proces tworzenia tego 
stanu nie jest możliwy w fizyce klasycznej, naruszone 
byłoby bowiem prawo zachowania energii. Energia 
musi się zmienić o wielkość AE, która co najmniej jest 
równa energii spoczynkowej mezonu rnć 2 (AE ^ mc 2 ). 
Natomiast w mechanice kwantowej udowadnia się, że 
dokładność określenia energii AE w czasie At jest 
ograniczona od dołu AE ^ k/At. Ponieważ prędkość 
wirtualnego mezonu jest rzędu prędkości światła c, to 
At X R/c. Stąd mc 2 x co daje masę m równą 
ok. 250 masom elektronu. Ponieważ możliwe są pro¬ 
cesy p+n —► n+p, n+p p-\-n i pĄ-p -> p-\-p, me¬ 
zony muszą być trzech rodzajów i nieść ładunek 0, 
+e i —e. Dopiero w 12 lat po tym, jak Yukawa wy¬ 
sunął swoją hipotezę, odkryto cząstki o zbliżonych 
własnościach — mezony n; masa ich wynosi 273 masy 
elektronu. 

Ścisły opis połowy oddziaływań silnych napotkał 
poważne trudności. Oddziaływania te są na tyle silne, 
że zrenormalizowana stała sprzężenia występująca 
w gęstości lagrangianu oddziaływaria Yukawy £ r 
kłopoty wynosi ok. 10, czyli nie jest mała. Stosowanie rachunku 
modelem zaburzeń wydaje się kompletnie nieuzasadnione, a w 
Yukawy dodatku praktycznie nieprzydatne. Poza tym liczba 
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zaobserwowanych cząstek elementarnych, a szczegól¬ 
nie hadronów jest tak wielka, że opis, w którym 
każdej z tych cząstek odpowiadałoby swoiste pole 
kwantowe, a w £1 występowałyby wszystkie możliwe 
sprzężenia typu Yukawy tych pól, wydaje się nie¬ 
właściwy. Nie wiadomo też, co zrobić z bardzo dużą 
liczbą cząstek zw. rezonansami. Te trudności spowo¬ 
dowały sceptycyzm i odejście od metod teorii pola 
w teorii oddziaływań silnych w latach 50-ych i 60-ych 
(-> Oddziaływania silne). Mimo to obraz Yukawy, 
według którego nukleon otoczony jest chmurą wir¬ 
tualnych mezonów, został przyjęty przez ogół fizyków 
i do dziś większość danych na temat rozpraszania 
mezonów n na sobie otrzymuje się interpretując pewne 
oddziaływania mezonów n z nukleonami jako oddzia¬ 
ływania tych mezonów z mezonami chmury wir¬ 
tualnej. 

Bardzo płodną okazała się koncepcja M. Gell-Man- 
na, zgodnie z którą wszystkie cząstki elementarne od¬ 
działujące silnie są zbudowane z 3 podstawowych 
cząstek o ładunkach ułamkowych i spinach połówko¬ 
wych, zw. kwarkami. Obecnie najczęściej przyjmuje 
się, że obiektów tych jest 18 (-> Cząstki elementarne 
i ich oddziaływania). Kwarki różnią się kolorami (trzy 
kolory) i zapachami (których jest co najmniej cztery, 
a ostatnio są dane, aby sądzić, że jest ich sześć). 

Zadziwiające jest to, że w wielu procesach hadrony uwięzienie 
zachowują się tak, jakby były złożone ze swobodnych kwarków 
i lekkich kwarków, natomiast mimo usilnych poszuki¬ 
wań swobodnych kwarków, nie udało się ich odkryć. 

Zjawisko to nazywa się uwięzieniem kwarków. Istnieje 
prosty model klasyczny mezonu — punkty materialne 
połączone elastyczną struną o długości spoczynkowej 
/ 0 . Kiedy struna nie jest napięta, punkty zachowują się 
tak, jak swobodne. Przy próbie oddalenia punktów od 
siebie na odległość większą od /„ struna wytwarza siłę 
o potencjale wprost proporcjonalnym do kwadratu 
jej wydłużenia, a przy stałym napięciu — o potencjale 
wprost proporcjonalnym do jej wydłużenia. Jeśli za¬ 
łożymy, że odpowiednio napięta struna może pęknąć, 
przy tym na nowych końcach pojawią się natychmiast 
odpowiednie punkty materialne, to obraz ten będzie 
bliski „obrazowi polowemu” mezonu. W obrazie tym 
rolę punktów odgrywają kolorowe kwarki i anty- 
kwarki, a oddziaływanie typu struny jest generowane 
w niecałkiem jeszcze zrozumiany sposób przez wy¬ 
miany kolorowych bezmasowych wektorowych glu- 
onów, będących kwantami pól cechowania typu 
Yanga-Millsa, związanymi z grupą cechowania 
SU(3). Nie musimy już powtarzać, że poglądowe 
obrazy są dość złudne. Poza tym prawidłowość tego 
przedstawienia nie została wykazana za pomocą żad¬ 
nego ścisłego matematycznego modelu. Istnieje jednak 
nadzieja, że zjawisko uwięzienia kwarków będzie w 
ten sposób wyjaśnione. Nadzieja ta jest oparta na 
obserwacji, że efektywny parametr występujący w 
perturbacyjnym rozwinięciu zależy od energii. W re- 
normalizowalnych teoriach Yanga-Millsa parametr 
ten dąży do zera, jeśli energia dąży do nieskończo¬ 
ności, natomiast rośnie, gdy energia maleje. Procesy 
wysokoenergetyczne wydają się być związane z od¬ 
działywaniem na bardzo małych odległościach. Proce- niewola 
sy niskoenergetyczne zaś — z dużymi odległościami, podczerwona 
Obszar niskich energii nazywa się często obszarem 
podczerwonym (przez analogie z optyką i z uwagi na 
związek między energią i częstością E = hv). Wzrost 
parametru rozwinięcia interpretuje się jako wzrost siły 
oddziaływań, tak więc wydaje się, że efekt ten wiąże 
się z uwięzieniem kwarków i został nazwany przez 
fizyka amerykańskiego S. Glashowa niewolą pod¬ 
czerwoną (ang. infrared slavery). Droga od tych przy¬ 
puszczeń do ścisłego udowodnienia, że kwarki muszą 
być uwięzione na dużych, a swobodne — na małych 
odległościach, wydaje się jeszcze daleka. Pojawia się 
przy tym jeszcze jedna poważna trudność techniczna. 

Istnieją w teorii pola efektywne algorytmy obliczania problem 
amplitud rozpraszania procesów, w których zmienia ze stanami 
się liczba swobodnych kwantów pola, oraz oblicza- związanymi 
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nia czasów życia cząstek nietrwałych. Nie ma nato¬ 
miast, jak dotąd, algorytmów obliczeń dotyczących 
procesów rozpraszania stanów związanych, a w mo¬ 
delu kwarkowym wszystkie hadrony są uważane za 
takie stany. 

Nowy zwrot w kierunku metod polowych w teorii 
oddziaływań silnych jest wynikiem znalezienia renor- 
malizowalnej teorii oddziaływań słabych. Teoria ta 
omawiana jest w artykule „Oddziaływania słabe”, tu 
podkreślimy kilka jej aspektów. Jak już wspominaliś¬ 
my, pole elektromagnetyczne ma interpretację pola 
cechowania stowarzyszonego z grupą cechowania 
Niezmienniczość ze względu na tę grupę jest cechą 
bardzo istótńą w przeprowadzaniu renormalizacji. 
Poszukując renormalizowalnej teorii oddziaływań 
słabych natrafiono na renormalizowalną teorię pól 
cechowania Yanga-Millsa, opartą na grupie cecho¬ 
wania SU( 2). Występują w niej trzy bezmasowe wek¬ 
torowe pola cechowania (dwa naładowane, jedno 
neutralne). Można sobie łatwo wyobrazić, że oddzia¬ 
ływania słabe polegają na wymianie cząstek wektoro¬ 
wych naładowanych. Okazuje się jednak, że odpowied¬ 
nie cząstki powinny mieć masę i to masę większą od 
masy protonu ok. 30 razy. Wprowadzenie członu ma¬ 
sowego do teorii Yanga-Millsa łamie symetrię ce¬ 
chowania i psuje renormalizowalność teorii. Po wielu 
trudach okazało się, że jeśli się wprowadzi do teorii 
dodatkowe pole skalarne (pole Higgsa) i założy, że 
stan próżni nie jest niezmienniczy ze względu na grupę 
cechowania, to pola cechowania mogą zyskać masę 
i teoria pozostanie renormalizowalna. Mechanizm 
wprowadzania w ten sposób masy nazywa się mecha¬ 
nizmem Higgsa. 

Wyniki te leżą u podstaw teorii Weinberga-Salama, 
w której zakłada się istnienie trzech nowych wektoro¬ 
wych cząstek: W+ i W~ o masach większych od 39,8 
mas protonu oraz Z° o masie większej od 79,6 mas 
protonu. Wprowadzenie cząstki Z° implikuje istnienie 
nowych reakcji, np. rozpraszania elektronów przez 
neutrina mionowe. Reakcje te zostały zaobserwowane, 
co było pierwszym wielkim sukcesem modelu. Pełnym 
sukcesem teorii byłoby odkrycie cząstek W ± i Z°. Na 
rys. 10 przedstawione są diagramy Feynmana, dające 
po renormalizacji wkład najniższego rzędu do pro¬ 
cesu n+v e -> n-j-v e w teorii Weinberga-Salama. Po¬ 
zwala to zorientować się, o ile teoria ta jest bardziej 
złożona od elektrodynamiki kwantowej. 



Rys. 10. Diagramy, które muszą być uwzględnione, aby po re¬ 
normalizacji otrzymać skończony wkład najniższego rzędu do 
amplitudy rozpraszania elastycznego neutrina elektronowego na 
neutronie. W odróżnieniu od rys. 8 i 9 zaznaczony jest tylko rodzaj 
wymienianych cząstek 


Łamanie symetrii cechowania przez stan próżni 
(zw. spontanicznym łamaniem symetrii) wskazuje na' 
to, że próżnia — stan pola o najniższej energii — ma 
ciekawe własności fizyczne. Nie powinien nas wpro¬ 


wadzać w błąd fakt, że energia i pęd tego stanu wy¬ 
noszą 0. Po prostu wprowadzając w definicji opera¬ 
torów energii i pędu uporządkowanie normalne 
przyjęliśmy energię próżni za punkt zerowy na skali 
wartości energii. 

Możliwość zmiany masy cząstki dzięki wprowadze¬ 
niu odpowiednich własności próżni skłania do przy¬ 
jęcia obrazu próżni jako pewnego skomplikowanego 
ośrodka. Wiadomo, że pole elektromagnetyczne może 
wnikać do nadprzewodnika tylko bardzo płytko. In¬ 
terpretuje się to często jako zjawisko zyskiwania 
masy przez fotony w ośrodku nadprzewodzącym, 
a stąd już krok do analogii z mechanizmem Higgsa. 
Z kolei to, że wirtualny foton emitowany przez ładu¬ 
nek może wytworzyć wirtualną parę elektron-pozyton 
(co efektywnie prowadzi do renormalizacji wyjścio¬ 
wego ładunku), przypomina zjawisko polaryzacji di¬ 
elektryka; nazywa się je dlatego polaryzacją próżni. 
Tak więc stan próżni jest skomplikowanym stanem 
pola, którego zrozumienie jest pomocne przy formu¬ 
łowaniu nowych ścisłych modeli. 


O optymizmie, wątpliwościach 
i głównych kierunkach badań 


Optymiści sądzą, że kwantowa teoria pola łącznie 
z procedurą renormalizacji jest tym ogólnym schema¬ 
tem, w ramach którego zostanie znaleziony jednolity 
opis zjawisk we Wszechświecie. 

Tak więc cele, które sobie stawiają, to: znalezienie 
podstawowych pól i odpowiadających im gęstości 
lagrangianu, rozwiązanie problemu stanów związa¬ 
nych i uwięzienia kwarków oraz stworzenie efektyw¬ 
nych algorytmów obliczania wszystkich fizycznie inte¬ 
resujących wielkości. Niektórzy natomiast sądzą, że 
podstawowym pojęciem przyszłej teorii będą pola ce¬ 
chowania Yanga-Millsa. Teoria tych pól jest skom¬ 
plikowana, dlatego bada się często modelowe teorie 
pól w czasoprzestrzeni o zmniejszonej liczbie wymia¬ 
rów lub na nieskończonych dyskretnych sieciach 
czasoprzestrzennych. Badania te stanowią obecnie 
główny nurt w teorii pola. Wynika z nich m.in. ko¬ 
nieczność modyfikacji ogólnej teorii względności dla 
małych odległości, ponieważ obecna teoria pola gra¬ 
witacyjnego po skwantowaniu daje teorię nierenor- 
malizowalną. 

Drugą grupę badań, którą charakteryzuje wysoka 
ścisłość i zaawansowanie metod matematycznych, sta¬ 
nowią prace nad aksjomatyczną teorią pola. Celem 
ich jest takie sformułowanie elektrodynamiki i in¬ 
nych znanych teorii pola, aby od początku nie wystę¬ 
powały w nich żadne rozbieżności. Poszukuje się wy¬ 
ników, które można uzyskać w sposób ścisły, a w wy¬ 
padku stosowania rachunku zaburzeń bada się zbież¬ 
ność szeregu perturbacyjnego. Ten kierunek badań 
rozwinął się w wyniku niezadowolenia ze zwykłej pro¬ 
cedury renormalizacji, która bardziej przypomina 
przepis rachunkowy niż element podstawowej teorii 
(podkreślał to wielokrotnie P.A.M. Dirac, jeden 
z twórców kwantowej teorii pola). Można zaliczyć 
do tej grupy pojawiające się ostatnio prace poświęco¬ 
ne kwantowej teorii solitonów. Ponieważ solitony cie¬ 
szą się dużym zainteresowaniem, zamieścimy o nich 
krótką dygresję. 

Zacznijmy od historii. Pierwszy soli ton został 
zaobserwowany w 1834 r. przez J. Russela. Przejeż¬ 
dżając konno wzdłuż wąskiego kanału zauważył on, 
że gwałtowne zatrzymanie się barki spowodowało 
powstanie fali o wysokości ok. 30 cm i długości ok. 
9 m, która bez zmiany kształtu przesuwała się z jed¬ 
nakową prędkością kilkunastu kilometrów na godzinę 
wzdłuż kanału. Russel towarzyszył tej fali na koniu 
na odcinku ok. 2 km. Liczne doświadczenia potwier¬ 
dziły tę obserwację. Stwierdzono, że im wyższa fala, 
tym szybciej się porusza. Zjawisko to, zw. falą samot- 
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Rys. 11. Zderzenie 
akustycznych soli- 
tonów w plazmie. 
Przemieszczanie się 
zagęszczeń jonów w 
plazmie opisuje 
równanie K-dV. Ry¬ 
sunek przedstawia 
ewolucję w czasie 
rozwiązania dwuso- 
litonowego 


ną, zostało analitycznie wyjaśnione przez otrzymanie 
w 1895 r. rozwiązania (o żądanych własnościach) 
nieliniowego równania różniczkowego cząstkowego: 

du(x 9 t) S 3 u(x,t) 

di dx* ~~ ’ 

które nazwano od nazwisk twórców równaniem Korte- 
wega-de Vriesa (K-dV). W roku 1965 M. Kruskal i N. 
Zabusky wykazali, że dwa rozwiązania równania 
K-dV odpowiadające dwóm samotnym falom skiero¬ 
wanym ku sobie, przechodzą przez siebie bez defor¬ 
macji, zachowując stabilność (rys. 11). Fale samotne 
o tej właściwości nazwano solitonami, a rozwiąza¬ 
nie równania nieliniowego, rozpadające się dla t -* 

—oo i t 4-oo na N rozwiązań solitonowych — roz¬ 
wiązaniem A-solitonowym. Znaleziono również inne 
równania dopuszczające rozwiązania solitonowe. 
Bardzo ważne z nich jest skalarne równanie falowe 
w czasoprzestrzeni (1+1)-wymiarowej (1 zmienna 
przestrzenna i czas) z członem nieliniowym sin <P 
zw. równaniem sG (sinusowym Gordona). Równanie 
to opisuje ruch defektów w ośrodkach uporządkowa¬ 
nych, takich jak np. ruch zlokalizowanych dyslokacji 
w kryształach. Równanie K-dV spotyka się np. przy 
opisie płytkich fal wodnych, jonowych fal akustycz¬ 
nych, fal Alfvćna w zimnej plazmie itp. Równanie sG 
można traktować jako nieliniowe równanie pola 
w 1 + 1 wymiarach, podejmuje się więc próby kwan¬ 
towania tego pola. Odkrycie i badanie solitonów to 
postęp w teorii nieliniowych równań cząstkowych 
oraz postęp w rozumieniu różnych nieliniowych zja¬ 
wisk fizycznych. Soliton w 1 +1 wymiarach jest pod 
wieloma względami podobny do cząstki elementar¬ 
nej: gęstość jego energii jest zlokalizowana, całkowita 
energia jest skończona, zderza się zachowując swą 
tożsamość, istnieją rozwiązania równania sG odpo¬ 
wiadające stanom związanym soliton-antysoliton 
(ang. breather 'dychacz’) itp. Niektórzy chcieliby tę 
analogię rozwinąć i wierzą, że w 3 + 1 wymiarach 
zaobserwuje się w pewnej klasie równań produkcję 
solitonów przy zderzeniach lub ich rozpraszanie, co 
uwożliwi stworzenie obrazu cząstki elementarnej jako 
solitonu. Program ten napotyka na razie trudności 
zarówno natury matematycznej, jak i fizycznej. 

Trzecia grupa badań to próby wyjścia poza lokalną 
teorię pola. Motywacja tych badań może być różno¬ 
rodna. Już na gruncie klasycznym widzieliśmy, że 
pomiar pola w punkcie jest idealizacją (zbiory obser¬ 
wowanych zdarzeń są zawsze dyskretne, a odrzucenie 
założenia ciągłości czasoprzestrzeni i konstrukcja 
czasoprzestrzeni dyskretnych nie daje, jak dotychczas, 
zadowalających wyników). Idealizacją jest również 
wprowadzenie punktowych ładunków. Pole punkto¬ 
wego ładunku jest osobliwe w punkcie, w którym 
ładunek ten się znajduje: klasyczna energia samood- 
działywania jest nieskończona. Osobliwość ta znaj¬ 
duje odbicie w nieskończonościach pojawiających się 
w kwantowej teorii pola. Wydaje się, że najprostszym 
sposobem zniknięcia tych nieskończoności byłaby 
odpowiednia modyfikacja teorii klasycznej na małych 
odległościach, a następnie skwantowanie zmodyfiko¬ 
wanej teorii. Elegancką i niesprzeczną modyfikacją 
elektrodynamiki klasycznej jest nieliniowa teoria 
Borna-Infelda, jednak trudności pojawiają się przy 
jej kwantowaniu, podobnie jak przy kwantowaniu 
każdej teorii, w której nieliniowość odgrywa istotną 
rolę. Wraz z rezygnacją z punktowości pojawia się 
możliwość wystąpienia tzw. oddziaływań nielokal¬ 
nych. .Wiąże się to z możliwością równoczesnego od¬ 
działywania z różnymi punktami obiektu rozciągłego. 
Istnieją metody kwantowania nielokalnych teorii pola 
i próbowano już nawet zastosować takie teorie do 
opisu hadronów. 

Założenie punktowości elektronów w elektrody¬ 
namice, stosowanej do opisu procesów atomowych 
przy odległościach między ładunkami rzędu 10” 8 cm. 


wydaje się przybliżeniem rozsądnym. Natomiast bo¬ 
gata struktura hadronów i bardzo krótki, ale dobrze 
określony zasięg oddziaływań silnych rzędu 10“ 13 cm 
uniemożliwiają założenie punktowości hadronów. 
Dlatego podejmuje się próby kwantowania rozciąg¬ 
łych klasycznych układów, takich jak struny, membra¬ 
ny i worki. Przy próbach porównania otrzymanych 
modeli z doświadczeniem pojawia się konieczność 
wprowadzenia dodatkowych upraszczających zało¬ 
żeń, co stawia pod znakiem zapytania większość 
otrzymywanych tym sposobem wyników. 

Zwolennicy lokalnej teorii pola utrzymują, że obraz 
punktowej cząstki otoczonej „chmurą” wirtualnych 
punktowych kwantów oraz obraz stanu związanego 
punktowych kwarków, jakie ta teoria daje, dobrze 
uwzględnia strukturę cząstek. 

Można sobie wyobrazić bardziej drastyczne odejście 
od założenia punktowości hadronów przy odległoś¬ 
ciach 10” 13 cm niż to ma miejsce w teoriach nielokal¬ 
nych czy też w obrazie chmury wirtualnych kwantów. 
Klasycznym przykładem drastycznego załamania za¬ 
łożenia punktowości jest przejście od opisu ruchu me¬ 
teorytu (z dobrym przybliżeniem punktowego) do 
opisu jego zderzenia z powierzchnią Ziemi. Do opisu 
procesu tworzenia się potężnego leja (np. słynny krater 
w Arizonie) trzeba używać metod zupełnie różnych 
matematycznie i fizycznie od równań Newtona dla 
punktów materialnych. W przykładzie tym charakte¬ 
rystyczny jest brak ciągłego przejścia pomiędzy tymi 
dwoma opisami fizycznymi. Wątpliwość co do stoso¬ 
walności teorii kwantowej do opisu zjawisk fizycz¬ 
nych na odległościach 10” 13 cm wysunął pierwszy 
W.C. Heisenberg już w latach 30-ych. Zaproponował 
on wprowadzenie nowej uniwersalnej stałej fizycznej 
(o wymiarze długości) — tzw. długości elementarnej — 
takiej, że przy odległościach mniejszych od tej stałej 
powinna nastąpić zmiana sposobu opisu zjawisk. 
Wobec wspomnianych wątpliwości i trudności doty¬ 
czących polowego opisu oddziaływań silnych zaczęto 
konstruować modele innego rodzaju (jak np. różne 
modele statystyczne i hydrodynamiczne stosowane 
z dużym niekiedy powodzeniem do opisu produkcji 
wielorodnej przy wysokoenergetycznych zderzeniach 
hadronów). 

Tak więc pesymiści nie wierzący w ostateczny suk¬ 
ces badań nurtu głównego mogą konstruować modele 
niezależne i porównywać je z doświadczeniem, mogą 
też sprawdzać prawdziwość najbardziej ogólnych 
twierdzeń dowodzonych na gruncie standardowego 
podejścia do lokalnej kwantowej teorii pola oraz po¬ 
szukiwać nowych subtelnych efektów doświadczal¬ 
nych, wynikających z obrazu inspirowanego istnie¬ 
niem długości elementarnej. Badania te wiążą się 
w pewien sposób ze współczesnymi badaniami pod¬ 
staw mechaniki kwantowej w duchu wątpliwości 
Einsteina, Schrodingera, de Broglie’a i Bohma, 
którzy kwestionowali traktowanie mechaniki kwan¬ 
towej jako najbardziej kompletnej teorii pojedyn¬ 
czych mikroukładów fizycznych (-*-0 niektórych 
podstawowych pojęciach fizycznych). 

Cały program tych pesymistycznych badań nie cie¬ 
szy się wielkim uznaniem i sympatią optymistów, choć 
na tej drodze mogą być znalezione dodatkowe argu¬ 
menty zarówńo teoretyczne jak i doświadczalne prze¬ 
mawiające za słusznością czy też koniecznością opisu 
wszystkich zjawisk w obrębie konwencjonalnie rozu¬ 
mianej teorii kwantowej. 

I. Bialynicki-Birula Wstęp do teorii pól kwantowych, War¬ 
szawa 1971; I. Białynicki-Birula, Z. Bialynicka-Birula Elek¬ 
trodynamika kwantowa, Warszawa 1974; W.B. Bierestecki i in. 
Relatywistyczna teoria kwantów cż. 1 Warszawa, 1972; L.N. 
Cooper Istota i struktura fizyki, Warszaw-a 1975; R.P. Feynman 
i in. Feynmana wykłady z fizyki, t. 3 Warszawa 1974; M. Kup- 
czyński Odkrycie powabu. Post. Fiz. 28, 275 (1977); E.M. Lifszyc 
i L.P. Pitajewski Relatywistyczna teoria kwantów cz. 2, Warsza¬ 
wa 1973; L.I. Schiff Mechanika kwantowa, Warszawa 1977; A. 
Szymacha Zunifikowane teorie oddziaływań słabych i elektroma¬ 
gnetycznych Post. Fiz. 27, 117 (1976); E.H. Wichmann Fizyka 
kwantowa Warszawa 1975. 
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Cząstki elementarne i ich oddziaływania 

Grzegorz Białkowski 


pojęcie Cząstki elementarne są to obiekty fizyczne, z któ- 
cząstki rych, według obecnego stanu wiedzy, składają się 
elementarne] wszystkie ciała materialne oraz rozmaite rodzaje pro¬ 
mieniowania. Ujmując rzecz historycznie, za jedną 
z podstawowych cech cząstek elementarnych uważano 
ich niepodzielność, co jest wyrażone w greckim termi¬ 
nie atom — atomos — niepodzielny. Niepodzielność 
cząstki elementarnej można rozumieć dwojako: albo 
jako nierozbijalność (a więc trwałość), albo też jako 
brak struktury wewnętrznej (a więc niezłożoność). 
Oba możliwe kryteria elementamości cząstek, oparte 
na tych dwu cechach, są jednak zawodne. Wiadomo 
dziś, że obiekty uważane za cząstki elementarne mają 
strukturę wewnętrzną, są więc tworami złożonymi. 
Poza tym, w przyrodzie istnieje tylko bardzo nie¬ 
liczna grupa cząstek trwałych (lub też mających tak 
długie czasy życia, że obecnie uważa się je za trwałe). 

Trwałymi cząstkami elementarnymi są: proton, ele¬ 
ktron, foton oraz neutrina elektronowe i mionowe. 

Trwałości cząstki nie można uważać za kryterium 
elementamości z następujących powodów. Po pierw¬ 
sze, liczne obiekty, których nieelementarność jest 
pewna (np. jądra atomowe lub atomy w stanie pod¬ 
stawowym), są trwałe. Po drugie, trwałe cząstki ele¬ 
mentarne mają zwykle „kuzynów” nietrwałych; po¬ 
krewieństwo cząstek trwałych i nietrwałych jest tak 
wyraźne, że logicznie jest jedne i drugie uznać za ele¬ 
mentarne. Na przykład proton i neutron tworzą parę 
cząstek elementarnych, mimo iż proton jest trwały, 
a neutron — nie. Po trzecie wreszcie, zdarza się często, 
iż w wyniku niektórych oddziaływań cząstki elemen¬ 
tarne trwałe przemieniają się w inne cząstki, nietrwałe. 
W takich wypadkach trudno jest uznać, że cząstki 
trwałe stają się składnikami obiektów nietrwałych. 
Przykładem takiego procesu może być np. anihilacja 
pary proton-antyproton v kilka mezonów n , czyli 
w cząstki nietrwałe. 

W tej sytuacji nie jest łatwo podać proste kryterium 
elementamości cząstki, odwołujące się wprost do 
faktów eksperymentalnych. Nasuwa się więc myśl, 
aby za elementarne uznać te i tylko te cząstki, których 
istnienie jest z punktu widzenia teorii warunkiem ko¬ 
niecznym występowania wszystkich innych obiektów 
fizycznych. Praktyczne stosowanie tego kryterium 
byłoby jednak możliwe tylko wtedy, gdyby istniała 
pełna, sprawna rachunkowo i przynosząca jedno¬ 
znaczne odpowiedzi teoria cząstek. Mimo, że opraco¬ 
waniem takiej teorii zajmuje się wielu najwybitniej¬ 
szych fizyków doby dzisiejszej, teoria ta jeszcze nie 
została sformułowana. W najlepszym razie można 
uznać, że stworzono pewne teorie cząstkowe, które 


zapewne wejdą w skład teorii kompletnej. Ostatecznie 
istnieje możliwość zdefiniowania cząstek elementar¬ 
nych przez ich wyliczenie. Najlepiej zbadane cząstki 
są wymienione w załączonej tabeli. 

Już pierwszy rzut oka na tę tabelę pozwala stwier¬ 
dzić, że sytuacja nie jest najlepsza, gdyż obiektów 
elementarnych jest bardzo dużo, a liczba ich przy tym 
wzrasta z roku na rok. Ponieważ zaś, jak stwierdzi¬ 
liśmy poprzednio, żadna ze znanych cząstek nie wy¬ 
daje się być bardziej elementarna od innych, pozostają 
jeszcze dwie inne możliwości poradzenia sobie z tym 
chaosem. Po pierwsze, można przyjąć, że rzeczywiście 
wszystkie obiekty uznawane obecnie za cząstki ele¬ 
mentarne są naprawdę równie elementarne w tym 
sensie, że każda z nich wymaga do swojego istnienia 
wszystkich innych cząstek, z których jest w jakiś spo¬ 
sób zbudowana. Ta hipoteza zwana hipotezą demo¬ 
kracji cząstek nie zyskała sobie powszechnego uzna¬ 
nia, m.in. w związku z trudnościami rachunkowymi 
występującymi przy próbach jej sprawdzenia. Po 
drugie, nasuwa się myśl, że może żadna z cząstek zna¬ 
nych teraz jako elementarne, naprawdę elementarna 
nie jest, i że taką prawdziwie elementarną cząstkę czy 
cząstki należy dopiero wykryć. Za „kandydatów” 
na takie cząstki prawdziwie elementarne uważa się 
m.in. kwarki. 

Hipoteza kwarków jest obecnie niemal powszech¬ 
nie uważana za słuszną. Powstaje więc pytanie, czy 
same kwarki są obiektami elementarnymi, i czy 
dalsze badania nie doprowadzą do wniosku, że należy 
szukać cząstek jeszcze bardziej elementarnych. W tym 
wypadku to, co uważamy za elementarne byłoby 
funkcją niewiedzy; elementarne jest to, o czym jeszcze 
nie wiemy, że naprawdę elementarne nie jest. Do¬ 
świadczenie skłania jednak do przypuszczenia, że po¬ 
gląd ten może nie jest słuszny. Okazuje się mianowicie, 
że kwarki dotychczas nie zostały wykryte jako cząstki 
swobodne i znane są jedynie jako składniki hadro¬ 
nów. Być może kwarki swobodne zostaną w przyszłości 
wykryte, ale wielu fizyków sądzi, że nie nastąpi to 
nigdy, gdyż kwarki — według nich — mogą istnieć 
jedynie wewnątrz hadronu, a więc jako cząstki zwią¬ 
zane. Ta hipoteza kwarków uwięzionych rozstrzyga¬ 
łaby więc problem elementamości w sposób nieocze¬ 
kiwany: cząstki elementarne byłyby wprawdzie złożo¬ 
ne, ale nie mogłyby być nigdy rozbite na swoje skład¬ 
niki. Poznawanie coraz głębszych poziomów struktury 
materii zostałoby wtedy w zasadniczy sposób zmodyfi¬ 
kowane. Można by nadal poszukiwać składników czą¬ 
stek takich jak kwarki, ale sens tego pojęcia w istotny 
sposób różniłby się od pojęcia składnika np. atomu. 


hipoteza 

demokracji 

cząstek 


kwarki 


hipoteza 

uwięzionych 

kwarków 
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Tabela cząstek efementaravcb 


Nazwa 

Symbol 

je 


Pc 

s,c 

Masa McV 

Czas życia, s 
lub JT, MeV 

Głównę ka- 
nały rozpadu 

Względne 

prawdopodo¬ 

bieństwo 

FOTON 

V 

t- 


-1 

0,0 

0 

<6-10- M 

trwały 

... 



LEPTONY 

Neutrino 

Vt 

1/2 




0 

trwałe 



elektronowe 






<6*10-* 

trwałe 



Neutrino 

y M 

1/2 




0 



mionowe 






<0,57 

trwałe 



Neutrino 

y c 

1/2 




<250 



taonowe 

Elektron 

e 

1/2 




0,511 

trwały 


100% 

Mion 

u 

1/2 




105,66 

2,197* 10-* 

ev u v t 

Taon 


1/2 




1784 

< 2,3-10- 1 * 



HADRONY 

MEZONY 









100% 

Pion 

*± 

o- 

1- 


0,0 

139,57 

2,603 *10"** 

PVjl 








evt 

1,27-10“* 



o- 

1- 

+ 1 

0,0 

134,96 

8,3*10- XT 

YY 

98,85% 

Kaon 

* 

0- 

1/2 


±1,0 

493,7 

1,24* 10-* 

SSf* 

63,5.% 

21,2% 









7l±7T~7t+- 

5,6% 









r°n° 

1,7% 









P ± 7i*v lt 

3,2% 










4,8% 



o- 

1/2 



497,7 

8,92* 10“ u 

7Z+7l~ 

68,67% 





71*71* 

31,4% 


Kl 

0- 

1/2 



497,7 

5,18* 10-* 

7r*7r®7r° 

21,5% 





n+Ttrrt* 

12,4% 










27,0% 










38,8% 









TC+7C- 

0,203% 









jt*n* 

0,094% 


tf 

0“ 

0+ 

+ 1 

0,0 

548,8 

0,85 keV 

YY 

38% 






3 n* 

29,9% 









7l+7t~7t* 

23,6% 









Tt+nry 

4,9% 









p+fi- 

2,2 10~* 


p 

I- 

1+ 

-1 

0,0 

776 

158 MeV 

7171 

-100% 







7Ty 

0,024% 









e+e- 

0,0043% 









M+jf- 

0,0067% 


0> 

1- 

0- 

-I 

0,0 

782,4 

10,1 MeV 

7t+7C~Jt* 

89,8% 





7t+7C~ 

1,4% 









n°y 

8,8% 









e+e~~ 

0,0076% 


rf 

0- 

0+ 

+ 1 

0,0 

957,6 

0,92 MeV 

7J7ZTC 

65,6% 






P°Y 

29,8% 






• 



(DY 

2,7% 









YY 

1,9% 


p 

1“ 

o- 

-1 

0,0 

1019,6 

4,1 MeV 

K+K- 

48,6% 






KlKs 

35,2% 









7C+7T-7t* 

14,7% 









ffY 

1,5% 









e+e~ 

0,032% 










0,025% 


A t 

1+ 

1- 

+ 1 

0,0 

-1100 

-300 MeV 

PTC 

interpretacja 









niepewna 


B 

1+ 

1+ 

-1 

0,0 

1231 

129 MeV 

om 

jedyny zaob¬ 
serwowany 


f 

2+ 

0+ 

+ 1 

0,0 

1273 

178 MeV 

mc 

83% 








2n+2*r 

2,9% 









KK~ 

2,8% 


A s 

2+ 

1- 

+ 1 

0,0 

1317 

102 MeV 

p7C 

70,0% 








1J1C 

14,6% 









CD7Z1Z 

10,6% 









KK~ 

4,8% 


r 

2+- 

0+ 

+ 1 

0,0 

1516 

67 MeV 

KK- 

główny kanał 


p r 

1- 

1+ 

-l 

0,0 

— 1600 

-300 MeV 

4 71 

główny kanał 


A t 

2“ 

1- 

+ 1 

0,0 

-1660 

-200 Me V 

fit 

interpretacja 

niepewna 


g 

3“ 

1+ 

-1 

0,0 

1690 

180 MeV 

27t 

24% 







An 

72,1% 


h 

4+ 

0+ 

+ 1 

0,0 

-2040 

- 150 MeV 

2tc , KK~ 

jedyne zaob¬ 
serwowane 


K* 

1- 

1/2 


±1,0 

891,8 

50,3 MeV 

Kit 

-100% 






K? 

0,15% 







«= 898,5 



49,1% 


K * 

2+ 

1/2 


±1,0 

1434 

100 MeV 

Ktc 







K*7l 

27,0% 









Kp 

6,6% 









Kco 

3,7% 


K* 

3“ 

1/2 

-1 

+ 1,0 

1785 

126 MeV 


7% 


Jlv 

1- 

o- 

0,0 

3097 

0,063 MeV 

e+e~, ft+pr 






hadrony 

86% 


yf 

1- 

0- 

-1 

0,0 

3685 

0,215 MeV 

e+e~, p+pr 

0,9% 







nadrony, np. : 

98,1% 









P7C+7T- 

33% 









¥71*71* 

17% 









¥*! 

4,2% 



1- 

? 

-1 

0,0 

4414 

43 MeV 

e+e~ 

0,0013% 








hadrony 

głównie 
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proces samo- 
oddziaływa¬ 
nia cząstek 


Na 2 wa 

Symbol 


7° 

Pc 

s,c 

\ 

Masa MeV 

Czas życia s 
lub r, MeV 

Główne ka¬ 
nały rozpadu 

Względne 

prawdopodo¬ 

bieństwo 

Ypsilon 

7* 

i- 

0- 

-1 

0,0 

9458 

0,060 

e + e-, p+pr 






hadrony 



T' 

i- 

o- 

-1 

0,0 

10016 

< 12 





o- 

1/2 


0,1 

1868,3±0,9 

2,5+J’jlO- 1 '* 

D+-* 

— ► K~n+n+ 

3,9% 










1,5% 


D * 

0- 

1/2 


0,1 

1863,1 ±0,9 

3,5^^- 10-^s 2>*-**“*+-* 

1,8% 

12% 









K-n+n+n~ 

3,5% 









(widziane) 



/>♦+ 

1- 

1/2 


0,1 

2008,6 

< 2 

D°n+ 

64% 







D+n° 

28% 


D*« 

1- 

1/2 


0,1 

2006,0 

< 5 

D°n° 

55% 





2,24+1^®-10- x *s 

D*y 

45% 


F+ 

0- 

0 

. .1 

-1,1 

2030±60 



BARIONY 

P 

1/2+ 

1/2 


0,0 

.938,28 

trwały 



Proton. 



(r>2 10** lat) 


100% 

Neutron 

n 

1/2+ 

1/2 


0,0 

939,57 

917 

pe~v 

A 

1/2+ 

0 


-1,0 

1115,6 

2,63* 10- 1 * 

pit¬ 

64,2% 






ni? 

35,8% 









pe~v 

8,07* 10- 4 









pprv 

1,5710- 4 









pit-y 

0,85*10-* 


z+ 

1/2+ 

1 


-1,0 

1189,4 

0,80-10-” 

pi? 

51,6% 




nit+ 

48,4% 









py 

1,24 10"* 









«?t+y 

0,93-10“* 









Ae+v 

2,02* 10-* 


z* 

1/2+ 

t 


1 -1,0 

1192,5 

0,58*10- łi 

Ay 

-100% 





Ae+e - 

5,45* 10-* 


z- 

1/2+ 

1 


-1,0 

1197,3 

1,48* 10“ x * 

mt~ 

~ 100% 







nc~v 

i,mo-» 









npry 

0,45-10-* 









Ae~v 

0,6*10-* 









nit~y 

4,6-lt)- 4 


3* 

1/2+ 

1/2 


-2,0 

1314,9 

2,90* 10~ x * 

Ai? 

100% 



1/2+ 

1/2 


-2,0 

1321,3 

1,64-10- 1 * 

An~ 

100% 





Ae~v 

2,8*10- 4 









Ap~y 

3,1*10- 4 


A 

3/2+ 

3/2 


0,0 

1232 

1,10 MeV 

Nit 

99,4% 







py 

0,6% 


Z{ 1385) 

3/2+ 

1 


-1,0 

+ :1383 

35,0 MeV\ 

42 MeV / 


88% 





— :1386 


12% 


5(1530) 

3/2+ 

1/2 


-2,0 

0:1532 

9,1 MeV 


100% 




— :1535 

10,1 MeV 




Q~ 

3/2+ 

0 


-3,0 

1672 

0,82-10“ 1# 

Sit-, S~j?, 

31,4% 







AK- 

68,6% 


N(1470) 

1/2+ 

1/2 


0,0 

pomiędzy 

120-350 MeV 

Nit 

-60% 




1390 a 1470 


Nn 

- 18% 









Nitit 

-25% 


AT(1520) 

3/2- 

1/2 


0,0 

pomiędzy 

110-150 McY 

Nit 

-55% 




1510 a 1530 


Nitit 

— 45% 


AT(I688) 

5/2+ 

1/2 


0,0 

pomiędzy 

120-145 MeV 

Nit 

60% 




1670 a 1690 


Nitit 

40% 


A (1950) 

■ 7/2+ 

3/2 


0,0 

pomiędzy 

200-240 McV 

Nit 

40% 



1910 a 1940 


Nitit 

ponad 25% 


/1(1405) 

> 1/2- 

0 


-1,0 

1405 

40 MeV 

Zn 

100% 


A{ 1520) 

- 3/1“ 

0 


-1,0 

1519 

15 MeV 

NK 

46% 






Zn 

42% 









Ann 

10% 


,4(1815) 

» 5/2+ 

0 


-1,0 

1820 

70-100 MeV 

NK 

60% 







Zn 

12% 









27(1385)« 

15-20% 


27(1670) 

* 3/2- 

1 1 


-1,0 

1670 

35-70 MeV 

NK 

10-25% 







Zn 

20-60% 


27(1915) 

> 5/2+ 

1 


-1,0 

od 1905 

70-140 MeV 

NK 

5-15% 





do 1930 


An 

20% 


Z (2030) 

7/2+ 

1 


-1,0 

od 2020 

120-200 MeV 

NK 

-20% 





do 2040 


An 

-20% 









Zn 

5-10% 


Ae 

1/2 

0 


o,+i 

2273 




Oddziaływania cząstek 
elementarnych 

Jedną z podstawowych cech cząstek elementarnych 
jest ich zdolność do oddziaływania wzajemnego, 
która umożliwia m.in. ich obserwację i badanie. Zdol¬ 
ność tę mają nie tylko te cząstki, które rzeczywiście 
w danym miejscu i w danej chwili oddziałują z innymi, 
ale i te, które znajdują się tak daleko od innych czą¬ 
stek, że możemy je uważać za swobodne. W tym 
drugim wypadku mamy do czynienia z tzw. samood- 
działywaniem. Polega ono na stałym emitowaniu i po¬ 
chłanianiu przez daną cząstkę innych cząstek, tych 
mianowicie, z którymi dana cząstka może oddziały¬ 


wać. W wyniku tych nieustannych aktów emisji 
i absorpcji rozważana cząstka otacza się jakby chmurą 
cząstek, które nazywa się „wirtualnymi”. Jeżeli bo¬ 
wiem rozważana cząstka jest trwała, to emitowane 
i pochłaniane przez nią cząstki nie mogą być praw¬ 
dziwymi cząstkami fizycznymi, które można by wprost 
zaobserwować doświadczalnie. Proces rzeczywistej 
emisji bądź też absorpcji jest wówczas wzbroniony 
przez prawo zachowania czteropędu. W polu własnym 
danej cząstki pojawiają się więc wyłącznie obiekty 
przypominające cząstki rzeczywiste wszystkimi swoimi 
własnościami, poza masą, której wartość nie jest rów¬ 
na masie cząstek fizycznych i może przybierać m.in. cząstki 
także wartości urojone. Są to tzw. cząstki wirtualne, wirtualne 
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Tak więc proces samooddziały wania cząstek elemen¬ 
tarnych nie jest dostępny bezpośredniej obserwacji 
i o jego istnieniu można dowiedzieć się a posteriori 
z analizy teoretycznej danych eksperymentalnych. 
Analizę tę przeprowadza się w ramach kwantowej 
teorii pola (rys. 1). 

Wyobraźmy sobie dwie cząstki elementarne, które 
znajdują się bardzo blisko siebie. Może się wówczas 
zdarzyć, że cząstka wirtualna wyemitowana przez 
jedną z nich zostanie pochłonięta nie przez tę samą 
cząstkę, lecz przez inną. Dojdzie wtedy nie do samo- 
oddziaływania, lecz do oddziaływania dwu cząstek 



'/ 

/ 

a) b) 

Rys. 1. Cząstka fermionowa (rze¬ 
czywista) otoczona chmurą wirtual¬ 
nych bozonów (linie przerywane). 
Na rys. Ib zostały narysowane 
także pętle wirtualnych par fer- 
mion-antyfermion. Zakładamy, że 
badamy cząstkę w jej układzie spo¬ 
czynkowym, a więc oś czasu jest 
równoległa do linii świata tej cząstki 
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Rys. 2. Dwie cząstki rzeczywiste 
fermionowe otoczone chmurami 
cząstek wirtualnych oddziałują 
przez wymianę wirtualnego bo¬ 
zonu 


przez wymianę między nimi jednej — lub wielu — 
cząstek wirtualnych (rys. 2). Można więc powiedzieć 
obrazowo, że akt emisji cząstki wirtualnej jest de¬ 
monstracją zdolności do oddziaływania cząstki emi- 
oddriatywa- tującej. Jeżeli natomiast cząstka wirtualna zostanie 
nie przez reabsorbowana przez cząstkę macierzystą, to właśnie 
wymianę zachodzi samooddziaływanie. 


Typy oddziaływań 

W przyrodzie istnieje kilka typów oddziaływań wy¬ 
raźnie różniących się od siebie. Różnice te przejawiają 
się w doświadczeniu w ten sposób, że procesy wywo¬ 
ływane przez poszczególne oddziaływania przebiegają 
różnie. Wnikliwsze zbadanie tych procesów prowadzi 
do wniosku, iż oddziaływania te różnią się od siebie 
zasięgiem, intensywnością oraz symetrią. Rozważania 
te wskazują na istnienie w przyrodzie co najmniej 
czterech podstawowych typów oddziaływań, a miano¬ 
wicie oddziaływania grawitacyjnego, słabego, elektro¬ 
magnetycznego i silnego, przy czym oddziaływania 
silne kwarków wewnątrz hadronu mogą się zasadniczo 
różnić od silnych oddziaływań hadronów. Zarazem 
dąży się do ujednolicenia wszystkich typów oddziały¬ 
wań według pewnych określonych kryteriów. W prze¬ 
szłości np. oddziaływania elektryczne i magnetyczne 
uważano za odrębne i dopiero dzięki badaniom pro¬ 
wadzonym przede wszystkim przez Faradaya i Max- 
wella okazało się, że w istocie istnieje tylko jedno 
oddziaływanie elektromagnetyczne. Obecnie prace 
nad podobną unifikacją oddziaływań słabych i elek¬ 
tromagnetycznych zostały zakończone. Na razie te 
dwa typy oddziaływań omawiamy oddzielnie. 


Zasięg oddziaływania 

Z wymienionych powyżej cech oddziaływań najłat¬ 
wiejszy do zdefiniowania jest ich zasięg. Rozróżniamy 
oddziaływania długozasięgowe (których potencjał 
maleje dla dużych odległości jak 1/r) oraz oddziały¬ 
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wania krótkozasięgowe (których potencjał maleje 
szybciej niż 1/r). Znane z fizyki makroskopowej 
oddziaływania elementarne są długozasięgowe. Są to 
oddziaływania grawitacyjne (opisane w fizyce kla¬ 
sycznej prawem powszechnego ciążenia Newtona) 
oraz elektromagnetyczne, opisane w wypadku od¬ 
działywania dwu spoczywających względem siebie 
ładunków elektrycznych prawem Coulomba. Nato¬ 
miast oddziaływania krótkozasięgowe (silne i słabe) 
są znane wyłącznie w fizyce mikroświata, gdyż ujaw¬ 
niają się one dopiero na bardzo małych odległościach. 

Prawo zaniku potencjału krótkozasięgowego na du¬ 
żych odległościach ma postać [exp(— pr)]/r 9 przy 
czym p jest pewną stałą o wymiarze m" 1 . Jako zasięg 
oddziaływania przyjmuje się odległość równą p~K 
Oddziaływania długozasięgowe mają zatem zasięg 
nieskończony. Natomiast jako zasięg oddziaływań 
krótkozasięgowych (wartość stałej /z"* 1 ) przyjmuje się 
długość fali comptonowskiej odpowiadającej najlżej¬ 
szej cząstce zdolnej do przenoszenia danego rodzaju 
oddziaływania. W oddziaływaniach silnych taką naj¬ 
lżejszą cząstką jest mezon n. Wobec tego dla oddzia¬ 
ływań silnych p = 0,7 fm" ł . Oddziaływania słabe zaś 
mają zasięg znacznie mniejszy niż oddziaływania 
silne. Przez wiele lat uważano, że zasięg ten jest równy 
zeru. Odpowiadałoby to sytuacji, w której cząstka 
przenosząca oddziaływanie słabe miałaby masę nie¬ 
skończenie dużą. Obecnie przypuszcza się, że zasięg 
oddziaływań słabych jest skończony, a bozonami 
przenoszącymi te oddziaływania (bozony Z i W) są 
cząstki o masie ok. 80 GeV/c 2 , czyli cięższe ok. 600 
razy od mezonu tt. Tylokrotnie też krótszy byłby zasięg 
oddziaływań słabych od zasięgu oddziaływań silnych. 
Należy podkreślić, że zarówno hipoteza istnienia bo¬ 
zonów W i Z jak i oszacowanie wartości ich mas 
nie mają pełnego potwierdzenia eksperymentalnego. 


Intensywność oddziaływania i stała 
sprzężenia 

Trudniej jest wyjaśnić, co to znaczy, iż poszczególne 
typy oddziaływań różnią się intensywnością. Intuicyj¬ 
nie jest zrozumiałe, że niektóre oddziaływania są sil¬ 
niejsze niż inne. Ilościowo intensywność oddziaływa¬ 
nia charakteryzujemy wartością stałej sprzężenia. 

Fizyczny sens stałej sprzężenia jest łatwiej zrozu¬ 
mieć, rozważając znane z fizyki klasycznej prawa 
Newtona i Coulomba. We wzorach wyrażających te 
prawa oprócz odległości r między oddziałującymi 
obiektami fizycznymi występuje jeszcze—jako miara 
liczbowa zdolności tych obiektów do oddziaływania— 
wielkość taka jak masa (we wzorze Newtona) czy też 
ładunek (we wzorze Coulomba). Posługując się języ¬ 
kiem fizyki cząstek elementarnych można powiedzieć, 
że wielkość ładunku elektrycznego lub grawitacyjnego 
(za który można uważać masę ciężką) charakteryzuje 
ilościowo zdolność danej cząstki elementarnej do 
emisji Gub absorpcji) cząstki przenoszącej oddziały¬ 
wanie. W wypadku oddziaływania elektromagnetycz¬ 
nego cząstką tą jest dobrze znany foton (o masie spo¬ 
czynkowej równej zeru, stąd stała p dla tego oddziały¬ 
wania ma także wartość równą zeru!), natomiast dla 
oddziaływań grawitacyjnych analogiczną funkcję 
pełniłby hipotetyczny na razie grawiton, o masie spo¬ 
czynkowej równej także zeru. 

Ponieważ oddziaływanie wzajemne polega na emisji 
oraz absorpcji cząstki przenoszącej oddziaływanie, 
więc liczbowo będzie ono charakteryzowane przez 
wielkość zawierającą kwadrat ładunku. Wielkość 
tę dobiera się tak, aby była bezwymiarowa. W rezul¬ 
tacie, jako stałą sprzężenia oddziaływania elektro¬ 
magnetycznego dostajemy wielkość 

Oel = (4 jcSo)" 1 * 2 /^), (1) 

a oddziaływania grawitacyjnego wielkość 

a gr = Gm^mJińc), (2) 

gdzie: e — ładunek elementarny, G — stała grawita- 


staia 

sprzężenia 
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Rys. 3. Oddziały¬ 
wanie nukleon-nu- 
kleon przez wymia¬ 
nę wirtualnego me¬ 
zonu (chmury zo¬ 
stały pominięte) 


cji, m 1 i m 2 — masy oddziałujących cząstek, e 0 — 
przeaikalność elektryczna próżni. 

Jak widać ze wzorów (1) i (2) stałą sprzężenia od¬ 
działywania elektromagnetycznego udało się zdefinio¬ 
wać w sposób uniwersalny, natomiast stała sprzę¬ 
żenia oddziaływania grawitacyjnego zależy od rodzaju 
oddziałujących cząstek. Dla cząstek elementarnych 
a* r jest zawsze znacznie mniejsza od a e i. I tak np. 
dla dwu protonów a gr wynosi ok. 5,9-10" 3 *, nato¬ 
miast (uniwersalna) wartość a e i jest z dobrym przy¬ 
bliżeniem równa 1/137. Toteż oddziaływania grawi¬ 
tacyjne cząstek elementarnych są zawsze znacznie 
słabsze od elektromagnetycznych; tym się też tłuma¬ 
czy fakt, dlaczego wolno pomijać oddziaływania 
grawitacyjne w opisie zachowania się cząstek ele¬ 
mentarnych (przy obecnie osiąganych energiach). 

Przy oddziaływaniach krótkozasięgowych sytuacja 
jest trudniejsza, ponieważ nie znamy wzoru opisują¬ 
cego te oddziaływania, który by stanowił analogię 
do wzoru Newtona czy też Coulomba. (Wzór e _ ^ /r , 
którym się posługiwaliśmy przy omawianiu zasięgu 
oddziaływania, ma znaczenie jedynie poglądowe i pół- 
jakościow-e, nie nadaje się jednak do rozważań ilościo¬ 
wych). Aby w'ięc zdefiniować stałą sprzężenia, sko¬ 
rzystamy z analogii fizycznej dó poprzednich przykła¬ 
dów oddziaływań. 

Rozpatrzmy dwa protony oddziałujące wzajemnie 
przez wymianę jednego (oczywiście wirtualnego) 
mezonu n. Aktowi emisji mezonu wirtualnego przez 
proton przyporządkujemy silny ładunek gNN* (rys. 3), 
podobnie jak aktowi emisji fotonu wirtualnego przez 
np. elektron został przyporządkowany ładunek 
elektryczny. Wielkość 

txsii — (4 jc^c)“ 1 ^ 2 > va-« (3) 

jest zwana stałą sprzężenia oddziaływań silnych 
nukleon-mezon n. Ta bezwymiarowa wielkość jest 
mierzalna (-* Oddziaływania silne) i wartość jej 
wynosi w przybliżeniu 15. Wobec tego, oddziaływa¬ 
nia silne są rzeczywiście znacznie silniejsze od oddzia¬ 
ływań elektromagnetycznych, co uzasadnia ich nazwę. 

Stosując tę terminologię należy jednak pamiętać, 
że oddziaływania silne są krótkozasięgowe i wobec 
tego dla dużych odległości są efektywnie znacznie 
słabsze od oddziaływań elektromagnetycznych. Dla¬ 
tego też porównując intensywności różnych typów 
oddziaływań należy wyraźnie określić, w jakiej odle¬ 
głości od siebie znajdują się cząstki oddziałujące. 

Sytuacja ta jest jeszcze wyraźniejsza w wypadku 
oddziaływań słabych. Początkowo sądzono, że od¬ 
działywania te mają zasięg zerowy. Wtedy z fenome¬ 
nologicznego punktu widzenia podstawowym aktem 
oddziaływania słabego nie byłaby emisja pojedynczej 
cząstki wirtualnej, lecz proces, w którym brałyby 
udział 4 cząstki fizyczne o spinach 1 / 2 (np. w procesie 
rozpadu mionu—rys. 4,//“->c~+v < r4-v^, alboteż pro- 




Rys. 4. Oddziaływanie Fermiego między czterema fermionami 
odpowiadające wychwytowi elektronu przez proton z przejściem 
do stanu neutron + neutrino. Na rys. Ib ten sam proces przed¬ 
stawiony jest przy założeniu istnienia hipotetycznego bozonu W 
przenoszącego oddziaływania słabe 


ces zderzenia neutrina z elektronem, v e +e -> v«-f e). 
Okazuje się (-► Oddziaływania słabe), że wielkość 
charakteryzująca taki proces nie jest bezwymiarowa 
i wynosi, jak wynika z danych doświadczalnych, G = 
= 1,02 • 10“ 5 * w" 2 (gdzie m v — masa protonu). Stałą G 
jest dość trudno porównać ze stałą sprzężenia np. od¬ 


działywania elektromagnetycznego ze względu na 
zupełnie inny charakter zależności tych dwu rodzajów 
oddziaływania od odległości. 

Jeśli, zgodnie z nowymi poglądami na oddziaływa¬ 
nia słabe, są one przenoszone przez bozony Z i W , 
to można, znając stałą G , obliczyć stałą sprzężenia 

a 8 ł = (4nhc)~ l g 2 p P W. (4) 

Wartość tej stałej jest rzędu stałej sprzężenia oddzia¬ 
ływań elektromagnetycznych. 

Rozważania dotyczące uszeregowania oddziaływań 
cząstek elementarnych na podstawie wartości stałych 
sprzężenia można poprzeć innymi jeszcze argumen¬ 
tami ilościowymi. 

Argumenty te czerpie się z danych podających mąsy cząstek 
różnice mas cząstek elementarnych oraz różnice ich eJementar- 
czasów życia. Należy zwrócić uwagę, że energia nych 
samooddziaływania, jak każda w ogóle energia 
(zgodnie z zasadami szczególnej teorii względności), 
wiąże się z pewną masą. Ponieważ zaś cząstka jest 
zawsze w stanie samooddziaływania, przeto jej zmie¬ 
rzona masa zawiera już w sobie ów dodatek (masę 
połową) pochodzący z samooddziaływania. Można 
więc oczekiwać, że każde dwie cząstki, które się róż¬ 
nią samooddziaływaniem będą mieć różne wartości 
masy. Porównując zatem masy tych cząstek, co do 
których można żywić nadzieję, że ich masy niepolowe 
są dokładnie jednakowe, możemy uzyskać dane 
o sile oddziaływania, pow-odującego przyrost masy. 

Intensywność oddziaływania zależy zaś od wartości 
stałej sprzężenia. Tym samym różnice mas cząstek 
elementarnych są jakąś miarą wartości stałych sprzę¬ 
żenia poszczególnych rodzajów oddziaływań. 

Mimo, że problem ten przedstawia się dość jasno 
od strony jakościowej, to jednak dotychczas nie 
opracowano konsekwentnej metody obliczania po¬ 
prawek do masy pochodzących od samooddziaływa¬ 
nia. Jest to więc zagadnienie, którego nie można 
jeszcze przedstawić od strony ilościowej. 

Dotychczas jest znany jeden przykład dwu cząstek różnice mas 
elementarnych, różniących się jedynie swymi od- cząstek po- 
działywaniami słabymi — są to K ® i Kg (patrz tabela krewnych 
na str. 84). Różnica ich mas jest bardzo mała, wy¬ 
nosi zaledwie 3,5 * 10“ 12 MeV/c 2 . Znacznie większe 
wartości mają różnice mas między pokrewnymi czą¬ 
stkami wynikające z oddziaływań elektromagnetycz¬ 
nych. I tak np. neutron jest cięższy od protonu o 1,29 
MeV/c 2 , mezon n+(\n~) od mezonu n° o 4,6 MeV/c 2 , 
hiperon Z~ od hiperonu 27° o 4,8 MeV/c 2 , ten ostatni 
zaś od hiperonu Z+ o 3,1 MeV/c 2 itd. Patrząc na 
tabelę, można się przekonać, że różnice te są z reguły 
mniejsze niż 10 MeV/c 2 . 

Jeszcze większe różnice mas występują między 
cząstkami pokrewnymi, różniącymi sięjednak oddzia¬ 
ływaniem silnym. I tak np. różnica masy między hipe¬ 
ronem A a nukleonem wynosi ok. 175 MeV/c 2 , mię¬ 
dzy hiperonami Z i A — ok. 75 MeV/c 2 , między hi¬ 
peronami S i Z —ok. 130 MeY/c 2 , między mezo¬ 
nem K a mezonem 7 t ok. 350 MeV/c 2 (wartość wyjątko¬ 
wo duża!), między mezonem K* a mezonem o ok. 

130 MeV/c 2 itd. Jak widać z tego zestawienia, różnice 
mas spowodowane oddziaływaniami silnymi zawierają 
się orientacyjnie między 100 a 400 MeV/c 2 . Są to 
więc wartości mniej więcej 100 razy większe od różnic 
mas elektromagnetycznych, co się z grubsza zgadza 
ze stosunkiem odpowiednich ładunków: silnego 
i elektrycznego. Wszelkie dokładniejsze porównania 
ilościowe mają jednak niewielkie znaczenie, ponieważ 
nie ma konsekwentnej teorii mas polowych. 

Następnym kryterium służącym do rozróżniania średnie czasy 
rozmaitych rodzajów oddziaływań mogą być średnie życia 
czasy życia cząstek nietrwałych. Cząstki nietrwałe — 
z punktu widzenia struktury pola własnego — tym 
się różnią od cząstek trwałych, że mogą emitować 
także cząstki rzeczywiste (fizyczne), a nie tylko wirtu¬ 
alne; taki akt emisji nie zachodzi bowiem z pogwał¬ 
ceniem zasady zachowania czteropędu. Jednakże emi¬ 
sja cząstki czy to wirtualnej czy też rzeczywistej jest 
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liczba pomiarów N (jednostki dowolne) 


uzależniona od zdolności cząstki emitującej do 
oddziaływania i wobec tego zależy od wartości stałej 
sprzężenia. Należy więc oczekiwać, że cząstki rozpa¬ 
dające się w wyniku oddziaływania silnego mają 
średnie czasy życia krótsze niż cząstki rozpadające się 
elektromagnetycznie, a te z kolei żyją średnio krócej 
niż cząstki rozpadające się w wyniku oddziaływań 
słabych. Jak wynika z tabeli na str. 84 dane doświad¬ 
czalne potwierdzają to przypuszczenie. Istotnie, 
wszystkie średnie czasy życia cząstek nietrwałych 
można podzielić na trzy grupy. Warto tu dodać, 
że średnie czasy życia cząstek rozpadających się 
w rezultacie oddziaływań silnych ocenia się na pod¬ 
stawie zasady nieokreśloności czasu i energii. Z zasady 



Rys. 5. Charakterystyczny przebieg krzywej rozkładu masy czą¬ 
stki nietrwałej, z którego można odczytać wartość szerokości po¬ 
łówkowej. Na osi poziomej odłożona jest masa, a na pionowej 
liczba pomiarów, w których została zmierzona dana wartość masy 


tej wynika m.in., że średni czas życia cząstek nietrwa¬ 
łych r, pomnożony przez szerokość połówkową /", 
charakteryzującą niepewność w określeniu masy 
cząstki nietrwałej, wynosić. Na tej podstawie można 
zapisać zależność r(s)r(MeV) » 6,58 *10" 22 (rys. 5). 
zależność Jedną grupę stanowią średnie czasy życia rzędu 
czasu życia 10" 21 -10" 24 s. Zaliczyć tu można czasy życia takich 
od typu od- cząstek jak A (t == 4,3 -10' 24 s), co (r = 6,6 -10' 23 s), 
działywania ^(r = 5,7 TO' 24 s) itd. Najdłuższe czasy życia w tej 
grupie mają mezony q> (1,6- 10~ 22 s) oraz niedawno od¬ 
kryte mezony J/y (9,8 *10~ 21 s)i y>'(2,9 -10“ 21 s). Wszy¬ 
stkie te rozpady przypisuje się oddziaływaniom silnym. 

Drugą (nieliczną) grupę średnich czasów życia 
tworzą r rzędu 10' 16 -10" 19 s. Zaliczyć tu można śred¬ 
nie czasy życia mezonu (0,83 -10' 18 ), mezonu 
rj (0,77 *10” 18 ) czy wreszcie hiperonu (0,58 *10~ 19 s). 
Wszystkie te rozpady przypisuje się oddziaływaniom 
elektromagnetycznym. 

Trzecią natomiast grupę tworzą średnie czasy życia 
rzędu 10" e -10' 13 s. Zaliczyć tu można czasy życia 
mezonów n ± , K £, K$, hiperonów A, E°, 

S~, Zestaw danych liczbowych znajduje się w ta¬ 
beli na str. 84. Można tu też zaliczyć średni czas życia 
mionu. Pozornym wyjątkiem jest rozpad neutronu, 
lecz wyjątkową powolność tego rozpadu wyjaśnia 
się działaniem czynników ubocznych. Wszystkie te 
rozpady powstają wskutek oddziaływań słabych. 

Tak więc między czasami życia charakterystycznymi 
dla oddziaływań silnych i elektromagnetycznych 
istnieje różnica co najmniej dwu rzędów wielkości, 
szczególnie-, jeśli pominąć wyjątkowo powolne—jak 
na oddziaływania silne — rozpady cząstek J/y i y. 
Podobna, a nawet większa różnica (co najmniej pięć 
rzędów wielkości) dzieli czasy życia wywołane roz¬ 
padami elektromagnetycznymi i słabymi. 

Podsumowując można powiedzieć, że dane do¬ 
świadczalne przemawiają za istnieniem trzech dobrze 
wyodrębnionych fenomenologicznie rodzajów od¬ 
działywań (nie biorąc pod uwagę oddziaływań 
grawi tacyj nych). 

Najtrudniejsza do wyjaśnienia jest różnica w sy¬ 


metrii poszczególnych rodzajów oddziaływań. Do 
tego zagadnienia przejdziemy dopiero po omówieniu 
głównych rodzajów cząstek i charakteryzujących je 
liczb kwantowych. 


Klasyfikacja cząstek 
elementarnych 


Podstawą klasyfikacji cząstek elementarnych są 
dwa niezależne kryteria — wartość liczby spinowej 
i zdolność do oddziaływań silnych. Wszystkie czą¬ 
stki dzielimy na fermiony (ich spin wynosi Yt, •••) 
oraz bozony (mające spin całkowity — 0,1,2,...). Jed¬ 
nocześnie wszystkie cząstki dzielisię na hadrony,czyli 
cząstki zdolne do oddziaływań silnych, oraz pozostałe 
cząstki, które nie mają odrębnej nazwy. Hadrony bę- 


bozony 


foton 


fermion 


leptony 


hadrony 


dące fermionami są nazywane barionami,a hadrony mezony 
będące bozonami — mezonami. Natomiast fermiony, 
które nie są hadronami tworzą grupę leptonów, a od¬ 
powiednie bozony — grupę zawierającą jedną tylko 
znaną cząstkę elementarną, a mianowicie foton. Do 
tej samej grupy można by zaliczyć także bozony od¬ 
działywań słabych, a wśród nich bozon W, gdyby ich 
istnienie zostało potwierdzone doświadczalnie. Liczba 
hadronów znacznie przewyższa liczbę cząstek pozo¬ 
stałych i główny problem klasyfikacyjny wiąże się 
właśnie z uporządkowaniem hadronów. 

Istnieje kilka wielkości fizycznych, które cha¬ 
rakteryzują wszystkie bez wyjątku cząstki elementarne. 

Są to wielkości znane już z fizyki klasycznej, 
jak pęd, energia, masa, czas życia (niekiedy wyrażany 
przez swoją odwrotność, a mianowicie przez szero¬ 
kość połówkową r), własny moment pędu (spin) 
czy ładunek elektryczny. Jednakże wartość pędu 
i energii nie odgrywa żadnej roli w klasyfikacji czą¬ 
stek, gdyż może ona ulec zmianie w wyniku przyspie¬ 
szenia lub spowolnienia ruchu tej samej cząstki. 

Oprócz ładunku elektrycznego są jeszcze znane 
z fizyki klasycznej inne wielkości fizyczne charak¬ 
teryzujące oddziaływanie obiektów fizycznych z po¬ 
lem elektromagnetycznym, jak np. momenty dipolowe 
(elektryczne i magnetyczne), kwadrupolowe, oktupo- 
lowe itd. W odniesieniu do cząstek elementarnych 
teoria pozwala na sformułowanie kilku twierdzeń 
ogólnych. Weźmy pod uwagę cząstkę elementarną 
o spinowej liczbie kwantowej J. Zgodnie z ogólnymi 
twierdzeniami teorii cząstek elementarnych oddziały¬ 
wanie takiej cząstki z polem elektromagnetycznym 
scharakteryzowane jest 2/-fl wielkościami. Twier¬ 
dzenie to jest słuszne z taką dokładnością, z jaką 
można pominąć oddziaływania słabe, a w pewnych 
wypadkach nawet z lepszą (z dokładnością, z jaką 
zachowana jest parzystość kombinowana CP). Tak 
więc oddziaływania elektromagnetyczne cząstki o spi¬ 
nie /= 0 są opisywane tylko przez jedną wielkość, 
a mianowicie ładunek elektryczny; dla cząstek o J — 

= Y 2 może się pojawić druga wielkość — dipolowy 
moment magnetyczny; dla cząstek o / = 1 oprócz 
dwu wymienionych może wystąpić jeszcze niezerowa 
wartość kwadrupolowego momentu elektrycznego 
itd. Oczywiście nie wszystkie te wielkości, poczynając 
od ładunku, muszą być różne od zera. Ponieważ 
trudno jest zmierzyć te wielkości dla cząstek bardzo 
nietrwałych (wyjątkiem jest ładunek), przeto o elek¬ 
tromagnetycznych liczbach kwantowych cząstek ele¬ 
mentarnych wiadomo na razie jeszcze niewiele. 

Liczby kwantowe: barionowa B y leptonowa L, 
taonowa L t , mionowa Lu i elektronowa L* są także 
powszechnymi liczbami kwantowymi, które można 
przyporządkować wszystkim cząstkom. Przyporząd¬ 
kowania tego dokonuje się w ten sposób, że wszystkim 
barionom przypisuje się B = 1, wszystkim antybario- 
nom B = — 1 (szerzej o pojęciu antycząstki będzie 
mowa dalej), natomiast wszystkim nie-barionom B — 

= 0. Podobnie są definiowane pozostałe liczby, np. 


banom 


powszechne 
liczby 
kwantowe 
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mionową: przypisujemy = 1 mionowi fT oraz 
neutrinie mionowemu v u , a ich antycząstkom — 
L» = -1. Natomiast wszystkie inne cząstki mają 
z definicji L» = 0. 

Wymienione dotychczas liczby kwantowe, takie jak 
np. pęd, moment pędu, ładunek, czy wreszcie liczby 
barionowa i leptonowa mają tę własność, że aby 
obliczyć wartość danej liczby kwantowej dla układu 
dwu lub więcej cząstek elementarnych należy po 
prostu dodać liczby kwantowe charakteryzujące 
poszczególne cząstki (przy momencie pędu należy 
oczywiście uwzględnić oprócz spinowego także orbi¬ 
talny moment pędu i zastosować kwantowe prawo 
dodawania tej wielkości fizycznej). Takie liczby 
kwantowe są nazywane addytywnymi. Oprócz nich 
mamy też do czynienia z multiplikatywnymi liczbami 
kwantowymi, które należy mnożyć przez siebie, 
aby uzyskać wartość danej liczby kwantowej dla 
układu cząstek. 

Przykładem multiplikatywnej liczby kwantowej 
jest parzystość P. Określa ona zachowanie się funk¬ 
cji falowych opisujących układy kwantowe przy do¬ 
konaniu inwersji, tzn. zmiany znaku wszystkich trzech 
przestrzennych osi układu odniesieniu. Jest oczywiste, 
że dwukrotne wykonanie inwersji przywraca stan 
pierwotny, można więc oczekiwać, iż parzystość P 
wszystkich cząstek może przybierać tylko dwie war¬ 
tości, a mianowicie +1 i —1. Okazuje się jednak, że 
funkcja falowa fermionów nie ma określonego za¬ 
chowania przy inwersji, co uniemożliwia bezwzględne 
przyporządkowanie parzystości cząstkom o spinie 
połówkowym. Można jednak określić parzystość 
względną dwu fermionów, gdyż para fermionów 
ma spin całkowity i jest bozonem. Bardziej szczegóło¬ 
wa analiza prowadzi do wniosku, że kilku wybranym 
fermionom należy umownie przyporządkować pa¬ 
rzystość, a wtedy parzystości pozostałych cząstek 
będą jednoznacznie określone. Wybranymi fermio¬ 
nami są: proton, neutron, hiperon A, elektron, mion 
i taon. Cząstkom tym przypisuje sięP=+l. 
Dodajmy, że określenie parzystości dla neutrin nie 
ma sensu, gdyż cząstki te biorą udział tylko w od¬ 
działywaniach słabych, które nie zachowują parzy¬ 
stości (zostanie to omówione nieco dalej). 

Należy jeszcze pamiętać o tym, że parzystość 
układu cząstek elementarnych nie jest po prostu 
równa iloczynowi parzystości tych cząstek, lecz temuż 
iloczynowi pomnożonemu dodatkowo przez parzy¬ 
stość związaną z ruchem orbitalnym składników 
układu. Dla układu dwucząstkowego mamy np. 

^układu = PiPz(~l) > 

przy czym P u P% — parzystości składników układu, 
/ — liczba kwantowa orbitalnego momentu pędu 
tych składników. 

Powstaje pytanie, czy oprócz dotychczas omawianej parzy¬ 
stości, którą można by nazwać przestrzenną, istnieje także pa¬ 
rzystość czasowa, związana z zachowaniem się funkcji falowej 
przy odwróceniu biegu czasu. Pozornie nie ma ona sensu, gdyż 
przecież rzeczywistego czasu odwrócić się nie da. Jednakże dla 
każdego ruchu można znaleźć ruch odwrócony w czasie, to zna¬ 
czy taki, który zachodzi w ten sam sposób, w jaki zachodziłby 
ruch wyjściowy oglądany przez obserwatora poruszającego się 
wstecz w czasie. 

Aby to lepiej zrozumieć, rozważmy ciało poruszające się w da¬ 
nym polu sił, zależnym tylko od odległości, z pewną — w usta¬ 
lonej chwili i w ustalonym punkcie — prędkością. Nie zmie¬ 
niając położenia ciała oraz sił działających na to ciało zmieńmy 
po prostu zwrot jego prędkości. Nastąpi wówczas ruch tego ciała 
w danym polu sił, lecz odwrócony w czasie. Gdyby zaś siły dzia¬ 
łające na to ciało były zależne od czasu, należałoby rozpatrywać 

ruch ciała w polu sił F( - /), przy jednoczesnym odwróceniu 
zwrotu jego prędkości. Widać więc, że transformacja odwrócenia 
czasu ma sens fizyczny. 

\\V mechanice klasycznej z transformacją odwrócenia czasu, 
zresztą podobnie jak z operacją inwersji, nie wiąże się żadna stała 
ruchu. Jednakże w mechanice kwantowej sytuacja ta —- teo¬ 
retycznie rzecz biorąc — mogłaby się zmienić, podobnie jak 
dla’ inwersji, której 'wartość własna, a mianowicie parzystość 
przestrzenna, jest pewną liczbą kwantową charakteryzującą za¬ 
równo pojedyncze cząstki elementarne jak i ich układy. Wyka¬ 
żemy teraz, że sytuacja taka nie zachodzi dla odwrócenia czasu, 
a więc że nie istnieje żadna parzystość czasowa 

Podstawowe w mechanice kwantowej równanie ruchu czyli 
równanie Schrodingera ma postać 


(- Ł a+v )* 


h By/ 
i dt 


( 6 ) 


e* & & 

przy czym: A — operator Laplace’a równy + -jpf + * 


fi _stała Plancka, m — masa rozważanego obiektu kwanto¬ 

wego, a y/ — funkcja falowa opisująca ten obiekt. Z równania 
Schródingera wynika, że zamiana t na -/ prowadzi do zmiany 
znaku prawej strony równania, natomiast nie powoduje żadnej 
zmiany po stronie lewej. Dąży się jednak do tego, aby ruch kwan¬ 
towy odwrócony w czasie przebiegał wedle tych samych praw co 
i ruch nieodwrócony. Trzeba wobec tego przyjąć, że operacja 
odwrócenia czasu zawiera w sobie także operator sprzężenia ze¬ 
spolonego, przy którym liczby rzeczywiste nie zmieniają się, 
zmienia się natomiast znak jednostki urojonej /. Ta drobna na 
pozór sprawa ma poważne konsekwencje, uniemożliwia bowiem 
sformułowanie w ramach mechaniki kwantowej zagadnienia wła¬ 
snego dla operatora odwrócenia czasu. Zgodnie bowiem z pra¬ 
wami mechaniki kwantowej dwie funkcje yt i cy/ (c— dowolna 
stała zespolona) opisują dokładnie ten sam stan fizyczny. Jeśli 
y; jest funkcją własną operatora odwrócenia czasu, to, oznacza¬ 
jąc ten operator symbolem 7*, mamy Tty = T'y/ f gdzie T jest od¬ 
powiednią wartością własną charakteryzującą stan kwantowy y/. 
Jednakże cy/ musi być wtedy także funkcją własną operatora T 
przynależną do tej samej wartości własnej, a więc powinna za¬ 
chodzić Tcy/ = Tcy /; wszelako mamy też związek Tcyt = c* Tyr *=• 
= c*T'y/. Dwie te równości nie mogą być ze sobą zgodne dla do¬ 
wolnej zespolonej wartości c. Tak więc nie ma parzystości cza¬ 
sowej. 

Bardzo wiele liczb kwantowych charakteryzuje 
wyłącznie Gub prawie wyłącznie) hadrony. Na ^pier¬ 
wszym miejscu zostanie tu wymieniona dziwność S. 
Jest to addytywna liczba kwantowa przybierająca 
wartość 0 dla fotonu oraz dla hadronów niedziwnych. 
Do hadronów niedziwnych zalicza się proton i neutron 
(wraz z ich antycząstkami) oraz wszystkie cząstki, 
które mogą powstawać pojedynczo w reakcjach 
zachodzących między wymienionymi cząstkami wy¬ 
wołanych oddziaływaniami silnymi. Hiperonowi A 
jest przypisywana dziwność —1. Łatwo wobec tego 
określić dziwność wszystkich innych hadronów, 
przestrzegając reguły addytywności oraz warunku, 
aby cząstka, której dziwność chcemy określić, pow¬ 
stawała pojedynczo w reakcji wywołanej oddziały¬ 
waniami silnymi. Obecnie są znane bariony o dziw¬ 
ności S = 0, —1, -2, -3 oraz mezony o dziwności 
S = -1, 0, +1. 

Z dziwnością wiąże się ściśle hiperładunek Y = B+ 
+5. Inną liczbą kwantową charakteryzującą wyłącz¬ 
nie bariony jest izospin I. Podstawą fenomenologiczną 
do wprowadzenia tej liczby kwantowej była obserwa¬ 
cja grupowania się hadronów w pewne rodziny o na¬ 
stępujących własnościach: a) wszystkie cząstki na¬ 
leżące do tej samej rodziny mają w przybliżeniu takie 
same masy (ich różnice są rzędu kilku MeV/c 2 , b) 
wszystkie cząstki należące do tej samej rodziny mają 
te same wartości spinu, parzystości, liczby barionowej 
i dziwności, c) ładunki elektryczne tych cząstek 
przybierają (w jednostkach e) wszystkie wartości 
z przedziału —/+ Yj2 aż do H-/+ K/2, gdzie I — pew¬ 
na liczba całkowita lub połówkowa, nieujemna. 
Nazywa się ją izospinem całej rodziny cząstek, a tę ro¬ 
dzinę z kolei — multipletem izospinowym. Liczeb¬ 
ność takiej rodziny wynosi oczywiście N r = 2/jl. 

Analogia formalna izospinu do zwykłego spinu, 
częściowo tłumaczy wybór nazwy dla tej wielkości 
fizycznej. Mianowicie (dla zwykłego spinu) danej 
wartości J odpowiada 2/+1 stanów, różniących się 
wartością jednej ze składowych spinu, którą zwykle 
wybieramy jako z-ową (albo trzecią) składową /, 
tzn. J z . Liczba kwantowa J 3 przybiera wszystkie 
bez wyjątku wartości ze zbioru —J, —J+ 1, •••» 

7- 1, J. Na tej zasadzie możemy też wprowadzić 
trzecią składową izospinu, / 3 , która także przybiera 
wszystkie wartości —/, —/-hi, ...» /—-1, /> po czym 
można zapisać wzór na ładunek cząstek należących 
do tego samego multipletu izospinowego w postaci 
Q = / 3 + K/2 (7) 


(wzór Gell-Manna-Nishijimy). 

Oczywiście, rozpatrując składową izospinu mamy 
na myśli jakąś interpretację geometryczną izospinu 
jako wektora. Rozumie się jednak, że nie jest to 
wektor w zwykłej przestrzeni, lecz jakiejś dodatko- 
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wej przestrzeni ładunkowej, a lepiej — izosprzestrze- 
ni. Tę izoprzestrzeń należy także uważać za trójwy¬ 
miarową. W zwykłej przestrzeni oprócz spinowego 
istnieje też orbitalny moment pędu, związany z ru¬ 
chem postępowym dwu obiektów względem siebie. 
Jednakże w przestrzeni izospinowej nie występuje 
ruch postępowy, nie ma więc także np. „izopędu” 
lub „izoenergii”, a w konsekwencji nie ma też „izo- 
momentu orbitalnego”. Tak więc, chcąc znaleźć 
wartość izospinu układu dwu cząstek należy dodać 
izospiny składników układu (nie dbając o nie istniejący 
w tym wypadku moment orbitalny), pamiętając 
jedynie, że izospin należy składać zgodnie z kwanto¬ 
wymi regułami dodawania momentu pędu. 
powab C Niedawno pojawiła się w fizyce nowa liczba kwan¬ 
towa, charakteryzująca wyłącznie hadrony, a miano¬ 
wicie powab C. Wszystkie dotychczas wymienione 
cząstki, umieszczone w tabeli na str. 84, miałyby C = 0, 
byłyby więc cząstkami niepowabnymi. Powab jest 
liczbą kwantową addytywną, pod wieloma względa¬ 
mi podobną do dziwności. Dla cząstek powabnych 
trzeba nieco zmodyfikować wzór GeH-Manna-Nishiji- 
my, który przybierze wówczas postać 

Q — / 3 +(T+C)/2. (8) 

Znamy też od niedawna, choć bardzo niedokładnie, 
jeszcze jedną liczbę kwantową charakteryzującą had¬ 
rony, a mianowicie B' (ang. beauty ), piękno. Liczba 
ta miałaby podobny status jak powab, 
antycząstki Należy teraz dokładnie sprecyzować pojęcie anty- 
cząstki. Antycząstką danej cząstki a nazywamy taką 
cząstkę a , która ma te same co a wartości masy, 
izospinu, spinu, czasu życia, przeciwne zaś JB, L z , L u , 
Lt (a więc i L), Q, S i C. Moment magnetyczny anty¬ 
cząstki jest ustawiony w stosunku do jej spinu prze¬ 
ciwnie niż moment magnetyczny cząstki. Parzystość 
antyfermionu jest przeciwna parzystości fermionu, a 
parzystość antybozonu jest taka sama jak parzystość 
bozonu. To, co uznajemy za cząstkę, jł co za anty- 
cząstkę, jest oczywiście umowne, gdyż a = a. 

Z powyższego zestawienia liczb kwantowych anty- 
cząstek wynika, że jest możliwe istnienie takich 
cząstek, które są identyczne ze swymi antycząstkami, 
a = d gdyż mają zerowe wartości tych wszystkich 
liczb kwantowych, które zmieniają znak przy przej- 
cząstkć ściu od cząstki do antycząstki. Cząstki te nazywać 
istotnie będziemy istotnie obojętnymi. Tak więc, dla cząstek 
obojętne istotnie obojętnych musi być B = S—Q = C = 0, 
L t = jL* = L c — L — 0. Cząstką istotnie obojętną 
jest np. foton oraz każdy nienaładowany, niedziwny, 
niepowabny mezon (np. mezon 7r°). Operację polega¬ 
jącą na zmianie cząstki w antycząstkę nazywa się 
sprzężenie sprzężeniem cząstka-antycząstka. Z powyższych defi- 
cząstka- nicji wynika, że funkcja falowa opisująca stan cząstki 
antycząstką istotnie obojętnej jest funkcją własną operatora tego 
sprzężenia. Ze względu na relację v = a kwadrat ope¬ 
ratora sprzężenia cząstka-antycząstka jest operatorem 
jednostkowym. Tym samym jego wartości własne mu¬ 
szą, podobnie jak dla parzystości przestrzennej, wyno¬ 
sić +1 lub — 1. Wartość własną operatora sprzężenia 
parzystość cząstka-antycząstka Pc nazywa się parzystością ła- 
ładunkowa dunkową. Z powyższego wynika, że tylko cząstki isto¬ 
tę tnie obojętne mają określoną parzystość ładunkową. 
Parzystość ładunkowa jest multiplikatywną liczbą 
kwantową. 

Warto zauważyć, że układ dwucząstkowy składają¬ 
cy się z cząstki i jej antycząstki tworzy także układ 
istotnie obojętny, ma więc określoną parzystość ła¬ 
dunkową, nawet wtedy, gdy jego składniki nie są 
cząstkami istotnie obojętnymi. Wartość tej parzy¬ 
stości jest dana wyrażeniem 

P C = (_ !)*+>, (9 ) 

w którym / — liczba kwantowa orbitalnego momentu 
pędu układu,/—wartość spinu tego układu. 

Inną multiplikatywną liczbą kwantową jest izo- 
rzoparzy- parzystość G. Jest ona wartością własną operatora 
stość G izoparzystości, który jest zdefiniowany jako iloczyn 
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operatora sprzężenia cząstka-antycząstka i operatora 
obrotu w izosprzestrzeni o kąt 7 T wokół drugiej 
osi w tej przestrzeni, lzoparzystość ma określoną 
wartość dla każdej cząstk i należącej do takiego multi¬ 
pletu izospinu, do którego należy także cząstka 
istotnie obojętna. W multiplecie takim bowiem wszy¬ 
stkie cząstki mają B = S = C = 0, a zatem wzór 
Gell-Manna-Nishijimy przybiera szczególnie prostą 
postać Q = / 3 . Sprzężenie cząstka-antycząstka zmie¬ 
nia Q na — Q y co zgodnie z powyższą relacją jest rów¬ 
noważne ze zmianą / s na — 7 a . Jednakże obrót o kąt 
tl wokół osi 2 w izoprzestrzeni powoduje odwró¬ 
cenie znaku osi trzeciej w tejże przestrzeni, a więc 
automatycznie zmianę znaku / 3 . Te dwie zmiany zna¬ 
ku kompensują się więc i łącznie sprzężenie G zamie¬ 
nia daną cząstkę w samą siebie. I tu znów G 2 = 1, 
więc izoparzystość może mieć wartości jedynie +1 
i —1. Dla cząstki istotnie obojętnej można ją obliczyć 
ze wzoru 

G = C(—iy, (10) 

zaś inne cząstki wchodzące w skład tego samego 
izomultipletu mają tę samą izoparzystość. 

Łatwo dostrzec, że inne cząstki nie mają określonej 
wartości G. Na przykład proton pod działaniem sprzę¬ 
żenia cząstka-antycząstka przechodzi w antyproton, 
a ten pod wpływem obrotu w przestrzeni izospinu 
zmienia znak / 3 , stając się antyneutronem. Operator 
G przeprowadza więc proton nie w proton, lecz 
w antyneutron. Proton nie jest więc stanem własnym 
G i nie ma określonej izoparzystości. 

Należy przy tym dodać, że w teorii oddziaływań 
słabych używa się jeszcze jednej multiplikatywnej 
liczby kwantowej, zwanej parzystością kombinowaną, parzystość 
będącej wartością własną operatora zdefiniowanego kombinc- 
jako iloczyn operatora inwersji i sprzężenia cząstka- wana 
antycząstka. 


Rodzaje oddziaływań a prawa zachowania 

Rozważmy dowolny proces z udziałem cząstek ele¬ 
mentarnych. W takim procesie na ogół ulega zmianie 
natura a nawet liczba cząstek. Doświadczenie wyka¬ 
zuje, że nie wszystkie możliwe a priori procesy za¬ 
chodzą w przyrodzie, a także, że niektóre z nich za¬ 
chodzą powoli, a inne — szybko. Aby zdać sobie 
sprawę z tych regularności wprowadzamy pojęcie 
zachowania wielkości fizycznych charakteryzujących 
cząstki elementarne i ich układy. 

Wykorzystując podane w poprzednim punkcie 
reguły, możemy obliczyć wartość określonej wielkości 
fizycznej dla układu cząstek wyjściowych oraz od¬ 
dzielnie dla układu cząstek końcowych. Mówimy, że 
pewna wielkość fizyczna jest zachowana w danym 
procesie, jeżeli dwie tak obliczone wartości są jedna¬ 
kowe oraz, że wielkość ta jest zachowana przez od¬ 
działywania silne (elektromagnetyczne, słabe), jeżeli 
jest ona zachowana we wszystkich procesach prze¬ 
biegających w czasie charakterystycznym dla oddzia¬ 
ływań silnych (elektromagnetycznych, słabych), tj. 
w czasie 10- 21 -10~ 24 s(lubteż 10' 16 -10~ 19 s, lub wresz¬ 
cie 10~ 6 -10~ 10 s). Wielkości zachowywane wewszyst- wielkości 
kich w ogóle oddziaływaniach nazywa się wielkoś- zachowywa- 
ciami bezwzględnie zachowanymi. ne bez- 

Z doświadczenia wynika niesłychanie interesująca względnie 
zależność. Okazuje się, że jeżeli jakaś wielkość fizyczna 
jest zachowana przez oddziaływania słabe, to na 
pewno jest też zachowana przez oddziaływania elek¬ 
tromagnetyczne, oraz jeśli jest zachowana przez 
oddziaływania elektromagnetyczne, to jest też zacho¬ 
wana przez oddziaływania silne. 

Wielkościami zachowanymi bezwzględnie są: pęd, 
energia i moment pędu, oraz ładunek elektryczny, 
liczba barionowa i liczby leptonowe. Oddziaływania 
słabe zachowują jeszcze dodatkowo parzystość kom¬ 
binowaną. Występują jednak procesy, które zachodzą 
jeszcze wolniej niż procesy uwarunkowane oddziały- 





waniami słabymi, w których parzystość kombino¬ 
wana nie jest zachowana. Są to pewne rozpady me¬ 
zonów Kl . Jak wynika z tabeli na str. 84 jednym 
z głównych kanałów rozpadu tych mezonów jest 
rozpad na trzy mezony n, zgodny z prawem zachowa¬ 
nia parzystości kombinowanej. Jednakże przekonano 
się, że w pewnym bardzo niewielkim procencie wy¬ 
padków, następuje też rozpad Kl na dwa mezony n 
z pogwałceniem tego prawa. Fenomenologicznie od- 
oddziaływa- powiada to istnieniu oddziaływań podsłabych, słab- 
nia podsłabe szych od słabych, nie zachowujących nawet parzystości 
kombinowanej. Rzeczywiste jednak wyjaśnienie tego 
zjawiska jest inne. 

Poza wielkościami zachowywanymi przez oddziały¬ 
wania słabe, oddziaływania elektromagnetyczne za¬ 
chowują jeszcze parzystość i parzystość ładunkową 
(z osobna) oraz S i / 3 (te dwie ostatnie wielkości 
dla procesów, w których uczestniczą wyłącznie hadro¬ 
ny i foton, przy założeniu, że dla fotonu / 3 = 0, 
aby utrzymać w mocy prawo Gell-Manna-Nishijimy). 
Oddziaływania silne zachowują ponadto izospin 
i izoparzystość. Powab byłby zachowany już przez 
oddziaływania elektromagnetyczne. 

Ta degradacja oddziaływań ze względu na liczbę 
zachowywanych przez nie wielkości fizycznych, pokry¬ 
wająca się przy tym ze spadkiem intensywności od¬ 
działywania, nie jest w pełni jasna. Lepsze zrozumienie 
znaczenia tego faktu można uzyskać po zbadaniu 
związku między prawami zachowania a symetrią 
teorii fizycznej. 


Symetrie a prawa zachowania 

Jedną z najgłębszych i najciekawszych idei już nie 
tylko fizyki czystek elementarnych, ale fizyki w ogóle 
jest związek między symetrią a prawami zachowania 
(-> Zasady zachowania). Układy fizyczne wykazują 
na ogół pewne własności symetrii. Na przykład, 
pojedyncza cząstka elementarna swoimi własnościami 
SVI 6rii symetrii nie wyróżnia w przestrzeni żadnego kierunku 
cząstki dzidki czemu można, nie zmieniając jej opisu, w do¬ 
wolny sposób skierować osie układu odniesienia. 

3 Jest też możliwe dowolne wybranie początku układu 
odniesienia, gdyż każdy punkt w przestrzeni jest 
równoważny innemu, skoro w przestrzeni tej nie ma 
innych cząstek, jak również dowolne wybranie chwili 
początkowej jako punktu zerowego na osi czasu. 
Co więcej, taka pojedyncza, swobodna cząstka poru¬ 
sza się, zgodnie z I zasadą dynamiki, ruchem jedno¬ 
stajnym prostoliniowym; prędkość .tego ruchu jest 
jednak dowolna. Ta dowolność prędkości odpowiada 
swobodzie przy wyborze do opisu cząstki jednego 
z nieskończenie wielu układów inercjalnych, poru¬ 
szających się względem siebie ze stałą prędkością. 

Intuicyjnie jest dość zrozumiałe, że ze swobodą 
przy wyborze tego czy innego układu odniesienia po¬ 
winna się wiązać jakaś niezmienna własność rozwa- 
twierdzenie żanego ciała lub układu ciał. Ścisłe uzasadnienie tego 
Moether przekonania jest jednak dość trudne. Dokładne 
rozważania prowadzą do twierdzenia Noether, 
które orzeka, że każda wielkość, będąca stałą ruchu 
(a więc spełniająca prawo zachowania), wiąże się 
z jakimś stopniem swobody, który mamy do dyspo¬ 
zycji przy wyborze sposobu opisu zachowania się 
układu fizycznego. Twierdzenie odwrotne nie byłoby 
jednak zawsze prawdziwe. 

W fizyce klasycznej występują prawa zachowania 
pędu energii, momentu pędu i ładunku elektrycznego. 
Twierdzenie Noether pozwala na ustalenie, że prawo 
zachowania pędu wynika ze swobody przy wyborze 
początku układu odniesienia (w przestrzeni trójwy¬ 
miarowej są to trzy stopnie swobody, odpowiada 
więc im zachowana wielkość trójskładnikowa — wek¬ 
tor). Prawo zachowania energii wynika ze swobody 
przy wyborze chwili początkowej na osi czasu, a pra¬ 
wo zachowania momentu pędu — ze swobody przy 
wyborze kierunków osi układu odniesienia. 


Nieco trudniej opisać symetrię układu fizycznego, 
z której wynika prawo zachowania ładunku. Przypom¬ 
nijmy, że podstawowe równania teorii elektromagne¬ 
tyzmu, a mianowicie równania Maxwe!la, dotyczą 

dwu wektorów — natężenia pola elektrycznego E 

i indukcji magnetycznej B. Okazuje się, że wektory te 
przez pewne operacje różniczkowe można otrzymać 

z dwu potencjałów — skalarnego <p i wektorowego A. 

Potencjały te jednak nie są wyznaczone jednoznacz¬ 
nie przez wartości pól E i B; można je w pewien 
sposób przekształcić nie zmieniając samych pól. 

Każde takie przekształcenie nazywano przekształce¬ 
niem cechowania. Zakładając, że potencjał skalarny przekształ- 
można traktować jako zerową (czasową) składową cenią 
czterowektora potencjału, którego składowymi prze- cechowania 
strzennymi są składowe potencjału wektorowego, 
można przyjąć, że przekształcenie cechowania spro¬ 
wadza się w przybliżeniu do dodania do każdej 
składowej czterowektora potencjału pochodnej czą¬ 
stkowej pewnej (jednakowej dla wszystkich składo¬ 
wych) funkcji skalarnej /?, wziętej względem tej zmien¬ 
nej, która odpowiada danej składowej. Na przykład 
do A x można dodać dpl8x, a do A 0 (czyli <p/c)— 

-mmc. 

Wyrażenie na gęstość energii oddziaływania cząstki 
naładowanej z polem elektromagnetycznym ma 
postać 

ejuA* = c0*o^o“ JA), (U) 

gdzie ja — czterowektor gęstości prądu (jego skła¬ 
dową zerową jest gęstość ładunku). W mechanice 
kwantowej analogiczna wielkość jest zbudowana 
z funkcji falowych cząstek naładowanych w sposób 
zależny od natury tych cząstek, jednakże zawsze 
w taki sposób, że każda składowa prądu zawiera 
funkcję falową cząstki i funkcję z nią sprzężoną 
(zespoloną). Jeśli chcemy, aby przekształcenie cecho¬ 
wania nie zmieniało postaci równań opisujących 
ruch cząstki naładowanej w polu elektromagnetycz¬ 
nym, to nie może się ono ograniczyć do pola elektro¬ 
magnetycznego, lecz musi też objąć prąd, a więc 
i funkcje falowe cząstek naładowanych. Okazuje się, 
się przekształcenie to, wykonane na tych funkcjach 
sprowadza się do ich obrotu w płaszczyźnie zespolo¬ 
nej (Re y, Im y>) o pewien kąt fi' = ( e]c)fł: 

(Rey)' = Rey cos£'+Imy sinj?', 

(Imy)' = — Reysin/?'-f Imy cos/?'. 

Kąt ten (rys. 6), co widać już z powyższego wzoru, 
jest proporcjonalny do funkcji /?, której pochodne 
dodaje się do składowych wektora czteropotencjału. 



W powyższych wzorach założono, że /? jest funkcją 
położenia i czasu. Takie przekształcenie cechowania 
jest nazywane przekształceniem drugiego rodzaju, cechowanie 
Zakładając, że $ nie zależy od r i /, a więc jest pewną pierwszego 
stałą, otrzymujemy cechowanie pierwszego rodzaju, i drugiego 
Okazuje się, że zachowanie ładunku (jedna wielkość!) rodzaju 
wynika ze swobody wyboru kierunków osi w płasz¬ 
czyźnie (Rey, Im y), co się wyraża w dowolności 
kąta obrotu p\ Ładunek elektryczny pełni w fizyce 
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podwójną rolę: jest stałą ruchu oraz źródłem pola 
elektromagnetycznego. Jak się okazuje należy używać 
w tym wypadku przekształcenia cechowania drugiego 
rodzaju. 

W przyrodzie istnieją inne stałe ruchu, których 
formalne podobieństwo do ładunku elektrycznego 
wyraża się tym, że ich zachowanie jest także konsek¬ 
wencją pewnej transformacji cechowania, ale które 
nie są źródłami żadnego pola fizycznego. Wielkościa¬ 
mi takimi są liczba barionowa i liczba leptonowa. 
Tak też, w pewnym ujęciu, można traktować dziwność 
i powab. W tych wszystkich wypadkach mamy do 
czynienia z przekształceniem cechowania pierwszego 
rodzaju. 

Prawo zachowania parzystości wiąże się ze swobodą 
przy wyborze lewo- i prawoskrętnego układu odnie¬ 
sienia, a więc z symetrią względem inwersji. Podobnie 
prawo zachowania parzystości ładunkowej wynika 
ze swobody przy wyborze tego, co uznamy za cząstkę, 
a co za antycząstkę, a więc z symetrii względem 
sprzężenia cząstka-antycząstka. 

Przekształcenie odwrócenia czasu jest przykładem 
sytuacji, w której symetria teorii względem pewnego 
przekształcenia nie prowadzi do żadnego prawa 
zachowania. Istotnie, prawa fizyki klasycznej, czy 
też mechaniki kwantowej są (z pewnym wyjątkiem, 
o czym dalej) symetryczne ze względu na odwrócenie 
czasu. Nie wiąże się z tym jednak zachowanie parzy¬ 
stości czasowej, gdyż po prostu wielkości takiej nie 
można zdefiniować, jak to zostało zaznaczone po¬ 
wyżej. 

sprzężenie Do podstawowych twierdzeń teorii cząstek elemen- 
PCT tarnych należy hipoteza (w pewnych konkretnych 
wypadkach udało się ją udowodnić), że wszystkie 
rodzaje oddziaływań wykazują symetrię względem 
przekształcenia będącego iloczynem inwersji, sprzę¬ 
żenia cząstka-antycząstka i odwrócenia czasu (zwa¬ 
nego sprzężeniem PCT). Mimo, że z symetrią tą, 
skoro zawiera ona odwrócenie czasu, nie wiąże się 
żadna stała ruchu, to jest ona bardzo ważnym skład¬ 
nikiem teorii cząstek. Wymienione wyżej twierdzenie 
zapewnia bowiem równość mas cząstki i antycząstki 
oraz równość ich czasów życia. 

Warto zauważyć, że wykonanie po sobie dwu prze¬ 
kształceń symetrii jest znów pewnym przekształce¬ 
niem symetrii. Przez przekształcenie symetrii rozumie 
się takie przekształcenie, które nie zmienia opisu 
badanego obiektu fizycznego, a więc jest zgodne z sy¬ 
metrią tego obiektu. Za przekształcenie symetrii 
należy też uważać przekształcenie tożsamościowe. 
Nasuwa się więc wniosek, że wszystkie przekształce¬ 
nia symetrii danego układu tworzą grupę, zwaną 
jego grupą symetrii. 

grupa Wspomnieliśmy poprzednio, iż najwięcej praw 
symetrii zachowania wiąże się z oddziaływaniami silnymi, a na 
podstawie obecnych rozważań wnioskujemy, że 
układom cząstek oddziałujących silnie odpowiada 
najwięcej przekształceń symetrii. Można zatem po¬ 
wiedzieć, że oddziaływania silne są najbardziej 
symetryczne, mniej symetryczne są oddziaływania 
elektromagnetyczne, a jeszcze mniej — oddziaływa¬ 
nia słabe. Najobszerniejsza grupa symetrii charakte¬ 
ryzuje oddziaływania silne, a grupa symetrii oddzia¬ 
ływań elektromagnetycznych jest jej podgrupą; 
podgrupą zaś jej z kolei jest grupa symetrii oddzia¬ 
ływań słabych. Wniosek ten wyciągnęliśmy już teraz, 
mimo, że nie jest jeszcze znana pełna grupa symetrii 
oddziaływań silnych, do czego przechodzimy w na¬ 
stępnym punkcie. 


Izospin i wyższe grupy symetrii 

Przy wprowadzaniu pojęcia izospinu stwierdzono, 
że ma on własności podobne do zwykłego spinu. Spin 
jest momentem pędu, a zachowanie momentu pędu 
wiąże się z symetrią względem obrotów w trójwy¬ 
miarowej przestrzeni zmiennych x , y , z. Analogicznie 


zachowanie izospinu wiąże się z symetrią względem 
obrotów w trójwymiarowej izoprzestrzeni. 

Okazuje się jednak, że takie ujęcie teorii zarówno 
momentu pędu jak i izospinu nie jest dogodne. Nie¬ 
dogodność ta pojawia się z chwilą wprowadzenia 
cząstek o spinie połówkowym. Wydaje się oczywiste, 
że obroty o kąt 0 i 2k są geometrycznie równoważne. 
Dla cząstek o spinie całkowitym obroty te są sobie 
równoważne także fizycznie, gdyż funkcja falowa ta¬ 
kich cząstek po obrocie o kąt 2 ji nie zmienia się. 
Inaczej jest dla cząstek o spinie połówkowym, gdyż 
obrót o kąt 2 n zmienia znak funkcji falowej tych 
cząstek i dopiero obrót o kąt 4 jt jest równoważny 
nie tylko geometrycznie ale i fizycznie obrotowi 
o kąt 0. W celu uniknięcia tej dwuznaczności wprowa¬ 
dzono zamiast grupy obrotów w trójwymiarowej 
przestrzeni zmiennych rzeczywistych x , y, z, grupę 
przekształceń unitarnych unimodularnych w prze¬ 
strzeni dwuwymiarowej zmiennych zespolonych, 
które można oznaczyć £, Każde przekształcenie 
tego typu zapisuje się w postaci 

s' -* £ + A in J/, i)' = Aniś-ł A m >/, 

przy czym macierz współczynników w tym prze¬ 
kształceniu A, 



spełnia warunki A*A = 1 (unitarność). 


gdzie A ł 



i Det(/ł) = l (unimodularność), Det(/I) oznacza symetria 
wyznacznik macierzy A. Grupę takich przekształceń SU{2) 
nazywamy grupą SU( 2). 

Grupa SU(2) umożliwia matematycznie poprawne 
sformułowanie teorii momentu pędu i izospinu. 

Zachowanie izospinu jest konsekwencją symetrii 
teorii względem przekształceń należących do izospi- 
nowej grupy SU( 2). 

W kwantowej teorii momentu pędu wykazuje się, 
że przy dodawaniu dwu momentów pędu, J x i J Zt 

Ji-rJ 2 — J , liczba kwantowa J kwadratu momentu 
pędu J musi spełniać warunek 


Ą Ą t ^ Ą+Ą. (12) 

Dodając zatem dwa momenty pędu l /a dostajemy J 
wypadkowe równe 0 lub I. Podobnie jest oczywiście 
z izospinem. Łatwo można się przekonać, że dodając 
do siebie co najmniej 2/-krotnie izospin Va dostaje¬ 
my, jako największą wartość wypadkowego izospinu, 
izospin /. Izospin 1 / 2 odgrywa podstawową rolę 
w teorii izospinu jako elementarna cegiełka, z której 
można uzyskać wszystkie inne wartości /. Innymi 
słowy, każdy multiplet izospinu może być zbudo¬ 
wany z dubletów. 

Omówioną przed chwilą operację składania dwu 
izospinów można wyrazić w następującej formie 

2®2=1©3, (13) 

przy czym znak mnożenia i dodawania zostały wzięte 
w kółka dla zaznaczenia, że nie chodzi tu o mnoże¬ 
nie i dodawanie liczb naturalnych lecz o składanie 
izospinów; liczby 2, 1 i 3 odpowiadają liczebnościom 
izomultipletów o I — */ 2 , 0 i l. Podobnie można na¬ 
pisać 

2©2<S>2 = 2©2©4. (14) 

W miarę wykrywania coraz to nowych cząstek ele¬ 
mentarnych, głównie hadronów, zaczęły się ujaw¬ 
niać pewne dalsze podobieństwa między nimi, które 
doprowadziły, po wielu wcześniejszych nieudanych symetria 
próbach, do sformułowania teorii symetrii SÓ( 3) SU(3) 
oddziaływań silnych. 

Podstawę stanowiło tu, podobnie jak w wypadku 
izospinu, grupowanie się hadronów w pewne rodziny, 
charakteryzujące się następującymi własnościami: 
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rodziny a) do tej samej rodziny należą hadrony o tych samych 

hadronów wartościach 7, /\ B\ b) w skład takiej rodziny wcho¬ 
dzi zawsze cały multiplet izospinowy; c) wchodzące 
w skład takiej rodziny izomultiplety mają na ogół 
różne wartości / oraz Y, jednakże zbiór tych wartości 
nie wykazuje żadnych luk, tj. / zmienia się co 
a Y co 1; d) charakterystyczne różnice mas między 
poszczególnymi izomultipletami są w danej rodzinie 
rzędu ok. 100-300 MeV/c 2 ; e) hadrony należące 
do tej samej rodziny wykazują analogiczne własności 
z punktu widzenia oddziaływań silnych (np. nukleon 
wiąże się z mezonem x w nietrwały stan barionu A 
o spinie 3 /a i parzystości dodatniej, a podobne stany 
nietrwałe powstają też z oddziaływania z mezonem tt 
hiperonów A i Z). Liczebność zaobserwowanych 
rodzin wynosi dla wszystkich hadronów I i 8, a dla 
barionów ponadto 10. 

W 1961 r. Gell-Mann odkrył, że multiplety o tej 
liczebności pojawiają się właśnie w symetrii 5ć/(3). 
Jest to, jak łatwo odgadnąć przez analogię z SU(2), 
grupa przekształceń unitarnych i unimodularnych, 
lecz w przestrzeni zespolonej trójwymiarowej. Ten 
dodatkowy wymiar przestrzeni jest potrzebny, aby 
włączyć hiperładunek do schematu klasyfikacyj¬ 
nego. 

multiplety W grupie symetrii SU(3) multipletem podstawo- 
podstawowe wym jest tryplet podobnie jak w grupie SU(2) — 
dublet. Okazuje się jednak, że w odróżnieniu od grupy 
SU(2) multiplet podstawowy istnieje w dwu odmia¬ 
nach— zwykłej, oznaczonej symbolem 3 oraz sprzę¬ 
żonej, oznaczonej przez 3. Konieczność wprowadze¬ 
nia takich dwu multipletów można uzasadnić na¬ 
stępująco. W multiplecie podstawowym symetrii 
51/(3) powinien tkwić, jako jego część, multiplet 
podstawowy izospinu, a więc dublet. Zatem podsta¬ 
wowy tryplet SU( 3) musi się składać z dubletu i sing- 
letu SU{ 2). Jednakże, należy tu jeszcze dodać hiper¬ 
ładunek lub dziwność, jako wielkość dodatkowo 
definiującą grupę SU( 3). Chcąc budować z multipletu 
podstawowego SU( 3) wyższe multiplety o różnych 
wartościach nie tylko / ale i 5, trzeba składowym 
multipletu 3 przyporządkować jakąś niezerową 
wartość dziwności. Gdyby wszystkie trzy składowe 
3 miały tę samą dziwność, równą np. S u to izospinowi 
! = 0 lub też / — l towarzyszyłab> zawsze dziwność, 
co najmniej równa 25 1? izospinowi 3/2 dziwność 
co najmniej 35 Ł itd. Tak jednak nie jest. Poza tym 
powyższe przyporządkowanie spowodowałoby, że 
pojawiłyby się tylko multiplety o dodatnim 5 (jeśli 
5t > 0) lub ujemnym 5 (w przeciwnym razie). Tym¬ 
czasem dziwności ujemne i dodatnie występują w przy¬ 
rodzie symetrycznie, gdyż jeśli cząstka ma dziwność 5, 
to jej antycząstka ma dziwność —5. Tak więc po¬ 
winno się skonstruować multiplet 3 w taki sposób, 
aby wartość 5 dla izodubletu była inna niż dla izo- 
singletu, oraz oprócz 3 należy wprowadzić tryplet 3, 
o przeciwnych wartościach dziwności. Łatwo też 
zauważyć, że wartości 5 dla izodubletu i izosingletu 
należącego do 3 powinny się różnić o I. Ostatecznie 
dokonujemy przyporządkowania tak, iż izodublet 
w 3 ma 5 = 0, a izosinglet w 3 ma 5 = - 1, nato¬ 
miast w 3 mamy izodublet o 5 = 0 i izosinglet 
o5 = +1. 

W ramach symetrii SU( 3) można podać wzory 
analogiczne do (13) i (14). Mamy mianowicie: 

3®3=l©8 (15) 

oraz 

3®3©3 = 1©8@8©10. (16) 

Z powyższych wzorów wynika, że istotnie, w ramach 
symetrii SU( 3) pojawiają się — obok wielu innych — 
także multiplety o liczebności l, 8 i 10. 

Przyporządkowanie znanych hadronów poszcze¬ 
gólnym multipletom SU( 3) na ogół nie nastręcza 
większych trudności. I tak np. znamy 8 barionów 
o J 1 ' = * + , a mianowicie neutron i proton (o 5 = 0 


czyli Y = -^1), tworzące dublet izospinu, hiperon .1 oktet bario- 
i trzy hiperony 27 o 5 = — 1 (więc Y = 0), oraz dwa nów i mezo- 
hiperony Z o 5 = —2 (więc Y =* — I, rys. 7). Po- nów 
dobnie można sklasyfikować razem — w ramach 
tego samego oktetu — osiem mezonów o J p = 0“ 

(rys. 8). Należą do niego dw'a mezony K o 5 = Y ~ 

=-•*!, trzy mezony n i jeden mezon // o 5 Y 0 




Rys. 8. Oktet mezonów J p = 0" przedstawiony w płaszczyźnie 
(' 3 , Y) 


oraz dwa mezony K o 5 — Y = — I. Okazuje się, że 
struktura wewnętrzna oktetu barionowego i mezono¬ 
wego jest identyczna, jeśli do klasyfikacji użyje się nic 
dziwności lecz hiperładunku. Ta sama struktura 
cechuje też wszystkie inne oktety symetrii SU( 3). 

W pewnych wypadkach obserwujemy więcej czą¬ 
stek niż np. osiem, o tych samych wartościach 7, P , 

B. Powstaje wtedy pytanie, jakimi kryteriami należy 
się kierować, aby we wspólnym multiplecie umieścić 
te a nie inne cząstki. Wówczas należy uciec się do 
rozważań ilościowych opartych na pewnych założe¬ 
niach dynamicznych. 

Jeśli chodzi o dekuplet 10, to zaliczamy tu cztery dekuplet 
bariony A(Y = +1), trzy bariony Y* (1385) o K— barionów 
= 0, dwa bariony Z* (1520) o Y = — i i wreszcie 
jeden barion o Y — —2 (rys. 9). Wtedy gdy sfor¬ 
mułowano hipotezę że symetria 5Ł/(3) jest symetrią 
świata hadronów, hiperon O nie był jeszcze znany 
z doświadczenia. Podobnie jednak, jak to było z tabli¬ 
cą Mendelejewa, symetria 51/(3) przewidywała dla 
tego hiperonu wolne miejsce właśnie w ramach de- 
kupletu. Późniejsze odkrycie tej cząstki było więc 
poważnym sukcesem teorii, tym bardziej, że była przewidzenie 
ona w stanie przewidzieć także, i to z bardzo dobrą hiperonu Q 
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dokładnością masę Q~ na podstawie wzoru masowego 
Gell-Manna-Okubo. 

Wiele przesłanek przemawia za tym, że w rzeczy¬ 
wistości grupa symetrii 5(7( 3) nie jest najszerszą grupą 
symetrii hadronów. Ogólniejszą mogłaby być grupa 
5(7(4) lub może nawet jeszcze w-yższa (5(7(6)). Roz¬ 
ważając grupę 5(7(4), musimy znów wprowadzić pe¬ 
wien wymiar cząstek elementarnych, a więc nową, 
analogiczną do hiperładunku liczbę kwantową; taką 
liczbą może być powab C. Zatem podstawowy multi¬ 
plet symetrii 5(7(4) byłby czeroskładnikowy, i zawie¬ 
rałby— oprócz podstawowego trypletu symetrii 5(7(3) 
—jeszcze singlet o C = 1. Prawa analogiczne do (15) 
i (16) miałyby wtedy postać: 

4©4=lel5 (17) 

oraz 

4©4®4 = 4©20 1 ©20 1 ©20 2 . (18) 

I w tym wypadku trzeba wprowadzić oprócz 4 multi¬ 
plet sprzężony 4, w którym dodatkowy izosinglet 
ma C = — 1. Zauważmy przy tym, że w prawie 
wyrażonym wzorem (18) występują dwa różne multi¬ 
plety dwudziestowymiarowe, odróżnione od siebie 
dolnym wskaźnikiem 1 i 2. Multiplety te mają całko¬ 
wicie odmienną strukturę. W 20i jest zawarty oktet 
symetrii 5(7(3) o C = 0, a poza tym sekstet 5(7(3) 



<§) stany obsadzone przez 2 cząstki 

Rys. 10. Multiplet 20* symetrii 5C'(4) przedstawiony w przestrzeni 
zmiennych (/ 3 . V, C). Multiplet ten obejmuje oktet barionów, 
położony w płaszczyźnie C -=■ 0, oraz jeden sekstet o C - — 1, 
jeden tryplet o C -» 1 i wreszcie jeden tryplet oC«2. Niektóre 
cząstki należące do multipletów C ^ 6 zostały już z zupełną 
pewnością zidentyfikowane w doświadczeniu. Wszystkie bariony 
należące do tego multipletu miałyby J p — 
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Rys. 11. Multiplet 20 ; symetrii 5^(4) obejmujący bariony o 
J p =* 2 + . W multiplecie tym w płaszczyźnie C — 0 znajduje się 
dekuplet 10 symetrii ££7(3). Inne cząstki należące do 20 2 nie 
zostały jeszcze wykryte 



Rys. 12. Multiplet 15 symetrii S6(4). Ma on tę samą budowę nie¬ 
zależnie od w-artości J p . Dla mezonów’ o J p = I w płaszczyźnie 
C =* 0 znajdowałyby się następujące cząstki:/? - , /A /A <p t w, J'tp 
K*\ K*+. K *°. K *“ 


o C = -ł-1, i dwa tryplety odpowiednio o C = tl 
i C = +2 (rys. 10). Natomiast w 20 2 mieści się de¬ 
kuplet 5(7(3) o C = 0, a poza tym sekstet 5(7(3) 
oC = -fl, tryplet 5(7(3) o C = +2 i wreszcie singlet 
5(7(3) o C — -r3 (rys. 11). Struktura multipletu 15 
obejmującego mezony (podczas gdy 20 1 i 20 2 obejmo¬ 
wałyby bariony) jest przedstawiona na rys. 12. 
Multiplet ten zawierałby oprócz oktetu symetrii 
5(7(3) o C = 0 także dwa tryplety odpowiednio 
o C = -fl i C = -1 oraz dodatkową cząstkę nie- 
powabną, singlet o C = 0, Gromadzenie bezpośred¬ 
nich dowodów doświadczalnych występowania sy¬ 
metrii 5(7(4) rozpoczęło się w gruncie rzeczy od 
wykrycia mezonu 7/y?, który interpretuje się jako czą¬ 
stkę związaną z tym właśnie dodatkowym singletem 
niepowabnym symetrii 5(7(4). 

W poprzednich punktach wspominaliśmy o tym, że 
różnice mas wiążące się z poszczególnymi oddziały¬ 
waniami powiększają się wraz ze wzrostem siły od¬ 
działywania. Schemat ten można by rozbudowy wać po 
przejściu do symetrii 5(7(4). Istotnie, różnice mas 
mogą być jeszcze większe. Na przykład cząstka J y>, 
która byłaby analogiem cząstki lecz należałaby do 
innego multipletu symetrii 5(7(3), pozostając w tym 
samym multiplecie symetrii 5(7(4) różniłaby się od 
niej masą aż o ok. 2 GeV/c 2 . 

Podsumowując te rozważania, można obecnie 
lepiej uzasadnić pogląd, że im większe jest natężenie 
oddziaływania, tym większa też jest jego symetria. 
Mogliśmy tę zastanawiającą regularność śledzić 
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poczynając od oddziaływań podsłabych do oddziały¬ 
wań bardzo silnych. 


Kwarki 

Jest rzeczą zastanawiającą, że znane z doświadczenia 
cząstki wypełniają tak niewiele różnych multipletów 
symetrii 5(7(3): mezony tylko 1. i 8, a bariony tylko 
1, 8 i 10. Nie są zatem wykorzystane przez przyrodę 
(przynajmniej w obrębie cząstek niepowabnych) 
inne liczne możliwości, włączając tu, co jest może 
szczególnie dziwne, także multiplet podstawowy 
SU( 3), a mianowicie triplety 3 i 3. Z wzorów (15) 
i (16) wynika, że te i tylko te multiplety, które są 
obsadzone w naturze można zbudować w wypadku 
mezonów z multipletów 3 i 3, a w wypadku barionów 
z trzech trypletów 3. Załóżmy więc, że multiplet 3 
jest obsadzony przez hipotetyczne cząstki o spinie 1 f 2 
zwane kwarkami (3 obsadzałyby więc anty kwarki). 
B dla kwarków wynosiłoby 7a- Wówczas, trzy kwarki 
miałyby łącznie B = 1, a kwark i antykwark — B = 
= 0, przy czym układy trzykwarkowe miałyby spin 
połówkowy, a dwukwarkowe — całkowity. 

Założenie to wywołuje dalsze nieoczekiwane kon¬ 
sekwencje. Po pierwsze, dostajemy wówczas także 
ułamkowe wartości dla hiperładunku i ładunku elek¬ 
trycznego kwarków. I tak np. dla dubletu kwarków 
o / = V 2 (oraz 5 = 0) mamy Y = 7a> natomiast dla 
singletu 7 = 0 (i 5 = — 1)— Y = — 2 /a- Po drugie, 
ze wzoru Gell-Manna-Nishijimy wynika zaś, że ła¬ 
dunki kwarków są wielokrotnościami nie ładunku ele¬ 
mentarnego e , lecz e/3 (patrz tabela poniżej, rys. 13). 



Rys. 13. Multiplet podstawowy symetrii 51/(3) — trypletu kwar¬ 
ków, przedstawionego w płaszczyźnie (7 łp K) 
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tory nie mogłyby ich wyprodukować. Po drugie, kwar¬ 
ki mogłyby być cząstkami stosunkowo lekkimi, ale 
nie oddziałującymi dostatecznie silnie (wówczas 
byłyby one wytwarzane rzadko i szansa ich zaobser¬ 
wowania byłaby odpowiednio mniejsza). Po trzecie, 
być może kwarki w ogóle nie istnieją. Po czwarte 
vyreszcie, być może kwarki mogą istnieć wyłącznie 
w stanie związanym, a więc wewnątrz hadronów. 

Żadna z wymienionych hipotez nie może być w tej 
chwili odrzucona. Jednakże druga z nich przedstawia 
się dziwacznie: oto cząstki zbudowane z kwarków 
mogłyby oddziaływać silniej niż ich składniki. Także 
i pierwsza hipoteza nie jest najlepsza. Bardzo ciężki 
kwark wiążąc się w stosunkowo lekki barion musiałby 
tracić ogromną część swej masy na wiązanie. Tak 
duża energia wiązania wskazywałaby na ogromną 
siłę oddziaływań wiążących kwarki. Kwarki takie 
musiałyby mieć same bardzo skomplikowaną struk¬ 
turę chmury, co trochę nie jest zgodne z przedsta¬ 
wianiem ich jako obiektów elementarnych. W każdym 
razie wtedy teoria kwarka musiałaby być może nawet 
bardziej skomplikowana niż teoria hadronu. Poza 
tym taka chmura dawałaby zapewne bardzo duży 
wkład do momentu magnetycznego kwarka (-► Od¬ 
działywania elektromagnetyczne), i to momentu 
anomalnego, polowego. Ten wniosek jest, jak się 
wydaje, niezgodny z prostym modelem, z którego 
można obliczyć momenty magnetyczne nukleonów, 
zakładając pewien efektywny moment magnetyczny 
kwarków. Trzecia koncepcja także nie znalazłaby 
obecnie zbyt wielu zwolenników, gdyż wiele prostych, 
nawet jakościowych przewidywań modelu kwarko¬ 
wego jest zdumiewająco zgodnych z faktami doświad¬ 
czalnymi. 

Pozostaje więc hipoteza czwarta, kwarków uwięzio¬ 
nych wewnątrz hadronu. Jaka miałaby być jednak 
przyczyna tego uwięzienia, nie jest łatwo ustalić, to¬ 
też sformułowanie konsekwentnej teorii opartej na 
tej hipotezie jest dalekie od zakończenia. 

Przejście do modelu opartego na symetrii 5(7(4) 
wymaga powiększenia liczby kwarków do czterech. 
Czwarty kwark byłby kwarkiem powabnym, o C = 
= -f 1 (tabela obok i rys. 14). Przejście do jeszcze wyż¬ 
szych symetrii pociąga za sobą dalsze rozszerzenie 
liczby kwarków. 



Rys. 14. Multiplet podstawowy symetrii 5(7(4) — kwartetu 
kwarków przedstawionego w przestrzeni zmiennych (/j, K, C) 


Fakt ten rokuje nadądeje na możliwość wykrycia 
kwarków swobodnych, gdyż, zgodnie z prawem za¬ 
chowania ładunku, cząstki o ładunku ułamkowym nie 
mogą się rozpadać na cząstki o ładunkach wyłącznie 
całkowitych. Tak więc co najmniej jeden kwark po- 
wiiien być cząstką trwałą, stosunkowo łatwą do wy¬ 
krycia. Jednakże dotychczasowe poszukiwania nie 
dały żadnego wyniku. Brak danych potwierdzających 
istnienie kwarków swobodnych można wyjaśniać 
jedną z czterech możliwych hipotez. 

Po pierwsze, kwarki mogą być cząstkami bardzo 
ciężkimi (obecnie dolna granica eksperymentalna 
byłaby dla cząstek silnie oddziałujących rzędu 10 
GeV/c 2 ). Gdyby tak było używane obecnie akcelera¬ 


Patrząc na rozmaite możliwe podklasy oddziały¬ 
wań silnych z punktu widzenia modelu kwarkowego, 
dostrzegamy inną możliwość wyjaśnienia łamania sy¬ 
metrii 5(7(3) a także 5(7(4). Można bowiem przyjąć, 
że oddziaływania kwarków są w pełni zgodne z zasa¬ 
dami symetrii 5(7(3) czy też 5C/(4), ale że kwarki 
te mają różne masy niepolowe. Kwark dziwny byłby 
wówczas cięższy od kwarków niedziwnych o ok. 200- 
300 MeV/c 2 , kwark powabny od kwarków niepo¬ 
wabnych o ok. 1-2 GeV/c 2 . 

Gdyby hipoteza kwarków uwięzionych okazała się 
poprawna, pytanie, która z wyżej wymienionych kon¬ 
cepcji łamania wyższych symetrii jest słuszna, miałoby 
charakter w znacznym stopniu akademicki. Nie ma- 


hipoteza 

kwarków 

uwięzionych 


kwartet 

kwarków 
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jąc do dyspozycji kwarków swobodnych, nie mogli¬ 
byśmy z sensem mówić o ich masie, a tylko o ich 
masie efektywnej wewnątrz hadronu. 

Jednym ze sprawdzianów ogólnej poprawności 
obrazu kwarkowego jest zagadnienie istnienia cząstek 
egzotycznych. Mianem tym określa się ogólnie takie 
cząstki, które by były składnikami innych multiple- 
cząstki tów symetrii 5(7(3) poza singletem i oktetem dla 
egzotyczne mezonów oraz singletem, oktetem i dekupletem dla 
barionów. Przykładami cząstek egzotycznych byłyby: 
a) mezon niedziwny podwójnie naładowany o / = 2 
lub więcej; b) mezon dziwny o 7 = 7 2 ; c) barion 
o 5 = 4-1. Żadna jednak z tych cząstek (ani innych 
cząstek egzotycznych) nie została wykryta. Gdyby 
to w przyszłości nastąpiło, to nie musielibyśmy re¬ 
zygnować z modelu kwarkowego, a tylko rozszerzyć 
schemat budowy hadronów z kwarków. Oprócz 
układów kwark-antykwark lub też trzy kwarki na¬ 
leżałoby dopuścić np. układy dwa kwarki i dwa anty- 
kwarki czy też cztery kwarki i jeden antykwark. 
Wobec tego niewystępowanie w przyrodzie cząstek 
egzotycznych przemawia nie tylko za modelem 
kwarkowym, ale także dodatkowo za pewnym kon¬ 
kretnym schematem budowy hadronów z kwarków. 

Sytuacja jednak nie może być tak prosta, jakby 
to wynikało z poprzednich uwag. I rzeczywiście, 
między kwarkami muszą przecież działać jakieś siły, 
skoro łączą się one w układy o takim stopniu trwałości 
jak hadrony. Musi to więc być jakieś nowe pole odpo¬ 
wiadające tym siłom oraz cząstki, które by mogły być 
wymieniane między kwarkami. Takie hipotetyczne 
gluony obiekty nazywa się gluonami. Byłyby to cząstki 
o b~Q = C = S — I—L — 0 oraz J p = 1". 
Ta ostatnia własność gluonów wynikałaby z założe¬ 
nia, iż fundamentalną rolę w przenoszeniu oddziały¬ 
wań odgrywają właśnie cząstki fotonopodobne. 
(Również bozon, czy też bozony przenoszące oddzia¬ 
ływania słabe miałyby J p — 1"). Posuwając się o krok 
dalej należałoby powiedzieć, iż skoro istnieją gluony, 
zdolne do oddziaływań z kwarkami, to niewątpliwie 
wewnątrz hadronu zachodzą też procesy wirtualna 
kreacji par kwark-antykwark z gluonów. Hadron 
byłby więc bardzo skomplikowaną strukturą, w któ¬ 
rej występowałyby: a) zespół kwarków i antykwarków 
decydujący o własnościach hadronu z punktu widze¬ 
nia symetrii 517(3), a więc o jego zdolności do wcho¬ 
dzenia w oddziaływania silne (te kwarki nazywamy 
często walencyjnymi); b) gluony; c) wiele („morze”) 
par kwark-antykwark w takich samych stanach jak 
gluony, a więc oC = 5= (? = 7 = 0, Oczywiście pary 
te, będąc singletami 5(7(3), nie naruszałyby przypo¬ 
rządkowania danego hadronu do określonego multi¬ 
pletu tej symetrii. 

Przedstawienie hadronów jako układów zbudowa¬ 
nych z kwarków walencyjnych, gluonów oraz par 
kwark-antykwark należących do „morza”, jest 
w ogólnych zarysach potwierdzone przez dane 
doświadczalne dotyczące zderzeń głęboko nieela¬ 
stycznych leptonów z hadronami. 


Kolor jako nowa liczba kwantowa 

Do rozwiązania pozostał jeszcze niezmiernie skompli¬ 
kowany problem dynamiczny: jak kwarki wiążą się 
w hadronie i czy rzeczywiście powinny one być w nim 
całkowicie uwięzione. Pochodzenie sił działających 
między kwarkami jesttrudnedorozszyfrowania. Jedną 
z trudności stanowi konieczność zrozumienia, dlacze¬ 
go układy dwukwarkowe są wiązane słabo (jeśli już 
w ogóle), natomiast układy trzykw'arkowe — mocno, 
tak że tworzą bariony. Siły kw>ark-kwark nie są więc 
z jakichś powodów wystarczająco silne w układach 
dwukwarkowych. Czy są to wobec tego siły głównie 
trzyciałow'e? Jak fakt ten uwzględnić w dynamicznej 
teorii kwarków? 

Dodatkową komplikacją są niezwykłe własności 
symetrii funkcji falowej w' związanych układach trzy- 


kwarkowych. Wszystkie cząstki o spinie połówkowym, trudności 
a więc i kw-arki powinny spełniać zasady statystyki dynamicznej 
Fermiego-Diraca. Funkcja falowa układu fermionów teorii kwar* 
powłnna być całkowicie antysymetryczna względem ków 
zamiany dwu fermionów należących do tego układu. 

Na te własności symetrii funkcji falowej składają 
się w wypadku kwarków związanych w barionie 
własności symetrii: — względem przestawienia liczb 
kwantowych odpowiadających symetrii 5(7(3), — 
względem przestawienia zmiennych spinowych oraz — 
względem zamiany położeń. Z punktu widzenia dy¬ 
namicznej struktury oddziaływań kwark-kwark inte¬ 
resujący jest przede wszystkim ten ostatni czynnik 
w funkcji falowej. Pewne informacje na ten temat 
można uzyskać w następujący sposób. Załóżmy, że 
wszystkie hadrony zbudowane z kwarków niepo- 
wabnych tworzą multiplety symetrii 5(7(6), na którą 
składają się symetria 5(7(3) oraz symetria 5(7(2) 
zwykłego spinu. Podstawowy multiplet tej symetrii 
5(7(6) — zgodnie z ogólnymi regułami — będzie 
mieć 6 składowych, przy czym jako jedną składową 
traktuje się jeden kwark znajdujący się w określonym 
stanie spinowym. Ponieważ spin kwarku z założenia 
wynosi przeto każdy kwark może występować 
w dwu stanach spinowych J z = +72 oraz J z = l / 2 . 

Okazuje się, że: 

6®6=l©35, (19) 

60 6 0 6 = 20©56©70©70. (20) 

Tak więc wszystkie stany mezonowe powinny nale¬ 
żeć do multipletów 1 i 35 symetrii 5(7(6), a wszystkie 
stany barionowe do jednej lub więcej rodziny spo¬ 
śród 20, 56 i 70. Na multiplet 35 składa się oktet 
5(7(3) o spinie 0 (8 stanów), plus singlet 5(7(3) o spi¬ 
nie 1 (3 stany, bo spin 1 ma trzy możliwe ustawienia), 
i wreszcie oktet 5(7(3) też o spinie 1, a więc łącznie 
24 stany. Spośród multipletów barionowych na 
szczególną uwagę zasługuje multiplet 56, mieszczący 
w sobie oktet 5(7(3) o spinie 72 (16 stanów) i dekuplet 
5(7(3) o spinie 72 (40 stanów). Jest rzeczą naturalną 
zaliczenie do tego multipletu symetrii 5(7(6) znanego 
dekupletu barionowego zawierającego m.in. bariony 
A oraz oktetu barionowego zawierającego m.in. 
nukleony. 

Można jednak sprawdzić, że multiplet symetrii 
5(7(6) o wymiarze 56 jest opisywany funkcją falową 
całkowicie symetryczną względem przestawień stopni 
swobody kwarków odpowiadających grupie 5(7(3) 
i grupie 5(7(2) zwykłego spinu. Tym samym funkcja 
falowa zarówno nukleonów jak i barionów z dekup¬ 
letu musi mieć część przestrzenną antysymetryczną 
względem przestawień położeń kwarków. Z drugiej 
jednak strony jest to stan o najniższej energii układu 
trzech kwarków (nie ma lżejszych barionów), a więc 
stan zwany stanem podstawowym. Największa trud¬ 
ność polega na tym, że nikomu nie udało się skon¬ 
struować takiego potencjału oddziaływania, który by 
dawał antysymetryczną funkcję falową (przestrzenną) 
w stanie podstawowym. 

Tę trudność dynamicznej teorii kwarków można 
ominąć, zakładając, że mają one jeszcze jeden sto¬ 
pień swobody, który należy włączyć do rozważań 
nad symetrią układów trójkwarkowych. Ten dodat¬ 
kowy stopień swobody nazywa się kolorem. Zgodnie 
z tą hipotezą kwarki mogłyby istnieć w trzech kolo¬ 
rach, których zespół tworzyłby multiplet podsta- grupa koloru 
wowy nowej grupy 5(/(3), zwanej grupą koloru, 
niezależnej od poprzednio wprowadzonej grupy 
5 (7(3) izospinowo-hiperładunkowej. 

Najczęściej zakłada się, że wszystkie cząstki obser¬ 
wowane w przyrodzie są singletami symetrii 5(7(3) 
koloru, a więc, są cząstkami białymi. Zagadnienie 
istnienia hadronów kolorowych i możliwości wykry¬ 
cia ich doświadczalnie w przyszłości jest otwarte, choć 
obecnie przeważa pogląd, że kolor jest liczbą kwan¬ 
tową wewnątrzhadronową, która na zewnątrz nie 
może się ujawnić. Natomiast koncepcja koloru jest 
właściwym rozwiązaniem zagadnienia budowy bario- 
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nów białych: singlet «S£/(3) jest bowiem opisywany 
funkcją falową całkowicie antysymetryczną. Antysy- 
metria funkcji falowej układu trzech kwarków byłaby 
więc przesunięta z części przestrzennej na część kolo¬ 
rową tej funkcji. Hipoteza koloru znajduje także 
pośrednie potwierdzenie w danych doświadczalnych 
dotyczących anihilacji par elektron-pozyton w obsza¬ 
rze bardzo wysokich energii. Wprowadzenie grupy 
SU( 3) koloru jako symetrii (ścisłej!) świata hadronów 
jest dodatkowym elementem świadczącym o wysokiej 
symetrii oddziaływań silnych. 

Często uogólnia się pojęcie koloru, tworząc kolor 
czwarty, leptonowy. W takiej koncepcji podstawowe 
dwie grupy symetrii cząstek elementarnych byłyby 
grupą SU(4) (grupą koloru — trzy kolory kwarkowe 
i jeden leptonowy) oraz grupą izospinowo-hiper-ła- 
dunkowo-powabną SU(ń) (n = 6?). W tym jednoli¬ 
tym obrazie świat byłby zbudowany z 16 fermionów 
(4 leptonów oraz 4 kwarków w trzech odmianach ko¬ 
loru każdy) oraz z kilku cząstek o J p — l~ (byłyby to 
fotony, gluony oraz bozony przenoszące oddziaływa¬ 
nia słabe), składających się na dynamikę układów 
fermionów. 

Wspominaliśmy już o próbach dodania do 4 kwar¬ 
ków jeszcze dwu dalszych kwarków, cięższych nawet 
od kwarka powabnego. Wówczas musielibyśmy ocze¬ 
kiwać wykrycia nowych cząstek o niezwykłych własno¬ 
ściach. Na ślad jednej z nich (odpowiednika cząstki 
J/y )) udało się już natrafić. Jest to bardzo ciężki me¬ 
zon o masie ponad 9,4G eV/c 2 , niedawno zaobser¬ 
wowany. Niezależnie od tych sugestii rozszerzyła się 
lista leptonów do 6 przez dodanie do czterech znanych 
leptonów jeszcze dwu leptonów, jednego o masie 1782 
GeV/c 2 (lepton t) i drugiego o masie bardzo małej 
(neutrino taonowe). Nie jest więc wykluczone, że na¬ 


leży konstruować świat z 24 rozmaitych fermionów, 
a mianowicie 6 leptonów i 6 kwarków, z których każdy 
występowałby w trzech stanach koloru. 

Jak wynika z powyższych danych, fizyka cząstek 
elementarnych znajduje się wciąż na etapie wstępnym, 
mimo ogromnych osiągnięć. Podstawową jej wadą 
jest brak aparatu teoretycznego, który by umożliwiał 
wykonanie obliczeń, sprawdzających w jednoznaczny 
sposób konkretne hipotezy budowy cząstek i ich 
oddziaływań. Istnieje oczywiście wiele rozmaitych 
metod rachunkowych opierających się na mniej czy 
bardziej wiarygodnych założeniach. Często mają 
one zastosowanie do jednego tylko rodzaju oddziały¬ 
wań, a nawet do jeszcze węższego kręgu zjawisk. 

Mimo tego braku, z istniejących danych doświad¬ 
czalnych oraz koncepcji teoretycznych wyłania się 
coraz lepiej uporządkowany obraz świata cząstek 
elementarnych, zawierających więcej czynników uni¬ 
fikacyjnych. Niewątpliwie największym osiągnięciem 
w tej dziedzinie jest sformułowanie teorii ujmującej 
wspólnie oddziaływania słabe i elektromagnetyczne. 
To postępujące porządkowanie koncepcji dotyczą¬ 
cych cząstek elementarnych jest nierozerwalnie zwią¬ 
zane z hipotezą kwarków. Jest ona, niezależnie od 
wciąż jeszcze ogromnych trudności pojęciowych 
i matematycznych, niewątpliwie jednym z najważniej¬ 
szych składników obecnego obrazu cząstek elementar¬ 
nych i ich oddziaływań. Na razie trudno sobie wy¬ 
obrazić, aby przyszła teoria cząstek elementarnych 
mogła się obejść bez pojęcia kwarku. 

G. Białkowski, R. Sosnowski Cząstki elementarne, Warsza¬ 
wa 1971; B.H. Bransden, D. Evans, J.V. Major Cząstki etc- 
mentarne, Warszawa 1981; J.J.J.Kokkedee The Quark Model, 
New York 1969 (ros. Moskwa 1971); Mezony, grawitacja, anty¬ 
materia, Warszawa. 1962; J. Nowożyłow Cząstki elementarne. 
Warszawa 1961. 


Struktura cząstek elementarnych 

Michał Święcki 


Mówiąc o strukturze badanego ciała, mamy zwykle 
na myśli jego skład. Wiemy np., że kawałek żelaza 
składa się z atomów, które z kolei składają się z elek¬ 
tronów i jąder atomowych. Te ostatnie są róymież 
obdarzone strukturą — składają się z protonów i neu¬ 
tronów. Wydaje się, że moglibyśmy rozkładanie 
struktur na ich składniki kontynuować bez istotnych 
zmian natury metodologicznej. Jednak gdy przecho¬ 
dzimy do obiektów niesłychanie małych, jakimi są 
cząstki elementarne (-> Cząstki elementarne i ich 
oddziaływania), ta wydawałoby się naturalna metoda 
postępowania przestaje być prosta i łatwa. Jest tak 
dlatego, że dla obiektów o rozmiarach rzędu np. 10~ 15 
m i charakterystycznych czasach trwania oddziały¬ 
wań rzędu np. 10~ 24 s intuicyjny opis klasyczny 
zupełnie zawodzi. Obserwowane w doświadczeniach 
zachowanie się cząstek elementarnych ma, jak się 
okazuje, charakter czysto statystyczny. Statystyczna 
jest też teoria, za pomocą której z ogromnym po¬ 
wodzeniem opisujemy wyniki tych doświadczeń. 
Teorią, którą mamy na myśli jest oczywiście mecha¬ 
nika kwantowa a właściwie kwantowa teoria pola 
(—► Teoria pola, Oddziaływania elektromagnetyczne). 


Statystyczny charakter struktury cząstek 

Wróćmy do kawałka żelaza. Podgrzany do odpowied¬ 
niej temperatury zaczyna świecić, czyli promieniować 
świetlne fale elektromagnetyczne. Emisja, a także 
absorpcja światła odbywa się zawsze porcjami, 
które zwiemy fotonami. Tak więc rozżarzony (i nie 
tylko) kawałek żelaza promieniuje fotony. Można 
by się więc zapytać, z ilu fotonów składa się ten 
kawałek. Jest rzeczą oczywistą, że nie potrafimy podać 


żadnego rozsądnego sposobu pomiaru tej liczby. 
Możemy ją określić jedynie statystycznie, szacując 
np. średnią liczbę fotonów na jednostkę czasu. Zu¬ 
pełnie podobnie jest w wypadku struktury protonów, 
neutronów i innych cząstek. Skład ich możemy okreś¬ 
lić jedynie statystycznie, podając prawdopodobień¬ 
stwo (na jednostkę czasu) wystąpienia pewnej struk¬ 
tury. Dlaczego więc mówiąc o jądrze atomowym 
mamy prawo twierdzić z całym przekonaniem, że 
składa się ono z określonej liczby protonów i neutro¬ 
nów, skoro struktury samych nukleonów nie możemy 
poznać jednoznacznie? 

Popatrzmy na te zagadnienia nieco bardziej for¬ 
malnie. Podstawowymi regułami obowiązującymi 
w fizyce są tzw. zasady nieokreśloności, które okre¬ 
ślają warunki, przy których zjawisko fizyczne ma 
przebieg klasyczny, a także warunki, w których istotne 
stają się cechy statystyczne, kwantowe. Jedną z owych 
zasad jest zasada nieokreśloności czasu i energii: 

AE-At > V A 

która wiąże minimalny czas Al , po jakim można 
przy użyciu dowolnych metod zaobserwować zmianę 
stanu badanego obiektu z nieokreślonością AE jego 
energii (a więc i masy, bo E = mc 2 ). Stała Plancka h 
jest bardzo mała {h = hj2n = 1,05 T0“ 34 J • s) i dla 
obiektów makroskopowych iloczyn AE'At wielo¬ 
krotnie ją przewyższa (np. 10 30 razy), co prowadzi 
do klasycznego, jednoznacznego ich zachowania się. 
Dla cząstek elementarnych natomiast iloczyn ten 
niewiele różni się od h i powyższa zasada mocno 
ogranicza własności tych cząstek. Gdybyśmy np. 
obserwowali atomy żelaza w przedziałach czasu 
rzędu 10" 10 s, to tak dokładnymi pomiarami wywo¬ 
łalibyśmy nieokreśloność ich energii rzędu 10 eV. 


hipoteza: 

6 leptonów 
i 6x3 
kwarków 


zasada nie¬ 
określoności 
czasu 
i energii 


7 - Encyklopedia fizyki współczesnej 
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Doprowadziłoby to do niekontrolowanej emisji 
fotonów o takiej właśnie energii, a więc o długościach 
fal rzędu charakterystycznego dla fal świetlnych 
(gdyż E = hv = hcjX). Pomiary przeprowadzane z 
mniejszą dokładnością nic by nie dały, gdyż już czas 
10 -10 s wielokrotnie przewyższa typowy czas emisji 
fotonu. Dlatego właśnie skład fotonowy kawałka 
żelaza możemy określić jedynie statystycznie. Przy 
opisie struktury kawałka żelaza nie jest to jednak 
ważne, gdyż wkład fotonów do energii (masy) żelaza 
jest zupełnie nieistotny. Przy opisie struktury nukleo¬ 
nów zagadnienia podobnego typu stają się znacznie 
bardziej istotne, gdyż masy składników nukleonów 
mogą być rzędu masy samych nukleonów. Nukleo- 
nowa struktura jąder atomowych jest z kolei równie 
prosta (?), jak struktura atomowa kawałka żelaza. 
Nukleony bowiem mają wewnątrz jąder masy rzędu 
1 GeV (ubytek ich masy na koszt energii wiązania 
jest niewielki i wynosi ok. 8 MeV) i dopiero pomiary 
przeprowadzane z niewiarygodną dokładnością 10~ 24 
s mogłyby doprowadzić do wykrycia w jądrze dodat¬ 
kowych par nukleonów, czy też innych hadronów 
(masa najlżejszych z nich — mezonów n — wynosi 
nhz & 140 MeV). Wykonując pomiary z mniejszą 
dokładnością będziemy zawsze obserwować typowy 
nukleonowy skład jąder. Nie jest to przypadek 
odosobniony. Okazuje się, że dla każdej cząstki ele¬ 
mentarnej można określić takie warunki doświad¬ 
czalne, przy których skład cząstki staje się prawie jed¬ 
noznaczny. Dzięki temu możemy w ogóle mówić o ja¬ 
kimkolwiek ich składzie. 


Kwantowopolowy opis własności cząstek 



czas 

Rys. 1. Rozprasza¬ 
nie elektronu na 
elektronie zachodzi 
przez wymianę fo¬ 
tonu wirtualnego 


cząstki 

punktowe 


Przejdźmy do zagadnienia struktury cząstek. Jak już 
mówiliśmy, zgodnie z zasadą nieokreśloności w do¬ 
statecznie krótkim przedziale czasu nieokreśloność 
energii (masy) każdego obiektu fizycznego, a więc 
i cząsiki, jest tak duża, że może nastąpić niekontro¬ 
lowana emisja innych cząstek (nie tylko fotonów). 
Taki krótkotrwały proces wysyłania cząstek przez 
inne cząstki jest podstawą występowania wszelkich 
rodzajów oddziaływań w przyrodzie. Na rys. 1 przed¬ 
stawiliśmy proces, w którym elektron wysłał foton 
(tzw. foton wirtualny), pochłonięty następnie po 
krótkiej chwili przez inny elektron. W wyniku tej wy¬ 
miany fotonu nastąpiło przekazanie energii oraz pędu 
od jednego elektronu do drugiego, czyli ich oddziały¬ 
wanie (rozpraszanie). Szczegółowa teoria tego ro¬ 
dzaju oddziaływań została opisana w artykule „Od¬ 
działywania elektromagnetyczne’’. Tam też znajduje 
się opis idei trudnych a zarazem pięknych doświad¬ 
czeń, które umożliwiły poznanie struktury cząstek. 
Doświadczalne zbadanie owej struktury nie było bo¬ 
wiem wcale trywialne. Nie będziemy tu powtarzać 
wszystkich argumentów doświadczalnych dotyczą¬ 
cych składu cząstek elementarnych. Przedstawimy je¬ 
dynie współczesny stan wiedzy na ten temat. Niestety 
nie jest to jeszcze wiedza kompletna. Mirno to w ciągu 
ostatnich lat zrobiono ogromny krok w kierunku peł¬ 
nego zrozumienia świata cząstek. Wystarczy powie¬ 
dzieć, że przed 1969 rokiem artykuł ten nie mógłby 
zawierać niemal żadnych informacji na temat struk¬ 
tury hadronów. 

Podstawą opisu oddziaływań cząstek elementarnych 
jest kwantowa teoria pola, której najlepiej zbadaną 
częścią jest elektrodynamika kwantowa (—► Teoria 
pola). Jest to teoria lokalna, co znaczy, że np. proces 
emisji (lub absorpcji) fotonu z elektronu zachodzi 
lokalnie, w jednym miejscu i jednej chwili, choć za¬ 
równo owo miejsce, jak i chwila są nieokreślone 
statystycznie. W związku z tym podstawą badań 
fizyki cząstek elementarnych są cząstki bez struktury, 
punktowe. Takie cząstki mogą bowiem punktowo 
wysyłać inne, również punktowe cząstki. Przy¬ 
miotnik „punktowy” należy tu rozumieć umownie. 
Żadnej cząstki nie można dostatecznie dobrze zloka¬ 


lizować doświadczalnie, gdyż zgodnie z zasadą zasada nie 
nieokreśloności pędu i położenia, określonośc 

Ap-Ax > P« du 

i położenia 

doprowadziłoby to do nadania jej dużego pędu, a więc 
i energii, co w konsekwencji wywołałoby emisję innych 
cząstek. Dokładnie zlokalizowana cząstka nie może 
być cząstką pojedynczą. Zwróćmy przy okazji uwagę 
na fakt, że daleko nam do osiągnięcia dokładności 
10~ 15 m (rozmiary nukleonów). Wracając do struk¬ 
tury cząstek elementarnych — próbujemy opisywać 
ją poprzez składniki nie mające już żadnej struktury. 

Na szczęście okazuje się, że opis taki jest możliwy. 


Struktura leptonów 


Najprostszym obiektem badań są leptony ( e , /^, v e , vv, 
t) nie podlegające oddziaływaniom silnym. Najsilniej¬ 
szymi są dla nich oddziaływania elektromagnetyczne, 
które charakteryzują się stałą sprzężenia c^i x Vis 7 - 
Znaczy to, że prawdopodobieństwo emisji fotonu 
z elektronu bądź mionu (neutrina są pozbawione ła¬ 
dunku elektrycznego) jest proporcjonalne właśnie do 
a e i (rys. 2). Wysłany foton musi po krótkim czasie 
być pochłonięty, np. przez ten sam elektron (rys. 3), 
a prawdopodobieństwo tego jest rzędu ~ ( l /i3 ? ) 2 . 
Wysłany foton może też wytworzyć parę elektron-po¬ 
zyton, która następnie, wciąż bardzo szybko, zamieni 
się z powrotem w foton. Prawdopodobieństwo każde- 



Rys. 2. Prawdojj 
dobieristwo zaji 
procesu emisji 
nu jest rzędu w 
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Rys. 3. Prawdopodo¬ 
bieństwo pochłonięcia 
fotonu przez ten sam ele¬ 
ktron jest rzędu 



czas 




Rys. 4. Prawdopodo¬ 
bieństwo zajścia takiego 
procesu jest rzędu 



go z tych procesów jest znów rzędu a c i. Prawdopodo¬ 
bieństwo, że elektron na krótką chwilę przejdzie w 
elektron oraz parę elektron-pozyton, jest więc rzędu 
aj* ^ O/137) 4 (rys. 4). To już bardzo mało. Możemy 
więc powiedzieć, że fizyczny elektron składa się z 
prawdopodobieństwem (na jednostkę czasu) bliskim 
jedności z jednego elektronu bez struktury, z prawdo¬ 
podobieństwem rzędu O/137) 2 z pozbawionych struk¬ 
tury elektronu i fotonu oraz z prawdopodobieństwem 
rzędu (Vi 37 ) 4 z elektronu i pary elektron-pozyton itd. 
(rys. 5). Elektron i wszystkie inne leptony są zatem 
niemal pozbawione struktury. Jest to wywołane małą 


elektron 

_ 


e 



7 


Rys. 5. Różny skład elektronu fizycznego ma różne prawdopo¬ 
dobieństwo na jednostkę czasu 


e 


e 




wartością elektromagnetycznej stałej sprzężenia, a e i. 
Oddziaływania słabe leptonów, jako jeszcze słabsze, 
nie zmieniają tego obrazu. Neutrina więc (jak i foto¬ 
ny) też są bez struktury. 


Kwarkowa struktura hadronów 

W przypadku leptonów sytuacja była prosta, kom¬ 
plikuje się jednak, gdy przechodzimy do opisu hadro¬ 
nów. Cząstki te podlegają oddziaływaniom silnym, 
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których stała sprzężenia nie jest mała. Dlatego poś¬ 
więcono wiele lat na zbadanie struktury hadronów. 
W wyniku tych badań prawdziwy obraz rysuje się 
dosyć jasno. 

Podstawą struktury wszystkich hadronów są pozba¬ 
wione już struktury kwarki. Wprawdzie nikomu nie 
udało się wybić kwarku ze struktury hadronu, ale nie¬ 
wielu jest fizyków, którzy nie wierzyliby w kwarkową 
naturę oddziaływań silnych. Kwarki tkwią więc wew¬ 
nątrz hadronów jak głaz w studni i trzeba ogromnej 
(prawdopodobnie nieskończonej) energii, żeby je 
stamtąd wydobyć. Podstawowym mankamentem te¬ 
orii kwarków jest niekompletne poznanie natury 
owych ogromnych sił, które nie pozwalają kwarkom 
na wydostanie się z wnętrza hadronów. Dlatego na¬ 
leży być może traktować tę teorię z pewną rezerwą. 
Mimo to teoria kwarków wyjaśnia tyle faktów i jest 
potwierdzona przez tyle niezależnych od siebie do¬ 
świadczeń, że rezerwa ta powinna być naprawdę nie¬ 
wielka. 

Zobaczymy dalej, że hadrony składają się nie tylko 
z kwarków, ale i z pewnych innych cząstek — nośni¬ 
ków oddziaływań międzykwarkowych. Jednak kwarki 
pełnią w strukturze hadronów rolę szczególną. Tylko 
bowiem kwarki biorą udział w oddziaływaniach ele¬ 
ktromagnetycznych i słabych. Różne masy kwarków 
decydują też o różnicach mas samych hadronów, a 
obserwowane w doświadczeniach prawo zachowania 
liczby barionów ma swoje źródło w ścisłym prawie 
zachowania liczby kwarków (liczba kwarków minus 
liczba antykwarków nie zmienia się w żadnym pro¬ 
cesie). Można powiedzieć, że własności kwarków 
(przede wszystkim ich masy) są odpowiedzialne za 
wszelkiego rodzaju symetrie obowiązujące w świecie 
hadronów. 

hipoteza Jakie więc są same kwarki? Najważniejsza, spraw¬ 
ie warko wa dzona w wielu doświadczeniach hipoteza teorii kwar¬ 
ków mówi, żc wszystkie bariony (hadrony o spinach 
połówkowych: 1 / 2t 3 U itd.) składają się z trzech kwar¬ 
ków, zaś mezony (hadrony o spinach całkowitych: 
0, 1 itd.) z pary kwark-antykwark. Anty bariony skła¬ 
dają się oczywiście z trzech antykwarków. Wynika 
z tego, że kwarki są fermionami o spinie 1 / 2 (z trzech 
fermionów można zbudować tylko fermion o spinie 
połówkowym, a z dwóch jedynie bozon o spinie 
całkowitym) i podlegają zakazowi Pauliego, podobnie 
jak bariony i leptony. W przyrodzie obserwujemy 
jedynie układy związane trzech kwarków- lub par 
kwark-antykwark. Inne układy, podobnie jak i same 
kwarki, nie zostały dotychczas znalezione. Liczba ob¬ 
serwowanych kwarkowych układów związanych, 
hadronów, zależy oczywiście od liczby samych kwar¬ 
ków, dla której nie znamy żadnego ograniczenia 
teoretycznego. Liczba kwarków może więc być do¬ 
wolna, choć doświadczalnie dowiedzieliśmy się o 
istnieniu jedynie kilku pierwszych, najlżejszych. Zna¬ 
my z pewnością cztery rodzaje kwarków-, a ostatnio 
odkryto hadrony, w których składzie znajduje się 
prawdopodobnie kwark piąty. Zapomnijmy na chwilę 
o spinach kwarków. Wtedy z czterech kwarków mo¬ 
żemy zbudować 4x4x4 = 64 bariony oraz 4x4 = 
= 16 mezonów. Po dodaniu spinów i uwzględnieniu 
istnienia stanów wzbudzonych liczba ta znacznie się 
zwiększa. Teoria kwarków jest więc bardzo oszczędna, 
pomimo że liczba odkrytych kwarków wciąż wzrasta. 

symbole Cztery kwarki, których istnienie zostało mocno 
kwarków ugruntowane doświadczalnie, mają następujące sym- 
(zapachy) bole: u (ang. up ‘górny’), d (ang. down ‘dolny’), s (ang. 

strange ‘dziwny’) oraz c (ang. charmed ‘powabny’). 
W klasyfikacji hadronów i ich oddziaływań stosuje 
się wciąż nieco inną symbolikę mającą dziś już raczej 
historyczne znaczenie. Zamiast mów-ić, że proton 
składa się z dwóch kwarków u oraz jednego d , po¬ 
wiada się, że proton ma liczbę barionową B = 1, 
trzecią składową izospinu / 3 = +7-, dziwność 
5 = 0 oraz powab C = 0. W tej terminologii np. 
kwark u nosi następujące wyróżniające go symbole: 
B = i/a, h = +72, 5 = 0, C = 0 przy czym war¬ 


tości liczb B, / 3 ,5 i C dla układu złożonego z kwarków 
równają się sumom tych liczb dla poszczególnych 
kwarków. Prościej chyba jednak pisać uud niż B = 1, 
/ 3 = 1 / 2 , 5 = 0, C = 0. Zamieszczona niżej tabela 


Addytywne liczby kwantowe kwarków 


Rodzaj 

kwarku 

Liczba 

bario- 

nowa 

B 

Trzecia 
składo¬ 
wa izo¬ 
spinu 

h 

Dziw¬ 

ność 

S 

Powab 

C 

Ładunek 

elek¬ 

tryczny 

Q 

u 

1/3 

+ 1/2 

0 

0 

2/3 

d 

1/3 

-1/2 

0 

0 

-1/3 

s 

1/3 

0 

-1 

0 

-1/3 

c 

1/3 

0 

0 

1 

2/3 


podaje liczby kwantowe w-szystkich czterech kwar¬ 
ków. Antykwarki mają liczby kwantowe przeciwnego 
znaku. Łatwo się przekonać, że dla wszystkich kwar¬ 
ków spełniony jest związek 

Q = / 3 + i(R+5+C). 

Ze względu na własność addytywności wszystkich wzór Gell- 
występujących w nim liczb kwantowych wzór ten -Manna- 
obowiązuje także dla hadronów. W przypadku C = -Nishijimy 
= 0 jest to znany już od przeszło 25 lat wzór Gell- 
Manna-Nishijimy.Suma Y = jB+ 5 zwana jest hiper- 
ładunkiem cząstki. 

Znając skład kwarkowy hadronu możemy na pod¬ 
stawie powyższej tabeli łatwo odczytać liczby kwan¬ 
towe tego hadronu. I tak np.: układ uud (B = 1, 

/ 3 = +72, 5 = 0, C = 0, Q = 1) to proton, układ 
udd (B = 1, I 2 = -72, 5 = 0, C = 0, Q = 0) to 
neutron, układ uuu (B — 1, / 3 = 3 / 2 , 5 = 0, C = 0, 

Q = 2) to rezonans zl ++ , układ uus {B = 1, / 3 = 1, 

5 = — 1, C = 0, Q = 1) to hiperon Z ,+ , układ ud 
(B = 0, / 3 = +1, 5 = 0, C = 0, Q = 1) to mezon 
n+, zaś układ us (B = 0, / 3 = 1 / 2> 5=1, C = 0, 

Q = 1) to mezon K + . Wszystko to można odczytać 
w Tabeli cząstek elementarnych (-* Cząstki elemen¬ 
tarne i ich oddziaływania), na którą będziemy się 
wielokrotnie powoływać. Oczywiście powyższe war¬ 
tości liczb kwantowych mają nie tylko wymienione 
stany podstawowe hadronów, ale i zamieszczona 
w tabeli cząstek cała rodzina ich stanów wzbudzo¬ 
nych (rezonansów). 

Ostatnią pozycją w tabeli liczb kwantowych kwar- ładunek 
ków jest ładunek elektryczny. Nie jest on całkowitą elektryczny 
wielokrotnością ładunku elementarnego. Ułamkowa kwarków 
wartość ładunku kwarków została potwierdzona 
w doświadczeniach nieelastycznego rozpraszania elek¬ 
tronów na nukleonach. Oczywiście same hadrony — 
układy trzykwarkowe lub kwark-antykwark — mają 
ładunki całkowite. 

Przejdźmy teraz do bardziej szczegółowego opisu 
własności hadronów z punktu widzenia ich składu 
kwarkowego. Jak się dalej okaże, o własnościach 
tych decydują różnice mas kwarków. Kwark po¬ 
wabny c jest znacznie cięższy od pozostałej trójki. 

Wyłączymy go więc z naszych rozważań i zajmiemy 
się hadronami złożonymi z kwarków u , d i 5. Hadro¬ 
nów powabnych znamy zresztą stosunkowo niewiele 
i niewiele też wiemy o obowiązujących dla nich sy¬ 
metriach. Zajmiemy się dalej symetriami hadronów 
wynikającymi z ich składu kwarkowego. 


Symetrie hadronów i ich oddziaływań 

Fundamentalną własnością każdego układu cząstek 
jest rodzaj symetrii amplitudy falowej (tzw. amplitu¬ 
dy prawdopodobieństwa), której kwadrat określa 
prawdopodobieństwo znalezienia układu w pewnym 
stanie. Amplituda układu złożonego np. z dw-óch 
cząstek może być funkcją symetryczną albo antysy- 
metryczną ze w-zględu na operację wzajemnego prze- 
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stawienia cząstek, tzn. zamiany wszystkich współ¬ 
rzędnych i liczb kwantowych cząstek. Symetria ukła¬ 
du może być także mieszana. Jeśli cząstki są identycz¬ 
ne, to obie sytuacje (przed i- po zamianie) nie mogą 
być w żaden sposób rozróżnione, a opisujące je ampli¬ 
tudy różnią się co najwyżej znakiem, przez co nie 
zmienia się prawdopodobieństwo. Amplituda falowa 
układu cząstek identycznych nie może więc mieć sy¬ 
metrii mieszanej, musi być albo funkcją symetryczną 
albo antysymetryczną. Rodzaj symetrii nie może przy 
tym zależeć od układu odniesienia, nie może zmieniać 
się przy żadnych transformacjach, jakim poddajemy 
układ. Jest to dosyć oczywiste, gdyż np. antysyme- 
tria amplitudy falowej powoduje, że prawdopodobień¬ 
stwo znalezienia obu identycznych cząstek w tym 
samym stanie równa się zeru i fakt ten nie może oczy¬ 
wiście zależeć od tego, z jakiego układu go obserwu¬ 
jemy. Tak właśnie zachowują się wszystkie identyczne 
fermiony. Ta ich własność jest treścią słynnego za¬ 
kazu Pauliego. Zagadnienie powyższe możemy nieco 
uogólnić. Możemy mianowicie rozważać problem 
przestawienia cząstek prawie identycznych, a także 
symetrię ze względu na zamianę tylko niektórych 
liczb kwantowych. 

Niektóre liczby kwantowe cząstek nie ulegają 
zmianie przy pewnych przekształceniach układu od¬ 
niesienia. Taką liczbą jest np. wewnętrzny moment 
pędu, czyli spin cząstki, którego wartość nie zależy 
od ustawienia (względem cząstki) układu mierzącego 
ten spin. Przy obrotach zmienia się jedynie ustawienie 
spinu, jego rzut na pewną oś, ale nie wartość spinu. 
Zupełnie podobny do poprzedniego argument prze¬ 
konuje nas teraz, że cząstka elementarna złożona 
z dwóch innych cząstek niekoniecznie identycznych 
ale obdarzonych takim samym spinem musi być opi¬ 
sywana symetryczną albo antysymetryczną amplitudą 
falową ze względu na przestawienie zmiennych spi¬ 
nowych. Przy czym określonej cząstce złożonej przy¬ 
pisana jest odpowiednia symetria (spin) w sposób 
jednoznaczny. 

Kwarki mają spin x / 2 . Rzut spinu na dowolną oś 
wyróżnioną przez warunki zewnętrzne (np. na kieru¬ 
nek zewnętrznego pola magnetycznego, za pomocą 
którego analizujemy spiny cząstek) przyjmuje jedynie 
wartości ±72 zgodnie z zasadami mechaniki kwan¬ 
towej. Dla pary kwark-antykwark możliwe są więc 
4 ustawienia spinów składników (rys. 6). Dwie pierw- 
sze sytuacje, w których rzut spinu sumarycznego jest 
równy ± 1, są oczywiście symetryczne ze względu na 
przestawienie rzutów spinu kwarków. Pozostałe dwie 
sytuacje o sumarycznym rzucie równym zeru mogą 
tworzyć zarówno kombinację symetryczną, jak i anty¬ 
symetryczną. Ostatecznie, trzy symetryczne ustawienia 
dają cząstkę złożoną (mezon) o spinie \ (rys. 7), pod¬ 
czas gdy jedna kombinacja antysymetryczną odpo¬ 
wiada cząstce o spinie 0 (rys. 8). Z tego wynika, że 
stany podstawowe układu kwark-antykwark to me¬ 
zony o spinie 0 (zwane pseudoskalarnymi) oraz me¬ 
zony o spinie 1 (zwane wektorowymi). Pierwsze z nich 
są opisywane antysymetryczną, a drugie — syme¬ 
tryczną amplitudą falową. Podobną sytuację mamy 
dla układów trzykwarkowych (barionów). Tu jednak 
amplituda falowa może być np. symetryczna dla pary 
kwarków i antysymetryczną ze względu na rzut spinu 
kwarku trzeciego. Całkowita antysymetria trzech 
rzutów spinu o dwóch tylko możliwych wartościach 
nie daje się zrealizować i pozostają jedynie dwie sy- 
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tuacje przedstawione na rys. 9 i 10. W jednej z nich 
są cztery możliwości opisywane amplitudą całkowicie 
symetryczną i przedstawiające cząstkę o spinie 3 / 2 . 
W drugiej amplituda ma symetrię złożoną (ale okreś¬ 
loną, nie mieszaną) i przedstawia dwa możliwe stany 
cząstki o spinie Stany podstawowe układów trzy¬ 
kwarkowych to bariony o spinie 1 U oraz 3 / 2 . 

Wyciągamy stąd wniosek, że zależnie od ustawie¬ 
nia spinów kwarków określony skład kwarkowy może 
odpowiadać różnym hadronom. I tak np. układ uud 
to albo proton (spin 72 ) albo rezonans A + (spin 3 / 2 ), 
układ ud to albo mezon n + (spin 0) albo mezon f> + 
(spin 1) itd. Masy tych cząstek są oczywiście różne, 
gdyż energia wiązania kwarków zależy od wzajem¬ 
nego ustawienia ich spinów. 

Przejdziemy teraz do symetrii przybliżonych obo¬ 
wiązujących wśród hadronów. Wiążą się one z pew¬ 
nymi podobieństwami różnych kwarków. Kwarki 
mogą się różnić nie tylko ustawieniem spinu, ale rów¬ 
nież masami oraz ładunkami elektrycznymi. To, że 
kwarki mają różne ładunki, jest przyczyną zróżnico¬ 
wania własności elektromagnetycznych hadronów. 
Nie ma to jednak istotnego znaczenia przy badaniu 
oddziaływań silnych. W oddziaływaniach tych ładunki 
kwarków i hadronów nie odgrywają istotnej roli 
i niemal o wszystkim decydują różnice mas kwarków. 

Wiadomo, że proton (uud) oraz neutron (udd) 
mają prawie jednakowe masy. Wnioskujemy stąd, że 
i kwarki u oraz d niewiele różnią się masami. Różne 
ładunki powodują, że nie są to cząstki identyczne 
(mezon 7 z + — ud to wcale nie to samo, co mezon 
n~ — du ), ale w oddziaływaniach silnych nie ma to 
większego znaczenia. Oddziaływania silne powinny 
być więc symetryczne ze względu na wymianę kwar¬ 
ków u oraz d. Symetrię tę nazwano wiele lat temu 
niezmienniczością ze względu na obroty w tzw. prze¬ 
strzeni izotopowej, lub też symetrią SU( 2). Oznacza 
to po prostu niezmienniczość ze względu na wspom¬ 
nianą zamianę kwarków. Zwróćmy uwagę, że sy¬ 
metria ta jest w oczywisty sposób naruszona przez 
oddziaływania elektromagnetyczne hadronów. 

Jakie są konsekwencje niezmienniczości izotopo¬ 
wej oddziaływań silnych? Weźmy pod uwagę dwie 
reakcje rozpraszania: n+p->n + p oraz n~n -> tT n. 
Stan 7 z+p (uduud) przechodzi po wymianie u+±d 
w stan 7 z~n (duudd). Stąd przekroje czynne obu reakcji 
powinny być jednakowe. I takie są rzeczywiście. 
Podobnie jak przekroje czynne reakcji n+n -> n + n 
oraz n~p -*-7Cp i wielu innych. Symetria izotopowa 
została sprawdzona dla wielu reakcji. Znacznie bar¬ 
dziej spektakularne są jednak przewidywania odno¬ 
szące się do mas hadronów tłumaczące występowanie 
tzw. multipletów izotopowych. Jeżeli bowiem kwarki 
u oraz d mają w przybliżeniu takie same masy, to 
zbliżone masy powinny mieć całe grupy, czyli multi¬ 
plety hadronów, np.: mezony 71 ( 7 :+— ud, n~ — du, 
7 z° — antysymetryczną kombinacja dd oraz uu), mezony 
K ( K + — us, K° — dś, K° — sd, K~ — su), rezonanse 
A (A ++ — uuu, A + — uud, A° — udd, A~ — ddd), hipe¬ 
rony Z (Z + — uus , Z 1 ® — uds , Z~ — dds), hiperony 
E (Z° — uss, E~ — dss). Przybliżona równość mas 
składników multipletów jest doskonale potwierdzona 
przez dane doświadczalne (Tabela cząstek elemen¬ 
tarnych, str. 84). Zachodzi ona oczywiście także dla 
innych stanów spinowych (np. mezony o, K*, czy też 
rezonanse Z(1385)) oraz stanów wzbudzonych cząstek. 

Symetrię izotopową 527(2) doskonale potwierdzają 
wszystkie dane doświadczalne. Natomiast nieco 
ogólniejsza symetria — symetria unitarna 5(7(3) — 
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nie jest już tak dokładnie spełniona. Byłaby ona sy¬ 
metrią ścisłą oddziaływań silnych, gdyby również 
kwark s miał taką samą masę, jak kwarki u i d . Mezon 
K + (uś ) ma jednak masę znacznie większą niż mezon 
7 i + (ud) i kwark 5 musi być wyraźnie cięższy. Ze składu 
kwarkowego cząstek możemy jednak i w tym wypad¬ 
ku wyciągnąć pewne ciekawe wnioski. 

Zwróciliśmy już uwagę na fakt, że oddziaływania 
silne wszystkich kwarków są takie same, a obserwo¬ 
wane różnice mają rzec można, naturę kinematyczną 
i wywołane są różnicami mas kwarków. Stąd, jeżeli 
istnieje cząstka, której amplituda falowa, traktowana 
jako amplituda układu kwarków, ma określoną s>- 
metrię, to musi też istnieć inna cząstka o tej samej 
symetrii, ale innym składzie kwarkowym. 

Zajmijmy się najpierw barionami. TJkłady uuu 
C4 ++ ), ddd(A~) oraz ss.? (£~) muszą mieć spiny z / 2 
i muszą być opisywane amplitudami falowymi całko¬ 
wicie symetrycznymi ze względu na przestawienie 
cząstek. Może się bowiem zdarzyć sytuacja, w której 
trzy jednakowe kwarki mają identyczne rzuty spi¬ 
nów. Sytuację tę można zrealizować przez odpowiedni 
obrót układu współrzędnych. W wyniku tego wszyst¬ 
kie trzy identyczne kwarki znajdą się w tych samych 
stanach i muszą być opisywane całkowicie syme¬ 
tryczną amplitudą. Stąd też muszą istnieć następujące 
symetryczne kombinacje układów trzykwarkowych 
o spinie 3 / 2 : uud (A + ), udd (A°), uus (rezonans Z + ), 
uds (rezonans E°), dds (rezonans Z~), uss (rezonans 
S°) oraz dss (rezonans E~). Razem z poprzednimi 
mamy więc dziesięć barionów o spinie Z U, tzw. de¬ 
kuplet barionowy. Dekuplet ten składa się z kwartetu 
izospinowego rezonansów A, trypletu rezonansów 
Z, dubletu rezonansów E i singletu Q~. Biorąc pod 
uwagę, że każdy kolejny multiplet zawiera o jeden 
kwark 5 więcej, łatwo wyciągamy wniosek, że różnice 
mas między sąsiednimi multipletami są takie same: 

= m(E)-m(Z) = m(E)-m(A), 

co możemy sprawdzić w tabeli cząstek. Przy wypro¬ 
wadzaniu tej reguły dla mas korzystaliśmy z faktu, że 
wszystkie spiny kwarków w dekuplecie mogą być 
ustawione w tę samą stronę i dlatego nie odgrywa 
roli ewentualna zależność energii wiązania od wza¬ 
jemnego ustawienia spinów (masa cząstki nie zależy 
od rzutu jej spinu). Nie odnosi się to do ośmiu bario¬ 
nów tworzących tzw. oktet barionowy o spinie 1 j z 
i dlatego reguła dla mas nie jest tutaj tak prosta. Nie 
będziemy jej wyprowadzać, wymienimy jedynie skład¬ 
niki oktetu barionowego. Nie są one oczywiście opi¬ 
sywane całkowicie symetrycznymi amplitudami falo¬ 
wymi, te bowiem odnoszą się do cząstek dekupletu. 
Nie ma więc hadronów o spinie 1 / 2 i składzie uuu, ddd 
oraz sss. Pozostają nam następujące kombinacje: uud 
(proton), ddu (neutron), uus (hiperon ŻT+), dds (hiperon 
Z~), ssu (hiperon E°), ssd (hiperon E+) oraz układ 
złożony z trzech różnych kwarków uds . W sześciu 
pierwszych cząstkach dwa spośród kwarków (umiesz¬ 
czone na pierwszym miejscu) są takie same, mogą 
mieć spiny skierowane w tę samą stronę (wtedy trzeci 
kwark ma spin skierowany w stronę przeciwną) i muszą 
być opisywane przez symetryczną amplitudę falową. 
Stąd i układ uds musi mieć tę samą symetrię i może 
istnieć w dwóch stanach: symetrycznym ze względu na 
parę ad (hiperon Z° uzupełniający multiplet r) oraz sy¬ 
metrycznym ze względu na parę us lub ds (hiperon A). 
Ostatecznie oktet barionowy składa się z następują¬ 
cych multipletów izospinowych: dubletu nukleonów, 
singletu A, trypletu E oraz dubletu E. Z tego, co 
powiedzieliśmy wyżej wynika, że wszystkie bariony 
(również stany wzbudzone układów trzykwarkowych) 
mogą istnieć jedynie w oktetach i dekupletach i że 
zawsze odpowiednie reguły dla mas są takie same. 
Fakt ten jest obecnie mocno potwierdzony przez 
doświadczenie. 

Znacznie prościej niż z barionami przedstawia się 
sprawa z mezonami. Komplikują ją jedynie mezony 


neutralne złożone z par uu, dd oraz ss. Układy takie 
mogą bowiem swobodnie przechodzić jeden w drugi 
(np. uu -> dd lub uu ->» 55 ). Przejścia uu -> dd między 
stanami o bardzo zbliżonych masach mają jedynie 
znaczenie przy wypisywaniu jawnej postaci amplitud 
falowych mezonów. Ważniejsze są przejścia ss -> uu 
lub dd , dzięki którym mezon złożony z pary kwarków 
dziwnych może przechodzić w mezon złożony z pary 
kwarków niedziwnych i na odwrót. Ustala się jakaś 
równowaga, w której stanami mezonowymi o określo¬ 
nej masie nie są już układy ss, uu, czy też dd, ale 
pewne ich kombinacje o składzie zajleżnym^od in¬ 
tensywności procesu przejścia ss -*■ dd lub uu. Oka¬ 
zuje się, że dla układów o spinie 1 przejścia te są mało 
prawdopodobne i dlatego własności cząstek o spinie 1 
(mezonów wektorowych) są prostsze. W przypadku 
mezonów pseudoskalamych o spinie 0 powyższe 
przejścia są istotne i odpowiednie reguły masowe do¬ 
syć złożone. Mezonów pseudoskalarnych^jest oczy¬ 
wiście dziewięć (3x3): trypjet n (ud, du, dd-uu), 
dwa dublety K(us , ds oraz su, sd) oraz dwa singlety 
7 1 i rf złożone z pewnych kombinacji par uu, dd oraz 
ss. Podobnie dziewięć jest mezonów wektorowych 
(tzw. nonet mezonowy): tryplet j (ud, du, uu-\-dd), 
dwa dublety K*(us, d7 oraz su, sd )oraz dwa singlety: 
co(uu J rdd)i<p(ss). W tym ostatnim wypadku możemy 
łatwo wyprowadzić odpowiednie zależności między 
masami. Po pierwsze, masa q jest oczywiście równa 

masiew: m(o) = m(có). 

Po drugie, porównując liczby kwarków dziwnych 
i niedziwnych w różnych mezonach dochodzimy do 
wniosku, że podwojona masa mezonu K*(us us) po¬ 
winna być równa sumie mas mezonu ? oraz mezonu 

Q (ss ud ). = m (?)+m (q). 

Reguły te zupełnie dobrze zgadzają się dla mas wy¬ 
znaczonych doświadczalnie. Dodajmy wreszcie, że 
wszystkie mezony (także stany wzbudzone) muszą 
również grupować się w podobne dziewiątki (3 x 3). 
Masy i inne liczby kwantowe wszystkich znanych 
cząstek (oczywiście bez cząstek powabnych, na które 
jednak łatwo uogólnić powyższe rozważania) dają się 
wyjaśnić przez założenie, że wszystkie mezony gru¬ 
pują się w nonety, a wszystkie bariony w oktety i de- 
kuplety. 


Kolory i zapachy kwarków 

Na początku artykułu stwierdziliśmy, że podstawą 
opisu oddziaływań cząstek jest kwantowa teoria pola. 
Powiedzieliśmy już chyba wystarczająco wiele o prze¬ 
widywaniach i sukcesach hipotezy kwarkowej. Spró¬ 
bujmy więc teraz zbudować kwantową teorię pola 
kwarkowego. Na wstępie zauważmy, że w dotych¬ 
czasowych rozważaniach popełnialiśmy stale bardzo 
poważny błąd. Z jednej strony twierdziliśmy, że 
układy identyczne fermionów muszą być opisywane 
anty symetryczny mi amplitudami falowymi (stąd za¬ 
kaz Pauliego). Równocześnie jednak okazało się, że 
barionowe układy trójkwarkowe muszą być opisywa¬ 
ne aplitudami symetrycznymi. Np. stan podstawowy 
identycznych kwarków uuu jest symetryczny ze wzglę¬ 
du na ich przestawienia. I nie może być inny. 
Ponieważ kwarki są fermionami, więc układ taki nie 
mógłby po prostu istnieć. Zauważmy, że gdy wszystkie 
spiny skierowane są np. w górę, wszystkie trzy kwarki 
u znajdują się w tym samym stanie, co nie mogłoby 
się zdarzyć, gdyby kwarki te były rzeczywiście iden¬ 
tyczne. Natrafiamy więc na sprzeczność, którą może¬ 
my usunąć jedynie przez wprowadzenie pewnej do¬ 
datkowej cechy, która rozróżniałaby te trzy kwarki. 
Wtedy zamiast układu uuu mielibyśmy układ- u x u 2 u 3 , 
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który już może być całkowicie antysymetryczny ze 
względu na wskaźniki 1, 2, 3 oraz symetryczny ze 
względu na pozostałe liczby kwantowe. Owe wskaź¬ 
niki nazwano kolorami kwarków (rodzaje kwarków 
w, d , s , c nazywa się często ich zapachami) przez ana¬ 
logię do własności światła białego, które może z jednej 
strony składać się z trzech barw podstawowych 
(czerwonej, zielonej i niebieskiej), ale również dowol¬ 
nej barwy oraz barwy do niej dopełniającej (zwykle 
nie jest to barwa czysta). Jak zobaczymy, hadrony są 
zupełnie podobnie zbudowane z kwarków koloro¬ 
wych. Mówimy często, że hadrony są bezbarwne, 
kolory Wprowadzamy więc dla wszystkich kwarków trzy 
kwarków kolory: czerwony (c), zielony (z) oraz niebieski ( n ). 

Aby jednak nie podważyć dotychczasowych rozważań, 
owo potrojenie liczby kwarków nie może spowodo¬ 
wać wzrostu liczby hadronów. Kwarki różnego ko¬ 
loru, lecz tego samego rodzaju (zapachu) nie mogą 
więc różnić się ani masą, ani ładunkiem. Poza tym 
jedynie pojedyncza symetria amplitudy falowej ze 
względu na przestawienia kolorów, może być reali¬ 
zowana w naturze. W przeciwnym razie mielibyśmy 
tyle cząstek, ile rodzajów symetrii. I wreszcie po to, 
by owa symetria „kolorowa” nie ulegała zmianie 
podczas oddziaływań hadronów, musimy mieć ścisłe 
prawo prawo zachowania każdego koloru w każdym proce- 
zachowania sie. Oznacza to, że np. liczba kolorów czerwonych 
koloru minus liczba kolorów anty czerwonych (anty barwy 
czyli barwy dopełniające mają oczywiście antykwar- 
ki) nie zmienia się w żadnej reakcji. Przy spełnieniu 
tych wszystkich warunków poprzednio opisane wy¬ 
niki teorii kwarkowej nie ulegają żadnym zmianom. 
Musimy tylko odpowiedzieć na pytanie, jaka to sy¬ 
metria wskaźników kolorowych jest realizowana 
w przyrodzie w postaci hadronów. W przypadku ba- 
rionów odpowiedź już znamy. Opisująca je amplituda 
falowa jest całkowicie antysy metryczna ze względu 
na wszystkie kolory. Na przykład 

U U U —> UcUzUn — Wc Un Hz "ł - Mn Uc Hz “f* 

— UnUz UcĄ-UzUn Uc — tizltcUn • 

Zwróciliśmy poprzednio uwagę na fakt, że trzy kwar¬ 
kowe układy złożone z różnych kombinacji kwarków 
w, d i s mogą tworzyć całkowicie symetryczne deku- 
plety bądź oktety o symetrii złożonej. Nie rozważa¬ 
liśmy tam możliwego pojedynczego układu całko¬ 
wicie antysymetryczncgo: singletu SU( 3) uds (inne 
układy nie mogą być całkowicie antysymetryczne), 
bowiem ma on stosunkowo dużą masę i nie został 
dotychczas zidentyfikowany doświadczalnie. Podob¬ 
nie teraz, w \ zypadku trzech kolorów, wyżej skon¬ 
struowany całkowicie antysymetryczny układ jest 
singletem kolorowym (symetria kolorowa jest rów¬ 
nież pewnego rodzaju symetrią SU( 3)). 

Spodziewamy się więc, że i mezony będą singletami 
kolorowymi. Jeżeli chcemy, by zachowanie koloru 
było ścisłym prawem przyrody i równocześnie żeby 
bezbarwny hadron (singlet kolorowy), np. nukleon, 
mógł wysyłać mezon, np. n, pozostając nadal bez¬ 
barwnym hadronem (proces ten jest źródłem występo¬ 
wania sił jądrowych), to mezony muszą też być bez¬ 
barwne. Podobnie jak z trzech kolorów i. trzech kwar¬ 
ków można utworzyć tylko jeden stan całkowicie 
antysymetryczny (automatycznie musi to być bez¬ 
barwny singlet nie wyróżniający żadnego koloru), 
tak w wypadku par kolor-antykolor można utworzyć 
tylko jeden stan nie wyróżniający żadnego koloru, 
singlety symetryczny ze względu na zamianę dowolnego ko- 
Icolnrowe loru (wraz z odpowiadającym mu antykolorem) na 
inny. Na przykład 

- «A+ U zź+ U nź- 

Taka kombinacja jest więc znów singletem koloro- 
wym i w ten właśnie sposób zbudowane są wszystkie 
mezony. 

Zauważmy też, że singletu kolorowego nie można 
zbudować ani z dwóch, ani z czterech czy pięciu kwar¬ 


ków (o trzech możliwych kolorach), ani też z kwarku 
i pary kwark-antykwark itp. Możemy łatwo spraw¬ 
dzić, że w każdym z tych wypadków dowolnego typu 
symetria kolorowa amplitudy falowej albo nie może 
być w ogóle zrealizowana, albo ma więcej niż jedną 
realizację (nie odpowiada wtedy singletowi o jednej 
składowej). Pojedynczy kwark jest oczywiście tryple- 
tem kolorowym. Widzimy więc, że jedynie układy 
trzykwarkowe oraz kwark-antykwark (a także ich 
wielokrotności) mogą tworzyć singlety kolorowe, co 
prowadzi do reguły: tylko singlety kolorowe są obser¬ 
wowane w postaci hadronów. 


Chromodynamika kwantowa 

Przypisanie kwarkom trzech różnych kolorów nie 
rozwiązuje problemu. Aby kwarki różniące się kolo¬ 
rem były naprawdę różne, musi istnieć jakieś oddzia¬ 
ływanie, które rozróżniałoby kolory. Oddziaływanie 
to musi być przenoszone przez jakieś cząstki. Cząstki 
te, nośniki oddziaływań między kwarkowych, nazywa 
się gluonami (ang. glue ‘klej’). Na wzór elektrodyna- gluony 
miki kwantowej buduje się teorię kwarkowo-gluono- 
wą zwaną chromodynamiką kwantową. Gluony, po¬ 
dobnie jak fotony, mają w niej zerowe masy i spin 
równy jedności. Oczywiście, że gluony nie zostały, 
jak dotychczas, wyprodukowane w żadnym doświad¬ 
czeniu. Mają wprawdzie masę zero, ale dzięki ich 
uwięzieniu wewnątrz hadronów zasięg oddziaływań 
silnych jest skończony (-> Oddziaływania elektro¬ 
magnetyczne). Zbadajmy, jakie kolory mają gluony. 

W tym celu musimy rozważyć elementarny diagram 
produkcji gluonu z kwarku o określonym kolorze 
(rys. 11). Na przykład kwark czerwony wysyła gluon 
i zmienia (lub nie) swoją barwę. Ponieważ obowiązuje 
ścisłe prawo zachowania każdej barwy, więc wysyłany 
gluon musi mieć dwa kolory: kolor kwarku przed 
aktem wysłania i antykolor (kolor dopełniający) 
kwarku końcowego. Każdy więc gluon ma dwa kolo¬ 
ry, z czego łatwo możemy obliczyć całkowitą liczbę 
gluonów. Zwróćmy jednak uwagę na fakt, że wartości 
prawdopodobieństwa wysłania gluonu z kwarków 
różnego koloru muszą być takie same. W przeciwnym 
razie wymiana gluonów nie tylko powodowałaby 
zmianę kolorów kwarków, ale także dla różnych ko¬ 
lorów prowadziłaby do różnej energii oddziaływania, 
co musiałoby wywołać wystąpienie różnic mas w try- gjiónu może ziniefl 
plecie kolorowym kwarków. nić lub nie zmienić ( 

Tak więc wysłanie gluonu z każdego kwarku wiąże k J Ioru .£^£ u * ^ 
się z tą samą stałą sprzężenia, która wynosi prawdo- zmienia jego rodzą* 
podobnie a c ^ 0,5. ju (zapachu) 

Ile więc jest gluonów mających kolor i antykolor? 

Ponieważ kolory są trzy, więc wydawałoby się, że 
gluonów musi być dziewięć. Jednak trzy układy ko¬ 
lorów, cc , zl nn nie zmieniają koloru kwarku. Nie 
oznacza to, że gluony mające takie pary kolorów 
nie rozróżniają wcale kolorów kwarków, gdyż np. 
gluon cc może być wysłany tylko z kwarku czerwone¬ 
go. Jedynie znana nam już całkowicie symetryczna 
kombinacja kolorów cc+zz-fn/z (singlet kolorowy) 
nie wyróżnia żadnego koloru kwarków. Wysłanie 
takiego gluonu nie zmieniłoby nawet względnych 
znaków amplitud falowych odpowiadających kwar¬ 
kom o różnych kolorach. Taki bezbarwny gluon 
musi być wyeliminowany z teorii, w której obowiązuje 
reguła, że wszystkie singlety kolorowe nie są uwię¬ 
zione w hadronach, mogą być więc obserwowane 
w doświadczeniach i wymieniane w reakcjach między 
hadronami. Teoria minimalna zawiera więc osiem 
gluonów o masie zero i spinie 1. Dodajmy jeszcze, że 
gluony nie mają ładunku elektrycznego i nie biorą 
udziału w oddziaływaniach słabych. 

Podstawą chromodynamiki kwantowej zbudowanej 
na wzór elektrodynamiki kwantowej są elementarne 
procesy wysyłania i pochłaniania gluonów przez 
kwarki oraz kreacji par kwark-antykwark przez gluo- 



102 







kwark ny a także anihilacji tych par z wytworzeniem gluo- 
fizyczny nów. Teoria ta różni się od elektrodynamiki jedynie 
liczbą nośników sił—gluonów oraz większą stałą 
sprzężenia, a c ~ 1 / 2 . Kwark fizyczny, podobnie jak 
poprzednio elektron, składa się, z prawdopodobień¬ 
stwem bliskim jedności, z kwarku pozbawionego 
struktury, z prawdopodobieństwem rzędu (a c ) 2 ^ 'U 
z kwarku i gluonu, z prawdopodobieństwem rzędu 
(a c ) 4 x ł /ig z kwarku oraz pary kwark-antykwark itd. 
Podobnie proton składa się z trzech punktowych 
kwarków uud z prawdopodobieństwem niewiele róż¬ 
nym od jedności. To wszystko jest jednak prawdziwe 
jedynie w odniesieniu do wewnętrznego obszaru pro¬ 
tonu, położonego blisko środka, i ten właśnie obszar 
był badany w doświadczeniach nieelastycznego roz¬ 
praszania elektronów na nukleonach. W obszarze ze¬ 
wnętrznym na kwarki i gluony działają ogromne siły 
nie pozwalające im na opuszczenie hadronów. Tak 
więc dla dużych odległości między kwarkami stała 
sprzężenia a c z niewyjaśnionych do końca powodów 
silnie wzrasta i nie możemy już klasyfikować składu 
hadronów mówiąc o trzech kwarkach pozbawionych 
struktury itp. W zewnętrznych regionach hadronu 
kwarki mają bogatą, trudną do opisania strukturę. 
Jednak przedstawiony poprzednio kwarkowy obraz 
hadronów nadal obowiązuje, choć przeważnie nie są 
to kwarki bez struktury. 

Przeprowadzona analiza własności i symetrii ha¬ 
dronów nie zależała oczywiście od tego, czy kwarki 
wewnątrz hadronów miały jakąś strukturę, czy też 
były punktowe. Ważne tam były tylko masy, rodzaje 
oraz liczba kwarków'. 

Zastanówmy się jeszcze, jak chromodynamika kwan¬ 
towa opisuje reakcje produkcji dodatkowych hadro¬ 
nów (głównie mezonów) w procesach ich rozprasza¬ 
nia. Będzie to analiza czysto jakościowa, ponieważ 
zarówno mechanizm uwięzienia kwarków, jak i włas¬ 
ności kwarków znajdujących się w pobliżu brzegów 
hadronu nie dają się łatwo opisać przy użyciu metod 
rachunkowych kwantowej teorii pola. Są to obszary 
teorii wkraczające w dziedzinę, którą można nazwać 
chemią oddziaływań silnych i jako .takie mogą być 
traktowane jedynie fenomenologicznie. 


Fenomenologiczny opis oddziaływań 
silnych 

Wyobraźmy sobie, że para kwarków jest uwięziona 
w obszarze mezonowym o określonej z grubsza obję¬ 
tości. Zderzając ten mezon z innym hadronem lub 
też elektronem możemy jednemu z kwarków nadać 
duży pęd względem kwarku drugiego (rys. 12). Obszar 



Rys. 12. Produkcja dwóch mezonów n~ i n + z mezonu tz° na¬ 
stępuje w wyniku kreacji dodatkowej pary dd 


mezonowy zaczyna się rozciągać i słabe, rozproszone 
początkowo statyczne pole gluonowe (o bardzo po¬ 
dobnych własnościach do fotonowego pola elektro¬ 
statycznego) zaczyna się wydłużać i przybiera postać 
pola jednorodnego. Na kwarki zaczyna wtedy działać 
stała siła, a energia obszaru mezonowego zaczyna być 
proporcjonalna do jego długości. W pewnym momen¬ 
cie energia jest tak duża, że wystarcza na utworzenie 
nowej pary kwark-antykwark. Na tych nowych cząst¬ 
kach zamykają się teraz linie sił pola gluonowego 
i obszar mezonowy rozpada się na dwa nowe mezony. 
Proces ten powtarza się prowadząc do wytworzenia 
wielocząstkowego stanu końcowego. W ten sposób 
w zderzeniach cząstek z hadronami produkowane są 
inne hadrony. Widzimy, że zawsze polega to na wy¬ 
tworzeniu wzbudzonego stanu mezonowego, a na¬ 
stępnie na jego rozpadzie. Własności tego stanu wzbu¬ 
dzonego nie zależą od rodzaju cząstki, która wywo¬ 
łała wzbudzenie (elektron, mezon tt, proton), a jedynie 
od przekazanego kwarkom pędu. Procesy produkcji 
wielu cząstek powinny więc wyglądać podobnie bez 
względu na rodzaj zderzających się cząstek. Fakt ten 
bardzo dobrze zgadza się z wynikami wielu doświad¬ 
czeń. 

A dlaczego mówimy często, że w oddziaływaniach 
wewnątrzjądrowych i innych oddziaływaniach silnych 
decydującą rolę odgrywa wymiana mezonów, np. me¬ 
zonu 7 T, a nie wymiana gluonów? Otóż w krótkich 
przedziałach czasu nieokreśloność energii (masy) 
hadronu staje się na tyle duża, że hadron ten może 
wydłużyć się i pęknąć wysyłając np. wirtualny mezon 
7 T, który następnie może zostać pochłonięty przez inny 
lub ten sam hadron. Z fenomenologicznego więc punk¬ 
tu widzenia oddziaływania silne to wymiana wirtual¬ 
nych mezonów n i innych hadronów. Podobnie można 
opisywać fenomenologicznie strukturę np. protonu 
jako cząstki złożonej częściowo (z pewnym prawdo¬ 
podobieństwem) z pojedynczego protonu, częściowo 
z protonu i mezonu n itd. Taki obraz oddziaływań sil¬ 
nych i struktury hadronów mógłby być najbardziej 
odpowiedni do opisu większości reakcji z udziałem 
hadronów. W reakcjach tych bowiem przeważnie 
bierze udział zewnętrzna część hadronów, a wtedy 
nie można już stosować prostych metod rachunko¬ 
wych lokalnej chromodynamiki kwantowej. Niestety, 
prawdopodobieństwo wysłania np. wirtualnego me¬ 
zonu u z protonu jest duże i związana z tym procesem 
stała sprzężenia wynosi aż 14,4. Nie można więc sto¬ 
sować takiego rachunku zaburzeń (diagramów Feyn- 
mana), jaki stał się podstawą sukcesów elektrodyna¬ 
miki kwantowej. Pozostają metody znacznie bardziej 
złożone, do jakich należy np. model wymiany biegu¬ 
nów Reggego (-> Oddziaływania silne), wykorzystanie 
tzw. związków dyspersyjnych itp. Metody te zupełnie 
poprawnie opisują wielką ilość danych doświadczal¬ 
nych dotyczących rozpraszania i produkcji hadronów. 
Warto jednak pamiętać, że znikoma zaledwie część 
tych danych ma bezpośredni związek z lokalnymi od¬ 
działywaniami kwarków i gluonów, a te przecież sta¬ 
nowią fundament wszystkich oddziaływań silnych. 
Podobnie analizując widmo promieniowania jakiej¬ 
kolwiek cząsteczki chemicznej nie domyślilibyśmy się 
łatwo, że struktura tej cząsteczki opiera się na jednym 
prostym prawie Coulomba. Dopiero zbadanie szcze¬ 
gólnego rodzaju widma — widma atomu wodoru — 
wyjaśniłoby szybko naturę owego fundamentalnego 
rodzaju sił. 

Materia jest prawie zawsze bardzo złożona i od¬ 
krycie najprostszych rządzących nią zasad wymaga 
przeprowadzenia bardzo szczególnych doświadczeń. 
Są to zwykle doświadczenia zupełnie dla danej dzie¬ 
dziny nietypowe. Takimi właśnie były doświadczenia 
nieelastycznego rozpraszania elektronów na nukleo^ 
nach, dzięki którym dowiedzieliśmy się, że kwarki 
nie mają struktury. 

G. Białkowski, R. Sosnowski Cząstki elementarne , War¬ 
szawa 1971; L.N. Cooper Istota i struktura fizyki,. Warszawa 
1975; R.P. Feynman i in. Feynmana wykłady z fizyki, t. 3, War¬ 
szawa 1974. 
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Atomy egzotyczne 

Janusz Zakrzewski 

Atom zwyczajny o liczbie atomowej Z składa się 
z jądra o ładunku dodatnim +Zq e , wiążącego za po¬ 
średnictwem oddziaływania elektromagnetycznego 
(przyciągających sił kulombowskich) Z ujemnie nała¬ 
dowanych elektronów, z których każdy ma ładunek 
elementarny -q e (\q e \ = 1,6- 10- 19 C). Jako całość 
atom jest więc elektrycznie obojętny. Składnikami 
zwyczajnego jądra są nukleony: Z dodatnio nałado¬ 
wanych protonów, każdy o ładunku +q e , oraz (A -Z) 
obojętnych elektrycznie neutronów (A jest liczbą ma¬ 
sową jądra oznaczonego symbolem zX). 

Najprostszym atomem zwyczajnym jest atom wo¬ 
doru, składający się z protonu, deuteronu lub trytonu 
jako jądra i jednego elektronu powłokowego. Jeżeli 
w takim atomie jądro zostanie zastąpione cząstką 
elementarną, naładowaną dodatnio, np. pozytonem 
e+ lub mionem (lepton ^ + ), powstanie układ zwią¬ 
zany cząstki dodatniej i ujemnego elektronu, zwany 
odpowiednio pozytonium (e+e~) lub mionium 
i,u + e~). Jeżeli natomiast w atomie zwyczajnym o licz¬ 
bie atomowej Z jeden z elektronów powłokowych e~ 
atomy zostanie zastąpiony cząstką elementarną naładowaną 
mionowe, ujemnie, np. mionem (lepton /r"), pionem (mezon 
pionowe, «“), kaonem (mezon K ~), antyprotonem^ lub hipe- 
kaonowe, ronem 27", powstanie odpowiednio atom mionowy, 
antyproto- pionowy, kaonowy, antyprotonowy lub hiperonowy 
nowe i hipe- ( 7 * Cząstki elementarne i ich oddziaływania). Składa 
r ono we się on z jądra o liczbie atomowej Z, cząstki ujemnej 
(o masie o wiele większej niż elektron) związanej 
w polu kulombowskim jądra oraz (Z— 1) elektronów 
powłokowych. Takie atomy będziemy zwali ogólnie 
atomami egzotycznymi; stosuje się też często ogólną 
nazwę mezoatomyJub atomy mezonowe (i to nie tylko 
w tych wypadkach, gdy cząstką związaną jest mezon 
czy lecz i wtedy, gdy jest nią lepton jT lub 
barion — antyproton czy hiperon 27"). 

Wszystkie wymienione atomy egzotyczne zostały 
zaobserwowane w doświadczeniach. Pierwszej obser¬ 
wacji egzotycznych atomów mionowych dokonano 
w 1947 r. iw tym samym roku pojawiły się pierwsze 
analizy teoretyczne tego zjawiska. Atomy egzotyczne 
stanowią do chwili obecnej przedmiot intensywnych 
badań eksperymentalnych i teoretycznych, dostar¬ 
czających informacji o własnościach cząstek elemen¬ 
tarnych, ich oddziaływaniach z nukleonami oraz 
o strukturze jąder atomowych. 

Ponieważ atomy mionowe i pionowe bada się 
przeszło 25 lat, w dalszym ciągu omówimy jedynie 
najnowsze wyniki doświadczeń nad atomami hadro- 
nowymi (hadroatomami) — kaonowymi, antyproto- 
nowymi i hiperonowymi. Badania w tej dziedzinie 
rozwinęły się dopiero w latach siedemdziesiątych, gdy 
w kilku laboratoriach dysponujących akceleratorami 
protonowymi wielkich energii (Argonne, Berkeley, 
Brookhayen, Genewa) wytworzono intensywne wiązki 
cząstek ujemnych o małej energii. Umożliwiło to za¬ 
stosowanie liczników półprzewodnikowych, germa¬ 
nowych i krzemowych, do badania mezoatomów za¬ 
wierających mezony K ~, hiperony 27" i anty protony. 


Procesy elektromagnetyczne 

Omówimy wpierw zjawiska wspólne dla wszystkich 
atomów egzotycznych. Historię życia cząstki nałado¬ 
wanej, która utworzyła atom egzotyczny w ośrodku 
materialnym, do momentu jej zniknięcia w końcowym 
procesie oddziaływania można podzielić na trzy etapy: 
spowolnienie spowolnienie, wychwyt atomowy i deekscytację utwo¬ 
rzonego atomu egzotycznego. Wszystkie trzy procesy 
wywołane są oddziaływaniem elektromagnetycznym. 
Końcowy proces oddziaływania — rozpad lub absorp¬ 
cja jądrowa — zależy od rodzaju cząstki. 
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Poruszając się w ośrodku materialnym, cząstka na¬ 
ładowana ujemnie, traci swą energię kinetyczną w od¬ 
działywaniu elektromagnetycznym z atomami ośrod¬ 
ka na wzbudzanie ich i jonizację. Czas potrzebny na 
spowolnienie cząstki od typowej energii ok. 100 MeV 
do ok. 2 keV wynosi w przybliżeniu 10" 10 -10 " 9 s. 
Gdy energia cząstki staje się dostatecznie mała, cząst¬ 
ka może ulec schwytaniu przez pole kulombowskie 
jądra atomu ośrodka i zastąpić w atomie jeden z jego 
elektronów powłokowych, który ulegnie wyrzuceniu 
z atomu w tzw. procesie Augera: 

cząstka -f atom -> atom egzotyczny + elektron. 

Powstaje atom egzotyczny w stanie wysoce wzbu¬ 
dzonym. Podstawowe własności tego atomu można 
opisać poglądowo posługując się najprostszym mode¬ 
lem atomu — modelem Bohra, z którego wynika, że 
energia cząstki ujemnej związanej w polu kulombow¬ 
skim jądra punktowego o liczbie atomowej Z (wpływ 
pozostałych elektronów powłokowych jest tu pomi¬ 
nięty) może mieć wartości 


*--W) 


( 1 ) 

promień zaś orbity kołowej, odpowiadającej stanowi 
o głównej liczbie kwantowej n, wynosi 


r n — - 

uc. 


<x7 


( 2 ) 


A * / 

m/(l +W / W ^ )jest mas * zredukowaną cząst¬ 
ki o masie spoczynkowej m i jądra o masie spoczyn¬ 
kowej mA> a x 1/137 jest stałą struktury subtelnej, 
c = 3 *10® m/s — prędkością światła w próżni, a h — 
- h/ln = 1,05 10" 34 J-s — stałą Plancka. Taki sam 
wzór na energię stanów stacjonarnych otrzymuje się 
z nierelatywistycznego równania falowego — rów¬ 
nania Schrodingera (—► Spektroskopia atomowa. 
Chemia kwantowa). 

Ze wzorów (1) i (2) otrzymujemy następujące związ¬ 
ki między energią E n oraz promieniem bohrowskim r n 
cząstki w atomie egzotycznym i odpowiednimi wiel¬ 
kościami atomu zwyczajnego w stanie o tej samej licz¬ 
bie kwantowej n : 

Zn — Ene(j*!rn — rne(j*elfl) , 


gdzie symbole ze wskaźnikiem e odnoszą się do elek¬ 
tronu w atomie zwyczajnym. Zatem w atomie egzo¬ 
tycznym poziomy energii leżą o wiele niżej (mają więk¬ 
szą wartość bezwzględną), a promienie bohrowskie 
są o wiele mniejsze niż w atomie zwyczajnym (nawet 
dla cząstki o najmniejszej masie — mionu —war¬ 
tość fx!fx e a; 207). Tylko w stanie o dużych wartościach 
głównej liczby kwantowej n jądro jest osłaniane przez 
elektrony powłokowe. Przy mniejszych wartościach n 
wszystkie elektrony powłokowe są znacznie dalej od 
jądra, tak że cząstkę w atomie egzotycznym można 


Własności cząstek i tworzonych przez nie atomów 
egzotycznych (wg modelu Bohra) 


Czą¬ 
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Wartości obliczone przy założeniu nieskończenie dużej masy ją¬ 
dra; £ 0 = 13,6 eV, a 0 = 5,3 *10* fm są wartościami energii i pro¬ 
mienia Bohra zwyczajnego atomu wodoru (wg N. Barash-Schmi- 
dta i in., 1980). 


wychwyt 

atomowy 


model Bohra 

atomu 

egzotycznego 


atom egzo¬ 
tyczny a 
zwyczajny 















traktować z dobrym przybliżeniem jak elektron w ato¬ 
mie wodoropodobnym (o jednym elektronie). Stan 
cząstki na orbicie bohrowskiej o promieniu r„ równym 
promieniowi r le elektronu o najniższej energii E u 
(n c — 1) jest nadal stanem wysoce wzbudzonym: od¬ 
powiada mu główna liczba kwantowa n = \J (/'/za¬ 
wartości tej liczby n oraz energii wiązania Er = —E x 
i promieni bohrowskich m — r x cząstek w' stanach 
podstawowych różnych atomów egzotycznych podane 
są w tabeli wraz z masami m i średnimi czasami życia r 
tych cząstek — składników’ odpowiednich atomów. 

Przy analizie danych doświadczalnych energie sta¬ 
nów w atomie egzotycznym należy obliczać dokład¬ 
niej, niż na to pozwala model Bohra. Stosuje się za- 
ścisłe tern relatywistyczne równanie falowe: Kleina-Gor- 
obliczenie dona dla cząstki o spinie 0 (bozonu — np. pionu, 
energii kaonu) lub Diraca dla cząstki o spinie l ! t (fermionu — 
np. mionu, antyprotonu, hiperonu E~). Przy zało¬ 
żeniu, że jądro jest punktowe, wzór na energię wyni¬ 
kający z tych równań ma postać: 



gdzie dla bozonu j /, dla fermionu zaś ] = /± ł / 2 , 
przy czym / jest orbitalną liczbą kwantową. (Wzór (1) 
stanowi przybliżenie wzoru (3), jeśli się w nawiasie 
kwadratowym pominie mniejsze od 1 wyrazy zawie¬ 
rające czynnik aZ). Widać, że dla fermionów poziomy 
energii £V?j są rozszczepione wskutek istnienia włas¬ 
nego momentu magnetycznego cząstki, tworzą dublety 
struktury subtelnej (tej samej wartości n odpowiadają 
dwie wartości/). Wyrażenie na energię należy uzupeł¬ 
nić dodając do wzoru (3) poprawki wynikające z 
uwzględnienia skończonych rozmiarów jądra (roz¬ 
kładu ładunku w jądrze), poprawki promieniste (wy¬ 
nikające przede wszystkim z efektu polaryzacji próżni) 
oraz poprawki uwzględniające osłanianie elektronów 
powłokowych (do pominięcia przy małych wartoś¬ 
ciach n ). Energię Eem stanu w atomie egzotycznym 
z uwzględnieniem wszystkich poprawek elektromag¬ 
netycznych AEem można ostatecznie zapisać w posta¬ 
ci: 

Eem = EkG,D + AEem, (4) 


gdzie członem dominującym (Ekg,r) jest energia wy¬ 
nikająca z równania Klcina-Gordona lub Diraca. 

Poziomy energii w atomie egzotycznym można wy¬ 
znaczać badając promieniowanie wysyłane w procesie deekscytacja 
deekscytacji pow-stałego atomu wzbudzonego, tzn. 
przy przejściach elektromagnetycznych między pozio¬ 
mami. W procesie deekscytacji atom pozbywa się 
energii wzbudzenia, równej różnicy energii stanu po¬ 
czątkowego p i końcowego k : £> E k —hor. pozbywa 
się jej w postaci energii kinetycznej elektronu powło¬ 
kowego, wyrzuconego z atomu w procesie Augera, 
lub promieniowania rentgenowskiego o częstości co. 

Proces pierwszy dominuje we wczesnych etapach roz¬ 
wijającej się w' atomie egzotycznym kaskady elektro¬ 
magnetycznej, drugi — w stanach o mniejszych war¬ 
tościach głównej liczby kwantowej n y jak to ilustruje 
schemat poziomów energii dla kaonowego atomu siar¬ 
ki (rys. I). Reguły wyboru rządzące tymi procesami, 

Al = £ 1 (z uprzywilejowaniem Al = — l i z dopusz¬ 
czalnie małą zmianą An dla procesu Augera, a dużą 
dla promieniowania rentgenowskiego) powodują, że 
cząstka zmierza do stanu o maksymalnej wartości 
orbitalnej liczby kwantowej / = n- 1 (do ,,orbity 
kołowej*' — w języku prostego modelu Bohra). 

Z chwilą osiągnięcia stanu o liczbach kwantowych 
(fj y I = n— 1) zachodzą tylko przejścia elektromagne¬ 
tyczne typu (/?, w — 1) -> («— 1, n — 2) (/r — 2, n — 3)-> 

..., tzn. przejścia między kolejnymi orbitami koło¬ 
wymi. Całość procesów elektromagnetycznych, spro¬ 
wadzających cząstkę do najniższego stanu, w którym 
następuje końcowy proces oddziaływania, trwa w su¬ 
mie 10~ ,2 -10 -1 ° s. 


Badanie własności cząstek elementarnych 

Informacje o utworzeniu i deekscytacji atomu egzo¬ 
tycznego pochodzą przede wszystkim z obserwacji 
promieniow-ania rentgenowskiego. Pomiary energii 
przeprowadza się przy użyciu detektorów' półprzewod¬ 
nikowych o rozdzielczości energetycznej AE[E < 10“ 2 widmo 
w zakresie energii ok. 100 keV. Identyfikacji przejść rentgeno- 
elektromagnetycznych zachodzących z emisją promie- wskie 
niowania rentgenowskiego dokonuje się na podstawie 
porównania precyzyjnie zmierzonych wartości energii 
kwantu hco z energią przejścia Eem —Eem , obliczoną 
z dużą dokładnością ze wzorów (3) i (4). Identyfikację 
taką opiera się na obserw-acji serii widmowych zna- 


emisje elektronów 
w procesie Augera 




emisja 

promieniowania 

rentgenowskiego 


— 1s 

Rys. I. Schemat poziomów energii kaonowego atomu siarki S A -. Wychwyt atomowy kaonów prowadzi do obsadzenia poziomów 
z prawdopodobieństwem proporcjonalnym do (2/4-1). Przejścia o największym natężeniu, w- miarę rozwoju kaskady elektromagnetycz¬ 
nej, zachodzą między orbitami kołowymi. Kaskada urywa się po osiągnięciu poziomu 3rf wskutek absorpcji jądrowej; ostatnim przej¬ 
ściem obserwowanym w atomie siarki jest 4 /—> 3 d (wg H. Kccha, 1973) 
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liczba zliczeń 



energia Rys 2 . Widmo promieniowania rentgenowskiego kaonowych ato¬ 
mów fosforu 15 Pk”. Linie 7 — >6, 6 —► 5, 5 —> 4, 4 -> 3 oraz 
9 —> 4 t 8 —> 4. 7 4, 6 4 (przejście do stanu o nic — 4) są 

liniami odpowiadającymi przejściom kaonowym. Widać też li¬ 
nie widma atomów hiperonowych (27 7 —► 6 i 27 6 —► 5) i linie wi¬ 
dma atomów pionowych Or 4 -*■ 3, n 3 -> 2) oraz linie wzorco¬ 
wania y. Linia 4 3 wykazuje poszerzenie spowodowane od¬ 

działywaniem silnym (wg G. Backenstossa i in., 1974) 


nych ze zwyczajnej spektroskopii rentgenowskiej. 
Rysunek 2 przedstawia widmo promieniowania rent¬ 
genowskiego kaonowych atomów fosforu 15 Pk-- 

z zaznaczonymi przejściami (n p —rik) między stanami 
o głównych liczbach kwantowych stanu początkowego 
n v i końcowego rik. 

pomiar masy Pomiar energii przejścia atomu egzotycznego umoż- 
v y liwia wyznaczenie masy cząstki schwytanej przez taki 

atom (masa cząstki występuje we wzorze na energię 
przejścia w atomie egzotycznym). Jedne z najdokład¬ 
niejszych pomiarów mas hadronów ujemnych po¬ 
chodzą właśnie z wyznaczenia energii atomów egzo¬ 
tycznych. Z precyzyjnych pomiarów energii przejścia 
między stanami o dostatecznie dużych wartościach 
liczby n w kaonowych atomach baru Ba x _ (5 < n < 
< 11) i złota Au x _(6 < n < 12) oraz ołowiu 
Fb K -(7 < n < 13) wyznaczono w dwóch niezależ¬ 
nych doświadczeniach, wykonanych w latach siedem¬ 
dziesiątych masę mezonu K~ i otrzymano wartości 
zgodne w granicach błędu; ich wartość średnia wy¬ 
nosiła 

m K - '= 493,667 ±0,017 MeV, 

z błędem względnym 3,5 *10“ 5 . Wyznaczono wówczas 
również masę hiperonu 27“ na podstawie obserwacji 
promieniowania rentgenowskiego hiperonowych ato¬ 
mów ołowiu Pb £ i(9 < n < 16) i otrzymano wartość 

m x . = 1197,24±0,14 MeV, 

zgodną z wynikami pomiarów za pomocą emulsji 
jądrowej = 1197,24±0,23 MeV oraz z wynikiem 
uzyskanym przy użyciu komory pęcherzykowej 
t= 1197 , 43 ±0,08 MeV. Dokonano też pomiaru 
masy antyprotonu posługując się antyprotonowymi 
atomami ołowiu Pbp (9 < n < 17): 

mp = 938,179±0,058 MeV. 

Odejmując tę wartość od masy protonu otrzymuje 
się różnicę mas protonu i antyprotonu, m v —m p — 
— 100±58 keV, równą zeru w granicach błędu, 
pomiar zgodnie z przewidywaniami elektrodynamiki kwan- 
momentów towej. 

magnetycz- Rozszczepienie struktury subtelnej linii promiemo- 
nych wania rentgenowskiego jest w pierwszym przybliżeniu 
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Rys. 3. Przejście II10 w antyprotonowych atomach uranu 
wykazujące rozszczepienie struktury subtelnej spowodowane 
przez moment magnetyczny antyprotonu (wg L. Tauschera, 1975) 


proporcjonalne do momentu magnetycznego cząstki 
związanej w atomie egzotycznym. Na tej podstawie 
zmierzono moment magnetyczny antyprotonu w 
dwóch niezależnych eksperymentach, w których bada¬ 
no przejścia 11 -> 10 w antyprotonowych atomach 
ołowiu Pbp i uranu U p (rys. 3). Uzyskano wartości: 

fip = — 2,819 ±0,056^# 

oraz 

fip = — 2,790 ±0,021/u jy, 

zgodne ze sobą oraz bliskie wartości momentu ma¬ 
gnetycznego protonu ju p = 2,79284 56/*n (jednostką 
momentu magnetycznego w fizyce jądrowej jest mag- 
neton jądrowy jun = hąjlnip = 5,05 *10“ 27 J*T ł ). 

Pomiar momentu magnetycznego hiperonu 27 
jest znacznie trudniejszy ze względu na małe natężenie 
promieniowania rentgenowskiego atomów hiperono¬ 
wych i duże tło pochodzące z innych procesów. Około 
8-10% aktów oddziaływania mezonów K~ z jądrami 
tarczy prowadzi do powstania hiperonów 27“. Tylko 
te hiperony, które przeżyją procesy spowalniania, mo¬ 
gą ulec schwytaniu w polu kulombowskim jądra-tarczy 
i utworzyć atomy hiperonowe. W tym samym widmie 
pojawiają się więc linie promieniowania atomów kao¬ 
nowych i pionowych stanowiące tło (zob. rys. 2). 
Z powyższych względów wyznaczenie momentu mag¬ 
netycznego hiperonu 27“ jest mniej pewne i opiera się 
na subtelnej analizie statystycznej widma. 


Wpływ oddziaływania silnego 

Na elektromagnetyczne stany związane hadronu 
w atomie egzotycznym wpływa oddziaływanie silne 
hadronu z jądrem. Gdy hadron jest związany w stanie 
o dużej wartości liczby kwantowej w, tzn. w dużej od¬ 
ległości od jądra, wpływ tego oddziaływania ze wzglę¬ 
du na jego krótki zasięg jest pomijalnie mały (z tego 
względu pomiary mas i momentów magnetycznych 
hadronów wykonuje się dla przejść między stanami 
o dużych wartościach liczby ń). Jednakże w miarę 
deekscytacji promienistej atomu egzotycznego cząstka 
osiąga stan o mniejszej wartości h, w którym jej orbita 
bohrowską wnika w obszar jądra. W takim stanie 
wpływ oddziaływania silnego zaczyna odgrywać istot¬ 
ną rolę i powoduje odstępstwa od schematu elektro¬ 
magnetycznych poziomów energii (zob. wzór 4). 
Wpływ ten można zaobserwować za pośrednictwem 
trzech zjawisk: przesunięcia poziomu energii 
jego poszerzenia A oraz zmniejszenia wydajności Y 
przejść z emisją promieniowania rentgenowskiego 
wskutek absorpcji jądrowej, stanowiącej najbardziej 
prawdopodobny końcowy proces oddziaływania ha¬ 
dronu. 



























absorpcja Absorpcja jądrowa staje się dominująca po przejściu 
jądrowa do następnego, niższego poziomu, o liczbie kwanto¬ 
wej n— 1; hadron ulega unicestwieniu w oddziaływa¬ 
niu silnym, o czym świadczy urywanie się serii wid¬ 
mowej. Widać to z rys. 4, przedstawiającego zależność 
wydajności przejścia rentgenowskiego od liczby ato¬ 
mowej Z atomów kaonowych, zmierzonej w zakresie 
od Z = 2 do Z = 92. Rysunek ten ilustruje najbar¬ 
dziej charakterystyczną cechę atomów hadronowych 
świadczącą o jądrowej absorpcji hadronów — zmniej¬ 
szanie się natężenia określonego przejścia (n, n — 1)-* 
->(« — 1 ,/ 2 —2) w miarę zwiększania się liczby ato¬ 
mowej pierwiastka, z ostatecznym zniknięciem tego 



Rys. 4. Wydajność przejść rentgenowskich między orbitami ko¬ 
łowymi w atomach kaonowych. Kończenie się danego przejścia 
przy określonej wartości liczby atomowej Z stanowi najbardziej 
charakterystyczną cechę hadronowych atomów egzotycznych 
(wg E. Wieganda i G. L. Godfreya, 1974) 

przejścia przy pewnej wartości Z. Zmiany wydajności 
przejścia, w tym minima przy wartościach Z ok. 28, 
38, 60 i 75, wiążą się z procesem atomowego wychwytu 
kaonu i wynikającym stąd obsadzeniem początko¬ 
wych stanów w atomie egzotycznym. 


Przesunięcie i poszerzenie poziomów energii 

Wskutek oddziaływania silnego poziom energii ulega 
przesunięciu AEn, które się definiuje jako różnicę 
między wartością energii zmierzonej £^ksp i obliczonej 


iTobi, z uwzględnieniem wszelkich poprawek elektro¬ 
magnetycznych (zob. wzór 4): AEs = £eksp— £om* 
Szerokość poziomu r a , spowodowana oddziaływa¬ 
niem silnym, jest związana z szybkością W a absorpcji 
jądrowej z tego poziomu: r a = hW a . Można je wy¬ 
znaczyć bezpośrednio, obserwując poszerzenie linii 
promieniowania rentgenowskiego, co widać na przy¬ 
kładzie przejścia 4-+3w atomie P K - (rys. 2). Otrzy¬ 
muje się w ten sposób szerokość 1, / = n— 2) 

poziomu niższego, z którego hadron jest absorbowany 
z prawdopodobieństwem 100% (zob. rys. I); jest ona 
o 2-3 rzędy wielkości większa od szerokości 
(n,l = n— 1) poziomu wyższego, ra = r x ( p / Y — 1) — 
— r A można obliczyć mierząc wydajność Y przejść z 
emisją promieniowania rentgenowskiego. Jest ona 
związaną z prawdopodobieństwem obsadzenia pozio¬ 
mu wyższego, które albo oblicza się uwzględniając roz¬ 
wój kaskady elektromagnetycznej w atomie egzotycz¬ 
nym albo wyznacza się doświadczalnie, mierząc wydaj¬ 
ność wszystkich przejść elektromagnetycznych zasila- 


Atomy kaonowe 


Pierwiastek 

Przejście 

AEx, cV 

r», eV 

r«. cV 

'Sb 

3—>2 

-208 ±35 

810 ±100 

— 

\!b 

3—>2 

—167 ±35 

700 ±80 

- 

-jc 

3—>2 

-590±80 

1730±150 

0,98±0,19 


4->3 

-330 ±80 

1440±120 

I,94±0,33 


Procesy absorpcji jądrowej 

Absorpcja jądrowa hadronu w atomie egzotycznym 
zachodzi w elementarnym procesie silnego oddziały¬ 
wania hadronu z nukleonami. Dla mezonów K~ do- absorpcja K 
minuje proces oddziaływania jednonukleonowego 
z produkcją mezonu n (oddziaływanie mezonowe): 

tf--HV-*r(hib A)+ n 

Z +N -> A+N (w materii jądrowej), 

gdzie N oznacza nukleon (proton lub neutron), a Z 
i A — odpowiednie hiperony (w stanie końcowym 
muszą się pojawiać hiperony Z lub A ze względu na 
zasadę zachowania dziwności w silnym oddziaływa¬ 
niu). W 20-30% przypadków mezon K~ jest absorbo¬ 
wany w oddziaływaniu dwunukleonowym (wielonu- 
kleonowym), bez produkcji mezonu n (oddziaływanie 
niemezonowe): 

A:--f2iV-2;(lub /1)+AT 

Z +N A-\-N w (materii jądrowej). 

W procesie takim bierze udział skorelowana para nu¬ 
kleonów, może więc on służyć do badania korelacji 
nukleon owych w jądrach atomowych. 

Hiperony Z - ulegają absorpcji w oddziaływaniu absorpcja Z~ 
silnym z protonami, 

Z~+p -> A-j-fi 9 

co prowadzi, podobnie jak w wypadku kaonów, do 
powstania hiperonów A jako produktu końcowego. 

Wskutek przyciągającego oddziaływania silnego hi¬ 
peronu A z nukleonami hiperon 4 może zostać zwią¬ 
zany w materii jądrowej i utworzyć hiperjądro (-► Hi- 
perjądra). Absorpcja jądrowa antyprotonów zachodzi absorpcja p 
w procesie anihilacji z produkcją wielu mezonów, 
głównie pionów: 

p + N -> 7T —{— 7T ~f~ 7T • 


jących ten poziom. W tabeli przytoczono niektóre 
dane dla atomów kaonowych, ilustrujące wartości 
omawianych wyżej wielkości. Tego rodzaju dane sta¬ 
nowią ważny sprawdzian każdej teorii usiłującej opi¬ 
sać oddziaływanie silne hadronu z jądrem. 
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potencja! 
oddziaływa¬ 
nia 
kaonu 
z jądrem 


sondowanie 

jądra 


proces 

widzenia 


We wszystkich dyskutowanych wyżej wypadkach 
wpływ oddziaływań silnych uwzględnia się przez 
wprowadzenie do falowego równania jądrowego po¬ 
tencjału optycznego, opisującego oddziaływanie ha¬ 
dronu z jądrem (—► Siły jądrowe). Najprostszą postać 
dla kaonów ma potencjał proporcjonalny do gęstości 
materii jądrowej ( >(r ): 

w= J'| 1+ ™th 8(r) , 

M m N ) 

gdzie m K - i niw oznaczają masy mezonu K~ i nukleo¬ 
nu, fi — masę zredukowaną układu kaon-jądro, A zaś 
jest parametrem zespolonym. Przyjmuje się przy tym, 
dla uproszczenia, że rozkład neutronów i protonów 
jest taki sam Q n (r ) = Q P (r) — ę(r)i że jest równy gęsto¬ 
ści ładunku w jądrze. Opis oddziaływania kaonów z ją¬ 
drem jest jednakże utrudniony wskutek występowania 
w układzie kaon-proton podprogowego stanu rezo¬ 
nansowego A (1405) (-> Cząstki elementarne i ich 
oddziaływania). Prawdopodobnie z tego względu 
prosta ekstrapolacja danych dotyczących rozprasza¬ 
nia kaonów na nukleonach, przy niskich energiach, do 
obszaru energii odpowiadającego kaonom związanym 
w atomach egzotycznch nie prowadzi do wyników 
zgodnych z doświadczeniem. 

Poprawny opis oddziaływania kaon-nukleon w ato¬ 
mie egzotycznym umożliwiłby wykorzystanie K~ 
(a także hiperonów i antyprotonów) jako cząstek 
sondujących strukturę jądrową. Ponieważ mezony K~ 
absorbowane są głównie w obszarze powierzchnio¬ 
wym, gdzie gęstość materii jądrowej nie przekracza 
ok. 10% wartości centralnej, można by użyć ich do 
badania powierzchni jądra, w tym — rozkładu neu¬ 
tronów i protonów oraz korelacji nukleonowych na 
powierzchni jądra. 

Absorpcja jądrowa mezonów — pionów i kao¬ 
nów — często prowadzi do emisji ugrupowań nukleo¬ 
nowych, w szczególności takich jak cząstki a. Infor¬ 
macje o tym zjawisku uzyskuje się bądź bezpośrednio, 
obserwując końcowe fragmenty jądrowe, bądź po¬ 
średnio, wykrywając fotony y emitowane z jąder koń¬ 
cowych. Rysunek 5 przedstawia wychwyt niemezono- 
wy kaonu przez jądro węgla, zarejestrowany w emulsji 
jądrowej. Zaobserwowany proces dowodzi, że mezon 
K~ może oddziaływać z dwoma nukleonami (lub ich 
większą liczbą) w procesie niemezonowym, powodu¬ 
jąc rozpad jądra końcowego na cząstki a. Częstą 
emisję cząstek a w oddziaływaniach mezonów można 
przypisywać albo własnościom jądra, albo mecha¬ 
nizmowi reakcji, np. wychwytowi wielonukleono- 
wemu. 

Dalsze badania atomów egzotycznych, a zwłaszcza 


Detekcja cząstek 

Tomasz Hofmok / 

Czy można zobaczyć cząstkę, której rozmiary są 
mniejsze niż 10" 15 m, a masa jest rzędu 10" 30 kg? Na 
to pytanie odpowiada się często przecząco argumen¬ 
tując tym, że zdolność rozdzielcza układu optycznego 
nie może być mniejsza od długości fali padającego 
światła, która dla zakresu promieniowania widzial¬ 
nego zawiera się w granicach 4—7 -10” 7 m, a rozmiary 
cząstki są o kilka rzędów wielkości mniejsze .Taka od¬ 
powiedź zakłada jednak potoczne, bardzo ograniczone 
znaczenie słowa widzieć. Zastanówmy się nad fizyczną 
stroną procesu widzenia. Jak przebiega z punktu wi¬ 
dzenia fizyka oglądanie czerwonego przedmiotu w sło¬ 
neczny dzień? Mamy do dyspozycji źródło kwantów 
promieniowania elektromagnetycznego (fotonów) o 
energiach 3-5 -10“ 19 J (zakres światła widzialnego), 
co odpowiada w częściej używanych w tej dziedzinie 
jednostkach 1,8-3,1 eV. Doprowadzamy fotony do 


/ 


5 



Rys. 5. Mikrofotografia oddziaływania w emulsji jądrowej me¬ 
zonu K~ z jądrem węgla ,2 C (punkt a) z produkcją hiperonu 
27“ (/), protonu (2), dwóch cząstek a (3,4) i dcuteronu (5). Cząstki 
a pochodzą prawdopodobnie z rozpadu jądra końcowego (®Be 
w stanie podstawowym). Hiperon 27“ w punkcie b rozpada się 
w locie na mezon (wg D. Evansa i in., 1961) 


badanie koincydencji między promieniowaniem rent¬ 
genowskim a cząstkami wtórnymi, powstałymi w wy¬ 
niku absorpcji hadronu przez jądro, przyniosą nie¬ 
wątpliwie odpowiedź na wiele problemów' otwartych, 
jeszcze nie rozstrzygniętych w dotychczasowych do¬ 
świadczeniach. 

G. Backenstoss Ann.Rev.Nuclear Sci. 20, 467 (1970); G. Bac- 
kenstoss i J. Zakrzewski Contemp. Phys. 15, 197 (1974); 
E.H.S. Burhop High-Energy Physics 3, 109 (1969) oraz Contemp. 
Phys. 11, 335 (1970); S. Devons i I. Duerdoth Advances Nuclear 
Phys. 2, 295 (1969); R. Sęki, C.E. Wiegand Kaonic and other 
Exotic Atoms , w: Ann. Rev. Nuci. Sci. 25, 241 (1975); C.S.Wu 
i L. Wilets Ann. Rev. Nuclear Sci. 19, 527 (1969). 


zderzenia z tarczą (przedmiot) i rejestrujemy energię 
i częstości kwantów wpadających do urządzenia po¬ 
miarowego (oko). Stwierdzamy, że wśród cząstek 
dochodzących po zderzeniu do detektora przeważają 
kwanty o energii 2 eV, a pozostałe cząstki zostały 
pochłonięte przez tarczę. Wnioskujemy stąd, że tarcza 
odbija promieniowanie elektromagnetyczne o długości 
fali 6,2*10“ 7 m. Potocznie mówimy, że przedmiot 
jest czerwony. W rzeczywistości to powiedzenie cha¬ 
rakteryzuje nie sam przedmiot (w świetle zielonym 
przedmiot będzie czarny), a proces oddziaływania 
z przedmiotem fal elektromagnetycznych o określo¬ 
nym rozkładzie długości fali. Oglądanie przedmiotu 
to badanie oddziaływania z nim światła. 

Rozszerzmy to określenie dopuszczając dowolne 
oddziaływanie czegokolwiek z badanym obiektem. 
Wtedy obmacywanie po ciemku ściany będzie rów- 


oddziaływa- 
nie mezonu#' 
z jądrem 12 C 
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oglądanie 

cząstek 


detektor 


nież jej oglądaniem. Takie rozszerzenie pojęcia wi¬ 
dzenia pozwoli nam obejrzeć cząstki elementarne. 
Postępowanie będzie analogiczne do oglądania przed¬ 
miotu. Należy w tym celu dysponować źródłem czą¬ 
stek, na przykład akceleratorem. Powinny mieć one 
odpowiednio dużą energię, aby długość fali de Brog- 
lie’a była rozmiarów porównywalnych lub mniejszych 
niż obszar oddziaływania. Przykładem oglądania pro¬ 
tonów jest eksperyment, w którym korzystano z wiąz¬ 
ki mezonów pi plus (n + ) o energii 16 GeV. Energii tej 
odpowiada długość fali de Broglie’a 7,7 *10" 17 m, co 
jest długością znacznie mniejszą niż rozmiary proto¬ 
nu. Zderzano mezony (piony) z tarczą z ciekłego wo¬ 
doru, a więc praktycznie z protonami i obserwowano 
cząstki rozproszone. 

Oczywiście na podstawie jednej obserwacji nie 
można wyciągać żadnych wniosków. Ze zderzenia 
jednego fotonu z przedmiotem też byśmy nic nie po¬ 
wiedzieli o kształcie i kolorze przedmiotu. Należy 
zbadać wiele, od kilkuset do kilkudziesięciu tysięcy 
zarejestrowanych zderzeń, aby móc coś powiedzieć 
o oddziaływaniu. 

Nie wchodząc na razie w zagadnienie co chcemy 
wiedzieć globalnie o badanym oddziaływaniu, może¬ 
my od razu wyliczyć co należałoby wiedzieć o każdej 
cząstce biorącej udział w każdym pojedynczym zda¬ 
rzeniu, wchodzącej lub opuszczającej obszar oddziały¬ 
wania. Najczęściej wystarcza znajomość energii 
i trzech składowych pędu każdej cząstki. Ideałem by¬ 
łaby znajomość również ustawienia w przestrzeni spi¬ 
nów pojedyncżych cząstek (o ile spin jest różny od 
zera), ale o tym można jeszcze tylko marzyć. W prak¬ 
tyce zagadnienie sprowadza się do wyznaczenia pędu 
oraz masy lub energii każdej interesującej w danym 
doświadczeniu cząstki. 

Bardzo często musimy się jednak ograniczać ze 
względów technicznych do niepełnej informacji, zre¬ 
dukowanej niekiedy tylko do sygnału czy cząstka 
przeszła przez detektor czy też nie. 

Nazwa „detektor” pochodzi od łacińskiego cza¬ 
sownika detegere — odkryć, odsłonić, wyjawić. De¬ 
tektor cząstek pozwala wykryć przejście cząstki i do¬ 
starcza różnych informacji umożliwiających identy¬ 
fikację i określenie stanu jej ruchu. Podstawą detekcji 
cząstek jest ich elektromagnetyczne oddziaływanie 
z materią (-> Oddziaływania elektromagnetyczne). 
Cząstki nie oddziałujące elektromagnetycznie (neu¬ 
trina) można zarejestrować obserwując produkty wy¬ 
woływanych przez nie reakcji zdolne do oddziaływań 
elektromagnetycznych. Celem detekcji jest znalezienie 
odpowiedzi na następujące pytania: Jaka cząstka zo¬ 
stała zarejestrowana? Jaka jest energia (pęd) cząstki? 
Jaka jest lokalizacja toru? W jakiej chwili pojawiła się 
cząstka? 

Rzadko udaje się, używając jednego typu detektora, 
uzyskać odpowiedź na wszystkie pytania. Toteż bu¬ 
duje się złożone układy detekcyjne. W tabeli przed¬ 
stawionej poniżej zestawione są zjawiska fizyczne mo¬ 
gące służyć do rejestracji i identyfikacji cząstek oraz 
stanu ich ruchu. 


Podstawowe zjawiska 
wykorzystywane przy rejestracji 
cząstek 

Rejestracja cząstki polega na zaobserwowaniu skut¬ 
ków oddziaływania cząstki z otaczającą ęnaterią. 
Poza bardzo słabymi oddziaływaniami grawitacyjnymi 
rozróżnia się oddziaływania słabe, silne i elektromag¬ 
netyczne. Te ostatnie są najczęściej wykorzystywane 
do rejestracji. Omówimy pokrótce te zjawiska fizycz¬ 
ne, które mogą służyć do rejestracji i identyfikacji 
cząstek (tabela poniżej). 


Ruch naładowanej cząstki w polu 
elektromagnetycznym 

Na poruszającą się naładowaną cząstkę o ładunku e 
w polu elektromagnetycznym działa siła 

F = e(EĄ-v x B ), 

gdzie E — wektor natężenia pola elektrycznego, B — 

wektor indukcji pola magnetycznego, v — wektor 
prędkości cząstki. Siła pochodząca od pola elektrycz¬ 
nego jest skierowana wzdłuż wektora tego pola, a przy¬ 
czynek od pola magnetycznego (proporcjonalny do ilo¬ 
czynu wektorowego v i B) jest prostopadły zarówno 
do prędkości, jak i do wektora indukcji pola. Spo¬ 
strzeżenie to jest bardzo ważne, albowiem w jedno¬ 
rodnym, stałym polu magnetycznym cząstka porusza 
się po okręgu (jeżeli nie traci energii po drodze), któ¬ 
rego promień krzywizny r zależy od pędu, ładunku 
i indukcji pola: 

p *0,3333 *10- 2 
r “ ZB 

gdzie r jest wyrażone w m, pęd p w MeV/c, indukcja 
B w teslach, a ładunek Z w jednostkach ładunku 
elementarnego. 

Znajomość krzywizny toru cząstki w znanym polu 
magnetycznym pozwala wyznaczyć stosunek pędu do 
ładunku, co w większości przypadków jest równo¬ 
znaczne z wyznaczeniem pędu, ponieważ praktycznie 
zawsze mamy do czynienia z cząstkami o ładunku 
jednostkowym (wyjątek stanowią oddziaływania z ją¬ 
drami atomowymi). Wielkość odchylenia w polu 
elektrycznym prostopadłym do ruchu cząstki zależy 
od prędkości cząstki, a nie od pędu. Układ, który 
wykorzystuje oba rodzaje pól, pozwala na wyznacze¬ 
nie pędu i energii cząstki, a zatem—jej masy. 


Rozpraszanie kulombowskie na jądrach 

Niezależnie od stosowania do identyfikacji cząstek 
silnych pól zewnętrznych można do tego celu wyko¬ 
rzystać silne pola elektryczne w pobliżu jądra. Nała¬ 
dowana cząstka przechodząca przez materię napotyka 


Zestawienie zjawisk lub wielkości pomocnych przy detekcji i identyfikacji cząstek 


Wielkość mierzona lub zjawisko 

Od czego zależy 

Uwagi 

Krzywizna toru w polu magnetycznym 

Krzywizna toru w polu elektrycznym 

Jonizacja i zjawiska pokrewne 

Zasięg 

Wielokrotne rozpraszanie 

Promieniowanie Czerenkowa 

Zjawisko Comptona i tworzenie par e + e~ 

Kaskada elektronowo-fotonowa 

Czas przelotu między dwoma licznikami 

Zderzenia sprężyste i rozpady cząstek nietrwałych 

pęd/ładunek 

pęd x prędkość/ładunek 

ładunek x prędkość 
ładunek x prędkość 
ładunek; 
pęd X prędkość 
ładunek x prędkość 
energia fotonu 
energia fotonu 
prędkość 
masa i energia 

bardzo często stosowane w pomiarach 
ograniczone zastosowanie ze względu na trudności 
uzyskania dużych pól 
pomiar często wykonywany 
pomiar stosowany do powolnych cząstek 
pomiar stosowany, gdy brak pola magnetycznego, 
a ślad jest dokładnie zarejestrowany 
szerokie zastosowanie w licznikach Czerenkowa 
stosowane w pomiarach kwantów y 
stosowane w pomiarach kwantów y i elektronów 
metoda elektroniczna szeroko stosowana 
metoda szczególnie przydatna do badania cząstek 
neutralnych; stosuje się ją również do naładowa¬ 
nych 


rejestracja 

cząstki 


wyznaczanie 

pędu 
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obszary o natężeniu pola elektrycznego rzędu 10 1( * 
V/m. Istnienie tak dużych pól zawdzięczamy ładun¬ 
kom elektrycznym jądra. Te silne pola elektryczne po¬ 
wodują tzw. rozpraszanie kulombowskie. Przecho¬ 
dząc przez warstwę substancji, cząstka wielokrotnie 
ulega rozpraszaniu kulombowskiemu. Małe pojedyn¬ 
cze rozproszenia w różnych kierunkach dodają się 
i obserwujemy wypadkowe średnie wielokrotne roz¬ 
proszenie. W nieobecności zewnętrznego pola elek¬ 
tromagnetycznego tor cząstki naładowanej powinien 
być prosty. Jednak wskutek wielokrotnego rozprasza¬ 
nia kulombowskiego odchyla się on od prostej, przy 
czym średni kwadrat kąta rozproszenia zależy od pędu 
cząstki i od właściwości ośrodka, przez który cząstka 
przechodzi. Średni kwadrat kąta rozproszenia <0 2 > 
(w radianach) można w przybliżeniu wyrazić w zależ¬ 
ności od pędu cząstki p (podanego w MeV/c), jej 
prędkości & (wyrażonej w stosunku do prędkości 
światła) i stałej X charakteryzującej materiał ośrodka, 
długość przez który cząstka przechodzi, zwanej długością ra- 
radiacyjna diacyjną (podanej w centymetrach): 



W tabeli zestawiono wartości długości radiacyjnej 
kilku częściej używanych substancji. Z porównania 
danych widać, że średnie kulombowskie rozproszenie 


Minimalne straty energii na jednostkę drogi cząstki 
w różnych substancjach 


Substancja 

Gęstość 

g/cm 3 

Długość 

radiacyjna 

X , cm 

MeV 

\ dxjm ln cm 

Ciekły wodór 

0,063 

1000 

0,26 

Propan C 3 H 8 

0,41 

111 

0,98 

Ksenon 

2,3 

3,9 

2,8 

Emulsja jądrowa 

3,82 

2,94 

5,49 

Ołów 

11,35 

0,56 

12,8 


jest praktycznie pomijalne dla cząstek poruszających 
się w wodorze (w dokładnych pomiarach uwzględnia 
się jednak to zjawisko), ale może znacznie zniekształcić 
tory w ksenonie. Ilustracją są zdjęcia torów z komór 
wypełnionych wodorem, propanem i ksenonem 
(tabl. 9, il. 28). W ksenonie wielokrotne kulombow¬ 
skie rozpraszanie odgrywa tak doniosłą rolę, że prak¬ 
tycznie uniemożliwia stosowanie zewnętrznych pól 
magnetycznych. Musiałyby one mieć ogromną induk¬ 
cję, aby dominować nad wielokrotnym rozpraszaniem. 


Straty energii na jonizację 

Przechodząc przez materię, naładowana cząstka od¬ 
daje część swojej energii napotkanym atomom powo¬ 
dując ich wzbudzenie lub jonizację. Dostarczona ener¬ 
gia zostaje pochłonięta przez któryś z elektronów po¬ 
włoki atomowej przeniesiony do wyższego stanu ener¬ 
getycznego. Jeżeli energia ta jest dostatecznie duża, to 
elektron może się całkowicie uwolnić z atomu. Mówi¬ 
my wtedy o jonizacji atomu. Przechodząca cząstka 
pozostawia więc ślad w postaci wzbudzonych lub zjo- 
nizow'anych atomów. Ilość takich wytrąconych z rów¬ 
nowagi atomów jest ważną informacją o przejściu 
i o samej naturze cząstki. 

Straty energii na jonizację lub wzbudzenie są spo¬ 
wodowane niesprężystym oddziaływaniem kulom- 
bowskim przelatującej cząstki z elektronami. Rysu- 
zaleźność nek 1 ukazuje zależność względnej jonizacji (stosunku 
względnej straty energii na jednostkę długości do minimalnej 
jonizacji możliwej straty energii) od pędu dla mezonów K 
od pędu i protonów. Umiejąc ocenić jonizację cząstki i znając 
jej pęd, możemy ją zidentyfikować. Rysunek ten moż¬ 
na uprościć wykreślając względną jonizację w zależ¬ 
ności od pędu podzielonego przez masę cząstki razy 
prędkość światła (rys. 2), Pokazana na nim krzywa 
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Rys. 1. Zależność względnej jonizacji gazu używanego w urzą¬ 
dzeniu identyfikującym cząstki od pędu protonów i mezonów K 



Rys. 2. Zależność względnej jonizacji od zmiennej pfnic. Krzywa 
jest uniwersalna dla cząstek o dowolnej masie i ładunku jedno¬ 
stkowym 


jest uniwersalna, tzn. że można ją stosować do cząstek 
o dowolnej masie, a ładunku —jednostkowym. 

Początkowo krzywa jonizacji względnej maleje 
bardzo szybko, odwrotnie proporcjonalnie do kwa¬ 
dratu prędkości cząstki, osiąga wartość minimalną 
(minimum jonizacji) i wzrasta do wartości maksy¬ 
malnej (maksimum jonizacji), przy której się utrzy¬ 
muje niezależnie od energii. Obszar malenia jonizacji 
z energią i obszar wzrostu są wykorzystywane do iden- 
tyfikacji cząstek. 

Znając stratę energii na jednostkę przebytej drogi, 
można obliczyć zasięg cząstki, czyli drogę, na której 
straci całą swoją energię na jonizację i zatrzyma się 
w ośrodku. Można wykazać, że stosunek zasięgu R 
do masy cząstki m zależy tylko od stosunku energii 
cząstki E do jej masy: 

R/m = 

Jeżeli więc znana jest krzywa zasięg-energra jakiej¬ 
kolwiek cząstki w danej substancji, to można łatwo 
wykreślić również krzywą dla innej cząstki o tym -sa¬ 
mym ładunku. Dla stosunkowo powolnych cząstek, 
a tylko takie mają szanse zatrzymać się w urządze¬ 
niach detekcyjnych, zasięg R można wyrazić zależ¬ 
nością przybliżoną: 

R ~ /n _2 'V 3 ' 3 . 

Tak więc proton o tym samym pędzie co mezon n 
zatrzyma się po przebyciu drogi prawie 80 razy krót¬ 
szej niż pion, ponieważ ma 6,7 razy większą masę. 


Mechanizm scyntylacji 

Atomy wzbudzone pozbywają się energii emitując 
promieniowanie elektromagnetyczne, czyli po prostu 
świecą. Średni czas życia stanu wzbudzonego jest 


względna 

jonizacja 


rozróżnianie 
cząstek wg 
zasięgu 













rzędu 10 “ 9 - 10“ 8 s, a więc świecenie jest praktycznie 
natychmiastowe. W omawianym wypadku interesuje 
radiotami- nas zjawisko fluorescencj i lub radioluminescencji, czyli 
nescencja fluorescencji pod działaniem cząstek jonizujących. 

Substancję, w której można obserwować radiolumi- 
nescencję, nazywamy scyntylatorem. Dobrymi ma¬ 
teriałami scyntylacyjnymi są niektóre gazy, przede 
wszystkim szlachetne, związki organiczne oraz krysz¬ 
tały nieorganiczne. Niektóre typy scyntylatorów omó¬ 
wimy opisując detektory scyntylacyjne. 


Zjawisko Czesankowa 


Badając w 1934 r. zjawisko emisji światła przy prze¬ 
chodzeniu przez substangę cząstek jonizujących, 
Czerenkow zauważył, że istnieje silna korelacja między 
kierunkiem padania cząstek i kierunkiem emisji 
światła. Jeżeli cząstka jonizująca porusza się w ośrod¬ 
ku o współczynniku załamania n v dla promieniowania 
o częstości v> a jej prędkość v jest większa niż prędkość 
światła w tym ośrodku cjn v : 

c 


czyli 



to cząstka wysyła promieniowanie elektromagnetycz-- 
ne w stożku skierowanym w kierunku lotu cząstki 



(rys. 3). Fale o różnej częstości będą wysyłane pod 
różnymi kątami: 

cos 0 V = - 5 — . 

/?«v 

Im większa prędkość cząstki padającej, tym większe 
rozwarcie stożka. Maksymalny kąt rozwarcia 

1 

0vmax — arc COS — — — • 

flv 

Typowe wartości parametrów charakteryzujących 
zjawisko Czerenkowa zestawiono w tabeli. 


Wartości parametrów charakteryzujących zjawisko 
Czerenkowa 



Materiał 

Parametr 

tworzywo 

perspcx 

woda 

powietrze 

Współczynnik 



1,00029 

załamania, n 

1,5 

1,33 

0 max = arc cos I Jn 

48° 

41° 

1,3° 

fimin — 1 In 

Minimalny pęd czą¬ 

0,667 

0,751 

0,9997 

stek odpowiadający 

fimlnl 

elektronu 

0,46 MeV/c 

0,58 MeV/c 

21 MeV/c 

mezonu n 

125 MeV/c 

159 MeV/c 

5,7 GeV/c 

protonu 

840 MeV/c 

1,067 GeV/c 

38 GcV/c 


Promieniowanie Czerenkowa pojawia się dopiero 
wtedy, gdy pęd cząstki przekroczy pewną progową 
wartość zależną od jej masy. Zjawisko to znalazło 
szerokie zastosowanie w identyfikacji cząstek. 

«> ) . .. ! 

Promieniowanie hamowania 

Jeżeli poruszająca się cząstka naładowana doznaje 
opóźnienia w jakimś polu zewnętrznym (np. jeżeli 


jest przyhamowana w polu jądra, albo tylko zmienia 
kierunek), to emituje kwant promieniowania elektro¬ 
magnetycznego. Promieniowanie to nazywamy pro¬ 
mieniowaniem hamowania. Jest ono szczególnie waż¬ 
ne dla elektronów. Jeżeli foton o dużej energii prze¬ 
chodzi przez substancję, to jest duże prawdopodo¬ 
bieństwo, że wytworzy parę e+e~. Każdy z elektro¬ 
nów spowalniany w substancji wysyła kwanty pro¬ 
mieniowania hamowania, te z kolei mogą znowu 
tworzyć pary e+e~ i proces powtarza się, w wyniku 
czego tworzy się kaskada elektronowo-fotonowa. 
Ilustracja 29 (tabl. 10) przedstawia rozwój kaskady 
elektronowo-fotonowej zarejestrowanej w ksenono- 
w'ej komorze pęcherzykowej. 


Oddziaływanie elektromagnetyczne 
kwantów y 

Kwanty y , czyli kwanty promieniowania elektromag¬ 
netycznego o dużej energii, są obojętne elektrycznie. 
O ich przejściu przez substancję możemy wnioskować 
na podstawie charakterystycznych zjawisk oddziały¬ 
wania elektromagnetycznego z materią. 

Kwant y o dużej energii, przechodząc przez materię, 
może się zderzyć z elektronem. W wyniku zderzenia 



Rys. 4. Zjawisko Comptona 


następuje przekazanie elektronowi części energii, 
kwant 7 ze zmniejszoną energią zmienia kierunek lotu, 
a elektron zostaje odrzucony z pewną prędkością 
(rys. 4). Energia, a więc częstość V rozproszonego 
kwantu, E' = hv\ zależy od kąta rozproszenia 0 
i energii pierwotnej E — hv: 

__ Em e c 2 _ 

m e c Ł -\-E{\ — cos 0 ) * 

Energia rozproszonego kwantu jest maksymalna 
(£" = E), gdy 0 = 0, i minimalna, gdy 0 = n. Dla 



energia y 

Rys. 5. Przekrój czynny na tworzenie się par e + e~ i zjawisko 
Comptona w powietrzu wyrażony w jednostkach 4,5-lO - * 4 cm* 
na nukleon 
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dużych energii E > m e c\ £^ ax = m e c 2 j2. Rysunek 5 
przedstawia wykres przekroju czynnego na rozpra¬ 
szanie komptonowskie w powietrzu kwantów y w za¬ 
leżności od ich energii. Na zdjęciu (tabl. 10, il. 32) 
pokazano elektron zarejestrowany w komorze freo¬ 
nowej wybity w zjawisku Comptona. W procesie tym 
zjawisko kwant y znika, a jego energia przekształca się 
tworzenia par całkowicie w energię pary elektron-pozyton. Zdjęcie 
ilustruje powstanie pary elektronowo-pozytonowej 
w komorze wodorowej w obecności pola magnetycz¬ 
nego. Z kierunku zakrzywienia torów wnioskujemy, 
że musiały to być cząstki o przeciwnych znakach. Ze 
względu na zasadę zachowania pędu produkcja par 
musi następować w pobliżu jądra, które przejmuje 
część pędu fotonu. Przekazanie energii jądru można 
pominąć, ponieważ ma ono masę znacznie większą 
od elektronu. Prawo zachowania energii może być za¬ 
pisane w postaci 

E — E' -f E" -\-2m e c 2 , 

gdzie E' i E" są energiami kinetycznymi pozytonu 
i elektronu, a E — energią fotonu. Na rys. 5 przed¬ 
stawiono przekrój czynny na tworzenie par w zależ¬ 
ności od energii. Porównanie z zależnością przekroju 
czynnego na rozpraszanie komptonowskie wskazuje, 
że przy dużych energiach najważniejszym zjawiskiem 
pozwalającym wnioskować, że przez materię przele¬ 
ciał foton, jest tworzenie się par. 


Inne zjawiska 

Z praktycznego punktu widzenia należy wymienić 
jeszcze dwa zjawiska stanowiące oddziaływanie elek¬ 
tromagnetyczne fotonu z całym atomem: zjawisko 
fotoelektryczne i zjawisko wzbudzenia atomu. Wzbu¬ 
dzenie atomu omawialiśmy przy okazji przechodzenia 
promieniowania jonizującego przez materię. Powro¬ 
towi atomu do niższego stanu energetycznego może 
towarzyszyć emisja promieniowania, które łatwo zare¬ 
jestrować w detektorze. 

Zjawisko fotoelektryczne, polegające na wybijaniu 
z substancji elektronów, ma duże zastosowanie w foto- 
powielaczach, pozwalających rejestrować słabe sygna¬ 
ły świetlne. 


Detektory cząstek 


Cząstki — i to zarówno naładowane elektrycznie, jak 
i neutralne — mają zawsze różne od zera prawdopo¬ 
dobieństwo oddziaływania z materią, przez którą 
przechodzą. Niekiedy to prawdopodobieństwo od- 
oddzialywa- działywania jest niezwykle małe, jak np. neutrina, 
nie cząstek które bierze udział tylko w oddziaływaniach słabych, 
z materią Wtedy o przejściu takiej cząstki możemy wnioskować 
tylko na podstawie zaobserwowanych produktów od¬ 
działywania słabego. W znacznie lepszej sytuacji 
jesteśmy, badając cząstki, które mogą brać udział 
w procesach elektromagnetycznych. Oddziałując elek¬ 
tromagnetycznie z materią, zostawiają śladnp. w pos¬ 
taci zjonizowanych atomów (tym samym sygnalizują 
swoje przejście), przy czym tracą na to bardzo mało 
energii. 

Problem detekcji cząstek sprowadza się do zaobser¬ 
wowania i zinterpretowania pozostawionych przez 
cząstkęśladów. Ze względów praktycznych detektory 
dzieli się na takie, które możliwie wiernie rejestrują 
ślad cząstki (detektory śladowe), oraz takie, w których 
istotne jest tylko zarejestrowanie faktu, że cząstka 
przeszła, i ewentualnie określenie jej natury. Granica 
podziału zaciera się obecnie coraz bardziej, buduje się 
bowiem układy hybrydowe, w których możliwie do¬ 
kładnie określa się i tor cząstki i jej naturę za pomocą 
wielu typów współdziałających detektorów. 


Emulsja jądrowa 

Historia zastosowania emulsji fotograficznej do reje¬ 
stracji cząstek sięga badań A. Becąuerela w 1896 r. 
nad fluorescencją związków uranu. Zauważył on, że 
związki te zadymiały kliszę fotograficzną. Chociaż 
Becąuerel szybko się przekonał, że zadymienie nie 
miało nic wspólnego z fluorescencją, minęło wiele lat, 
zanim stwierdzono, że jest ono związane z przechodze¬ 
niem przez emulsję cząstek jonizujących. Dopiero 
w 1911 r. M. Reinganum zarejestrował fotograficznie 
ślad cząstki a, ale przez wiele następnych lat nie umia¬ 
no wyprodukować takiej emulsji fotograficznej, która 
byłaby czuła na dowolne cząstki naładowane. W1948 r. 
firma Kodak dokonała tego, a odtąd udoskonalano 
emulsje wielokrotnie i stosowano w wielu ekspery¬ 
mentach. 

Emulsja fotograficzna składa się z halogenków 
srebra, głównie AgBr w zawiesinie żelatynowej. 

Reakcja na światło lub na cząstki zależy od jonizacji 
wytworzonej w aktywnych ziarnach. Jonizacja ta, czyli 
oderwanie elektronu z powłoki atomowej, powstaje 
w wyniku przekazania atomowi przez przechodzącą 
cząstkę naładowaną lub kwant promieniowania elek¬ 
tromagnetycznego odpowiedniej energii. Jonizacja 
atomów nie powoduje żadnych widocznych zmian w 
ziarnach halogenków srebra, lecz zmienia ich struk¬ 
turę w ten sposób, że mogą reagować z czynnikiem 
wywołującym. Ziarna, w których nie nastąpiła joni- mechanizm 
zacja, nie dają się wywołać. Mechanizm zmian we- rejestracji 
wnętrznych w ziarnie kryształu bromku srebra można 
w przybliżeniu przedstawić następująco: Na po¬ 
wierzchni kryształu AgBr są małe centra czułości skła¬ 
dające się z cząsteczek Ag 2 S, które mogą wychwyty¬ 
wać swobodne elektrony poruszające się w krysztale. 

Elektrony uwolnione z atomów wskutek ich jonizacji 
dyfundują aż na powierzchnię kryształu i tam są wy¬ 
łapywane przez centra czułości, które ładują się ujem¬ 
nie. W krysztale AgBr są zawsze swobodne dodatnio 
naładowane jony srebra, które wskutek dyfuzji rów¬ 
nież mogą dotrzeć do ujemnych już teraz centrów 
czułości. Tam następuje zobojętnienie ładunków i na 
powierzchni kryształu osadzają się kryształy srebra — 
powstaje obraz utajony. W procesie wywoływania 
srebro to katalizuje redukcję jonów srebra z wnętrza 
kryształu do srebra metalicznego. Tak powstaje obraz 
wywołany. Na str. 216 (rys. 1) przedstawione jest his¬ 
toryczne już dzisiaj zdjęcie pierwszego zarejestrowa¬ 
nego przypadku produkcji i rozpadu najprawdopo¬ 
dobniej hiperjądra ”B, czyli jądra boru 11, w którym 
jeden z nukleonów został zastąpiony przez hiperon 
A °. Zdarzenie to zaobserwowali w 1953 r. Marian 
Danysz i Jerzy Pniewski z Uniwersytetu Warszaw¬ 
skiego, zapoczątkowując tym odkryciem nową dzie¬ 
dzinę fizyki — fizykę hiperjąder. 

Spójrzmy uważnie na zdjęcie z punktu widzenia wyznaczania 
charakteru torów. Niektóre z nich są ciemne, „tłu- pędu i 
ste” — to te pozostawione przez cząstki o dużym ła- prędkości 
dunku, np. przez hiperfragment “B, lub cząstki bar¬ 
dzo powolne. Gęstość liniowa ziaren srebra jest miarą 
jonizacji. Z odstępstw śladu od linii prostej można 
wyznaczyć średnią wartość kwadratu wielokrotnego 
rozproszenia. Te dwa pomiary pozwalają na określe¬ 
nie pędu i prędkości cząstki, a co za tym idzie—jej 
masy. 

Technika emulsji jądrowych przeżyła już okres 
swojej świetności. Jest jednak używana jako technika 
pomocnicza, szczególnie gdy wymagana jest duża 
zdolność rozdzielcza, długi czas czułości oraz małe 
rozmiary detektora. 


Komora Wilsona (komora mgłowa) 

Zjonizowane atomy w przesyconej (przechłodzonej) 
parze odgrywają rolę zarodzi kondensacji dla krope¬ 
lek cieczy powstających ze skraplającej się pary. Ko¬ 
mora Wilsona składa się zasadniczo z naczynia zawie- 
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rającego gaz w stanie dalekim od skroplenia oraz parę 
jakiejś cieczy nasyconą lub bliską nasycenia. Objętość 
naczynia można nagle powiększać. Temperatura mie¬ 
szaniny przy tym maleje i para przechodzi w stan prze¬ 
sycenia. Jeżeli w gazie jest kurz, nawet niewielkie roz¬ 
prężenie powoduje powstanie w całym naczyniu 
mgły, ponieważ kondensacja rozpoczyna się na czą¬ 
steczkach pyłu. W komorze wolnej od pyłu nie obser¬ 
wuje się kondensacji, dopóki stosunek objętości ko¬ 
mory po i przed rozprężeniem (stosunek rozprężenia) 
granica n ie osiągnie tzw. granicy jonowej. Po jej przekrocze- 
jonowa niu kropelki cieczy pojawiają się tam, gdzie są jony. 

W silnym oświetleniu kropelki te widać jako jaskrawe 
punkty na czarnym tle. Jony powstałe wskutek przej¬ 
ścia przez komorę naładowanej cząstki są zarodziami 
kropelek układających się w ślad cząstki. Ilustracja 27 
(tabl. 9) przedstawia wykonaną przy użyciu komory 
Wilsona pierwszą rejestrację hiperonu E~ (ksi), który 
się rozpada na hiperon A° i mezon n~ : 

S~ -y A Q +n ~. 

Hiperon A° z kolei rozpada się na proton i tC. Stąd 
załamanie śladu cząstki pierwotnej jest miejscem roz¬ 
padu hiperonu E~ na hiperon neutralny A °, który nie 
zostawił śladu w komorze, i ujemnie naładowany tC. 
Hiperon A° przeleciał pewien odcinek drogi i rozpadł 
się na dwie cząstki naładowane, tworząc charaktery¬ 
styczny ślad w kształcie widełek. 

Komory Wilsona nie są obecnie stosowane. Są one 
mało wydajne, ponieważ nie można zbyt często po¬ 
wtarzać rozprężenia. Gaz wypełniający ma niewielką 
gęstość, czyli małą liczbę jąder w porównaniu z emul¬ 
sją jądrową lub komorą pęcherzykową, i dlatego praw¬ 
dopodobieństwo zaobserwowania oddziaływania jest 
stosunkowo małe. Komora Wilsona nadaje się nato¬ 
miast do badania cząstek promieniowania kosmicz¬ 
nego. Jony w tej komorze żyją dostatecznie długo, 
aby można było wywoływać rozprężenie w jakiś czas 
po przejściu cząstki. Pozwala to na współpracę ko¬ 
mory z licznikowym urządzeniem wyzwalającym roz¬ 
prężanie wtedy, gdy zdarzenie spełnia założone kry¬ 
teria. 


Komora pęcherzykowa 

W komorze tej pęcherzyki pary tworzą się w cieczy 
przegrzanej. Istnienie stanu cieczy przegrzanej jest 
zjawiskiem bardzo dobrze znanym. Wiadomo rów¬ 
nież, że naruszenie równowagi przez dostarczenie 
niewielkich nawet ilości energii zapoczątkowuje pro¬ 
ces wrzenia. Przejście z jednego do drugiego stanu 
skupienia jest przejściem fazowym I rodzaju (-► 
Przejścia fazowe). Jeżeli nowym stanem skupienia 
jest ciecz (albo gaz), powierzchnia rozdziału faz przy- 
. biera kształt kuli, aby zminimalizować energię po- 
promien w j erzc hniową. Można wykazać, że istnieje promień 
krytyczny Wytyczny takiej kuli, poniżej którego nowa faza jest 
niestabilna, powyżej zaś kuta rośnie, a metatrwały 
stan starej fazy zanika. Aby kula — pęcherzyk osiąg¬ 
nęła promień krytyczny, należy wykonać pewną pra¬ 
cę. Jeżeli nie ma mechanizmu dostarczającego energię, 
krytyczny promień nigdy nie zostaje osiągnięty i ciecz 
pozostaje w początkowym stanie skupienia nieskoń¬ 
czenie długo. 

Cząstka naładowana, przelatując przez przegrzaną 
ciecz, jonizuje atomy, czyli dostarcza im energii. 
Jeżeli energia ta zostanie przekazana pęcherzykom 
pary, będą one mogły osiągnąć krytyczny promień 
i wzdłuż śladu cząstki rozpocznie się wrzenie cieczy. 

Pomijając szczegółowe rozważania teoretyczne co 
do mechanizmu przekazywania energii cząstki pęche¬ 
rzykowi pary, stwierdzamy, że podwyższenie tem¬ 
peratury w pęcherzyku powoduje wzrost jego roz¬ 
miaru powyżej promienia krytycznego, a tym samym 
umożliwia dalszy jego rozwój. Duży pęcherzyk można 
zobaczyć widząc tym samym ślad cząstki. Rysunek 6 
przedstawia wykres zależności ciśnienia od temperatu- 



Rys. 6. Krzywa ciśnienie-temperatura dla ciekłego wodoru. Pio¬ 
nowa linia wskazuje możliwe warunki pracy komory 


ry dla ciekłego wodoru. Obszar zacieniowany odpo¬ 
wiada takim wartościom ciśnienia i temperatury, 
w których się nie rozpoczyna jeszcze samorzutne wrze¬ 
nie, lecz energia jonizacji jest już wystarczająca do 
wzrostu pęcherzyków. Jest to obszar czułości. Piono¬ 
wa linia odpowiada pracy komory w temperaturze 
T — 27 K. Zasada działania komory jest prosta. 
Załóżmy, że ciecz komory jest we właściwej temperatu¬ 
rze. Jedynym problemem jest sterowanie ciśnieniem. 
W pierwszej fazie ciśnienie jest większe niż ciśnienie 
pary nasyconej (/). W drugiej fazie następuje rozprę¬ 
żenie do ciśnienia odpowiadającego obszarowi czu¬ 
łości (2). Jeżeli teraz przez komorę przejdzie cząstka 
naładowana, to zjonizuje atomy na swej drodze i do¬ 
starczy energii na wzrost pęcherzyków do rozmiarów 
krytycznych. Pęcherzyki rosną przez kilka milisekund 
i są fotografowane. Ostatnią fazą jest zwiększanie 
ciśnienia do stanu początkowego. Rysunek 7 pokazuje 
schematyczny szkic komory pęcherzykowej. 


wysokie ciśnienie niskie ciśnienie 



Rys. 7. Schemat komory pęcherzykowej 

Widać stąd, jak bardzo ważną rzeczą jest synchro¬ 
nizacja czasu nadejścia cząstki, chwili rozprężenia 
komory i zapłonu lamp błyskowych, umożliwiających 
fotografowanie. Dlatego komora pęcherzykowa może 
współpracować tylko z akceleratorem, wtedy dokład¬ 
nie wiadomo, w której chwili nadleci wiązka przy¬ 
spieszanych cząstek. Schemat blokowy sterowania 
komorą podaje rys. 8. Na rys. 9 przedstawiono moż¬ 
liwy zapis oscyloskopowy impulsów informujących 
o przebiegu pracy układu akcelerator-komora. 
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Rys. 8. Schemat blokowy sterowania komorą 


impuls przybycie cząstek 



czas w milisekundach 


Rys. 9. Przykład zapisu oscyloskopowego impulsów steru¬ 
jących komorą i zmian ciśnienia 



Rys. 10. Przekrój pionowy przez Wielką Europejską Komorę 
Pęcherzykową 

Pierwszą komorę pęcherzykową zbudował D.A. 
Glaser w 1953 r. Była ona bardzo mała. Zdjęcie 
33 (tabl. 10) przedstawia ślad elektronu w szklanej ko¬ 
morze pęcherzykowej o rozmiarach: V 2 cala (1,27 cm) 
średnicy i 1 cal (2,54 cm) długości, wypełnionej izo- 
pentanem, w temperaturze 130°. W następnych latach 
rozwinięto technikę budowy komór wypełnionych 
różnymi cieczami, w szczególności ciekłym wodorem. 


Największa istniejąca obecnie komora wodorowa BEBC 
BEBC {Big European Bubble Chamber) mieści 33,5 m 3 
wodoru. Na rys. 10 jest schematyczny przekrój tej 
komory. Całość jest umieszczona w polu magnetycz¬ 
nym 3,5 T nadprzewodzącego magnesu. Celem 
uzmysłowienia skali urządzenia na dolnym podeście 
narysowana jest postać Judzka. Na zdjęciu 35 (tabl. 

11), pokazano komorę wraz z urządzeniem do identy¬ 
fikacji cząstek. 

Badania z użyciem komór wodorowych ogromnie 
rozszerzyły zakres wiedzy o cząstkach i ich oddzia¬ 
ływaniach. 


Komory iskrowe 

Podstawową rolę w komorach iskrowych odgrywa 
wyładowanie w gazie w przerwie między dwiema elek¬ 
trodami (rys. 11). Między elektrodami wytwarza się 
różnicę potencjałów dostatecznie dużą, aby spowodo¬ 
wać wyładowanie elektryczne, jeżeli w przerwie mię¬ 
dzy nimi pojawią się elektrony lub jony. Przebieg 
zjawiska jest złożony. W uproszczeniu można po¬ 
wiedzieć, że jony i elektrony w zewnętrznym polu 



Rys. 11. Zasada działania komory iskrowej 


elektrycznym uzyskują dostateczną energię, by jo¬ 
nizować napotkane atomy, wywołując tym samym la¬ 
winowe narastanie wyładowania. Przeskok iskry nas¬ 
tępuje najłatwiej w miejscu, gdzie się znajdują zjo- 
nizowane atomy. Przestrzeń między płytami odle¬ 
głymi o 1-2 cm wypełnia się gazem. Stosując szereg 
równoległych płyt pod napięciem, można uzyskać ślad 
toru w postaci szeregu iskier. Zdjęcie 30 (tabl. 10) 
zostało wykonane w dużym układzie komór iskrowych 
zbudowanym w Zjednoczonym Instytucie Badań 
Jądrowych w Dubnej. Widać na nim oddziaływanie 
pionu o energii 40 GeV z jądrem żelaza, w wyniku 
czego powstało 6 cząstek naładowanych. Zdjęcie to metody 
było przykładem optycznego (fotograficznego) od- odczytu 
czy tu informacji. W praktyce stosuje się jeszcze inne informacji 
metody, np.: 

metoda akustyczna, polegająca na detekcji fali 
dźwiękowej towarzyszącej iskrze: 

metoda rdzeni ferrytowych, które ulegają przemag- 
nesowaniu przez prąd iskry; informację o przemag- 
nesowaniu rdzeni odczytuje się elektrycznie; 

metoda magnetostrykcji; w pobliżu drutów zasila¬ 
jących umieszcza się metalowy pręt; gdy przeskakuje 
iskra, w pręcie generuje się mechaniczny impuls; 
opóźnienie w dotarciu fali sprężystej do końca pręta 
określa pozycję drutu, a więc i płyty, która brała 
udział w wyładowaniu; 

metoda pojemnościowa; przeskok iskry powoduje 
zmianę pojemności w układzie kondensatorów 
sprzężonych z płytami; rejestrację przeprowadza 
układ elektroniczny. 

Bardzo dokładne informacje o współrzędnych toru 
cząstki (z dokładnością do 100 j«m) można uzyskać 
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z komory iskrowej z przerwą miedzy płytami rzędu 
4-10 cm. Iskra biegnie wtedy prawie dokładnie wzdłuż 
śladu jonizacji. Zjawisko rozwoju wyładowania w ga¬ 
zie, będące podstawą działania komory iskrowej, jest 
wykorzystywane w pokrewnych typach detektorów, 
jak np. komora dryfowa, strimerowa, proporcjonalna 
wielodrutowa. Komory dryfowa i proporcjonalna 
wielodrutowa wykorzystują zjawisko wzmocnienia 
gazowego. Chmura elektronów wytworzona przez jo¬ 
nizującą cząstkę porusza się (dryfuje) w kierunku 
bardzo cienkiego przewodnika (np. pozłacany drut 
wolframowy o średnicy 20 pm). W pobliżu (ok. 50 
jim) drutu istnieje pole elektryczne o bardzo dużym 
natężeniu, tak przyspieszające elektrony, że następuje 
jonizacja lawinowa atomów. Wypadkowy impuls po¬ 
tencjału na drucie może być wzmocniony 10° razy 
w stosunku do impułsu, jaki by wywołała pierwotna 
chmura elektronów. 

W komorze dryfowej mierzy się opóźnienie sygnału 
z drutu względem chwili przejścia cząstki przez ko¬ 
morę wyznaczonej za pomocą np. licznika scyntyla- 
cyjnego. Znając prędkość dryfu (rzędu 5-10* cm/s 
przy natężeniu pola 1 kV/cm), można ocenić położe¬ 
nie miejsca, w którym nastąpiła jonizacja, z dokład¬ 
nością do 100 pm. 

W komorze drutowej, złożonej z dużej liczby cien¬ 
kich drutów' odległych od siebie o 1-5 mm, sygnał 
z drutu określa równocześnie jego pozycję. Należy 
stosować układy wzajemnie prostopadłych przewodni¬ 
ków, jeżeli się chce odczytać trzy współrzędne miej¬ 
sca, w którym cząstka zjonizowała gaz. Komora 
strimerowa jest komorą iskrową o dużej przerwie. 
Napięcie przykłada się do elektrod na bardzo krótko 
(2 * I0“ s s), tak że iskra dopiero się zaczyna formować. 
Na filmie fotografuje się zaczątki iskier (strimery), 
które pokazują przebieg cząstki. Wszystkie detektory 
oparte na zasadzie rozwoju wyładowania w gazie 
odznaczają się dużą szybkością działania, tzn. mogą 
wykonać kilka milionów' rejestracji w ciągu sekundy. 
Ma to ogromne znaczenie przy poszukiwaniu i ba¬ 
daniu rzadkich procesów. 


Liczniki Czerenkowa 

W działaniu licznika wykorzystuje się zjawisko 
Czerenkowa. Cząstka jonizująca przechodzi przez 
odpowiednio dobrany ośrodek, zwany konwerterem. 
Promieniowanie elektromagnetyczne zjawiska Czeren- 
kow'a, w w-iększości w zakresie długości fal widzial¬ 
nych, jest rejestrowane przez fotopowielacze i daje 
informację o przejściu cząstki o prędkości większej niż 
prędkość graniczna (patrztabela str. 1II),a więc licz¬ 
nik Czerenkowa jest licznikiem progowym. Ponieważ 
emisja promieniowania elektromagnetycznego odby¬ 
wa się pod ściśle określonym kątem do kierunku lotu 
cząstki, zależnym od jej prędkości i współczynnika 
załamania ośrodka konwentera, można budować licz¬ 
niki czułe tylko na wybrane cząstki. Światło emitowa¬ 
ne w stożku o określonym kącie rozwarcia jest 
ogniskowane na pierścieniu z fotopowielaczy. Fotony 
nie spełniające danych kryteriów są ogniskowane poza 
obszarem czułego pierścienia i nie są rejestrowane. 
Prędkość fi wszystkich cząstek o dużej energii — nie¬ 
zależnie od ich masy — zdąża do jedności {0 — v/c). 
W takim wypadku konwerter musi mieć współczynnik 
załamania bliski jedności, 

n < 1 Ifi, 

i dlatego trzeba używać gazu pod małym ciśnieniem. 
To z kolei zmniejsza ilość fotonów emitowanych na 
jednostkę drogi w konwerterze i zmusza do stosowania 
bardzo długich konwerterów'. 

Licznik ogniskujący fotony promieniowania Czeren¬ 
kowa na w ; ybranym pierścieniu pozwala określić 
równocześnie kierunek lotu i prędkość. Ilustracja 36 
na tablicy 11 przedstawia wygląd zewnętrzny licznika 
Czerenkowa. 


Licznik proporcjonalny 

Zasadę działania tego typu detektora ilustruje rys. 12. 
W przew odzącej rurce wypełnionej gazem przeciągnię¬ 
ty jest wzdłuż osi cienki drut. Między rurką a osłoną 
panuje różnica potencjałów ok. 1 kV. Przejściu 



Rys. 12. Zasada działania licznika proporcjonalnego 


cząstki naładowanej przez licznik towarzyszy joni¬ 
zacja. Swobodne ładunki elektryczne w ; ędrują do e- 
lektrod. W pobliżu środkowej elektrody następuje 
zjawisko wzmocnienia gazowego, tak więc ładunek 
elektryczny powstający na elektrodzie zbierającej 
licznika jest N razy większy od ładunku jonizacji współczynnik 
pierwotnej. Współczynnik N nazywa się współczyn- wzmocnienia 
nikiem wzmocnienia gazowego; jego wartość zależy gazowego 
od napięcia zasilania oraz rodzaju i ciśnienia gazu 
wypełniającego licznik. Liczniki proporcjonalne zna¬ 
lazły bardzo szerokie zastosowanie w detekcji cząstek, 
w pomiarze jonizacji, a w szczególności do pomiarów 
aktywności źródeł promieniotwórczości o małej 
energii wysyłanych cząstek. 


Urządzenie do pomiaru jonizacji 

11. 35 (tabl. 11) przedstawia 52-tonowe urządzenie do 
identyfikacji cząstek, umieszczone za (patrząc od 
strony nadlatujących cząstek) Wielką Europejską Ko¬ 
morą Pęcherzykową. Do identyfikacji cząstek wyko¬ 
rzystuje się zjawisko wzrostu jonizacji przy bardzo du¬ 
żych prędkościach cząstek (rys. 1). Detektor składa 
się z 4096 liczników proporcjonalnych, ułożonych w 
ciśnieniowym pojemniku w 128 warstwach, po 32 
liczniki w każdej warstwie. Długość detektora wynosi 
8,5 m, a efektywna powierzchnia detekcji 1 mx2 m. 
Energia jonizacji, wydzielona w każdym liczniku przez 
cząstkę jonizującą, jest automatycznie mierzona przez 
układ elektroniczny. Dla każdego toru odbywa się 
więc 128 pomiarów wydzielonej energii. Stąd można 
wyznaczyć jonizację z dokładnością do ok. 3% , a tym 
samym można określić prędkość cząstki. Jeżeli znany 
jest pęd z pomiaru krzywizny toru w polu magnetycz¬ 
nym, to można zidentyfikować cząstkę. 


Układy eksperymentalne 


Dwuramienny spektrometr mionów 

W laboratorium imienia Fermiego grupa fizyków odkrycie 
pod kierunkiem Leona Ledermana odkryła w 1977 r., cząstki / 
badając reakcje p -f- tarcza —> p + p 4- cokolwiek, 
nową cząstkę — ypsilon. Pęd protonu dobrze znano, 
należało zidentyfikować, zarejestrować i wyznaczyć 
pędy obu mionów p. W tym celu użyto dwuramienne- 
go spektrometru, przedstawionego na zdjęciu (tabl. 

11, ii. 37) wykonanym z osłony tarczy wzdłuż wiązki. 

Na pierwszym planie widać dwa duże analizujące 
magnesy, za nimi umieszczone są układy liczników 
wyzwalających układ, następnie wielodrutowe komory 
proporcjonalne, liczniki Czerenkowa i absorbery 
stalowe. Układ ten mógł zarejestrować zdarzenia, 
podczas których zarówno w jednym, jak i drugim 
ramieniu przeleciał mion, oraz określić pęd i kierunek 
lotu każdego mionu. Pozwoliło to na poszukiwanie 
cząstek, które rozpadają się na dwa miony. Ekspery¬ 
ment zakończył się sukcesem. Odkryto cząstkę 
ypsilon, T. 
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Spektrometr Q 

Zdjęcie 38 (tabl. 11) przedstawia widok ogólny spek¬ 
trometru Cl. Urządzenie to łączy zalety komory pę¬ 
cherzykowej — umożliwiającej rejestrację cząstek 
emitowanych w dowolnym kierunku z punktu od¬ 
działywania — z szybkością pracy komór iskrowych. 
Szybkość rejestracji jest tu bardzo istotna. Można 


Dodatkowe liczniki scyntylacyjne S pozwalają 
stwierdzić przejście cząstki i określić natężenie 
wiązki padającej. Za komorą umieszczono dwa duże 
liczniki Czerenkowa, Cl i C2, pozwalające zidenty¬ 
fikować szybką cząstkę opuszczającą obszar oddzia¬ 
ływania, jeżeli znany jest jej pęd. Pęd ten wyznaczają 
dwie drutowe komory proporcjonalne Y z i Y 4 . Znając 
położenie tarczy, a więc tym samym przybliżone 



możliwość bowiem dokonywać bezpośredniej selekcji zdarzeń 
selekcji zda- i rejestrować tylko określone procesy. Rysunek 13 
rżeń ukazuje schematycznie budowę spektrometru. W 
1400-tonowym jarzmie elektromagnesu umieszczono 
2 nadprzewodzące cewki, pozwalające przy natężeniu 
prądu 4800 A wytwarzać pole magnetyczne o indukcji 
1,8 T w obszarze 14 m 3 . Wewnątrz tego obszaru znaj¬ 
dują się tarcza wodorowa oraz dwa układy komór 
iskrowych G2 i Cl. Komory są „widziane” przez 
specjalne kamery telewizyjne, tzw. plumbikony, które 
automatycznie rejestrują współrzędne iskry. Infor¬ 
macja ta może być zapisana na taśmie magnetycznej 
maszyny cyfrowej, jeżel i przypadek spełnia dane kry¬ 
teria eksperymentu. O tym decyduje układ liczników 
sterujących systemem wyboru danych i zmieniających 
się w zależności od potrzeb eksperymentu. Opiszemy 
układ wybierający tylko zdarzenia z bardzo szybkim 
protonem emitowanym do przodu. W komorze pę¬ 
cherzykowej, w której się rejestruje wszystko po kolei, 
trzeba by wykonać kilkadziesiąt lub kilkaset tysięcy 
zdjęć (zależnie od reakcji), aby zaobserwować odpo¬ 
wiednią do analizy 1 iczbę zdarzeń z szybkim protonem. 
Identyfikacja szybkiego protonu jest w komorze pę¬ 
cherzykowej trudna, więc nawet zebrana w ten sposób 
próbka zdarzeń byłaby „zanieczyszczona”. W spek¬ 
trometrze Cl zadanie jest łatwiejsze, 
układ wy- Wiązka cząstek ujemnych o określonym pędzie 
bierający wchodzi do obszaru tarczy z lewej strony, przy czym 
nie pokazane na rys. 13 liczniki Czerenkowa pozwala¬ 
ją określić, czy jest to mezon n~ y mezon K~ czy anty- 
proton. Ponieważ (tabela str. 111) przy tej samej 
prędkości minimalnej /? min proton musi mieć znacz¬ 
nie większy pęd niż mezon 7t y aby wywołać zjawisko 
Czerenkowa wystarczy więc przy określonym pędzie 
cząstek wiązki umieścić dwa liczniki Czerenkowa o tak 
dobranych substancjach, aby pierwszy ( C n ) reagował 
tylko na mezony 7T, drugi ( Ck ) na mezony K~ i iC y 
a był nieczuły na antyprotony. Wtedy przejściu me¬ 
zonu tC będzie odpowiadał sygnał z obu liczników, 
przejściu K~ sygnał tylko z jednego licznika, a przy 
przejściu antyprotonu żaden z liczników niezareaguje. 
Oznaczając kreską poziomą nad symbolem licznika 
brak sygnału, możemy zapisać symbolicznie sygnały 
związane z przejściem cząstki: 

7i : C n 'Ca-, K : C« * Ck , p : Cn *Ck> 


położenie punktu oddziaływania, oraz współrzędne 
toru w komorach Y z , Y 4 i konfigurację pola magnety¬ 
cznego, można określić pęd cząstki. Sygnały z dwóch 
liczników Czerenkowa o odpowiednio dobranych 
parametrach wraz ze znajomością pędu pozwalają 
zidentyfikować cząstkę. Układ zawiera jeszcze do¬ 
datkowe liczniki H u A 0 , wspomagające układ 
sterowania. W chwili, gdy ze współpracujących licz¬ 
ników nadejdą sygnały stwierdzające, że w obszarze 
tarczy nastąpiło oddziaływanie i że wśród cząstek 
wtórnych był proton o pędzie powyżej danej wartości, 
układ elektroniczny sterowania podejmie decyzję 
zebrania informacji ze wszystkich komór iskrowych 
i liczników pomocniczych i zapisania jej na taśmie 
magnetycznej. Decyzja taka jest podejmowana 
w 7,5-10 _7 s po przejściu cząstki. Dalsze opracowy¬ 
wanie danych odbywa się już znacznie później, 
z wykorzystaniem dużych komputerów. Jest to pro¬ 
ces żmudny, wymagający wielu obliczeń, prowadzący 
do rekonstrukcji w przestrzeni zaszłego zdarzenia. 

Komputer, znając współrzędne wszystkich iskier, 
może na żądanie operatora odtworzyć na ekranie 
telewizyjnym obraz zdarzenia. 

Urządzenie TPC 

Pod tym skrótem kryje się angielska nazwa Time TPC —komo 
Projection Chamber , czyli komora z projekcją czasu, ra z projekcją 
Urządzenie jest dopiero w budowie w Berkeley i bę- czasu 
dzie gotowce kosztem 10 min dolarów w pierwszej po¬ 
łowie lat osiemdziesiątych. W założeniu konstrukto¬ 
rów .komora zapewni rejestrację torów poszczegól¬ 
nych cząstek oraz identyfikację elektronów', pionów, 
kaonów i protonów w' bardzo szerokim zakresie kąta 
bryłowego, a nawet dla zdarzeń z wieloma cząstkami 
wtórnymi. Komora pozwoli wyznaczyć rówmież ener¬ 
gię kwantów y oraz zidentyfikować miony. Jednym 
słowem ma to być niemal idealny detektor, o jakim 
śnili fizycy. Ma on współdziałać z przeciwbieżnymi 
wiązkami e + i e~ w eksperymentach mających na celu 
poszukiwanie nowych cząstek. 

Urządzenie to składa się z dużej cylindrycznej* 
komory dryfowej o średnicy i długości 2 m (rys. 14). 

Współrzędne prostopadłe do kierunku dryfu będą 
odczytywane za pomocą układu drutów. Informację 
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Rys. 14. Szkic budowy urządzenia TPC 


elektroda dużego 
^ ujemnego potencjału 

192 drutów na sektor do pomiaru 
strat energii na jednostkę drogi 


dotyczącą współrzędnej wzdłuż kierunku dryfu 
uzyska się na podstawie pomiaru opóźnienia sygnału 
w drutach w stosunku do czasu przejścia cząstki. 
Prędkość dryfu elektronów ma wynosić 7 cm/ps. 
Na torze cząstki można będzie mieć do 192 odczytów 
współrzędnych (tyle bowiem jest drutów). Pozwoli to 
zrekonstruować nawet oddziaływania o dużej liczbie 
cząstek wtórnych. Z wielkości sygnału na każdym 
drucie można będzie ocenić pierwotny ładunek 
jonizacji, a więc wyznaczyć straty energii przechodzą¬ 
cej cząstki na jonizację. Informacja ta wraz ze zna¬ 
jomością pędu cząstki pozwoli na jej pełną identy¬ 
fikację. Oczekuje się, że elektrony, piony, kaony, 
protony będzie można identyfikować w zakresie 
pędów 100 MeV/c-15 GeV/c. Cała komora będzie 
umieszczona w polu magnetycznym nadprzewodzą¬ 
cych cewek o indukcji 1,5 T. Energia i kierunek kwan- 


pad hiperonu A° (ii. 31, tabl. 10). Hiperon A° ma 
średni czas życia 2,6 • 10" 10 s, a więc żyje stosunkowo 
długo. Mezon tt° rozpada się średnio po czasie 0,8 • 

•10“ 16 s » tylko z najwyższym trudem można ocenić 
drogę, którą przebywa w emulsji jądrowej od pow¬ 
stania do rozpadu. Znamy cząstki, które żyją jeszcze 
parę rzędów wielkości krócej niż 7 t°. Odległość między 
punktem produkcji i punktem rozpadu jest rzędu 
1 f m = 10~ 15 m i bezpośrednia obserwacja toru takiej 
cząstki, zwanej rezonansem, jest obecnie niemożliwa; 
o jej istnieniu wnioskujemy na podstawie analizy 
produktów rozpadu. 

Omówimy zagadnienie na przykładzie doświadczę- doświadcze¬ 
nia prowadzonego przez Leona Ledermana i zakon- nie Leder- 
czonego odkryciem nowej cząstki T (ypsilon) o masie mana 
9,5 GeV. Omawialiśmy już spektrometr dwuramien- 
ny, który ustawiono w laboratorium im. Fermiego 
przy akceleratorze protonów. Protony o energii 
400 GeV padały na tarczę, za którą stał spektrometr 
rejestrujący tylko miony ju + i Badana reakcja prze¬ 
biegała następująco: 

p -f jądro tarczy -> pA -fjtr -f cokolwiek, o czym nic 
nie wiemy. 

Mamy natomiast precyzyjną informację, że zostały 
wyprodukowane dwa miony, wiemy, pod jakimi 
kątami zostały emitowane i z jaką energią. Sytuację 
przedstawia rys. 16a. Możemy jednak dopuścić, 
że naprawdę proces przebiegał inaczej (rys. 16b). 

W wyniku oddziaływania proton-jądro powstała 
jakaś cząstka o nieznanej masie m ^ która po bardzo 
krótkim czasie rozpadła się na p+p ~. Jeżeli czas życia 
był tak krótki, że punkt rozpadu był doświadczalnie 


uzwojenie magnesu kalorymetr 
jarzmo magnesu 


cewki korekcyjne 


* żelazny 
absorber 

rura wiązki mionów 



Rys. 15. Przekrój poprzeczny przez 
układ detekcyjny urządzenia TPC, 
rury próżniowe wiązek przeciwbież¬ 
nych e + i e~ oraz magnesy 


licznik scyntylacyjny 


żelazny absorber mionów liczniki mionów 


tów y ma być wyznaczony przez kalorymetry wypeł¬ 
nione ciekłym argonem, w których się będzie mierzyć 
całkowitą energię kwantu y. Identyfikację powolnych 
mionów uzyska się z pomiaru jonizacji, a mionów 
o większej energii — na podstawie zdolności przeni¬ 
kania przez warstwy żelaza. Cały układ będzie ste¬ 
rowany przez komputer wybierający według danych 
kryteriów określone zdarzenia. Rysunek 15 ilustruje 
przekrój poprzeczny przez układ detekcyjny, rury 
próżniowe wiązek przeciwbieżnych e+e~ oraz mag¬ 
nesy. 


Badanie krótkożyjących cząstek 


Dotychczas mówiliśmy o cząstkach, które mogą 
przejść przez detektor, tzn. ich droga od punktu 
powstania do punktu rozpadu jest tak długa, że można 
ją zmierzyć. Przykładem może być powstanie i roż¬ 


nie do odróżnienia od punktu produkcji, to obraz 
oddziaływania będzie taki jak na rys. 16a. O hipote¬ 
tycznej cząstce nie mamy żadnych informacji, znamy 
natomiast wektory pędu ewentualnych produktów 

rozpadu /T x i pl. Piszemy „ewentualnych”, ponieważ 

nie wiemy, czy taka cząstka istnieje, a jeżeli istnieje, 

czy rozpada się tylko na dwa miony p + i pr. Ponieważ 

nie wiemy, robimy założenie: a) cząstka istnieje, b) 

rozpada się na parę p + p~. Teraz można obliczyć 

masę m r , czyli masę, jaką miałaby cząstka rozpadająca obliczenie 

się na dwa konkretnie zarejestrowane miony. Masę tę masy nie- 

nazywamy masą niezmienniczą układu (w tym wy- zmienniczej 

padku układu dwóch mionów). W mechanice rela- układu 

tywistycznej energia cząstki wyraża się wzorem 

Ey,= 

z zasady zachowania pędu otrzymujemy 

Pp = ]/ (Pix ~tP 2 z) 2 + (P\y ~hP2y) 2 +(Piz + Pzz ) 2 » 
gdzie p Zy p Vy pi są składowymi pędu p wzdłuż odpo- 
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wiednich osi współrzędnych, a z zasady zachowania 
energii wynika.,. 

E t = +)/pić l +/n2c 4 . 

Znając z pomiarów całkowite pędy obu mionów i ich 
składowe, możemy z powyższych wzorów obliczyć m T . 

Mając do dyspozycji tylko jedną rejestrację, nie 
moglibyśmy wyciągnąć żadnego wniosku. Każde 
dwie cząstki dają jakąś masę niezmienniczą, choćby 
każda z nich powstała w innym procesie. Dopiero 
dysponując dużą liczbą rejestracji, można sprawdzić, 
czy obliczone masy określonej kombinacji cząstek 
grupują się wokół jakiejś wartości. Jeżeli tak, to może 
znaczyć, że w oddziaływaniu powstała cząstka (mó¬ 
wimy: rezonans) o określonej masie (im węższe 
jest maksimum, tym dłużej cząstka żyje). Rysunek 17 
przedstawia wykres zależności częstości pojawiania 
się określonej masy pary p + p~ od wielkości masy, 
wykazujący, że w obszarze ok. 10 GeV jest wyraźne 
zgrupowanie przypadków. Bliższe przyjrzenie się 
rysunkowi wskazuje na istnienie dwóch maksimów 
przy 9,4 GeV i 10 GeV, co z kolei wskazuje na istnie¬ 
nie dwóch rezonansów T i V' o powyższych masach. 
W podobny sposób wykryto bardzo wiele cząstek. 



Rys. 17. Rozkład masy układu p*pr otrzymany przez zespół 
Ledermana 


Metoda badania tak krótkożyjących tworów jest 
statystyczna. Nie umiemy na razie wskazać zdarzenia 
i powiedzieć o nim z całą pewnością, że w tym wła¬ 
śnie wypadku został wytworzony ypsilon. Możemy 
tylko powiedzieć, że w badanej reakcji produkuje się 
ypsilon z takim to a takim przekrojem czynnym. 
Nie zmienia to faktu, że cząstka taka istnieje w takim 
samym sensie, w jakim istnieje proton. Wszędzie tam, 
gdzie się będzie produkował ypsilon, stwierdzimy 
nadmiar kombinacji mas p+ i pr w obszarze masy 
9,4 GeV, jeśli tylko warunki nie będą zabraniały 
rozpadu na //+ i pr. 

I. Bartke Wielka Europejska Komora Pęcherzykowa , Post. 
Fiz. 28, 433 (1977); D.A. Bromlej (cd.) Dedectors in Nuclear 
Science , Nuclear Instruments and Methods, t. 162, Nr 1-3, p. 1,2 
(1979); G. Charpak Wielodrutowc i dryfowe komory proporcjo¬ 
nalne , Post. Fiz. 30,579 (1979); WJ. Willis Wielkie spektrometry , 
Post. Fiz. 31, 279 (1980); J.W. Zaniewskij Prowołocznyje dietie- 
ktory elementarnych czastic , Moskwa 1978. 


potwierdzę 
nie istnieni 
cząstki T 


Akceleratory 

Ryszard Sosnowski 

Akceleratorami nazywamy urządzenia, które pozwa¬ 
lają wytwarzać strumienie cząstek obdarzonych znacz¬ 
ną energią kinetyczną. Strumienie rozpędzonych czą¬ 
stek służą fizykom do badania bardzo małych obiek¬ 
tów, takich jak jądra atomów lub cząstki elementarne. 
Obecnie coraz częściej wykorzystuje się akceleratory 
na potrzeby techniki oraz terapii medycznej, 
akcelerator Pierwsze akceleratory cząstek zbudowano ok. 
--narzędzie 1930 r. Zapoczątkowały one nowy okres w fizyce 
badan jądro- jądrowej. Z ich pomocą stała się możliwa „alchemia 
wych XX wieku” —przeprowadzanie reakcji jądrowych. 
Rozpędzone cząstki, uderzając w jądra ustawionych 
na ich drodze tarcz, zamieniały je w jądra innych 
pierwiastków. Procesy te badano już wcześniej, 
wykorzystując cząstki emitowane przez izotopy radio¬ 
aktywne. Dopiero jednak zbudowanie akceleratorów 
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pozwoliło na systematyczne badanie reakcji jądrowych 
oraz na wytwarzanie i zbadanie własności jąder wielu 
nowych izotopów. 

Budowa alceleratorów dostarczających wiązek akcelerator 
cząstek o coraz większej energii pozwoliła fizykom — narzędzie 
badać w laboratoriach obiekty jeszcze mniejsze niż badania 
jądra atomów — cząstki elementarne (-> Cząstki cząstek 
elementarne i ich oddziaływania). W latach pięćdzie- elementar- 
siątych powstały akceleratory nadające protonom nych 
tak duże energie, że mogły one wytworzyć cząstki 
obserwowane uprzednio tylko w zderzeniach promie¬ 
ni kosmicznych (-* Promieniowanie kosmiczne): 
mezony i hiperony. Ponadto umożliwiły odkrycie 
nowych, nieobserwowanych do tego czasu antycząstek, 
a mianowicie: antyprotonów, antyneutronów i anty- 
hiperonów. 





















Zwiększenie intensywności wiązek przyspieszonych 
cząstek oraz ich energii pozwoliło w latach sześć¬ 
dziesiątych na znaczne powiększenie rodziny cząstek 
elementarnych o tzw. stany rezonansowe. Są to cząstki 
o takjkrótkim czasie życia, że rozpadają się niemal 
natychmiast (tzn. po czasie ok. 10~ 23 s) p? swym 
powstaniu. Dalszy rozwój techniki akceleracji dopro¬ 
wadził do odkrycia w latach siedemdziesiątych nowej 
rodziny cząstek elementarnych obdarzonych tzw. 
powabem. Nie jest przesadą twierdzić, że bez akcele¬ 
ratorów nie potrafilibyśmy zbadać ani własności jąder 
atomowych, ani poznać świata najmniejszych zna¬ 
nych obecnie obiektów fizycznych — cząstek ele¬ 
mentarnych. 


Akceleratory elektrostatyczne 

Najprostszym akceleratorem cząstek naładowanych 
jest układ dwóch elektrod, między którymi istnieje 
różnica potencjału elektrostatycznego. Cząstka na¬ 
ładowana, która znajduje się w obszarze między 
elektrodami jest odpychana przez elektrodę o tym 
samym znaku ładunku a przyciągana przez elektrodę 
naładowaną przeciwnie. Aby cząstka została bez 
przeszkód przyspieszona między elektrodami musi 
istnieć próżnia taka, by średnia droga na zderzenie 
przyspieszanej cząstki z cząsteczkami gazu była 
znacznie większa od odległości między elektrodami. 
Wędrując od jednej elektrody do drugiej cząstka 
uzyskuje energię kinetyczną, E , proporcjonalną do 
różnicy potencjałów między elektrodami, V , oraz do 
wielkości ładunku elektrycznego tej cząstki, e , 

E — eV. 

Z tego właśnie względu przyjęto określać energię 
przyspieszonych cząstek przez podanie różnicy po¬ 
tencjałów, które należałoby zastosować do uzyskania 
elektrono- tej energii, gdyby cząstka miała ładunek jednostkowy, 
wolt Różnicę potencjałów wyrażamy zazwyczaj w woltach, 
a ładunek jest zawsze wielokrotnością ładunku 
elementarnego, tzn. takiego, którym jest obdarzony 
np. elektron. Stąd powszechnie używaną jednostką 
energii jest elektronowolt (eV), a jednostki pochodne 
to — kiloelektronowolt (keV), megaelektronowołt 
(MeV), gigaelektronowolt (GeV) i teraelektronowolt 
(TeV), 

lTeV = 10 3 GeV = 10 6 MeV = 10 9 keV = 10 12 eV. 

Energię jednego elektronowolta uzyskuje cząstka 
o ładunku takim jaki ma elektron, przyspieszona 
różnicą potencjału równą 1 wolt, 

1 eV s 1,6 -10” 19 J. 

rurki Crooksa Prototypem pierwszych akceleratorów elektrosta¬ 
tycznych były rurki Crooksa, w których — w drugiej 
połowie ubiegłego wieku — wytworzono promienie 
katodowe, będące wiązkami przyspieszonych elek¬ 
tronów. Również lampy rentgenowskie i wszelkie 
lampy elektronowe, są małymi akceleratorami elek¬ 
tronów. Jednakże, aby badać własności jąder ato¬ 
mowych należało użyć cząstek o energiach znacznie 
przewyższających energie uzyskiwane w lampach 
rentgenowskich. Ponadto jako pocisków należało 
użyć nie elektronów lecz protonów. 


Akceleratory typu Cockrofta-Waltona 

J.D. Cockroft i E.T.S. Walton w 1932 r. opubliko¬ 
wali opis zbudowanego przez nich akceleratora pro¬ 
tonów. Protony były przyspieszane różnicą poten¬ 
cjałów 600 kV. 

W celu uzyskania tak wysokiego napięcia Cockroft 
i Walton zastosowali układ nazywany generatorem 
kaskadowym, którego schemat pokazany jest na 


rys. 1. Transformator prądu zmiennego wytwarza na generator 
końcówkach uzwojenia wtórnego zmienne napięcie kaskadowy 
o amplitudzie V 0 . Gdy końcówka 1 jest biegunem 


Rys. 1. Schemat generatora kaska¬ 
dowego typu Cockrofta i Waltona 



ó r\j ó 


dodatnim a końcówka 2 biegunem ujemnym, wówczas 
kondensator C Ł ładuje się do napięcia Ko> gdyż punkty 
1 i 3 są zwarte przez prostownik P x . W drugiej połów¬ 
ce okresu końcówka 1 jest biegunem ujemnym, lecz 
prostownik P x nie pozwala dodatniemu ładunkowi 
odpłynąć z puntu 3 do punktu 1. Transformator i kon¬ 
densator Ci są wtedy połączone szeregowo, wytwarza¬ 
jąc na okładkach kondensatora C 2 napięcie 2 V ? . W na¬ 
stępnej połówce okresu znowu końcówka 1 jest bie¬ 
gunem dodatnim i wtórne uzwojenie transformatora 
jest połączone szeregowo z kondensatorem C 2 , wy¬ 
twarzając między punktem 5 i punktem 2 napięcie 
3 V Q . W kolejnej połówce półokresu połączone 
szeregowo kondensatory C x i C 3 oraz wtórne uzwoje¬ 
nie transformatora wytwarza między punktem 1 i 
punktem 6 napięcie 4V 0 . 

Zastosowanie odpowiedniej liczby prostowników 
i kondensatorów pozwala na uzyskanie większego 
zwielokrotnienia napięcia. Nie możemy jednak zwięk¬ 
szać napięcia nieograniczenie. Ze względu na wyła¬ 
dowania, które powodują ucieczkę ładunku elektrycz¬ 
nego z wyższych stopni kaskady, generatory wyso¬ 
kiego napięcia typu Cockrofta-Waltona dostarczają 
napięcia nie większego niż 3 MV. Ucieczkę ładunku 
można zmniejszyć, zamykając całe urządzenie w po¬ 
jemniku, w którym zwiększa się ciśnienie gazu. W ten 
sposób uzyskiwano napięcie do 6 MV. 

Wadą akceleratorów Cockrofta-Waltona jest mała 
stabilność uzyskiwanego napięcia i dlatego nie zna¬ 
lazły one większego zastosowania do badania jąder 
atomowych. Używa się ich natomiast jako pierwszego 
stopnia przyspieszenia cząstek, które są następnie 
wprowadzane do akceleratorów cyklicznych wielkich 
energii. Stosunkowo duża moc prądu wiązki uzyski¬ 
wana za pomocą akceleratorów kaskadowych pozwa¬ 
la na uzyskanie intensywnych wiązek. Na il. 39 
(tabl. 11) jest pokazany generator typu Cockrofta- 
Waltona, w którym protony są przyspieszane do 
energii 10 MeV. Następnie są one wprowadzane do 
największego obecnie akceleratora, synchrotronu 
Narodowego Laboratorium Akceleratorow-ego im. 
H. Fermiego w Batavii i uzyskują energię do 500 GeV. 

Wytworzona przez generator wysokiego napięcia 
różnica potencjałów wykorzystywana jest do przy¬ 
spieszenia jonów. Następuje to w tzw. rurze przy¬ 
spieszającej, w której panuje wysoka próżnia. Moż¬ 
liwie dokładne usunięcie z rury gazu jest niezbędne 
z dwóch powodów. Po pierwsze, gaz nie powinien 
stwarzać przeszkód na drodze przyspieszanych jonów. 
Po drugie, cząsteczki zjonizowanego gazu w rurze 
akceleracyjnej powodowałyby odpływ ładunku z elek¬ 
trody wysokiego napięcia. Zmniejszenie ucieczki 
ładunku przez gaz jest możliwe albo za pomocą zwięk¬ 
szenia ciśnienia gazu, albo przez możliwie dokładne 
jego usunięcie. 


zastosowania 
akcelerato¬ 
rów Cockro¬ 
fta-Waltona 
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źródło Ważnym elementem każdego akceleratora jest żró- 
cząstek dło cząstek, które mają być przyspieszane. Na ogół 
są to jony określonego typu. Najczęściej stosowano 
protony, deuterony i cząstki a. Ostatnio jednak przy¬ 
spiesza się również ciężkie jony (-* Fizyka ciężkich 
jonów). Zadaniem źródła jonów jest wytworzenie 
i dostarczenie tych jonów — żądanego rodzaju i ilo¬ 
ści — w pobliże elektrody wysokiego napięcia. Bardzo 
często ważne jest, aby energia jonów po przyspiesze¬ 
niu była dobrze określona, tzn. aby wszystkie jony 
z wiązki wychodzącej z akceleratora miały tę samą 
energię. W tym wypadku oczywiście rozrzut energii 
jonów przed przyspieszeniem musi być mały. 

Jony dostarczone przez źródło są przyspieszane 
wzdłuż rury akceleracyjnej, którą wykonuje się z do¬ 
brych izolatorów, aby nie powodować upływu ła¬ 
dunku, co zmniejszałoby wartość napięcia. Wzdłuż 
rury umieszcza'się wiele elektrod pośrednich. Ich 



Rys. 2. Fragment rury ak¬ 
celeratora elektrostatycz¬ 
nego. Elektrody pośrednie 
zapewniają równomierny 
rozkład pola wzdłuż rury 
oraz ogniskują cząstki 
wzdłuż osi symetrii rury 


zadaniem jest ogniskowanie wiązki przyspieszonych 
cząstek wokół osi rury. Zmniejsza to straty wiązki, 
zabezpiecza przed gromadzeniem się ładunków na 
ściankach rury (co mogłoby zakłócić proces przy¬ 
spieszania) oraz zapewnia mały wymiar poprzeczny 
wiązki na wyjściu z akceleratora, ułatwiający wyko¬ 
rzystanie przyspieszonych cząstek (rys. 2). 


Akceleratory z generatorami Van de Graaffa 

Nieomal w tym samym czasie, gdy Cockroft i Walton 
zbudowali swój pierwszy akcelerator, R.J. Van de 
generator Graaff skonstruował generator wysokiego napięcia 
Van de działający na odmiennej zasadzie. Prototypem tego 
Graaffa generatora było urządzenie, którego pomysł poddał 
lord Kelvin. Pozwalało ono na uzyskanie wysokiego 
napięcia za pomocą źródła o znacznie niższym na¬ 
pięciu. Zasada działania tego urządzenia pokazana 
jest na rys. 3. Spadające do wnętrza puszki Faradaya 
krople wody przenoszą do niej ładunek elektryczny. 



Rys. 3. Zasada generatora 
Van de Graaffa. Przeka¬ 
zywany do puszki Fara¬ 
daya ładunek przenoszony 
przez krople wody pozwala 
uzyskać różnicę potencja¬ 
łów znacznie wyższą niż 
wytwarzana przez genera¬ 
tor połączony ze zbiorni¬ 
kiem wody 


jeżeli zbiornik z wodą ma potencjał elektryczny wzglę¬ 
dem ziemi. W rezultacie puszka może uzyskać taki 
ładunek, że jej potencjał znacznie przewyższy poten¬ 
cjał zbiornika z wodą. 

Generator wysokiego napięcia skonstruowany 
przez Van de Graaffa działał na podobnej zasadzie. 
W urządzeniu tym generator dający stosunkowo 


+++++++++++ 



Rys. 4. Schemat generatora 
Van de Graaffa 



F«b. 12, 193S. R J VAN DE GRAAFF 1,991*236 

EtECTROSfATIC OENERATOR 

■ v . 

Fil*cJ D*ę. 1$; 1331 4 5h««ta~Sh*at i 



120 
































































podwójny 
generator 
Van de 
Graaffa 


niskie napięcie ładował powierzchnię pasa jedwabne¬ 
go, który przenosił ładunek do wnętrza metalowej 
kuli, spełniającej rolę puszki Faradaya (rys. 4). Tam 
ładunek był zbierany z pasa za pomocą szczotki me¬ 
talowej. 

W 1931 r. Van de Graaff zbudował podwójny gene¬ 
rator składający się z dwóch identycznych urządzeń, 
z których jedno generowało potencjał dodatni, 
a drugie ujemny. Każda z elektrod osiągała napięcie 
750 kV względem ziemi, a więc napięcie między elek¬ 
trodami wynosiło 1,5 MV. Na rys. 5 jest pokazane 
zgłoszenie patentowe tego urządzenia. 

Pierwszy akcelerator, w którym generator Van de 
Graaffa wyposażony był w rurę akceleracyjną i źródło 
jonów przedstawiono na il. 34 (tabl. 10). Dostarczał 
on wiązki protonów i deuteronów o energii 0,6 MeV. 

Współcześnie działające generatory Van de Graaffa 
przekraczają napięcie 20 MV, a budowany w Dares- 
bury generator ma osiągnąć napięcie 30 MV. Przy 
tak dużych napięciach urządzenia te muszą być zam¬ 
knięte w pojemnikach, w których panuje wysokie 
ciśnienie gazu (ok. 500 hP). Do tego celu używa się 
gazów o szczególnie dobrych własnościach izolacyj¬ 
nych, np. SF 6 . Wielkość uzyskiwanego napięcia za¬ 
leży od tego, jak szybko można uzupełniać ucie¬ 
kający ładunek. Do transportu ładunku używa się 
więc pasów poruszających się ze znaczną prędkością— 
ok. 1 km/min. Przenoszony przez te pasy prąd łado¬ 
wania wynosi 100-500 pA. 


Akcelaratory typu tandem 

Już w 1932 r. A.J. Dempster, stosując różnice po¬ 
tencjałów 22,5 kV, otrzymał protony o energii 45 keV. 
Schemat urządzenia Dempstera jest pokazany na 



Rys. 6. Zasada działania akceleratora typu tandem zastosowana 
przez Dempstera 

rys. 6. Protony są przyspieszane różnicą potencjałów 
między elektrodą dodatnią A i uziemioną B. W po¬ 
bliżu elektrody B część protonów wychwytuje elek¬ 
trony i już jako neutralne atomy wodoru przebywają 
przestrzeń BC. Po wyminięciu elektrody C znaczna 
część obojętnych atomów w zderzeniu z resztkami 
wodoru traci elektrony i jako jony dodatnie jest przy¬ 
spieszana różnicą potencjałów panującą między C / D. 

Zasada zmiany ładunku przyspieszanych jonów 
została wykorzystana we współczesnych akcelerato¬ 
rach typu tandem. Powstały one w końcu lat pięć¬ 
dziesiątych mimo, że zasada ich działania była sfor¬ 
mułowana znacznie wcześniej. W.H. Bennett przed¬ 
stawił ją jako zgłoszenie patentowe w 1935 r. Dopiero 
jednak opracowanie źródeł jonów ujemnych oraz 
opanowanie techniki zamiany ich na jony dodatnie 
pozwoliło budować akceleratory typu tandem. 
W akceleratorach tych jony są przyspieszane w dwóch 
etapach. Ujemnie naładowane jony są przyspieszane 
w polu między uziemionym źródłem jonów i elektrodą 
naładowaną dodatnio. Po osiągnięciu elektrody jony 
przechodzą przez obszar o nieco wyższym ciśnieniu 
gazu lub przez cienką folię. W wyniku zderzeń część 


jonów traci pewną ilość elektronów i staje się jonami 
dodatnimi. Wiązka dodatnich jonów jest następnie 
przyspieszana potencjałem dodatnim elektrody. 

Akceleratory typu tandem znalazły powszechne 
zastosowanie w fizyce jądrowej. Pozwalają one uzys¬ 
kać wiązki różnorodnych jonów o energiach do paru 
dziesiątków MeV. Ponadto wiązki te mają bardzo 
dobrze określoną energię. Względny rozrzut energii 
jonów wynosi 10“ 5 energii średniej. 


Akceleratory liniowe 


W omawianych dotychczas akceleratorach wykorzy¬ 
stywano stałe, niezmieniające się w czasie pole elek¬ 
trostatyczne. Już jednak w 1924 r. Ising opublikował 
projekt, w którym pole przyspieszające pojawiało się 


źródło 

jnnAu< 



wielkiej 

częstości 

Rys. 7. Schemat akceleratora liniowego 


wiązka 


w poszczególnych przerwach między elektrodami 
tylko wtedy, gdy docierała do tej przerwy grupa 
przyspieszanych jonów. Na rys. 7 pokazano schemat 
takiego akceleratora. Generator zmiennego napięcia 
połączony jest z elektrodami E ly E 2 i E 3 przez linie 
opóźniające. W obszarach S u S 2 i powstaje zmienne 
pole elektryczne. Długość elektrod E jest tak dobra¬ 
na, aby w czasie, gdy w obszarach S występuje pole 
o znaku przeciwnym niż potrzebny do przyspiesze¬ 
nia, jony znajdowały się wewnątrz cylindrycznych 
elektrod E. Ze względu na uzyskiwaną przez jony 
coraz większą prędkość każda następna elektroda 
jest dłuższa niż poprzednia. W akceleratorze poka¬ 
zanym na schemacie jony są przyspieszane trzykrot¬ 
nie. Akcelerator ten dostarcza cząstek nie w postaci 
nieprzerwanego strumienia, lecz jako krótkotrwałe 
impulsy. Akcelerator pracujący na tej zasadzie został 
po raz pierwszy zbudowany przez Wideroe. Za po¬ 
mocą generatora o napięciu 20 kV uzyskano jony 
potasu o energii 40 keV. Jednakże rozwój akcelera¬ 
torów liniowych nastąpił dopiero z chwilą opanowa¬ 
nia techniki mikrofal i generatorów wysokiej często¬ 
ści. Technika ta przeżyła gwałtowny rozwój w cza¬ 
sach II wojny światow-ej dzięki wprowadzeniu radaru. 

Drugim ważnym czynnikiem umożliwiającym bu¬ 
dowę akceleratorów liniowych było odkrycie zasady 
samoogniskowania się cząstek. Współczesny akcele¬ 
rator liniowy działa w ten sposób, że elektryczne pole 
przyspieszające, równoległe do osi rury akcelera- 
cyjnej, jest wytworzone w niewielkim stosunkowo 
obszarze, który przesuwa się wzdłuż akceleratora 
z tą samą prędkością z jaką biegną przyspieszone 
cząstki. Na pozór realizacja takiego procesu wydaje 
się wymagać niesłychanie precyzyjnego uregulowania 
prędkości początkowej cząstek, wartości natężenia 
pola oraz prędkości przesuwania się tego pola. W pra¬ 
ktyce okazuje się jednak, że dochodzi do automa¬ 
tycznego dopasowania się’tych wielkości, ułatwiają¬ 
cego uzyskanie efektu przyspieszenia. 

Na rys. 8 przedstawiono rozkład natężenia pola 
elektrycznego przyspieszającego cząstki. Pole to 
przesuwa się z pewną prędkością wzdłuż rury akcele¬ 
ratora wraz z cząstkami, które w tym polu uzyskują 
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Rys. 8. Zasada satnodopasowania wartości pola przyspieszają¬ 
cego w akceleratorze liniowym — £ 0 i prędkości jego przesu¬ 
wania się wzdłuż rury akceleracyjnej — V 
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przyspieszenie. Oznaczmy przez E 0 tę wartość pola, 
która zapewnia takie przyspieszenie cząstek, że ich 
prędkość jest zawsze identyczna z prędkością prze¬ 
suwania się pola. Wartość E 0 występuje w dwóch 
punktach A i B. Załóżmy, że jakaś cząstka zamiast 
znaleźć się w punkcie A opóźni się i pole zacznie ją 
wyprzedzać. Wówczas podlega ona działaniu nieco 
silniejszego pola, prędkość jej wzrośnie szybciej 
niż innych cząstek i wkrótce opóźniająca się cząstka 
dogoni lub nawet przegoni pole przyspieszające. 
W wypadku uzyskania zbyt dużego przyspieszenia 
i wyprzedzenia pola cząstka znajdzie się w obszarze 
pola słabszego i będzie przyspieszana mniej efektyw¬ 
nie. Pozwoli to z kolei przesuwającemu się polu 
elektrycznemu dopędzić uciekającą cząstkę. Widzimy 
więc, że w pobliżu punktu A występuje mechanizm 
samoczynnego dopasowania się prędkości cząstek do 
wartości pola przyspieszającego i do prędkości prze¬ 
mieszczania się tego pola. Warto zauważyć, że w po¬ 
bliżu punktu B mechanizm samodopasowania nie 
występuje. 

Akceleratory liniowe są używane zarówno do przy¬ 
spieszania protonów jak i elektronów. Największy 
akcelerator protonów pracujący w Los Alamos osiąga 
energię 800 MeV. Największym akceleratorem linio¬ 
wym przyspieszającym elektrony jest liniowy akce¬ 
lerator w Stanford, który przyspiesza elektrony do 
energii 20 GeV. 


Akceleratory cykliczne 


Poza akceleratorami, w których tory przyspieszanych 
cząstek biegną w przybliżeniu po liniach prostych, 
istnieje wiele typów akceleratorów o torach zbliżo¬ 
nych do okręgów. W akceleratorach tych przyspie¬ 
szane cząstki biegną w polu magnetycznym zakrzy¬ 
wiającym ich tory. Dzięki temu można znacznie wy¬ 
dłużyć drogę, na której cząstki doznają przyspiesze¬ 
nia, bez konieczności budowy bardzo długich rur 
akceleracyjnych. W czasie pokonywania tej drogi 
cząstki doznają drobnych, lecz wielokrotnych przy¬ 
rostów energii, co powoduje że całkowity przyrost 
energii jest znaczny. Akceleratory tego typu nazwano 
akceleratorami cyklicznymi. 


Cyklotron 

wykorzysta- Cyklotron jest najstarszym akceleratorem cyklicznym, 
nie pola mag- Zasada jego działania polega na tym, że cząstka 
netycznego naładowana poruszająca się w jednorodnym polu 
magnetycznym prostopadle do linii pola biegnie po 
torze kołowym, a czas obiegu wynosi 

T=— - 2mC 
V eH ' 

gdzie m — masa cząstki, c — prędkość światła, e — 
ładunek elektryczny cząstki, H — natężenie pola 
magnetycznego, r — promień toru, v — prędkość 


cząstki. Jak widzimy okres obiegu cząstki nie zależy 
od jej energii, jeśli pominiemy relatywistyczny 
wzrost masy. Zasadę działania cyklotronu pokazano 
na rys. 9. Wzdłuż średnicy toru cząstki ustawione 
są dwie elektrody, między którymi jest przyłożone 
zmienne pole elektryczne o częstości równej \/T. 
Naładowana cząstka, która w pewnej chwili znajduje 



się między elektrodami, zostanie przyspieszona i za¬ 
toczywszy półokrąg po czasie T/2, znajdzie się ponow¬ 
nie w obszarze między elektrodami. Natrafi wówczas 
na pole, które jest skierowane zgodnie z jej ruchem 
i w zwitku z tym cząstka ta ulegnie dalszemu przy¬ 
spieszeniu. Promień jej toru zwiększy się. Po czasie 
T/2 cząstka zatoczy następne pół okręgu i ulegnie 
dalszemu przyspieszeniu. W ten sposób, dzięki 
wielokrotnemu przechodzeniu przez obszar przyspie¬ 
szający, tor cząstki dojdzie do granicy pola jedno¬ 
rodnego i dalszy wzrost energii cząstki przestanie być 
możliwy. 


Synchrocyklotron 

Możliwość kontynuowania przyspieszania cząstek 
nie jest ograniczona jedynie skończonymi rozmiarami 
pola magnetycznego. Ze względu na relatywistyczny 
wzrost masy cząstki, w miarę wzrostu jej energii 
okres obiegu po orbicie kołowej wydłuża się i cząstka 
zaczyna się pojawiać w obszarze między elektrodami 
zbyt późno, aby trafić na pole przyspieszające. 

W celu uzyskania cząstek o energiach większych 
niż to jest możliwe w cyklotronach, zaczęto budować 
tzw. synchrocyklotrony. Są to akceleratory działające 
w podobny sposób jak cyklotrony, lecz w tym wy¬ 
padku częstość pola przyspieszającego maleje w mia¬ 
rę, jak przyspieszone cząstki uzyskują energię i okres 
ich obiegu po torze kołowym wzrasta. Oczywiście 
w odróżnieniu od cyklotronów, w których możliwe 
jest jednoczesne przyspieszanie cząstek w całym 
obszarze pola magnetycznego, synchrocyklotrony 
przyspieszają w danej chwili tylko te cząstki, których 
energia odpowiada aktualnej częstości pola przyspie¬ 
szającego. Wykorzystując zasadę synchrocyklotronu, 
uzyskano wiązki protonów o energii do700 MeV. 



Rys. 10. Zasada samodopasowania w synchrocyklotronic 


wykorzysta 
nie zmiany 
częstości 
pola 
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samoognis- W konstrukcji synchrocyklotronów ważną rolę od- 
kowanie fazy grywa zasada samoogniskowania fazy cząstek oma- 
cząstek wiana już przy opisie akceleratorów liniowych. Za¬ 
sada ta działa tutaj następująco. Niech między elektro¬ 
dami przyspieszającymi synchrocyklotronu panuje 
zmienne pole elektryczne o wolno malejącej częstości. 
Przebieg jego amplitudy przedstawiono na rys. 10. 
Punktem A jest oznaczona wartość pola konieczna do 
uzyskania takiego wzrostu energii cząstki, by po 
czasie T natrafiła ona na pole A' w celu dalszego 
przyspieszenia. Jeżeli jednak zamiast w punkcie A 
cząstka znajdzie się w polu przyspieszającym wcześniej 
(punkt i?), to uzyska zbyt dużo energii. Ze względu 
na relatywistyczny wzrost masy okres jej obiegu 
wydłuży się i w następnym cyklu przyspieszania zosta¬ 
nie ona poddana działaniu słabszego pola (punkt B'). 
W ten sposób zbyt silne przyspieszenie w jednym 
cyklu zostaje skompensowane słabszym przyspiesze¬ 
niem w cyklu następnym i odwrotnie. Warunkiem 
wystąpienia takiego samoregulującego się mechaniz¬ 
mu jest pojawienie się cząstek w obszarze pola, gdy 
pole to maleje (obszar wokół punktu A\ a nie gdy 
rośnie (obszar wokół punktu C). Należy zauważyć, 
że sytuacja w synchrocyklotronie jest odmienna niż 
w akceleratorze liniowym. Tam cząstki opóźniające 
się, a więc wolniejsze, powinny podlegać działaniu 
silniejszego pola przyspieszającego. W synchrocy¬ 
klotronie natomiast spóźniają się cząstki szybsze 
o zbyt dużej energii. 


Cyklotrony izochroniczne 

Jak wynika ze wzoru na okres obiegu cząstki po orbi¬ 
cie kołowej, okres ten można przy wzroście masy 
utrzymać stały, gdy jednocześnie zwiększy się wartość 
natężenia pola magnetycznego. Ponieważ cząstki 
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Rys. 11. Magnes dający pole magnetyczne o natężeniu rosnącym 
w kierunku zewnętrznym. Pole takie nie może być użyte w cyklo¬ 
tronie, gdyż nie ogniskuje cząstek w pobliżu poziomej płaszczyzny 
symetrii szczeliny magnesu 


o większej energii poruszają się po torach o większym 
promieniu, mogłoby się wydawać, że pole magne¬ 
tyczne magnesu (pokazanego na rys. 11) może za¬ 
pewnić możliwość przyspieszania cząstek przy stałej 
częstości zmiennego pola elektrycznego. W miarę 
uzyskiwania coraz większej energii, a więc i wzrostu 
relatywistycznego masy cząstki, porusza się ona po 
torach biegnących w obszarze silniejszego pola 
magnetycznego. Niestety, pola magnetycznego po¬ 
kazanego na rys. 11 nie można wykorzystać w cyklo¬ 
tronie, ponieważ charakteryzuje się ono tym, że tylko 
cząstki poruszające się w idealnie poziomej płaszczyź¬ 
nie symetrii szczeliny między nabiegunnikami pozo¬ 
staną w tej płaszczyźnie. Każde najdrobniejsze odchy¬ 
lenie od tej płaszczyzny spowoduje, że cząstki będą 
się od niej stopniowo oddalać i uderzą w nabiegunnik 
magnesu. 

Aby temu przeciwdziałać, w cyklotronach izochro- 
nicznych stosuje się pole magnetyczne, którego 
natężenie uśrednione po całej orbicie kołowej wzrasta 
wpływ wraz z odległością od środka cyklotronu. Nabiegun- 
kształtu niki nie mają jednak symetrii cylindrycznej jak w cy- 
nabiegunni- klotronach i synchrocyklotronach. Biegnące cząstki 
ków natrafią kolejno na obszary słabszego i silniejszego 



Rys. 12. Przykłady kształtu nabiegunników magnesów stosowa¬ 
nych w cyklotronach izochronicznych 


pola magnetycznego, co uniemożliwia im oddalanie 
się od płaszczyzny symetrii szczeliny między nabiegun¬ 
nikami. Na rys. 12 pokazane są nabiegunniki stoso¬ 
wane w cyklotronach izochronicznych. 

Za pomocą cyklotronów izochronicznych można 
uzyskiwać cząstki o energiach znacznie większych 
niż w cyklotronach klasycznych. W ten sposób uzys¬ 
kano protony o energii kilkuset MeV. Ograniczenie 
wielkości otrzymywanych energii za pomocą cyklo¬ 
tronów izochronicznych wynika z faktu, że dla 
dużych energii wzrostowi pędu cząstki towa¬ 
rzyszy bardzo mały wzrost jej prędkości. Należy 
więc poza cyklotronem utrzymywać pole rosnące 
bardzo szybko wraz z promieniem. W odległości 

m 0 c 2 

natężenie pola magnetycznego powinno osiągnąć 
wartość nieskończoną. We wzorze tym w 0 oznacza 
masę spoczynkową cząstki, a H 0 — natężenie pola 
magnetycznego w pobliżu osi nabiegunnika. Uzyskanie 
pola magnetycznego zmieniającego się gwałtownie 
z promieniem orbity jest prawie niemożliwe. 


Synchrotron 

W odróżnieniu od cyklotronu klasycznego, czy nawet 
izochronicznego, synchrocyklotron może teoretycznie 
dostarczać cząstki o nieograniczenie dużej energii. 
Przeszkodą jest jednak zbyt duży koszt jego budowy. 
Najkosztowniejszym jego elementem jest magnes, 
który musi wytwarzać prawie jednorodne pole magne¬ 
tyczne w bardzo dużym obszarze, obejmującym za¬ 
równo tory cząstek powolnych jak i tych w końcowej 
fazie przyspieszenia. Aby uniknąć wysokich kosztów 
magnesu, buduje się akceleratory, w których przy- 


pole o częstości 
malejącej 



Rys. 13. Schemat synchrotronu ze „słabym ogniskowaniem” 
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spieszane cząstki krążą po stałych orbitach. Dopóki 
cząstki mają małą energię, elektromagnesy wytwa¬ 
rzają pole magnetyczne o niewielkim natężeniu. 
Natężenie to rośnie w miarę uzyskiwania przez cząs¬ 
tki coraz wyższej energii. W ten sposób cząstki biegną 
w akceleratorze po stałych, w przybliżeniu, torach 
i tylko w tym obszarze potrzebne jest pole magne¬ 
tyczne. Przyspieszanie cząstek odbywa się podobnie 
jak w cyklotronach za pomocą zmiennego pola elek¬ 
trycznego. Częstość tego pola rośnie w miarę, jak 
rośnie prędkość cząstek. 

Schemat synchrotronu pokazany jest na rys. 13. 
Wstępnie przyspieszone cząstki wprowadzane są do 
synchrotronu, % gdzie ich tor składa się z czterech 
ćwiartek okręgu połączonych odcinkami prostolinio¬ 
wymi. Rosnące w procesie akceleracji pole zlokali¬ 
zowane jest tylko w obszarze, gdzie tory się zakrzy¬ 
wiają. Przyspieszanie cząstek odbywa się na jednym 
z prostych odcinków. Po uzyskaniu żądanej energii 
cząstki są na ogół wyprowadzane z akceleratora. 
W tym celu na pewnym odcinku ich orbity pojawia 
się pole magnetyczne skierowujące wiązkę cząstek 
w pożądanym kierunku. 

ogniskowa- Schemat pokazany na rys. 13 przedstawia synchro- 
nie słabe tron starszego typu z tzw. „słabym” ogniskowaniem. 

W akceleratorach tego typu tory przyspieszanych 
cząstek mogły się znacznie odchylać od średniego 
toru. Zmuszało to konstruktorów akceleratora do 
stosowania dużych magnesów, a próżniowy kanał 
akceleratora musiał mieć dużą średnicę. Odkrycie za¬ 
sady silnego ogniskowania umożliwiło stosowanie 
kanałów o średnicy paru centymetrów i tylko w tym 
obszarze powinno się wytworzyć pole magnetyczne. 

ogniskowa- Zasada silnego ogniskowania polega na zastosowaniu 
nie siBne szeregu magnesów, które na przemian skupiają i roz¬ 
praszają wiązkę przyspieszanych cząstek. W rezulta¬ 
cie, średnica wiązki zostaje zmniejszona, podobnie jak 



Rys. 14. Analogia optyczna zasady „silnego ogniskowania” 
cząstek 

zmniejszona jest średnica wiązki świetlnej (pokazanej 
na rys. 14) na skutek przechodzenia jej przez soczewki 
skupiające i rozpraszające. Synchrotrony ze słabym 
ogniskowaniem pozwalały na przyspieszanie proto¬ 
nów do energii ok. 10 GeV. Zastosowanie magnesów 
silnie ogniskujących pozwoliło osiągnąć znacznie wyż¬ 
sze energie. Supersynchrotron protonowy w Europej- 


kim Centrum Badań Jądrowych w Genewie przy¬ 
spiesza protony do energii 450 GeV, a zbudowany 
wcześniej w Batavii pod Chicago akcelerator pro¬ 
tonów dostarcza wiązek o energii do 500 GeV (il. 40, 
tabl. 11). 


Układy zderzających się wiązek 


Przy badaniu zderzeń o wysokich energiach ważne 
jest, aby uzyskać jak największą energię w układzie 
środka masy dwóch zderzających się cząstek. Jeżeli 
cząstka o masie m 1 spoczywa w laboratorium a ude¬ 
rzająca w nią cząstka o masie m 2 ma energię E , to 
energia zderzenia w układzie środka masy tych czą¬ 
stek E * wyniesie 

E * = l^tnl+ml + lEm^ 

Jeżeliby jednak obu cząstkom nadać energię E i skie¬ 
rować jedną przeciwko drugiej, to energia E* wy¬ 
niosłaby w tym przypadku 

E* = 2 E. 


W ten sposób np. dwie wiązki protonów, każda o ener¬ 
gii 20 GeV będą wywoływać zderzenia o energii E* 
wynoszącej 40 GeV. Ażeby tę energię uzyskać w wa¬ 
runkach, gdy przyspieszony zostaje tylko jeden pro¬ 
ton a drugi spoczywa, należałoby dysponować 
akceleratorem na energię 800 GeV. Zasadę zderzania 
ze sobą dwóch protonowych wiązek przeciwbieżnych 
zastosowano w Europejskim Centrum Badań Jądro¬ 
wych w Genewie w celu badania zderzeń o najwyż¬ 
szych wytworzonych przez człowieka energiach. Dwie 
intensywne wiązki protonów o natężeniu 20 amperów 
każda krążą po przeciwbieżnych torach w wysokiej 
próżni. „Czas życia” takiej wiązki wynosi kilkadzie¬ 
siąt godzin. W miejscu, gdzie te wiązki się spotykają, 
zachodzą zderzenia dwóch biegnących naprzeciw 
siebie protonów. Energia każdej z wiązek może osiąg¬ 
nąć do 30 GeV, co daje E* = 60 GeV. Dla osiągnięcia 
takiej energii w klasycznych akceleratorach należa¬ 
łoby przyspieszyć protony do energii 1800 GeV. 

Dwie wiązki przeciwbieżne stosuje się także przy 
badaniu zderzeń elektronów z pozytonami. Jest to 
zresztą jedyny sposób badania tych zderzeń. Istnieje 
w tej chwili na świecie sześć akceleratorów połączo¬ 
nych z układami zderzających się wiązek pozytono- 
wo-elektronowych. Dwa ostatnio zbudowane układy 
umożliwiają badanie zderzeń elektronowo-pozytono- 
wych przy energii każdej z wiązek dochodzącej do 
20 GeV. 

W.S. Scharf Akceleratory cząstek naładowanych i ich zastoso¬ 
wania , Warszawa 1978. 


protonowe 
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Oddziaływania silne 

Grzegorz Białkowski 


Oddziaływania silne cząstek 
trwałych i nietrwałych 


Oddziaływania silne są jednym z typów oddziaływań 
między cząstkami elementarnymi (-*■ Cząstki ele¬ 
mentarne i ich oddziaływania). Biorą w nich udział 
tylko hadrony. Istnienie tych oddziaływań zostało 
po raz pierwszy dostrzeżone przy próbach wyjaśnie¬ 
nia budowy i własności jąder atomowych. Początkowo 
zjawiska wewnątrzjądrowe próbowano zrozumieć 
stosując wyłącznie prawa elektrodynamiki. Po wy¬ 
kryciu neutronu przez Jamesa Chadwicka w 1932 r. 
stało się oczywiste, że są one do tego niewystarcza¬ 


jące. Na właściwą myśl wpadł Hideki Yukawa, który hipoteza 
zaproponował, aby do opisu sił jądrowych wprowa- istnienia 
dzić nową cząstkę elementarną, w owym czasie jeszcze mezonu 
nie zaobserwowaną w doświadczeniu, którą nazwano 
„mezonem”. 

W kilkanaście lat po wypowiedzeniu przez Yukawę 
tej hipotezy mezony n , oddziałujące z nukleonami, 
zostały istotnie wykryte. Był to jednak dopiero po- 
cząstek lawiny odkryć, trwającej zresztą do dziś, 
która z fizyki oddziaływań silnych czyni dziedzinę 
szczególnie pociągającą, ale też i szczególnie trudną. 

Fakty, które zostały stwierdzone doświadczalnie, 
dają się wyjaśnić teoretycznie na razie tylko częś¬ 
ciowo. Mimo to można powiedzieć śmiało, że nie- 
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wiele jest takich dziedzin fizyki, w których postęp 
w ostatnich latach byłby równie szybki, i w których 
zarazem tak zupełna byłaby świadomość stąpania 
po ziemi całkowicie nieznanej. Jest to więc dziedzina 
istotnie potrzebująca nowych idei, a w której tak nie¬ 
wiele da się przewidzieć na podstawie znanych już 
faktów. 

Informacje eksperymentalne dotyczące oddziały¬ 
wań silnych pochodzą z dwu nierównej wartości 
źródeł: z analizy stanów związanych (ją<J er atomo¬ 
wych i hiperjąder) oraz z analizy procesów zderzeń 
zachodzących między cząstkami elementarnymi. 
Znacznie bogatszy materiał pochodzi z tego drugiego 
źródła, przy czym okazuje się, że charakter danych 
zależy bardzo silnie od energii zderzających się obiek¬ 
tów. 

Istotne znaczenie dla rozwoju badań miała więc — 
poza udoskonaleniem techniki analizy otrzymywa¬ 
nych danych — także budowa coraz to potężniejszych 
akceleratorów cząstek (-* Akceleratory). Urządzenia 
te, w których dochodzi do zderzeń między hadronami, 
można podzielić na dwie grupy. Do pierwszej można 
zaliczyć urządzenia, w których przyspieszona wiązka 
pada na nieruchomą tarczę, a do drugiej te, w których 
dochodzi do czołowych zderzeń wiązek przeciwbież¬ 
nych. Każdy z tych dwóch typów akceleratorów ma 
swoje zalety: w drugim wykorzystuje się znacznie wy¬ 
dajniej moc akceleratora, ponieważ nie traci się ener¬ 
gii na (niemal) bezproduktywny fizycznie ruch środka 
masy zderzających się obiektów. Za to w pierwszym 
akceleratorze uzyskuje się znacznie większą wydajność 
przy danej gęstości wiązki, a przede wszystkim istnieje 
możliwość wytworzenia wiązek wtórnych, zawiera¬ 
jących obiekty nietrwałe, których nie można przy¬ 
spieszać ze względu- na ich krótki czas życia. Osta¬ 
tecznie, jeśli odliczyć zderzenia, w których biorą udział 
złożone jądra atomowe, mamy do dyspozycji dane 
pochodzące z oddziaływań na tarczach protonowych 
wiązek złożonych z protonów, neutronów, niektórych 
hiperonów, mezonów tt*, mezonów K + i K~ i wre¬ 
szcie mezonów K £. Badanie zderzeń z nukleonami in¬ 
nych cząstek, jeszcze mniej trwałych, z których nie 
można sformować nawet wiązki wtórnej, jest umo¬ 
żliwione (w ograniczonym zakresie i z większą 
niepewnością) przez badanie kaskad wewnątrzjąd- 
rowych. Także analiza oddziaływań w stanie koń¬ 
cowym dostarcza pewnych informacji o oddziały¬ 
waniach cząstek nietrwałych. 


Rys. 1. Oddziały¬ 
wanie cząstek nie¬ 
trwałych wewnątrz 
jąder atomowych 



gim, lub jeszcze dalszym. Na ogół jednak, znając 
wielkości opisujące procesy rozpraszania mezonu n 
na nukleonie oraz produkcji mezonu g w zderzeniu 
mezonu n z nukleonem, możemy przystąpić do ana¬ 
lizy danych dotyczących produkcji mezonów g na 
jądrach mając tylko jedną wielkość nieznaną, a mia¬ 
nowicie amplitudę rozpraszania mezonów g na nu¬ 
kleonach. Tę wielkość więc w zasadzie można wyzna¬ 
czyć. Oczywiście postępowanie takie zawiera wiele 
niezbyt pewnych elementów, jednakże można się 
nim posłużyć do uzy skania co najmniej przybliżonych 
informacji o procesie, którego innymi metodami nie 
można byłoby w ogóle badać. 

Jeśli chodzi o oddziaływanie w stanie końcowym, 
to dostarcza nam ono informacji o zderzeniach czą¬ 
stek, które zostały właśnie wytworzone w danym 
procesie i które jeszcze przez jakiś czas po akcie pro- 
dukcji pozostają w zasięgu sił. Takie cząstki, zanim 
się od siebie dostatecznie oddalą, oddziałują ze sobą, 
co modyfikuje np. ich rozkłady kątowe i to w sposób 
wyraźnie zależny od energii ruchu względnego tych 
obiektów. Badając owe rozkłady możemy się do¬ 
wiedzieć, jak oddziaływałyby cząstki, gdybyśmy 
z nich umieli formować wiązki i tarcze, stosując 
standardowe metody badania zderzeń. 

W pewnych wypadkach analizę oddziaływania 
wzajemnego cząstek nietrwałych można jeszcze 
bardziej udoskonalić, stosując metodę opartą na 
przybliżeniu biegunowym (znaczenie tego pojęcia 
zostanie wyjaśnione nieco dalej). Zasada postępowa¬ 
nia jest przedstawiona na rys. 2. Przykładem może 
być proces produkcji jednego mezonu 7t w zderzeniu 
mezonu n z nukleonem. Sądzimy w tym wypadku, 
że główny przyczynek do amplitudy produkcji 
przy bardzo małych przekazach czteropędu od nukleo¬ 
nu początkowego do końcowego wnosi wymiana 
pojedynczego mezonu n , jak to przedstawia rys. 2. 
Gdy bowiem przekaz czteropędu jest mały, to (zgod¬ 
nie z zasadą nieokreśloności) parametr zderzenia 
jest duży. Z drugiej strony, średni promień chmury 
cząstek wirtualnych otaczających nukleon jest od¬ 
wrotnie proporcjonalny do masy tych cząstek. Skoro 
zaś najlżejszym hadronem jest mezon rc, możemy 
sądzić, że najbardziej zewnętrzna część chmury jest 
tworzona przez te właśnie cząstki. Zatem w zderzeniu 
peryferycznym nadlatujący mezon n uderza w wirtu¬ 
alny mezon n znajdujący się w chmurze. Taka interpre¬ 
tacja umożliwia przeprowadzenie analizy procesów 
produkcji dodatkowego mezonu n w zderzeniu n-N 
oraz w zderzeniu K-N w taki sposób, aby z niej 
uzyskać informacje dotyczące odpowiednio oddzia¬ 
ływań 7 r- 7 r i K-n, Takie właśnie analizy są wykony¬ 
wane i dostarczają nam niezwykle cennych danych, 
choć nie całkiem pewnych i teoretycznie uzasadnio¬ 
nych, głównie ze względu na istnienie poprawki odpo¬ 
wiadającej wymianie więcej niż jednej cząstki. 


Obszary energii dla zderzeń hadron-hadron 


Zasada badania oddziaływań cząstek nietrwałych 
w zderzeniach wewnątrzjądrowych jest przedsta¬ 
wiona schematycznie na rys. 1. Wiązka cząstek 
padających (np. mezonów n) udenza w jądro. Jedna 
z tych cząstek wytwarza w wyniku oddziaływania 
z jednym z nukleonów znajdujących się w jądrze 
(w punkcie a) inną cząstkę, bardzo nietrwałą (np. 
mezon g). Ze względu na to, że odległości między 
nukleonami w jądrze są bardzo małe, ok. 1 fm, ist¬ 
nieje duże prawdopodobieństwo, że nowo wytwo¬ 
rzona cząstka zdąży oddziałać z kolejnym nukleonem 
(w punkcie b ) zanim się rozpadnie. Jeżeli energia tej 
cząstki nie jest zbyt duża, to w oddziaływaniu tym nie 
dojdzie do zmiany rodzaju cząstek (oddziaływanie 
elastyczne). Po jednym lub kilku takich oddziaływa¬ 
niach cząstka ta opuści jądro i rozpadnie się. Oczy¬ 
wiście padający na jądro mezon n może wytworzyć 
mezon g nie w swym pierwszym zderzeniu, ale w dru¬ 


Jak już wspomniano, charakterystyka zderzeń za¬ 
leży w dużym stopniu od energii, przy której zderze¬ 
nia te zachodzą. Można wyróżnić kilka obszarów 
energetycznych, w których zderzenia hadron-hadron 
mają specyficzne cechy. (Opisany tu przebieg za¬ 
leżności energetycznej jest wyidealizowany; w rzeczy¬ 
wistości bowiem nie wszystkie cząstki zachowują się 
jednakowo, a poszczególne obszary energetyczne 
nie są od siebie wyraźnie oddzielone). W obszarze 
skrajnie niskich energii oddziaływanie kulombowskie 
nawet przy stosunkowo dużych kątach rozpraszania 
konkuruje z oddziaływaniem silnym; w tym wypadku 
trudno uzyskać informacje o oddziaływaniach sil¬ 
nych hadronów naładowanych. Istnienie oddziaływań 
kulombowskich przejawia się też w tym, że bardzo 
powolne naładowane ujemnie hadrony są chwytane 
przez protony, co prowadzi od powstania specyficz¬ 
nych układów atomowych, zw. hadroatomami (jeśli 
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schwytaną cząstką jest mezon, taki obiekt nazywamy 
mezoatomem, —► Atomy egzotyczne). Atomy te za¬ 
chowują się podobnie do zwykłych atomów, w których 
na orbicie znajdują się elektrony, z tą tylko różnicą, 
że orbity te mają znacznie mniejsze promienie (w sto¬ 
sunku równym stosunkowi mas danego hadronu 
i elektronu). Z tych orbit hadrony naładowane ujem¬ 
nie są chwytane przez jądra, przy czym dochodzi do 
anihilacji ładunku, a czasem i innych liczb kwanto¬ 
wych (np. liczby barionowej, jeśli schwytaną cząstką 
jest antyproton). Badanie tych procesów ma zasad¬ 
nicze znaczenie dla fizyki jądra atomowego, pozw-ala 
bowiem badać jego strukturę; dla fizyki oddziaływań 
silnych ma ono jednak mniejsze znaczenie. 

W kolejnym obszarze, energii bardzo niskich, mo¬ 
żemy odróżnić dwa zasadnicze przypadki. Jeżeli 
zderzające się cząstki nie anihilują ze sobą, to znaczy, 
jeśli nie istnieje stan dwu lub więcej cząstek o niższej 
masie lecz tych samych wszystkich liczbach kwanto¬ 
wych, jakie ma układ cząstek zderzających się (do 
układów nie anihilujacych należą układy p-p , n±-p y 
K + -p i A-p), to w obszarze bardzo niskich energii 
w oddziaływaniu nie powstają nowe cząstki i oddzia¬ 
ływanie to można bardzo łatwo opisać, wprowadzając 
niewielką liczbę parametrów fenomenologicznych, 
takich jak długość rozpraszania czy też zasięg efektyw¬ 
ny (por. tekst dalej). Jeżeli jednak zderzające się 
cząstki mogą anihilować (np. dotyczy to układu 
p-p lub też K~-p y który nawet już przy energii 
progowej może przejść np. w układ A-n °), to od¬ 
działywanie już od energii progowej ma charakter 
nieelastyczny, co zwykle prowadzi do istotnych 
komplikacji w opisie i interpretacji danych. 

Kolejny obszar można by nazwać obszarem niskich 
energii. W obszarze tym procesy nieelastyczne wy¬ 
stępują już nawet w tych zderzeniach, które w obsza¬ 
rze poprzednim miały charakter czysto elastyczny, ale 
zjawiska nieelastyczne odgrywają w nim jeszcze nie¬ 
wielką rolę. Można tu znów rozróżnić dwie grupy 
procesów. W jednej z nich w obszarze niskich energii 
dochodzi do powstania jednocząstkowych bardzo 
nietrwałych obiektów, które nazywa się stanami 
rezonansowymi układu zderzających się cząstek. 
Do grupy tych procesów należy m.in. rozpraszanie 
7r±-p,czy n + - 7 t~ lub K~-p. Do drugiej grupy procesów 
należy rozpraszanie K + -p czy 7i + -7r + lub też p-p. 
Zdania co do istnienia stanów rezonansowych także 
i w tych układach są podzielone; w każdym razie 
można uznać, że jeśli one istnieją, to do ich powstania 
dochodzi trudniej i nie są one tak bezpośrednio 
widoczne jak w pierwszej grupie procesów. 

W następnym obszarze energii zwanym obszarem 
średnich energii, struktury rezonansowe stopniowo 
zanikają, rośnie natomiast nieelastyczność zderzeń. 
Rezonanse mają coraz to krótsze czasy życia, co 
utrudnia ich identyfikację. W rezultacie są one co¬ 
raz mniej dostrzegalne. Nie sprzyja temu również 
wzrastająca liczba stanów orbitalnych, w których 
mogą się znaleźć cząstki silnie oddziałujące (por. da¬ 
lej). Jest to obszar może najtrudniejszy z punktu 
widzenia analizy teoretycznej, ale też chyba i najmniej 
interesujący. 

W obszarze wysokich energii obraz nieco się upra¬ 
szcza. Rezonanse przestają być widoczne, nato¬ 
miast można wprowadzić pewne metody specjalnie 
przystosowane do tego obszaru energii (np. metoda 
biegunów Reggego; zob. dalej). W obszarze tym 
silnie rośnie krotność wyprodukowanych cząstek 
i wkład procesów nieelastycznych znacznie prze¬ 
wyższa wkład procesów elastycznych. 

Wreszcie, w obszarze skrajnie wysokich energii, 
zaczynamy obserwować pewne regularności, które 
zgodnie z przewidywaniami teoretycznymi powinny 
cechować zderzenia przy energiach zmierzających do 
nieskończoności. Znaczna część tych regularności ma 
charakter uniwersalny, a więc niezależny od rodzaju 
zderzających się cząstek. Jest sprawą w pewnej 
mierze otwartą, czy już przy obecnie osiągalnych 


energiach zbliżono się do obszaru „asymptotycznego”, 
a także jak dalece przewidywania teoretyczne, oparte 
przecież na pewnych założeniach, będą się sprawdzać 
w praktyce. 


Wybór zmiennych kinematycznych 

Będziemy rozważać zderzenia zachodzące między 
dwiema cząstkami w stanie początkowym: cząstką-po- 
ciskiem a i cząstką-tarczą b. W stanie końcowym 
mogą pojawić się dwie cząstki, i wtedy proces na- procesy 
żywa się binarnym, albo więcej cząstek i wtedy binarne i wie 
proces jest wielocząstkowy. W dalszym ciągu przez locząstkowe 
cząstkę trwałą należy rozumieć cząstkę trwałą ze 
względu na oddziaływania silne, a więc o czasie 
życia rzędu co najmniej 10~ 20 s. Może się zdarzyć, 
że proces wielocząstkowy zachodzi w ten sposób, że 
w rzeczywistości są wytwarzane dwie cząstki nie¬ 
trwałe rozpadające się niemal w miejscu swej pro- procesy 
dukcji na Cząstki trwałe. W takich wypadkach mówi kwazibinarne 
się o procesie kwazibinarnym. 

Wśród procesów binarnych można wyróżnić 
w^ażną klasę procesów elastycznych, tj. takich, w któ¬ 
rych cząstki końcowe są fizycznie identyczne z czą¬ 
stkami początkowymi. Zbliżony charakter mają te 
procesy, w których jedyna zmiana w porówmaniu 
ze stanem początkowym polega na wymianie ła¬ 
dunku (procesy wymiany ładunku, np. tC -p -> r^-n) 
lub też na wymianie dziwności (procesy z wymianą 
dziwności, np. K~-p -> 7 T-£ + ). Niekiedy mówi się też 
o procesach z wymianą innych liczb kwantowych. 

Z czteropędów p a i Pb cząstek początkowych można 
utworzyć jeden niezmiennik lorentzowski, a więc 
wielkość niezależną od wyboru układu odniesienia. 






Rys. 3. Określenie układu laboratoryjnego (a) i układu środka 
masy (b) dla procesów wielocząstkowych i binarnych 


Wielkością tą jest zmienna s = ( p a +pb ) 2 . W układzie zmienna s 

laboratoryjnym, zdefiniowanym warunkiem pb = 0 
(rys. 3a), zmienna 5 wyraża się wzorem 

s = m 2 a -\-ml+2m b El(j> a ), (1) 

gdzie m a i mb są masami zderzających się cząstek, 

a Ei jest energią cząstki-pocisku w układzie labora¬ 
toryjnym. Oczywiście, energia i pęd $ą związane za¬ 
leżnością relatywistyczną, tj. (c = l) 

E = V7‘+»r ■ (2) 

W układzie środka masy zdefiniowanym warunkiem 
Pa-ł-pb = 0 (rys. 3b), zmienna s dana jest wzorem 
^ = W\ (3) 

gdzie W^jest energią całkowitą obu cząstek w ukła- 
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zmienna t 


zmienna u 


pospieszność 


dzie środka masy (nazywa się ją także masą efektyw¬ 
ną układu cząstek a i b), daną zatem wzorem 

w = ez+e; ( 4 ) 

(odtąd gwiazdkami będą zawsze oznaczane wielkości 
zdefiniowane w układzie środka masy). 

Dla każdej pary cząstek, jednej początkowej 
i jednej końcowej, można zdefiniować wielkość 
zwaną kwadratem przekazu czteropędu, np. / = 
= (pa—pc) 2 . W wypadku procesów binarnych wpro¬ 
wadza się jeszcze zmienną u — (p a —pd) 2 . Można 
łatwo wykazać, korzystając z zasady zachowania 
czteropędu, 

Pa+Pb = pc+pdy (5) 

że zmienne s, ti u nie są niezależne, gdyż spełniają one 
równość 

s+t+u = ( 6 ) 

Zależności — takie jak związek (6) — między 
zmiennymi kinematycznymi charakteryzującymi dany 
proces powodują, że proces o n cząstkach w stanie 
końcowym (i, oczywiście, dwu w stanie początkowym) 
jest opisywany tylko przez 3/z—4 zmienne niezależne. 
W procesie binarnym istnieją więc tylko dwie takie 
zmienne i można je wybrać jako s i /. W każdym 
ustalonym układzie odniesienia można też wprowa¬ 
dzić dwie inne zmienne, bliżej powiązane z pomiarem. 
Przykładem takiej pary zmiennych może być (w ukła¬ 
dzie laboratoryjnym) energia lub pęd cząstki-po- 
cisku oraz kąt między kierunkiem jej lotu i kierun¬ 
kiem lotu jednej z cząstek końcowych, np. cząstki c 
(kąt produkcji cząstki c). W układzie środka masy 
dwiema wybranymi zmiennymi są często wartość 
bezwzględna pędu cząstek zderzających się, pi = 

= \p a \ = \pb\ i kąt między kierunkiem lotu cząstki a 
i cząstki c, 0*. Jeśli cząstki a i c są identyczne, to 
mówimy nie o kącie produkcji, lecz o kącie rozpra¬ 
szania. Zmienna / wyraża się przez zmienne kinema¬ 
tyczne zdefiniowane w układzie środka masy wzorem 

/ = +wj - 2 E;E* C + 2p* a p * cos $*. (7) 

Ponieważ w procesach elastycznych pęd początkowy 
Pi jest dokładnie równy pędowi końcowemu p/ = 

= \pc\ — \pd\y wzór powyższy znacznie się wtedy 
upraszcza i przybiera postać 


/ = — 2/? 2 *(l — cosfl*). (8) 


W procesach wielocząstkowych można się także 
posługiwać zmiennymi zdefiniowanymi niezależnie 
od wyboru układu odniesienia, lecz często wtedy, gdy 
dąży się do określenia stanu jednej lub dwu wybra¬ 
nych cząstek, wprowadza się pojęcia nowe, które są 
tu bardziej przydatne. Wektor pędu cząstki rozkłada 

się na pęd podłużny p ih tj. tę składową pędu, która 
jest skierowana równolegle do pędu cząstki pocisku, 

oraz pęd poprzeczny p±, znajdujący się w płaszczyźnie 
prostopadłej do lotu pocisku. Przy transformacjach 
Lorentza, w których prędkość względna obu układów 

jest skierowana zgodnie z p a , pędy poprzeczne 
wszystkich cząstek nie zmieniają się, gdyż przekształ¬ 
ceniu ulegają tylko zmienne Aby dalej uprościć 
problem przechodzenia od układu do układu wpro¬ 
wadza się zmienną zw. pospiesznością (ang. rapidity ), 
zdefiniowaną wzorem 


y = 



E+p 

E-p 


(8a) 


która ma tę istotną własność, że przy zmianie układu 
odniesienia pospieszności wszystkich cząstek zmienia¬ 
ją się w szczególnie prosty sposób, a mianowicie 
do każdej z nich dodaje się ta sama stała odpowia¬ 
dająca pospieszności względnej obu układów odnie¬ 
sienia. 


W doświadczeniu mierzy się niekiedy tylko kąty, pseudo- 
pod którymi wylatują poszczególne cząstki. Wygodnie pospieszność 
jest wtedy wprowadzić wielkość zw. pseudopospiesz- 
nością, ??, zdefiniowaną wzorem: 

V = -ln tg (0/2). (9) 

Użyteczność tej zmiennej wynika stąd, że jest ona 
powiązana z pospiesznością w-zorem: 

Pj sinhł? = (}/ m 2J rp]_ )sinhy. (10) 

Widać z tego, że w tych wszystkich wypadkach, 
w których masa wyprodukowanej cząstki jest mała 
w porównaniu z jej pędem poprzecznym (zachodzi to 
często dla mezonów tt), pospieszność i pseudopo- 
spieszność są w przybliżeniu jednakowe. 

Zgodnie z ogólnymi zasadami fizyki kwantowej, amplitudy 
przejścia od stanu początkowego do końcowego opi- przejścia 
sywane są zespołem funkcji zw. amplitudami przej¬ 
ścia; przy czym każda z nich jest zależna od wymie¬ 
nionych wcześniej 3/7 —4 zmiennych kinematycz¬ 
nych. Amplitudy przejścia są funkcjami zespolonymi 
tych zmiennych, a ich znajomość daje kompletny 
opis procesu. Liczba amplitud zależy od spinów 
cząstek zarówno początkowych jak i końcowych. 

Ponieważ hadron o spinie S może występować 
w 2S+1 stanach spinowych, przeto łączna liczba 
amplitud nie może przekraczać wartości (2S a -fl) 

(25& + 1) (20^4-1)... W rzeczywistości jednak jest ona 
znacznie mniejsza ze względu na to, że w oddziały¬ 
waniach silnych zachowywana jest parzystość (a więc 
amplitudy muszą spełniać warunki wynikające z nie¬ 
zmienni czości teorii względem inwersji). Ponadto 
dalsze ograniczenia liczby amplitud w procesach 
elastycznych pochodzą z niezmienniczości teorii 
względem odwrócenia czasu, d jeśli zderzające się 
cząstki są jednakowe, mogą powstać dodatkowe za¬ 
leżności między amplitudami wynikające z zasad sy¬ 
metrii lub antysymetrii funkcji falowej zależnie od 
tego, czy cząstki te są bozonami czy też fermionami. 

W rezultacie liczba amplitud znacznie się zmniejsza. 

W dwu szczególnie ważnych wypadkach mamy: dwie 
niezależne amplitudy dla zderzeń cząstek o spinach 
0 i 1 / 2 oraz 6 amplitud dla zderzeń elastycznych 
cząstek o spinie 1 / 2 : liczba ta zmniejsza się do 5, gdy 
zderzające się cząstki są jednakowe (np. dla zderzeń 
nukleon-nukleon). Oczywiście w procesach nieela¬ 
stycznych, a szczególnie wielociałowych, liczba nie¬ 
zależnych amplitud, mimo wszystkich możliwych 
ograniczeń, może być bardzo duża. Pojawienie się 
efektów zależnych od spinu prowadzi do poważnych 
komplikacji (co prawda czysto technicznych), któ¬ 
rych pełne omówienie nie jest tu możliwe. Wobec tego 
wszędzie tam, gdzie nie będzie to specjalnie zazna¬ 
czone, wszystkie hadrony będą traktowane tak, jak 
gdyby były cząstkami bezspinowymi. 


Przegląd danych doświadczalnych 

Wielkościami mierzonymi doświadczalnie są m.in.: 
a) całkowity przekrój czynny cr ca ;k na zderzenie dwu 
danych hadronów; b) całkowity przekrój czynny na 
zderzenie elastyczne dwu hadronów, <7ci caik; c) róż¬ 
niczkowy przekrój czynny na rozmaite procesy bi¬ 
narne, w tym także na proces elastyczny, da}dQ; 
d) rozmaite wielkości charakteryzujące stany spinowe 
zderzających się cząstek (wektory i tensory polary¬ 
zacji); e) rozkłady krotności wyprodukowanych 
cząstek, w tym przede wszystkim krotność średnia 
n ; f) rozkłady kątowe jednej ustalonej cząstki wy- rozkłady 
produkowanej w zderzeniu danych dwu hadronów inkluzywne 
(są to rozkłady inkluzywne, które można zapisać 
symbolicznie w następujący sposób: 

a-\-b —> c-ł-X 9 

gdzie X oznacza wszystkie inne cząstki, które zostały 
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przekrój czynny 




wyprodukowane oprócz cząstki c y ale nie były iden¬ 
tyfikowane); rozkłady te dane są wielkością 

„da da 

E ———— = ——; (11) 

dp\\d~p ± dyd~p ± 

g) podobne rozkłady dla dwu lub więcej cząstek od¬ 
powiadające procesom 

a-i-b —> c-\-d-\- X y 
a+b -> c+d+e+X 
itd. 


Analiza takich danych pozwała na wyznaczenie 
innych wielkości fizycznych, które mogą mieć głębszy 
sens fizyczny i które są przedmiotem zainteresowania 
teorii oddziaływań silnych. 

W bardzo schematycznym zarysie istniejące dane 
doświadczalne przedstawiają się następująco, 
zależność Gdy energia zbliża się do wartości progowej cał- 
przekroju kowity przekrój czynny reakcji może albo zmierzać 
czynnego od do nieskończoności albo do pewnej stałej, niekiedy 
energii równej zeru. Pierwszy przypadek odpowiada tym 
procesom, którym od progu towarzyszy anihilacja 
(w ogólnym sensie tego słowa); wówczas <r C ałk zmierza 
do nieskończoności zgodnie z prawem 


const 

°całk ~ —-- 


( 12 ) 


w którym v — prędkość cząstki padającej w układzie 
laboratoryjnym. Całkowity przekrój czynny jest bo¬ 
wiem ilorazem dwu czynników, z których licznik 
przedstawia prawdopodobieństwo zajścia jakiegokol¬ 
wiek oddziaływania przy danym stanie początko¬ 
wym, mianownik zaś — gęstość strumienia cząstek 
padających, proporcjonalną do v. Próg reakcji jest 
określony przez znikanie prędkości cząstki padają¬ 
cej, tak więc mianownik wyrażenia na <r ca ik zawsze 


zmierza do zera. Jednakże w procesach, którym już 
od progu towarzyszą przejścia nieelastyczne, nawet 
w progu nie znika prawdopodobieństwo przejścia, 
co prowadzi do nieskończonej wartości ilorazu. Na¬ 
tomiast procesy, które w pobliżu progu są czysto 
elastyczne, charakteryzują się tym, że w progu znika 
prawdopodobieństwo przejścia i w rezultacie iloraz 
(który ma teraz postać 0/0) przybiera pewną wartość 
skończoną. 

Dalszy przebieg zależności cr ca łk od energii zależy 
od tego, czy w procesie zderzenia pojawiają się rezo¬ 
nanse, czy też nie. W pierwszym wypadku wykres 
tfcałk (E) jest krzywą, wykazującą szereg stopniowo 
coraz to niższych i szerszych maksimów, które po 
przekroczeniu pewnej wartości energii zanikają. 
Wartość energii, przy której takie maksimum wystę¬ 
puje, odpowiada w przybliżeniu wartości energii 



Rys. 4. Całkowity przekrój czynny w pobliżu energii rezonan¬ 
sowej, odpowiadający wzorowi Breita-Wignera 
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różniczkowy przekrój czynny doi di? 



rezonansowej. Zachowanie się przekroju czynnego 
(rys. 4) w otoczeniu takiego punktu można opisać 
w przybliżeniu fenomenologicznym wzorem Breita- 
Wignera 


(254-1) T 2 /4 

"calk p i {E-E a f+ 1 Ur l ’ 


(13) 


wzór Breita— 
-Wignera 


gdzie r —szerokość połówkowa rezonansu, E 0 — 
energia rezonansowa, p — pęd w układzie środka 
masy zderzających się obiektów, a S — spin rezo¬ 
nansu (całkowity moment pędu zderzających się 
cząstek). Zgodnie z zasadą nieokreśloności, rezonans czas życia 
możemy traktować jako bardzo nietrwałą cząstkę, rezonansu 
której średni czas życia wiąże się z r wzorem 

r-rxfi. ( 14 ) 

W wypadku drugim, gdy rezonansów nie ma, albo 
też gdy są one mało widoczne, wykres zależności 



Rys. 7. Różniczkowy przekrój czynny dcxjdQ na rozpraszanie 
elastyczne n-p w obszarze niskich energii 


Rys. 8. Różniczkowy przekrój czynny d<j{dQ na 
rozpraszanie elastyczne p-p w obszarze niskich energi i 



9 - Encyklopedia fizyki współczesnej 


129 
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tfcaik od energii jest krzywą gładką, zbliżoną do wy¬ 
kresu funkcji stałej. W obszarze najwyższych energii 
obserwuje się jednak uniwersalny wzrost o C ałk pro¬ 
porcjonalny do kwadratu logarytmu energii (rys. 5). 

Zależność od energii całkowitego przekroju czyn¬ 
nego na proces elastyczny, a zatem i na wszystkie 
procesy nieelastyczne, omeei = ^całk—tfeicaik, dany 
jest krzywą zbliżoną do wykresu całkowitego prze¬ 
kroju czynnego, mimo że stosunek tych wielkości nie 
jest stały i wykazuje pewną zmienność z energią 
(rys. 6). 

Różniczkowy przekrój czynny na zderzenie ela¬ 
styczne wykazuje silną zależność zarówno od energii, 
jak i (na ogół) od kąta, jak wreszcie, co najmniej 
w obszarze niezbyt dużych energii, także od rodzaju 
zderzających się cząstek. Na rys. 7 i 8 podane są 
przykładowo różniczkowe przekroje czynne na ela¬ 
styczne rozpraszanie n + -p oraz p-p, w obu wy¬ 
padkach w obszarze niskich energii, natomiast na 

mb/(GeV/c ) 2 



-kwadrat przekazu czteropędu (GeV/c ) 2 


Rys. 10. Różniczkowy przekrój czynny dojdt na rozpraszanie 
elastyczne p-p w obszarze wysokich energii 


rys. 9 i 10 — w obszarze wysokich energii. Z rysun¬ 
ków tych widać, że przy przejściu od niskich do wy¬ 
sokich energii obraz całkowicie się zmienia. Różnicz¬ 
kowy przekrój czynny, który w obszarze niskich 
energii jest niemal izotropowy lub stosunkowo wolno 
zmienny z kątem rozpraszania, w obszarze energii 
wysokich jest duży tylko dla bardzo małych kątów, 
gdzie obserwuje się ostre maksimum. Nachylenie 
krzywej przedstawiającej to maksimum rośnie na 
ogół ze wzrostem energii. Przekrój czynny opada 
wykładniczo, przybierając w obszarze kątów bliskich 
90° bardzo małą wartość. Zwykle przed osiągnięciem 
tej małej wartości krzywa przechodzi przez kilka 
maksimów i minimów. W obszarze kątów bliskich 
180° (w rozpraszaniu proton-proton ze względu na 
identyczność cząstek jest to obszar fizycznie nieod¬ 
różnialny od obszaru kątów bliskich zeru) pojawia 
się nowe maksimum, znacznie niższe niż dla małych 
kątów. 

Ważną — z teoretycznego punktu widzenia — in¬ 
formacją doświadczalną jest wartość stosunku części 
rzeczywistej do części urojonej amplitudy rozprasza¬ 
nia. W obszarze niskich energii wielkość tę można 
zawsze wyznaczyć po dokonaniu analizy fazowej, 
o czym będzie dalej mowa. Natomiast w obszarze 
wysokich energii z różnych powodów nie można 
wykonać analizy fazowej. W tym wypadku wyznacza 
się stosunek Re/Im badając interferencję amplitudy 
rozpraszania jądrowego z amplitudą rozpraszania 
kulombowskiego. W obszarze bardzo dużych energii 
rozpraszanie kulombowskie jest znaczne tylko dla 
bardzo małych kątów, a więc tylko tam wyraz in¬ 
terferencyjny może być znaczny i dostępny obser¬ 
wacji. O rozpraszaniu kulombowskim wiadomo 
praktycznie wszystko; jego amplituda jest niemal 
czysto rzeczywista. Tak więc w dobrym przybliżeniu 
wyraz interferencyjny pochodzi z iloczynu części 
rzeczywistej obu amplitud. W rezultacie uzyskuje się 
informacje nie tylko o wartości części rzeczywistej 
amplitudy uwarunkowanej oddziaływaniem silnym, 
ale też i o jej znaku. Oczywiście metodę tę można 
stosować tylko dla cząstek naładowanych elektrycz¬ 
nie, między którymi działa siła kulombowska. Wy¬ 
niki przedstawione są na rys. 11 i 12. Dla wszystkich 
zbadanych reakcji Re/Im jest małą wielkością zmniej¬ 
szającą się wraz z energią. Można powiedzieć zatem, 
że amplituda rozpraszania elastycznego w obszarze 
wysokich energii jest w przybliżeniu funkcją urojoną, 
przynajmniej w obszarze bardzo małych kątów. 

Oprócz procesów elastycznych bardzo duże zna¬ 
czenie w teorii oddziaływań silnych mają też inne 
procesy binarne. Szczególnie wiele uwagi poświęca 
się analizie procesów z wymianą ładunku. Jednym 
z najlepiej zbadanych jest proces 

7i~ ~\~p -> n°+n. 


mb/(G eV/c ) 2 



Rys. 11. Różniczkowy przekrój czynny dajdt na rozpraszanie elastyczne p-p przy wysokiej energii w tym zakresie wartości 
kwadratu przekazu czteropędu, w którym można zaobserwować interferencję kulombowską 
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Rvs. 12. Zależność od pędu laboratoryjnego stosunku części rzeczywi¬ 
stej do urojonej amplitudy rozpraszania elastycznego rozmaitych naar 
nów na protonach 



Rys. 13. Zależność od energii całkowitego przekroju 
czynnego na procesy wymiany ładunku 


«b/(GeV/c ) 2 



Rys. 14. Różniczkowy przekrój czynny daj di na proces wymiany 
ładunku n~ p~> 7 t°n przy kilku wartościach energii w zakresie 
0 < l/ j < 1.3 (GcV/c)* 

Na rys. 13 przedstawiona jest zależność od energii 
całkowitego przekroju czynnego na ten proces. Widać 
z niego, że w obszarze dużych energii wielkość ta 


szybko maleje z energią. Różniczkowy przekrój 
czynny na ten proces dla dużych energii pokazany 
jest na rys. 14. Istnieje cała grupa tego typu procesów 
binarnych, lecz nieelastycznych i niemal wszystkie 
wykazują szybki spadek całkowitego przekroju czyn¬ 
nego z energią. Wyjątkowe znaczenie ma więc ta 
grupa procesów kwazielastycznych, dla których cał¬ 
kowity przekrój czynny maleje z energią bardzo po¬ 
woli lub nawet w ogóle nie maleje. Zaobserwowano, 
że dotyczy to przede wszystkim tych procesów, 
w których nie ma wymiany ładunku, dziwności itd., 
czyli które spełniają tzw. warunek Morrisona-Gribo- 
wa. Właśnie w tych procesach powstają cząstki w sta¬ 
nie końcowym, które różniąc się spinem o AS i pa¬ 
rzystością o AP od cząstki początkowej, mają 

AP-i-iy* os) 

Innymi słowy, jeśli spin cząstki zmienia się o liczbę 
parzystą, to parzystość cząstki się nie zmienia, nato¬ 
miast jeśli spin zmienia się o liczbę nieparzystą, to pa¬ 
rzystość zmienia się z dodatniej na ujemną lub 
z ujemnej na dodatnią. 

Ta reguła jest przykładem pewnej ogólniejszej za¬ 
leżności, która wiąże szybkość zmniejszania się 
przekroju czynnego na dany proces z wartościami 
liczb kwantowych, które są „wymieniane” między 
oddziałującymi cząstkami. Jest zrozumiałe, że w pro¬ 
cesie elastycznym, w którym liczby kwantowe obu 
cząstek nie zmieniają się, przekazywane są między 
cząstkami liczby kwantowe próżni (zakładamy, że 
próżnia jest obojętna elektrycznie, ma dziwność, 
liczbę barionową, powab, izospin i spin równe zeru, 
a parzystość zwykłą i ładunkową równą +1). Także 
w omówionych procesach są wymieniane liczby kwan¬ 
towe próżni. Okazuje się zaś, że gdy wymieniane 
liczby kwantowe odpowiadają liczbom kwantowym 
dowolnego mezonu niedziwnego, spadek przekroju 
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Rys. 15. Przykłady procesów wymiany różnych liczb kwantowych 
oraz dane doświadczalne obrazujące spadek ze wzrostem energii 
crc&jk na te procesy. Na rysunku przedstawiona jest liczba pro¬ 
cesów o ustalonej wartości wykładnika n występującego we 
wzorze crank ~ p~ n , gdzie p — pęd laboratoryjny cząstki padają¬ 
cej; a) wymiana liczb kwantowych próżni ($>), b) wymiana ła¬ 
dunku, c) wymiana dziwności, d) wymiana liczby barionowej 
e) wymiana liczb kwantowych mezonu egzotycznego 

mb/(GeV/c) 2 



Rys. 16. Zjawisko przecinania się wykresów obrazujących różnicz¬ 
kowe przekroje czynne na zderzenia elastyczne cząstki i anty- 
cząstki na protonach O, — pęd laboratoryjny cząstki padającej) 


czynnego następuje z grubsza biorąc jak s~\ jeśli 
byłby to mezon dziwny — to jak jeśli barion — 
to jak s~ 3 -s~*, a wreszcie, jeśli przenoszonym licz¬ 
bom kwantowym nie można przyporządkować żad¬ 
nej znanej cząstki — spadek jest jeszcze szybszy. 
Przykłady poszczególnych rodzajów procesów wy¬ 
miany liczb kwantowych oraz dane doświadczalne 
obrazujące spadek ze wzrostem całkowitego przekroju 
czynnego na te procesy zostały podane na rys. 15. 
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Ważne informacje uzyskuje się też, porównując ze 
sobą wartości przekrojów czynnych na rozpraszanie 
elastyczne na protonach cząstek (o ładunku ujem¬ 
nym) i ich antycząstek (o ładunku dodatnim), a więc 
np. p-p i p-p, n~-p i n+-p, K~-p i K+-p. Jeśli chodzi 
o wartości całkowitych przekrojów czynnych na 
rozpraszanie takich dwu cząstek, to stwierdza się, że 
ich różnica maleje szybko z energią, przy czym <r ca łk 
dla cząstki jest zawsze większy niż dla antycząstki. 
Odbija się to także w pewien sposób na postaci róż¬ 
niczkowego przekroju czynnego na rozpraszanie ela¬ 
styczne, który w obszarze małych kątów jest zawsze 
większy dla cząstki. Ciekawe jednak, że przy pewnej 
wartości zmiennej / wykresy obu różniczkowych 
przekrojów czynnych przecinają się i zaczyna domi¬ 
nować przekrój czynny antycząstki (rys. 16). 

Jednym z najważniejszych zadań fizyki oddziały¬ 
wań silnych jest wyznaczenie widma mas cząstek 
nietrwałych (ze względu na oddziaływania silne). 
Cząstki te mają tak mały średni czas życia (rzędu 
10“ 20 -10“ 24 s), że przed rozpadem mogą przebyć 
tylko bardzo krótki odcinek, praktycznie niedostrze¬ 
galny ze względu na ograniczoną zdolność rozdzielczą 
przyrządów. Innymi słowy, w doświadczeniu zawsze 
obserwuje się już tylko produkty rozpadu tych nie¬ 
trwałych obiektów, a o ich istnieniu i własnościach 
wnioskuje się z analizy tych właśnie produktów roz¬ 
padu. W niektórych wypadkach, jak była mowa po¬ 
wyżej, takie nietrwałe obiekty są obserwowane jako 
rezonanse odpowiadające maksimom na wykresie 
całkowitego przekroju czynnego na rozpraszanie 
danych dwu cząstek trwałych. Mówi się wtedy o pro¬ 
cesie formacji rezonansów. W pewnych wypadkach, 
szczególnie w obszarze wyższych energii, rezonan¬ 
som takim nie odpowiadają żadne widoczne maksi¬ 
ma, a o ich istnieniu można się dowiedzieć dopiero 
po przeprowadzeniu analizy fazowej. 

Niekiedy obserwuje się rezonanse powstałe nie 
w wyniku oddziaływania cząstek początkowych, lecz 
wskutek oddziaływania w stanie końcowym. Mówi 
się wówczas o procesie produkcji rezonansów. Re¬ 
zonanse takie są widoczne na wykresach przedsta¬ 
wiających prawdopodobieństwo pojawiania się pary 
(rzadziej większej grupy) cząstek, zależnie od ich 
masy efektywnej, a więc całkowitej energii całego 
układu tych cząstek w ich układzie środka masy. 
Przykłady takiej sytuacji są przedstawione na rys. 17. 
Cząstce nietrwałej odpowiada wyraźnie maksimum 
na wykresie, które może być najczęściej opisane 
wzorem Breita-Wignera (13). W pewnych wypad¬ 
kach (np. rozpraszanie n-n) o istnieniu rezonansów 
pochodzących z produkcji można się dowiedzieć 
także po wykonaniu anałizy fazowej. Najczęściej 
jednak takiej analizy nie można wykonać, wobec 
czego uzyskane dotychczas informacje na temat 
widma mas cząstek nietrwałych na pewno są nie¬ 
kompletne. Oddzielnym problemem jest wyznaczenie 
liczb kwantowych cząstek nietrwałych, szczególnie 
zaś ich spinu i parzystości. I tu znów wielką pomocą 
jest wynik analizy fazowej, jeśli ją można przepro¬ 
wadzić. W wielu wypadkach trzeba się jednak uciekać 
do innych metod, czasem dostosowanych do danego 
indywidualnego wypadku. 

Analizę procesów wielociałowych przeprowadza 
się w ten sposób, że pomiarem i identyfikacją obejmuje 
się albo wszystkie wyprodukowane obiekty (pomiar 
ekskluzywny), albo też tylko niektóre spośród nich 
(pomiary te nazwaliśmy już inkluzywnymi). Metoda 
pierwsza, aczkolwiek dostarcza pełnej informacji 
o stanie końcowym i jest przez to szczególnie cenna, 
nie może być stosowana wtedy, gdy krotność cząstek 
jest bardzo duża. Znaczną część wszystkich cząstek 
stanowią bowiem zawsze cząstki neutralne, które nie 
są rejestrowane przez większość przyrządów. Gdy 
rośnie całkowita krotność wyprodukowanych cząstek, 
wzrasta automatycznie udział tych procesów, w któ¬ 
rych występuje więcej niż jedna neutralna cząstka, 
i które nie mogą być dokładnie wyodrębnione z ca- 
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łości danych. Nie znaczy to, że analiza procesów za¬ 
wierających najwyżej jedną cząstkę neutralną, w któ¬ 
rych wobec tego można w zasadzie zidentyfikować 
wszystkie cząstki, traci swoje znaczenie. Jednakże w 
ostatnich latach uwaga fizyków koncentrowała się 
przede wszystkim na pomiarach inkluzywnych. 

Najprostszym pojęciowo pomiarem inkluzywnym 
jest pomiar całkowitego przekroju czynnego. Intere¬ 
sującą wielkością jest przecież w tym wypadku 
prawdopodobieństwo zajścia, przy ustalonym stanie 
początkowym, procesu, w którym nie identyfikuje się 
ani jednej cząstki w stanie końcowym. Identyfikując 
jedną cząstkę końcową, znajduje się pojedynczy roz¬ 
kład inkluzywny, dwie — rozkład podwójny itd. 
Rozkłady potrójne, a tym bardziej jeszcze wyższe, są 
na razie mało zbadane i nie będą tu omawiane. 

Charakterystyczną cechą rozkładów pojedynczych 
jest szybki spadek prawdopodobieństwa produkcji 
cząstek wtórnych ze wzrostem pędu poprzecznego. 
Zjawisko to jest dobrze jakościowo przedstawione 
na rys. 18. Jest tam także widoczna inna charakte¬ 
rystyczna cecha produkcji cząstek, a mianowicie ist- 
tki nienie tzw. cząstek wiodących. Przez cząstkę wiodącą 
■nń ace rozumie się cząstkę, która jest tego samego typu co 
wiocą cząstka padająca i która kontynuuje z dużym pędem 
podłużnym kierunek lotu cząstki padającej. I tak 




Rys. 17. Maksima w rozkładzie masy efektywnej układów czą¬ 
stek produkowanych w zderzeniach hadronów, wskazujące^na 
istnienie rezonansów: a) para tz~7z° (mezon p„) b) para n~n + 
(mezony / i p), c) trójka n + n~n° (mezony rj i co) 


np., jeżeli cząstką padającą jest proton, to w dużej 
liczbie zdarzeń można odnaleźć proton szybki poru¬ 
szający się zgodnie z kierunkiem lotu protonu po¬ 
czątkowego. To samo, choć w mniejszym stopniu, 
dotyczy też mezonów K, a w jeszcze mniejszym — 
mezonów n. 

Na rys. 19 i 20 pokazane są dla przykładu rozkłady 
inkluzywne cząstek produkowanych w zderzeniach 
proton-proton. Na pierwszym z nich widać (jako 
funkcję pospieszności) rozkład inkluzywny rozmai¬ 
tych cząstek powstałych w zderzeniach bardzo wyso¬ 
kiej energii. Na uwagę zasługuje kilka charaktery¬ 
stycznych cech tych rozkładów. Po pierwsze, widać 
wyraźnie znaczne różnice w wydajności produkcji 
rozmaitych rodzajów cząstek. Najobficiej produko¬ 
wane są mezony 7 i, znacznie rzadziej — pary mezo¬ 
nów K , a jeszcze rzadziej — pary barion-antybarion. 
Ilościowo fakt ten uwidacznia fenomenologiczny 



Rys. 18. Wykres Peyrou dla protonów i mezonów nr pochodzą¬ 
cych z procesu n~p —► p;r + 7r - 7r"7t 0 przy pędzie laboratoryjnym 
16 GeV/c 



pospieszność 

Rys. 19. Rozkłady inkluzywne rozmaitych cząstek produkowa¬ 
nych w zderzeniach p-p wysokiej energii przy pędzie laborato¬ 
ryjnym zawartym między 6,8 a 53 GeV/c oraz przy ustalonej 
wartości pędu poprzecznego p±. » 0,4 GeV/c 
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Rys. 20. Rozkłady inkluzywne mezonów produkowanych w zde¬ 
rzeniach wiązek przeciwbieżnych przy pędach obu wiązek rów¬ 
nych; a) ok. 15,4 GeV/c, b) ok. 26,6 GeV/c, c) przy pędzie jednej 
wiązki jak w (a), a drugiej jak w (b) 


wzór wyrażający podział całkowitej średniej krotności 
cząstek produkowanych w zderzeniach proton-pro- 
ton przy pędzie cząstki padającej ok. 1500 GeV/c. 
Wzór ten ma postać 

w c aik = w ± +« 0 = 12dz6 = 4,7;r + -f 4,57r 0 -M,37T + 

+0,43A'++0,31i£~+l,6^+0,15p4-... 


gdzie n ± i n 0 są to średnie krotności cząstek nałado¬ 
wanych i obojętnych. 

zagadnienie Oczywiście ani średnia krotność ani też (w mniej- 
krotności szym stopniu) podział tej krotności między poszcze¬ 
gólne rodzaje cząstek nie są niezależne od energii. 
Całkowita krotność wzrasta z energią dość szybko, 
z grubsza zgodnie ze wzorami: 

n = A+B Ins-f-C ln 2 ^ 

lub (16) 

n = a+b Ins+iclns)^ 11 *, 


gdzie A y B, C oraz a, b, c są pewnymi liczbami nie¬ 
zależnymi od energii. Oczywiście, w braku przesłanek 
teoretycznych, wybór wzoru przedstawiającego wzrost 
całkowitej krotności produkowanych cząstek nała¬ 
dowanych może być przypadkowy. Jednakże wydaje 
się, że w każdym razie średnia krotność rośnie szyb¬ 
ciej niż In s. Warto odnotować, że przy każdej war¬ 
tości energii najwięcej produkowanych cząstek to 
mezony n, następnie ze wzrostem energii zaznacza się 
powolny wzrost udziału mezonów ^,aw dalszej ko¬ 
lejności także par barion-antybarion. 

Informacje na temat całkowitej krotności średniej 
nie wyczerpują znajomości problemu krotności. Ist¬ 
nieją bowiem dość dokładne dane dotyczące rozkładu 
krotności cząstek naładowanych przy ustalonej ener¬ 
gii w dużym zakresie energii. Są to dane bardzo inte¬ 
resujące, które rzucają wiele światła na mechanizm 
produkcji cząstek. Gdyby bowiem produkcja cząstek 
miała charakter czysto probabilistyczny, oczekiwali¬ 
byśmy, że rozkład krotności będzie przypominać 
rozkład Poissona. Jedną z charakterystycznych cech 
tego rozkładu jest to, że kwadrat dyspersji liczby 
cząstek, D 2 = « 2 — n 2 , jest równy średniej liczbie 
cząstek, ń. Dane doświadczalne przeczą jednak przy¬ 
puszczeniu, że rozkład krotności cząstek naładowa¬ 
nych dany jest wzorem Poissona. Istnieje fenome- 
wzór nologiczny wzór, podany przez Andrzeja K .Wróblew- 
Wróbłe- skiego, który trafnie opisuje dane doświadczalne, 
wskiego i który ma postać 

D = A(jń±- a), (17) 


gdzie A = 0,58 dla wszystkich rodzajów zderzeń, zaś 
« ^ 1 i zależy nieco od zderzających się cząstek. 
Rozkład krotności cząstek produkowanych jest więc 
różny od rozkładu Poissona, co wskazuje na istnienie 
korelacji w procesie produkcji cząstek. 

Powracając teraz do analizy danych przedstawio¬ 
nych na rys. 19, należy zauważyć, że pomijając istotny 
dla rozkładu protonów efekt cząstki wiodącej, roz¬ 
kłady cząstek różnych rodzajów mają podobny cha¬ 
rakter. Ta uniwersalność (przybliżona i nie obejmu¬ 
jąca cząstek wiodących) jest widoczna także wtedy, 
gdy zmieni się cząstka padająca. 

Ogólnie rozkłady inkluzywne można scharaktery¬ 
zować w następujący sposób. Dla wartości pospiesz- 
ności bliskich wartościom granicznym zaznacza się 
bardzo interesujący fakt, polegający na tym, że 
kształt a nawet wartość przekroju czynnego zależy 
tylko od charakterystyki kinematycznej jednej ze 
zderzających się cząstek. Aby to lepiej opisać, do¬ 
godnie jest wprowadzić trzy obszary kinematyczne: 
obszar pfi bliskich pędowi pocisku (obszar fragmen- 
tacji pocisku), obszar p,* bliskich pędowi tarczy 
(obszar fragmentacji tarczy) i wreszcie obszar p* 
małych (obszar centralny). Okazuje się, że w dwu 
pierwszych obszarach rozkłady nie zależą od całko¬ 
witej energii zderzenia (a więc od s), a tylko odpo¬ 
wiednio od pędu pocisku i pędu tarczy. Jest to wy¬ 
raźnie widoczne na rys. 20. Natomiast w obszarze 
centralnym zależność od s, choć słaba, jednak się po¬ 
jawia. Postulowane w niektórych modelach teore¬ 
tycznych centralne plateau niezależne od s nie poja¬ 
wia się (być może dlatego, że dostępne obecnie energie 
są jeszcze zbyt niskie). 

Rozkłady ze względu na pęd podłużny i poprzeczny 
są od siebie w przybliżeniu niezależne. Rozkład w pę¬ 
dzie poprzecznym wykazuje wykładniczy spadek 
z p ± , przy czym wartość średnia pędu poprzecznego 
jest niewielka, rzędu kilkuset MeV/c, wolno rosnąc 
z masą wyprodukowanej cząstki. 

Niezwykle ważnych i cennych informacji dostar¬ 
czają rozkłady podwójne. Zamiast posługiwać się 
wprost podwójnym różniczkowym przekrojem czyn¬ 
nym, wprowadza się funkcje korelacji, w celu stwier¬ 
dzenia, czy produkcja cząstek następuje niezależnie 
(w tym wypadku podwójny rozkład byłby równy po 
prostu iloczynowi rozkładów pojedynczych). Intere¬ 
sującą wielkością jest więc różnica między rozkładem 
podwójnym i iloczynem rozkładów pojedynczych. 


_ 1 d 2 a _ 1 da da 

yi,y2 G dy x dy 2 a 2 dy x dy 2 ' 


(18) 


Chcąc tę wielkość przedstawić jako funkcję dwu 
zmiennych, należałoby użyć wykresu trójwymiaro¬ 
wego. Zamiast niego można też posłużyć się metodą 
poziomic. Poziomice odpowiadające funkcji kore¬ 
lacji dwucząstkowych pokazane są na rys. 21. Pod¬ 
stawową cechą tych korelacji jest silne maksimum 
funkcji korelacji występujące w pobliżu przekątnej 
y x = y 2 . Innymi słowy, istnieją wyraźne, dodatnie 
korelacje między cząstkami o małej różnicy po- 
spieszności (zwane korelacjami krótkozasięgowymi). 
Na rys. 21 zaznacza się jednak także istnienie kore¬ 
lacji długozasięgowych, w obszarach y x = —y 2 przy 
dużych wartościach bezwzględnych obu tych zmien¬ 
nych. Obraz produkcji cząstek jest więc dość skom¬ 
plikowany. Najprostsza narzucająca się hipoteza jest 
taka, że cząstki końcowe są pierwotnie produkowane 
w pewnych grupach, w jakichś kawałkach materii 
hadronowej, zwane czasem zgęstkami lub klastrami 
(ang. clusters ), które być może choćby częściowo są 
znanymi już rezonansami. Te zgęstki rozpadałyby się 
izotropowe w swoim układzie środka masy. Wszystkie 
mezony n pochodzące z tego samego zgęstka miałyby 
zbliżone wartości pospieszności i oczywiście byłyby 
skorelowane dodatnio. Tak więc, znaczna część, 
może nawet przeważająca, cząstek końcowych byłaby 
produkowana w procesie dwuetapowym. (Chodzi tu 
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Rys. 21. Funkcje korelacji dla par mezonów produkowanych w zderzeniach p-p przy różnych pędach: a) 102 GeV/c, b) 400 GeV/c, 
c) 240 GeV/c, d) 2000 GeV/c 


przede wszystkim o te cząstki, które mają małe war¬ 
tości pospieszności w układzie środka masy). Istnienie 
korelacji długozasięgowych wskazuje jednak na ist¬ 
nienie jeszcze jakiegoś innego mechanizmu dynamicz¬ 
nego produkcji cząstek, być może w postaci wzbudze¬ 
nia i tarczy, i pocisku (bez wymiany liczb kwanto¬ 
wych) oraz ich — w następnych chwilach —- rozpadu 
na cząstki końcowe (mechanizm dyfrakcyjny). Za¬ 
gadnienia te nie są jednak na razie ostatecznie wy¬ 
jaśnione. 


Opis teoretyczny oddziaływań 
silnych 

Ogromne bogactwo danych, które tu zostały przed¬ 
stawione bardzo fragmentarycznie, wymaga oczy¬ 
wiście jakiejś interpretacji teoretycznej. Powstaje 
przede wszystkim problem, na jakich podstawowych 
zasadach teoria ta mogłaby być oparta. W tej kwestii 
zasadniczo panuje zgodność między fizykami zaj¬ 
mującymi się teorią cząstek. Teoria ta musi być po 
pierwsze teorią kwantową (bo odnosi się do mikro- 
świata), a po drugie zgodną z teorią względności 
(relatywistyczną), gdyż dotyczy obiektów, których 
energia całkowita jest na ogół znacznie większa od 
ich energii spoczynkowej. 

Całkowitego uzgodnienia tych dwu zasadniczych 
idei teoretycznych nie udało się jeszcze dokonać. 
Trudności wiążą się między innymi z tym, że w teorii 


takiej z konieczności musi się rozpatrywać nie poje¬ 
dyncze cząstki, lecz pola fizyczne, a przy tym nie 
można pomijać procesów produkcji. Innymi słowy, 
musi to być teoria zawierająca nieskończenie wiele 
stopni swobody. Mimo istniejących ogromnych 
trudności wyłoniło się wiele zasad, o charakterze 
ogólnym, które służą za przewodnika w gąszczu da¬ 
nych. 

Teoria będzie mieć na pewno charakter relatywi¬ 
styczny, jeśli wszystkie wielkości teoretyczne będą 
funkcjami tylko niezmienników lorentzowskich. Oczy¬ 
wiście, jak stwierdzono poprzednio, w ustalonym 
układzie odniesienia od niezmienników tych można 
zawsze przejść do wielkości zdefiniowanych tylko 
w tym układzie, takich jak np. kąt rozpraszania. 

Kwantowy charakter teorii zmusza do posługiwa¬ 
nia się pewnymi funkcjami zespolonymi, które zależą 
od wymienionych powyżej niezmienników. Funkcje 
te muszą mieć interpretację probabilistyczną, zgodnie 
z ogólnymi zasadami fizyki kwantowej. 


Macierz S 

Przyjmijmy, że stany przed oddziaływaniem (w chwili 
/ = —oo) tworzą zespół stanów opisywanych określo¬ 
nymi wartościami liczb kwantowych i ponumerowa¬ 
nych liczbami i u / 2 , ... a stany cząstek końcowych 
(w chwili t = +oo) tworzą zbiór odpowiednich sta¬ 
nów ponumerowanych/u/ 2 , .... Amplitudę prawdo¬ 
podobieństwa tego, że układ cząstek, znajdujących 
się początkowo w jakimś stanie i przejdzie w wyniku 
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oddziaływania do jednego ze stanów /, oznacza się 
symbolem S if . Wielkości S if zależą od pełnej cha¬ 
rakterystyki stanu zarówno początkowego jak i koń¬ 
cowego, przy czym od czteropędów, ze względu na 
postulowaną relatywistyczną niezmienniczość teorii 
Sif zależeć mogą tylko za pośrednictwem opisanych 
tu niezmienników. 

Wielkości Si f tworzą pewną macierz, nieskończo¬ 
nego rzędu, zw. macierzą S. Jest to kluczowe pojęcie 
teorii oddziaływań silnych, ponieważ w macierzy tej 
zawarta jest pełna informacja o wszystkich procesach 
między cząstkami elementarnymi. Powstają pytania, 
czy macierz tę można obliczyć w ramach jakiejś 
teorii, czy jest możliwe choćby powiązanie ze sobą 
w pewien sposób jej elementów. Rozwiązanie tych 
problemów stanowi cel teorii oddziaływań silnych 
między hadronami. W chwili obecnej powstały kon¬ 
cepcje ujmujące częściowo własności macierzy S 
i pozwalające na pewne przewidywania. 

Probabilistyczna interpretacja macierzy S wraz 
z postulatem, że wśród stanów i oraz / są wszystkie 
możliwe stany fizyczne dowolnych układów cząstek 
prowadzi do wniosku, że macierz ta musi spełniać 
warunek matematyczny zwany unitarnością, aby było 
zachowane prawdopodobieństwo w przejściu od 
stanu początkowego do końcowego. Jeśli symbolem 
S* oznaczyć macierz sprzężoną hermitowską z ma¬ 
cierzą S, to warunek unitamości można zapisać w po¬ 
staci 

= S'S = 1, (19) 

gdzie macierz 1 jest macierzą jednostkową tego same¬ 
go rzędu co macierz S. 

Z unitamości macierzy S wypływa prosty wniosek 
zw. twierdzeniem optycznym. W twierdzeniu tym 
występuje amplituda rozpraszania elastycznego dwu 
cząstek a i b (ściślej jej część urojona), przy czym 
w rozpraszaniu nie może ulec zmianie ani stan spinowy 
ani nawet pędowy zderzających się cząstek (jest to 
więc rozpraszanie pod kątem 0°). Twierdzenie op¬ 
tyczne mówi, że wielkość ta jest proporcjonalna do 
całkowitego przekroju czynnego na jakiekolwiek 
zderzenie ze stanu wyjściowego a+b : 

Im fa+b-ta+b (p y 0 = 0°) = GV4jl)cr calk (/0, (20) 

gdzie p — pęd zderzających się cząstek. 

Właściwy wybór reprezentacji odgrywa istotną rolę 
w lepszym rozumieniu danych doświadczalnych. 
W wypadku procesów dwuciałowych reprezentacją 
możliwą jest reprezentacja pędowa, w której zmien¬ 
nymi niezależnymi są pędy (w układzie środka masy) 
cząstki początkowej i końcowej. Ponieważ długość 
wektora pędu jest wyznaczona przez wartość energii 
całkowitej W , przeto dogodnymi zmiennymi mogą 
być W i 0, albo też np. pęd początkowy p% i 0. Od tej 
reprezentacji warto niekiedy przejść do reprezentacji 
momentu pędu, w której zmiennymi niezależnymi są 
Pi oraz liczba kwantowa orbitalnego momentu pędu /. 
Element macierzy S odpowiadający procesowi ela¬ 
stycznemu w tej reprezentacji, Si(p\ spełnia nierów¬ 
ność wynikającą z warunku unitamości 

s;si ^ i, (2i) 

przy czym znak równości odpowiada takiej sytuacji 
kinematycznej, w której z danym procesem nie kon¬ 
kuruje żaden proces nieelastyczny. 

Łatwo wykazać, że amplitudę rozpraszania ela¬ 
stycznego można przedstawić w postaci 

f(p, 6) = 1 tp £ (21 +1 )/i 0>) fi (cos 6), (22) 

Z-o 

gdzie Pi — wielomian Legendre’a /-tego rzędu, zaś 
amplituda cząstkowa fi dana jest wzorem 

fi = (Si — l)/2i, (23) 

spełnia zatem warunek 

I fil 2 < Im/}. (24) 


Warto przy tym zaznaczyć, że jeśli zderzające się 
cząstki mają spin różny od zera, wzór (22) należy za¬ 
stąpić wyrażeniem ogólniejszym. 

Jeżeli proces ma charakter czysto elastyczny, wów¬ 
czas Si można sparametryzować wprowadzając 
przesunięcie fazowe 

Si = e 2i8 i. (25) 

Wzór (25) można stosować nawet wtedy, gdy wy¬ 
stępują konkurencyjne procesy nieelastyczne, należy 
tylko przyjąć, że przesunięcie fazowe jest wielkością 
zespoloną albo też wprowadzić parametr nieelastycz- 
ności w ^ 1, zdefiniowany wzorem 

Si = 7ji exp (2 iói). (26) 

Interpretacja fizyczna przesunięcia fazowego polega 
na tym, że określa ono różnicę fazy fali padającej 
i fali końcowej (w obu wypadkach obliczaną w ob¬ 
szarze bardzo dalekim od obszaru oddziaływania). 

Ograniczenie (24) powoduje, że wykres amplitudy 
cząstkowej rozpraszania na płaszczyźnie zespolonej 
zawsze zawarty jest w obrębie koła o środku w punkcie 
Ref = 0 i Imf = 1 / 2 i o promieniu równym V 2 . Koło 
to nazywamy kołem unitamości. Jest to tzw. wykres 
Arganda (rys. 22). Widać stąd, że gdy proces jest 
czysto elastyczny, wartości amplitudy leżą dokładnie 
na okręgu, a w przeciwnym razie schodzą do wnętrza 
koła. Można się przekonać, że jeśli rji = 1, to ampli¬ 
tuda ma wartość maksymalną przy di = tt/ 2; jest to 



Rys. 22. Zasada budowy wykresu Arganda. Krzywa (a) odpo¬ 
wiada amplitudzie procesu elastycznego z oddziaływaniem przy¬ 
ciągającym zachodzącym w dużym obszarze energii bez kon¬ 
kurencji procesów nieelastycznych. Krzywa (b) odpowiada wy¬ 
padkowi podobnemu, ale z odpychaniem; aby mógł powstać 
rezonans, amplituda schodzi z okręgu unitamości i obiega mały 
okrąg w przeciwnym kierunku. Krzywa (c) odpowiada wypadkowi 
rozpraszania elastycznego, któremu już od progu towarzyszy 
rozpraszanie nieelastyczne. Krzyżyki wskazują orientacyjnie po¬ 
łożenie rezonansów 


właśnie ta sytuacja, która odpowiada rezonansowi. 
W wypadku rji < 1 amplituda zakreśla wewnątrz koła 
unitamości niekiedy dość skomplikowaną krzywą, 
lecz zawsze lokalnie w pobliżu rezonansu zakreśla 
okrąg obiegając go w kierunku przeciwnym do ruchu 
wskazówek zegara (odpowiada to rozpadowi cząstki 
nietrwałej; przeciwny kierunek ruchu oznaczałby, że 
cząstki trwałe skupiają się z powrotem w stanie rezo¬ 
nansowym). Tak więc patrząc na wykres Arganda 
dla danej fali cząstkowej możemy wykryć rezonanse 
oraz ustalić ich spin (równy 1). 

Jednakże powstaje pytanie, w jaki sposób uzyskać 
wartości amplitud cząstkowych, które następnie 
można by odkładać na wykresie Arganda. Zagadnie¬ 
nie to jest przedmiotem analizy fazowej. Punktem 
wyjścia są wartości całkowitego i różniczkowego 
przekroju czynnego jako funkcji kąta. 

Dla uproszczenia przyjmijmy, że proces jest czysto 
elastyczny. Korzystając z faktu ortogonalności wie- 
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Rys. 23. Procesy skrzyżowane dla 5 cząstek (łącznie początkowych i końcowych) 


analiza lomianów Legendre ł a można różniczkowy przekrój 
fazowa czynny przedstawić wówczas w postaci 

^ = l/l 2 = £ Pi(cosO)Fi(p) -L. (27) 

Ponieważ oddziaływania silne mają skończony zasięg, 
przeto parametr zderzenia nie może być zbyt duży, bo 
w przeciwnym razie nie doszłoby do oddziaływania. 
Z kolei rząd orbitalnego momentu pędu wynosi 
/ # pb, gdzie b jest parametrem zderzenia. Tak więc 
można oczekiwać, że przy każdej skończonej war¬ 
tości energii wkład do przekroju czynnego wnosić bę¬ 
dzie tylko pewna ograniczona (rosnąca z energią) 
liczba wartości /. W tym przypadku szereg we wzorze 
(27) można urwać przy pewnej wartości / ma x = L. 
Występujące w tym wzorze funkcje Fi zależą od prze¬ 
sunięć fazowych. Gdyby np. przyjąć L — 0, to F 0 = 
=sin 2 <5 0 . Gdyby L było równe 1, to oprócz F 0 poja¬ 
wiłaby się jeszcze funkcja F 1 = sin<5 0 sin^ (cos ó 0 x 
xcos<5 1 +sin<5 0 sin^). Dalsze wyrażenia byłyby oczy¬ 
wiście jeszcze bardziej skomplikowane. Już jednak 
z tego prostego przykładu wynika, że badając zależ¬ 
ność różniczkowego przekroju czynnego od kąta, 
można wyznaczyć przesunięcia fazowe. Oczywiście 
jest to problem trudny i pełen niejednoznaczności 
m.in. z powodu zawsze ograniczonej dokładności 
pomiaru. Gdy zderzające się cząstki mają spin różny 
od zera (co zwykle zachodzi), i gdy trzeba jeszcze 
uwzględnić konkurencyjne procesy nieelastyczne, 
a liczba fal cząstkowych jest znaczna, zagadnień tych 
nie można rozwiązywać bez pomocy komputerów. 
Zasada jednak jest ta sama. 


Wartości przesunięć fazowych są ważną informacją 
m.in. ze względu na możliwość wykrycia stanów re¬ 
zonansowych. Ponadto znak przesunięć fazowych 
określa, czy rozpraszanie w danym stanie orbitalnym 
ma charakter odpychający (Si < 0) czy też przycią¬ 
gający (Si > 0). W obszarze najniższych energii 
przesunięcia fazowe często parametryzuje się wpro¬ 
wadzając zasięg efektywny n i długość rozpraszania 
Ai. Można wykazać, że 

P n+1 ctgh = --!_ + Ą-np*+ ... (28) 

Ai l 

W obszarze energii niezbyt odległym od energii 
progowej procesu próbuje się często stosować metody 
nierelatywistyczne oparte na równaniu Schrodingera 
z odpowiednio dobranym potencjałem. Metody te 
w wielu wypadkach wystarczają, np. do opisu naj¬ 
prostszych jąder atomowych i rozpraszania przypro- 
gowego dwu nukleonów. W innych sytuacjach można 
jednak stosować te metody nie po to, aby uzyskać 
dobrą liczbową zgodność z doświadczeniem, ale po to, 
by odgadnąć pewne własności macierzy S , które by 
można było (być może) zastosować nawet tam, gdzie 
model nierelatywistyczny na pewno przestaje być 
słuszny. 

Przykładem takich własności, częściowo potwier¬ 
dzonych przez badania teorii relatywistycznych, jest 
analityczność macierzy S. Analityczność może ce¬ 
chować tylko funkcje zespolone zmiennych zespolo¬ 
nych. Rozważa się więc amplitudę rozpraszania jako 
funkcję zespolonych argumentów, czy to — nie¬ 
zmienników 5, /, u czy też pędu, energii, kąta, a na- 
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wet liczby /. W tych wypadkach, w których udało się 
uzyskać ścisłe dowody analityczności macierzy 5, 
własność ta była konsekwencją warunku przyczyno- 
wości. W innych wypadkach analityczność macierzy S 
po prostu się postuluje. 

Omówienie choćby drobnej części wiążących się 
z tym zagadnień przekracza ramy tego artykułu. 
Wnioski, do których można dojść, są następujące. 
Przypuśćmy, że istnieje taki stan jednej cząstki trwa¬ 
łej, który ma te same liczby kwantowe zachowywane 
w oddziaływaniach silnych, co i stan dwu cząstek 
zderzających się. (Oczywiście przejście dwu tych 
stanów w siebie nie jest możliwe ze względu na prawo 
zachowania energii i pędu). W takim wypadku, jeśli 
M jest masą tego stanu jednocząstkowego, to ampli¬ 
tuda rozpraszania cząstek zderzających się mieć będzie 
biegun pierwszego rzędu w punkcie s = M 2 (M — ma¬ 
sa stanu jednocząstkowego). W każdym zaś punkcie, 
w którym istnieje próg procesu dwu- lub więcej- 
cząstkow'ego o właściwych liczbach kwantowych, 
amplituda ma punkt rozgałęzienia. 

Postulat maksymalnej analityczności głosi, że je¬ 
dynymi osobliwościami amplitudy są te właśnie wy¬ 
żej wymienione bieguny i punkty rozgałęzienia. Aby 
procesy ten problem przedstawić nieco dokładniej, należy je- 
skrzyżowane szcze wprowadzić ważne pojęcie procesu skrzyżowa¬ 
nego z danym procesem. Jeśli dany jest proces np. 

ab- b -> c-bd-be y 

to procesem doń skrzyżowanym nazywa się każdy 
z poniższych procesów (rys. 23): 

abb-bć -> d-be, b-bća-bdbe, 

a-bd -> b+c-be, 

i tak dalej, a także każdy z procesów przebiegających 
w przeciwnym kierunku niż powyższe, albo taki, 
w którym każda cząstka została zastąpiona przez od¬ 
powiednią antycząstkę. Jak widać, proces skrzyżo¬ 
wany różni się od danego procesu tym, że jedna lub 
więcej cząstek zostaje przeniesiona „na drugą stronę” 
z jednoczesną zamianą jej na jej antycząstkę. 
reguła Reguła podstawień mająca podstawowa znaczenie 
podstawień w teorii analityczności macierzy S> głosi, że wszystkie 
procesy skrzyżowane ze sobą opisywane są funkcjami, 
które można otrzymać z jednej przez przejście gra¬ 
niczne z wielowymiarowego obszaru zmiennych ze¬ 
spolonych 5, /, w,... do obszaru, w którym te zmienne 
przyjmują odpowiadające danemu procesowi wartości 
rzeczywiste. Konsekwencje tej reguły dla analitycz¬ 
ności są bardzo istotne, gdyż automatycznie wszyst¬ 
kie osobliwości jednej z amplitud procesów skrzyżo¬ 
wanych stają się osobliwościami wszystkich innych 
amplitud. 

Warto tu rozpatrzyć pewien konkretny ważny przy¬ 
kład, mianowicie rozpraszanie 7r + 4 p -> n +-bp. Istnie¬ 
ją dwa procesy (istotnie różne) skrzyżowane z tym 
procesem, a mianowicie n~-bp -► n~-bp oraz pbp 
-+7i+-\-7[ . Jeśli zmienne są zdefiniowane następu¬ 
jąco: s = (pa-bpb) z , t = (pł>—pd) 2 i wreszcie u = 
— {pa pa) 2 , to przejście od rozważanego procesu 
do pierwszego procesu skrzyżowanego odpowiada 
zmiana znaku wszystkich składowych czteropędów 
p» i p c . Wówczas zmienna s przybiera postać charakte¬ 
rystyczną dla przekazu czteropędu {pb— Pa) 2 , a zmien¬ 
na u — postać typową dla kwadratu energii całkowi¬ 
tej. W procesie pierwszym istnieje jeden stan jedno- 
cząstkowy trwały, a mianowicie nukleon, występu¬ 
je więc biegun w punkcie s = M 2 . Podobnie dla proce¬ 
su drugiego istnieje biegun w punkcie u = M 2 odpo¬ 
wiadający nukleonowi. Natomiast w procesie trzecim 
stan jednej cząstki trwałej się nie pojawia (nie ma ta¬ 
kiego trwałego hadronu, który by miał liczby kwanto¬ 
we pary mezonów- n). Tak więc amplitudy rozpraszania 
wszystkich trzech procesów skrzyżowanych będą 
mieć dwa bieguny w podanych wyżej punktach, 
z tym jednak, że interpretacja fizyczna zmiennych 



5, /, u jest dla wszystkich tych procesów rozmaita. Po¬ 
dobnie można by określić punkty rozgałęzienia 
amplitud (rys. 24). 


a) 

Ims 
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u = (M+ft) 2 s = M 2 u=M 2 s=(M+{t) 2 

czyli czyli 
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u = (M + m) 2 
czyli 

s=M 2 s=Ml 

s = {M-m} 2 

s~(M +u ) 2 s=(Mi/r)l 


Rys. 24. Struktura osobliwości dla: a) procesu n p •> n~p t b) pro¬ 
cesu K~p —» K~p , w obu wypadkach dla 0 -= 0 (czyli t - 0). 
M oznacza masę nukleonu, p masę mezonu 7t, M A masę hipe¬ 
ronu/l, masę hiperonu 27, m masę mezonu K. Położenia bie¬ 
gunów oznaczone są x, punkty rozgałęzienia •—- 


Istnienie osobliwości macierzy S i ich znajomość 
pozwala na napisanie dla amplitudy rozpraszania 
f(s, t) reprezentacji całkowej Cauchy'ego, która po 
pewnych drobnych przekształceniach prowadzi do 
tzw. związku dyspersyjnego. Typową postać takiego 
związku przedstawia wzór 
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(28a) 


związek 

dyspersyjny 


gdzie całkowanie po każdej zmiennej przebiega od 
najniższego progu do nieskończoności, a residua 
w punktach biegunow-ych są równe iloczynom ładun¬ 
ków silnych charakteryzujących oddziaływanie z od¬ 
powiednim stanem jednocząstkowym cząstek po¬ 
czątkowych {gab) oraz cząstek końcowych {g c a). Jeśli 
stan końcowy i początkowy są identyczne, to resi¬ 
duum staje się równe stałej sprzężenia charaktery¬ 
zującej oddziaływanie trzech cząstek, tj. cząstek a y 
b i cząstki pośredniej. Ponieważ część urojona am¬ 
plitudy rozpraszania ku przodowi może być wyra- 
żona przez całkowity przekrój czynny na podstawie 
twierdzenia optycznego, a część rzeczywistą ampli¬ 
tudy także się mierzy, przeto z niepewnością wyni¬ 
kającą z nieznajomości danych w obszarze bardzo 
wysokich energii można wzór dyspersyjny porów¬ 
nywać z doświadczeniem, przy czym w idealnym 
wypadku jedyną nieznaną w nim wielkością jest właś¬ 
nie stała sprzężenia. Jest to niemalże jedyna meto¬ 
da wyznaczania stałych sprzężenia oddziaływań sil¬ 
nych. 

Analityczność i inne własności macierzy S pozwa¬ 
lają na ścisłe wyprowadzenie pewnych twierdzeń, 
zwanych twierdzeniami asymptotycznymi, które odno¬ 
szą się do zachowania niektórych wielkości fizycz¬ 
nych w obszarze bardzo wysokich energii (tj. gdy 
s -> oo). Do najbardziej znanych twierdzeń asymp¬ 
totycznych należy ograniczenie Froissarta, nie po- ograniczenie 
zwalające całkowitemu przekrojowi czynnemu rosnąć Froissarta I 
zbyt szybko w nieskończoności, 

ocaJk < const -In 2 s, (29) 
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twierdzenie oraz twierdzenie Pomeranczuka, zgodnie z którym 
Pomeranczu- całkowite przekroje czynne na zderzenie cząstki a 
ka z tarczą b i antycząstki a z tą samą tarczą powinny 
być sobie asymptotycznie równe, 

ffcałk (ab) 

0całk(tfÓ) 

Twierdzenia asymptotyczne odgrywają ważną rolę 
przy testowaniu modeli teoretycznych. 


Teoria biegunów Reggego 

Tullio Regge, badając analityczność nierelatywistycz- 
nych amplitud rozpraszania jako funkcji zmiennej 
zespolonej /, przekonał się, że amplitudy te są me- 
romorficznymi funkcjami / w obszarze Re / ^ —V 2 > 
dla pewnej klasy potencjałów obejmujących m.in. 
potencjał Yukawy V(r) = V 0 e-» r /r. Co więcej, wy¬ 
kazał on, że ewentualne bieguny amplitudy mogą 
leżeć jedynie w obszarze ograniczonym dodatkowo 
warunkiem Im/ > 0, przy czym położenie takiego 
bieguna na płaszczyźnie zmiennej zespolonej / za¬ 
leży na ogół od wartości energii, przy której zachodzi 
zderzenie. Bieguny te nazywane są biegunami Reg¬ 
gego. - . , . * 

bieguny Biegun Reggego ma przejrzystą interpretację fi- 
Reggego zyczną. Z równania Schródingera z pewnym ustalo¬ 
nym potencjałem przyciągającym V(r), wynika na 
ogół istnienie stanów związanych i rezonansowych 
przy wartościach energii zależnych od liczby kwanto¬ 
wej orbitalnego momentu pędu /. Zależność ta po¬ 
jawia się dlatego, że do potencjału V(r) dochodzi 
jeszcze potencjał odpychający związany z siłą odśrod¬ 
kową, równy 


i efektywny potencjał staje się funkcją liczby /. Oczy¬ 
wiście fizyczne wartości / są całkowite, ale można trak¬ 
tować potencjał ten jako funkcję zmiennej / o do¬ 
wolnych wartościach, a nawet nadawać jej wartości 





zespolone. Można się przekonać i w końcu do tego 
sprowadza się odkrycie Reggego, że przy ciągłych 
zmianach liczby / poziomy energetyczne w potencjale 
efektywnym, odpowiadające stanom związanym 
i rezonansowym, przesuwają się także w sposób ciągły. 

Jeśli biegun przy pewnej wartości s występuje dla trajektoria 
wartości (na ogół zespolonej) liczby / = a($), to bieguna 
fupkcję oc(s) nazywa się trajektorią bieguna Reggego Reggego 
(rys. 25). Biegun ten jest biegunem amplitudy roz¬ 
praszania w tym kanale, w którym s jest kwadratem 
całkowitej energii zderzających się cząstek w ich 
układzie środka masy. Residuum tego bieguna (danej 
amplitudy) jest opisane także pewną funkcją fi(s), zw. 
funkcją residualną bieguna Reggego. 

Regge wykazał, że całkowita amplituda rozpra¬ 
szania wyraża się w następujący sposób przez wkłady 
pochodzące od poszczególnych biegunów 



Ms)Paj W (-cos0) 
sin n aj (s) 


( 31 ) 


gdzie sumowanie obejmuje wszystkie bieguny Regge¬ 
go. iW)(—cosfl) jest funkcją Legendre’a, która prze¬ 
chodzi w dobrze znany wielomian Legendre’a, gdy 
a (s) jest liczbą całkowitą nieujemną. 

Z wyrażenia na całkowitą amplitudę rozpraszania 
danego wzorem (31) można przejść do wyrażeń na am¬ 
plitudy cząstkowe. Okazuje się wtedy, że w otoczeniu 
punktu o / całkowitym wkład pochodzący od bieguna 
Reggego reprezentowany jest wyrażeniem Breita-Wig- 
nera, a więc biegun ów w takim punkcie przedstawia 
rezonans, jeżeli tylko Ima(s) > 0. Gdy zaś Im a ( 5 ) = 

= 0, mamy do czynienia ze stanem związanym 
(szerokość połówkowa r jest proporcjonalna do 
Im a (.ę), a dla stanów związanych r = 0). 

Ponieważ trajektoria bieguna jest funkcją zmien¬ 
nej 5, przeto jeden biegun Reggego zawiera w sobie 
informacje o wielu rezonansach odpowiadających 
różnym fizycznym wartościom liczby kwantowej /. 

Rozpatrując trajektorię Reggego w płaszczyźnie 
zmiennych (Re/, ReO otrzymuje się tzw. wykres wykres 
Chew-Frautschiego. Okazuje się, że trajektorie ob- Chew-Fraut- 
serwowanych rezonansów mają na takich wykresach schiego 
w przybliżeniu to samo nachylenie, 

= <*Reoc(s) _ ^ j GeV - 2 (32) 

v ' ć/Res 


Wyniki doświadczalne zestawione z odpowiednimi tra¬ 
jektoriami Reggego są przedstawione na rys. 26. 

Pierwszą zatem korzyścią z wprowadzenia pojęcia 
bieguna Reggego jest to, że na jednej trajektorii 
znajduje się wiele stanów związanych i rezonansów, 
co przyczynia się do uporządkowania widma mas had¬ 
ronów, a w połączeniu z obserwowaną uniwersalnoś¬ 
cią nachylenia trajektorii Reggego na wykresie Chew- 
Frautschiego — pozwala na snucie przewidywań do¬ 
tyczących mas hadronów dotychczas nie obserwo¬ 
wanych. Należy jednak zaznaczyć, że nie istnieje jak 
dotąd żadna metoda, pozwalająca na obliczenia czy 
to trajektorii Reggego czy to funkcji residualnych. 
Fakt zaś uniwersalności nachylenia i (przybliżonej) 
prostoliniowości trajektorii jest na razie zupełnie 
niezrozumiały. 

Była już mowa o tym, że zgodnie z prawem pod¬ 
stawień każdy biegun amplitudy jednego z procesów 
skrzyżowanych jest zarazem biegunem amplitudy po¬ 
zostałych procesów skrzyżowanych. Dla zilustrowa¬ 
nia zagadnienia przytoczymy proste obliczenie kine¬ 
matyczne. W wypadku, gdy masy wszystkich czterech 
cząstek biorących udział w procesie są jednakowe, 
w jednym z kanałów skrzyżowanych („kanale s”) 


s = 4 (p%+m*) 9 t = — 2i?I(l— cosfl,). 


a w drugim („kanale /'*) 

5 = -2 p\ (1 -cosflć), / = 4(pj+m 2 ), 

gdzie wskaźniki „ 5 ” i przy pędzie i kącie roz- 
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wykres praszania oznaczają, że dana wielkość jest zdefi- 
Cłiew- niowana w układzie środka masy odpowiedniego 
-Frautschie- procesu, a m jest wartością masy cząstek zderzają- 
go cych się. 





Rys. 26. Rozmieszczenie niektórych cząstek trwałych i nietrwa¬ 
łych na trajektoriach Reggego w płaszczyźnie (Re/, Rej), tzw. 
wykres Chew-Frautschiego, a) trajektorie B = 0, 5 = 0, b) tra¬ 
jektorie B = 0, 5 0, c) trajektorie B ^ 0, 5 = 0, d) trajek¬ 

torie B 0, S & 0. Spośród trajektorii mezonowych tylko na 
trajektoriach mezonów p i / można umieścić po dwie znane 
cząstki. Nachylenia pozostałych trajektorii mezonowych do¬ 
brano podobnie do wyżej wymienionych 

Z powyższych wzorów widać, że małe ujemne war¬ 
tości niezmiennika t i duże dodatnie wartości nie¬ 
zmiennika s odpowiadają fizycznym wartościom 
zmiennych p s i 0«, ale na pewno niefizycznym wartoś¬ 
ciom zmiennych pt i 6t. Mianowicie, w wymienionym 
obszarze wartości s i /, p\ < 0, zaś cos dt — ©o. 
Jeśli dana jest amplituda reprezentująca wkład od 
pojedynczego bieguna Reggego w kanale t , zgodnie 
ze wzorem (31) równa 


(pominięte tu są ważne czynniki odpowiadające tzw. 
sygnaturze trajektorii). W rezultacie można uzyskać 
następujące wyrażenia na całkowity przekrój czynny 
oraz różniczkowy przekrój czynny w kanale s pocho¬ 
dzący od tego samego bieguna Reggego, który w ka¬ 
nale t porządkował stany rezonansowe 

tfcaik = const-j*^ 1 (33) 

oraz 

■JjTj- = ll(/)|V0 (1) - I >. (34) 

Tak więc trajektorie Reggego nie tylko porządkują 
widmo mas hadronów, ale także wyznaczają zacho¬ 
wanie się wysokoenergetyczne amplitud w kanale 
skrzyżowanym. 

Hadrony usytuowane na tej samej trajektorii mają 
te same wartości liczby barionowej B, dziwności S t 
izospinu I itd., różnią się jedynie masą i spinem. Te 
wszystkie liczby kwantowe można więc przypisać 
samej trajektorii. Trajektoria, rozważana z punktu 
widzenia kanałów skrzyżowanych, opisuje zatem wy¬ 
mianę odpowiednich liczb kwantowych pomiędzy zde¬ 
rzającymi się cząstkami. 

Gdyby dla któregokolwiek bieguna Reggego a(0) 
było większe od 1, wzór (33) musiałby doprowadzić 
do pogwałcenia ograniczenia Froissarta. Tak więc 
najwyższą możliwą wartością a(0) jest 1. Odpowiada 
to zachowaniu się tfcałk w obszarze wysokich energii 
jak const. Takie w przybliżeniu zachowanie się jest 
istotnie obserwowane, z dokładnością do poprawek 
logarytmicznych. Biegun o a(0) = 1 nazywa się bie¬ 
gunem Pomeranczuka. Trajektoria Pomeranczuka 
byłaby scharakteryzowana przez liczby kwantowe trajektoria 
próżni. Analizując inne trajektorie Reggego z punktu Pomeran- 
widzenia wymienianych liczb kwantowych, można czuka 



-kwadrat przekazu czteropędu (GeV/c ) 2 
a) 


PiiOPajiyj-COSOt) 

sinnocj(t) 


i w obszarze/? 2 ^ 0 i |cos0f| < 1 zawierająca wkłady 
rezonansowe, to ta sama amplituda w innym (nie¬ 
fizycznym) obszarze wartości zmiennym p\ i Ot zy¬ 
skuje interpretację amplitudy rozpraszania w kanale 
skrzyżowanym, tj. w kanale s. W tym właśnie kanale 
da ona do pełnej amplitudy rozpraszania wkład na¬ 
stępujący 


Mo (—cos 0e)‘* (i >= md [-i— 


FJ 


gdyż dla bardzo dużych wartości x funkcję Pi(x) 
można zastąpić przez najwyższą potęgę zmiennej 
czyli przez X 1 . Poprawne uwzględnienie wszystkich 
czynników kinematycznych prowadzi do następującej 
postaci amplitudy, wyrażającej wkład: pojedynczego 
bieguna Reggego w kanale skrzyżowanym 

MDs*i (t) ' 1 



Rys. 27. Porównanie modelu Reggego z wynikami doświad¬ 
czalnymi: a) trajektoria efektywna dla reakcji wymiany ładunku 
w zderzeniu 7 t-N f b) i c) opis reggeowski rozpraszania n-N 
ku tyłowi przy użyciu efektywnych trajektorii nukleonowych (b)— 
7t~P, (c) — n + p 
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Rys. 28. Diagram 
odpowiadający wy¬ 
mianie pojedyncze¬ 
go reggeonu (rys. 
a); najprostszy dia¬ 
gram dający wkład 
do cięcia Reggego 
(wymiana dwu reg- 
geonów, rys. b) 


reggeonowa 
teoria pola 


warunek 

dualności 


uzasadnić zaobserwowane regularności w przebiegu 
zależności rozmaitych przekrojów czynnych od energii. 
Warto też zauważyć, że dla prostoliniowej trajektorii 

a(/) = ao-fa'/, 

gdzie a' dane jest wzorem (32), można prawą stronę 
wzoru (34) przepisać w postaci następującej 

|^(/)1 2 e [2< *°“ 1)lnsl e l2a/<lnsl . 

Tak więc wzór ten przewiduje wykładniczy spadek 
wartości różniczkowego przekroju czynnego ze wzro¬ 
stem Ul oraz zwiększanie się nachylenia krzywej przed¬ 
stawiającej ten przekrój czynny ze wzrostem energii 
(zmiennej s). Oba te wnioski są jakościowo, a często 
i ilościowo zgodne z danymi doświadczalnymi (rys. 
27). Badanie zjawisk wiążących się z nieznikającymi 
wartościami spinu cząstek, różnicami mas oraz tzw. si¬ 
łami wymiany wnosi do tego obrazu istotne poprawki, 
które jednak mają dobre uzasadnienie teoretyczne 
i znajdują potwierdzenie doświadczalne. 

Jak była mowa powyżej, w teorii nierelatywistycznej 
jedynymi osobliwościami amplitud rozpraszania dla 
Re/> — 1 U są bieguny. Nie jest to jednak prawdą 
w teorii relatywistycznej. Różnica pochodzi stąd, 
że w teorii relatywistycznej należy uwzględnić także 
możliwość produkcji nowych cząstek, a więc sta¬ 
nów wielocząstkowych. Odpowiada to w teorii Reg¬ 
gego istnieniu oprócz biegunów także i cięć w płasz¬ 
czyźnie zmiennej zespolonej / (tzw. cięć Reggego). 
Okazało się, że cięcia te w pewnych wypadkach 
odgrywają istotną rolę w wyjaśnianiu pewnych 
danych eksperymentalnych, jednakże ich występo¬ 
wanie niezwykle komplikuje teorię Reggego i zmniej¬ 
sza jej siłę przewidywania (rys. 28). 

Jako próba konsekwentnego przezwyciężenia tych 
trudności, powstała w ciągu ostatnich lat tzw. regge- 
onowa teoria pola, w której operuje się wymianą 
trajektorii Reggego (tzw. reggeonów), a nie zwykłych 
cząstek. W teorii tej istnieje możliwość wprowadzenia, 
bez pogwałcenia ograniczenia Froissarta, także tra¬ 
jektorii o liczbach kwantowych próżni, a więc trajek¬ 
torii Pomeranczuka o a(0) > 1. 

Bieguny Reggego znalazły też zastosowanie w te¬ 
orii procesów inkluzywnych. Dzieje się to w ten spo¬ 
sób, że od procesu a+b c+x przechodzi się na 
podstawie prawa podstawień do procesu a+b+c -* x y 
reprezentowanego przez część urojoną amplitudy 
procesu elastycznego a+b+c -> a+b+c (zgodnie 
z uogólnionym twierdzeniem optycznym); tę zaś 
amplitudę można wyrazić z kolei przez wkłady 
reggeowskie. To postępowanie doprowadziło do lep¬ 
szego zrozumienia obszernej klasy zjawisk z udziałem 
wielu cząstek. 

Zaskakującym spostrzeżeniem było to, iż ampli¬ 
tudy opisywane wzorem reggeowskim w obszarze 
wysokich energii i przedłużone do obszaru energii 
niższych, gdzie wzór ten nie powinien się stosować, 
po rozłożeniu na fale cząstkowe wytworzyły na wy¬ 
kresie Arganda okręgi odpowiadające w wielu wy¬ 
padkach cząstkom obserwowanym w tym samym pro¬ 
cesie. Było to dalsze odkrycie, ponieważ do tego czasu 
bieguny Reggego korelowały zachowanie się wielkoś¬ 
ci fizycznych przy wysokich energiach w jednym pro¬ 
cesie z zachowaniem się rezonansowym — w procesie 
skrzyżowanym. Sformułowano wówczas hipotezę, że 
amplituda oddziaływania silnego musi spełniać jeszcze 
jeden warunek dotychczas nieznany, zwany dual¬ 
nością. Amplituda spełnia warunek dualności, jeśli 
w tym samym procesie może być przedstawiona albo 
jako suma wszystkich wkładów rezonansowych, albo 
jako suma wszystkich wkładów od biegunów Reggego 
(rys. 29). Oczywiście, praktycznemu wykorzystaniu 
tej zasady stoi na przeszkodzie brak informacji 
o wszystkich możliwych rezonansach i biegunach 
Reggego, toteż koncepcję tę można sprawdzić tylko 
z pewnym przybliżeniem. Jednak wnioski uzyskane 
na jej podstawie niejednokrotnie okazywały się trafne. 


amplituda = 

rezonanse 


Rys. 29. Zasada warunku dualności 
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Jednym z kluczowych problemów teorii opartej na 
pojęciu biegunów Reggego jest status bieguna Pome¬ 
ranczuka. Jest on niewątpliwie wyróżniony fizycz¬ 
nie przez swoje położenie w płaszczyźnie zmiennej 
zespolonej / i przez liczby kwantowe próżni, które go 
charakteryzują. Jednakże również analiza fenomeno¬ 
logiczna danych wskazuje na pewne szczególne cechy 
tej osobliwości. Po pierwsze, jest to jedyny biegun, biegun Po- 
którego trajektoria wyłamuje się z ogólnej regular- meranczuka 
ności wartości stałego nachylenia (zob. wzór 32). 

Nachylenie trajektorii bieguna Pomeranczuka jest 
znacznie mniejsze; szacuje się je na ok. 0,3 GeV -2 . 

Po drugie, trudno wskazać rezonanse, które by znaj¬ 
dowały się na tej trajektorii. Wprawdzie istnieją 
takie warianty teorii, w których z trajektorią Po¬ 
meranczuka wiąże się mezon / o masie ok. 1270 
MeV/c 2 , ale takie przyporządkowanie nie jest natu¬ 
ralne i wymaga dość skomplikowanej argumentacji. 

Po trzecie, wzrost cr ca łk w obszarze najwyższych obec¬ 
nie dostępnych energii wskazuje na to, iż amplitudy 
rozpraszania elastycznego nie mogą być opisywane 
wyłącznie przez biegun Pomeranczuka, bo w tym 
wypadku przekrój czynny o C ałk przybierałby wartości 
stałe. Być może zatem to, co nosi obecnie nazwę bie¬ 
guna Pomeranczuka, jest jakąś inną osobliwoś¬ 
cią (zespołem cięć). Te trudności w zrozumieniu 
istoty bieguna Pomeranczuka uwidaczniają się także 
w próbach włączenia go w schemat teorii dualnej. 

Niekiedy wypowiada się pogląd, że jest to osobli¬ 
wość powiązana przez zasadę dualności nie z rezonan¬ 
sami, lecz właśnie z nierezonansowym tłem. Za taką 
koncepcją mógłby przemawiać fakt, że przebieg wy¬ 
sokoenergetyczny wszystkich amplitud (który jest 
opisywany wyłącznie przez osobliwość Pomeranczuka) 
jest taki sam dla tych procesów, w których obser¬ 
wuje się rezonanse (np. rozpraszania n + -N), jak i dla 
tych, w których rezonansów nie widać (np. K+-N). 

Powstaje też problem genezy osobliwości Pomeran¬ 
czuka. Nie wiadomo, czy osobliwość ta jest tworem 
samodzielnym, czy też wynikiem jakiegoś sumowa¬ 
nia się wkładów od innych, normalnych trajektorii. 


Symetrie oddziaływań silnych 
i modele kwarków 

Innym podejściem do teorii oddziaływań silnych, 
częściowo konkurencyjnym w stosunku do ujęcia 
dynamicznego i analitycznego, przedstawionego po¬ 
wyżej, a częściowo je uzupełniającym jest ujęcie tej teo¬ 
rii od strony symetrii (-> Cząstki elementarne i ich 
oddziaływania). Oddziaływania silne są wyróżnione 
fizycznie m.in. przez bogactwo swych własności 
symetrii wyrażonych w wielu prawach ^chowania 
rozmaitych wielkości fizycznych. Z symetrii tych wyni¬ 
ka nie tylko pewne uporządkowanie cząstek w multi¬ 
plety (np. izospinu), ale też pewne ważne związki 
między amplitudami. 

Biorąc jako przykład zderzenia mezonów K z nu¬ 
kleonami, można się przekonać, że istnieje pięć 
fizycznie różnych procesów, a mianowicie: rozpra¬ 
szanie elastyczne K + -p, K + -n, K°-p , K°-n oraz pro¬ 
ces wymiany ładunku K + +n -► K°+p. Jednakże 
warunek niezmienniczości izospinowej wyklucza niezmienm- 
możliwość, aby amplitudy oddziaływań silnych zależa- czość izo- 
ły od kierunku wektora izospinu całkowitego ukła- spinowa 
du obu cząstek w przestrzeni izospinu, zezwalając 
tylko na to, aby amplitudy te zależały od długości 
tego wektora. Innymi słowy, amplitudy nie mogą za- 
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leżeć od liczby kwantowej / 3 , a tylko od całkowitego 
izospinu /. Dla dwu cząstek o izospinie V 2 (jak N i K ) 
całkowity izospin może przybierać (zgodnie z zasada¬ 
mi składania momentu pędu) tylko dwie wartości, 
a mianowicie 0 i 1. Powinny więc istnieć najwyżej dwie 
niezależne amplitudy izospinowe, przez które muszą 
się wyrażać amplitudy wszystkich pięciu wymienio¬ 
nych wyżej procesów. Związki takie można znaleźć 
i następnie sprawdzić doświadczalnie. Jak dotąd ani 
w tym, ani w żadnym innym procesie nie napotkano 
wypadku łamania symetrii izospinowej przez od¬ 
działywania silne (jest ona łamana przez oddziaływa¬ 
nia elektromagnetyczne). 

niezmienni- Podobnie, choć na wyższym poziomie, przedstawia 
czość wzglę- się zagadnienie niezmienniczości teorii oddziały- 
dem S£/(3) wań silnych względem przekształceń grupy SU( 3). 

Rozpatrzmy przykład zderzeń binarnych dowolnych 
dwu cząstek należących jedna do oktetu mezonów 
pseudoskalarnych, a druga — do oktetu barionów 
o spinie V 2 i parzystości dodatniej. Uwzględniając 
już nawet związki wynikające z niezmienniczości 
izospinowej, wciąż jeszcze istnieje tu aż 36 a priori 
niezależnych amplitud (rozpraszanie elastyczne n -iV, 
K-N, K-N, tj-N, n-A^K-A, K-A., rj-A, n-Z, K-,Z 
K-Z, r r Z, 7T-Z, K-Z, K-Z, rj-3, oraz amplitudy nie¬ 
elastycznych procesów binarnych nN -> r>N, 7 iZ~-> 
-> rjZ, tlA -> rjZ, jzZ n Z, KA -> KZ, KA -> KZ, 
7i A —> nZ, yA —> nZ, jtN KA, 71 N —>■ KZ, rjN -> KA, 
tjN -> KZ, kAKN, JtA -> KZ, n Si-> KN , yA — 
-> KZ, nZ _> KN, nZ -> KZ, n Z -> KN, yZ -> KZ). 
Z drugiej jednak strony z zasad składania reprezen¬ 
tacji grupy SU{ 3) wynika, że 8®S = 1©8®8©10© 
©10027. Istnieje więc tylko 6 niezależnych amplitud 
oddziaływań silnych przy zderzeniu, o którym tu 
mowa, jeśli oddziaływania te są niezmiennicze wzglę¬ 
dem przekształceń grupy 517(3). I te związki mogą być 
przedmiotem analizy doświadczalnej, choć nie należy 
oczekiwać, aby były one tak dobrze potwierdzone 
przez pomiar, jak w wypadku izospinu. Niestety, 
sprawdzanie jest tu dodatkowo utrudnione przez fakt, 
że tylko nieznaczna część spośród wymienionych 
amplitud dostępna jest pomiarom, ze względu na 
ograniczenia zarówno co do tarcz jak i co do wiązek 
(tarcze tylko nukleonowe, wiązki tylko n, K i K). 

Sprawdzanie tych relacji może nawet nie mieć, co 
najmniej w obszarze obecnie dostępnych energii, 
większego sensu ze względu na znany fakt łamania 
symetrii SU{ 3) uwidaczniający się już w widmie mas. 
Gdyby bowiem symetria SU( 3) była ścisła, wszystkie 
masy cząstek należących do tego samego multipletu 
byłyby jednakowe, a tak nie jest. Jednakże Susumo 
Okubo i Murray Gell-Mann podali opis teoretyczny 
takiego łamania symetrii SU( 3), które prowadzi do 
uzyskania poprawnego widma mas. Założyli oni, że 
operator masy składa się z kilku części, z których 
jedna jest skalarem symetrii SU( 3) i daje wszystkim 
cząstkom tego samego multipletu te same masy, pod¬ 
czas gdy pozostałe dwie części są pewnymi składowy¬ 
mi oktetu, tak dobranymi, aby wszystkie cząstki 
wzór Ge!l- należące do tego samego izomultipletu miały tę samą 
-Manna- masę. Uzyskany wzór na widmo mas (wzór Gell- 
-Okubo -Manna-Okubo) ma następującą postać: 

w = a+bYZĄI(IĄ- 1)-V 4 r% (35) 

gdzie Y = jB- 1-5 jest hiperładunkiem cząstki, I — jej 
izospinem, zaś a , b, c są trzema stałymi, zależnymi od 
multipletu symetrii SU( 3), w którym wzór (35) jest 
sprawdzany. 

W zastosowaniu do barionów wzór (35) sprawdza 
się bardzo dobrze. Na przykład w oktecie, do które¬ 
go należy nukleon, przyjmując znane z doświadczenia 
masy N, A i Z można dostać przewidywaną masę 
hiperonu Z równą ok. 1328 MeV/c 2 , podczas gdy masa 
rzeczywista, znana z doświadczenia, wynosi ok. 
1320 Me/y/c 2 . Lepszą zgodność z doświadczeniem 
uzyskuje się dla dekupletu barionów o spinie 3 / 2 . 


W zastosowaniu do mezonów wzór (35) nieoczeki¬ 
wanie nie przynosi tak dobrych rezultatów. W wyni¬ 
ku dalszych badań i poszukiwań wyjaśniono ostatecz¬ 
nie, że nie wszystkie obserwowane w przyrodzie cząst¬ 
ki należą do jakiegoś konkretnego multipletu 5Ł/(3), 
lecz że są też takie które stanowią „mieszaninę" 
dwu różnych multipletów. Przykładów tej sytuacji 
jest sporo. Wszystkie one dotyczą mieszania oktetu 
z singletem w rozmaitych stanach spinu i parzys¬ 
tości. Okazało się np., że mezony <p i co nie są ani 
czystymi stanami singletowymi, ani też oktetowymi, 
lecz pewną mieszaniną obu tych multipletów. 

Zagadnienie to zostało wyjaśnione na podstawie 
modelu kwarkowego cząstek elementarnych. Okazało 
się mianowicie, że mezon y jest zbudowany przede 
wszystkim (niemal dokładnie) z pary ss , podczas 
gdy mezon co z par kwarków' niedziwnych, co dokład¬ 
nie odpowiada obserwowanemu mieszaniu multiple¬ 
tów. 

Z modeli kwarkowych wynikają także relacje mię¬ 
dzy amplitudami zderzeń hadronów, przy pewnych za¬ 
łożeniach dynamicznych dotyczących oddziaływań po¬ 
między kwarkami. Taką najbardziej znaną relacją 
jest związek między całkowitymi przekrojami czynny¬ 
mi na rozpraszanie r.-N i N-N, który ma postać 

tfcatkOrAO = 7 3 *całk (NN). (36) 

Wynika on bezpośrednio z liczenia kwarków*. W mezo¬ 
nach Ti występuje para kwarków niedziwnych, a w nu¬ 
kleonach — trójka takich samych kwarków. W oddzia¬ 
ływaniu n-N mamy więc 2x3 oddziaływań kwarko¬ 
wych, a w oddziaływaniu N-N 3x3 takich oddziały¬ 
wań. Prowadzi to wprost do wzoru (36), przy założe¬ 
niu, że amplitudy zderzeń indywidualnych kwarków 
po prostu można dodawać, aby dostać amplitudę 
zderzenia hadron-hadron. Podobnie z modelu kwarko¬ 
wego można wysnuć wniosek, iż 

<7catk(*A0 = o CAlk (KN), (37) 

który razem z (36) prowadzi do wzoru: 

2<Xcałk(7riV) = tfcałk( A7V ) -f 2 / 3 <T caik( N N ). (38) 

Porównanie tych wzorów z danymi doświadczalnymi 
przedstawia rys. 30. 
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Rys. 3(X Porównanie z doświadczeniem wzorów (36), (37) i (38) 


Powstanie jednolitej teorii oddziaływań słabych 
i elektromagnetycznych, sukcesy modelu partonowego 
(-> Struktura cząstek elementarnych) w wyjaśnianiu 
danych dotyczących zderzeń głęboko nieelastycznych 
hadronów z leptonami i wreszcie wykrycie nowych 
cząstek, zawierających kwarki powabne, jeszcze bar¬ 
dziej zwiększyło zainteresowanie modelem kwarko¬ 
wym budowy hadronów. Czyniono próby stworzenia 
teorii dynamicznej oddziaływań kwarków wewnątrz 
hadronu. W pracach tych zwykle rezygnuje się z na¬ 
dziei, że kwarki kiedykolwiek będą mogły być zaob¬ 
serwowane poza hadronami, a koncentruje się uwagę 
na wyjaśnieniu faktu uwięzienia kwarków w hadro¬ 
nach. 


model 

kwarkowy 


kwarki 

uwięzione 
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chromodyna- Jedną z takich koncepcji teoretycznych, powstałą 
mika stosunkowo niedawno, co do której istnieją uza- 
kwantowa sadnione nadzieje, że może się ona w przyszłości 
przerodzić w poszukiwaną od tak dawna teorię od¬ 
działywań silnych, jest chromodynamika kwantowa. 
Jest to teoria opisująca oddziaływania między kwar¬ 
kami przez wymianę cząstek podobnych do foto¬ 
nów— gluonów. Zasadnicza różnica między foto¬ 
nami a gluonami polega na tym, że gluony będąc ska- 
larami zwykłej grupy SU( 3), czy też właściwie 517(4) 
lub może nawet SU(6 ), byłyby zarazem składowymi 
oktetu innej grupy 5C/(3), a mianowicie grupy koloru 
(stąd nazwa „chromodynamika”)- Gluony oddziały¬ 
wałyby silnie nie tylko z kwarkami, ale też ze sobą 
nawzajem, w odróżnieniu od fotonów. Być może fakt 
ten mógłby wyjaśnić, dlaczego gluony nie są emito¬ 
wane na zewnątrz hadronów (bo więżą je inne gluony). 
W rezultacie w przyrodzie nie obserwuje się cząstek 
kolorowych, a tylko „białe” hadrony. 

Chromodynamika kwantowa jak dotąd jednak nie 
jest w stanie tego wniosku uzasadnić ilościowo. W re¬ 
zultacie w praktycznych obliczeniach fakt uwięzie¬ 
nia kwarków traktuje się jako dany z góry. Można 
to zrobić dwojako. W wersji bardziej wyszukanej, 
zakłada się, że oddziaływania między kwarkami i gluo¬ 
nami powodują powstanie pewnego pola samouzgod- 
nionego, które trzyma wszystkie te cząstki wewnątrz 
hadronu oraz dają pewne słabe oddziaływania reszt¬ 
kowe, które w pierwszym przybliżeniu można nawet 
model pominąć. Pole więżące kwarki nazywa się czasem 
worka workiem. W modelu worka zakłada się pewną kon¬ 
kretną postać pola. Obliczone wówczas widmo mas 
hadronów zgadza się na ogół bardzo dobrze z do¬ 
świadczeniem z wyjątkiem masy mezonu 7r, której 
obliczona wartość jest za duża oraz poza tym, że 
z obliczeń wynika istnienie również takich cząstek, 
których — jak dotąd — nie wykryto w doświadczeniu. 
Poza tym model worka nie pozwala na żadne prze¬ 
widywania co do amplitud procesów między hadro¬ 
nami. . 

Mniej ambitna wersja modelu polega na założeniu, 
że uwięzienie kwarków można opisać wprowadzając 
po prostu pewien potencjał, który dla dużych odległoś¬ 
ci między kwarkami zmierza do nieskończoności, nie 
pozwalając im opuścić hadronu. Typowym przykła¬ 


dem takiego potencjału jest 

V(r) = Afr+Br , (39) 

gdzie A i B są pewnymi stałymi. Potencjał taki wsta¬ 
wia się do równania Schrodingera i bada widmo 
stanów związanych. Wyniki przedstawione dla układu 
kwarków c-c (układ fizyczny zwany czarmonium, 
od ang. charm < powab’), są w bardzo dobrej zgod¬ 
ności z doświadczeniem. Oczywiście i w tym wy¬ 
padku nie można badać oddziaływań między hadro¬ 
nami, a tylko widmo mas, oraz inne własności poje¬ 
dynczych hadronów. 

Pomimo wszystkich tych ograniczeń wyniki uzyska¬ 
ne w modelach pochodzących od chromodynamiki 
kwantowej pozwalają mieć nadzieję na to, że konsek¬ 
wentna teoria oddziaływań silnych wreszcie powstanie. 

Obraz, który się być może wyłania z obecnie do¬ 
stępnych danych, byłby więc taki, że oddziaływania 
silne, podobnie jak słabe i elektromagnetyczne by¬ 
łyby przenoszone przez bozony o spinie 1, a liczba 
fundamentalnych cząstek obejmowałaby oprócz tych 
bozonów jeszcze tylko stosunkowo niewielką liczbę 
fermionów (być może 6 leptonów i 6 kwarków, te os¬ 
tatnie — każdy w trzech kolorach). Chromodynamika 
kwantowa (albo inna teoria oparta na modelu kwarko¬ 
wym) musi przede wszystkim wyjaśnić wszystkie te 
regularności dynamiczne, które są opisane w modelu 
biegunów Reggego. Sprawą zaś dalszej przyszłości 
jest zarysowująca się możliwość unifikacji także od¬ 
działywań silnych ze słabymi i elektromagnetycznymi. 

Istnieją poglądy, że leptony tworzą czwarty kolor, 
a więc pełna grupa symetrii koloru byłaby grupą 
517(4), a nie SU( 3). W tym wypadku kwarki mogłyby 
samorzutnie przechodzić w leptony, a dokładniej 
w układy cząstek zawierające leptony. Liczba bario- 
nów nie byłaby więc zachowana bezwzględnie, a pro¬ 
ton byłby cząstką nietrwałą, z bardzo długim czasem 
życia, rzędu co najmniej 10 22 lat. Sprawdzenie doświad¬ 
czalne tych hipotez może więc być bardzo trudne. 

P.D.B. Collins, E.J. Squires Regge Poles in Particie Pkysics, 
Berlin 1968 (ros. Moskwa 1971); R-J- Eden , En€rg Z 
sions of Element ary Particles , Cambridge 1967 (ros. Moskwa 
1970); D.H. Perkins Jntroduction to High Energy Physics.Łon- 
don 1972 (ros. Moskwa 1975); H. Pilkuhn The Interactions of 
Hadrons, Amsterdam 1967; Zob. też bibl. do Cząstki elementarne 
i ich oddziaływania. 


Oddziaływania elektromagnetyczne 

Michał Święcki 


Oddziaływania elektromagnetyczne są to wszelkiego 
typu reakcje zachodzące między ładunkami elektry¬ 
cznymi zarówno nieruchomymi, jak i pozostającymi 
w ruchu. W tym drugim przypadku mamy do czynie¬ 
nia z prądami elektrycznymi, które są źródłem od¬ 
działywań magnetycznych. Wszystkie oddziaływania 
elektromagnetyczne zachodzą za pośrednictwem pola 
elektromagnetycznego, które w każdym punkcie wy¬ 
pełnionej nim przestrzeni działa siłą elektryczną na 
umieszczone w tej przestrzeni ładunki elektryczne, 
ładunki a także siłą magnetyczną — na ładunki, będące w ru- 
elektryczne chu (prądy, magnesy). Równocześnie źródłem pola 
a pole elektromagnetycznego są ładunki elektryczne. Nie- 
elektrc- ruchome ładunki oraz stałe prądy elektryczne są źród- 
magnetyczne łami nie zmieniających się z upływem czasu poi 
statycznych, na przykład pola elektrostatycznego 
siły Coulomba bądź pola magnetostatycznego nie¬ 
ruchomego magnesu. Ruchome pojedyncze ładunki 
oraz prądy zmienne wywołują powstawanie zmiennego 
pola elektromagnetycznego. Zmiana (zaburzenie) pola 
elektromagnetycznego następuje lokalnie, w miej¬ 
scu, w którym zaszła zmiana ładunku — źródła pola. 
Następnie zaburzenie to rozchodzi się po całej prze¬ 
strzeni w postaci fali elektromagnetycznej. Poza miej¬ 
scem i chwilą zajścia zaburzenia fala ta rozchodzi 


się swobodnie, aż do momentu napotkania innych 
ładunków, na które również lokalnie działa siłami 
elektrycznymi i magnetycznymi. Przekonamy się dalej, 
na czym polega owo rozchodzenie się pól elektro¬ 
magnetycznych — nośników wszystkich oddziaływań 
elektromagnetycznych. 

Oddziaływania elektromagnetyczne odgrywają wy¬ 
jątkową rolę w świecie i w procesie jego poznawania. 
Decydują one o budowie atomów i cząsteczek chemi¬ 
cznych, a także o strukturze wszelkich ciał makrosko¬ 
powych z wyjątkiem planet i gwiazd, gdzie istotne są 
również oddziaływania grawitacyjne. Nasze zmysły 
działają również dzięki oddziaływaniom elektromag¬ 
netycznym. Na nich też opiera się funkcjonowanie 
wszystkich przyrządów pomiarowych. Także tych, 
za pomocą których przeprowadzamy doświadczenia 
w świecie cząstek elementarnych. Można powiedzieć, 
że cała nasza ścisła wiedza o świecie była i jest zbierana 
za pomocą różnego typu oddziaływań elektromagne¬ 
tycznych. Nic więc dziwnego, że oddziaływania te 
zostały najlepiej poznane i opisane przez fizykę. 
Istnieje bardzo elegancka i doskonale zgodna z do¬ 
świadczeniem teoria oddziaływań elektromagnetycz¬ 
nych. Dla zjawisk makroskopowych jest to znana 
teoria Maxwella-Faradaya. W przypadku zjawisk 
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mikroskopowych, z których wynikają oczywiście 
wszelkie prawa makroskopowe, teorią tą jest elektro¬ 
dynamika kwantowa (—► Elektrodynamika, Teoria 
pola). W tym artykule opiszemy zasady elektrodyna¬ 
miki kwantowej i jej zastosowanie do opisu oddziały¬ 
wań elektromagnetycznych cząstek elementarnych, 
własności Nim do tego przejdziemy, zastanówmy się, dlaczego 
oddziaływań to właśnie oddziaływania elektromagnetyczne pełnią 
elektromag- ową wyjątkową rolę w przyrodzie. Jest to związane 
netycznych z dwiema ich własnościami. Po pierwsze mają one 
nieskończony zasięg działania i łatwo je obserwować 
na odległościach makroskopowych. Oddziaływania 
grawitacyjne mają również tę własność, ale są wyjątko¬ 
wo słabe i zaczynają odgrywać zauważalną rolę do¬ 
piero dla obiektów astronomicznych. Oddziaływania 
zaś silne i słabe mają zasięg działania niesłychanie 
mały 10~ 15 m), znacznie mniejszy niż zdolność roz¬ 
dzielcza stosowanej aparatury pomiarowej. Z drugiej 
strony oddziaływania elektromagnetyczne cząstek 
elementarnych są na tyle słabe, że przy ich opisie 
stosować można pewne metody przybliżone (diagra¬ 
my lub inaczej grafy Feynmana), które opiszemy dalej 
Oddziaływania silne ważne przy opisie struktury jądra 
atomowego są natomiast zbyt mocne i dlatego ich 
opis teoretyczny nie jest już tak prosty, 
elektro- Elektrodynamika kwantowa traktuje o oddziaływa- 
dynamika niach elektromagnetycznych cząstek elementarnych, 
kwantowa W oddziaływaniach tych biorą udział wszystkie cząstki 
z wyjątkiem neutrin. Wszystkie one bowiem albo są 
obdarzone ładunkiem, albo zbudowane są ze składni¬ 
ków- naładowanych, jakimi są np. kwarki w hadro¬ 
nach (-*• Cząstki elementarne i ich oddziaływania. 
Struktura cząstek elementarnych). Kluczową rolę we 
wszystkich oddziaływaniach elektromagnetycznych 
odgrywa foton. Nie ma on ładunku, a tylko oddziałuje 
z ładunkami innych cząstek przenosząc między nimi 
pęd i energię. Foton więc pełni w świecie cząstek ele¬ 
mentarnych taką samą funkcję, jak pole elektromag¬ 
netyczne w zjawiskach makroskopowych. Rozpatrzmy 
dokładniej, na czym polega przenoszenie oddziaływań 
między cząstkami przez inne cząstki (np. przez foton). 
W tym celu musimy przypomnieć prawa kwantowe 
rządzące mikroświatem. 

Zgodnie z wynikami dotychczas przeprowadzonych 
doświadczeń cząstki elementarne rozchodzą się jak 
wzory fale, których częstość i długość wiążą się z energią 
de Brog!ie'a i pędem cząstek wzorami de Broglie’a: 

E — hv, p — h!X. 

Fale te ulegają dyfrakcji i interferencji, zjawiskom 
charakterystycznym dla procesów rozchodzenia się 
cząstek. Natomiast bez względu na to, czy rozcho¬ 
dząca się fala elektronowa bądź fotonowa jest kulista 
czy też płaska (zależy to od własności źródła elektro¬ 
nów, czy fotonów) zawsze przekazuje ona całą swą 
energię, pęd, ładunek i inne mierzalne swe własności 
w' postaci zlokalizowanych, bardzo małych przestrzen¬ 
nie porcji — w postaci cząstek. Tak więc cząstki ele¬ 
mentarne rozchodzą się jak fale, a we wszystkich 
urządzeniach pomiarowych rejestrowane są jako bar- 
falcs prawdo- dzo małe obiekty. Żeby opisać ten paradoksalny wynik 
podobień- w'ielu doświadczeń wprowadzamy pojęcie fal prawdo- 
stwa podobieństwa. Fale te opisują wszystkie możliwe 
drogi i sposoby rozchodzenia się cząstek. Rozcho¬ 
dzenie się to ma właśnie charakter falowy. Natężenie 
fal prawdopodobieństwa, czyli kwadrat ich amplitudy 
jest miarą prawdopodobieństwa określonego zacho¬ 
wania się cząstek. Tak więc mówimy jedynie o praw¬ 
dopodobieństwie uzyskania określonego wyniku po¬ 
miaru położenia cząstki i prawdopodobieństwo to 
rozchodzi się jak fala. A jaki jest związek fali, na 
przykład fotonowej, z makroskopowym polem elek¬ 
tromagnetycznym? Otóż przy bardzo dużej mocy 
źródła wysyłającego fotony liczba możliwych rozróż¬ 
nianych doświadczalnie dróg, po których mogą się 
one rozchodzić, staje się znacznie mniejsza niż liczba 
samych fotonów. Chociaż więc w dalszym ciągu losy 
pojedynczego fotonu mogą być określone jedynie 


statystycznie, to jednak prawdopodobieństwo tego, 
że duża liczba jakichkolwiek fotonów znajdzie się w 
dowolnym miejscu jest bliskie jedności. 1 tak właśnie 
pojawia się makroskopowa fala elektromagnetyczna, 
która składa się z ogromnej liczby mikroskopowych 
fal fotonowych. Zerowa masa spoczynkowa fotonu 
jest odpowiedzialna za fakt, że fale elektromagne¬ 
tyczne rozchodzą się z maksymalną możliwą pręd¬ 
kością c x 300 000 km/s. Dwa możliwe ustawienia 
spinu fotonu odpowiadają dwom niezależnym stanom 
polaryzacji tych fal. Wysyłanie i pochłanianie fal ele¬ 
ktromagnetycznych to nic innego, jak wysyłanie i po¬ 
chłanianie fotonów przez ładunki elektryczne. 

Z powyższych rozważań wynika, że elementarnym oddziaływa- 
oddziaływaniem elektromagnetycznym jest wysłanie nie elernen- 
bądź pochłonięcie fotonu przez cząstkę naładowaną tarne 
elektrycznie. Proces ten, podobnie jak oddziaływania 
makroskopowe, zachodzi lokalnie, czyli w pewnym 
punkcie przestrzeni i pewnej chwili czasu. Poza tym 
punktem i chwilą zarówno naładowana cząstka, jak 
i foton rozchodzą się zupełnie swobodnie, bez oddzia¬ 
ływań. Wynika z tego, że jedynie oddziaływania elek¬ 
tromagnetyczne cząstek elementarnych nie mających 
wewnętrznej struktury są łatwe do opisania. Takimi 
cząstkami prócz samego fotonu są wszystkie leptony. 

Natomiast hadrony mają bogatą strukturę — złożone 
są prawdopodobnie z kwarków i tylko oddziaływania 
elektromagnetyczne tych ostatnich są proste. Najpierw 
więc opiszemy oddziaływania elektromagnetyczne 
leptonów, przed omówieniem struktury hadronów. 

Podstawowym procesem elektromagnetycznym jest 
wysłanie fotonu przez inną, naładowaną cząstkę. 

Jednak proces taki wydaje się niemożliwy z punktu 
widzenia praw zachowania energii i pędu. Elektron 
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o ściśle określonej (przez pomiar) energii E x i pędzie 
Pi (rys. 1) może po wysłaniu fotonu pozostać tym 

samym elektronem o energii E z i pędzie p z tylko wtedy, 
gdy kwadrat masy spoczynkowej fotonu wynosi 

T = (1 /<*)[(fi—£k)*-<£- A)V] ^ 0, 
zgodnie z zasadami zachowania oraz relatywistycz¬ 
nym związkiem między energią i pędem. Tymczasem 
wiemy, że masa fotonu wynbsi zero, co w powyższym 
wzorze może się zdarzyć tylko wtedy, gdy E l = E z 

oraz p x == p z (rozpraszanie do przodu). A jednak fotony 
mogą istnieć, choć niezbyt długo, fotony o dowolnych wirtualne 
wartościach masy. Są to tzw. fotony wirtualne. Ich 
pojawianie się wiąże się z zasadą nieokreśloności 
energii i czasu powszechnie obowiązującą w teoriach 
kwantowych. Zasada ta jest bezpośrednią konsekwen¬ 
cją związku między energią cząstki i liczbą drgań na 
sekundę w fali z nią związanej, E = Jn\ Głosi ona, że 
minimalny czas At, po którym jakikolwiek obiekt 
fizyczny (np. przyrząd pomiarowy) może zarejestro¬ 
wać zmianę stanu badanej cząstki (na przykład fakt 
wysłania przez nią fotonu) wiąże się z nieokreślono¬ 
ścią wartości energii tej cząstki AE nierównością. 

AE At ^ V z h. 

Zasada ta obowiązuje często ze znakiem równości. 

Na przykład dla cząstki swobodnej iloczyn nieokreślo¬ 
ności czasu i energii dąży do V 2 tf, gdy nieokreśloność 
energii dąży do zera, tzn. gdy energię cząstki wyzna¬ 
czamy z dużą dokładnością. Nie ma jednak żadnego 
powodu formalnego (poza, być może, naszą jakże 
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masy często zawodną intuicją), żeby masy spoczynkowe 
spoczynkowe cząstek były ściśle określone. W każdym przypadku 
omawianej reakcji emisji fotonu energie i pędy cząstek 
są określone bardzo dobrze — dla elektronów przez 
pomiary, dla fotonu wirtualnego przez zasady za¬ 
chowania. Nie ma jednak zasady zachowania masy 
spoczynkowej. Obowiązuje dla niej tylko związek 

/>i 2 c 4 — E 2 —p 2 c 2 

i stąd właśnie wyznaczamy tę masę. Tak więc w każ¬ 
dym pojedynczym akcie emisji masa jest określona 
przez ten związek, chociaż ani nie musi być ona np. 
równa zeru dla fotonu, ani być taka sama we wszyst¬ 
kich aktach emisji. W wielokrotnie powtórzonym do¬ 
świadczeniu z emisją fotonu energie i pędy elektronów 
końcowych będą za każdym razem inne dając różne 
masy spoczynkow-e fotonu wirtualnego. 

Musimy teraz uwzględnić relatywistyczną nie- 
zmienniczość teorii. Wiemy przecież, że wartości za¬ 
równo energii jak i czasu (podobnie pędu i położenia) 
zależą od układu odniesienia i musimy dokonać wy¬ 
boru odpowiedniego układu, uniwersalnie dla wszyst¬ 
kich przypadków danej reakcji. Najwygodniej jest 
związać wybrany układ z własnościami fotonu wir¬ 
tualnego. I tak na przykład, w opisanej reakcji emisji 
fotonu mamy cf ^ 0 i można wybrać układ odnie¬ 
sienia (tzw. układ Breita), w którym p x = p 2 . Wtedy 
E x — energia fotonu jest równa zeru, a jego pęd 
wiąże się z wartością masy: p / = c ]/ —q*. W rozwa¬ 
żanej dalej reakcji anihilacji pary elektron-pozyton 
z wytworzeniem fotonu wirtualnego kwadrat masy 
fotonu jest dodatni, q 2 > 0, i wygodny jest układ od¬ 
niesienia (tzw. układ środka masy), w którym również 

p\ = -p. L . Kinematyka jest tu jednak inna i mamy 
ą 2 = (l/c 4 ) • [(E 1 +£ 2 ) 2 -(Pi-fp 2 ) 2 c 2 ] ^ 0, skąd £> - 
= c- ]/q 2 przy pi = 0. W tym ostatnim przypadku 
wybraliśmy więc po prostu układ spoczynkowy fotonu 
wirtualnego (dla ą 2 < 0 układtaki nie istnieje) i w tym 
układzie nieokreśloność energii fotonu równa się nie¬ 
określoności jego masy (AE = c 2 'Am). Ponieważ masa 
fotonu rzeczywistego wynosi zero, więc dla pojedyn¬ 
czego aktu emisji z określoną wartością ą 2 nieozna¬ 
czoność masy równa się wartości samej masy. Wtedy 
z zasady nieokreśloności wynika 

= h!2e\ 

gdzie At jest czasem trwania emisji, czyli czasem, pod¬ 
czas którego żaden przyrząd pomiarowy nie jest w 
stanie stwierdzić pojawienia się fotonu o niefizycznej 
wartości masy. Po upływie tego czasu foton taki może 
być dostrzeżony i przedtem musi być z powrotem 
pochłonięty. Zupełnie podobne rozważania można 
przeprowadzić w przypadku, gdy q 2 ^ 0. Wtedy jed¬ 
nak należy mówić o nieoznaczoności położenia i pędu 
w układzie Breita. Mamy podobnie Ap - c-Am, a w 
pojedynczym akcie emisji Am = j/~ q 2 . Z zasady 
nieokreśloności pędu i położenia mamy teraz Ax • 
.|/ZT^r _ fij2c> gdzie Ax oznacza rozmiary obszaru, 
w którym zaszła emisja. Foton wirtualny nie może się 
pojawić w odległości większej niż Ax , gdyż wtedy 
mógłby zostać zaobserwowany. Wprowadzając umo¬ 
wnie i w tym wypadku charakterystyczny czas równy 
Ax/c można stale posługiwać się pojęciem czasu od¬ 
działywania, danego uniwersalnie przez związek At = 
= Ul 2 \ V c 2 . Wszystko to obowiązuje jedynie dla 
cząstek swobodnych, dla których nie występuje nie¬ 
określoność energii oddziaływania. Wiemy jednak, 
że w teorii lokalnej swobodne są wszystkie cząstki, 
w tym również wirtualne. I tak, w pojedynczym akcie 
emisji wysłany z elektronu foton o kwadracie masy q 2 , 
nieoznaczo- wyznaczonym przez pomiary dla elektronu, może 
ność czasu zostać zauważony dopiero po czasie 
emisji ^ _ h 

fotonu At ~ 2| /—i- c = • 


Tyle właśnie wynosi nieoznaczoność czasu emisji 
fotonu, choć jak wiemy czas ten jest tylko chwilą 
(punktem czasowym). Po upływie czasu At wysłany 
foton musi zostać pochłonięty przez inną bądź tę 
samą cząstkę (rys. 2 i 3). W pierwszym wypadku na¬ 
stępuje przekazanie pędu i energii drugiej cząstce, -► 

czyli jej rozproszenie. I na tym polega przekazywa- 
nie oddziaływań elektromagnetycznych przez fotony. ' F 2 ol on° winuat 
Niedostrzężony przez czas At foton wirtualny może ' zosta( poc |.,i 0 - 
w tym czasie przebyć drogę równą c 'At. Ponieważ dla nięty pr/e/ inn> 
rozpraszania do przodu q 2 -> 0, więc At -> oo i w elektron 
tych warunkach droga przebyta przez foton może być 
dowolnie duża. Dlatego właśnie mówimy, że od¬ 
działywania elektromagnetyczne mają zasięg nieskoń¬ 
czony. Odpowiada temu statyczny potencjał oddziały- potencjał 
wanfa V ~ 1 jr. Gdyby cząstka przenosząca oddziały- oddziaływa- 
wanie nie miała>zerowej masy, m 0 * 0 (w 0 jest tu ma- nia 
są cząstki rzeczywistej), to dla q 2 0 nieokreśloność 
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Rys. 3. Absorpcja foto¬ 
nu wirtualnego prze/__ 

ten sam elektron "czas 

masy nie dążyłaby do zera ale do m 0 . Wtedy At - 
-> i zasięg takiego oddziaływania wynosiłby 

c . At = hHm Q c. Sytuacja tego rodzaju występuje przy 
oddziaływaniach silnych oraz słabych i odpowiada 
jej statyczny potencjał oddziaływania zw-any poten¬ 
cjałem Yukawy V ~(l/r) exp[ (fifm 0 c)r]. 

Przejdźmy teraz do obliczenia prawdopodobień¬ 
stwa zajścia niektórych procesów elektromagnetycz¬ 
nych. Musimy przedtem ustalić, w jaki sposób bę¬ 
dziemy opisywali wyniki doświadczeń przeprowa¬ 
dzanych nad cząstkami. Przede wszystkim zauważmy, 
że z zasady nieokreśloności energii i czasu, a także 
z podobnej zasady obowiązującej dla pędu i położenia 
wynika, że reakcje zachodzące między cząstkami ele¬ 
mentarnymi mogą być opisywane albo za pomocą 
położeń i czasu, albo za pomocą energii i pędów czą¬ 
stek. Opis przy użyciu obu tych zbiorów zmiennych 
równocześnie nie jest możliwy. W doświadczeniach 
potrafimy mierzyć energie i pędy cząstek z dokład¬ 
nością sięgającą jednego procenta, podczas gdy do¬ 
kładność bezpośredniego pomiaru położenia i czasu 
jest o wiele rzędów wielkości gorsza niż rozmiary 
cząstek i czasy trwania procesów zachodzących 
miedzy nimi. Nic też dziwnego, że przy opisie od¬ 
działywań między cząstkami posługujemy się poję¬ 
ciem prawdopodobieństwa uzyskania określonych 
wartości energii i pędów cząstek, nic nie mówiąc o ich 
położeniach. Podobnie fale opisujące zachowanie się 
cząstek będą zależały od pędów i energii, podczas 
gdy ich własności czasoprzestrzenne nie będą nas 
interesowały. Zamiast pojęcia przestrzennych fal 
prawdopodobieństwa wprowadzimy ogólniejsze po¬ 
jęcie amplitudy prawdopodobieństwa. Amplituda ta 
w wypadku reakcji zachodzących między cząstkami amplitudy 
elementarnymi zależy od pędów i energii cząstek, prawdopo- 
Jej kwadrat daje prawdopodobieństwo uzyskania dobieństwa 
określonego wyniku doświadczenia. Amplitudami 
prawdopodobieństwa posługujemy się tak Jak samym 
prawdopodobieństwem, tzn. mnożymy amplitudy 
odpowiadające procesom niezależnym bądź warunko¬ 
wym oraz dodajemy amplitudy odpowiadające pro¬ 
cesom nierozróżnialnym doświadczalnie. W tym 
ostatnim przypadku mamy właśnie do czynienia zc 
zjawiskami interferencji wszelkiego rodzaju. 

Obliczymy amplitudę prawdopodobieństwa zwią¬ 
zaną z opisanym uprzednio procesem rozpraszania 
dwdch cząstek naładowanych, zachodzącym przez 
wymianę fotonu wirtualnego o kwadracie masy rów'- 
nym q 2 . W rachunkach pominiemy spjny cząstek, tak 
że uzyskane wyniki nic będą ścisłe. Załóżmy też, że 
rozpraszane cząstki nie są identyczne. Może to być 
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np. rozpraszanie mionu pr na elektronie. W przypad¬ 
ku cząstek identycznych, np. elektronów, pojawią się 
dwa nierozróżnialne stany końcowe, w których roz¬ 
proszone cząstki mają zamienione pędy i energie. 
Amplitudy prawdopodobieństwa zajścia tych dwóch 
zdarzeń należy dodać, pojawia się interferencja, która 
nieco komplikuje rachunki. 

Amplituda prawdopodobieństwa zajścia procesu 
emisji fotonu nie może zależeć bezpośrednio od pę¬ 
dów i energii cząstek uczestniczących w tej reakcji. 
Wtedy bowiem prawdopodobieństwo emisji zależa¬ 
łoby od układu odniesienia, z którego obserwujemy 
ten proces. Amplituda może więc zależeć jedynie od 
takich kombinacji pędów i energii cząstek, które nie 
zmieniają się przy zmianie układu odniesienia. Takimi 
kombinacjami są masy spoczynkowe cząstek — sta¬ 
łe— oraz zmienna masa )f— q 2 charakteryzująca 
wysłany foton wirtualny. Amplituda prawdopodo¬ 
bieństwa wysłania fotonu wirtualnego jest więc funk¬ 
cją q 2 (pominęliśmy spiny cząstek). Jaka jest ta zależ¬ 
ność? Najprościej przyjąć, że amplituda jest wprost 
proporcjonalna do czasu trwania procesu emisji At 
(oznacza to, że każda chwila wysłania jest równie 
prawdopodobna), czyli odwrotnie proporcjonalna do 
]/— q 2 . Stałą proporcjonalności nazywamy ładun¬ 
kiem elektrycznym cząstki wysyłającej. Taka definicja 
ładunku jest zgodna z definicją makroskopową (po¬ 
przez prawo Coulomba). Tak więc elementarna ampli¬ 
tuda prawdopodobieństwa równa się ej)/— q 2 , gdzie 
e-i jest ładunkiem cząstki wysyłającej. Podobnie ampli¬ 
tuda prawdopodobieństwa zajścia procesu absorpcji 
fotonu wynosi ej)/ —q 2 , gdzie e 2 jest ładunkiem cząst¬ 
ki pochłaniającej. Wreszcie amplituda zajścia procesu 
absorpcji pod warunkiem,.że uprzednio wystąpił pro¬ 
ces emisji jest oczywiście iloczynem obu powyższych 
amplitud: 

AW)=- e -f- 

(Często zamiast zmiennej q 2 wprowadza się zmienną 
t = q 2 ). Prawdopodobieństwo uzyskania w wyniku 
rozpraszania takiej konfiguracji pędów i energii koń¬ 
cowych, której odpowiada określona wartość q 2 , jest 
dane przez kwadrat tej amplitudy. Przekrój czynny, 
który jest miarą prawdopodobieństwa rozpraszania, 
przy odpowiednich jednostkach ładunku wynosi 
da (Anfęlel 1 
dq 2 ~ (j hc) 2 q 4 * 

We wzorze tym nie uwzględniono normalizacji prze¬ 
kroju czynnego (prawdopodobieństwo na jednostkę 
strumienia) i stąd znak proporcjonalności. Uwzględ¬ 
nienie spinów cząstek komplikuje znacznie rachunki, 
gdyż amplitudy prawdopodobieństwa mogą być także 
funkcją takich iloczynów pędów i spinów, które nie 
zależą od układu odniesienia. Jeżeli jednak badamy 
rozpraszanie cząstek nie identycznych i nie interesu¬ 
jemy się stanami polaryzacji (ustawienia spinu) czą¬ 
stek, to powyższy wzór poprawnie opisuje wyniki do¬ 
świadczalne. 

Zupełnie podobnie można obliczyć przekroje czynne 
innych procesów elektromagnetycznych związanych 
z wysyłaniem lub pochłanianiem fotonów. Nie bę¬ 
dziemy przedstawiać wyników tych obliczeń, musimy 
jednak zwrócić uwagę na podstawową własność 
amplitud prawdopodobieństwa, a mianowicie na ich 
uniwersalność. 

Uniwersalność amplitud prawdopodobieństwa po¬ 
lega na tym, że jedna amplituda opisuje wiele proce¬ 
sów. Korzystaliśmy już z tej własności, przyjmując że 
amplitudy wysłania i pochłonięcia fotonu wirtualne¬ 
go są dane tym samym wzorem. W tym wypadku było 
to dosyć oczywiste, gdyż procesy wysyłania i pochła¬ 
niania fotonu różnią się formalnie jedynie kierunkiem 
biegu czasu, który nie występuje w przyjętym przez nas 
opisie rozpraszania poprzez pędy i energie cząstek. 
Pochłaniany lub wysyłany foton nie niesie żadnych 
wielkości (liczb kwantowych), które podlegają pra¬ 


wom zachowania, z wyjątkiem pędu i energii. Foton 
ma zerowe wartości ładunku elektrycznego, leptono- 
wego oraz barionowego, nie zmienia więc tych ładun¬ 
ków u cząstek, z którymi oddziałuje. Zmienia tylko 
pęd i energię; a także spin, ale ten nie wnosi tu nic 
istotnego. Mówimy, że foton jest identyczny ze swoją 
antycząstką, co z definicji znaczy, że ma zerowe war¬ 
tości wszystkich zachowywanych liczb kwantowych 
typu ładunkowego. Dlatego właśnie procesy pochła¬ 
niania i wysyłania fotonu są opisywane tą samą ampli¬ 
tudą. Wprawdzie pęd i energia fotonu w pierwszym 
wypadku dodają się, a w drugim — odejmują od pędu 
i energii elektronu padającego, ale amplituda zależy 
jedynie od q 2 = (l/c*) [E}— pjc 2 ]. Znaki £>oraz p/ nie 
mają więc znaczenia. Zupełnie inaczej jest w wypadku 
emisji i absorpcji cząstek, które mają niezerową 
wartość przynajmniej jednej spośród zmiennych 
ładunkowych. Wysłanie na przykład elektronu z pew¬ 
nego układu, to zwiększenie ładunku elektrycznego 
tego układu o jeden. Pochłonięciu elektronu odpowia¬ 
da natomiast zmniejszenie ładunku o jeden. Podobnie 
jest z innym rodzajem ładunków, np. ładunkiem lep- 
tonowym elektronu. 

Gdyby jednak istniała cząstka, która miała by prze¬ 
ciwny niż elektron znak ładunku elektrycznego oraz 
leptonowego, a poza tym niczym nie różniła się od 
elektronu, to emisja jej mogłaby być bardzo podobna 
do absorpcji elektronu. Taką cząstką jest pozyton, 
anty cząstka elektronu. 

Zwróciliśmy poprzednio uwagę na fakt, że amplitu¬ 
da prawdopodobieństwa wysłania (pochłonięcia) fo¬ 
tonu wirtualnego może zależeć jedynie od mas czą¬ 
stek (spiny stale pomijamy) — stałych mas spoczynko¬ 
wych elektronów rzeczywistych i zmiennej masy foto¬ 
nu wirtualnego. Stałą proporcjonalności we wzorze na 
amplitudę jest ładunek elektryczny. Jest więc zupełnie 
oczywiste, że amplituda prawdopodobieństwa wysła¬ 
nia fotonu wirtualnego z pozytonu, cząstki o tej samej 
masie co elektron, ale przeciwnym ładunku, różni się 
od odpowiedniej amplitudy dla elektronu jedynie 
pewnym czynnikiem fazowym (np. znakiem). 

Ta równość amplitud reakcji z udziałem cząstek 
i antycząstek nosi nazwę niezmienniczości ze względu 
na operację sprzężenia ładunkowego. Dodajmy tu 
jeszcze, że oddziaływania elektromagnetyczne są rów¬ 
nież niezmiennicze ze względu na operacje inwersji 
przestrzennej i zmiany kierunku czasu. Te dwie ostat¬ 
nie ich własności znane są już z fizyki klasycznej. 

Zauważmy, że proces wysłania fotonu z elektronu 
można rozumieć w następujący sposób: w pewnym 
punkcie przestrzeni oraz w pewnej chwili następuje 
pochłonięcie padającego elektronu i wysłanie elektro¬ 
nu wraz z fotonem. Wtedy podobny proces z udziałem 
pozytonu powstaje przez zamianę pochłanianego 
elektronu na wysyłany pozyton, a wysyłanego elektro¬ 
nu na pochłaniany pozyton. Odpowiednie amplitudy 
różnią się jedynie znakiem. A co będzie, jeżeli tylko 
jeden z elektronów zamienimy na pozyton (rys. 4, 5)? 
Powstaną wtedy zupełnie inne reakcje — kreacja pary 
elektron-pozyton przez foton wirtualny oraz anihila- 


Rys. 4. Anihilacja pary 
elektron-pozyton na fo¬ 
ton wirtualny 



cja pary na foton. Ponieważ założyliśmy raz na za 
wsze, że amplituda prawdopodobieństwa jest propor¬ 
cjonalna do nieokreśloności czasu zajścia oddziały¬ 
wania, a przez stałą proporcjonalności zdefiniowaliś¬ 
my ładunek elektryczny, więc nic dziwnego, że te no¬ 
we procesy są opisywane znów przez amplitudę 


pozyton — 
anty cząstka 
elektronu 


niezmienni- 
czość 
ze względu 
na operację 
sprzężenia 
ładunkowego 


Rys. 5. Kreacja pa* 
ry elektron-pozyton 
przez foton wirtual¬ 
ny 
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e!]/—q 2 z odpowiednią, określoną przez prawa za¬ 
chowania wartością q 2 . Tak więc jedna amplituda 
opisuje wszystkie omówione poprzednio procesy 
z udziałem fotonu wirtualnego. 

Spróbujmy odwrócić tok powyższego rozumowania. 
Pokazaliśmy, że amplituda prawdopodobieństwa po¬ 
chłonięcia fotonu przez elektron przechodzi w ampli¬ 
tudę kreacji pary elektron-pozyton przez foton, jeżeli 
pęd i energia padającego elektronu zmienią znaki (po¬ 
przednio pęd i energia fotonu były różnicami pędów 
i energii leptonów, teraz są ich sumą) i staną się od¬ 
powiednimi wielkościami wysyłanego pozytonu (o 
przeciwnym znaku ładunku). Korzystaliśmy przy tym 
z faktu istnienia pozytonu. Nie jest to jednak zało¬ 
żenie konieczne, bowiem fakt ten wynika już z sa¬ 
mych zasad przedstawianej teorii. Am plitu da praw¬ 
dopodobieństwa absorpcji fotonu, e/]/—q 2 , nie zni¬ 
ka przecież, jeżeli pęd i energia elektronu zmienią 
znak. Tyle tylko, że teraz ą 2 dane jest innym niż po¬ 
przednio wyrażeniem 

q 2 = -4-K^+^-fe+A)*^] > °- 


diagramy 

Feynmana 


Poprzednio q 2 < 0. Funkcja e/)/—q 2 nie znika ani 
dla dodatnich, ani ujemnych wartości q 2 . Nie znika 
więc amplituda, a z nią i prawdopodobieństwo zajścia 
odpowiednich reakcji. Jeżeli prawdopodobieństwo 
zajścia procesu kreacji pary z fotonu nie znika, to 
znaczy, że pary takie muszą być czasem produkowa¬ 
ne. A zatem musi istnieć antycząstka elektronu 
o takiej samej co elektron masie, lecz o ładunku elek¬ 
trycznym przeciwnego znaku. Jest to prawo obowią¬ 
zujące ogólnie w świecie cząstek elementarnych. 
Wszystkie one muszą mieć i rzeczywiście mają anty- 
cząstki o takich samych masach (i spinach), ale prze¬ 
ciwnego znaku ładunkach wszystkich rodzajów. Nie¬ 
które cząstki, jak np. foton, czy też mezon n° są 
tożsame ze swymi antycząstkami. 

Przedstawione poprzednio rysunki obrazujące wy¬ 
syłanie i pochłanianie fotonów wirtualnych przez elek¬ 
trony i pozytony (bądź jakiekolwiek inne cząstki na¬ 
ładowane) oraz anihilację i kreację par zwane są dia¬ 
gramami (grafami) Feynmana. Są to elementarne 
diagramy Feynmana opisywane przez tę samą ampli¬ 
tudę prawdopodobieństwa. Jednak w tych elementar¬ 
nych procesach nie tylko foton może być wirtualny. 
Wiemy przecież, że fotony, podobnie jak i fale elek¬ 
tromagnetyczne mogą rozchodzić się swobodnie na 
ogromne odległości i wtedy ich czas życia jest nie¬ 
skończony, a masa określona i równa zeru. Jeżeli 
w elementarnym procesie produkcji foton jest rzeczy¬ 
wisty, to wirtualny musi być jeden z elektronów lub 
pozytonów. Wymagają tego prawa zachowania 


dukcji wraz ze wszystkimi jego odmianami jest jedyną 
cegiełką, z której zbudowana jest elektrodynamika. 

Jest wielkim sukcesem fizyki, że teoria oparta na tak 
prostych zasadach bezbłędnie opisuje wszystkie bez 
wyjątku doświadczenia. 

Chcielibyśmy zwrócić jeszcze uwagę na pewną waż- ładunki 
ną cechę cząstek elementarnych. Mają one miano- cząstek ele- 
wicie jedynie całkowite wartości wszystkich swych mentarnych 
ładunków. Jeśli chodzi o interesujące nas tu ładunki 
elektryczne, to okazuje się, że wszystkie znane cząstki 
pozbawione struktury wewnętrznej mają ładunki ± 1 
albo 0 (w jednostkach ładunku elektronu). Leptony 
(e“, fT) mają ładunki —1, antyleptony +1, a neutrina 
i foton są elektrycznie obojętne. Obdarzone strukturą 
hadrony mogą mieć ładunki większe, ale zawsze cał¬ 
kowite. Dopiero ich nieobserwowane jako cząstki 
swobodne składniki — kwarki — mają ładunki wy¬ 
noszące x / 3 bądź 2 / 3 ładunku elementarnego. Zarówno 
owo skwantowanie ładunków elektrycznych u cząstek 
obserwowanych doświadczalnie, jak i określone od¬ 
stępstwo od niego dla uwięzionych w hadronach 
kwarków nie zostały dotychczas wyjaśnione przez 
teorię. 

W związku z tą ciekawą własnością cząstek wygod¬ 
ną miarą prawdopodobieństwa wysłania fotonu z ja¬ 
kiejkolwiek cząstki jest kwadrat ładunku elementarne¬ 
go. Wprowadza się więc nową bezwymiarową stałą 
uniwersalną, 

OCel = ^/ĄlZSoftc X VlS7> 

zwaną stałą struktury subtelnej albo stałą sprzężenia 
oddziaływań elektromagnetycznych. Poza zależnością 
od q 2 prawdopodobieństwo emisji jest zawsze dane 
przez a e i razy jeden bądź zero C/» lub 4 / 9 dla kwar¬ 
ków). Zwróćmy uwagę na stosunkowo niewielką 
wartość elektromagnetycznej stałej sprzężenia, aei ~ 

~ Vi 37 1* Jest to bardzo ważna własność. Dzięki 
temu bowiem mówiąc o rozproszaniu leptonów mo¬ 
gliśmy ograniczyć się do procesów z wymianą tylko 
jednego fotonu wirtualnego. Prawdopodobieństwo 
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Rys. 6. Emisja fotonu 
rzeczywistego z elektro¬ 
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energii i pędu. Tak więc możliwe są procesy, w których 
np. padający elektron wysyła rzeczywisty foton prze¬ 
chodząc w elektron wirtualny o masie określonej przez 
prawa zachowania (rys. 6). Amplituda tego procesu 
jest inna, gdyż nieokreśloność masy wynosi teraz nie 
]/—q 2 \ ale ]/—q 2 +ml , gdzie m 0 jest masą spoczynko¬ 
wą elektronu rzeczywistego. W związku z tym 
At ~ l/ł/— q 2 +ml, ale, wciąż pomijając spin, jest to 
jedyna zmiana, gdyż stała proporcjonalności (ładu¬ 
nek) jest znów ta sama, co poprzednio. Moglibyśmy 
też rozważać procesy, w których nie jedna, ale dwie 
albo nawet wszystkie trzy cząstki są wirtualne. Ra¬ 
chunki nieco się wtedy komplikują, ale zasada pozo¬ 
staje ta sama. Tak więc elementarny diagram pro- 


Rys. 7. Wymiana dwóch 
fotonów wirtualnych 
przy rozpraszaniu elek¬ 
tronów jest mało istotna 

wysłania (i następnie pochłonięcia) dwóch, trzech 
i więcej fotonów nie jest równe zeru (rys. 7). Jednak 
wymiana każdego fotonu wiąże się zawsze z pojawie¬ 
niem się w amplitudzie prawdopodobieństwa czynnika 
otei ~ V i 37 * Wszystkie procesy wyższych rzędów są 
więc bardzo mało prawdopodobne i mogą być pomi¬ 
nięte. W dokładnych rachunkach, służących do opisu 
bardzo precyzyjnych pomiarów, trzeba oczywiście 
uwzględnić również te nieznaczne wkłady. Jednak 
zawsze wystarczy ograniczyć się do niewielkiej stosun¬ 
kowo liczby procesów wielofotonowych. Tak więc 
jedynie dzięki małej wartości stałej sprzężenia możemy 
wykonywać efektywne obliczenia dla reakcji pocho¬ 
dzenia elektromagnetycznego. Zupełnie inaczej wy¬ 
gląda sprawa z oddziaływaniami silnymi, których 
stała sprzężenia jest duża, oku » 10. Powoduję to, że 
kolejne wyższe rzędy oddziaływania są coraz większe 
i opis teoretyczny bardzo się komplikuje. Dopiero 
oddziaływania składników hadronów — kwarków — 
mogą być w pewnych warunkach niezbyt silne. Nie są 
też oczywiście silne oddziaływania elektromagnetycz¬ 
ne zarówno hadronów, jak i kwarków. 

Opiszemy teraz krótko różnego rodzaju reakcje 
pochodzenia elektromagnetycznego. Każdą z nich 
będziemy ilustrować odpowiednim diagramem Feyn¬ 
mana, ograniczając się zawsze do diagramów najniż¬ 
szego rzędu. Zaczniemy od przedstawienia oddziały¬ 
wań elektromagnetycznych leptonów — cząstek bez 
struktury wewnętrznej. 
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pozytonium 


Rozpraszanie kuSombowskie. Stany związane 


przekrój 
czynny na 
rozpraszanie 
kulumbow- 
skie 


Reakcję tę omawialiśmy szczegółowo poprzednio. 
Rozpraszać się mogą różne leptony obdarzone ładun¬ 
kiem. Ponieważ ładunki elektryczne wszystkich lep¬ 
tonów różnią się jedynie znakiem, więc wszystkie prze¬ 
kroje czynne są proporcjonalne do tej samej stałej 
a 2 ei. Różnice pojawiają się jedynie w wypadku dwóch 
cząstek identycznych: interferencja dwóch procesów 
prowadzących do nierozróżnialnych sytuacji jest 
wtedy powodem znikania prawdopodobieństwa zajś¬ 
cia rozpraszania pod kątem njl (w układzie środka 
masy). Pomijając ten wypadek i pomijając spiny czą¬ 
stek dostajemy zależność: 



Widzimy, że przy rozpraszaniu nie ma znaczenia, czy 
rozpraszane cząstki mają ładunki jedno- czy różno- 
imienne. Nie ma więc znaczenia, czy przyciągają się 
czy też odpychają wzajemnie. Sytuacja ta niczym istot¬ 
nym nie różni się od rozpraszania makroskopowych 
cząstek klasycznych. Klasyczna cząstka rozpraszana 
na centrum potencjału kulombowskiego porusza się 
po hiperboli zagiętej w kierunku centrum dla poten¬ 
cjału przyciągającego i odginającej się od centrum dla 
potencjału odpychającego. Wiązka cząstek przelatu¬ 
jących w różnych odległościach od centrum odchylana 
jest po różnych hiperbolach, co daje pewne prawdo¬ 
podobieństwo (przekrój czynny) uzyskania rozpra¬ 
szania pod pewnym kątem. Rozkład kierunków nie 
będzie oczywiście zależał od tego, czy kierunki te po¬ 
chodzą z hiperbol zagiętych w jedną, czy też w drugą 
stronę. Warto przy okazji zwrócić uwagę na fakt, że 
w przybliżeniu nierelatywistycznym (potencjalnym) 
klasyczny wzór na przekrój czynny jest identyczny 
z wzorem kwantowym. Dlatego tylko Rutherford 
mógł wyciągnąć ze swych doświadczeń poprawne 
wnioski o budowie atomu, choć przecież nie znał zu¬ 
pełnie mechaniki kwantowej. 

Tak więc znaki ładunków elektrycznych nie mają 
wpływu na procesy rozpraszania cząstek, decydują 
jedynie o ewentualnym pojawianiu się stanów zwią¬ 
zanych cząstek. W ujęciu klasycznym odpowiada to 
pojawianiu się zamkniętych eliptycznych lub kołowych 
orbit w przypadku potencjału przyciągającego. Nato¬ 
miast w ujęciu kwantowym zjawisko to jest związane 
z pojawianiem się procesów wymiany wielu fotonów 



Rys. 8. Wymiana dowolnej liczby fotonów wirtualnych nie może 
być pominięta dla stanu związanego elektronu z pozytonem 


(rys. 8). W reakcjach rozpraszania procesy te są nie¬ 
istotne ze względu na małą wartość stałej sprzężenia, 
«ei ~ Vi 37 • Argument ten jest jednak oparty na za¬ 
łożeniu, że czas oddziaływania jest skończony. W przy¬ 
padku rozpraszania jest to prawda — po krótkim 
czasie cząstki rozlatują się swobodnie. W zlokalizo¬ 
wanych przestrzennie niewielkich układach związa¬ 
nych cząstek czas oddziaływania jest nieskończony, 
stany Cząstki stale pozostają w pobliżu siebie i bez względu 
związane na wartość stałej sprzężenia prawdopodobieństwo 
cząstek wymiany dowolnej liczby fotonów jest równe jed¬ 
ności. Wtedy wszystkie przedstawione na rysunku 
diagramy Feynmana są równie ważne i decyduje ich 
suma. Z formalnego punktu widzenia szereg perturba- 
cyjny nie jest więc zbieżny dla stanu związanego. 
Szereg ten w wypadku dwóch cząstek o przeciwnych 
ładunkach zawiera wyrazy o innej sekwencji znaków 
niż dla cząstek o ładunkach jednakowych. Tylko 
w jednej z tych sytuacji szereg jest rozbieżny przy pe¬ 
wnej wartości energii pary cząstek równej, oczywiście, 
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masie stanu związanego. Widać więc wyraźną różnicę, 
chociaż ścisły dowód na to, że tylko w jednym z tych 
wypadków otrzymujemy trwały stan związany, nie jest 
prosty. Warto zwrócić uwagę na fakt, że problem sta¬ 
nów związanych w elektrodynamice kwantowej nie 
został jeszcze w pełni rozwiązany. Nie umiemy bowiem 
radzić sobie z problemami, przy których rachunek 
zaburzeń nie jest zbieżny. 

Prócz atomu wodoru i innych atomów znane są 
również stany związane bardziej egzotyczne: pozy¬ 
tonium— stan związany elektronu i pozytonu oraz 
atomy egzotyczne (-* Atomy egzotyczne) — stany 
związane fT proton, tT proton, proton, antypro- 
ton proton itp. Te ostatnie nie są stanami absolutnie 
trwałymi, gdyż nietrwałe są ich składniki, chociaż ich 
czas życia jest stosunkowo długi w porównaniu z cza¬ 
sem charakterystycznym dla oddziaływań elektromag¬ 
netycznych. Jeśli chodzi o pozytonium, to zdarza się, 
jak się dalej przekonamy, że elektron* i pozyton ulega¬ 
ją anihilacji na dwa lub trzy fotony rzeczywiste. Z tego 
powodu pozytonium też nie jest absolutnie trwałe, 
choć żyje stosunkowo długo. 


Anihilacja wraz z kreacją pary 

Diagram Feynmana takiego właśnie procesu został 
przedstawiony na rysunku 9. Jeśli para anihilująca 
i para kreowana są takie same (np. e+e~ e + e~), to 
ten sam stan końcowy może być również uzyskany 


Rys. 9. Anihilacja pary 
elektron-pozyton wraz 
z następującą po niej 
kreacją pary mionów 
pru* 



w wyniku opisanego poprzednio procesu rozpraszania 
cząstki na antycząstce. Odpowiednie amplitudy trzeba 
wtedy dodać i dopiero potem obliczyć prawdopodo¬ 
bieństwo przez podniesienie sumy amplitud do kwa¬ 
dratu. Jeżeli obie pary są różne (np. e + e~ ^ + ^“), to 
rozpraszania być nie może i opis jest szczególnie 
prosty. Jak już wiemy, odpowiedni przekrój czynny 
jest dany przez to samo wyrażenie, co dla procesu 
rozpraszania z cząstkami zamienionymi na anty- 
cząstki (w tym przypadku e~fT -* e~(x~): 


da 
dq 2 



q 2 > 0. 



Rys. 10. Wyniki pomiarów przekroju czynnego procesu przej¬ 
ścia pary elektron-pozyton w parę mionów dla różnych 

wartości q l . Krzywa ciągła przedstawia przewidywania teore¬ 
tyczne 


atomy 

egzotyczne 


przekrój 
czynny na 
anihilację 
z kreacją 
pary 













Porównanie tego wyrażenia z danymi doświadczał- rzeczy wisty, pojedynczy foton. Reakcja taka zdarza się 
nymi przedstawiono na rys. 10. Widać, że zgodność w kulombowskim polu innej cząstki naładowanej, 
jest doskonała. która pełni rolę odbiorcy nieskompensowanego 


Rozpraszanie Comptona 


Rozpraszanie Comptona polega na rozpraszaniu fo¬ 
tonów na cząstkach naładowanych. Odpowiednie dia¬ 
gramy podano na rys. 11. Zwr'ćmy uwagę, że teraz 



Rys. 11. Diagramy Feynmana opisujące elastyczne rozpraszanie 
fotonu na elektronie 


nie foton, a elektron jest wirtualny. Poza tym akty 
wysyłania i pochłaniania fotonu zachodzą w czasie, 
którego nieokreśloność jest równa czasowi trwania 
reakcji. Nie możemy więc stwierdzić,- który z tych 
procesów zachodzi wcześniej i musimy dodać do siebie 
obie amplitudy odpowiadające diagramom na rysun¬ 
ku. Nie będziemy podawać wzoru na przekrój czynny, 
zwróćmy tylko uwagę, że jest on znów rzędu a*,. 
W wyniku rozpraszania foton zmienia pęd i energię, 
a stąd i długość fali (p = hjX\ co nazwano zjawiskiem 
Comptona. Kinematyka tego zjawiska jest przedsta¬ 
wiona w każdym podręczniku elementarnym. Obli¬ 
czenie jednak przekroju czynnego, czyli rozkładu ką¬ 
tów fotonów rozproszonych, wymaga posłużenia się 
aparatem elektrodynamiki kwantowej. Fotony mogą 
rozpraszać się nie tylko na leptonach, ale również na 
hadronach, np. jądrach atomowych. 


Rys. 14. Kreacja pa¬ 
ry elektron-pozyton 
przez foton rzeczywi¬ 
sty zachodząca po¬ 
przez dodatkowe od¬ 
działywanie kulom- 
bowskie z inną czą¬ 
stką, którą może być 
atomowe jądro 

w procesie kreacji pędu. Z rys. 14 widzimy, że zarówno 
wewnętrzny lepton, jak i foton są teraz cząstkami 
wirtualnymi. Proces zawiera trzy elementarne akty 
emisji i jego przekrój czynny jest proporcjonalny do 
a.* r Kreacja par jest szczególnie istotna w polu kulom- 
bowskim jąder atomowych. Wtedy prawdopodobień¬ 
stwo zajścia procesu wzrasta Z 2 razy, gdzie Z jest 
ładunkiem jądra. Fotony przechodzące przez materię 
dosyć więc często kreują pary. I całe szczęście że 
często, pojawienie się bowiem pary elektron-pozyton 
jest jedynym doświadczalnym sygnałem obecności 
fotonu. Wszystkie stosowane metody detekcji foto¬ 
nów oparte są na tym zjawisku. 



Promieniowanie hamowania 

Proces ten zachodzi również jedynie w polu kulom- 
bowskim innej cząstki. Promieniowanie hamowania 
polega na tym, że ruch elektronu zostaje zwolniony 
w polu np. jądra atomowego w wyniku czego następu¬ 
je emisja fotonu. Z diagramów przedstawionych na 
rys. 15 wynika, że proces ten powstaje z procesu 
kreacji pary (rys. 14) przez odpowiednią zamianę 


Anihilacja par na fotony rzeczywiste 



Rys. 12. Anihilacja 
pary elektron-pozy¬ 
ton na dwa fotony 
rzeczywiste 


W przeciwieństwie do odpowiedniego procesu z udzia¬ 
łem pojedynczego fotonu, anihilacja pary na dwa 
i więcej fotonów może zachodzić także dla cząstek 
rzeczywistych. Proces taki jest obserwowany do¬ 
świadczalnie. Odpowiedni diagram został przedsta¬ 
wiony na rys. 12. Widzimy, że powstał on z diagramu 
rozpraszania komptonowskiego przez zamianę roz¬ 
proszonego elektronu na padający pozyton oraz fo¬ 
tonu padającego na wysłany. Obie reakcje są więc 




Rys. 15. Promieniowanie hamowania. Foton rzeczywisty jest wy¬ 
syłany przez elektron poprzez dodatkowe oddziaływanie kulom- 
bowskie z inną cząstką, którą może być jądro atomowe 



Rys. 13. Anihilacja pary 
elektron-pozyton na trzy 
fotony rzeczywiste 


opisywane przez tę samą amplitudę, a przekrój czynny 
jest znów rzędu a* r Anihilować mogą nie tylko pary 
lepton-antylepton ale wszelkie pary cząstka-anty- 
cząstka. Na przykład para proton-antyproton może 
anihilować na fotony, jednak w tym przypadku wy¬ 
stępuje też bardziej prawdopodobny silny proces anihi- 
lacji na mezony n. Prócz anihilacji na parę fotonów 
obserwuje się też anihilację trójfotonową (rys. 13). 
Przekrój czynny w tym przypadku jest proporcjonalny 
do a’j i prawdopodobieństwo zajścia reakcji jest ok. 
sto razy mniejsze. 


Kreacja par w polu kulombowskim 

W pewnych warunkach może zachodzić również pro¬ 
ces kreacji rzeczywistej pary elektron-pozyton przez 


cząstek. Przekrój czynny jest znów rzędu Z 2 a^. Oka¬ 
zuje się przy tym, że fotony promieniowane są przede 
wszystkim wewnątrz niewielkich stożków dokoła 
kierunków lotu elektronu padającego i rozproszone¬ 
go. Zauważmy, że część amplitudy prawdopodobień¬ 
stwa związana z wymianą elektronu wirtualnego jest 
proporcjonalna do [— q z +ml)- 1 i staje się bardzo 
duża, gdy q 2 -> mj, czyli gdy elektron wirtualny ma 
masę niewiele różną od masy elektronu rzeczywistego. 
Sytuacja taka występuje wtedy, gdy foton wynosi nie¬ 
wiele pędu i energii. W procesie promieniowania 
hamowania wysyłane są więc przede wszystkim fotony 
niskoenergetyczne, tzw. miękkie. Często też trudno 
je wykryć doświadczalnie. Klasycznym odpowiedni¬ 
kiem promieniowania hamowania jest promieniowa¬ 
nie elektromagnetyczne wysyłane przez ładunki elek¬ 
tryczne zmieniające swą prędkość ruchu. Tak pro¬ 
mieniują przewodniki z prądem zmiennym, których 
przykładem jest nadawcza antena radiowa. 

Opisane procesy elektromagnetyczne należą do 
najważniejszych. Prócz nich występują jeszcze znacz¬ 
nie mniej prawdopodobne reakcje z udziałem większej 
liczby cząstek. Należą tu: promieniowanie hamowania 
wielu fotonów, produkcja dodatkowych fotonów przy 
rozpraszaniu Comptona, produkcja pary elektron- 
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pozyton z wypromieniowanego wirtualnego fotonu 
hamowania i wiele innych. W reakcjach tych nie wy¬ 
stępują jednak żadne inne jakościowo zjawiska. 

Przejdziemy teraz do opisu oddziaływań elektro¬ 
magnetycznych hadronów. O niektórych procesach 
tego typu mówiliśmy już przy dyskusji pewnych 
reakcji z udziałem leptonów. Teraz skoncentrujemy 
się na zagadnieniach najważniejszych, na reakcjach 
będących podstawowym źródłem wiedzy o strukturze 
hadronów. Zwróćmy przedtem uwagę na dwa ważne 
fakty. Po pierwsze hadrony oddziałują przede wszyst¬ 
kim silnie i oddziaływania elektromagnetyczne między 
nimi są przeważnie zupełnie nieistotne. Dlatego przy 
badaniu oddziaływań elektromagnetycznych hadro¬ 
nów musimy posłużyć się elektronem. Elektron nie 
bierze udziału w oddziaływaniach silnych i jego roz¬ 
praszanie np. na protonie może zajść jedynie poprzez 
wymianę fotonu wirtualnego (pomijamy oddziały¬ 
wania słabe elektronu). Foton ten jest pochłaniany 
przez bogatą strukturę protonu i występowanie tej 
struktury to drugi istotny dla hadronów fakt. Przed¬ 
stawiona poprzednio teoria była sformułowana jedy¬ 
nie dla cząstek pozbawionych struktury. Jak zoba¬ 
czymy dalej teoria ta okaże się płodna również dla 
hadronów obdarzonych strukturą. Okazuje się bo¬ 
wiem, że hadrony są zbudowane z bardziej elementar¬ 
nych składników, kwarków, które już nie mają struk¬ 
tury wewnętrznej. Przejdźmy więc do opisu tych do¬ 
świadczeń z udziałem elektronów i hadronów, których 
wyniki były decydujące dla podtrzymania hipotezy 
o istnieniu kwarków. 


Rozpraszanie elastyczne elektronów 
na hadronach 


Rozpraszanie to jest podobne do rozpraszania ku- 
lombowskiego elektronów ha mionach p*. Tym jed¬ 
nak razem cząstki rozpraszające mają wyraźną struk¬ 
turę wewnętrzną. Ładunek elektryczny wewnątrz 
hadronów jest rozłożony w pewnym obszarze o roz¬ 
miarach rzędu 10 -15 m. W związku z tym wyprowa-^ 
dzony poprzednio wzór na przekrój czynny musi zo¬ 
stać zmodyfikowany o pewną dodatkową zależność 

° d ^ : da 

dq * ~ q 4 


gdzie funkcja F(q 2 ) jest tzw. elastycznym czynnikiem 
postaci hadronu. Jej obecność oznacza, że przy roz¬ 
praszaniu efektywny ładunek hadronu wynosi 
AzeF(q 2 ) i przez taki właśnie ładunek jest pochłaniany 
foton wirtualny o kwadracie masy q 2 . Przedyskutujmy 
własności funkcji F(q 2 ) z punktu widzenia nieokreślo¬ 
ności At czasu emisji i absorpcji fotonu. Czas At 
jest przedziałem czasowym, w którym fakt zajścia 
emisji czy też absorpcji nie mógł zostać zauważony. 
Jeżeli czas At był bardzo mały, to foton wirtualny 
wysłany przez elektron przebył niezauważony przez 
hadron niewielką drogę c At, po czym został zaabsor¬ 
bowany. Sytuacja taka mogła się zdarzyć tylko pud 
warunkiem, że elektron przebywał w chwili oddziały¬ 
wania niedaleko środka hadronu, mniej więcej w od¬ 
ległości c At. Tak więc foton jest absorbowany tylko 
przez część ładunku hadronu, co w ujęciu klasycznym 
odpowiada temu, że ładunek punktowy przelatujący 
przez obszar naładowany oddziałuje kulombowsko 
głównie z wewnętrzną częścią ładunku. Oddziaływania 
warstw zewnętrznych mają tendencję do znoszenia 
się, a np. dla kuli to znoszenie się jest całkowite. Po¬ 
nieważ At ~ l/j f—q 2 , więc dla — q 2 -* oo czas At 
-> 0 i część ładunku hadronu, na której zachodzi roz¬ 
praszanie, dąży do zera. Wyciągamy stąd wniosek, że 

lim F(q 2 ) = 0. 

- Q 2-+C0 

I na odwrót, dla At oo, czyli q 2 -> 0 elektron znaj¬ 
duje się bardzo daleko od środka hadronu (zwróćmy 
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uwagę Da fakt, że odległość np. 10“ 7 m może być 
uważana za niemal nieskończoną w porównaniu ze 
średnimi rozmiarami protonu, 10“ 15 m) i „widzi” 
cały jego ładunek. W takich warunkach hadron może 
być traktowany jako punktowy. Tak więc 

F( 0) = 1 dla hadronu o ładunku ±e , 

F( 0) = 0 dla hadronu o ładunku zero. 


Te własności czynnika postaci świetnie zgadzają się 
z doświadczeniem. Na rys. 16 przedstawiony jest 
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Rys. 16. Wyniki pomiaru elastycznego elektrycznego czynnika 
postaci protonu dla różnych wartości q z 


zmierzony w doświadczeniu elastyczny czynnik po- elektryczny i 
staci protonu. Jest to tzw. czynnik postaci elektryczny, magnetyczny 
Proton, jak i wszystkie hadrony obdarzone spinem, czynnik 
ma bo.wiem również inny czynnik postaci — magne- postaci 
tyczny — o podobnych własnościach. Występowanie 
dodatkowych czynników postaci dla hadronów wiąże 
się z tym, że dla cząstek mających wewnętrzny mo¬ 
ment pędu (spin) ładunki wewnętrzne składające się 
na strukturę cząstki wykonują ruchy, które są przy¬ 
czyną powstawania prądów elektrycznych. Prądy te 
biorą udział w oddziaływaniach magnetycznych z po¬ 
ruszającym się elektronem i rozkład tych właśnie od¬ 
działywań wewnątrz hadronu odzwierciedlają magne¬ 
tyczne czynniki postaci. Hadrony obdarzone spinem 
są więc małymi magnesami o pewnym momencie 
magnetycznym, którego odpowiednią część (dążącą 
oczywiście znów do zera, gdy — q 2 -> oo) obserwuje 
w rozpraszaniu elektron. Zwróćmy przy okazji uwagę 
na fakt, że moment magnetyczny mają również lepto¬ 
ny (o spinie V 2 ), ale tylko naładowane. W wypadku 
leptonów moment magnetyczny nie wykazuje jednak 
struktury i odpowiedni czynnik postaci, jak i wszystkie 
czynniki postaci leptonów, wynosi jeden (albo zero 
dla neutrin) przy wszystkich wartościach q 2 . 












Rozpraszanie nieelastyczne elektronów 
na nukleonach 

Pomiar elastycznych czynników postaci nukleonów 
stał się najważniejszym argumentem na rzecz istnienia 
struktury wewnętrznej hadronów. Struktura ta po¬ 
wstaje poprzez oddziaływania silne, w których uczest¬ 
niczą hadrony i szczegółowa jej analiza, np. oblicze¬ 
nie funkcji F(q 2 ), jest bardzo złożona. Niewiele mo¬ 
żemy powiedzieć o oddziaływaniach, dla opisu któ¬ 
rych nie możemy stosować rachunku zaburzeń 
i diagramów Feynmana. Posługujemy się wtedy opi¬ 
sem półfenomenologicznym, wprowadzając nielokalne 
fenomenologiczne oddziaływanie poprzez wymianę 
np. wirtualnych mezonów n obdarzonych strukturą, 
czy też biegunów Reggego (-> Oddziaływania silne). 
Metody te, chociaż zaczerpnięte z lokalnej kwantowej 
teorii pola, nie noszą już tych cech ścisłości i jedno¬ 
znaczności przewidywań, które charakteryzują np. 
elektrodynamikę kwantową. Stąd elastyczne czynniki 
postaci hadronów możemy obliczyć posługując się jedy¬ 
nie pewnymi modelami. Lepiej przedstawia się sprawa 
z tzw. nieelastycznymi czynnikami postaci, których 
pomiar udowodnił, że struktura hadronów jest zbu¬ 
dowana z cząstek nie mających już struktury, a mia¬ 
nowicie z kwarków. 

nieelastyczne Nieelastyczne czynniki postaci wyznacza się bada- 
czynniki j ąc nieelastyczne rozpraszanie elektronów na hadro- 
postaci (nukleonach). Reakcja ta polega na rozbiciu 

struktury hadronu przez padający elektron. Wysłany 
z elektronu wirtualny foton zostaje pochłonięty przez 
hadron, w wyniku czego powstaje wiele dodatkowych 
hadronów, głównie mezonów (rys. 17). Wyobraźmy 
sobie teraz, że np. proton składa się z pewnej liczby 
składników obdarzonych ładunkami elektrycznymi Qi 
i że przez te właśnie składniki jest pochłaniany foton. 
Reakcja ma więc przebieg, jak na rys. 18. Rysunek 
ten jest jednak bardzo wyidealizowany. Czas oddziały¬ 
wania silnego między składnikami protonu jest bo¬ 
wiem zupełnie dowolny i w trakcie pochłaniania 
fotonu składniki mogą wielokrotnie oddziaływać 
między sobą zamazując całkowicie obserwowane 
zjawisko. Jeżeli jednak elektrony mają bardzo dużą 
energię, to z punktu widzenia elektronu proton 
porusza się z bardzo dużą prędkością, bliską pręd¬ 
kości światła. Zaczynają wtedy odgrywać rolę efekty 


relatywistyczne; między innymi wszelkie ruchy 
i zmiany wewnątrz protonu będą wydawały się na¬ 
szemu elektronowi bardzo powolne — czas ulega 
dylatacji. Jeżeli dodatkowo będziemy interesowali się 
jedynie rozproszeniami, w których q 1 jest duże, to 
czas trwania procesu pochłaniania fotonu będzie 
krótki. W takich właśnie kontrolowanych doświad- duże 
czalnie warunkach, w czasie pochłaniania fotonu energie, duże 
przez składnik protonu nie zachodzą prawie żadne q 2 
oddziaływania silne między składnikami i reakcja 
przebiega w idealny sposób przedstawiony poprzed¬ 
nio na rysunku. Oczywiście amplituda całego rozpra¬ 
szania jest sumą amplitud prawdopodobieństwa zajś¬ 
cia rozpraszania na każdym ze składników. Korzy¬ 
stając ze związku de Broglie’a między długością fali 
i pędem (A = h/p) można się przekonać, że dla du¬ 
żych ą 2 (a więc i dużych pędów fotonu) warunek spój¬ 
ności między poszczególnymi amplitudami zostaje 
silnie naruszony. Nie ma więc interferencji i całkowity 
przekrój czynny jest po prostu sumą przekrojów czyn¬ 
nych dla poszczególnych rozproszeń: 

da ri dat 

2j~dq*' 

i 

Znamy wzór na każdy ze składników tej sumy: 


da i 
dq 2 



F*{q 2 ) 9 


gdzie Qt — ładunek (w jednostkach ładunku elemen¬ 
tarnego), Fi(q z ) — elastyczny teraz czynnik postaci 
i-tego składnika protonu. Tak więc 



Zatem badając zależność całkowitego przekroju czyn¬ 
nego od q 2 możemy dowiedzieć się czegoś o struktu¬ 
rze samych składników. Wyniki takiego pomiaru 
zostały przedstawione na rys. 19. Widać wyraźnie, że 
w opisanych wyżej warunkach (duże energie, duże q 2 ) 
da f oc 2 

wyrażenie- /nie zależy od q 2 . Elastyczne czyn- 

dq % l q x 

niki postaci składników protonu (a także neutronu, 
bo i dla niego przeprowadzono pomiary) nie zależą 



Rys. 17. Rozbicie protonu zachodzące w wyniku pochłonięcia 
fotonu wirtualnego 



czas 

Rys. 18. Dwustopniowy charakter nieelastycznego rozpraszania 
elektronu na protonie. Najpierw foton wirtualny jest pochła¬ 
niany przez jeden ze składników protonu, a potem zachodzi od¬ 
działywanie wszystkich składników prowadzące do powstania 
pewnej liczby hadronów 



Rys. 19. Wyniki pomiaru przekroju czynnego reakcji nieelastycz¬ 
nego rozpraszania elektronów na protonach dla różnych war¬ 
tości ą 2 . Przedstawione dane odpowiadają różnym energiom 
elektronów większym od wartości 5 GeV 


więc od q 2 . Oznacza to, jak wiemy, że Fi{q 2 ) = 1. 
Składniki nukleonów nie mają więc struktury. 

Mogłoby się wydawać, że w tym samym doświad¬ 
czeniu mierzymy również sumę kwadratów ładunków 
składników, Z Ql gdyż wszystkie /%*) = 1. Tak 

jednak nie jest, bowiem w powyższym rozumowaniu 
zrobiliśmy pewne istotne uproszczenie. Nie uwzględ¬ 
niliśmy wcale faktu, że składniki mogą mieć wewnątrz 
protonu pewne niezerowe wartości pędu, podobnie 
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jak elektron wewnątrz atomu wodoru. Od rozkładu 
tych pędów zależy również całkowity przekrój czyn¬ 
ny. Oznaczając przez/i(> 2 ) prawdopodobieństwo tego, 
że wewnątrz protonu /-ty składnik naładowany (ten, 
z którym oddziałuje elektron) ma pęd p z (przy bardzo 
dużych prędkościach składnika względem elektronu 
istotna jest tylko jedna składowa pędu — w kierunku 
ruchu elektronu — oznaczyliśmy ją przez p z ), otrzy¬ 
mujemy poprawny już wzór na przekrój czynny: 


d°(a 2 >Pz) 
—-— 

dq 2 


4 i 


gdzie uwzględniliśmy doświadczalnie odkryty fakt 
braku struktury składników, Fi(q 2 ) = 1. Okazuje się, 
że nie tylko wartości energii i q 2 mogą być kontrolo¬ 
wane w doświadczeniu. Mierząc całkowitą energię 
(masę) hadronów powstałych z rozbicia protonu 
możemy wyznaczyć również wartość p z . Nie będziemy 
tego bardzo ważnego faktu bliżej dowodzić. W każ¬ 
dym razie możemy zsumować wyznaczone doświad¬ 
czalnie przekroje czynne odpowiadające reakcjom 
ze wszystkimi możliwymi wartościami p z . Przyjmując, 
że rozkład kwarków u(d) w protonie jest taki sam, jak 
kwarków d(u) w neutronie (—► Struktura cząstek ele¬ 
mentarnych), można obliczyć średni przekrój czynny 
rozpraszania elektronów na protonach i neutronach 
— otrzymuje się wówczas wyrażenie, w którym wystę¬ 
puje pewna średnia, niezależna od rodzaju składnika, 
funkcja rozkładu f(p z ). Oznaczając 


/= £f(Pz) 

Vz 

otrzymamy wtedy 

*«"(«*> <1 V 

gdzie stała / oznacza prawdopodobieństwo tego, że 
całkowity pęd protonu (z punktu widzenia elektronu) 
jest w całości niesiony przez jego naładowane skład¬ 
niki. 

Suma kwadratów ładunków składników nukleonów 
może zostać wyznaczona, jeżeli zrobimy założenie, 
że w oddziaływaniach słabych hadronów biorą udział 
dokładnie te same składniki, co w oddziaływaniach 
elektromagnetycznych. Możemy wtedy posłużyć się 
procesem nieelastycznego rozpraszania neutrin na 
jądrach atomowych, które są na tyle duże, że odpo¬ 
wiednie przekroje czynne mogą być zmierzone. Reak¬ 
cję v it J rN p~ Ą- hadrony badamy znów przy du¬ 
żych energiach neutrin i dla dużego q 2 (rys. 20). Ko¬ 



Rys. 20. Dwustopniowy charakter nieelastycznego rozpraszania 
neutrin mionowych na nukleonach. Najpierw zachodzi słaby pro¬ 
ces rozpraszania neutrina na jednym z kwarków (zasięg tego 
oddziaływania jest niemal równy zeru), a potem wszystkie kwarki 
oddziałują silnie w wyniku czego powstaje pewna liczba hadronów' 


rzystając z faktu, że stała sprzężenia oddziaływań 
słabych G (-* Oddziaływania słabe, badany obszar 
q z jest stale taki, że J q 2 \ mw, gdzie mw jest masą 
bozonu pośredniczącego w oddziaływaniach słabych) 
jest uniwersalna dla wszystkich cząstek biorących 
udział w tych oddziaływaniach, możemy wyprowadzić 
odpowiedni wzór na przekrój czynny: 


da yjv 

~Ę r 




G 2 f. 


Znając stałą G możemy z obu pomiarów wyelimino¬ 
wać nieznaną poprzednio stałą f Okazuje się, że 
/ 1, co świadczy o tym, że w nukleonach znajdują 
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się nie tylko składniki oddziałujące elektromagnetycz¬ 
nie i słabo. Możemy w ten sposób wyznaczyć jedynie 
sumę kwadratów ładunków uśrednioną po protonach 
i neutronach. Otrzymamy wynik 

4 Z Q\ = 0,27±0,03 

i 

doskonale zgadza się z hipotezą kwarków. Jeżeli bo¬ 
wiem właśnie kwarki są składnikami hadronów biorą¬ 
cymi udział w oddziaływaniach elektromagnetycznych 
i słabych, to w protonie znajdują się dwa kwarki 
o ładunku 2 / 3 i jeden o ładunku —V 3 (-» Struktura 
cząstek elementarnych), a w neutronie na odwrót. 
Mamy zatem 



W ten sposób wyniki eksperymentów nieelastycznego dowód ist- 
rozpraszania elektronów (i neutrin) na nukleonach nienia kwar- 
dowiodły, że składnikami hadronów są kwarki poz- ków 
bawione struktury wewnętrznej. 

Można 23 dać pytanie, skąd w takim składnikowym 
modelu bierze się obserwowana silna zależność od 
q z elastycznego czynnika postaci samych hadronów. 

Pochodzi ona stąd, że przy dużych q 2 kwark, który po¬ 
chłonął foton, nabiera dużego pędu względem pozo¬ 
stałych kwarków i zostaje silnie wybity z całej struk¬ 
tury. Niechętnie więc zlepia się z resztą kwarków 
w wyjściowy hadron. Im większe q 2 , tym mniejsze 
prawdopodobieństwo utworzenia na końcu stanu po¬ 
jedynczego hadronu. Dlatego właśnie prawdopodo¬ 
bieństwo (przekrój czynny) zajścia reakcji elastycznej 
silnie maleje ze wzrostem q 2 . Dlatego też w opisanych 
wyżej doświadczeniach badano nie tylko reakcje nie¬ 
elastyczne, ale dodatkowo nie nakładano żadnych 
ograniczeń doświadczalnych na rodzaj nieelastycz- 
ności. Badano więc np. rozpraszanie elektronów na 
protonach nie interesując się zupełnie, ile i jakie ha¬ 
drony powstały w procesie. Wtedy i tylko wtedy eli¬ 
minujemy z opisu wpływ oddziaływania kwarków po 
rozproszeniu, które to oddziaływanie prowadzi do 
powstania końcowego stanu wielohadronowego. 


Anihilacja pary elektron-pozyton 
na hadrony 

Reakcja c + c~ -> hadrony zachodzi, podobnie jak 
opisana poprzednio reakcja e + e~ -* p + jlT, przez ani- 
hilację pary na foton z q 2 > 0 i następnie kreację 
z tego fotonu różnych hadronów, głównie mezonów. 
Dla dużych wartości q 2 (w tej reakcji q 2 w układzie 
środka masy e + e~ równa się kwadratowi całkowitej 
energii pary) czas oddziaływania jest znów niewielki 
i kreacja hadronów zachodzi zapewne przez kreację 
wszystkich możliwych par składników (kwarków) 
i dopiero potem oddziaływanie tych par prowadzące 
do powstania różnych stanów wielohadronowych. 
W tym wypadku jednak argumenty nie są tak ścisłe 
jak w wypadku reakcji nieelastycznego rozpraszania 
elektronów, gdyż nie mamy żadnej metody na kon¬ 
trolowanie doświadczalne czasu trwania oddziaływań 



Rys. 21. Proces anihilacji pary elektron-pozyton ma przy odpo¬ 
wiednio wysokich energiach pary przebieg w pewnym przybli¬ 
żeniu dwustopniowy. Najpierw foton wirtualny kreuje lokalnie 
jedną z par kwarków bez struktury, a potem para ta oddziałuje 
silnie przechodząc w pewną liczbę hadronów 

























wewnątrzhadronowych i czas ten w zasadzie jest zu¬ 
pełnie dowolny. Jeżeli jednak wyprodukowana para 
składników ma dużą energię, to rozlatują się one bar¬ 
dzo szybko i prawdopodobnie oddziaływanie przebie¬ 
ga przez dwa kolejne stadia, jak na rys. 21. Jeżeli więc 
nie interesujemy się, jakie i ile hadronów powstało 
z wyprodukowanych par, oraz jeżeli ]/ q 2 jest dużo 
większe od wszystkich dostępnych energetycznie pro¬ 
gów produkcji tych par, to całkowity przekrój czynny 
dany jest wzorem analogicznym do wzoru na przekrój 
czynny reakcji e + e~ 


stosunek R 



hadrony) ~ ^ Q \, 


gdzie sumowanie przebiega po ładunkach wszystkich 
możliwych par składników hadronów. Przy pisaniu 
tego wzoru zrobiliśmy założenie, że składniki hadro¬ 
nów nie mają struktury, Fi{q 2 ) = 1, co tutaj znów 
zostało potwierdzone doświadczalnie w bardzo du¬ 
żym przedziale wartości q 2 . Odpowiedni przekrój 
czynny został zmierzony przy użyciu akceleratorów 
ze zderzającymi się przeciwbieżnymi wiązkami elek¬ 
tronów i pozytonów. Dzieląc ten. przekrój czynny 
przez odpowiedni przekrój czynny na produkcję pary 
fi + tr(ctiJg*) otrzymujemy tzw. stosunek R , którego 


chowanie się stosunku R, a mianowicie jego wartość 
R x 2 poniżej progu produkcji kwarków powabnych 
i R » 4 powyżej tego progu jest zgodne z przewidy¬ 
waniami modelu kwarków. Należy tylko pamiętać, 
że każdy rodzaj kwarku ma trzy odmiany (tzw. 
kolory), które nie różnią się między sobą masami ani 
ładunkami elektrycznymi. W hadronach znajduje się 
zawsze określona kombinacja tych odmian i np. pro¬ 
ton składa się zawsze z trzech kwarków: dwóch kwar¬ 
ków jednego rodzaju (ładunek 2 /a) i jednego kwarku 
innego rodzaju (ładunek — :1 / 3 ), z których każdy jest 
innej odmiany (koloru). Całkowita liczba wszystkich 
możliwych kwarków zwiększa się w ten sposób trzy¬ 
krotnie. Poniżej progu produkcji kwarków powab¬ 
nych mamy więc 

zaś powyżej progu 

w dość dobrej zgodności z danymi doświadczalnymi. 

Warto jeszcze zwrócić uwagę na ostre maksima 
pojawiające się w stosunku R w obszarach nieregu- 



Rys. 22. Wyniki pomiaru stosunku R całkowitego przekroju czynnego anihilacji par elektron-pozyton na hadrony do przekroju czynnego 
przejścia tych par na pary mionów pr pL* dla różnych wartości q*. W rogu zamieszczono dane z obszaru powyżej 9 GeV/c* nie unormo¬ 
wane do przekroju czynnego na produkcję mionów 


wartości doświadczalne przedstawiono na rys. 22. 
Teoretycznie (choć jedynie w przybliżeniu) stosunek 
R jest oczywiście dany przez sumę kwadratów ładun¬ 
ków wszystkich możliwych składników wszelkich 
hadronów: 

i 

Z rysunku widać, że po początkowych nieregularnoś- 
ciach występujących w obszarze wartości q 2 bliskich 
progom produkcji trzech najlżejszych par kwark-anty- 
kwark o ładunku 2 /a, — Vs i — l U (r+ Struktura cząstek 
elementarnych) stosunek R ustala się — przyjmuje 
wartość R js 2 — po czym znowu przy progu pro¬ 
dukcji pary kwarków powabnych o ładunku 2 U wy- 
stępują nieregularności. Dla jeszcze większych war¬ 
tości q 2 stosunek R ustala się na poziomie R a 5, 
po czym jeszcze raz, przy kolejnym progu produkcji 
jeszcze jednej, piątej pary kwarków, pojawiają się 
nieregularności. W okolicach progu produkcji kwar¬ 
ków powabnych pojawia się również kreacja pary 
ciężkich leptonów z (-* Oddziaływania słabe), które 
nie zostały wydzielone z danych doświadczalnych. 
Powyżej tego progu proces produkcji ciężkich lepto¬ 
nów (o ładunku jeden) daje do stosunku R wkład rów¬ 
ny jedności i jedynie R x 4 powinno pochodzić 
z wkładu od kreacji par kwarkowych. Powyższe za- 


larności. Są one wynikiem produkcji krótkożyjących 
stanów hadronowych, tzw. rezonansów, które szybko 
rozpadają się na hadrony. 


Inne oddziaływania hadronów z fotonami 

Przedstawimy teraz krótko niektóre inne, mniej waż¬ 
ne reakcje elektromagnetyczne hadronów. Ich analiza 
jest oparta na znajomości kwarkowego składu hadro¬ 
nów. Dla dalszych rozważań będzie tylko istotna in¬ 
formacja, że wszystkie bariony składają się z trzech 
kwarków, natomiast mezony z pary kwark-antykwark. 
Wysłanie fotonu wirtualnego z kwarku nie prowadzi 
do jakiejkolwiek jego zmiany, podobnie jak dla 
wszystkich cząstek pozbawionych struktury. Stąd 
w oddziaływaniach elektromagnetycznych hadronów 
jest zachowana trzecia składowa izospinu / 3 , hiper- 
ładunek Y (lub dziwność S) oraz powab C. Wartości 
bowiem tych liczb kwantowych służą w modelu kwar¬ 
ków jedynie do ponumerowania różnych rodzajów 
kwarków. Również odmiana kwarku (kolor) nie 
zmienia się przy wysyłaniu fotonu. Wszystkie te 
prawa zachowania zostały sprawdzone w wielu do¬ 
świadczeniach. Nie ma jednak żadnego powodu, by 
w oddziaływaniach elektromagnetycznych zachowy- 


liczby kwan¬ 
towe zacho¬ 
wywane 


153 


















rozpraszanie 
fotonów na 
hadronach 



Rys. 23. Anihilacja 
wirtualnej pary 
kwark-antykwark 
na foton rzeczywi¬ 
sty 


model 

dominacji 

wektorowej 


rozpady 

elektromag¬ 

netyczne 

hadronów 


wał się izospin całkowity hadronów. I rzeczywiście 
nie jest. 

Oddziaływania elektromagnetyczne hadronów dzie¬ 
lą się na reakcje rozpraszania fotonów oraz rozpady 
cząstek. Typowymi reakcjami rozpraszania są procesy 
fotoprodukcji (np. y+p n+p) oraz rozpraszania 
komptonowskiego (np. y+p -> y+p). Końcowe stany 
hadronowe mogą być i często są wielocząstkowe 
(np. y+p -> 2 n+p). Procesy rozpraszania fotonów 
zachodzą przez kreację (lub anihilację) par kwark- 
antykwark przez foton rzeczywisty (rys. 23). Pary te 
uczestniczą dalej w oddziaływaniach silnych z ha¬ 
dronem bombardowanym. Powstała z fotonu (lub 
przechodząca w foton) wirtualna para kwark-anty¬ 
kwark ma liczby kwantowe mezonu, i to mezonu 
o spinie jeden — równym spinowi fotonu, gdyż obo¬ 
wiązuje zasada zachowania momentu pędu. Stąd 
np. reakcja fotoprodukcji (rys. 24) zachodzi w ten 



Rys. 24. Proces fotoprodukcji hadronów na hadronach zachodzi 
za pomocą pośrednictwa pewnego wirtualnego mezonu wekto¬ 
rowego, w który przechodzi padający foton rzeczywisty 


sposób, że foton przechodzi w jeden z mezonów wek¬ 
torowych o spinie 1 (q, cd, <p ,...), po czym mezony te 
rozpraszają się na hadronie bombardowanym. Takie 
pośredniczące działanie mezonów wektorowych na¬ 
zwano modelem dominacji wektorowej. Model ten 
może być również stosowany w przypadku elastycz¬ 
nego pochłaniania fotonu przez składniki hadronu 
(dostarczając dość dobrej parametryzacj i elastycznego 
czynnika postaci). Oczywiście proces rozpraszania 
mezonów wektorowych na hadronach bombardowa¬ 
nych należy do zjawisk wywoływanych oddziaływa¬ 
niami silnymi i jako taki może być opisany jedynie 
półfenomenologicznie (-* Oddziaływania silne). 
Typowymi rozpadami elektromagnetycznymi hadro¬ 
nów są rozpady mezonu 7t°(7i° -* 2 y) oraz hipero¬ 
nu Z* 0 (27° A + y). Pierwszy z nich to anihilacja me¬ 

zonowej pary kwark-antykwark na dwa fotony, a dru¬ 
gi to promieniowanie hamowania kwarku hiperono- 
wego zachodzące w polu oddziaływania z innymi 
kwarkami (hiperony 27° i A mają ten sam skład kwar¬ 
kowy). Oba te procesy zostały przedstawione na 



Rys. 25. Rozpad mezonu n °zachodzi poprzez anihilację mezono¬ 
we jpary kwarków na dwa fotony rzeczywiste 



Rys. 26. Rozpad hiperonu zachodzi poprzez promieniowanie 
hamowania jednego z kwarków znajdującego się w polu oddzia¬ 
ływań silnych kwarków pozostałych. Rozpad ten jest możliwy 
tylko dlatego, że hiperony 2T° i A składają się z takich samych 
trzech kwarków, choć stany kwantowe kwarków są różne w obu 
przypadkach 
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rys. 25 i 26. Jak mówiliśmy, prawdopodobieństwo 
zajścia pierwszej z tych reakcji jest rzędu a*,, zaś 
drugiej rzędu a e i- W tym drugim jednak przypadku, 
podobnie jak dla rozpadu p neutronu (-► Oddziały¬ 
wania słabe), prawdopodobieństwo rozpadu jest silnie 
stłumione, gdyż różnica mas hiperonów 27° i A jest 
niewielka. W rezultacie czasy życia zarówno mezonu 
7i°, jak i hiperonu 27° są zbliżone i wynoszą ok. 10~ 16 - czas życia 
10~ 17 s. Zauważmy, że czas życia cząstki jest odwrotnie a stała 
proporcjonalny do prawdopodobieństwa jej rozpadu, sprzężenia 
Im więc większa stała sprzężenia oddziaływania wy¬ 
wołującego rozpad, tym krótszy czas życia. 

Można by spytać, dlaczego cząstki tt° i 27° nie roz¬ 
padają się przede wszystkim za pomocą oddziaływań 
silnych, skoro odpowiednie prawdopodobieństwo 
rozpadu powinno być większe, a czas życia krótszy. 

Brak rozpadów silnych w tym wypadku bierze się 
stąd, że nie istnieją odpowiednie cząstki lżejsze od n° 
i 27°, na które oba te hadrony mogłyby się rozpadać 
bez pogwałcenia wszystkich obowiązujących w oddzia¬ 
ływaniach silnych praw zachowania (/, / 8 , Y itd.). 

W przypadku innych hadronów, np. rezonansów, 
obserwujemy także rozpady elektromagnetyczne 
(np. q -> n+y), ale mają one jedynie znaczenie mar¬ 
ginesowe i nie decydują o czasie życia. Natomiast 
wyłącznie elektromagnetycznego pochodzenia są 
rozpady mezonu r) zachodzące czasem z udziałem je¬ 
dynie fotonów wirtualnych (np. rj 37r, rys. 27). 



Rys. 27. Elektromagnetyczny rozpad mezonu tj. Rozpad silny 
jest wzbroniony przez zasadę zachowania całkowitego izospinu. 
Wymiana fotonu wirtualnego między pewną parą kwarków zmie¬ 
nia izospin całkowity umożliwiając zachodzenie reakcji 


Przedstawiliśmy już wszystkie zasadnicze własności 
oddziaływań elektromagnetycznych cząstek elemen¬ 
tarnych, a także schemat teoretyczny pozwalający 
w sposób jednoznaczny i ścisły analizować, opisywać 
i przewidywać te własności. Elektrodynamika kwan¬ 
towa jest teorią tak elegancką, a jej przewidywania 
tak świetnie zgadzają się z doświadczeniem (np. po¬ 
miar momentu magnetycznego elektronu daje wy¬ 
nik 1,0011596577± 0,0000000035e#/2m e , a wartość moment 
teoretyczna wynosi 1,0011596554± 0,0000000033 X magnetyczny 
x ehjlnie ; podobna zgodność zachodzi dla mionu pr\ elektronu 
że na wzór tej teorii buduje się ostatnio modele 
wszystkich rodzajów oddziaływań. W ten sposób po¬ 
wstała teoria kwarkowo-gluonowa oddziaływań sil¬ 
nych (-► Struktura cząstek elementarnych) oraz jed¬ 
nolita teoria oddziaływań elektromagnetycznych 
i słabych (-► Oddziaływania słabe). Należy jednak 
zaznaczyć, że współczesna struktura elektrodynamiki 
kwantowej nie może być uważana za ostateczną. 

Teoria ta bowiem zawiera pewne luki formalne. Jedną 
z nich jest zasadnicza niemożność obliczenia mas 
podstawowych cząstek, np. leptonów. Wiąże się to 
z faktem, że np. elektron w swym ruchu swobodnym 



Rys. 28. Reabsorpcja fotonu wirtualnego przez elektron. Pęd k 
i energia co fotonu są dowolne i należy wykonać sumowanie 
(całkowanie) po wszystkich wartościach tych zmiennych 
























może wysyłać i reabsorbować fotony wirtualne /rys. 
28). Odpowiedni diagram Feynmana wydaje się mały 
(rzędu a e i), ale obliczenie jego wkładu wymaga wy¬ 
konania sumowania (całkowania) po wszystkich po¬ 
działach pędu padającego elektronu na pędy pośred¬ 
niego elektronu wirtualnego i również wirtualnego 
fotonu. Suma okazuje się nieskończona (rozbieżna). 
Logiczną zwartość teorii można wprawdzie uratować 
za pomocą pewnego dobrze określonego przepisu 


(zwanego procedurą renormalizacji), ale pojawiają się 
wtedy dodatkowe dowolne parametry. W ten sposób 
np. masa elektronu okazuje się dowolna. Choć więc 
wydawałoby się, że istnieje bardzo dobra teoria, wciąż 
pewne ciemne jej obszary nie pozwalają fizykom na 
bezczynność. 

G. Białkowski, R. Sosnowski Cząstki elementarne , War¬ 
szawa 1971; W.B. Bierestecki, E.M. Lbfszic, L.P. Pitajewski 
Relatywistyczna teoria kwantów , cz. I, Warszawa 1972; L.N. 
Cooper Istota i struktura fizyki , Warszawa 1975. 


Oddziaływania słabe 

Andrzej Szymacha 


Oddziaływania słabe na tle innych 
oddziaływań 

Oddziaływania słabe są jednym z trzech typów od¬ 
działywań mających znaczenie w fizyce cząstek ele¬ 
mentarnych (-* Cząstki elementarne i ich oddziały¬ 
wania). W zbadanym dotychczas zakresie energii 
cząstek są one najsłabsze. Silniejsze od nich są oddzia¬ 
ływania elektromagnetyczne oraz jądrowe zwane też 
oddziaływaniami silnymi. 

oddziaływa- W mechanice klasycznej termin „oddziaływanie” 
nie w teorii był synonimem siły działającej między rozpatrywany- 
klasycznej mi ciałami. Ujęcie klasyczne zawodzi jednak w za- 
i kwantowej stosowaniu do mikroobiektów, szczególnie przy 
opisie zjawisk zachodzących z udziałem niewielkiej 
liczby cząstek elementarnych. W tym wypadku 
poprawny opis teoretyczny musi być sformułowany 
za pomocą pojęć stosowanych w teorii kwantowej 
i to w dodatku w najbardziej zaawansowanej jej 
wersji — kwantowej teorii pola. W teorii tej potocz¬ 
nemu pojęciu oddziaływania odpowiada hamiltonian 
oddziaływania, którego znajomość pozwala (przy¬ 
najmniej w zasadzie — praktycznie jest to często 
bardzo trudne) obliczać (przepowiadać) wyniki 
najrozmaitszych doświadczeń przeprowadzanych z 
udziałem cząstek elementarnych. Kwantowa teoria 
pola nie daje się jednak wyłożyć w sposób krótki 
i prosty. Z drugiej zaś strony oddziaływania słabe — 
w przeciwieństwie do elektromagnetycznych — są 
niezwykle krótkozasięgowe i nie mają żadnego 
odpowiednika w makroświecie. Dlatego opisując je, 
będziemy przedstawiać konkretne skutki tego od¬ 
działywania, które są znacznie prostsze i pojęciowo 
uchwytniejsze od abstrakcyjnego hamiltonianu od¬ 
działywania. 

skutki od- W kręgu zjawisk z udziałem niewielkiej liczby 
dzśaływań cząstek elementarnych wszelkie oddziaływania mogą 
się przejawiać w postaci następujących skutków: 

a) Wpływu na statyczne parametry cząstek ele¬ 
mentarnych i na powstawanie układów związanych. 
Należą tu takie własności jak: masa cząstek ele¬ 
mentarnych, moment magnetyczny, energia wiązania 
jądra itp. 

b) Rozpadów cząstek nietrwałych i układów nie¬ 
trwałych charakteryzowanych liczbowo przez czas 
rozpadu (dokładniej średni czas rozpadu bądź 
czas połowicznego zaniku) i prawdopodobieństwa 
rozpadów danego obiektu na różne możliwe pro¬ 
dukty końcowe. 

c) Zachodzenia procesów rozpraszania elastycznego 
lub nieelastycznego. Pierwszym doświadczeniem 
tego rodzaju było doświadczenie E. Rutherforda 
uwieńczone odkryciem jądra atomowego. Wszystkie 
akceleratory buduje się właśnie po to, by zderzać 
jedne cząstki z drugimi. Poza tym, zderzenie wysoko¬ 
energetycznych cząstek jest jedynym sposobem 
wytwarzania wszelkich nietrwałych cząstek, których 
rozpady następnie się bada. 

Rola oddziaływań słabych nie jest jednakowo waż¬ 
na we wszystkich wyżej wymienionych punktach. 
Są one za słabe, by mogły prowadzić do utworzenia 


układu związanego. Wszystkie znane układy złożone 
są utrzymywane bądź przez oddziaływania silne 
(jądra atomowe), bądź przez elektromagnetyczne 
(molekuły, atomy, atomy egzotyczne). Wpływ od¬ 
działywań słabych na własności układów złożonych 
(których istnienie jest uwarunkowane silniejszymi 
oddziaływaniami) jest znikomo mały. Jedynie w nie¬ 
licznych przypadkach daje się go zaobserwować 
przez efekty niezachowania parzystości w stanach 
wzbudzonych jąder. Interpretacja tych efektów za¬ 
leży jednak silnie od bardzo złożonych efektów 
jądrowych i dlatego w ten sposób nie udało się uzyskać 
niemal żadnych informacji o oddziaływaniach sła¬ 
bych. W ostatnim czasie wielkie zainteresowanie 
wzbudzają doświadczenia, w których podobnego 
efektu poszukuje się w zjawisku przejść optycznych 
w gazach jednoatomowych (wodór atomowy, pary 
metali ciężkich). Praktycznie efekt taki powinien 
przejawiać się jako aktywność optyczna niektórych 
gazów jednoatomowych bądź jako szczątkowa polary¬ 
zacja kołowa światła wysyłanego przez rozgrzane gazy. 

Żaden z tych efektów nie wystąpiłby, gdyby między 
elektronami i jądrem atomowym działały tylko zwykłe 
siły elektromagnetyczne. W związku, z postępem 
techniki laserowej i elektroniki osiągnięto już do¬ 
kładność rzędu spodziewanego efektu. W niedalekiej 
przyszłości będzie to zapewne bardzo cenna metoda 
badania oddziaływań słabych. 

Procesy rozproszeniowe wywołane oddziaływa¬ 
niami słabymi są również trudne do obserwacji. 

Wyjątkiem są procesy rozpraszania neutrin. Są one rozpraszani® 
wprawdzie niesłychanie mało prawdopodobne, wy- neutrin 
magające zatem olbrzymich detektorów, dużych na¬ 
tężeń wiązki neutrin i długiego czasu obserwacji, ale 
ich wielką zaletą jest niewystępowanie „tła” procesów 
wywołanych innymi oddziaływaniami. Neutrina są 
jedynymi znanymi cząstkami elementarnymi nie 
uczestniczącymi ani w oddziaływaniach silnych, ani 
elektromagnetycznych. Przejawia się to w ich ogrom¬ 
nej przenikliwości przez materię. Neutrino ma realną 
szansę przejścia nawet na wskroś gwiazdy bez żadnego 
aktu oddziaływania, a więc bez zmiany swej energii 
i kierunku lotu! (-> Reakcje jądrowe w gwiazdach). 
Prawdopodobieństwo tego, że elektron wejdzie w sła¬ 
be oddziaływanie z materią, przez którą przelatuje, 
jest tego samego rzędu wielkości co dla neutrina, ale 
nie sposób wyłowić tych rzadkich przypadków z 
ogromnej liczby innych procesów wywołanych od¬ 
działywaniami elektromagnetycznymi elektronów z 
materią (kreacja par, promieniowanie hamowania, 
rozbijanie jąder i inne). 

Najwięcej informacji o oddziaływaniach słabych rozpady 
uzyskano obserwując rozpady cząstek elementarnych słabe 
(i jąder atomowych). Ponieważ badanie reakcji neu- 
trinowych stało się technicznie możliwe stosunkowo 
późno, oddziaływania słabe przez wiele lat utożsa¬ 
miano właściwie z rozpadami słabymi, zwanymi też 
rozpadami powolnymi. Łatwo zrozumieć, dlaczego 
obserwacja słabych rozpadów nie nastręcza większych 
trudności. Otóż, jeśli jakaś cząstka może sie rozpaść 
jedynie wskutek oddziaływań słabych, to niezależnie 
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od ich słabości proces taki wcześniej czy później 
musi nastąpić. Prawdopodobieństwo tego zdarzenia 
wynosi dokładnie 1, podczas gdy prawdopodobień¬ 
stwo zajścia reakcji rozpraszania przy przechodzeniu 
neutrina przez określoną warstwę substancji może 
wynosić np. 10 —30 ! Ewentualna słabość odddziaływa- 
nia wywołującego rozpad przejawi się jedynie w dłu¬ 
gości czasu życia rozpadającego się obiektu. Intuicyj¬ 
nie powinno być zrozumiałe, że im słabsze oddziały¬ 
wanie, tym dłużej trzeba taką cząstkę obserwować 
zanim się ona rozpadnie, czyli tym dłuższy będzie jej 
czas życia. 

Typowe czasy życia cząstek elementarnych rozpa¬ 
dających się wskutek oddziaływań słabych wynoszą 
ok. 10" 10 s lub więcej. Czy to dużo czy mało? Odpo¬ 
wiedź będzie oczywiście zależeć od tego, z czym ten 
czas porównujemy. 

Jest ogólną regułą w fizyce, że o wielkości miano¬ 
wanej nie można powiedzieć czy jest duża, czy mała 
w oderwaniu od innych okoliczności. Małe lub duże 
mogą być tylko wielkości niemianowane, a więc np. 
stosunki dwóch wielkości o tym samym wymiarze, 
charakterys- w kręgu spokrewnionych zjawisk występują zawsze 
tyczne pewne charakterystyczne wielkości wymiarowe. Na 
wielkości przykład, w teorii względności charakterystyczną 
wymiarowe prędkością jest prędkość światła c , w fizyce atomowej 
charakterystyczną wielkością o wymiarze momentu 
pędu — stała Plancka, a także charakterystyczną 
jednostką energii — energia jonizacji atomu wodoru 
itd. Mówiąc, że jakaś wielkość jest bardzo mała 
(bądź bardzo duża) mamy zawsze na myśli jej stosu¬ 
nek do charakterystycznej dla danego kręgu zjawisk 
wielkości o tym samym wymiarze. Musimy zatem 
ustalić charakterystyczne wielkości o różnych wymia¬ 
rach (w tym także czasu) mające znaczenie dla od¬ 
działywań cząstek elementarnych o wysokich ener¬ 
giach. Niewątpliwie charakterystyczną prędkością 
jest c, a charakterystyczną długością — średnica 
cząstki elementarnej. Charakterystycznym momen¬ 
tem pędu jest oczywiście h. Z tych trzech wielkości 
można już utworzyć wszystkie inne mechaniczne 
wielkości o różnych wymiarach. Kłopot polega jedy¬ 
nie na tym, że w przeciwieństwie do stałych h i c, 
które mają uniwersalny sens nie związany z tą czy 
inną cząstką, „średnica cząstki” nie jest dobrze okreś¬ 
lona, choćby dlatego, że istnieją różne cząstki i nie ma 
powodu, by któraś z nich była najważniejsza. Jed¬ 
nakże, nie popełnimy wielkiego błędu, jeśli przyjmie¬ 
my wartość charakterystycznej długości równą 10~ 13 
cm. Teraz można stwierdzić, że czas charakterys¬ 
tyczny dla cząstek elementarnych ma wielkość 10“ 13 
cm/c « 3 lO -24 s. Wielkością tego rzędu są również 
niektóre czasy życia cząstek rozpadających się wskutek 
oddziaływań silnych. Gdyby ten czas przyjąć za jed¬ 
nostkę, to typowy czas życia cząstek rozpadających 
się wskutek oddziaływań słabych równy 1Ó“ 10 s 
byłby w tych jednostkach rzędu 3 TO 13 . Jest to liczba 
powolność ogromna i dlatego rozpady słabe można nazwać 
rozpadów rozpadami powolnymi. Przypomnijmy, że typowe 
słabych czasy życia cząstek rozpadających się silnie zawierają 
się z grubsza biorąc w zakresie 10“ 24 -10“ 21 s, a roz¬ 
padających się elektromagnetycznie — w zakresie 
10“ 19 -10“ 16 s. . 

Liczby te nie tylko pokazują różnicę między po¬ 
szczególnymi rodzajami oddziaływań, ale mogą być 
podstawą określenia oddziaływań słabych. Właśnie 
owa powolność procesu jest jedyną elementarną i za¬ 
razem bezpośrednio widoczną cechą charakterystycz¬ 
ną oddziaływań słabych. Są też i inne cechy, bardziej 
fundamentalne, ale zarazem bardziej abstrakcyjne. 
Jednej z nich (łamaniu symetrii zwierciadlanej) 
poświęcimy dalej nieco uwagi. 


Rozpady 0 neutronu i jąder atomowych 

Pierwszym rozpadem słabym obserwowanym wiele 
lat przed pojawieniem się pojęcia oddziaływań 
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słabych był rozpad 0 jąder atomowych (-> Rozpady rozpad 
jąder atomowych). Istnieją rozpady 0+ i 0~. Najprost- neutronu 
szym jądrem ulegającym rozpadowi 0~ jest swobodny 
neutron. Jest zupełnie naturalne wyobrazić sobie, 
że rozpad 0- jakiegoś bardziej złożonego jądra za¬ 
chodzi w wyniku rozpadu jednego z neutronów 
wchodzących w skład jądra. Jak wiadomo, swobodny 
neutron rozpada się (lepiej by było mówić: samorzut¬ 
nie się przekształca — słowo rozpad, przyjęte ze 
względów historycznych, sugeruje, że neutron jest 
zbudowany z cząstek będących produktami jego 
rozpadu, a to jest nieprawda) na proton, elektron 
i antyneutrino elektronowe. Reakcję tę zapisujemy 
w sposób następujący: 

n ~->p+e+v e -\-Q Q , (1) 

gdzie Q 0 — energia kinetyczna cząstek końcowych 
(produktów rozpad"). Zgodnie ze słynnym wzorem 
Einsteina, energia ta dana jest wzorem 

0o = ( nj n —nip—me)c 2 . (2) 

Wielkości m n , m p i m e oznaczają masy spoczynkowe 
odpowiednich cząstek. Pominęliśmy masę neutrina, 
gdyż zgodnie z doświadczeniem jest ona w granicy 
dokładności pomiaru równa zeru. 

Kiedy neutron rozpada się wewnątrz jądra, to rozpad 
wytworzony proton zajmuje jego miejsce w jądrze, jądra 
co można zapisać tak: 

z+iX+ e +Ve+Q(A, Z), 

gdzie A Z X —jądro promieniotwórcze złożone z Z 
protonów i A—Z neutronów. 

Energia wyzwolona w tym procesie wynosi 

Q(A, Z) = (m z -m z+1 -m e )c 2 , (3) 

gdzie m z i /w z+1 ~- masy jąder A X i z A x X. Ale różnica 

mas jąder nie jest bynajmniej równa różnicy mas 
spoczynkowych ich składników. W rzeczywistości 

m 7 = Zm,+(A-Z)m„- — ^ , (4) 

gdzie B — energia wiązania jądra. Energia wiązania 
uwarunkowana jest oddziaływaniami silnymi i elektro-., 
magnetycznymi nukleonów w jądrze i zależy od A i Z 
w sposób bardzo złożony. Korzystając z wzorów 
(2-4) mamy 

Q(A, Z) = Q 0 +B(A, Z+\)-B(A, Z). 

Ze względu na złożony charakter zależności B(A, Z) 
wielkość Q(A, Z) może być zarówno większa od 0 O , jak 
też znacznie mniejsza. Najważniejsze jest to, że dla 
wielu wartości A i Z wielkość Q(A, Z) jest po prostu 
ujemna i że jądro takie jest trwałe ze względu na 
rozpad 0~. Gdyby było inaczej, to poza wodorem nie 
istniałyby we Wszechświecie żadne inne pierwiastki 
trwałe. 

W procesie rozpadu jest zachowana nie tylko ener- zasady za- 
gia ale i pęd. Gdy w stanie końcowym po rozpadzie chowania w 
mamy tylko dwa ciała o określonych masach (spo- rozpadzie/? 
czynkowych), to łatwo sprawdzić, że dwa prawa 
zachowania wyznaczają jednoznacznie sposób po¬ 
działu energii 0 między produkty rozpadu. Rozpad 
0 jest jednak rozpadem z trzema cząstkami w stanie 
końcowym. Uwzględnienie trzeciego ciała nie zwięk¬ 
sza liczby równań, wyrażąjących prawa zachowania, 
a jedynie liczbę niewiadomych (energia i pęd trzeciej 
cząstki, a ponadto rozmaite kąty między kierunkami 
lotu). Dlatego właśnie prawo zachowania energii 
i pędu nie wyznacza jednoznacznie sposobu podziału 
energii 0 między cząstki końcowe. Istnieje nieskoń¬ 
czenie wiele możliwości zgodnych z prawami zacho¬ 
wania i przyroda w każdym akcie rozpadu wybiera 
w sposób statystyczny ów sposób rozdziału. Specy¬ 
fika rozpadu 0 polega na tym, że jeden z produktów, 
neutrino, jest cząstką niezwykle przenikliwą, a zatem 




widmo fi 


umykającą obserwacji. W praktyce możemy obser¬ 
wować i mierzyć jedynie energię elektronu i jądra 
końcowego (bardzo zresztą małą w porównaniu 
z energią elektronu). Suma tych dwóch energii 
jest w każdym akcie rozpadu inna i na ogół mniejsza 
od wartości Q wyznaczonej z wzoru Einsteina 
(w skrajnym wypadku może być równa). Ponieważ 
pomijamy w praktyce znikomo małą energię jądra 
końcowego, więc energia elektronów powstających 
w wielu aktach rozpadu jest rozrzucona w sposób 
statystyczny od zera do wartości niemal równej Q , 
co oznacza, że elektrony z rozpadu fi mają widmo 
ciągłe (rys. 1 i 2). Kształt tego widma był i jest przed¬ 
miotem analizy teoretycznej i pomiarów doświad¬ 
czalnych, gdyż można z niego wiele odczytać. Na 
przykład jasne jest, że gdyby masa spoczynkowa 
neutrina była większa od zera, to maksymalna energia 
elektronów (kraniec widma) powinna być mniejsza 
od obliczonej z wzoru (2). Przy założeniu, że neutrino 
istnieje i jest emitowane w procesie rozpadu fi, 
ciągłe widmo energii elektronów nie jest niczym 



a) 



energia £ 10 2 keV 


Rys. 1. Typowe widma fi. Na osi odciętych odłożona jest energia 
kinetyczna elektronu E w keV, na osi rzędnych względna liczba 
elektronów w jednostkowym przedziale energii N(E ) = ANjAE 



Rys. 2. Porównanie widma fi rozpadu trytu z przewidywaniami 
teoretycznymi przy różnych założonych wartościach masy neu¬ 
trina. Najlepszą zgodność uzyskuje się przy m v = 0. E energia 
kinetyczna elektronu, W całkowita energia elektronu (E-f mc 2 ), 
p pęd elektronu, JF(Z, W) znany czynnik uwzględniający. m.in. 
wpływ elektrostatycznego przyciągania jądra końcowego i elek¬ 
tronu fi na kształt widma 


zagadkowym. Jednakże w czasie, gdy odkryto widmo 
ciągłe w rozpadzie fi nikt nawet nie podejrzewał 
istnienia neutrina. Przy założeniu zaś, że jądro rozpada 
się tylko na dwa ciała, widmo ciągłe energii przeczy 
w oczywisty sposób prawu zachowania energii. 
Kiedy zmierzono energię i kierunek lotu jądra koń¬ 
cowego, to przekonano się, że również prawo za¬ 
chowania pędu musiałoby być naruszone. Z kolei 
analiza spinów cząstek uczestniczących w rozpadzie 
fi (oczywiście przy pominięciu neutrina) wykazała 
załamanie prawa zachowania momentu pędu. Aczkol¬ 
wiek niektórzy fizycy traktowali poważnie możliwość 
naruszenia wszystkich tych praw zachowania, to 
jednak znaleźli się inni, którzy raczej uwierzyli 
w hipotezę W. Pauliego postawioną w 1930 r., 
według której w rozpadzie fi musi być emitowana 
jeszcze jedna cząstka. Wkrótce nawet nadano jej 
nazwę — neutrino. 

Jednym z fizyków doceniającym znaczenie hipotezy 
Pauliego był E. Fermi, który w 1932 r. stworzył pier¬ 
wszą konsekwentną, acz nie ostateczną teorię oddzia¬ 
ływań słabych, uwzględniającą istnienie neutrina. 
Przez długie lata była to cząstka hipotetyczna. Dopiero 
w latach pięćdziesiątych F. Reines i C. Cowan 
udowodnili bezpośrednio, że neutrino rzeczywiście 
istnieje, gdyż może (choć niezmiernie rzadko) wy¬ 
wołać nową reakcję w dowolnej odległości od miejsca 
ego wytworzenia. 

Oprócz jąder wykazujących promieniotwórczość fi~~ 
znane są także jądra wykazujące promieniotwórczość 
/?+. Ogólne równanie procesu fi+ ma postać: 

A z X-> z * x X+e++v e +Q. (5) 

Jasne, że przy Z — 1 i A = 1 proces (5) byłby roz¬ 
padem protonu. Ale dla swobodnego protonu wiel¬ 
kość Q występująca w równaniu (5) jest ujemna 
(ponieważ proton jest lżejszy od neutronu), zatem 
swobodny proton jest cząstką trwałą. Mimo to, 
wygodnie jest wyobrażać sobie, że rozpad fi + jądra 
jest rezultatem rozpadu protonu wewnątrz tego 
jądra. Niezbędną energię „pożycza” proton od całego 
jądra. Podobny efekt występował także przy roz¬ 
padzie fi~ wówczas, gdy wyzwolona energia Q(A, Z) 
była większa od Q 0 . Chociaż rozpad swobodnego 
protonu jest wzbroniony, można rozpad fi~ związane¬ 
go neutronu i rozpad fi+ związanego protonu trakto¬ 
wać na zupełnie równych prawach. W tym miejscu 
ujawnia się nonsensowność rozpatrywania neutronu 
jako zbudowanego z protonu, elektronu i antyneutri- 
na. Gdyby tak było, to powinniśmy z kolei proton 
uważać za zbudowany z neutronu, pozytonu i neutri¬ 
na. Inaczej mówiąc, neutron byłby zbudowany z sa¬ 
mego siebie, a ponadto z elektronu, pozytonu, neu¬ 
trina i antyneutrina, co jest — przynajmniej w do¬ 
słownym rozumieniu słowa „zbudowany z”—jaw¬ 
nym bezsensem. 

Proces rozpadu czyli przekształcania się cząstek 
jest czymś fundamentalnie nowym, zjawiskiem niezna¬ 
nym fizyce klasycznej, w której wszelkie procesy 
sprowadzały się do przegrupowywania składników. 
Należy wyobrazić sobie, że w momencie rozpadu zni¬ 
ka po prostu cząstka pierwotna, na jej miejsce zaś 
pojawiają się nowe, których przedtem nie było. W 
takim ujęciu procesy rozpadu są podobne do proce¬ 
sów zderzeń nieelastycznych. Te ostatnie należy rozu¬ 
mieć jako znikanie cząstek początkowych i powsta¬ 
wanie na ich miejsce cząstek końcowych, których nie 
było przed aktem oddziaływania. 

W tym ujęciu termin „oddziaływanie” oznacza moż¬ 
liwość znikania jednych cząstek i pojawiania się 
na ich miejsce innych. 


Zasada krzyżowania 

Zajmijmy się teraz dokładniej owym „traktowaniem 
na równych prawach” procesu rozpadu neutronu 
(fi-) i rozpadu protonu (fi+). Aby móc sformułować 
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dokładniej co to znaczy, musimy najpierw rozpatrzyć 
jaki jest związek między wielkościami charakteryzu¬ 
jącymi rozpad neutronu swobodnego, a charaktery¬ 
stykami rozpadu jądra. Nie jest to związek będący 
równością odpowiednich parametrów. Na przykład, 
energia maksymalna elektronu Q(A , Z) jest inna niż 
analogiczna wielkość Q 0 , na pewno różne są też czasy 
życia. Przecież dla wielu wartości A i Z jądro jest 
trwałe, co odpowiada nieskończonemu czasowi 
życia tegoż jądra. Porównując odpowiednie dane 
można się przekonać, że kształty widma elektronów 
bywają bardzo różne dla różnych jąder (rys. 1). Czyż 
nie jest to w sprzeczności ze sformułowaniem, że 
rozpad jądra należy rozumieć jako wynik rozpadu 
jednego z jego neutronów? Okazuje się, że nie. Rzecz 
uniwersał- w tym, że wszystkie te procesy są dokładnie opisane 
ność hamil- identycznym hamiltonianem oddziaływania _ i jeśli 
tonianu od- zostanie on poprawnie dobrany do opisu jednego 
działywania tylko procesu (1), to automatycznie, przez stosowanie 
uniwersalnych metod teorii kwantowej, ten sam ha¬ 
miltonian pozwala doskonale opisać wszj^stko co się 
da zmierzyć, dla rozpadów rozmaitych jąder. Róż¬ 
norodność rozpadów odzwierciedla bogactwo 
struktury różnych jąder, ale nie wnosi już nic istot¬ 
nego do poznania własności oddziaływań słabych. 
Jest to niewątpliwie dużym sukcesem kwantowej 
teorii pola i dowodem jej wielkiej przydatności do 
opisu oddziaływań. Pod tym względem teoria ta jest 
podobna do teorii grawitacji Newtona, dzięki której 
wystarczy z jednego doświadczenia wyznaczyć 
stałą grawitacyjną, aby na podstawie tej teorii móc 
opisywać ruchy wszelkich planet, komet, gwiazd 
podwójnych, statków kosmicznych itp. 

Kwantowa teoria pola oprócz tego, że pozwala ze 
znajomości rozpadu swobodnego neutronu przepo¬ 
wiedzieć dokładnie jak będzie się on zachowywał 
w jądrze atomowym; przewiduje też, że ten sam 
hamiltonian opisujący rozpad (1) musi opisać pro¬ 
cesy, w których dowolną cząstkę przeniesiemy „na 
drugą stronę reakcji” z jednoczesną zamianą na 
antycząstkę (zasada krzyżowania), jak też procesy, 
w których odwrócimy kierunek przebiegu reakcji. 

Jest oczywiste, że reakcję p n+e++v e można 
otrzymać z reakcji n -> p+e~-\-v e przez przeniesienie 
elektronu i antyneutrina na drugą stronę i zmianę 
znaku strzałki. Tym samym widzimy, że wszelkie 
procesy i 0 + są przejawem dokładnie jednego 
i tego samego oddziaływania. Cała informacja o tym 
oddziaływaniu jest zawarta w fakcie zachodzenia 
reakcji (1) oraz w- kwantowych regułach obliczeń. 
Oczywiście przenosząc na drugą stronę dwie cząstki 
w reakcji rozpadu, dostajemy znów proces rozpadu. 
Teoria kwantowa wiąże ponadto te rozpady z proce¬ 
sami, w których przenosi się na drugą stronę tylko 
edną cząstkę. Są to już procesy rozpraszania, np. 

v e +p n+e+, (6) 

e+p -> n+' ve. (7) 

dowody na Dowód Reinesa i Cowana na istnienie neutrina 
istnienie polegał właśnie na zaobserwowaniu reakcji (6) za- 
neutrina inicjowanej przez antyneutrina wydobywające się 

w ogromnych ilościach z pracującego reaktora ją¬ 
drowego. Słabość oddziaływania polega na tym, że 
z miliardów antyneutrin przelatujących przez detek¬ 
tor jedynie kilkadziesiąt wywołało reakcję (6), a reszta 
przeleciała bez jakichkolwiek oddziaływań. Wspomi¬ 
naliśmy już o tym, że jest zupełnie nierealne próbować 
obserwować reakcję (7) tymi samymi metodami co 
reakcję (6) Mimo to proces (7) występuje dość 
często i jest nieźle zbadany, jednak nie jako proces 
rozproszeniowy, lecz jako tzw. wychwyt elektronu 
atomowego, przeważnie z powłoki K. Można się 
przekonać, że dla pojedynczego protonu i elektronu 
o prawie zerowej energii zasada zachowania energii 
zabrania reakcji (7). Wynika to stąd, że 

m e +m p < m n . (8) 


Ale dla odpowiednio dobranego jądra (podobnie jak 
w przypadku rozpadów J3+) można poprawić bilans 
energetyczny i odwrócić znak nierówności (8). 
Reakcja 

e+ A z X z ^X+v e (9) 

może zachodzić, jeżeli 

m e +m z > m z _ x . 

Nierówność ta jest słabsza od nierówności 
m z > 

będącej warunkiem koniecznym rozpadu /?+. A zatem 
jeśli jądro ulega rozpadowi /?+, to również może 
następować wychwyt elektronu, ale nie na odwrót. 
Znane są jądra, dla których nie wystarcza energii na 
rozpad £ + , a wystarcza na wychwyt elektronu. 

Zwróćmy uwagę na to, że z punktu widzenia atomu 
jako całości, wychwyt elektronu jest procesem 
rozpadu. Ponieważ w wyniku reakcji wychwytu 
powstają dwa ciała: neutrino i atom końcowy, koń¬ 
cowa energia atomu (w praktyce jądra) jest ściśle 
określona. Doświadczalne wykazanie tego faktu 
pięknie potwierdziło hipotezę o istnieniu neutrina 
i o spełnieniu prawa zachowania energii w oddziały¬ 
waniach słabych. Należy przy tym podkreślić, że 
czasy życia atomu ze względu na wychwyt elektronu, 
obliczone na podstawie zasady krzyżowania, są 
zgodne z doświadczeniem, co przekonuje nas, że 
wychwyt elektronu jest wywołany tym samym do¬ 
kładnie oddziaływaniem, co reakcja (1). 


Skrętność neutrina i łamanie symetrii 
zwierciadlanej 


Zastanowimy się teraz dlaczego w reakcjach raz wy¬ 
stępuje neutrino, a raz antyneutrino i czym te cząstki 
się różnią. W tym celu załóżmy najpierw, że neutrino 
i antyneutrino są identyczne (podobnie jak foton 
jest swą antycząstką): v e = v e . Przepiszemy reakcję 
(6) z uwzględnieniem powyższego fałszywego zało- 
żenia 

v e +p -+ n+e+ (10) 


oraz reakcję jaką dostajemy z (1) po przeniesieniu v e 
na lewą stronę 

v e +n->p+e-. (11) 


Ze wzorów (10) i (11) wynika, że bombardując 
„neutrinami” z reaktora, materię złożoną z równej 
(z grubsza) liczby neutronów i protonów powinniśmy 
obserwować jednakową liczbę reakcji, w których 
powstają elektrony i reakcji z utworzeniem pozytonu. 
Jest to w jawnej sprzeczności z doświadczeniem — 
obserwujemy w takim wypadku tylko proces (10), 
a nigdy (11). Innymi słowy, cząstki z reaktora są 
antyneutrinami, a w reakcji (10) nie wolno opuścić 
kreski nad symbolem v e . Można więc uznać, że 
antyneutrina to te cząstki, które oddziałując z nukleo¬ 
nami przekształcają się w pozytony (antyelektrony), 
a neutrina to te, które przekształcają się w elektrony. 

Zgodnie z zasadą krzyżowania, jeśli ani elektro¬ 
nów, ani neutrin nie było na początku (jak w rozpa¬ 
dach /?*), to wraz z elektronem zostanie wytworzone 
antyneutrino, a wraz z antyelektronem (pozytonem) 
— neutrino. Fakty te pozwalają wprowadzić pojęcie 
liczby leptonowej i zasadę zachowania tej liczby. 
Przypisując elektronowi i neutrinu liczbę ieptonową 1, 
a ich antycząstkom liczbę — 1, widzimy, że we wszy¬ 
stkich procesach dotychczas omawianych suma 
tych liczb nie ulega zmianie w wyniku reakcji. Korzy¬ 
stając z prawa zachowania liczby leptonowej, zawsze 
możemy ustalić czy dana cząstka jest neutrinem czy 
antyneutrinem (wystarczy znać jej pochodzenie 
bądź zaobserwować wywołaną przezeń reakcję). 
Oczywiście można zapytać, czy poza liczbą leptono- 
wą neutrino i antyneutrino różnią się jeszcze jakąś 
inną, mierzalną cechą. Odpowiedź na to jest twier- 
dlząca. Neutrina, podobnie jak elektrony i nukleony, 
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mają własny moment pędu (spin) z tym, że elektron 
(lub nukleon) może mieć rzut spinu na kierunek lotu 
równy bądź +V 2 #> bądź — x Uh y a neutrino ma zaw¬ 
sze rzut spinu na kierunek pędu równy — x łih. 
skrętność Neutrino jest pod tym względem zupełnie wyjątkowe, 
neutrina Jak mówimy obrazowo, neutrino zawsze „wiruje” 
w lewo. Natomiast antyneutrino zawsze „wiruje” 
w prawo. Zauważmy, że aby stwierdzenia te miały 
sens, neutrino musi być cząstką o masie dokładnie 
równej zeru, a zatem musi zawsze poruszać się z pręd¬ 
kością światła. W przeciwnym wypadku łatwo popaść 
w sprzeczność. Rozpatrzmy dwóch obserwatorów 
O i O' (rys. 3). Niech w układzie odniesienia O neu- 


o-- 
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Rys. 3. Neutrino obserwowane przez dwóch obserwatorów: 
obserwatora O, względem którego porusza się w dodatnim kie¬ 
runku osi x i obserwatora O' poruszającego się względem O 
szybciej niż neutrino (voo'> vó). Obserwator O ' widzi, że neutri¬ 
no porusza się w ujemnym kierunku osi x ' i że wiruje w prawo w 

stosunku do swej prędkości t'o' 


trino leci w dodatnim kierunku osi ;e i wiruje w lewo 
w stosunku do kierunku swego lotu. Jeśli prędkość 
neutrina vo jest mniejsza od c, to przy prędkości 
v 0 , 0 obserwatora O' względem układu O większej od 
vo zaobserwuje on w układzie O' ten sam kierunek 
wirowania względem osi ale tym razem kierunek 
lotu neutrina będzie przeciwny (obserwator O' wy¬ 
przedza neutrino). Zatem obserwator O' powie, że 
neutrino wiruje w prawo w stosunku do kierunku 
swego lotu. 

Fakt określonej, zawsze jednakowej skrętności 
neutrin ma ważne konsekwencje. Fizyka klasyczna, 
jak również fizyka kwantowa, ale w zakresie zjawisk 
wywoływanych oddziaływaniami silnymi i elektro- 
symetria magnetycznymi, wykazywała pewną symetrię zwaną 
zwierciadła- symetrią zwierciadlaną. Przedstawiając poglądowo, 
symetria zwierciadlana polega na tym, że jeśli jakiś 
proces jest możliwy (to znaczy zgodny z prawami 
fizyki), to również zgodny z prawami fizyki, a więc 
możliwy do realizacji, jest proces podobny do rozpa¬ 
trywanego, ale w którym wszelkie ruchy i konfigura¬ 
cje są takie, jakie by widział obserwator obserwujący 
odbicie tego pierwszego procesu w zwierciadle. 
Na przykład, śruba prawoskrętna z odpowiednią 
nakrętką działa zgodnie ze swym przeznaczeniem. 
Gdybyśmy popatrzyli na śrubę z nakrętką (oraz na 
proces ich skręcania) w zwierciadle, to by się nam 
wydawało, że jest to śruba lewoskrętna. Ale taką 


z 



zwierciadło 

Rys. 4. Rozpad /? neutronu i jego obraz w zwierciadle Z. Obraz 
antyneutrina w zwierciadle wiruje w lewo. W rzeczywistości pro¬ 
cesu takiego nigdy nie obserwujemy 


lewoskrętną śrubę można skonstruować naprawdę 
i będzie ona równie użyteczna w zastosowaniach. 
Podobnie, przywykliśmy do zasad ruchu prawostron¬ 
nego na drogach. Jeśli jednak wszystkie # pojazdy 
zmienią ruch na lewostronny, to nadal będzie to kon¬ 
sekwentna metoda unikania kolizji. 

Przykłady takie można mnożyć w nieskończo¬ 
ność. Tymczasem spójrzmy na obraz w zwierciadle 
jakiegokolwiek procesu z udziałem neutrin, np. na 
obraz procesu (1) (rys. 4). Ujrzymy neutron rozpada¬ 
jący się na proton, elektron i pewną cząstkę wirującą 
w lewo, a więc nie tak jak antyneutrino w rzeczywi¬ 
stym procesie, lecz jak neutrino. Taki proces jest 
jednak niemożliwy. Przyroda nigdy go naprawdę nie 
realizuje. (Nie wiemy dlaczego, ale tak po prostu jest!) 
Można więc stwierdzić, że przy oddziaływaniach 
słabych nie jest spełniona zasada symetrii zwierciadla¬ 
nej. Ten sam fakt określa się też jako niezachowanie 
parzystości w oddziaływaniach słabych. Naruszenie 
symetrii zwierciadlanej prowadzi do zaskakujących 
asymetrii, sprzecznych całkowicie z intuicją ukształto¬ 
waną przez fizykę klasyczną. Pierwszym doświadcze¬ 
niem, w którym taką asymetrię wykryto, było do¬ 
świadczenie wykonane przez panią C.S. Wu i współ¬ 
pracowników, a zaproponowane przez T.D. Lee i N. 
C. Yanga. Doświadczenie polegało na badaniu rozpa¬ 
dów /?+ jąder kobaltu 60 Co. Decydujące o zaobserwo¬ 
waniu asymetrii było oziębienie próbki kobaltu do 
bardzo niskiej temperatury i umieszczenie jej w silnym 
polu magnetycznym. Jądra kobaltu mają spin i zwią¬ 
zany z nim moment magnetyczny. W normalnych 
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sytuacja niemożliwa, bo 
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Rys. 5. Asymetria „góra-dół” w rozpadzie /ł - jądra ,0 Co. Strzałka 
na jądrze kobaltu nie symbolizuje całego spinu jądra lecz jedynie 
różnicę (równą + \h) między spinem* 0 Co i ,0 Ni. Różnica ta 
uniesiona musi być przez v + e. Lecące w dół antyneutrino nie 
może jednak unieść tego momentu pędu,bo musi wirować tak jak 
na rysunku (w prawo do kierunku swego lotu). Na dolnym rysun¬ 
ku sytuacja jest już zgodna z prawami zachowania i ustaloną 
skrętnością antyneutrina 


warunkach kierunki owych momentów (czyli „płasz¬ 
czyzny wirowania” jąder) są ustawione chaotycznie. 
W silnym polu magnetycznym wszystkie momenty 
magnetyczne ustawiają się równolegle do pola magne¬ 
tycznego. Można też powiedzieć, że wszystkie jądra 
wirują w płaszczyznach równoległych i w tę samą 
stronę. Załóżmy, że płaszczyzna jest pozioma a jądra 
wirują np. w lewo jeśli patrzymy na próbkę „z góry” 
(rys. 5) Wiadomo, że jądra 60 Co wykazują promienio¬ 
twórczość jff-. W wyniku rozpadu powstaje jądro 60 Ni, 
elektron i antyneutrino. Jądro eo Ni ma spin niniejszy 
o 1 h od jądra 60 Co. Zgodnie z zasadą zachowania 
momentu pędu ów jednostkowy spin musi być unie¬ 
siony przez elektron i antyneutrino. Ponieważ każda 
z tych cząstek może mieć rzut spinu na oś pionową 
równy to aby z rzutów tych złożyć -fi h 9 za¬ 

równo spin elektronu jak i spin antyneutrina muszą 
wynosić Gdyby antyneutrino, które musi 

kręcić się w prawo w stosunku do swego pędu, leciało 
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„w dół”, to rzut jego spinu na oś pionową byłby 
—i prawo zachowania momentu pędu nie mo¬ 
głoby być spełnione. W efekcie kierunek „w górę” 
jest dla antyneutrin uprzywilejowany. Z tego, że suma 
wszystkich pędów musi być równa zeru, wynika, że 
dla elektronów uprzywilejowany jest kierunek „w 
dół” — tam leci faktycznie większość elektronów. 
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Rys. 6. Dozwolona konfiguracja po rozpadzie “Co i jej obraz 
w zwierciadle poziomym. Na obrazie tym antyneutrina lecą w dół, 
a więc tak jak im faktycznie nie wolno 

Spoglądając na odbicie tej sytuacji w zwierciadle płas¬ 
kim równoległym do płaszczyzny „wirowania” (rys. 
6), ujrzymy sytuację sprzeczną z prawem przyrody. 
W odbiciu tym kierunek „wirowania” jąder nie uleg¬ 
nie zmianie, a elektron zamiast głównie „w dół” 
lecieć będzie głównie ,,do góry”, czyli na odwrót niż 
w rzeczywistym doświadczeniu. 

Za postawienie hipotezy, że oddziaływania słabe 
naruszają symetrię prawo-lewo, fizycy N.C. Yang 
i T.D. Lee dostali nagrodę Nobla w tym samym 
roku, w którym doświadczenie pani Wu hipotezę tę 
potwierdziło (1957 r.). 

Oddziaływania słabe mionów 

pary W przyrodzie oprócz pary leptonów (e, v e ) występuje 
leptonów inna para leptonów: mion i neutrino mionowe Gu, v„) 
oraz ich antycząstki. Przekonano się, że oddziaływa¬ 
nie tych cząstek z nukleonami jest identyczne jak 
pary (e, v«). Dokładniej mówiąc, identyczny co do 
postaci jest hamiltonian oddziaływania, jeżeli zastą¬ 
pimy w nim symbole elektronu i neutrina elektrono¬ 
wego odpowiednimi symbolami mionu i neutrina 
mionowego. Nie trzeba zmieniać nawet stałej sprzę¬ 
żenia, jest ona taka sama („uniwersalna”). Oczy¬ 
wiście, obliczając dalej prawdopodobieństwa proce¬ 
sów z udziałem mionów, wszędzie w odpowiednich 
miejscach wstawiamy masę mionu a nie elektronu 
i to prowadzi do oczywistych różnic całkowicie 
jednoznacznie uwzględnianych przez teorię. 1 tak np. 
masa mionu jest większa od różnicy mas dowolnych 
dwóch jąder o tej samej liczbie masowej A — nie 
obserwujemy więc w ogóle procesów analogicznych 
do rozpadu /?, ale z udziałem mionów. Na odwrót, 
proces analogiczny do wychwytu elektronu jest 
energetycznie zawsze możliwy, bo 

nin+m v > m n , niu+mz > niz- 1 , 


gdyż masa mionu jest równa 106 MeV/c 2 , a różnice 
mas izobarów (jąder o tym samym A) nie przekraczają , 

10 MeY/c 2 . Dodatkowym czynnikiem faworyzują¬ 
cym wychwyt mionu jest fakt, że mion wmezoatomie 
(atomie, w którym jeden z elektronów zastąpiony jest 
mionem) jest średnio znacznie bliżej jądra niż elek¬ 
trony z najgłębszych nawet powłok. Powoduje to, że 
czas życia mezoatomu ze względu na wychwyt mionu 
jest o wiele rzędów wielkości krótszy od analogicznego 
czasu dla wychwytu elektronu. Warto podkreślić 
jeszcze raz, że i w tym wypadku czas życia można 
jednoznacznie obliczyć (zgodnie z doświadczeniem) 
przy założeniu dla mionów tej samej postaci i „inten¬ 
sywności” oddziaływania, którą wyznaczono z pro-, 
cesu (1). 

Podobnie reakcja 

v t i+P -* ł-t^+n (12) 

w pełni analogiczna do reakcji (6) była obserwowana. 
Porównując reakcje (6) i (12) można szczególnie do¬ 
bitnie wykazać sens uniwersalności oddziaływań sła¬ 
bych mionów i elektronów. Otóż dla tych reakcji 
przeprowadzonych przy bardzo dużych energiach 
antyneutrin (dużo większych od energii spoczynko¬ 
wej mionu) można oczekiwać, że wpływ masy mionu 
na przekrój czynny powinien być pomijalny. Ale jeśli 
tak, to w tych warunkach reakcje (6) i (12) powinny 
zachodzić jednakowa często (przy tej samej energii v e 
i v*) —już bez potrzeby uwzględniania jakichkolwiek 
poprawek. Po prostu przy tych samych natężeniach 
antyneutrin w dwóch analogicznych doświadczeniach 
i tym samym czasie naświetlania powinno być tyle 
samo reakcji (6) w jednym doświadczeniu, co reakcji 
(12) w drugim. Wniosek ten jest zgodny z doświad¬ 
czeniem. 

Nasuwa się więc pytanie, co różni v e od v„. Otóż różnice 
jedyna znana różnica polega na tym, że neutrina między v e 
pierwszego typu wywołują reakcje z elektronami a v» 
w stanie końcowym, a neutrina drugiego typu — 
zawsze z mionami. Konkretnie, antyneutrina pow r - 
stające wraz z mionem w rozpadzie pionu 

7 r -> [*-+vu 

wywołują reakcję (12), a nigdy reakcję (6). Fakt 
ten pozwala na zdefiniowanie, oprócz wprowadzonej 
już elektronowej liczby leptonowej L e , nowej liczby 
leptonowej L M równej -P1 dla pr i — 1 dla p + i v» 
oraz 0 dla pozostałych cząstek. Obie liczby leptono- 
we — z dokładnością na jaką pozwala obecna tech¬ 
nika doświadczalna — spełniają niezależne prawa 
zachowania. 

Znamy już dwie reakcje (1) i (12), z których przez 
krzyżowanie można uzyskać wszelkie możliwe procesy 
z udziałem nukleonów i leptonów określonego typu. 

Skoro jednak para («, p) oddziałuje z parą (e, v e ) 
i parą (ju, v M ) i to w ten sam sposób, to powstaje 
pytanie, czy pary ( e , v e ) i (/*, mogą oddziaływać 
ze sobą. Okazuje się,że tak. Prototypem jest tu reakcja 
rozpadu mionu na neutrino mionowe, elektron 
i antyneutrino elektronowe: 

-> v M + e~ J r v e . (13) 

Jest ona bardzo podobna do rozpadu swobodnego 
neutronu na proton, elektron i antyneutrino elektro¬ 
nowe. (Reakcja (1) przechodzi dokładnie w (13) jeśli 
zastąpimy n-> p -* v*). Czas życia mionu wynosi 
10~ 6 s. Okazuje się, że jeśli do obliczenia tego czasu 
użyć hamiltonianu oddziaływania o takiej samej po¬ 
staci jak hamiltonian opisujący rozpad (1) i z tą samą 
stałą sprzężenia, to dostanie się wynik zaledwie o 5% 
mniejszy od zmierzonej wartości. Owa rozbieżność 
jest większa od dokładności pomiaru — powrócimy 
jeszcze do tego problemu. 

Rys. 7. Trzy prototypowe oddziaływania: a) pary ( n , p) z parą 
(e, vc); b) pary (p, vp) z parą (e, v*) i pary (n, p) z parą {p y v#t). Prze¬ 
nosząc linię którejkolwiek cząstki na drugą stronę linii przery¬ 
wanej z jednoczesną zamianą na antycząstkę możemy dostać 
diagramy wielu innych możliwych procesów 
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Podsumujmy nasze wiadomości o oddziaływaniach 
słabych omówionych dotychczas. Sześć cząstek, 
które rozpatrywaliśmy («, p y e , v«, p y v^) grupują się 
w trzy pary («, p) y (e y v«) i (>, V*). Istnieją trzy „ele¬ 
mentarne” procesy, w których uczestniczą dwie 
kompletne pary, a więc cztery cząstki. Można je 
symbolicznie przedstawić w postaci diagramów 
(rys. 7). 

Powyższe diagramy można interpretować jako śla¬ 
dy torów cząstek uczestniczących w procesie. Po 
lewej stronie linii przerywanej narysowano cząstki 
początkowe, po prawej — produkty reakcji. Zgodnie 
z zasadą krzyżowania, z każdego diagramu można 
otrzymać wiele innych diagramów przez odchylenie 
jednej- (lub więcej) linii tak, by znalazły się one po 
przeciwnej stronie linii przerywanej z jednoczesną 
zmianą cząstki na antycząstkę. 


Oddziaływania słabe innych cząstek. 

Model kwarkowy 

Powyżej zostało przedstawione oddziaływanie słabe 
sześciu cząstek. Zadziwiające jest, że cała różnorod¬ 
ność procesów opisana jest jedną formułą matema¬ 
tyczną (hamiltonian oddziaływania) i jedną stałą 
sprzężenia (jeśli pominąć 5% rozbieżność). Wiemy 
jednak, że liczba cząstek jest bardzo duża i wszys¬ 
tkie one uczestniczą w słabych oddziaływaniach. Nie 
obserwujemy wprawdzie rozpadów słabych wszyst¬ 
kich znanych cząstek nietrwałych, ale to tylko dlatego, 
że niektóre cząstki są nietrwałe ze względu na inne od¬ 
działywania i żyją zbyt krótko, by powstała realna 
szansa zauważenia ich słabego rozpadu, który jednak 
w zasadzie jest możliwy. O tym, że cząstki takie 
uczestniczą w słabych oddziaływaniach może nas 
przekonać np. fakt zachodzenia reakcji 

Vlx +p-+p-+A + + 

(cząstka J + + -* Cząstki elementarne i ich oddziaływa¬ 
nia). 

Ale nawet ograniczając się do rozpadów tylko 
tych cząstek, które nie mogą rozpadać się wskutek 
oddziaływań innych niż słabe, napotykamy na ogrom¬ 
ną różnorodność procesów. Na przykład, mezon K~ 
(i podobnie K + ) rozpada się na co najmniej 26 znanych 
różnych sposobów (tabela cząstek w Cząstki ele¬ 
mentarne i ich oddziaływania). Wydaje się zrazu, 
że idea uniwersalności postaci oddziaływań słabych 
musi się załamać. Przemawia za tym występowanie 
procesów powolnych, w których nie uczestniczą bynaj¬ 
mniej cztery cząstki o spinie V 2 , lecz np. trzy lub pięć, 
z tego część cząstek o spinie 0, np. 

7t~ -> fjT K~ -* 7l~ -f^ + Ą-e~ +Ve- 

W teorii pola, hamiltonian opisujący oddziałanie 
czterech cząstek o spinie 1 /* nie może opisywać 
innych oddziaływań niż czterech cząstek o spinie */*• 
Do opisu powyższych procesów należałoby użyć 
dwu nowych hajmiltonianów. Oczywiście nic nie 
zabrania Przyrodzie być tak skomplikowaną. Szo¬ 
kujące jest natomiast to, że na przekór pozorom, ideę 
uniwersalności oddziaływań słabych można utrzymać 
(uzyskując doskonały opis rzeczywistości), i że w 
gruncie rzeczy nieznaczne uogólnienie poznanych już 
oddziaływań pozwala na opisanie różnorodnych roz¬ 
padów cząstek elementarnych. Rzecz w tym, że to co 
nazywamy cząstkami elementarnymi stanowi w więk¬ 
szości struktury złożone. Ogromnym postępem w kie¬ 
runku uzyskania zwartego opisu oddziaływań słabych 
jest przyjęcie, że wszystkie hadrony są zbudowane 
model z niewielkiej liczby kwarków. Jest to przeniesienie 
kwarkowy modelu z poziomu jądra, według którego wszystkie 
hadronów jądra są złożone z dwóch rodzajów nukleonów, a roz¬ 
pady jąder są odzwierciedleniem jednego procesu 
elementarnego, co bardzo upraszcza sytuację. Gdy¬ 
byśmy ignorowali fakt złożoności jąder, to do opisu 
rozpadu fi każdego jądra musielibyśmy używać innego 


hamiltonianu i innej stałej sprzężenia. W tej sytuacji 
wydawałoby się, że z własności rozpadu jednego jądra 
nie można wywnioskować nic, co dotyczyłoby rozpa¬ 
du innego jądra. 

Hadrony (znane do 1974 r.) można było zbudować 
w określony sposób z kwarków trzech rodzajów*, d , 
u , 5 , w tym nukleony tylko z kwarków di u o ładun¬ 
kach — 1 / z e i + 2 Ue (e — ładunek elementarny). W 
modelu tym proton i neutron to układy złożone z 
kwarków w sposób następujący: 

n = (d d u), a p = (u u d). 

Przyjmijmy, że rozpad nukleonu jest spowodowany 
rozpadem jednego z jego kwarków składowych. Proces . ^ 

(1) zastępujemy przez 

d -> u+e~+ve- (14) 

Mimo ułamkowych ładunków kwarków widać, że 
reakcja ta zachowuje ładunek całkowity. Fakt, że 
kwark rozpada się wewnątrz hadronu, nie stanowi 
żadnej przeszkody — ten sam problem występował 
w poprzedniej wersji rozpadu jądra — teoria kwanto¬ 
wa dobrze sobie z tym radzi. 

Spójrzmy pod tym kątein na reakcję rozpadu 

7t~~ 7i° - ( 15 ) 

W modelu kwarkowym ir to układ związany an¬ 
ty kwarku u i kwarku d y a jt° to superpozycja układu 
(u u) i (dd). Rozpad (15) możemy traktować dokład¬ 
nie tak, jak rozpad 0- jądra. Zakładamy więc, że d 
rozpada się na u , e~ i v«: 

fi- 

(u d) -> (u «)H-c“+v<-. 


Możliwy jest też rozpad antykwarku u: 

U ->d+e-+ve (zasada krzyżowania) 
prowadzący do procesu 


/?- 

i I 

(u d) -*■ (d d)+e~+ve . 

W wyniku równoległego zachodzenia tych procesów 
dostajemy na końcu dokładnie tę suprepozycję {u u) 
i ( d d), która jest mezonem tz°. Prawdopodobieństwo 
tego rozpadu można obliczyć dokładnie tak samo, 
jak rozpadu jądra i wtedy uzyska się — bez żadnych 
nowych parametrów czy założeń —- wynik zgodny 
z doświadczeniem. Umawiamy się, że zamiast pary 
(«, p) uważamy odtąd za elementarną parę (</, u). 

W celu opisania oddziaływań słabych cząstek dziw¬ 
nych trzeba ustalić, w jaki sposób kwark s (kwark 
dziwny) uczestniczy w słabych oddziaływaniach. 
Informacji tych dostarczyć może rozpad 

K~ _* n °+ e -+v e . (16) 


opis rozpadu 

cząstek 

dziwnych 


W modelu kwarkowym K~ jest układem (w $), n° 
zaś nie zawiera kwarku 5. Zatem kwark ten musi roz¬ 
padać się w trakcie procesu (16) na p y er i v e : 

s -> u+e~+v e . (17) 

Jest to proces bardzo podobny do (14), którym za¬ 
stąpiliśmy „złożony” proces (1)—jedyna różnica, 
to zamiana d na 5. Stosując standardową teorię do 
procesu (16) (z tą samą stałą sprzężenia) dostalibyśmy 
czas życia zbyt krótki o czynnik ok. 20. Klucz do roz¬ 
wiązania zagadki może stanowić fakt, że po raz 
pierwszy napotykamy parę cząstek ( 5 , w), w której 
składnik u wystąpił już w innej parze 0 d , «). W rezul¬ 
tacie para ( d , u) sprzęga się nieco słabiej niż para 
0*, v„) a para ( s 9 u) sprzęga się najsłabiej. k Cabibbo 

Wprowadzając jedną parę z kombinacją kwarków 
dis 

(d cosfl-Msintf, u) 

sprzężoną równie silnie jak para (e, v e ) bądź (p , v tl ) 
można uzyskać doskonały opis wszystkich znanych 
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procesów, jeżeli tylko kąt 0 (kąt abibbo) przyjmiemy 
równy 0,22; 

sin0 = 0,22 (sin 2 0 « 1/20 = 5/100). 



Rys. 8. Wzajemne 
oddziaływanie słabe 
kwarków d i u 


Dlaczego wartość tego kąta wynosi właśnie tyle — nie 
wiemy. Jest to jeden z dwóch parametrów charaktery¬ 
zujących słabe oddziaływania (obok stałej Fermie¬ 
go G), który na obecnym etapie wiedzy brać musimy 
z doświadczenia. 

Nasuwa się pytanie, czy oprócz procesów z udzia¬ 
łem 2 różnych par („dubletów”) występują słabe pro¬ 
cesy, w których dublet oddziałuje z samym sobą, np. 


d+u^u+d y (18) 

co symbolizuje rys. 8. Okazuje się, że tak. Nie jest to 
łatwo potwierdzić. Rzecz w tym, że proces d+u -> 
uĄ-d zachodzi też wskutek oddziaływań silnych. 
Jednakże oddziaływania słabe naruszają parzystość. 
Chociaż więc są odpowiedzialne za znikomy ułamek 
potencjału oddziaływania d u (lub w-/?— rzeczywisty 
neutron —rzećzy wisty proton), to jedynie ten ułamek 
może prowadzić do naruszenia symetrii lewo-prawo 
i w efekcie do tego, że jądra atomowe wysyłają czasa¬ 
mi promieniowanie y o nieznacznej przewadze jedne- 
V e V e ^ go rodzaju polaryzacji kołowej nad drugą. 

Zaobserwowano również (z ogromnym trudem) 
X. rozpraszanie elastyczne antyneutrin na elektronach, 
© a więc reakcję 


Rys. 9. Oddziały¬ 
wanie elastyczne 
v«+e-J- v* + e 



Ve + e -> Ve + e, 

którą przedstawia rys. 9 (diagram). 

Najprostszy sposób naturalnego uwzględnienia 
tych wszystkich procesów polega na przypuszczeniu, 
że istnieją dwie cząstki o dużej masie, spinie 1 i ła¬ 
dunkach ± le y tzw. bozony pośrednie W+ i W~ y które 
sprzęgają się (jednakowo silnie!) do każdego z trzech 
dubletów. Diagram procesu czterofermionowego np. 
(14) przyjmie więc nową postać. Można go interpre¬ 
tować jako rozpad tf na u i W~, który dalej może za¬ 
mienić się na parę e i v e (rys.. 10). Istnienie rozpraszania 
elastycznego (np. 18) jest w tym obrazie zupełnie na¬ 
turalne (rys. 11). 



Rys. 10. Przejście 
od obrazu oddzia¬ 
ływania czterofer¬ 
mionowego do od¬ 
działywania z udzia¬ 
łem bozonu pośred¬ 
niego 


W ten sposób podaliśmy niezbędne informacje po¬ 
trzebne do opisu oddziaływań słabych znanych do 
1973 r. Rok ten przyniósł odkrycie nowego rodzaju 
sprzężenia, a rok następny odkrycie cząstek, do któ¬ 
rych opisu stało się niezbędne wprowadzenie czwartego 
kwarku c (powabnego). 

Oba te fakty zostały przewidziane przez słynną 
teorię Weinberga-Salama oddziaływań słabych (roz¬ 
winiętą w pracy Glashowa, Iliopoulosa i Maianiego). 
Analizując problem rozbieżności w wyższych rzędach 
rachunku zaburzeń kwantowej teorii pola, doszli oni 
do wniosku, że przedstawioną tu teorię można i trzeba 
ulepszyć (zmodyfikować). Niezbędna modyfikacja 
polega na wprowadzeniu czwartego kwarku c, a ra¬ 
czej czwartego dubletu 


(—<rfsin0-bscos0, c) (19) 



Rys. 11. Sprzęże¬ 
nie dubletu (d u ) 
do bozonu pośred¬ 
niego prowadzi w o- 
czywisty sposób do 
możliwości oddzia¬ 
ływań elastycznych 


opisującego w pełni słabe rozpady cząstek, w których 
skład wchodzi ów czwarty kwark c, oraz jeszcze 
jednego bozonu Z (nienaładowanego) sprzęgającego 
się w określony sposób z linią, w której nie nastę¬ 
puje zmiana tożsamości cząstki (czy będzie to lep¬ 
ton, czy kwark). 

Wiele przewidywań tej teorii zostało już potwier¬ 
dzonych.' Tak więc odkryto w 1977 r. już wszystkie 
sześć cząstek powabnych o spinie 0 (spokrewnio¬ 
nych z mezonami n i K)i stwierdzono, że rozpadają 
się one w sposób, który przewiduje teoria. Pomijając 
sin 2 0 jako wielkość małą, moglibyśmy w zerowym 
przybliżeniu dwa dublety kwarków przedstawić w po¬ 
staci (d y u) i (s y c). W tym przybliżeniu kwark c 
musi rozpadać się na kwark s i bozon W+. Ten ostatni 
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może się z kolei przekształcać np. na parę i v*, co 
prowadzi do procesu 

D+ -* K°+e+ + v e 
lub 

jeżeli W+ rozpadnie się akurat na parę ( u y d) (rys. 12). 
Jest tutaj istotne, że w stanie końcowym wystąpi 
(prawie zawsze) cząstka dziwna. Dokładniej, nastąpi 
to w 95%, bo tyle wynosi cos^. 



Rys. 12. Dwa spośród wielu możliwych rozpadów słabych czą¬ 
stki Z) + , w skład której wchodzi kwark c rozpadający się głównie 
na kwark s i bozon W + . Kwark s na rysunku można zastąpić 
kwarkiem d, ale według teorii prawdopodobieństwo tych no¬ 
wych procesów byłoby mniejsze o czynnik tg 2 0 c * l / 2 o 


Rys. 13. Niektóre procesy z wymianą bozonu neutralnego. Pro¬ 
cesy a), b) i c) są zupełnie nieoczekiwane w klasycznej wersji 
teorii słabych oddziaływań. Proces c) powinien prowadzić do JL 
łamania symetrii zwierciadlanej w procesach związanych z ab¬ 
sorpcją i emisją światła przez atomy. Proces d) wnosi istotny 
wkład do procesu przedstawionego na rys. 11 modyfikując prze- 
widywanie starej teorii dotyczące łamania symetrii zwierciadlanej 
w fizyce jądrowej 


Natomiast założenie istnienia bozonu Z 0 prowadzi 
do przewidywania procesów niemożliwych w poprzed- v 
niej wersji teorii, a mianowicie: v+d v+d y v*4- 
-ł-e — V(t-ł-e itp. przedstawionych na rys. 13. 

Oba te procesy zostały doświadczalnie potwier- 
dzone. Określa się je jako oddziaływania „poprzez e 
prądy neutralne”, co oznacza po prostu, że przy b) 
przechodzeniu cząstki przez punkt oddziaływania nie 
następuje zmiana jej ładunku. 

Najciekawszy i najbardziej kontrowersyjny jest 
proces e+p (lub ń) -*• e+p (lub n) przedstawiony na ^ © 
rys. 13c. Jest to proces elastycznego rozpraszania elek- 
tronu na nukleonie. Proces ten jest maskowany oczy¬ 
wiście normalnymi oddziaływaniami elektromagne- 
tycznymi, ale podobnie jak przy oddziaływaniach ( n ) 
nukleonów prowadzi on do efektywnego potencjału C ) 
elektron-nukleon (a więc i elektron-jądro) naruszają¬ 
cego parzystość (o efekcie tym wspominaliśmy już we 
wstępie). Powoduje to m.in. bardzo nieznaczne skrę¬ 
cenie płaszczyzny polaryzacji światła przechodzącego n : 
przez jednoatomowe pary metali ciężkich. W pierw¬ 
szych doświadczeniach (niedokładnie jeszcze spraw- 
dzonych) efektu nie stwierdzono, a w każdym razie 
niejest on większy niż ok. V 5 tego co przewiduje teoria d ) 
Weinberga-Salama. Do roku 1979 potwierdzono 
istnienie tego oddziaływania tak jak przewiduje teoria, 
czego konsekwencją było przyznanie Weinbergowi, 
Salamowi i Glashowowi nagrody Nobla z fizyki. Czy 
jest to nowe wyzwanie, które zmusi do modyfikacji tej 
pięknej teorii, czy tylko błąd w analizie danych — 
jeszcze nie wiadomo. Przypuszczalnie problem zo¬ 
stanie rozstrzygnięty, zanim ten artykuł dotrze do 
Czytelników. 

L.A. Okuń Słabe oddziaływania cząstek elementarnych. War¬ 
szawa 1966; R. Sosnowski, G, Białkowski Cząstki elementarne. 
Warszawa 1971. 
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jądra atomowe i ich wzbudzenia 


Piotr Decowski 

Jądro atomowe składa się z dodatnio naładowanych 
elektrycznie protonów i obojętnych elektrycznie neu¬ 
tronów, nazywanych wspólnie nukleonami. Liczba 
protonów Z w jądrze nosi nazwę liczby atomowej lub 
liczby porządkowej jądra, a liczba wszystkich nu¬ 
kleonów A = Z+N. ; gdzie AT jest liczbą neutronów, 
nosi nazwę liczby masowej jądra. Jądro o liczbach 
Z, N \ A oznacza się krótko gdzie za X wpisuje 
się symbol chemiczny odpowiadający liczbie atomowej 
Z. Na przykład jądro berylu (Z = 4) o liczbie masowej 
A = 9 -oznacza się |Be s . Często w tym oznaczeniu 
pomija się liczbę neutronów N==A—Z. 
izotopy. Jądra o tym samym Z, a różnych A> nazywamy 
izotony, izotopami. Na przykład ^Oe i Wio są dwoma izo- 
izobary topami tlenu. Jądra o tym samym AT, a różnych A , 
nazywamy izotonami, np. 1 |Oi 0 i foNpio- J%dra 
o tym samym A , a różnych Z, nazywamy izobarami, 
np. Ar 22 i ™Ca 20 . [Ponieważ w normalnych warun¬ 
kach jądra występują nie same, ale z powłokami ele¬ 
ktronowymi, często nazywamy izotopami, izotonami 
czy izobarami nie grupy jąder o omówionych włas¬ 
nościach, lecz odpowiadające im grupy atomów.] 
Liczby Z i N lub Z i A określające skład jądra nie 
charakteryzują go jeszcze w pełni. Może ono bowiem 
znajdować się w różnych stanach. Każdy stan okre¬ 
ślony jest przez pewien zespół cech, do którego na¬ 
leżą: energia E> całkowity moment pędu (spin, kręt) 
energia / j parzystość P. Parzystość jest cechą czysto kwanto- 
wzbudzenia W ą (jest własnością funkcji falowej opisującej stan 
jądra); może być dodatnia (+) lub ujemna (-). 
Wśród wszystkich stanów jądra wyróżniony jest stan 
o najmniejszej energii E 0 . Nazywamy go stanem pod¬ 
stawowym. Wszystkie stany pozostałe są stanami 
wzbudzonymi. Energia wzbudzenia jest różnicą ener¬ 
gii stanu wzbudzonego i stanu podstawowego jądra. 

Własności jąder w stanie podstawowym 

siły Jądro istnieje dzięki działaniu jądrowych sił wzajem- 
jądrowe n ego przyciągania nukleonów (-► Siły jądrowe). 

W porównaniu z siłami, z jakimi spotykamy się w 
świecie makroskopowym, są to siły olbrzymie. Dwa 
nukleony, mikroskopijne obiekty o rozmiarach rzędu 
10“ 13 cm, mogą się przyciągać z siłą równą ciężarowi 
masy około 10 ton! Siły te jednak działają tylko wtedy, 
gdy odległość między nukleonami jest bardzo mała 
— rzędu 10“ 13 cm, a już w odległości paru femtome- 
trów zanikają. Zatem „efektywna” siła działająca 
między nukleonami w jądrze jest kilkadziesiąt razy 
mniejsza, ale w porównaniu z naszymi wyobrażeniami 


jeszcze olbrzymia. Krótki zasięg sił jądrowych powo¬ 
duje, że nukleon w jądrze „czuje” obecność tylko ota¬ 
czających go najbliższych paru sąsiadów, niezależnie 
od liczby pozostałych nukleonów. Dlatego też gę¬ 
stość materii jądrowej jest stała, nie zależy od liczby 
nukleonów w jądrze i wynosi około 1,7*10 38 nukle¬ 
onów/cm 3 . Nasuwa się analogia do kropli nieściśli¬ 
wej cieczy, w której siły van der Waalsa działają tylko 
między najbliższymi cząsteczkami. Z tych względów 
objętość jądra jest proporcjonalna do liczby nukle¬ 
onów (a więc do liczby masowej A danego izotopu). 

Wyznaczenie rozmiarów tak małego obiektu jak rozkład 
jądro atomowe nie jest łatwe. Większość metod opie- ładunku 
ra się na badaniu przestrzennego rozkładu ładunku 
jądra. Informacji o rozkładzie ładunku dostarcza na 
przykład obserwacja strumienia elektronów mają¬ 
cych bardzo dużą energię, rozpraszanych w różnych 
kierunkach przez badaną próbkę. Długość fali elek¬ 
tronów o energii rzędu kilkuset MeV jest bliska roz¬ 
miarom jądra i obraz rozpraszania ma charakter 
dyfrakcyjny, podobnie jak obraz dawany przez wiąz¬ 
kę światła napotykającą na swej drodze przeszkodę 
o rozmiarach porównywalnych z długością fali świe¬ 
tlnej (rys. 1). Analizując elektronowy obraz dyfrak¬ 
cyjny można odtworzyć kształt rozkładu ładunku, 
a więc i rozkładu protonów w jądrze. Z innych waż¬ 
niejszych sposobów pomiaru rozkładu ładunku moż¬ 
na wymienić pomiar mas jąder o tej samej liczbie 
masowej A , lecz różniących się liczbą neutronów i pro¬ 
tonów o 1: iX N i z £Y n -i 04 to tzw. jądra zwier¬ 
ciadlane). Główną przyczyną występowania różnicy 
mas jest energia kulombowska dodatkowego protonu 
w polu elektrostatycznym pozostałych protonów za¬ 
leżna od ich rozkładu przestrzennego. O rozkładzie 
ładunku można również wnioskować z badania wid¬ 
ma promieniowania towarzyszącego wychwytowi 
na orbitę atomową „ciężkiego elektronu”-—mionu. 

Orbita mionu, dzięki jego dużej masie, może znajdo¬ 
wać się w bezpośrednim sąsiedztwie jądra, w związku . , 

z czym rozkład ładunku może mieć istotny wpływ na promień 
jej parametry. Zgodnie z przewidywaniami gęstość ładunkowy 
ładunku w dużym obszarze jądra jest prawie stała, 
zaś w pobliżu powierzchni jądra szybko spada do ze¬ 
ra. Zależność gęstości od odległości od środka masy 
opisuje tzw. rozkład Fermiego (rys. 2): 

/ \_ go 

6 1 t Q(r-R)[cT> 

w którym promień jądra, zwany promieniem ładun¬ 
kowym, wynosi R = 1,07 A 1 ^ fm, natomiast <?(tzw. 
rozmycie powierzchni jądra) równa się 0,55 fm. 
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logaryłm względnego natężenia, Ig / 



Użycie elektronów do sondowania jądra ma pewną 
istotną zaletę. Oddziałują one ze składnikami jądra 
tylko poprzez siły elektromagnetyczne — nie „czują” 
, sił jądrowych. Dlatego też opisują rzeczywisty rozkład 

ładunku. Inaczej jest, gdy do badania rozmiarów jąder 
stosuje się rozpraszanie wiązek nukleonów, cząstek 
a czy też innych cząstek oddziałujących z nukleonami 
również siłami jądrowymi. Uzyskany wówczas roz¬ 
kład gęstości materii jądrowej jest podobny do roz¬ 
promień kładu gęstości ładunku, z tym, że wyznaczony pro- 
potencjalowy mień jądra, noszący nazwę promienia potencjałowe¬ 
go, jest większy: U=l,21 A 1J3 f m. Jest to zrozumiałe, 
gdyż pojawienie się sił jądrowych powoduje, że cząstka 
bombardująca zaczyna „odczuwać” jądro już w pew¬ 
nej odległości od jego powierzchni. 

Masa jądra (wyraża się ją ze względu na małą war¬ 
tość, w jednostkach masy atomowej u, 1 u jest równa 
Vi 2 masy jądra izotopu węgla 12 C, czyli 1,660531* 
•10 _27 kg) jest mniejsza od sumy mas tworzących je 
nukleonów. Spowodowane to jest oddziaływaniem 
nukleonów w jądrze. Gdyby zgrupować swobodne 
nukleony, to na skutek ich wzajemnego przyciągania 
energia się wydzieliłaby się, kosztem ich łącznej masy, pewna 
wiązania energia, zwana energią wiązania jądra; taka energia 
potrzebna jest do rozbicia jądra na pojedyncze skład¬ 
niki. Energię wiązania można obliczyć ze wzoru: 

B(A , Z) = Zm H +(A-Z)m n -M(A, Z), 
w którym A i Z oznaczają odpowiednio liczbę maso¬ 
wą i porządkową jądra, M(A, Z) — masę atomu pier¬ 
wiastka (tzn. masę jądra wraz z Z elektronami), 
— masę atomu wodoru, m n — masę neutronu. 

Zgodnie z zastosowaniem do jądra analogii kropli 
cieczy, średnia energia wiązania przypadająca na je¬ 
den nukleon, B(A f Z)/A t winna być w przybliżeniu 
stała dla wszystkich jąder. Warunkować ją powinna 
liczba nukleonów otaczających dany nukleon, zależ¬ 
na jedynie od gęstości materii jądrowej. W jądrze 
nie można jednak pominąć wpływu dodatkowych 
czynników, z których najważniejszy jest wpływ nukleo¬ 
nów znajdujących się na powierzchni jądra. Są one 
słabiej związane, podobnie jak cząsteczki znajdujące 
się na powierzchni cieczy (co prowadzi do powstania 
efektu napięcia powierzchniowego), z tym że w ją¬ 
drze, w związku z małą liczbą nukleonów, efekty 
powierzchniowe są znacznie bardziej istotne. 
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Wpływ różnych czynników na energię wiązania wzór 
można ująć ogólnie (-** Modele jądrowe) za pomocą Weizsack 
tzw. wzoru Weizsackera: 

B(A, Z)=a 1 A-a 2 A z f 3 -a 3 (A-IZYtA-a^jA^ 3 +<5. 

Człon drugi we wzorze, proporcjonalny do powierz¬ 
chni jądra (R 2 ~ A 2 ! 3 ), uwzględnia zmniejszanie energii 
wiązania przez efekty powierzchniowe. Człon trzeci, 
proporcjonalny do kwadratu różnicy Jiczby neutro¬ 
nów i protonów, mówi o tendencji do utrzymania 
równej ilości neutronów i protonów w jądrze (jest to 
tzw człon symetrii wynikający z braku wyróżnienia 
jakiegokolwiek z dwu rodzajów nukleonów — nad¬ 
miar protonów lub neutronów zakłóca tę symetrię 
i jest energetycznie niekorzystny). Człon czwarty 
uwzględnia fakt istnienia odpychania elektrostatycz¬ 
nego protonów (energia potencjalna naładowanej kuli 
jest proporcjonalna do Z*/R). Wreszcie człon piąty 
uwzględnia wynikające z natury sił jądrowych zjawis¬ 
ko dążenia nukleonów do łączenia się w pary —jądra 
o parzystej liczbie neutronów i protonów są bardziej 
trwałe (jest to efekt podobny do efektu nadprzewod¬ 
nictwa gazu elektronowego niektórych związków w 
niskich temperaturach). Współczynniki a u a 2 » # 3 , ^ 
oraz człon <5 wyznaczone doświadczalnie na podsta¬ 
wie zmierzonych mas jąder (głównie metodami spek¬ 
trografii masowej, przez obserwację torów jonów po¬ 
ruszających się ze znaną prędkością w polu magne¬ 
tycznym o znanym natężeniu) opisują z dużą dokład¬ 
nością energię wiązania i masy jąder o dowolnym A 
i Z. Wpływ poszczególnych członów na energię wią¬ 
zania ilustruje rys. 3. 
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Rys. 3. Wkład do średniej energii wiązania nukleonu różnych 
członów wzoru Weizs&ckera w zależności od liczby masowej 
jądra. Od energii objętościowej odejmuje się energia powierzch¬ 
niowa, kulombowska i energia symetrii (człon związany z łącze¬ 
niem się nukleonów w pary pominięto) dając w rezultacie war¬ 
tość wynoszącą dla większości jąder około 8 MeV 
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Wzór Weizsackera mówi, że energia wiązania, parabola 
a więc i masa jąder o tym samym A (izobarów), zależy mas 
parabolicznie od liczby porządkowej Z (rys. 4). 
Najbardziej związanymi, a tym samym trwałymi izo- 
barami, są jądra o liczbie porządkowej w pobliżu 
minimum paraboli mas. We współrzędnych N=A—Z 
(liczba neutronów) i Z układają się one wzdłuż tzw. ścieżka 
ścieżki trwałości (rys. 5). Jądra poza nią są nietrwałe trwałości 
i ulegają przemianom promieniotwórczym prowa¬ 
dzącym do tworzenia jąder bardziej trwałych. 

Spin jądra mierzony w jednostkach h{H=h/2n, h 
— stała Plancka) jest zawsze liczbą całkowitą dla 
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Rys. 5. Ścieżka trwałości 


wartości. Moment magnetyczny wyraża się za pomocą 
jednostki zwanej magnetonem jądrowym: 

= \e\h__ = 050509 .10”“ erg. Gs' 1 = 0,50509 X 

^ 2 M v c 

X 10“ u J T- 1 

(M p — masa protonu, c — prędkość światła). Maksy¬ 
malna wartość rzutu momentu magnetycznego na 
wybrany kierunek w przestrzeni wiąże się z maksy¬ 
malną wartością / rzutu spinu na ten kierunek: 

Mi = Igr Mn = yibl- 

Wprowadzone we wzorze wielkości gi i yi noszą naz¬ 
wę jądrowego czynnika g oraz stosunku geomagne¬ 
tycznego. Moment magnetyczny wyznacza się do¬ 
świadczalnie, badając rozszczepienie linii w widmach 
atomowych spowodowane jego oddziaływaniem z po¬ 
lem magnetycznym powłok elektronowych atomu. 

Wyznaczone eksperymentalnie wielkości g lub y są 
czułym sprawdzianem poprawności różnych teore¬ 
tycznych modeli budowy jądra atomowego. 

Pole elektryczne wokół jądra, będącego rozciągłym 
naładowanym obiektem, zależy od jego kształtu. Za¬ 
leżność tę opisuje się rozkładając potencjał elektro¬ 
statyczny na szereg mułtipolowy, w którym o wiel¬ 
kości kolejnych członów, zależnych od (1/r) w coraz 
wyższych potęgach, decydują momenty elektryczne, moment 
Elektryczny moment monopolowy równa się ładun- elektryczny 
kowi jądra. Elektryczny moment dipolowy jest równy 
zeru ze względu na równomierne rozłożenie ładunku 
w jądrze. Moment kwadrupolowy pojawia się wtedy, 
gdy kształt jądra odbiega od kształtu kulistego. Wyż¬ 
sze momenty są z reguły bardzo małe i zwykle można 
je pominąć. 

Pomiar momentu kwadrupolowego jądra (np. kształty 
przez obserwację wpływu pola elektrycznego jądra jąder 
na ruch elektronów poruszających się po orbitach 
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Rys. 6. Znak i wartość elektrycznego momentu kwadrupolowego 
dostarczają informacji o kształcie jądra 


jąder o parzystej liczbie nukleonów i liczbą połówko¬ 
wą dla jąder o A nieparzystym. Pochodzi on od wek¬ 
torowego złożenia się momentów pędu ruchu nukleo¬ 
nów w jądrze oraz ich własnych spinów równych 
Wszystkie niewzbudzone jądra o parzystej licz¬ 
bie zarówno protonów, jak i neutronów mają spin 
równy zeru. Jest to konsekwencją wspomnianej już 
tendencji do łączenia się nukleonów jednego rodzaju 
w pary. Całkowity moment pędu takiej pary mika, 
gdyż najchętniej łączą się w nią nukleony o przeciwnie 
skierowanych momentach pędu. Wartości spinów 
wszystkich jąder w stanie podstawowym, o nieparzy¬ 
stej liczbie nukleonów jednego lub obu rodzajów, 
wyjaśniono na podstawie obecnych danych o budo¬ 
wie jądra. Jest to istotny sukces teorii jądra atomo¬ 
wego. 

Jądro atomowe ma, obok ładunku elektrycznego 
Ze, pewne własności magnetyczne, opisywane przez 
dipolowy moment magnetyczny. Wiąże się on ze spi¬ 
nem jądra, lecz w odróżnieniu od niego nie jest wiel¬ 
kością skwantowaną — może przyjmować dowolne 


atomowych — moment kwadrupolowy wpływa na 
nadsubtelną strukturę widm optycznych) najczęściej 
jest źródłem informacji o kształcie jądra (rys. 6). Oka¬ 
zuje się, że istnieje wiele jąder silnie zdefonnowanych 
w stanie podstawowym, o dużej wartości momentu 
kwadrupolowego, których kształt przypomina w więk¬ 
szości wypadków wydłużone cygaro. Skupiają się 
one w pewnych obszarach tablicy pierwiastków 
(np. zdeformowane są jądra z obszaru pierwiastków 
ziem rzadkich oraz z obszaru aktynowców), poprze¬ 
dzielanych obszarami silniej związanych jąder sfe¬ 
rycznych skupionych wokół jąder magicznych (tj. 
jąder o tzw. magicznych liczbach protonów i neutro¬ 
nów równych jednej z liczb 2, 8, 20, 50, 82, 126 
cechują się one szczególnie silnym wiązaniem i trwa¬ 
łością). Kształt jądra wpływa na widmo jego wzbu¬ 
dzeń. Jądra zdeformowane mogą np. szczególnie łat¬ 
wo rotować wokół osi prostopadłej do osi ich sy¬ 
metrii. Prowadzi to do pojawienia się w ich energiach 
wzbudzenia regularnych sekwencji zwanych pasmami 
rotacyjnymi. 
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Wzbudzenia jąder atomowych 

Zgodnie z prawami mechaniki kwantowej jądro ato¬ 
mowe może znajdować się tylko w pewnych stanach 
o określonych cechach kwantowych, m.in. spinie, 
parzystości, energii. Stwierdzenie powyższe jest ścisłe 
tylko dla energii wzbudzenia jądra, która jest za ma¬ 
ła, aby mogła nastąpić emisja jakiegokolwiek nu¬ 
kleonu z jądra, czyli dla energii mniejszych od energii 
wiązania najsłabiej związanego nukleonu (zwanej 
energią wiązania ostatniego nukleonu). Dla energii 
większych każda energia, spin i parzystość są do¬ 
puszczalne. Jest to zrozumiałe, gdyż każdy stan, z któ¬ 
rego może nastąpić emisja cząstki o pewnej energii 
kinetycznej, można utworzyć przez wprowadzenie 
cząstki o takiej samej energii do jądra. Cząstce mo¬ 
żemy jednak nadać dowolną energię kinetyczną. 
W ten sposób możemy tworzyć stany jądra o dowol¬ 
nej energii. Okazuje się jednak, że tylko przy niektó¬ 
rych wyróżnionych wartościach energii jądro tworzy 
układ trwający pewien, odpowiednio długi czas 
(rozumie się przez to czas co najmniej kilkakrotnie 
dłuższy od tzw. charakterystycznego czasu jądrowego 
potrzebnego na przejście najszybszego nukleonu 
w jądrze przez odcinek równy średnicy jądra, wynosi 
on w zależności od jądra i jego energii wzbudzenia 
lQ- 22 _i 0 —w ny odróżnieniu od stanów leżących po¬ 

niżej progu na emisję nukleonów, zwanych stanami 
związanymi, wzbudzone stany leżące w obszarze 
stany continuum energii noszą nazwę stanów rezonanso- 
związane i wych. Istnienie bariery kulombowskiej na powierz- 
rezonansowe jądra może być przyczyną znacznego utrudnienia 
emisji cząstek naładowanych ze stanów niezwiąza- 
nych o małej energii. Gdy emisja neutronów będą¬ 
cych cząstkami obojętnymi jest niemożliwa (gdy np 
energia wiązania neutronu jest większa niż energia 
wzbudzenia), stany takie wykazują cechy stanów 
związanych i dlatego nazwano je „kwazizwiązanymi”. 

Wszystkie stany wzbudzone jąder, zarówno zwią¬ 
zane jak i rezonansowe, istnieją tylko przez pewien 
czas życia określony czas, którego średnia wartość zwana jest 
stanu czasem życia stanu. Stany związane rozpadają się 
przez wysłanie promieniowania y lub niekiedy ulega¬ 
ją rozpadowi /? (—*■ Rozpady jąder atomowych). Stany 
rezonansowe rozpadają się najczęściej przez emisję 
nukleonu lub grupy nukleonów. 



Rys. 7. Krzywa względnego prawdopodobieństwa wzbudzenia 
stanu o szerokości r przy różnych wartościach energii 


Prawdopodobieństwo wzbudzenia stanu rezonanso¬ 
wego jest funkcją energii wzbudzenia E wyrażoną 
wzorem (rys. 7) ^ 

P(E ^ ~ (£-Ą,) 2 +r 3 /4' 

Występująca we wzorze wielkość r, równa zakresowi 
energii, dla którego gęstość prawdopodobieństwa 
wzbudzenia stanu jest większa od połowy wartości 
maksymalnej (przy E = E 0 ), nazywa się szerokością 
energetyczną stanu. Stanowi wzbudzonemu nie od- 
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powiada więc dokładnie jedna wartość energii. Pod 
pojęciem „energia stanu” rozumie się odpowiadającą 
mu wartość E 0 . Szerokość energetyczna r wiąże się 
z jego czasem życia r przez zasadę nieoznaczoności 
Heisenberga: 

Pt x h. 

Stany rezonansowe mają z reguły znacznie większą 
szerokość energetyczną od stanów związanych (kró¬ 
cej żyją; rys. 8 i 9). Jest to konsekwencją faktu, że na 



energia wzbudzenia 


Rys. 9. Zależność od energii wzbudzenia szerokości jT poziomów 
o spinie 0 w jądrze **Sc. Linie przerywane oznaczają szerokości 
poziomów w przypadku gdyby był możliwy ich rozpad tylko 
przez emisję kwantów y (/%) lub nukleonów (r*). Poniżej energii 
wiązania ostatniego neutronu emisja nukleonów jest niemożliwa. 
Powyżej energii wiązania fp decyduje o szerokości stanu 


ogół emisja nukleonów następująca pod wpływem 
niezwykle silnych oddziaływań jądrowych jest znacz¬ 
nie bardziej prawdopodobna niż emisja promienio¬ 
wania elektromagnetycznego lub emisja elektronu 
i neutrina w rozpadzie fi powodowane znacznie słab¬ 
szymi oddziaływaniami. Im wyższa jest energia sta¬ 
nu, tym większa jest jego szerokość, gdyż rośnie liczba 
możliwych sposobów emisji nukleonów (np. mogą 


































energia potencjalna 


być wysyłane z coraz bardziej różnymi wartościami 
energii), co zwiększa prawdopodobieństwo rozpadu 
stanu. 

wzbudzenie Aby zrozumieć proces wzbudzenia jądra, wyobraź- 
jądra my je sobie jako twór składający się z nukleonów bę¬ 
dących w ciągłym ruchu. Każdy nukleon, podobnie 
jak elektrony na orbitach atomowych, porusza się 
z pewną określoną energią kinetyczną po swej or¬ 
bicie. Nukleony są fermionami, czyli cząstkami o spi¬ 
nie połówkowym, muszą więc podporządkowywać 
się zakazowi Pauliego mówiącemu, że dwie identycz¬ 
ne cząstki nie mogą przebywać w identycznych sta¬ 
nach. Dlatego też, mimo że w jądrze niewzbudzonym 
nukleony dążą do przebywania na orbitach o jak naj¬ 
mniejszej energii, zakaz Pauliego zmusza je do zaj¬ 
mowania kolejnych, nie obsadzonych orbit o coraz 
wyższych energiach (rys. lOa). 



Rys. 10. Schematyczny rysunek przedstawiający różne rodzaje 
wzbudzeń jądra atomowego: a) stan podstawowy — nukleony 
zajmują orbity położone najniżej w skali energetycznej, b) wzbu¬ 
dzenie jednocząstkowe — jeden z nukleonów jest przeniesiony 
na orbitę o większej energii, c) wzbudzenie wielocząstkowe — 
wiele nukleonów jest przeniesionych na orbity o wyższych 
energiach 



Wzbudzenie jądra atomowego polega na zmianie wzbudzenia 
ruchu pewnej liczby nukleonów. Na przykład gdy ca- jednocząst- 
ła energia wzbudzenia jest skupiona na jednym nu- kowe 
kleonie — tylko on jest przeniesiony na orbitę o więk- i kolektywne 
szej energii — mówimy, że wzbudzenie ma charakter 
jednocząstkowy (rys. lOb). Jest to najprostsza kon¬ 
figuracja stanu wzbudzonego. We wzbudzeniu może 
brać również udział wiele nukleonów (rys. lOc). Jeśli 
wzbudzenie przenosi się w sposób skorelowany zJed¬ 
nych nukleonów na inne, możemy mieć do czynienia 



Rys. 12. Gigantyczny elektryczny rezonans dipolowy. Protony 
i neutrony drgają wokół środka masy jądra 


z wzbudzeniem kolektywnym, które objawia się np. rezonans 
w postaci wibracji powierzchni jądrowej lub rotacji gigantyczny 
całego jądra (rys. 11). We wzbudzeniach mogą brać 
udział w sposób spójny niemal wszystkie nukleony 
jądra — prowadzi to do wzbudzeń typu rezonansów 
gigantycznych (rys. 12). 


Modele i własności jąder 

Do opsiu stanów stosuje się różne metody zależnie 
od typu wzbudzenia. Wzbudzenia o prostej konfigu¬ 
racji najłatwiej przedstawić opisując indywidualne 
stany biorących w nim udział nukleonów. Dla wzbu¬ 
dzeń kolektywnych taki opis jest już zbyt skompliko¬ 
wany, wymaga uwzględnienia dużej liczby stopni 
swobody układu wielu nukleonów biorących udział 
we wzbudzeniu. Sytuacja znacznie się upraszcza po współrzędne 
wprowadzeniu współrzędnych kolektywnych zwią- kolektywne 
zanych z kształtem i orientacją w przestrzeni jądra 
jako całości i rozpatrywaniu wzbudzeń niewielu stop¬ 
ni swobody związanych z tymi współrzędnymi. Przy¬ 
kładem mogą tu być wzbudzenia rotacyjne opisywane 
bardzo prosto przez wprowadzenie obrotu odpowied¬ 
nio zdeformowanego jądra, natomiast bardzo skom¬ 
plikowane w opisie wielocząstkowym. 

Aby opisać własności stanów wzbudzonych należy 
przyjąć pewne założenia dotyczące oddziaływań, ja¬ 
kim ulegają nukleony, czy też jakie wpływają na ko¬ 
lektywne stopnie swobody. W tym celu stosuje się 
modele budowy jądra atomowego (-*Modele jądro¬ 
we). Proste konfiguracje opisuje się za pomocą mo¬ 
delu powłokowego, operującego wzbudzeniami i od¬ 
działywaniami poszczególnych nukleonów. Bardziej 
skomplikowane konfiguracje opisuje się za pomocą 
odpowiednich modeli kolektywnych. 

Na ogół konfiguracja stanu wzbudzonego opisy¬ 
wana za pomocą danego modelu nie jest konfiguracją 
„czystą”, tzn. będącą określonym wzbudzeniem nu¬ 
kleonu czy grupy nukleonów, czy też związaną ze 
wzbudzeniem określonego kolektywnego stopnia 
swobody. Wszystkie stany różniące się tylko magne- jądrowy 
tyczną liczbą kwantową — rzutem spinu na wybraną poziom 
oś kwantyzacji określa się pojęciem „jądrowego po- energetyczny 
ziomu energetycznego”. (Gdy na jądro nie działają 
czynniki zewnętrzne, np. pole magnetyczne, energia 
stanu nie zależy od kierunku ustawienia spinu w prze¬ 
strzeni — wszystkie stany należące do danego po¬ 
ziomu mają wówczas tę samą energię). Sąsiedztwo 
dwu poziomów o innej konfiguracji a tym samym spi¬ 
nie i parzystości powoduje, że następuje „zmiesza- mieszanie 
nie” konfiguracji, tzn. jeden i dnigi stan stają się mie- konfiguracja 
szaniną obu konfiguracji różniących się np. liczbą 
wzbudzonych nukleonów (rys. 13; mieszające się 
stany muszą mieć ten sam spin i parzystość, gdyż od¬ 
działywania jądrowe zachowują te wielkości). Jest to 
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znowu jedna z charakterystycznych kwantowych cech 
mikroświata: stany o identycznych cechach kwanto¬ 
wych są w zasadzie nierozróżnialne. Stany o nieco 


Przy dalszym dodawaniu nukleonów do jądra po¬ 
dwójnie magicznego wzbudzenia stają się coraz bar¬ 
dziej kolektywne. Oddziaływania między nukleonami 



Rys. 13. Mieszanie konfiguracji. Pod wpływem oddziaływań międzynukleonowych konfiguracje blisko położonych poziomów o tym 
samym spinie /1 parzystości P ulegają zmieszaniu 


różnych cechach kwantowych, np. różnej energii 
a tym samym spinie i parzystości starają się jak naj¬ 
bardziej upodobnić do siebie. Im mniejsza jest róż¬ 
nica energii między nimi, tym większy jest stopień 
zmieszania. Mieszanie się konfiguracji można inter¬ 
pretować w ten sposób, że jądro wzbudzone do dane¬ 
go stanu pod wpływem oddziaływań międzynukleo¬ 
nowych wielokrotnie przechodzi od jednej konfigu¬ 
racji do drugiej. Zmieszanie zmienia energię stanów 
— poziomy odsuwają się od siebie. Oczywiście, może 
nastąpić wzajemne mieszanie wielu sąsiadujących 
poziomów mających podobne liczby kwantowe. 
W takiej sytuacji funkcja falowa danego poziomu ma 
wiele składowych odpowiadających różnym kon¬ 
figuracjom. Poziomy jądrowe o niewielkich energiach 
wzbudzenia są stanami stosunkowo „czystymi”—w ra¬ 
mach odpowiednio dobranego modelu dają się opisać 
za pomocą funkcji falowej zawierającej niewielką licz¬ 
bę składowych o łatwej interpretacji fizycznej. Wynika 
to stąd, że przy małych energiach wzbudzenia po¬ 
ziomy o podobnych liczbach kwantowych pojawiają 
się rzadko. 

Jądra, w których liczba protonów i neutronów 
równa jest jednej z liczb magicznych; 2, 8, 20, 50, 82, 
jądra 126, są szczególnie trwałe (np. ^O, JJCa, 2 J$Pb) 
magiczne i nazywane są jądrami magicznymi. Ze względu na 
dużą trwałość jąder magicznych do ich wzbudzenia 
potrzebna jest znacznie większa energia niż do wzbu¬ 
dzenia jąder sąsiednich (np. energia pierwszych sta¬ 
nów wzbudzonych w jądrach 1 JO i J |0 wynoszą od¬ 
powiednio: ok. 6 MeV i ok. 2 MeV, w jądrach 
™JPb i *JfPb — odpowiednio 1 MeV i 2,6 MeV). 
Dlatego też najniżej leżące poziomy wzbudzone ją- 
wzbudzenia der bliskich jądrom podwójnie magicznym są wzbu- 
jąder dzeniami stosunkowo prostymi. Bierze w nich udział 
bliskich niewielka liczba nukleonów znajdujących się poza 
magicznym rdzeniem — jądrem podwójnie magicznym. Na przy¬ 
kład wzbudzenia jąchra różniącego się od jądra po¬ 
dwójnie magicznego liczbą nukleonów o jeden od¬ 
zwierciedlają sekwencję kolejnych poziomów jedno- 
cząstkowych w danym obszarze liczb masowych. W se¬ 
kwencji tej nie widać jakiejkolwiek regularności tak 
w energii, jak i w spinach kolejnych poziomów wzbu¬ 
dzonych. Stąd też widma wzbudzeń jąder bliskich 
jądrom magicznym również nie wykazują specjalnych 
cech regularności. Mogą one być zasadniczo różne 
w sąsiadujących jądrach, gdyż przy niewielkiej liczbie 
wzbudzonych nukleonów dodanie jednego nukleonu 
zmienia w sposób istotny sytuację. Przy wyższych 
energiach wzbudzenia konfiguracje przestają być tak 
proste, ponieważ możliwe stają się również wzbudze¬ 
nia rdzenia, których konfiguracje mogą się mieszać 
z konfiguracjami pozostałych nukleonów. 
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znajdującymi się poza rdzeniem prowadzą do powsta¬ 
nia między nimi korelacji (również przestrzennych, 
np. może powstać trwała deformacja jądra). Wzbudze¬ 
nia są teraz wzbudzeniami całych zespołów nukleo¬ 
nów. Ich cechami charakterystycznymi są małe war¬ 
tości energii, występowanie regularności w sekwencji 
energii i spinów oraz podobieństwo u wielu jąder 
(rys. 14). Wzbudzenia mają charakter najbardziej 
kolektywny w jądrach, w których liczby protonów 
i neutronów Z i Wieżą w przybliżeniu w połowie mię¬ 
dzy dwoma kolejnymi liczbami magicznymi (np. 
w jądrach izotopów pierwiastków ziem rzadkich lub 
aktynowców). Najbardziej wyróżniającą się cechą pasma 
wzbudzeń tych jąder są pasma rotacyjne wynikające rotacyjne 
z istnienia obrotów zdeformowanych jąder wokół 
osi prostopadłej do osi ich symetrii. Dalsze zwiększa¬ 
nie liczby nukleonów prowadzi do tworzenia jąder 
coraz bliższych następnemu jądru magicznemu. 
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Rys. 14. Widma wzbudzeń poziomów rotacyjnych jąder zdefor¬ 
mowanych. Liczby podają energię wzbudzenia poziomu (w MeV) 
oraz jego spin, znak (+) dotyczy parzystości. Dla różnych jąder 
widma te wyglądają bardzo podobnie 
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Wzbudzenia tych jąder stopniowo tracą charakter niu od gazu klasycznego, zależność całkowitej energii 
kolektywny. od temperatury nie jest liniowa lecz kwadratowa. 

Przy dużych energiach wzbudzenia (od 20 MeV Gwałtowny wzrost gęstości poziomów w zależności 
dla jąder lekkich, od 10 MeV dla jąder ciężkich) gę- od energii wzbudzenia jest wynikiem nie tylko zwięk- 
stość poziomów staje się bardzo wielka, bowiem po- szenia się ilości możliwych sposobów rozkładu energii 
dobną energię wzbudzenia można osiągnąć różnymi wśród nukleonów biorących udział we wzbudzeniu, 
sposobami, np. przez wzbudzenie bardzo różnej licz- lecz również wynikiem wzrostu średniej liczby wzbu- 
by nukleonów. Rośnie szerokość energetyczna po- dzonych nukleonów. . . 

ziomów. W rezultacie poziomy zaczynają się pokry- Przy ustalonej energii wzbudzenia gęstość pozio- 
wać. Duża gęstość poziomów powoduje, że wszystkie mów zależy od ich spinów. Jest to zrozumiałe, gdy się 
stany w danym obszarze energii wzbudzenia są bar- weźmie pod uwagę fakt, że aby utworzyć stan o wyso- 
dzo silnie zmieszane — ich funkcje falowe mogą kim spinie, nukleony muszą obsadzać poziomy w taki gęstofeć 
zawierać nawet miliony składowych! W tej sytuacji sposób, by spiny możliwie licznej grupy nukleonów poziomów 
do opisu własności poziomów stosuje się na ogół me- układały się w tym samym kierunku dając odpowied- a spin 
tody statystyczne. Między innymi zakłada się, że nio dużą wypadkową wartość. Ogranicza to swobodę 
pojawienie się każdej z tych wielu konfiguracji jest rozdziału energii na poszczególne nukleony (a więc 
równie prawdopodobne. Obliczone przy tych zało- swobodę obsadzania różnych orbit) i obniża gęstość 
żeniach prawdopodobieństwo rozpadu stanu, np. stanów. Dla każdej energii wzbudzenia istnieje pewna 
przez emisję nukleonu, jest uwarunkowane wyłącznie optymalna wartość spinu, przy której gęstość jest 
prawdopodobieństwem przejścia nukleonu przez skok maksymalna, oraz pewna maksymalna wartość spinu, 
potencjału na powierzchni jądra i nie wymaga znajo- Osiąga się ją tylko przy szczególnej, jedynej konfigu- 
mości struktury stanu rozpadającego się i stanu, w ja- racji, w której spiny nukleonów u.ozone są w sposob 
kim jądro pozostaje po rozpadzie (tzn. nie trzeba najbardziej równoległy. Nie ma sensu wówczas mówić 
rozpatrywać możliwości tworzenia takiej konfiguracji o temperaturze związanej ze wzbudzeniem mimo 
stanu wzbudzonego, w której nukleon jest wzbudzony dużej energii wzbudzenia jądro jest „zamrożone., po- 
do energii odpowiadającej energii jego emisji). W wię- dobnie jak we wzbudzeniach bliskich stanowi podsta- 
kszości wypadków konfrontacja z eksperymentem wowemu. Innymi słowy, cała energia wzbudzenia jest 
potwierdza słuszność przyjętych założeń. skupiona w określonym przez spin obrocie jądra, mc 



energia wzbudzenia 

Rys. 15. Zależność gęstości poziomów od energii wzbudzenia dla 
dwóch różnych jąder 

gęstość Gęstość poziomów bardzo silnie zależy od energii 
poziomów wzbudzenia. Zależność ta jest w przybliżeniu wykład- 
a ensrgia nicza — zwiększenie energii wzbudzenia o 2-3 MeV 
wzbudzenia pow oduje już ok. 10-krotny wzrost gęstości! (rys. 15). 

Do szacowania gęstości poziomów stosuje się metody 
statystyczne z termodynamiki. Jądro traktuje się wów¬ 
czas jako gaz fermionów w równowadze termodyna¬ 
micznej o pewnej temperaturze odpowiadającej ener¬ 
gii wzbudzenia. Istnienie skwantowanych, stosunko¬ 
wo rzadko rozmieszczonych stanów energetycznych 
nukleonów oraz zakazu Pauliego powoduje, że spo¬ 
śród wszystkich nukleonów tylko te mogą brać udział 
we wzbudzeniach, które są najbliżej nie obsadzonych 
stanów nukłeonowych (najbliżej tzw. powierzchni 
Fermiego). Średnia liczba wzbudzonych nukleonów 
jest liniową funkcją temperatury. Zatem, w odróżnie- 



Rys. 16. Przykłady teoretycznie oszacowanych linii „yrast” 


nie pozostaje na jego wzbudzenie wewnętrzne. Za- linia yrast 
leżność maksymalnej wartości spinu od energii wzbu¬ 
dzenia (rys. 16) nosi nazwę linii „yrast” (szwedz. „naj¬ 
bardziej zakręcony”). Istnienie linii yrast ma poważny 
wpływ na rozpad stanów wysokospinowych, m.in. 
utrudnia emisję nukleonów, które unosząc z jądra 
znaczną energię wzbudzenia (równą ich energii kine¬ 
tycznej zwiększonej o energię wiązania), muszą rów¬ 
nież wynieść duży spin, gdyż maksymalny spin jądra 
po emisji jest znacznie mniejszy od spinu wyjściowego. 

Ze względu na ma^ gęstość poziomów o dużym 
spinie stopień ich zmieszania jest stosunkowo mały. 

Mimo znacznej energii wzbudzenia poziomy o dużym 
spinie są więc, podobnie jak poziomy w pobliżu stanu 
podstawowego, stosunkowo „czyste”. Utworzenie stany wyso- 
jądra w stanie o wysokim spinie nie jest łatwe, gdyż kospinowe 
wnikająca do jądra cząstka, niosąca duży moment pę¬ 
du, ma energię na tyle wysoką, że mało prawdopo¬ 
dobne jest jej pozostanie w jądrze. Nie dotyczy to 
ciężkich jonów, które z powodu dużej masy nawet 
przy małych prędkościach mają w zderzeniu z jądrem 
duże momenty pędu. Właśnie dzięki reakcjom przez 
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nie wywoływanym stany wysokospinowe są obecnie 
intensywnie badane. 

Wspomniane uprzednio założenie o równopraw¬ 
ności każdej konfiguracji w obszarze gęsto leżących 
stanów nie jest jednakże zawsze spełnione. Okazuje 
się, że przy pewnych energiach wzbudzanie niektórych 
konfiguracji jest szczególnie łatwe, występują one w 
stanach wzbudzonych z wyjątkowo dużą amplitudą. 
Przykładem mogą być tu wszelkie rezonanse gigan¬ 
tyczne, które zawsze występują przy stosunkowo du¬ 
żych energiach. Na przykład maksimum elektrycznego 
dipolowego rezonansu gigantycznego, polegającego 
na oscylacjach protonów i neutronów względem środ¬ 
ka masy jądra, występuje przy energiach wzbudzenia 
wynoszących kilkanaście MeV. Rezonans ten ma spin 
różniący się od spinu stanu podstawowego o dodaną 
wektorowo wartość równą 1 h i ma przeciwną parzy¬ 
stość. We wszystkich stanach w tym obszarze energii 
wzbudzenia, mających spiny utworzone z wektoro¬ 
wego dodania do spinu stanu podstawowego wartości 
lft i mających przeciwną parzystość niż stan podsta¬ 
wowy, prawdopodobieństwo wystąpienia konfigura¬ 
cji rezonansu dipolowego jest znacznie zwiększone, 
co objawia się przez uprzywilejowanie emisji z tych 
stanów dipolowych kwantów y. 

Podobną sytuację mamy w wypadku analogowych 
rezonansów izobarycznych. Znacznie upraszczając 
zagadnienie, naturę tych rezonansów można wyjaśnić 
następująco. Z niezależności ładunkowej sił jądrowych 
wynika, że stany jądrowe nie powinny zależeć od 
zamiany neutronu na proton znajdujący się na takiej 
samej orbicie (i odwrotnie — protonu na neutron; 
nie dotyczy to jąder ciężkich, w których istnieje nad¬ 
miar neutronów, więc wszystkie orbity neutronowe 
odpowiadające protonom są już zajęte), lecz powinny 
być prawie identyczne. Jednakże naładowany proton 
ma w polu kulombowskim jądra energię potencjalną 
wynoszącą od kilku do kilkunastu MeV (w zależności 
od ładunku Ze jądra), energia stanu musi być więc 
o taką wartość zwiększona. Zatem stan znajduje się 
teraz w obszarze gęsto położonych poziomów wzbu¬ 
dzonych jądra powstałego po zamianie neutronu na 
proton. Jest on zwany analogiem odpowiedniego 
niskoleżącego stanu w jądrze o tym samym A (a więc 
w izobarze), lecz o Z protonach i N neutronach, nazy¬ 
wanego stanem macierzystym. We wszystkich stanach 
wzbudzonych jądra (Z+1, N—l) o spinie i parzysto¬ 
ści takiej samej jak spin i parzystość stanu macierzy¬ 
stego, a znajdujących się w bezpośrednim sąsiedztwie 
miejsca, w którym powinien wystąpić stan analogowy, 
znacznie wzmocniona jest konfiguracja taka, jaką ma 
stan macierzysty (szczególnie jeśli jest to konfiguracja 
prosta). Uśrednienie widma stanów w pewnym prze¬ 
dziale energii uwidocznia pozornie istniejący w tym 
obszarze energii oddzielny stan rezonansowy o dużym 
wkładzie struktury stanu macierzystego zwany ana¬ 
logowym rezonansem izobarycznym (rys. 17). Do 
opisu własności tych stanów wprowadza się formalizm 
izospinu (zwanego również spinem izotopowym — 
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Siłami jądrowymi nazywamy specyficzne siły, które 
działają między nukleonami (neutronami i protona¬ 
mi), tj. składnikami jądra atomowego i powodują 
ich wiązanie. Stanowią one szczególny i najlepiej zba¬ 
dany przypadek oddziaływań silnych występujących 
pomiędzy hadronami (barionami i mezonami, —► 
Cząstki elementarne i ich oddziaływania). Oddzia¬ 
ływania silne tworzą odrębną klasę wśród czterech 
znanych w fizyce oddziaływań (silne, elektroma¬ 
gnetyczne, słabe i grawitacyjne) i są najsilniejszymi 
z nich. 
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Rys. 17. Przekrój czynny reakcji rozpraszania elastycznego pro¬ 
tonów przez jądra argonu: 4# A(p, p)*°A. W obszarze, w którym 
powinien wystąpić stan analogowy (dla wzbudzeń odpowiadają¬ 
cych energii wychwytywanych protonów ok. 1,87 MeV) szczegól¬ 
nie łatwo wzbudzają się poziomy o liczbach kwantowych takich 
samych jak stan analogowy — duży jest w nich udział konfigu¬ 
racji stanu analogowego. Uśredniony przekrój czynny (linia prze¬ 
rywana) zachowuje się w tym obszarze energii protonów tak, jak 
gdyby istniał rezonans w wychwycie protonów 

w formalizmie tym zakłada się, że proton i neutron 
są dwoma stanami tej samej cząstki różniącymi się 
ustawieniem izospinu w wyimaginowanej izoprze- 
strzeni). 

Jądra można wzbudzać różnymi metodami. Wnik¬ 
nięcie nukleonu lub złożonej cząstki do jądra prowa¬ 
dzi na ogół do powstania stanów wysokowzbudzo- 
nych, gdyż poza energią kinetyczną wniesioną do ją¬ 
dra wydziela się energia wiązania nukleonu czy też 
grupy nukleonów. Tworzenie stanów o niższej energii 
w wyniku rozpadu stanów wysokowzbudzanych jest 
na ogół niezależne od ich struktury, która przy ma¬ 
łych energiach wzbudzenia może być bardzo różno¬ 
rodna (jest to wynikiem zmieszania różnych konfigu¬ 
racji w stanie wysokowzbudzonym). Reakcje przekazu 
nukleonu lub grupy nukleonów między jądrem a czą¬ 
stką przelatującą w bezpośrednim sąsiedztwie jego 
powierzchni preferują tworzenie stanów o konfigu¬ 
racjach prostych, odpowiadających pojawieniu się 
nukleonów na określonych orbitach wokół niewzbu- 
dzonego jądra tarczy (lub wyrwaniu nukleonów 
z określonych jego orbit). W reakcjach rozpraszania 
nieelastycznego preferowane są wzbudzenia kolektyw¬ 
ne (np. pobudzenie jądra do oscylacji lub rotacji przez 
pole jądrowe lub kulombowskie przelatującej w jego 
pobliżu cząstki). 

Badania wzbudzeń jądrowych, ich konfiguracji 
(najczęściej za pomocą reakcji jądrowych) oraz roz¬ 
padów dostarczają podstawowych danych do pozna¬ 
nia budowy jądra i natury sił jądrowych. Mimo ol¬ 
brzymiego postępu w ostatnich latach, w dziedzinie 
tej jest jeszcze wiele zagadnień niedokładnie pozna¬ 
nych i nie rozwiązanych. 

A. Bohr, B.R. Mottelson Struktura jądra atomowego , t. 1. 
Warszawa 1975; B.L. Cohen Concepts of Nuclear Physics, New 
York 1971; P. Marmier, E. Sheldon Physics of Nuclei and 
Particlcs, vol. 1, New York 1971; E. Segrć Nuclei and Partlcles , 
New York 1964. 
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W powyższym, tradycyjnym określeniu sił jądro¬ 
wych, które tu przyjmujemy, ograniczamy się do od¬ 
działywań występujących w jądrach zwykłych. W hi- 
perjądrach występuje jeszcze dodatkowo oddziały¬ 
wanie między nukleonami a cząstką A (-* Hipeijądra). 

Chociaż często używa się intuicyjnego pojęcia siły, 
to jednak przy ilościowym opisie oddziaływania po¬ 
między nukleonami stosuje się pojęcia energii oddzia¬ 
ływania lub potencjału, tj. te pojęcia, których się uży¬ 
wa w mechanice kwantowej opisującej mikroobiekty, 
jakimi są nukleony. 
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W porównaniu z oddziaływaniami elektromagne¬ 
tycznymi i grawitacyjnymi, wiedza nasza o oddziały¬ 
waniach jądrowych jest bardzo niepełna. Jednym z po¬ 
wodów tego jest ich bardzo mały zasięg (promień 
działania). Objawiają się one dopiero przy bardzo 
dużych zbliżeniach nukleonów (jak w jądrze atomo¬ 
wym lub przy zderzeniu jąder), a więc w sytuacjach, 
których wytwarzanie i badanie można było rozpocząć 
stosunkowo niedawno (w obecnym wieku, a inten¬ 
sywniej — dopiero od lat trzydziestych, gdy zbudowa¬ 
no pierwsze akceleratory). W oddziaływaniach między 
dużymi obiektami siły jądrowe nie odgrywają żadnej 
roli i dlatego nie można było wynieść o nich żadnej 
wiedzy z fizyki klasycznej opisującej takie obiekty. 
W klasycznej fizyce ważne są tylko oddziaływania da¬ 
lekiego zasięgu, jak grawitacyjne i elektromagnetycz¬ 
ne. Drugim powodem niepełnej znajomości oddzia¬ 
ływań jądrowych jest skomplikowany ich charakter. 

Głównym źródłem wiedzy o siłach jądrowych jest 
badanie najprostszych układów nukl eon owych: neu- 
tron-proton (n-p) i proton-proton (p-p). Jest to bada¬ 
nie rozpraszania dwu nukleonów na sobie. Najdo¬ 
godniejszy do analizy teoretycznej jest układ n-p, 
ponieważ nie zaburza go odpychanie elektryczne (ku- 
lombowskie). W odróżnieniu od układów n-n i p-p, 
układ n-p ma stan związany, który również dostarcza 
informacji o siłach jądrowych. Czystego układu n-n 
nie można badać, gdyż nie ma tarcz neutronowych. 

Ważnym źródłem wiedzy są również własności ją¬ 
der, np. zależność objętości (lub promienia) jądra 
od liczby masowej A, czy też średnia energia wiązania 
przypadająca na jeden nukleon w jądrze (-* Jądra 
atomowe i ich wzbudzenia) 

Dodatkowym źródłem jest badanie oddziaływania 
mezonów (głównie mezonów n) z nukleonami. Przyj¬ 
muje się bowiem, że oddziaływanie jądrowe jest wy¬ 
nikiem wymiany mezonów pomiędzy nukleonami, 
podobnie jak oddziaływanie elektromagnetyczne jest 
wynikiem wymiany fotonów między cząstkami nała¬ 
dowanymi. 

Własności sił jądrowych 

Omówimy kilka charakterystycznych własności sił 
jądrowych. Jak pokazują wyniki rozpraszania nukleo¬ 
nów na sobie, a także własności jąder, zasięg sił ją¬ 
drowych jest bardzo krótki; wynosi ok. 1-2 fm. Jest 
krótki zasięg więc niewiele większy od promienia samego nukleonu 
i jednocześnie dosyć bliski średniej odległości między 
nukleonami w jądrze. Oznacza to z jednej strony, że 
nukleony w jądrze są dosyć ściśle „upakowane”, a z 
drugiej, że każdy nukleon w jądrze oddziałuje tylko 
z nukleonami znajdującymi się najbliżej niego, 
charakter Siły jądrowe są na ogół przyciągające. Inaczej nie 
przyciągający mogłyby istnieć układy związane nukleonów, czyli 
jądra atomowe. Szczegółowy charakter tych sił jest 
jednak skomplikowany. Na bardzo małych odległo¬ 
ściach, do ok. 0,4-0,5 fm, są one odpychające (tzw. 
rdzeń odpychający). Na dalszych odległościach mogą 
być zarówno przyciągające jak i odpychające, zależ¬ 
nie od stanu, w jakim znajduje się układ dwu nukle¬ 
onów. Przeważa jednak charakter przyciągający. 

Badanie własności jąder oraz rozpraszania nukleo¬ 
nów wskazuje, że siły jądrowe między dwoma neu¬ 
tronami (n-ri), neutronem i protonem (n-p) oraz 
dwoma protonami (p-p) są w przybliżeniu takie same, 
jeśli tylko te pary cząstek znajdują się w identycznych 
niezależność stanach. Własność ta nazywa się ładunkową niezależ- 
ładu tikowa nością sił jądrowych. Naturalnie, aby to stwierdzić, 
w badaniu oddziaływania p-p należy uwzględnić 
(odjąć) efekt odpychania kulombowskiego. 

Jedną z dróg sprawdzania ładunkowej niezależ¬ 
ności jest porównanie energii wiązania dwóch jąder 
zwierciadlanych, tj. pary jąder, których liczba pro¬ 
tonów różni się o jeden, a liczba masowa jest taka 
sama: np. pary 3 H- 3 He (rys. 1) lub n B- n C. Jądra 
takie przechodzą w siebie nawzajem przy zamianie 


wszystkich neutronów na protony i odwrotnie. Oka¬ 
zuje się, że z dużą dokładnością różnica między ener¬ 
giami wiązania tych jąder równa jest różnicy między 
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Rys. 1. Przykład jąder O O 9 U 

zwierciadlanych n p n P 

ich energiami kulombowskimi, wywołanej różną 
liczbą zawartych w nich protonów. Nie pojawienie 
się żadnej innej różnicy świadczy o tym, że siły jądro¬ 
we n-n i p-p są takie same. Własność ta, zwana 
symetrią ładunkową sił jądrowych, jest węższa od 
własności niezależności ładunkowej. Aby stwierdzić 
niezależność ładunkową, należy jeszcze wykazać, że 
siły n-p są identyczne z n-n i p-p. Do tego celu 
nie wystarcza porównywanie jąder zwierciadlanych, 
bowiem liczba wiązań n-p jest w nich taka sama. 
Należy rozważyć szersze układy, np. trójki jąder 
jak: 6 He-*Li-®Be czy 8 Li- 8 Be- B B. Porównanie ich 
energii wiązania, a także widm poziomów wzbudzo¬ 
nych, wskazuje na ładunkową niezależność sił. Na 
własność tę wskazuje także porównanie wyników roz¬ 
praszać n-p i p-p. Gdyby siły jądrowe były tylko przy¬ 
ciągające, to gęstość jądra rosłaby szybko ze wzro¬ 
stem liczby masowej A. Każdy nukleon dążyłby bo¬ 
wiem do pozostawania w zasięgu oddziaływania 
wszystkich pozostałych i promień jądra nie przekra¬ 
czałby tego zasięgu. Energia wiązania byłaby wtedy 
proporcjonalna do liczby wszystkich możliwych wią¬ 
zań, tj. liczby oddziałujących par, tzn. doA(A — l)/2, 
czyli w przybliżeniu do A 2 . Tymczasem z doświad¬ 
czenia wiadomo, że tak nie jest; gęstość jądra jest 
w przybliżeniu stała, a energia wiązania — proporcjo¬ 
nalna do A. Fakty te świadczą o własności tzw. wy¬ 
sycania (nasycania się) sił jądrowych. Mianowicie, 
siły te muszą być silnie odpychające przy małych 
odległościach (rdzeń odpychający), by zapobiec wzro¬ 
stowi gęstości przy wzroście A, oraz muszą mieć taki 
zasięg, by każdy nukleon oddziaływał tylko z naj¬ 
bliższymi sąsiadami, a nie ze wszystkimi nukleonami 
w jądrze. Ten ostatni warunek jest po to, by energia 
wiązania była proporcjonalna do A, a nie A 2 . Sytu¬ 
acja jest podobna do tej, jaka istnieje w cieczy i w ciele 
stałym. Na przykład siły występujące między mole¬ 
kułami w cieczy są odpychające na małych odległo¬ 
ściach, a przyciągające na większych, przy czym zasięg 
sił jest krótki, tak że cząstka może oddziaływać tylko 
z cząstkami najbliższymi. Wykres potencjału takich 
sił podany jest na rys. 2. 
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Rys. 2. Przykład poten¬ 
cjału sił o własności wy¬ 
sycania 

Oprócz rdzenia odpychającego, do własności wy¬ 
sycania sił wnosi także swój wkład składowa wymien¬ 
na tych sił (patrz niżej). Składowa ta jest bowiem za¬ 
leżna od stanu i powoduje, że w pewnych stanach 
siły jądrowe są odpychające na każdej odległości. 

Siły jądrowe zależą od względnego ustawienia spi¬ 
nów oddziałujących nukleonów. O zależności tej 
świadczy np. fakt, że stan 1 s (tj. najniższy energetycz¬ 
nie stan o orbitalnym momencie pędu L = 0) układu 
n-p jest związany, gdy spiny neutronu i protonu 
ustawione są równolegle (stan trypletowy o całkowi- 
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tym spinie S = 1), a nie jest związany, gdy spiny są 
ustawione antyrównolegle (stan singletowy o całko¬ 
witym spinie S — 0). 

charakter Siła między dwoma ciałami (punktowymi) dzia- 
niecentrafny łająca w kierunku linii łączącej te ciała nazywa się 
siłą centralną. Przykładem jest siła przyciągania lub 
odpychania elektrostatycznego (kuiombowskiego) 
pomiędzy elektrycznymi ładunkami punktowymi. 
Wartość bezwzględna siły centralnej (a także jej po¬ 
tencjał) zależy tylko od odległości między ciałami. 
Oprócz odległości, siła może zależeć także od orien¬ 
tacji wektora wzajemnego położenia względem kie¬ 
runku wyróżnionego w przestrzeni. W przypadku 
nukleonów może to być kierunek ich spinów. Siła 
taka nie jest już centralna i nazywa się siłą tensorową. 
Na przykład przy ustawieniu nukleonów takim, jak 
na rys. 3a (wektor wzajemnego położenia współiinio- 
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Rys. 3. Przykład różnych ustawień wektora wzajemnego poło¬ 
żenia dwu nukleonów względem kierunku ich spinów. Porówna¬ 
nie z różnymi ustawieniami dwu magnesów 

wy ze spinami) siła tensorowa jest inna niż przy usta¬ 
wieniu jak na rys. 3b (wektor położenia prostopadły 
do spinów). Przypomina to sytuację, jaką mamy przy 
znanym, klasycznym oddziaływaniu dwu magnesów. 
Przy ustawieniu A przyciągają się one, a przy usta¬ 
wieniu B —- odpychają. Dla ilustracji wzięliśmy tu 
tylko ustawienia skrajne; przy ustawieniach pośred¬ 
nich siła przyjmuje również wartości i kierunki po¬ 
średnie. 

Jednym z argumentów, który świadczy o niecen- 
tralnym charakterze sił jądrowych, jest niezerowy 
moment kwadrupolowy (elektryczny) Q deuteronu. 
Z pomiarów wynika, że moment ten jest dodatni. 
Rysunek 4 ilustruje, że dodatniemu momentowi Q 
odpowiada kształt wydłużony jądra, typu cygara 
(rys. 4a), a ujemnemu — kształt spłaszczony, typu 
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Rys. 4^Przykład wydłużonego (a) i spłaszczonego (b) kształtu 

jądra. / jest momentem pędu, a Q momentem kwadrupołowym 
jądra 

dysku (rys. 4b). Porównanie rysunków 4 i 3 sugeruje, 
że wydłużony kształt deuteronu przemawia za uprzy¬ 
wilejowaniem ustawienia (a) z rys. 3 , tj. za przycią¬ 
gającym charakterem sił jądrowych przy tym usta¬ 
wieniu. Analogia z siłami między dwoma magnesami 
jest więc bardzo duża. Jednakże natura tych dwu ro¬ 
dzajów sił jest inna. Oddziaływanie jądrowe jest 
silniejsze i ma inną zależność od odległości, identyczna 
jest tylko zależność kątowa. 





Część oddziaływania jądrowego stanowią siły wy¬ 
mienne, które są efektem czysto kwantowym, nie 
mającym żadnej analogii klasycznej. Działanie ich 


charakter 

wymienny 


1 



ł 

ł 


Rys. 5. Procesy wymiany układu neutron-proton. Neutron ozna¬ 
czony jest kółkiem wypełnionym, proton—pustym, a spin_ 

strzałką 


polega na wymianie między nukleonami niektórych 
lub wszystkich wielkości opisujących te nukleony, np.: 
położenia (tzw. siły Majorany), spinu (siły Bartletta) 
oraz zarówno położenia jak i spinu (siły Heisenberga). 
Dla pełności terminologii dodajmy, że zwykłe siły 
jądrowe, które nie prowadzą do wymiany żadnej 
wielkości, nazywają się siłami Wignera. Różne możli¬ 
wości wymiany dla układu n-p są zilustrowane na 
rys. 5. Biorąc stan a za wyjściowy, stan b otrzymuje 
się z niego przez wymianę położenia, stan c — przez 
wymianę spinu, a stan d — przez wymianę obu tych 
wielkości. To znaczy stan b otrzymywany jest ze sta¬ 
nu a (i odwrotnie), jeśli działają tylko siły Majorany, 
stan c —jeśli tylko siły Bartletta, a d —jeśli tylko siły 
Heisenberga. Siły Wignera pozostawiają stan a (jak 
również pozostałe stany 6 , c, d) bez zmiany. 

Siły wymiany znajdują wyjaśnienie w mezonowej 
teorii sił jądrowych (patrz niżej). Na przykład pro¬ 
cesy prowadzące od stanu a do b lub d z rys. 5 mogą 
być zrealizowane drogą wymiany między neutronem 
i protonem mezonu naładowanego tT lub tt + (rys. 6). 

Najbardziej bezpośredniego dowodu doświadczal¬ 
nego występowania sił wymiany dostarcza badanie 
rozpraszania neutronów na protonach. Jeśli energia 
neutronu padającego na tarczę protonową jest duża, 
znacznie większa od energii oddziaływania (przycią¬ 
gania czy odpychania) między nim a protonem, to 
neutron zdoła przekazać protonowi w trakcie od¬ 
działywania („zderzenia”) tylko małą część swojego 
pędu. Po zderzeniu będzie więc nadal poruszał się 
z dużą prędkością i w kierunku mało zmienionym 
w stosunku do początkowego (rys. 7c i d). Rozkład 
kątowy takich neutronów po zderzeniu będzie, miał 
zatem silne maksimum przy małych kątach (rys. 7 e). 
Maksimum przy dużych kątach (tzw. rozpraszanie 
do tyłu) możemy otrzymać jedynie w przypadku wy¬ 
miany neutronu na proton i odwrotnie (rys. 7h). Fakt, 
że w doświadczeniu otrzymujemy maksimum zarów¬ 
no przy małych, jak i przy dużych kątach (rys. 7 i), 
świadczy o obecności zarówno zwykłej jak i wymiennej 
składowej w oddziaływaniu jądrowym. Na rys. 7 
proces rozpraszania zilustrowany został w układzie 
laboratoryjnym (a, c, f), w którym proton tarczy 
spoczywa przed zderzeniem, oraz w układzie środka 
masy (b, d, g), w którym sumaryczny pęd obu nu¬ 
kleonów jest równy zeru. 

Siły jądrowe zależą nie tylko od wzajemnego usta¬ 
wienia spinów oddziałujących nukleonów, ale i od 
ustawienia ich względem wektora orbitalnego mo- 
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mentu pędu L. Część sił powodującą tę zależność 
nazywamy siłami spin-orbita. O istnieniu ich świad¬ 
czą bezpośrednio doświadczenia polaryzacyjne, tzn. 
takie, w których bądź tarcza, bądź wiązka padająca, 
bądź też produkty rozpraszania są spolaryzowane, 
czyli mają więcej cząstek ze spinem skierowanym do 
góry, niż w dół lub na odwrót. 


Rozważmy dla ilustracji (rys. 8 ) rozpraszanie spo¬ 
laryzowanej wiązki protonów ze spinami ustawi o- 
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nymi do góry na jądrach o spinie równym zeru. Od- tego zasada zachowania energii. Cząstka wirtualna 
działywanie protonu wiązki z jądrem jest naturalnie może być jednak wyemitowana bez spełnienia tej za- 
sumą oddziaływań ze wszystkimi nukleonami jądra, sady, byle na dostatecznie krótki czas, na jaki pozwala 
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Rys 7 Rozpraszanie neutronu o dużej energii na protonie w układzie laboratoryjnym i układzie środka masy. U dołu pokazane są 
trzy’rozkłady kątowe rozproszonych neutronów: (e) — rozkład jaki otrzymalibyśmy gdyby nie było w ogolę wymiany., (h) — gdyby 
była wyłącznie wymiana oraz (i) — rozkład jaki otrzymuje się w doświadczeniu 



Rys. 8. Rozpraszanie spolaryzowanych protonów na jądrze bez- 
spinowym. Obok zilustrowano orientację spinu protonów wzglę¬ 
dem ich orbitalnego momentu pędu 


Załóżmy dla uproszczenia, że działają tylko siły spin- 
orbita i że są one przyciągające, gdy spin o jest skie¬ 
rowany zgodnie z momentem orbitalnym L oraz od¬ 
pychające w przypadku przeciwnym. Widać z rys. 8, 
że protony będą wówczas rozpraszane tylko w lewo. 

Ponieważ w rzeczywistości siły spin-orbita są jedną 
z kilku a nie jedyną składową sił jądrowych, roz¬ 
praszanie występuje w obie strony. Obserwowana 
jednak różnica ilości cząstek rozproszonych w lewo 
i w prawo (tzw. asymetria lewo-prawo) świadczy o 
istnieniu tych sił 


Mezonowa teoria sil jądrowych 

Oddziaływanie między obiektami fizycznymi reali¬ 
zowane jest za pośrednictwem pola. W opisie kwan¬ 
towym (-* Teoria pola) oznacza to wymianę kwantów 
— cząstek tego pola. Wymiana ta prowadzi do prze¬ 
kazania pędu od jednego obiektu do drugiego, a więc 
do występowania sił między nimi. Na przykład od¬ 
działywanie elektromagnetyczne polega na wymianie 
kwantów pola elektromagnetycznego, czyli fotonów. 

Cząstki przenoszące oddziaływanie są cząstkami 
wirtualnymi, tj. cząstkami nieobserwowalnymi bez¬ 
pośrednio w procesie oddziaływania. Możliwość ich 
obserwacji oznaczałaby bowiem zwykłą ich emisję, 
dla której trzeba by dostarczyć emitującemu je obiek¬ 
towi energię potrzebną do ich wytworzenia, a więc 
równą co najmniej ich energii spoczynkowej. Wymaga 


zasada nieokreśloności Heisenberga, czyli co naj 
wyżej na czas: 

At = hfAE < rjfm 0 c\ 


gdzie AE — energia cząstki, m 0 —jej masa spoczyn¬ 
kowa, c — prędkość światła. W czasie tym cząstka 
wirtualna może się oddalić co najwyżej na odległość: 


Odległość: 


r = cAt < hcfm Q c 2 . 
r z ~ hc(m 0 c- 


<D 


jest zatem zasięgiem sił, jaki otrzymuje się za po¬ 
średnictwem pola, którego kwanty mają masę spo¬ 
czynkową m 0 . Widać stąd, że siły elektromagnetyczne 
mają zasięg nieskończony (sity długiego zasięgu), 
ponieważ dla fotonu m 0 = 0. Zasięg zaś sił jądrowych 

JeSt: tl » hcl( 140 MeV) a 1,4 fm. 


ponieważ masa spoczynkowa mezonu n (pionu), 
przenoszącego oddziaływanie jądrowe, wynosi ok. 
140 MeV/r\ 

Zasięg sił jądrowych obliczyliśmy tutaj mając zmie¬ 
rzoną masę dobrze obecnie znanego mezonu n. Histo¬ 
rycznie było jednak odwrotnie. Dla objaśnienia sił 
jądrowych wysunięto, śmiałą na owe czasy, hipotezę 
istnienia cząstek silnie oddziałujących z nukleonami 
i przenoszącymi oddziaływanie jądrowe. Znając z 
doświadczenia zasięg (krótki) tego oddziaływania 
można było oszacować na podstawie wzoru (1) ich 
masę m 0 . Dokonał tego fizyk japoński H. Yukawa 
w 1934 r., na długo przed doświadczalnym odkryciem 
samych cząstek (mezonów n), które nastąpiło dopiero 
w 1947 r. Historia ta jest jednym z ładniejszych przy¬ 
kładów, jak teoria może dać objaśnienie zjawiska na 
długo przed odkryciem jego podstaw doświadczal¬ 
nych i w efekcie odkrycie to przyśpieszyć. 

Ze wzoru (1) wynika, że zasięg sił jest tym mniej¬ 
szy, im większa jest masa spoczynkowa przenoszą¬ 
cych je cząstek. Na przykład wymiana dwu pionów 
na raz prowadzić będzie do sił o dwukrotnie mniej 
szym zasięgu niż wymiana pojedynczego pionu. 

W bardziej ilościowym ujęciu wymiana jednej cząst¬ 
ki prowadzi do oddziaływania opisanego potencjałem 
Yukawy: 

V(r ) = -g*e-*'ł r. 


zasięg sił 
jądrowych 


potencjał 

Yukawy 
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gdzie g — stała, ji = m 0 c z lhc, przy czym jest masą 
spoczynkową tej cząstki. Krótki zasięg opisany wzo¬ 
rem (1) przy m 0 ¥= 0 znajduje tu swoje odbicie w 
szybkim, wykładniczym spadku oddziaływania z od¬ 
ległością. 

Mówiąc dokładniej, potencjał Yukawy odpowiada 
wymianie cząstki skalarnej, tj. cząstki o spinie zero 
i parzystości dodatniej. Wymiana cząstki pseudo- 
skalamej (spin zero i parzystość ujemna), jaką jest 
pion, prowadzi do potencjału tensorowego. Wreszcie, 
wymiana cząstki wektorowej (spin równy jeden) 
pozwala odtworzyć rdzeń odpychający oraz oddziały¬ 
wanie spin-orbita. Ponieważ obecnie znamy mezony 
wymiana o wszystkich wymienionych cechach, można oczeki- 
mezonów wać, że wymiana ich pozwoli odtworzyć wszystkie 
omówione własności oddziaływania jądrowego. Rze¬ 
czywiście, z pomocą wymiany jednomezonowej zna¬ 
nych mezonów o masie do 1 GeV/c 2 możemy obecnie 
zadowalająco odtworzyć znane z doświadczenia 
i omówione w poprzednim paragrafie oddziaływanie 
między nukleonami. Nie oznacza to jednak jeszcze, 
że stan mezonowej teorii sił jądrowych jest już obecnie 
zadowalający. 


Zapis sił jądrowych 


Dodajmy jeszcze kilka uwag o sposobie zapisu róż¬ 
nych składowych sił jądrowych. 

Siły zależne tylko od odległości (siły centralne) 
możemy opisać potencjałem: 

Kc(r), 

gdzie r — odległość między nukleonami. 

Siły zależne od wzajemnego ustawienia spinów 
dają się opisać wyrażeniem: 


Vs(r)e t -iZ 

gdzie Oi i a 2 — wektory spinu cząstek 1 i 2. Siły te są 
różne przy dwu możliwych ustawieniach spinów: 
równoległym (stan trypletowy) i antyrównoległym 
(stan singletowy), gdyż: 


^ __ f 1 dla stanu trypletowego, 

1 2 (—3 dla stanu singletowego. 

Siły tensorowe można opisać potencjałem: 
Vr(r ) S 12> 

gdzie: 

c _ * •'•)(**•'') r r 

*>12 — >- 2 - 0 i * 02 > 


( 2 ) 


a siły spin-orbita wyrażeniem: 

V. V LS {r)L*(7 x +7^ 

We wzorach powyższych r = r x —r z jest wektorem 

względnego położenia nukleonów, a L = rxp jest 
wektorem względnego orbitalnego momentu pędu, 

przy czym p jest pędem względnym. 

Zatem całkowity potencjał oddziaływania między 
oddziaływa- dwoma nukleonami ma postać: 

ma 2 nu- 

kleonów V NN = Vc(r)+ V s (r)a x ^ 2 -f Vr(r)S x2 +'ł z V LS (s)L- 

*(<?!+(Ta). (3) 

Jest on zbudowany tak, aby był skalarem (niezmien- 
niczość względem obrotu w przestrzeni zwykłej), 
a także aby zapewniał zachowanie parzystości (nie- 
zmienniczość względem odbicia w początku układu 
współrzędnych) obowiązujące w oddziaływaniach 
silnych. Aby zapewnić niezależność ładunkową (nie- 
zmienniczość względem obrotu w przestrzeni izospi- 
nowej), każda z czterech funkcji V c (r), V s (r\ Vr(r) 
i V LS ( r ) powinna być postaci : 

V(f)= Vi(r)-hV 2 (r)7^7 2f 
gdzie r — wektor izospinu nukleonu. 
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Można wykazać, że wzór (3) jest najogólniejszą 
postacią potencjału nukleon-nukleon, jeśli uwzględnić 

zależność jego od prędkości (czy pędu p, czy też mo¬ 
mentu pędu L) tylko w pierwszej potędze. Między 
innymi opisuje on wszystkie siły wymienne. Na przy¬ 
kład wymianę spinu otrzymuje się działając na funk¬ 
cję falową wyrażeniem: 

^ = 72(1+01*^, (4) 

które zgodnie z (2) daje: 


P<r 


1 dla stanu trypletowego, 
— 1 dla stanu singletowego, 


tzn. nie zmienia znaku funkcji falowej w stanie try- 
pletowym, a zmienia znak w stanie singletowym; 
prowadzi więc dokładnie do tego samego, co ope¬ 
racja zamiany spinów między cząstkami 1 i 2. Obec¬ 
ność wyrażenia c x * a 2 w potencjale (3) oznacza zatem, 
zgodnie ze wzorem (4), obecność operatora wymiany 
spinu Pa, opisującego spinowe siły wymienne. 

Potencjał (3) zawiera ostatecznie osiem funkcji 
odległości Vi(r), które należy wyznaczyć z analizy 
wyników rozpraszania N-N (tzn. nukleonu na nukleo¬ 
nie). Wykonano wiele takich analiz; wyniki ich nie 
są jednoznaczne. Wszystkie one prowadzą jednak do 
kilku wspólnych wniosków, z których ważniejsze to: 

1) wszystkie człony w oddziaływaniu (3) są potrzebne, 

2) na małych odległościach, mniejszych od ok. 
0,5 fm, oddziaływanie jest odpychające (rdzeń od¬ 
pychający), 3) oprócz zależności od pełnego spinu, 
oddziaływanie zależy także od parzystości stanu, 
w którym zachodzi; w stanach o dodatniej parzy¬ 
stości (L — parzyste) jest ono silniejsze niż w stanach 
o parzystości ujemnej (L — nieparzyste) i jest przy¬ 
ciągające, 4) na dużych odległościach oddziaływanie 
jest dobrze opisywane przez potencjał Yukawy odpo¬ 
wiadający wymianie jednego pionu. 


Siły wiefociafowe 

Dotychczas zakładaliśmy, że siły jądrowe mają na¬ 
turę dwuciałową. Oznacza to, że jeśli mamy np. trzy 
znajdujące się blisko siebie nukleony A, B i C (rys. 9), 
to siła działająca np. na nukleon A jest: Pab+Fac , 
gdzie F ab jest siłą, która działa między nukleonami 
A i B w nieobecności nukleonu C, a Fac — siłą dzia¬ 
łającą między A i C w nieobecności B. Inaczej mówiąc, 
siły dwuciałowe działają tylko pomiędzy parą cząstek 
i nie są modyfikowane przez obecność innych czą¬ 
stek. Na przykład, w bardzo dobrym przybliżeniu 
siły elektromagnetyczne i grawitacyjne mają taki 
właśnie charakter. 

Istnieje jednakże możliwość występowania także 
trój- i więcejciałowych sił jądrowych. Możemy to 
przedstawić następująco. Przy opisie sił jądrowych 
za pomocą wymiany mezonów wymiana jednego 
mezonu odpowiada siłom dwuciałowym, bo tylko 
między dwoma nukleonami wymiana taka może za¬ 
chodzić i nie jest ona przy tym zależna od obecności 
trzeciego nukleonu. Natomiast przy wymianie dwu 
mezonów na raz jest już i inna możliwość niż wymia¬ 
na obu między dwoma nukleonami. Mianowicie 
jeden z mezonów wyemitowanych przez nukleon A 
może być pochłonięty przez nukleon B , a drugi — 
przez C. Odpowiada to już siłom trójciałowym. Ana¬ 
logicznie można przedstawić sobie cztero-, pięcio- 
i ogólnie wielociałowe siły. Widać, że przy takiej na¬ 
turze tych sił, siły trójciałowe będą miały zasięg dwa 
razy mniejszy niż dwuciałowe, a czterociałowe — 
trzy razy mniejszy itd. Wynika to ze wzoru (1), gdyż 
m 0 jest w tym wypadku masą dwu, trzech i odpo¬ 
wiednio więcej mezonów. Skoro zasięg sił dwuciało- 
wych wynosi ok. 1,4 fm, to trójciałowych wyniesie 
ok. 0,7 fm, a czterociałowych — ok. 0,47 fm. Ponie¬ 
waż średnia odległość między nukleonami w jądrach 
wynosi ok. 2,1 fm — widać, że rola sił maleje ze wzro¬ 
stem stopnia ich wielociałowości. Ponadto, ponieważ 
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Rys. 9. Trzy wza¬ 
jemnie oddziałują¬ 
ce nukleony 
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siły dwuciałowe wykazują silne odpychanie na odle¬ 
głościach mniejszych od ok. 0,5 fm i praktycznie nie 
dopuszczają do zbliżenia dwu nukleonów większego 
niż na tę odległość — należy oczekiwać, że rola sił 
cztero- i więcejciałowych jest już do pominięcia. 
Warto zatem badać jedynie siły trójciałowe, w uzupeł¬ 
nieniu do dwuciałowych. Poświęcono już wiele uwagi 
różnym efektom sił trójciałowych. Nadal jednak 


Modele jądrowe 

Adam Sobtczewski 

Jądra poznanych dotychczas pierwiastków są ukła¬ 
dami od jednego do ok. 260 nukleonów; poza pier¬ 
wiastkami najlżejszymi są więc one układami wielu 
ciał. Opis takiego układu (czyli rozwiązanie zagad¬ 
nienia wielu ciał) polegałby na pełnym określeniu 
ruchu wszystkich nukleonów powstającym pod wpły¬ 
wem ich wzajemnego oddziaływania. Wiemy jednak, 
że w ogólnym wypadku zagadnienia takiego nie po¬ 
trafimy rozwiązać ściśle już dla trzech ciał, ani w me¬ 
chanice kwantowej ani klasycznej, nawet przy stosun¬ 
kowo prostym oddziaływaniu. Tymczasem oddziały¬ 
wanie między nukleonami jest skomplikowane i nie 
w pełni jeszcze poznane (-► Siły jądrowe). 

Wyjątkowo trudne zadanie, jakie mamy przy opi¬ 
sie układu wielu nukleonów (jądro atomowe), można 
zilustrować porównując je z opisem powłoki elektro¬ 
nowej atomu (tzn. układu wielu elektronów), który 
to opis jest już bardzo złożony. Przede wszystkim, 
elektrony oddziałują ze sobą za pomocą dobrze zna¬ 
nych i stosunkowo prostych sił elektromagnetycznych, 
których główną składową jest odpychanie kulom- 
bowskie. Oddziaływanie między nukleonami zaś, jak 
wspomnieliśmy, jest skomplikowane i nie w pełni zna¬ 
ne. Poza tym, elektrony są w polu silnie naładowanego 
jądra (o ładunku równym sumie ładunków wszyst¬ 
kich elektronów — w atomie obojętnym), którego 
masa jest znacznie (ok. 1840 razy) większa od masy 
elektronu i które zatem prawie spoczywa w układzie 
środka masy. W tych warunkach oddziaływanie mię¬ 
dzy elektronami jest tylko poprawką (sprowadzającą 
się w dużej mierze do częściowego ekranowania od 
pola jądra elektronów zewnętrznych przez we¬ 
wnętrzne, a więc do zmniejszania ładunku jądra 
„widzianego” przez elektrony zewnętrzne) do oddzia¬ 
ływania ich z niemal nieruchomym centrum pola, 
jakim jest jądro. W jądrze zaś nie ma takiego cen¬ 
trum; wszystkie nukleony poruszają się „równo¬ 
prawnie” w polu jedynie wzajemnego oddziaływania. 
Pokazuje to, że opis ruchu nukleonów jest znacznie 
jeszcze trudniejszy od i tak trudnego zadania, jakim 
jest opis ruchu elektronów w atomie. 

Wszystko to powoduje, że w opisie jąder musimy 
uciekać się do znacznych uproszczeń, przybliżeń. 
Modele jądrowe są takimi właśnie uproszczeniami. 
Stosuje Się je zarówno przy opisie struktury jądra, 
jak i reakcji jądrowych. W tym ostatnim wypadku, 
zamiast o modelu, mówi się często o mechanizmie 
reakcji (-* Reakcje jądrowe). W artykule niniejszym 
omówimy modele struktury jądra. 

Model powinna cechować przede wszystkim pro¬ 
stota oraz łatwość przewidywania na jego podstawie 
własności jądra. Prostota ta jednak przyczynia się 
do organiczenia modelu oraz sprawia, że za jego po¬ 
mocą można opisać tylko niektóre własności jądra. 
Do opisu innych własności jądra trzeba użyć innego 
modelu, który często różni się znacznie od poprzed¬ 
niego, a czasem wydaje się wręcz z nim sprzeczny. 
Zachęcające do używania modeli jest jednak to, że 
niektóre z nich mają bardzo szeroki zakres stosowal¬ 
ności, co świadczy o trafności zastosowanych przy¬ 
bliżeń. Prostota modelu łączy się na ogół z jego po- 
glądowością, która jest pomocna w wyrobieniu pew¬ 


wnioski z tych badań, co do roli sił trójciałowych 
w jądrach, nie są zdecydowane i rozstrzygające. 

D.M. Brink Nuclear for ces, Oxford 1965; B.L. Cohen Con - 
cepts of nuclear physics , New York 1971; Encyklopedia fizyki , 
t. 3, str. 318, Warszawa 1974; H. Frauenfelder and E.M. Hen- 
ley Subatomic physics, Eoglewood Cliffs 1974; R. Sachs Fizyka 
teoretyczna jądra atomowego, Warszawa 1957; A. Strzałkow¬ 
ski Wstąp do fizyki jądra atomowego , Warszawa 1973: Sz. Szcze- 
niowski Fizyka doświadczalna , cz. 6, Warszawa 1974; Z. Wil- 
helmi Fizyka reakcji jądrowych, Warszawa 1976. 


nej intuicji ułatwiającej jego stosowanie. Cechę tę 
mają zwłaszcza modele oparte na analogiach kla¬ 
sycznych (np. model kroplowy jądra). 

Obecnie stosuje się ok. dziesięciu modeli struktury 
jądra, które są pewną odmianą lub połączeniem dwu 
zasadniczych modeli: modelu cząstek niezależnych 
oraz modelu cząstek silnie skorelowanych. W pierw¬ 
szym z nich nukleony lub ich grupy poruszają się we 
wspólnym potencjale niezależnie lub prawie nieza¬ 
leżnie od siebie. W drugim — nukleony oddziałują 
ze sobą tak silnie, że ruch jednego jest ściśle skorelo¬ 
wany z ruchem innych. Różne odmiany i połączenia 
tych dwu bardzo odbiegających od siebie wyobrażeń 
o ruchu nukleonów w jądrze pozwalają opisać bardzo 
różne własności jąder: od własności, w których kore¬ 
lacje między nukleonami są nieważne (efekty jedno- 
cząstkowe) do takich, w których są one podstawowe 
(efekty kolektywne). 


Modele podstawowe 

Omówimy kilka podstawowych modeli struktury 
jądra, które są najczęściej stosowane, bądź bezpo¬ 
średnio do opisu własności jądra, bądź do konstrukcji 
bardziej złożonych modeli. 


Model kroplowy 

Model kroplowy, który wykorzystuje analogię między 
jądrem a kroplą cieczy, jest najprostszą wersją mo¬ 
delu silnych korelacji. Podstawą tej analogii są dwa 
fakty doświadczalne: a) Stała gęstość materii w jądrze, 
niezależna od jego wielkości. Wynosi ona 

q x 0,17 nukleonu/fm 3 , (1) 

b) niemal stała wartość energii wiązania jądra w prze- 



Rys. 1. Zależność doświadczalnej wartości energii wiązania jądra 
na jeden nukleon B[A od liczby masowej A. Aby lepiej zilustrować 
strukturę tej zależności dla jąder 1 ekkieb, rozciągnięto dla men 
skalę A 


cząstki nie¬ 
zależne lub 
silnie skore¬ 
lowane 


energia 

wiązania 
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liczeniu na jeden nukleon B/A (rys. 1); wynosi ona 
ok. 8 MeV. Fakt, że BjA jest prawie stale, oznacza, 
że energia wiązania B jest prawie proporcjonalna do 
A 9 lub inaczej, że część B> która jest proporcjonalna 
do A (energia objętościowa) czyli 

energia B v = a v A 9 (2) 

objętościo¬ 
wa cz yni a v — współczynnik proporcjonalności, jest 
jej częścią główną. 

Obie podane własności jądra są charakterystyczne 
dla cieczy; gęstość jej jest stała, niezależnie od obję¬ 
tości (a nawet, w dużej mierze od ciśnienia zewnętrz¬ 
nego). Także ciepło parowania — które jest odpowied¬ 
nikiem energii wiązania — w przeliczeniu na jednostkę 
objętości, a zatem i na jedną cząstkę, jest stale. Wy¬ 
parowanie jednej cząstki (molekuły), a więc oswobo¬ 
dzenie jej z więzów łączących ją z innymi cząstkami, 
wymaga stałej energii określonej dla danej cieczy. 
Obie własności są wyrazem wysycania sił działających 
między molekułami cieczy, czy nukleonami w jądrze; 
siły takie działają tylko między najbliższymi sąsiadami. 

Analogię z cieczą można rozszerzyć i przyjąć, że 
nukleony znajdujące się na powierzchni jądra są wią¬ 
zane słabiej od tych, które są wewnątrz. Mają one 
bowiem ok. dwa razy mniej nukleonów w swoim naj¬ 
bliższym sąsiedztwie. Powoduje to zmniejszenie ener¬ 
gii wiązania o wielkość proporcjonalną do liczby nu- 
energia k, . eonów powierzchniowych, a zatem do pola po- 
powie- wferzchni jądra, a więc do A 2/3 . W.rezultacie zmniej- 
rzchniowa szen i et <>jest 

B$ = —a 8 A 2 * 2 . (3) 


rzystych (N i Z nieparzyste). Wkład tego efektu do 
energii wiązania można zapisać: 

( A dla jąder parzysto-parzystych, 

= \ 0 —„— nieparzystych, (6) 

l**"d —„— nieparzysto-nieparzystych. 

A jest tutaj połową energii rozerwania pary neutro¬ 
nów lub protonów. 



]^ ys * ?": .Wkład energii objętościowej, powierzchniowej, kulom- 
bowsłaej i symetrii do całkowitej (doświadczalnej) energii wiąza¬ 
nia na jeden nukleon: B/A 


model 

kropelkowy 


Idąc jeszcze dalej, można uwzględnić wpływ za¬ 
krzywienia powierzchni jądra i dodać wyrażenie 
f " a * A llz . Dokonuje się tego w modelu kropelkowym 
jądra będącym ulepszeniem modelu kroplowego. 

Przy obliczaniu energii wiązania jest niezbędne 
uwzględnienie faktu, że „ciecz” jądrowa jest nałado¬ 
wana dodatnio. Trzeba więc dodać (ujemną) energię 
odpychania kulombowskiego 


energia 3 

kulom- ż?kui = — 
bowska 


(Ze) 2 = _3 (Ze) 2 


5 R 


5 rA 1/z 


Z 2 

“ ~ akul ~4lj3’( 4 ) 

gdzie R = rA 1 ' 2 —-promień jądra, e — ładunek pro¬ 
tonu, a Z — liczba protonów w jądrze (liczba ato¬ 
mowa). 

Jest to już wszystko, co można osiągnąć stosując 
model kroplowy do opisu energii wiązania. Dalszy 
istotny fakt, że w niezbyt lekkich jądrach jest więcej 
neutronów niż protonów, uwzględnia się już za po¬ 
mocą modelu gazu Fermiego (patrz niżej). Daje on 
poprawkę postaci 


energia 

symetrii 


B$ym — —tfsym 


(N-Z) 2 


(5) 


która mówi, że wiązanie jądra jest najsilniejsze, gdy 
jest ono symetryczne względem zamiany neutronów 
na protony i odwrotnie, czyli gdy liczba neutronów 
N równa jest liczbie protonów Z. Energia (5) nazywa 
się energią symetrii. 

Udział poszczególnych członów: energii objętościo¬ 
wej By, powierzchniowej B s , kulombowskiej B knl oraz 
energii symetrii Ż? sym w energii wiązania B jest zilu¬ 
strowany na rys. 2. Widać z niego, że rola członu po¬ 
wierzchniowego B s jest największa dla jąder lekkich 
(bo dla nich największy jest stosunek pola po¬ 
wierzchni do objętości) i maleje ze wzrostem A. 
Rola członu kulombowskiego zaś szybko rośnie z A t 
bo razem z A wzrasta ładunek jądra Ze, Także rola 
członu symetrii 2?sym rośnie z A , gdyż razem z A 
wzrasta nadmiar neutronów w jądrze N—Z. 

Model kroplowy, oprócz energii symetrii, nie opi¬ 
suje także dwu mniejszych efektów wpływających na 
energię wiązania. Jeden — to różnica między energią 
wiązania jąder parzysto-parzystych (N i Z parzyste), 
nieparzystych (nieparzyste A) i nieparzysto-niepa- 


Drugi efekt — to efekt struktury powłokowej, któ¬ 
rego przejawem jest fakt, że niektóre jądra (o zam¬ 
kniętych powłokach) są szczególnie silnie związane. 
(Na rys. 1 jest to dobrze widoczne jedynie dla naj¬ 
lżejszego jądra o podwójnie zamkniętych powłokach: 
4 He (cząstka a), które jest znacznie silniej związane 
od jąder sąsiednich — lokalne maksimum na krzywej 
B/A. Dalsze, słabsze maksima przy A — 8, 12, 16, ... 
świadczą o tendencji jąder do „struktury alfowej”, 
tzn. do tego, by nukleony ich wiązały się w szczególnie 
trwałe grupy — cząstki a). Opisu struktury powłoko¬ 
wej jądra dostarcza oddzielny model — model po¬ 
włokowy (patrz niżej). 

Dopiero suma wszystkich wymienionych efektów 

(7) 

B — B-0+ i?«+i?kui+^sym+jBpa+ efekty powłokowe 

dobrze odtwarza doświadczalną energię wiązania B. 

Rysunek 1, choć uproszczony, pozwala jednak 
zrozumieć podstawę energetyki jądrowej. Zarówno 
reakcja rozszczepienia jądra ciężkiego, jak i reakcja 
syntezy jąder lekkich powodują wyzwolenie energii. 
Obie prowadzą bowiem od jąder słabiej związanych— 
do silniej. Najsilniej związane są jądra o A ^ 60. 

Model kroplowy jest także pomocny przy opisie 
kolektywnych drgań jąder (model kolektywny — patrz 
niżej) oraz przy opisie samorzutnego rozszczepiania 
("■* Rozpady jąder atomowych). 


Model gazu Fermiego 

Model gazu Fermiego jest najprostszą wersją modelu 
cząstek niezależnych. Przyjmuje się w nim, że nukleo¬ 
ny poruszają się niezależnie od siebie i w nieograni- 
czenie dużym obszarze (materia jądrowa — brak 
efektów powierzchniowych). Jedyna relacja między 
nimi jest narzucona przez zakaz Pauliego, który mó¬ 
wi, że cząstki identyczne nie mogą zajmować tego 
samego stanu. Ponieważ stan w modelu gazu Fer¬ 
miego jest określony przez pęd lub energię kinetyczną 
cząstki e (poziom energetyczny) i wartość rzutu jej 
spinu na wybraną oś, to każdy poziom energetyczny 
może być zajmowany przez dwa protony (o prze¬ 
ciwnych wartościach rzutu spinu) i dwa neutrony. 
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Energia poziomu przebiega ciągłe widmo wartości. 
W stanie podstawowym cząstki zapełniają poziomy 
najniższe, od energii e = 0 do energii maksymalnej 
e =e F (jest to tzw. energia Fermiego, a odpowiadające 
jej poziom i pęd są odpowiednio poziomem i pędem 
Fermiego). Wartość energii Fermiego zależy wy¬ 
łącznie od gęstości cząstek w materii jądrowej, przy 
czym neutrony i protony traktuje się jako oddzielne 
gazy Fermiego. Przy równej liczbie neutronów N 
i protonów Z w jądrze (jądra lekkie), ich gęstości są 
identyczne, a więc i energie Fermiego są takie same 
i wynoszą 

ep } = e F ) = e F = -^-C/2^) 2/a > (8) 

gdzie m — masa nukleonu, q — gęstość materii ją¬ 
drowej. Podstawiając wartość doświadczalną q = 
= 0,17 fm" s dostajemy eF ~ 39 MeV. 

Zatem największa energia kinetyczna nukleonu 
w jądrze eF jest znacznie mniejsza od jego energii 
spoczynkowej (ok. 940 MeV). Oznacza to, że po¬ 
prawki relatywistyczne związane z ruchem są małe 
i nierelatywistyczna fizyka jądrowa jest dobrym 
przybliżeniem (z wyjątkiem reakcji jądrowych wyso¬ 
kich energii). Wartość energii Fermiego eF pozwala 
nam tąkże ocenić głębokość potencjału jądrowego 
(rys. 3). Ponieważ wartość doświadczalna energii S 


}• 


Rys. 3. Energia Fermiego er i ener- 
e F gia separacji S nukleonów umiesz¬ 
czonych w jamie potencjału o głę¬ 
bokości V t 

potrzebnej do oderwania jednego nukleonu od jądra 
(energia separacji) wynosi ok. 8 MeV, to głębokość 
powinna wynosić: 

V 0 = e F +S * 47 MeV. 

Rzeczywiście, potencjał o takiej mniej więcej głębo¬ 
kości pozwala na odtworzenie wielu wyników do¬ 
świadczalnych. 

W ogólnym wypadku, gdy N ^ Z, energie Fer¬ 
miego neutronów i protonów są różne i wynoszą: 



Wówczas w całkowitej energii kinetycznej gazu Fer¬ 
miego 

£ kln = •UVfe*>+Ze?> 1 * >Ue F A X 

«• 

pojawia się człon symetrii (5) zwiększający energię 
kinetyczną, a więc zmniejszający energię wiązania 
jądra B przy wzroście nadmiaru neutronów (N—Z). 
Członu tego nie można było otrzymać z modelu krop¬ 
lowego. 



Model powłokowy 

Model kroplowy oraz model gazu Fermiego opisują 
tylko pewne wartości uśrednione, które zmieniają 
się w sposób gładki przy zmianie takich parametrów 
jądra jak liczba nukleonów czy deformacja. Model 
kroplowy opisuje np. gładką zależność energii wią¬ 
zania od liczby protonów i neutronów oraz od defor¬ 
macji. Wszystkie jednak wielkości jądrowe wykazują 
pewną mikrostrukturę — mniej lub bardziej wyraźne 
fluktuacje nałożone na te gładkie zależności. Świad¬ 


czą one o powłokowej strukturze jądra, podobnej do 
struktury powłok elektronowych. Model powłokowy 
ma na celu opis tej struktury. 

Jednym z pierwszych i ważniejszych argumentów 
przemawiających za strukturą powłokową jąder było 
istnienie tzw. liczb magicznych. Stwierdzono miano¬ 
wicie, że jądra o liczbie protonów lub neutronów 
równej 2, 8, 20, 28, 50 i 82 oraz liczbie neutronów 126 
są szczególnie silnie związane i trwałe. Trudno jest liczby 
spowodować ich rozpad, a nawet wzbudzenie. Mó- magiczne 
wimy, że mają one zamkniętą powłokę protonową 
albo neutronową (lub obie), podobnie jak atomy ga¬ 
zów szlachetnych mają zamkniętą powłokę elektro¬ 
nową. 

Model powłokowy jest modelem jednocząstkowym. 

Zakłada on, że nukleony poruszają się niezależnie 
od siebie w potencjale będącym wynikiem oddziały¬ 
wania jednego nukleonu ze wszystkimi pozostałymi. 

Wobec krótkiego zasięgu sił jądrowych, przebieg tego 
potencjału V powinien być bardzo zbliżony do prze¬ 
biegu gęstości materii q (i jednocześnie ładunku, gdyż 
rozkład protonów i neutronów w jądrze jest w przy¬ 
bliżeniu taki sam). 

Z danych doświadczalnych wynika, że zależność 
gęstości q od odległości od środka jądra r ma w przy¬ 
bliżeniu przebieg przedstawiony na rys. 4, tzn 
wewnątrz jądra gęstość jest stała i szybko spada w re- 


Rys. 4. Zależność gęs¬ 
tości materii p oraz po¬ 
tencjału V od odległości 
od środka jądra r 



jonie jego powierzchni. Zatem potencjał V(r) powi¬ 
nien mieć przebieg taki jak przedstawiony na tym sa¬ 
mym rysunku u dołu, tzn. być proporcjonalny do 
g(r), tylko z przeciwnym znakiem (potencjał przycią 
gający) i mieć jedynie promień R nieco większy (mnie 
więcej o zasięg sił jądrowych) niż g(r). 

Rozpatrzymy oddzielnie jądra kuliste i zdeformo- 


WdUC. _ . . . 

Potencjałem, którego zależność od odległości r jądra kulista 
jest podobna do przedstawionej na rys. 4 jest potencjał 
Woodsa-Saxona. Ma on postać 


V(r) = 


-Vq 

l +e (r-l?)/a ’ 


OD 


potencja! 

Woodsa- 

Saxona 


gdzie R — promień potencjału, a — parametr roz¬ 
mycia (grubości) powierzchni potencjału. 

Stan własny nukleonu umieszczonego w tym poten¬ 
cjale jest scharakteryzowany przez cztery liczby 
kwantowe:— radialną liczbę kwantową n (n = 1, 
2, 3,...), która opisuje liczbę oscylacji funkcji falo¬ 
wej w funkcji r (im większa jest ta liczba, przy tych 
samych wartościach pozostałych liczb kwantowych, 
tym większa jest energia nukleonu), — orbitalny 
moment pędu / (/ = 0, 1, 2, ...), — jego rzut na oś 
kwantyzacji mi oraz — rzut spinu na tę oś m 8 . Ponie¬ 
waż potencjał jest sferyczny i żaden kierunek kwan¬ 
tyzacji nie jest wyróżniony, to energia stanu nie zależy 
od mi. Nie zależy ona także od m s , gdyż potencjał 
jest niezależny od kierunku rzutu spinu. Każdy po¬ 
ziom energetyczny jest zatem 2(2/-f-l)-krotnie zdege- 
nerowany (ponieważ są dwie możliwe wartości tn s = 
= —i 2/+1 możliwych wartości mi = —/, 
—/+1,... +/) i wystarcza oznaczać go liczbami nil. 
Dla stanów o / « 0, 1, 2, 3, 4, 5, 6, 7, ... używa się 
powszechnie symboli literowych s 9 p, d,f, g , ń, i,y,... 

Układ poziomów otrzymany w potencjale Wood- 
sa-Saxona jest przedstawiony na rys. 5b. Są to po- 
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ziomy neutronowe. Układ poziomów protonowych, 
przy którego obliczaniu należy uwzględnić oddziały¬ 
wanie kulombowskie, różni się od niego znacznie tylko 
w górnej części (poziomy odpowiadające ciężkim 
jądrom — oddziaływanie kulombowskie większe). 
Sumując liczby cząstek, które obsadzają kolejne po¬ 
ziomy, łatwo możemy się przekonać, że potencjał 
Woodsa-Saxona, podobnie jak i prostsze od niego 
potencjały potencjały: — oscylatora harmonicznego (którego 
oscylatora szczególnie prosty układ poziomów jest podany dla 
harmonicz- porównania na rys. 5a) 
nego i jamy 

rostokątnej v (r) = V 2 'wa> 2 r 2 , (12) 

gdzie m — masa nukleonu, a co — parametr „sztyw¬ 
ności” potencjału oraz—jamy prostokątnej 


V(r) = 


{ 


~Vq 

0 


dla r < R, 
dla> > R , 


(13) 


gdzie R — promień jamy, odtwarzają jedynie trzy 
pierwsze liczby magiczne: 2, 8 i 20. Żaden z nich 
(jak i inne jeszcze potencjały) nie pozwala na odtwo¬ 
rzenie liczb dalszych. Aby je odtworzyć należy Wlą- 
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Rys. 5. Układ poziomów neutronowych otrzymanych w poten¬ 
cjale: oscylatora harmonicznego (a), Woodsa-Saxona bez sprzę¬ 
żenia spin-orbita (b) oraz ze sprzężeniem spin-orbita (c). Liczby 
z lewej strony oznaczają numer powłoki oscylatorowej JV. Na¬ 
wiasy klamrowe pokazują, które poziomy potencjału Woodsa- 
Saxona powstają przez rozszczepienie poziomu oscylatora har¬ 
monicznego. W nawiasach lub w kółkach podane są liczby wszy¬ 
stkich cząstek zapełniających poziomy położone poniżej 


czyć do potencjału oddziaływanie spin-orbita, tj. 
przyjąć potencjał w postaci 

K(r)+K so (r)7.^ (14) 

gdzie / — wektor orbitalnego momentu pędu nukleo¬ 
nu, s — wektor jego spinu. Spinowo-orbitalna część 
potencjału F so pochodzi ze spinowo-orbitalnej skła¬ 
dowej sił jądrowych i jest największa w obszarze po¬ 
wierzchni jądra, w którym zachodzi najszybsza zmia¬ 
na gęstości materii q. Gdy przyjmie się taki potencjał, 
liczby mi i m» nie są już dobrymi liczbami kwanto¬ 
wymi; liczbami takimi pozostają jednak: pełny mo¬ 
ment pędu nukleonu j = l± * 1 U oraz jego rzut na oś 
kwantyzacji m = mi+ms. Wymienienie tych liczb, 
obok liczb n i /, w pełni określa stan. Sama energia 
stanu nie zależy od m (m — —/, —/+1,...,/) i wobec 
tego degeneracja każdego poziomu energetycznego 
wynosi (2/+1). Układ poziomów jest podany na rys. 
5c: Widać z niego, że każdy poziom (z wyjątkiem po¬ 
ziomów o / = 0) zostaje rozszczepiony na dwa: 
j = /-P/s i j — /—V 2 . Dane doświadczalne wyka¬ 
zują, że poziom o większym j leży niżej, co oznacza, 
że oddziaływanie spin-orbita ma charakter przycią¬ 
gający. Z rys. 5c wynika także, że wzięcie pod uwagę 
tego oddziaływania pozwala na odtworzenie wszyst¬ 
kich znanych doświadczalnie liczb magicznych. 

Stosując model powłokowy możemy odtworzyć 
własności jąder w stanie podstawowym oraz w sta¬ 
nach niskowzbudzonych. Odtworzenie to jest naj¬ 
bardziej bezpośrednie dla jąder nieparzystych, któ¬ 
rych wiele własności (spin, parzystość, moment ma¬ 
gnetyczny, energia wzbudzenia) jest z reguły wła¬ 
snościami stanu zajętego przez nieparzysty nukleon. 
Opis tych własności jest najlepszy dla jądra podwójnie 
magicznego plus lub minus jeden nukleon. Jądro po¬ 
dwójnie magiczne może być uważane wtedy za szcze¬ 
gólnie sztywny, niełatwo ulegający wzbudzeniu rdzeń 
i o własności jądra nieparzystego decyduje nukleon 
„nadwyżkowy” lub brakujący (tzw. „dziura”) 
w zamkniętej powłoce. Na przykład, w jądrze “•Pb 
rdzeń stanowią 82 protony oraz 126 neutronów i os¬ 
tatni 127. neutron decyduje o własnościach jądra. 
Zgodnie z rys. 5c, stan podstawowy tego jądra powi¬ 
nien mieć spin ®/ a i parzystość dodatnią (-f-), gdyż 
wówczas ostatni neutron obsadza najniższy dostępny 
poziom 2g 9ft (/ = 4, tzn. parzyste). Najniższe zaś stany 
wzbudzone powinny być: u /j-h *7*—» 7s+' Z doś¬ 
wiadczenia rzeczywiście otrzymuje się zarówno stan 
podstawowy, jak i najniższe wzbudzone zgodne z tymi 
przewidywaniami. 

Oprócz jąder kulistych istnieją jądra zdeformo¬ 
wane. Wykazują one trwałą, statyczną deformację, 
a kształt ich jest zbliżony do kształtu wydłużonej 
elipsoidy obrotowej (kształt cygara — por. rys. 7). 
Oczekuje się ponadto, że niektóre jądra nietrwałe 
mogą mieć kształt elipsoidy spłaszczonej (kształt 
dysku). 

Do opisu ruchu nukleonów w jądrze zdeformowa¬ 
nym, jest potrzebny potencjał zdeformowany. Może 
to być np. potencjał Wood$a-Saxona, ale o po¬ 
wierzchniach ekwipotencjalnych odpowiednio zde¬ 
formowanych. Potencjał taki jest często stosowany 
w obliczeniach. Znacznie prostsze jednak są oblicze¬ 
nia za pomocą potencjału Nilssona, który jest nieco 
zmodyfikowanym potencjałem oscylatora harmo¬ 
nicznego, zawierającym oddziaływanie spin-orbita. 
Modyfikacja jest na tyle zręczna, że mimo uproszcze¬ 
nia potencjał jest realistyczny. Model powłokowy 
oparty na potencjale Nilssona nazywa się modelem 
Nilssona i jest szczególnym, wciąż bardzo powszech¬ 
nie stosowanym modelem powłokowym dla jąder 
zdeformowanych. 

Przy potencjale zdeformowanym, całkowity mo¬ 
ment pędu nukleonu J nie jest już dobrą liczbą kwan¬ 
tową. Liczbami takimi pozostają jedynie parzystość 
oraz rzut całkowitego momentu pędu na oś symetrii 
jądra. Energia stanu zależy teraz od deformacji jądra. 
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Rys. 6. Przykład zależności energii jednocząstkowej do defor¬ 
macji jądra d dla kilkunastu poziomów (fragment wykresu Nils- 
sona). Przy każdym poziomie podany jest rzut pełnego momentu 
pędu tego poziomu na oś symetrii jądra oraz jego parzystość 


Przykład takiej zależności jest podany na rys. 6, na 
którym wartościom dodatnim parametru deformacji 
odpowiada wydłużony kształt jądra, a ujemnym — 
spłaszczony. Widać, że poziomy przecinają się. Ich 
układ, kolejność zmieniają się wraz z deformacją. 
Jeśli znamy zatem deformację jądra, to za pomocą 
wykres wykresu poziomów (zwanego wykresem lub diagra- 
Nilssona mem Nilssona) i — ogólnie — za pomocą modelu 
Nilssona możemy odtworzyć lub przewidzieć wła¬ 
sności jądra w jego stanie podstawowym i stanach 
niskowzbudzonych, podobnie jak dla jąder sferycz¬ 
nych. Jeśli nie wiemy jaka jest deformacja, ale znamy 
inne własności jądra, to możemy postąpić odwrotnie: 
z własności tych wnosić o jego deformacji. 

Przy kształcie kulistym (deformacja (5 = 0) po¬ 
ziomy wykresu z rys. 6 pokrywają się z poziomami 
z rys. 5c. Deformacja usuwa częściowo degenerację 
poziomów, pozostaje jeszcze tylko dwukrotna dege¬ 
neracja każdego poziomu. 


8+ 


• 6 + 


• 4+ 


2 + 

0 + 


może przybierać wartości: 1 — 0, 2, 4, 6, ...; widmo 
(15) (zwane widmem rotacyjnym) jest pokazane na 
rys. 8. Takie charakterystyczne widma zaobserwo¬ 
wano u parzysto-parzystych jąder zdeformowanych. 

Model rotacyjny został właśnie wynaleziony do ich 
wyjaśnienia. 

Wśród różnych wzbudzeń jąder obserwujemy takie, 
które możemy powiązać z ich drganiami. Szczególnie 
prosty obraz dostajemy przyjmując, że jądro jest kroplą 
nieściśliwej cieczy, której drgania możemy opisać drga- Rys g widmo ro- 
niami jej powierzchni. Rysunek 9 podaje kształty po- tacyjne jądra zdc- 
wierzchni jądra sferycznego przy dwóch rodzajach formowanego 
drgań: kwadrupolowym (kształty elipsoidalne) i ok- 
tupplowym (kształty typu gruszki), prowadzących do 
najniższych energii wzbudzenia. 

W modelu kroplowym widmo wzbudzeń odpowia¬ 
dające drganiom ma postać jak na rys. 10. Przy drga¬ 
niach kwadrupolowych najniżej położony jest po¬ 
ziom 2-f ; na wysokości dwukrotnie wyższej znajdują 
się trzy poziomy (tryplet) — 0+, 2+, 4+; na po¬ 
trójnej wysokości — pięć poziomów, a wyżej — 
układy coraz bardziej złożone. Na wysokości tych 
pięciu poziomów znajduje się dopiero pierwszy po¬ 
ziom wzbudzony oktupolowy 3 — , a poziom następ¬ 
ny — dopiero na wysokości podwójnej. Rzeczywiste 
widma niektórych jąder sferycznych wykazują pewne 


0+, 2+, 3+ 
4+, 6+ 


model 

wibracyjny 



O-K 2 + , 4 + 

2 + 

0 + 


A — 3 

Rys. 9. Kształty po¬ 
wierzchni jądra wy¬ 
konującego drgania 
kwadrupolowc 
(multipolowość X** 
= 2) i oktupolowe 
_0_l_ (X = 3) wokół kształ¬ 
tu kulistego odpo- 
/, = 3 wiadającego stano¬ 

wi równowagi 


Rys. 10. Widmo wibracyjne najniższych wzbudzeń kwadrupolo¬ 
wych (X *= 2) i oktupolowych (X = 3), otrzymane w modelu 
kroplowym 


cechy widm z rys. 10. Na ogół jednak obraz jest bar¬ 
dziej złożony. 

Podobnie można opisywać wzbudzenia wibracyjne 
ąder zdeformowanych. 


Model uogólniony 


Model kolektywny 

W jądrze atomowym poza zjawiskami jednocząstko- 
wymi * występują zjawiska kolektywne, w których 
bierze udział, w sposób skorelowany, wiele cząstek. 
Model kolektywny ma za zadanie opisanie tych zja¬ 
wisk; jest on modelem cząstek silnie skorelowanych. 
Przykładami zjawisk kolektywnych są: ruch obroto¬ 
wy (rotacja) i drgania (wibracje) jądra. Modele opi¬ 
sujące oddzielnie rotację i wibracje nazywane są od¬ 
powiednio rotacyjnym i wibracyjnym, 
model j a k wspomniano wyżej, niektóre jądra atomowe 
rotacyjny S ą trwale zdeformowane. Przykładem są jądra pier¬ 
wiastków ziem rzadkich oraz aktynowców. Kształt 
ich jest (w dobrym, przybliżeniu) elipsoidą wydłużoną, 
osiowo symetryczną (rys. 7). 

Obrót tak zdeformowanego jądra względem osi 
prostopadłej (np. osi (te) do osi symetrii (Oz na 
rys. 7) prowadzi w mechanice kwantowej do nastę¬ 
pującego widma energii: 

E = i /(/+1)> (15) 

R« 7 Jadro zde- gdzie / — moment pędu jądra, a J — jego moment 
‘formowane bezwładności względem osi obrotu. Moment pędu / 


Model uogólniony (zwany też połączonym, scalonym 
lub zunifikowanym) jest połączeniem modelu jedno- 
cząstkowego (powłokowego) z modelem kolektyw¬ 
nym. Dopiero w ramach tego modelu można opisać 
w sposób stosunkowo pełny i konsekwentny wła¬ 
sności jąder. 

Za najprostszy model uogólniony można uważać 
omówiony wcześniej model Nilssona. By opisać bo¬ 
wiem strukturę jednocząstkową jądra zdeformowane¬ 
go musi on zawierać deformację jądra, która jest 
wielkością kolektywną. Z tego punktu widzenia, opis 
tego modelu można by umieścić na początku niniej¬ 
szego rozdziału, a nie w rozdziale poświęconym mode¬ 
lowi powłokowemu. Jednak w modelu Nilssona rola 
parametru kolektywnego — deformacji —jest na tyle 
tylko pomocnicza, że bardziej naturalne wydaje się 
traktowanie go jako modelu powłokowego niż uogól¬ 
nionego. Od typowego modelu uogólnionego wyma¬ 
gamy bowiem więcej, mianowicie — by opisywał on 
zarówno własności jednocząstkowe, jak i kolektywne 
lub też by opisywał własności kolektywne w sposób 
pełny (mikroskopowy — jak często się mówi), tj. 
oparty o wewnętrzną, jednocząstkową, mikroskopo¬ 
wą strukturę jądra. 

Możliwości i rolę modelu uogólnionego zilustru¬ 
jemy trzema przykładami. Jako pierwszy weźmiemy 
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opis jąder jądro nieparzyste, które jest zwykle traktowane jako 
nieparzys- układ jednej cząstki dodanej do parzysto-parzystego 
tych rdzenia. Najniższe wzbudzenia takiego układu są 
pewną superpozycją wzbudzeń kolektywnych rdzenia 
i wzbudzeń cząstkowych cząstki nieparzystej umiesz¬ 
czonej w polu rdzenia. Widma tych wzbudzeń są 
więc pewną kombinacją widma kolektywnego (typu 
przedstawionego na rys. 8 lub 10) i jednocząstkowego 
(typu przedstawionego na rys. 5 lub 6); mogą zatem 
być opisane w pełni dopiero przez model uogólniony, 
rozwinięcie Drugiego przykładu może dostarczyć model rota- 
modelu cyjny, który jest szczególnym przypadkiem modelu 
rotacyjnego kolektywnego. We wzorze (15), który opisuje energie 
ruchu obrotowego jądra zdeformowanego występuje 
parametr J — moment bezwładności jądra. Dopóki 
pozostajemy w ramach samego modelu rotacyjnego, 
parametr ten jest czysto fenomenologiczny. Możemy 
wyznaczyć jego wartość z doświadczenia porównując 
zmierzoną energię stanu rotacyjnego o danym mo¬ 
mencie pędu i z energią obliczoną ze wzoru (15). Nie 
możemy jednak powiązać tej wartości z wewnętrzną 
strukturą jądra, o której w czystym modelu rotacyj¬ 
nym nic nie wiemy. Powiązanie takie jest jednakże 
bardzo ważne, gdyż pozwala wykorzystać wiedzę 
doświadczalną o widmach jąder obracających się 
(w szczególności, zdobywaną ostatnio wiedzę o wid¬ 
mach jąder szybko obracających się -> Jądra atomowe 
w stanach ekstremalnych) do sprawdzenia i wzboga¬ 
cenia wiedzy o strukturze jądra. Dokonać tego może¬ 
my dopiero w modelu uogólnionym, który obejmuje 
wewnętrzną strukturę jądra. Korzystając z tego mo¬ 
delu możemy wykonać mikroskopowe obliczenia mo¬ 
mentu bezwładności, który w sposób istotny zależy 
od szczegółów tej struktury. 

energia cal- Trzecią ilustracją potrzeby i możliwości modelu 
kowita jądra uogólnionego jest stosowany najczęściej sposób ob¬ 
liczania energii całkowitej jądra, a zwłaszcza jej za¬ 
leżności od deformacji. Znajomość tej zależności po¬ 
zwala wyznaczyć statyczną deformację (deformację 
równowagi) jądra, obliczyć barierę potencjału na roz¬ 
szczepienie, energię wzbudzeń kolektywnych itd. 
Obecnie energię jądra oblicza się najczęściej jako su¬ 
mę energii kropli cieczy (model kroplowy jądra, 
a więc jedna z najprostszych wersji modelu kolek¬ 
tywnego) oraz poprawki powłokowej. Poprawka ta 
uwzględnia niejednorodny, powłokowy charakter 
wewnętrznej struktury. Do jej wyznaczenia jest po¬ 
trzebny jednocząstkowy, powłokowy model tej struk¬ 
tury (np. model Nilssona), przy interesującej nas de¬ 
formacji jądra. Widzimy więc, że obliczenie energii 
jest dopiero możliwe w pełnym modelu uogólnio¬ 
nym. 

Przyjrzyjmy się nieco wynikom takich obliczeń. 
Są one pokazane na rys. 11, który przedstawia orien¬ 
tacyjnie zależność energii kroplowej, poprawki po¬ 
włokowej oraz energii całkowitej od deformacji kwa- 
drupolowej <5, opisującej elipsoidalny kształt jądra 
(tej samej co na rys. 6). Rozważone są trzy wypadki: 
jądra o zamkniętych powłokach (a), jądra o niewielu 


nukleonach poza zamkniętymi powłokami (b) oraz 
jądra o dużej liczbie nukleonów poza zamkniętymi 
powłokami — równej w przybliżeniu połowie liczby 
wszystkich nukleonów w powłokach (neutronowej 
i protonowej) niezapełnionych (c). Widoczne jest, że 
w wypadku a) poprawka powłokowa ma głębokie mi¬ 
nimum przy kształcie kulistym (ó = 0), co powoduje, 
że całkowita energia ma także minimum przy ń = 0 
i szybko rośnie ze wzrostem deformacji (wydłużaniem 
lub spłaszczaniem kształtu elipsoidalnego). Oznacza 
to, że w stanie równowagi jądro takie jest kuliste i trud¬ 
no jest je zdeformować; jest ono mało podatne („sztyw¬ 
ne”) na deformację. W wypadku b) jądro jest nadal 
kuliste w stanie równowagi, ale jest już bardziej po¬ 
datne („miękkie”) na deformację, jest mu łatwo oscy¬ 
lować wokół kształtu kulistego. W wypadku c) jądro 
jest zdeformowane w stanie równowagi i znowu sto¬ 
sunkowo mało podatne na odkształcanie od kształtu 
równowagi. 

Wynika stąd, gdzie na mapie nuklidów możemy 
oczekiwać jąder zdeformowanych. Jądra te będą 
grupowały się wokół środków prostokątów utworzo¬ 
nych przez linie Z — Zm&g i N = ATmag, odpowiadają¬ 
ce protonowym i neutronowym liczbom magicznym 
(rys. 12). Obszary jąder zdeformowanych będą tym 
większe, im większe są powłoki; przy małych powło¬ 
kach mogą wcale nie wystąpić. Na rys. 12 cztery naj- 
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jąder zdefor¬ 
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Rys. 12. Położenie znanych i przewidywanych obszarów jąder 
zdeformowanych na mapie nuklidów. Przez obszary 1 (ziemie 
rzadkie — ZR) i 2(aktynowce— Ak) przechodzi ścieżka trwałości/?. 
Na skraj obszaru 3 (jądra neutronodeficytowe) prowadzą reakcje 
z ciężkimi jonami (obszar ciemnoniebieski) a do obszaru 4 (jądra 
neutrononadmiarowe) — reakcje rozszczepienia jąder ciężkich. 
Jądra położone poza Liniami zerowej energii wiązania neutronu 
(Bn = 0) lub protonu (Bp — 0) nie mogą istnieć; rozpadałyby się 
natychmiast lub prawie natychmiast po ich utworzeniu. Zazna¬ 
czone jest także położenie hipotetycznej wyspy (kulistych) jąder 
superciężkich (SC), usytuowanej na przecięciu linii przewidywa¬ 
nych liczb magicznych Zmaz — 114 i JVmac = 184 



Rys. 11. Zależność gładkiej (kroplowej) części energii, poprawki 
powłokowej oraz energii całkowitej od deformacji kwadrupoło- 
wej 6 dla jądra o zamkniętych powłokach (a), niewielkiej liczbie 
nukleonów poza zamkniętymi powłokami (b) oraz znacznej ich 
liczbie (c) 


większe obszary jąder zdeformowanych są oznaczone 
numerami 1-4. Tylko dwa z nich są tak usytuowane, 
że niemal przez środek ich przechodzi ścieżka trwa¬ 
łości fi. Są to: obszar ziem rzadkich 1 i aktynowców 2. 
W tych obszarach występują zatem jądra zdeformo¬ 
wane trwałe (ziemie rzadkie) lub długożyciowe 
(część aktynowców) i one właśnie zostały zbadane 
jako pierwsze spośród jąder zdeformowanych. 


Rozwój modeli jądrowych 

Modele podstawowe rzadko są stosowane oddzielnie. 
Widzieliśmy np., że już do bardzo przybliżonego opi¬ 
su energii wiązania jąder, oprócz modelu kroplowego 
był także potrzebny model gazu Fermiego. W celu 


180 









































dokładniejszego zaś opisu trzeba było jeszcze dodać 
(por. wzór 7) model przedstawiający nukleony w ją¬ 
drze jako powiązane w pary oraz model powłokowy. 
Drugim przykładem potrzeby kojarzenia modeli jest 
przedstawiony powyżej i często stosowany model 
uogólniony, który jest połączeniem modelu kolektyw¬ 
nego i powłokowego. Ogólnie, im więcej chcemy 
objąć faktów lub dokładniej je opisać, tym bardziej 
złożonego modelu musimy używać. 

Już same modele podstawowe, opisane w rozdziale 
pierwszym, z reguły nie mają obecnie tak prostej po¬ 
staci, w jakiej je przedstawiliśmy wcześniej. Na przy¬ 
kład, przy stosowaniu modelu powłokowego musimy 
na ogół uwzględnić oddziaływanie resztkowe (szcząt¬ 
kowe). Jest to część oddziaływania między nukleo¬ 
nami, która nie została włączona do potencjału mo¬ 
delu powłokowego. W oddziaływaniu resztkowym 
występuje m.in. składowa o stosunkowo krótkim za¬ 
sięgu działania, która łączy nukleony w pary. 
Uwzględnienie jej pozwala objąć modelem powłoko¬ 
wym wspomniany już model przedstawiający nukleo¬ 
ny w jądrze jako powiązane parami. Taki model 
nukleonów (połączonych w pary) jest stosowany za¬ 
równo do dokładniejszego opisu energii wiązania 
(por. wzór 6), jak też do ulepszenia opisu wielu in¬ 
nych wielkości jądrowych, np. momentu bezwład¬ 
ności. 

Nawet jeśli nie uwzględnia się oddziaływań reszt¬ 
kowych, to jednak takiemu „czystemu” modelowi 
powłokowemu stawia się obecnie często wyższe wy¬ 
magania niż dawniej. Wymaga się mianowicie, by 
potencjał potencjał stosowany w tym modelu był samozgodny, 
samozgodny tj. zgodny z rozkładem gęstości nukleonów, które go 
wytwarzają. Wyjaśnimy to dokładniej. Jeśli weźmie¬ 
my np. potencjał Woodsa-Saxona, to rozwiązując 
równanie Schrodingera opisujące ruch nukleonów 
w tym potencjale, możemy znaleźć rozkład gęstości 
umieszczonych w nim nukleonów. Następnie, znając 
już tę gęstość i znając oddziaływanie między nukleo¬ 
nami, możemy wyznaczyć potencjał, który one wy¬ 
twarzają. Przekonamy się, że potencjał ten różni się 
trochę od wyjściowego potencjału Woodsa-Saxona. 
Po poprawieniu go o tę różnicę możemy znaleźć nowy 
rozkład gęstości, a z niego nowy potencjał itd. Dopiero 
po kilku lub kilkunastu takich krokach (zależnie od 
tego, jak dobrze był odgadnięty potencjał wyjścio¬ 
wy) rozkład gęstości obliczony w danym potencjale 


będzie odtwarzał go na powrót; oznacza to właśnie, metoda 
że znaleziony został potencjał samozgodny. Postępo- Hartree'ego— 
wanie według takiego schematu nazywa się metodą Focka 
Hartree’ego-Focka. 

Powyższy przykład pokazuje, jak ulepszenie mo¬ 
delu, nie naruszając podstawowych jego założeń 
(w tym wypadku — niezależność ruchu nukleonów), 
czyni go bardziej złożonym. W pierwszym modelu 
powłokowym, potencjał przyjmowało się (odgady¬ 
wało) w możliwie prostej i poglądowej postaci. 

W metodzie zaś Hartree’ego-Focka odnajduje się go 
za pomocą dosyć złożonej procedury obliczeniowej. 

Obecnie coraz częściej prosty dawniej model zostaje 
zastąpiony dość złożonym postępowaniem oblicze¬ 
niowym. Model traci wtedy swoją poglądowość na 
tyle, że przestaje być nazywany modelem. Niektórzy 
fizycy nie mówią już np. o modelu powłokowym, 
a tylko o strukturze powłokowej jądra, o opisie lub 
o teorii tej struktury. 

Ważnym etapem rozwoju każdego modelu było 
uzasadnienie jego sukcesu, szczególnie, gdy sukces 
ten był nieoczekiwany. Przykładem tego jest znowu 
model powłokowy. Ponieważ siły jądrowe mają krótki 
zasięg (niewiele przekraczający rozmiary nukleonu), 
i wobec tego jądro może zostać związane tylko przy 
dość ścisłym „upakowaniu” nukleonów, sukces mo¬ 
delu powłokowego wydał się dziwny. Model ten przyj¬ 
muje bowiem swobodny ruch nukleonów w jądrze; 
wymaga zatem, by średnia droga swobodna nukleonu 
była równa lub większa od rozmiarów jądra, a więc 
większa niż średnia odległość między nukleonami, wpływ zakazu 
Zagadkę jego sukcesu rozwiązało wykrycie wpływu Pauliego 
zakazu Pauliego na ruch nukleonów. Otćż zakaz ten 
wzbraniając nukleonom zajmowania poziomów za¬ 
jętych już przez inne, sprawia, że nukleony w jądrze 
„odczuwają” tylko niektóre ze zderzeń między sobą; 
mianowicie tylko zderzenia silne, które mogą „wybić” 
je ponad „morze” stanów zajętych. Inne, słabsze 
zderzenia nie mogą zmienić stanu nukleonów i nie są 
zatem przez nie odczuwalne. Jest to równoważne 
efektowi wydłużenia drogi swobodnej. 

Encyklopedia fizyki , t. 1, str. 843, Warszawa 1972; B.L. Cohen 
Concepts of nuclear physics, New Delhi 1975; H. Frauenfelder, 

E.M. Henley Subatomic physics , Englewood Cliflfs 1974; A. Sobi- 
CZEWSKI Potencjał jednocząstkowy dla jąder zdeformowanych , Post. 

Fiz. 20, 649 (1969); A. Strzałkowski Wstęp do fizyki jądra ato¬ 
mowego, Warszawa 1978; Sz. Szczeniowski Fizyka doświad¬ 
czalna , cz. 6, Warszawa 1974; Z. Wilhelmi Fizyka reakcji ją¬ 
drowych, Warszawa 1976. 


Rozpady jąder atomowych 

Adam Sobiczewski 


Jądro atomowe może znajdować się w stanie podsta¬ 
wowym, tj. w stanie, w którym ma najniższą energię 
całkowitą (a więc i najmniejszą masę), lub w stanie 
wzbudzonym. 

jądro Jądro w stanie wzbudzonym ulega rozpadowi, 
wzbudzono Może to być rozpad, który zmienia skład jąora (np. 

rozpad /?, a, rozszczepienie), jak i rozpad, który skła¬ 
du tego nie zmienia (rozpad y, konwersja wewnętrzna). 
W ostatnim przypadku jądro przechodzi ze stanu 
o wyższej energii wzbudzenia do stanu o energii niż¬ 
szej (deekscytacja), w szczególności do stanu podsta¬ 
wowego. W stanie podstawowym jądro bądź w ogóle 
nie rozpada się (jądra trwałe), bądź ulega rozpadowi 
zmieniającemu jego skład, czyli prowadzącemu do 
innego już jądra. 

izomery Niektóre stany wzbudzone są szczególnie wolno 
jądrowe rozpadające się (stany długożyciowe, metatrwałe). 

Nazywamy je stanami izomerycznymi jądra, a samo 
jądro znajdujące się w tym stanie — izomerem. Izo¬ 
mer jądrowy różni się zatem od jądra w zwykłym sta¬ 
nie nie składem jądra, lecz jego strukturą (podobnie 
jak w przypadku izomeru chemicznego), co oznacza¬ 
my przez dodanie litery m (od metatrwały) przy liczbie 


masowej. Na przykład 116m In oznacza izomer jądra 
116 In. 

Warunkiem koniecznym każdego rozpadu jest, by egzoener- 
wydzielona w nim była pewna ilość energii (proces getyczno&ć 
egzoenergetyczny), tzn., by masa wszystkich produk- rozpadu 
tów rozpadu była mniejsza od masy układu wyjścio¬ 
wego. Wśród rozpadów jądrowych najważniejsze są: 
rozpady /? i a, rozszczepienie oraz rozpad y i kon¬ 
wersja wewnętrzna. Rozpad p zachodzi wskutek od¬ 
działywań słabych, rozpad y i konwersja wewnętrzna 
wskutek oddziaływań elektromagnetycznych, a w roz¬ 
padzie a i rozszczepieniu istotną rolę odgrywają od¬ 
działywania silne (—► Oddziaływania słabe. Oddzia¬ 
ływania elektromagnetyczne. Oddziaływania silne). 

Obecnie znamy około 2000 różnych jąder. Poło¬ 
żenie ich na mapie jąder, tj. na wykresie, na którym 
na jednej osi odłożona jest liczba protonów Z, a na 
drugiej — liczba neutronów N jądra, ilustruje rys. 1. 

Są to w większości jądra nietrwałe, rozpadające się 
(promieniotwórcze), wytworzone sztucznie w różnego 
rodzaju reakcjach jądrowych. Na przykład w drodze 
reakcji rozszczepienia jąder powstaje wiele izotopów 
bogatych w neutrony (neutrono-nadmiarowych). 
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Rys. 1. Mapa jąder. Dla jądfer promieniotwórczych różnymi kolorami wyróżniono główne typy rozpadu. Jeśli jądro może rozpadać się 
na różne sposoby, np. na drodze rozpadu a, j? + , konwersji wewnętrznej i rozszczepienia samorzutnego, ale rozpad a występuje najczęś¬ 
ciej, to oznaczone jest ono na mapie jako jądro a-promicniotwórcze. Widoczne jest, żc dla większości jąder ciężkich dominuje rozpad * r 
chociaż rozszczopicnic odgrywa dla tych jąder także ważną rolę (wg Delta nr 5, 1975) 


a w drodze reakcji z ciężkimi jonami (-*- Fizyka cięż¬ 
kich jonów) — wiele izotopów ubogich w neutrony 
(neutrono-deficytowych). Wraz z postępem technicz¬ 
nym ciągle wzrasta możliwość przeprowadzania róż¬ 
nych reakcji, a tym samym możliwość poznania no- 
jądra trwałe wych jąder nietrwałych. Trwałych jąder jest jedynie 
i promienie- 264. W przyrodzie oprócz tych 264 jąder trwałych 
twórcze występuje pewna liczba jąder promieniotwórczych 
(promieniotwórczość naturalna). Przykładami natu¬ 
ralnych jąder promieniotwórczych są jądra; izotop 
toru 232 Th i izotopy uranu 238 U i 235 U. Mają one długie 
okresy rozpadu, porównywalne z wiekiem Ziemi (do¬ 
kładniej, z wiekiem najstarszych skał skorupy ziem¬ 
skiej, ocenianym na ok. 5 miliardów lat) i dlatego 
mogły przetrwać w skorupie ziemskiej w ilościach 
obserwowalnych. Rozpadając się, dają początek całym 
szeregom (rodzinom, rys. 1, str. 245) promieniotwór¬ 
czym. Każdy szereg składa się z jąder promienio¬ 
twórczych, które powstają w drodze kolejnych rozpa¬ 
dów a lub p jednego z wymienionych jąder wyjścio¬ 
wych, i kończy się na jądrze trwałym. Szeregi powsta¬ 
jące z jąder: 232 Th, 238 U i 235 U nazywają się szeregami: 
torowym, uranowym i aktynowo-uranowym i kończą 
się odpowiednio na jądrach trwałych: izotopach oło¬ 
wiu 208 Pb, 206 Pb i 207 Pb. 


Ogólne własności rozpadu jąder 

Wytwarzamy obecnie bardzo wiele jąder i w bardzo 
różnych stanach. Dobierając odpowiednio rodzaj 
i parametry reakcji jądrowej możemy wytwarzać jądra 
w określonym stanie. Z chwilą jednak, gdy jądro jest 
już utworzone, nie mamy praktycznie wpływu na jego 


rozpad. Rozpad odbywa się samorzutnie, spontanicz¬ 
nie. Istnieje określone prawdopodobieństwo 2, właś¬ 
ciwe dla danego jądra i stanu, w którym się ono znaj¬ 
duje, że rozpadnie się ono w jednostce czasu. Ilość 
wszystkich rozpadów w tej jednostce czasu równa jest 
zatem liczbie wszystkich jąder pomnożonej przez to 
prawdopodobieństwo: 

dNIdt = -XN. (1) 

Znak minus we wzorze (1) oznacza, że wskutek roz¬ 
padu liczba jąder maleje. Wzór (1) nazywa się pra¬ 
wem rozpadu promieniotwórczego. Prawo to określa 
zależność liczby jąder N od czasu t; ma ona postać 
wykładniczą; 

N(t) = N( 0)e-«. (2) 


prawo 

rozpadu 

promienio¬ 

twórczego 


N(0) oznacza liczbę jąder w chwili początkowej 
/ = 0, w której zaczynamy obserwację. Prawo roz¬ 
padu (1) jest równaniem różniczkowym, którego roz¬ 
wiązaniem jest funkcja N(t) podana wzorem (2). 

Prawo (1) opisuje rozpad nie tylko jąder, ale 
wszelkich obiektów, których prawdopodobieństwo 
rozpadu na jednostkę czasu jest stałe, niezależne ani 
od chwili, w której zachodzi, ani od liczby obiektów. 

Podlega mu np. także rozpad nietrwałych cząstek 
elementarnych. 

Prawdopodobieństwo 2, zwane także stałą rozpadu, 
określa szybkość rozpadu. Szybkość tę często cha¬ 
rakteryzuje się także czasem (okresem) połowicznego 
zaniku (połowicznego rozpadu) T 1/2 , tj. czasem, 
w którym liczba jąder maleje, wskutek rozpadu, do 
połowy. Wyraża się on przez 2 następująco: czas 

~ _ In 2 fXi połowiczne- 

^j/2 -j—- go zaniku 
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Rysunek 2 ilustruje zależność (2) liczby jąder N(f) 
od czasu. Zaznaczony jest także na nim czas poło¬ 
wicznego zaniku r, /2 . 



zaniku 7\/, 

Liczbę rozpadających się jąder w danej próbce 
promieniotwórczej w jednostce czasu nazywa się jej 
aktywność aktywnością. Zgodnie z (1) liczba ta jest równa AN. 
próbki Zatem aktywność każdej próbki spada, zgodnie z (2), 
wykładniczo z czasem. 

Jeśli jądro będące w danym stanie ulega kilku róż¬ 
nym rozpadom, np. rozpadowi fi, cc i in., to całkowite 
prawdopodobieństwo A równe jest sumie prawdopo¬ 
dobieństw At poszczególnych rozpadów, tzn. 

l-JJ h, ( 4 ) 

f-i 

gdzie n jest liczbą możliwych rozpadów. Wobec re¬ 
lacji (3) wzór ten możemy przepisać jako związek po¬ 
między całkowitym czasem połowicznego zaniku 
(zapisanym krótko jako T, zamiast r 1/2 ), a czasami 
połowicznego zaniku Ti ze względu na poszczególne 
rozpady: 



i-1 


Ze wzoru (5) wynika, że najważniejszy jest rozpad 
o najmniejszym Ti, który decyduje o całkowitym 
czasie T. Zgodnie z (4) aktywność AN jest sumą ak¬ 
tywności odpowiadających poszczególnym rodzajom 
rozpadu: 

AN = j?AiN. (6) 

i-l 


Rozpad a 

Rozpad cc polega na wyrzuceniu z jądra cząstki cc, tj. 
jądra JHe, które wśród jąder lekkich jest jądrem 
szczególnie silnie związanym. Rozpad cc możemy za¬ 
pisać symbolicznie jako 

A y -+ a -*Y 4-a. 

Z^N Z-2 J N~2~ 

Obecnie znamy ok. 370 jąder ulegających rozpadowi 
a ze stanu podstawowego, w tym dla ok. 260 z nich 
jest to rozpad główny, tzn. rozpad, którego prawdo¬ 
podobieństwo Aoe jest większe od prawdopodobieństw 
rozpadu innego rodzaju. 

prawdopo- Prawdopodobieństwo rozpadu oc bardzo silnie za- 
dobieństwo leży od energii tego rozpadu Q a —jest tym większe, 
rozpadu a im większa jest energia Q a . Energia rozpadu (równa 
praktycznie energii kinetycznej emitowanej cząstki cc, 
Eo) mierzona we wszystkich obserwowanych rozpa¬ 
dach mieści się w granicach ok. 2-9 MeV. Odpowia¬ 
dający tej energii czas połowicznego zaniku T a jest 
w granicach od ok. 8* 10 15 lat (^ISm) do ok. 3 • 10” 7 s 
(sifPo). Oznacza to, że różnicy energii rozpadu <2*, 


wynoszącej ok. 7 MeV, odpowiada ogromna różnica 
czasów T a sięgająca ok. 29 rzędów wielkości. 

Rozpad a jest efektem czysto kwantowym. Polega bariera po- 
on na przeniknięciu cząstki a przez barierę poten- tencjału dla 
cjału (efekt tunelowy), które nie jest możliwe w fizyce cząstki cc 
klasycznej. Bariera potencjału pojawia się jako rezul¬ 
tat nałożenia się dwu oddziaływań pomiędzy cząstką 
a i pozostałą częścią jądra: oddziaływania jądrowego, 
które ma charakter krótkozasięgowy i jest przyciąga¬ 
jące, oraz oddziaływania kulombowskiego, które ma 
charakter długozasięgowy i jest odpychające. Zilu¬ 
strowane jest to na rys. 3. Rysunek 3a pokazuje sche¬ 
matyczny przebieg potencjału jądrowego Uj(r) i po¬ 
tencjału kulombowskiego Ł/kui(r) w funkcji odległości 
r cząstki a od środka jądra. Z rys. 3b widać, że super¬ 
pozycja tych oddziaływań daje potencjał z barierą, 
którą cząstka a o energii Ea musi przeniknąć na od¬ 
ległości od R (promień jądra) do b (punkt wyjścia 
z bariery). Im energia E a jest większa, tym grubość 
(i jednocześnie względna wysokość) bariery do poko¬ 
nania jest mniejsza, a zatem większe prawdopodo¬ 
bieństwo przeniknięcia przez nią. 




Rys. 3. Mechanizm powstawania bariery potencjału dla rozpadu 
a. a) Schematyczny przebieg potencjału jądrowego U)(r) i poten¬ 
cjału kulombowskiego t/ ku i(r)dla cząstki a w funkcji jej odległości 
r od środka jądra, b) Superpozycja tych dwu potencjałów dająca 
barierę potencjału, którą cząstka a o energii Ea musi pokonać 
na odległości od R do b 

prawdopo- 

Prawdopodobieństwo emisji cząstki a można dobieństwo 
w przybliżeniu zapisać jako: emisji a 

JU » <7) 

gdzie v a jest prędkością cząstki a w jądrze, a R —- 
promieniem jądra. Wielkość v a = v a /2R jest częstością 
„uderzeń” cząstki a o barierę potencjału (tj. liczbą 
przebiegnięć cząstki od jednego do drugiego brzegu 
jądra w jednostce czasu), zatem całkowite prawdo¬ 
podobieństwo emisji a w jednostce czasu jest iloczy¬ 
nem liczby uderzeń o barierę w tym czasie i prawdo¬ 
podobieństwa Pa przeniknięcia przez nią przy każdym 
uderzeniu. 

Rola rozpadu a jest tym większa, im większa jest 
liczba atomowa Z jądra. Tym większe bowiem jest 
wtedy prawdopodobieństwo rozpadu 2a, czyli tym 
mniejszy czas połowicznego zaniku r«. Najmniejsze 
czasy Ta mają więc jądra najcięższych pierwiastków 
lub pierwiastków bogatych w protony (lub, co na 
jedno wychodzi, ubogich w neutrony). Czasy Ta jąder 
pierwiastków ziem rzadkich są ogromne (np. ok. 

8 *10 15 lat wynosi Ta izotopu samaru ^JSm, jak po¬ 
daliśmy wyżej). Dla najcięższych zaś znanych obecnie 
pierwiastków (Z = 104, 105, 106)—już tylko rzędu 
sekund. Na przykład dla odkrytego w 1974 roku izo¬ 
topu 263 1 06 wynosi on 0,9 s. 
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struktura Przy precyzyjnych badaniach rozpadu a określonego 
subtelna jądra można na ogół zaobserwować cząstki a o kilku 
widma a różnych energiach (tzw. struktura subtelna widma a). 

Jest to wynikiem tego, że jądro początkowe może się 
rozpadać nie tylko do stanu podstawowego jądra 
końcowego, lecz także do jego stanów wzbudzonych 
(—► Jądra atomowe i ich wzbudzenia); ilustruje to 
rys. 4a. Natężenia jednak rozpadów do stanów wzbu- 



Rozpad fir polega na przemianie jednego neutronu 
w jądrze na proton, której towarzyszy emisja nega- 
tonu (elektronu ujemnego) i anty neutrina v. Sym¬ 
bolicznie możemy to zapisać: 

Z X N W 

Rozpad fi* jest przemianą jednego protonu w ją¬ 
drze na neutron, której towarzyszy emisja pozytonu 
(elektronu dodatniego) e + i neutrina. Symboliczny 
zapis: 

Z Xy “"*■ Z - x Jjy +1 + e + (9) 

Wychwyt elektronowy polega na pochwyceniu 

przez jądro negatonu z jednej z powłok atomowych, 
czemu towarzyszy emisja neutrina. Symboliczny za¬ 
pis: 

AX K+e - z ĄY N+1 +v. (10) 


wysokoenergetyczne 
cząstki a 


\ 
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Rys. 4. Ilustracja pochodzenia nisko- i wysokoenergetycznych 
cząstek a: a) Rozpad ot ze stanu podstawowego jądra wyjściowego 
do stanu podstawowego oraz do stanów wzbudzonych (nisko- 
energetyczne cząstki a) jądra końcowego, b) Rozpad a ze stanu 
podstawowego oraz ze stanów wzbudzonych (wysokoenergetycz¬ 
ne cząstki a) jądra wyjściowego do stanu podstawowego jądra 
końcowego 


nisko- i wy- dzonych (rozpady ac^ot 2 , ...) są z reguły bardzo małe 
sokoenerge- w stosunku do natężenia rozpadu do stanu podsta- 
tyczne wowego (rozpad a 0 ), gdyż energie E* x , E* 2 ... są mniej- 
cząstki « sze od E* Q . Można obserwować także rozpady ze 
stanów wzbudzonych jądra początkowego do stanu 
podstawowego jądra końcowego (rys. 4b). Tutaj, ze 
względu na wysokie energie cząstek a, j, 
można by oczekiwać dużych natężeń linii <x[, 

W rzeczywistości jednak natężenia te są bardzo małe, 
gdyż stany wzbudzone „chętniej” ulegają rozpadowi 
y niż a i tylko w bardzo niewielu przypadkach jądro 
wzbudzone zdąży wyemitować cząstkę a przed emisją 
kwantu y. 

Przy dokładnym opisie rozpadu a należy brać pod 

uwagę kilka dodatkowych czynników. Należą tu: 

— stopień różnicy w strukturze jądra początkowego 
i końcowego. Znaczne różnice w tej strukturze, jak 
różnice w spinie, parzystości, w strukturze powłoko¬ 
wej, deformacji, powodują dodatkowe spowolnienia 

tzw. wzbronienia) w rozpadzie a; 

— unoszenie przez niektóre cząstki a z jądra pewnej 
ilości momentu pędu. Daje to spowolnienie w emisji 
tych cząstek, ponieważ bariera potencjału dla nich 
jest wyższa (efekt sił odśrodkowych); 

— wzór (7) jest słuszny przy założeniu, że cząstki a 
są już gotowe w jądrze, przed ich emisją. W rzeczy¬ 
wistości w jądrze są protony i neutrony i istnieje tylko 
określone, znacznie mniejsze od jedności prawdopo¬ 
dobieństwo tworzenia się z nich struktur złożonych, 
takich jak cząstki a. 


Rozpad p 

Pod nazwą rozpadu lub przemiany fi rozumiemy trzy 
procesy: rozpad fi~ 9 rozpad fi + i wychwyt elektronu 
orbitalnego. 


Najbardziej prawdopodobny jest wychwyt z powłoki 
K (wychwyt K), znajdującej się najbliżej jądra. 

Widmo energetyczne elektronu (negatonu e~ lub 
pozytonu e + ) obserwowanego w rozpadzie fi jest 
ciągle. Ilustruje to rys. 5 podający zależność ilości 



Rys. 5. Zależność ilości elektronów N< obserwowanych w roz¬ 
padzie 0 od ich energii E 


obserwowanych elektronów N e od ich energii E. Fakt 
ten odpowiada różnemu możliwemu podziałowi ener¬ 
gii rozpadu pomiędzy elektron i neutrino (czy anty- 
neutrino) i był jednym z głównych powodów wpro¬ 
wadzenia (przez Pauliego) hipotezy istnienia neutri¬ 
na. Neutrino bowiem, jako cząstka oddziałująca 
słabo z materią, nie jest bezpośrednio obserwowane 
w rozpadzie fi. Jedynie maksymalna energia widma, 
odpowiadająca wypadkowi, gdy elektron unosi całą 
dostępną energię, równa jest energii przejścia fi: 

Em ax — Ex — Ey. 

W wypadku wychwytu elektronu emitowana jest 
tylko jedna cząstka (neutrino). Ma więc ona określo¬ 
ną energię, równą energii przejścia. 

Ze wzorów ($-10) widać, że rozpad fi nie zmienia 
liczby masowej jądra A. Jest więc przemianą, w której 
jądro wyjściowe i końcowe są izobarami. Rozpad 
p~ zwiększa ładunek jądra o 1, a rozpad p + i wychwyt 
elektronowy — zmniejszają. 

Wśród wszystkich izobarów o danym A istnieją 
tylko jeden, dwa lub trzy stabilne (trwale) względem 
rozpadu fi. Dokładniej, wśród izobarów o nieparzy¬ 
stym A istnieje tylko jeden trwały, a wśród izobarów 
o parzystym A mogą istnieć jeden, dwa lub trzy izo- 
bary trwałe. Stanowią one jądra najsilniej związane 
wśród tych izobarów. Dla parzystego A są to jądra 
o parzystej liczbie zarówno protonów Z, jak i neutro¬ 
nów N (tzw. jądra parzysto-parzyste). Natomiast 
jądra o nieparzystych Z i N (jądra nieparzysto-nie- 
parzyste) hie są trwale względem rozpadu p (z wyjąt¬ 
kiem kilku jąder najlżejszych, nie wychodzących poza 
”N). Szczególna trwałość jąder parzysto-parzystych 
pochodzi stąd, że oddziaływania jądrowe uprzy¬ 
wilejowują wiązanie się identycznych nukleonów 
w pary. 

Zilustrowane to jest na rys. 6. Na rys. 6a podana 
jest zależność masy izobaru o nieparzystym A od jego 
ładunku Z. Zależność tę dobrze opisuje model krop¬ 
lowy jądra (—► Modele jądrowe). Wykresem jej jest 
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parabola. Poszczególne izotopy odpowiadają na tej 
paraboli punktom, których współrzędna Z ma war¬ 
tości całkowite. Gdyby nie było sił kulombowskich 
pomiędzy protonami, najniższy punkt (najmniejsza 
masa, najsilniej związane jądro) byłby przy Z = A/2. 
Wobec odpychania kulombowskiego dogodniejsza 
energetycznie jest mniejsza liczba protonów w jądrze, 
zatem minimum występuje przy Z < A/2. Widoczne 
jest, że parabola ma zawsze dokładnie jeden punkt 
najniższy, a więc istnieje dokładnie jeden izobar trwa¬ 
ły, odpowiadający Z Tr . 

izobary W przypadku parzystego A (rys. 6b) mamy dwie 
trwałe parabole, oddalone od siebie o masę 2 ó/c 2 równoważ- 
oA parzystym ną energii rozerwania dwu par: jednej protonowej 
i jednej neutronowej. Przemiana fi, zmieniając jądro 
z parzysto-parzystego na nieparzysto-nieparzyste 
(lub odwrotnie), prowadzi od punktu na paraboli dol¬ 
nej do punktu na paraboli górnej (lub odwrotnie). 
Dla dowolnego punktu na paraboli górnej zawsze 
istnieje punkt sąsiedni, niższy, na paraboli dolnej 
i wobec tego jądro nieparzysto-nieparzyste zawsze 
(z wyjątkiem wspomnianych wyżej kilku jąder lek¬ 
kich) może przejść do jądra parzysto-parzystego. Na 
dolnej paraboli jednak może być kilka punktów, dla 
których nie ma sąsiednich punktów na paraboli gór¬ 
nej, które leżałyby niżej. Może więc być kilka parzy- 
sto-parzystych izobarów trwałych względem rozpadu 
fi. Na rys. 6b izobarami takimi są izobary o Z 4 i Z«. 
Na rysunku tym izobary o Z u Z 3 , Z 5 i Z 7 są niepa- 




Rys. 6. Zależność masy izobaru od jego liczby atomowej Z: 
a) Izobary o nieparzystej liczbie masowej A. Widoczne jest, że 
wśród wszystkich izobarów o nieparzystym A istnieje tylko jeden 
(Z = Ztr) trwały względem rozpadu fi. Pozostałe rozpadają się 
bądź poprzez rozpad fi~ (gdy Z < Ztr), bądź fi+ lub wychwyt 
elektronu (gdy Z > Ztr) i to tym szybciej, im dalej położony jest 
dany izobar od izobaru trwałego, b) Izobary o parzystym A. 
Dolna parabola odpowiada jądrom parzysto-parzystym, a gór¬ 
na — nieparzysto-nieparzystym. Widać, że w przypadku parzy¬ 
stego A mogą istnieć dwa (a nawet trzy) izobary trwałe względem 
rozpadu fi. Na rysunku są to izobary oZ=ZjiZ-=Z t 


rzysto-nieparzyste, a izobary o Z 2 , Z ą i Z e są parzysto- 
parzyste. Interesujący jest przypadek izobaru niepa- 
rzysto-nieparzystego o liczbie atomowej Z K . Widać, że 
może on ulegać rozpadowi zarówno jak i fi*. 

Przykładem takiego izobaru jest izotop miedzi 84 Cu, 
który ulega wszystkim trzem rodzajom rozpadu 
fi: fi~ (31% wszystkich rozpadów), fi + (15%) i wych¬ 
wytowi elektronu (54%). 

Szybkość rozpadu fi rośnie na ogół ze wzrostem szybkość 
energii rozpadu. Rysunek 6 ilustruje więc, że przy rozpadu fi 
oddalaniu się od izobaru trwałego, a więc od ścieżki 
trwałości (-* Jądra atomowe i ich wzbudzenia), ener¬ 
gia a zatem i szybkość rozpadu róśnie, tzn. czasy 
połowicznego zaniku 7> maleją. Przy tym, jeśli odda¬ 
lamy się w kierunku jąder ubogich w neutrony (np. 
produkty reakcji z ciężkimi jonami), to jest to wy¬ 
chwyt elektronu lub rozpad fi + , jeśli zaś w kierunku 
jąder bogatych w neutrony (np. produkty naświetla¬ 
nia strumieniem neutronów lub produkty rozszcze¬ 
pienia jąder ciężkich), to jest to rozpad fi~. 

Para elektron plus neutrino (czy antyneutrino) przejścia 
może być emitowana z jądra w stanach o różnym or- dozwolone 
bitalnym momencie pędu / = 0, 1, 2, ... (wyrażonym i wzbronione 
w jednostkach h). Najbardziej prawdopodobna jest 
emisja z / = 0. Są to tzw. przejścia „dozwolone”. 

Przejścia z wyższymi momentami orbitalnymi nazy¬ 
wają się, ze względów historycznych, „wzbroniony¬ 
mi”, a samo / — stopniem wzbronienia. Każdy sto¬ 
pień wzbronienia powoduje spowolnienie rozpadu 
o ok. dwa rzędy wielkości (tzn. o ok. 100 razy). 

Wśród przejść dozwolonych wyróżnia się tzw. przej¬ 
ścia uprzywilejowane, które zachodzą między stana¬ 
mi jądrowymi ó podobnej strukturze wewnętrznej. 


Rozpad y 

Przez rozpad czy przejście y rozumiemy przejście 
jądra ze stanu wzbudzonego do stanu o energii niż¬ 
szej, podczas którego energia przejścia unoszona jest 
przez promieniowanie elektromagnetyczne. Ze wzglę¬ 
du na duże energie przejść jądrowych, długości fal 
tego promieniowania są małe (z reguły mniejsze od 
1 A, tzn. od 0,1 nm) i ważny jest cząstkowy (korpusku- 
larny) aspekt tego promieniowania. 

Kwant promieniowania y emitowany z jądra cha¬ 
rakteryzuje się: 

— energią, jaką unosi on z jądra. Jest to energia reguły 

przejścia jądrowego (deekscytacji) wyboru dla 

przejść y 

E y = E'-E , (11) 

gdzie E jest energią stanu początkowego, a E' — 
energią stanu końcowego jądra, 

— momentem pędu (spinem, krętem) / (mierzonym 
w jednostkach h ), jaki unosi on z jądra. Może on 
przyjmować wartości / = 1, 2, 3,... Mówi się, że pro¬ 
mieniowanie (i odpowiadające mu przejście) unoszące 
spin / jest 2*-polowe lub multipolowe rzędu lub stop¬ 
nia l. Przy 1=1 jest to promieniowanie dipolowe, 
przy 1 = 2 — kwadrupolowe, 1 = 3 — oktupolowe. 
Promieniowanie określonej multipolowości / może być 
elektryczne ( E ) lub magnetyczne (M). Z zasady za¬ 
chowania momentu pędu wynika, że spin unoszony 
przez kwant y jest różnicą (wektorową, gdyż moment 
pędu jest wielkością wektorową) między spinami 
stanów: początkowego 1 i końcowego V jądra. Daje 
to warunek na / 

|/-/'| < / ^ /+/', ( 12 ) 

zilustrowany schematycznie na rys. 7, 

— parzystością P, która może być dodatnia (+) lub 
ujemna (—). Promieniowanie elektryczne o multipo¬ 
lowości / ma parzystość (— l) z , a magnetyczne — 

Zasada zachowania parzystości w oddziały¬ 
waniach elektromagnetycznych daje dla przejścia 
y o multipolowości / warunek 

PPi = P\ 


(13) 
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tzn., e między stanami jądrowymi o tej samej pa¬ 
rzystości ( P ' = P) mogą zachodzić tylko przejścia 
o parzystości dodatniej (np. przejście elektryczne 



Rys. 7. Ilustracja fak¬ 
tu, żc spin stanu po¬ 
czątkowego I jest su¬ 
mą (wektorową) spinu 

stanu końcowego V 

oraz spinu / unoszo¬ 
nego przez kwant y. 
Liniami kreskowany¬ 
mi zaznaczone są róż¬ 
ne możliwe orientacje 

spinu / 


Interesujące są przypadki, gdy pomiędzy stanami 
o znacznie różniących się spinach nie występują stany 
o spinach pośrednich. Przykładem są jądra, w których 
spiny pierwszego stanu wzbudzonego i stanu podsta¬ 
wowego różnią się znacznie. Wtedy prawdopodo¬ 
bieństwo przejścia y ze stanu wzbudzonego jest małe, 
bo multipolowość przejścia jest duża i czas połowicz¬ 
nego zaniku Ty jest duży. Może on być rzędu nawet 
godzin, podczas gdy dla przeciętnych stanów jądro¬ 
wych Ty jest, orientacyjnie, w granicach od mikro¬ 
sekund (10’ 6 s) do pikosekund (10" 12 s). Takie dłu- 
gożyciowe (metatrwałe) stany nazywają się izome¬ 
rycznymi, a jądra w tych stanach — izomerami jądro¬ 
wymi. Przykładem izomeru jądrowego jest jądro izo¬ 
topu indu m In w stanie o energii 335 keV. Stan ten 
jest stanem o najniższej energii wzbudzenia; jego spin 
wynosi 1 / 2 , a parzystość (—). Przejście do stanu pod¬ 
stawowego, który ma spin */ 2 i parzystość (+), może 
więc, zgodnie ze wzorem (12), mieć multipolowość 
tylko 4 lub 5. Uwzględniając także wzór (13) może to 
być przejście typu MA lub £5. W związku z wysoką 
multipolowością i małą energią przejścia czas poło¬ 
wicznego zaniku izomeru jest duży i wynosi 4,5 h. 


kwadrupolowe lub magnetyczne dipolowe), a między 
stanami o parzystości przeciwnej (£' = —£)— 
przejścia o parzystości ujemnej (np. elektryczne dipo¬ 
lowe). 

Wzory (11-13) nazywają się regułami wyboru dla 
przejść y. Ponieważ są one konsekwencją zasad za¬ 
chowania energii, momentu pędu i parzystości, sta¬ 
nowią warunki, które muszą być spełnione przy tych 
przejściach. Reguły wyboru pozwalają na wyznacza¬ 
nie energii, spinów i parzystości stanów jądrowych 
(-> Spektroskopia jądrowa) za pomocą pomiaru 
energii i multipolowości przejść y. 

Prawdopodobieństwo przejścia y, X y silnie zależy 
od energii przejścia Ey i multipolowości /. Rośnie ono 
silnie ze wzrostem E y , a bardzo silnie maleje ze wzro¬ 
stem /. Ten ostatni fakt oznacza, że najczęściej obser¬ 
wuje się przejścia tylko najniższej multipolowości: 
/ = 1 (dipolowe) i / = 2 (kwadrupolowe), a spośród 
wszystkich możliwych przejść między stanami o spi¬ 
nach I f i /, podanych przez regułę (12), obserwuje się 
na ogół tylko przejście o najniższym /, tj. o / = \1'—I\. 
Jeszcze innym wyrazem tej zależności jest fakt, że 
pomiędzy stanami o znacznie różniących się spinach 
jądro dokonuje najchętniej przejścia y nie bezpo¬ 
średnio (potrzebna duża multipolowość przejścia), 
lecz przez stany o spinach pośrednich. Przykład ta¬ 
kich przejść podany jest na rys. 8, który pokazuje 
widmo rotacyjne jądra parzysto-parzystego zdefor¬ 
mowanego. Spiny kolejnych stanów są: 0, 2, 4, 6, 
8, ... Obserwuje się tu kaskadę przejść o najniższej 
możliwej multipolowości (/ = 2), a więc przejścia 
pomiędzy stanami o najmniejszej różnicy spinów. 

— — ■ 8 + 


£ 2 

Rys. 8. Przykład typowego widma ro¬ 
tacyjnego jądra parzysto-parzystego 
y ' zdeformowanego. Jądro zdeformo- 

i ■ q wane może obracać się i energie od¬ 

powiadające różnym stanom tego ob¬ 
rotu (rotacji) tworzą właśnie widmo 
rotacyjne. Poziomy tego widma leżą 
E 2 stosunkowo nisko i dobrze się sepa¬ 

rują od pozostałych poziomów wzbu¬ 
dzonych jądra. Teoretyczny opis tych 
) f poziomów podany jest przez model 

44 . kolektywny jądra (—>Modele jądro- 
we). Kolejne stany mają spiny: 0, 2, 
4, 6, 8, ... oraz parzystość dodatnią 
£2 (+). Doświadczalnie obserwuje się 

w tutaj kaskadę przejść y typu £2 (ele¬ 

ktryczne kwadrupolowe) pomiędzy 

ł "“—2 + sąsiednimi stanami. Przejścia pomię- 
£2 dzy stanami dalszymi niż sąsiednie 

.. ■ o+ są natomiast bardzo słabe 


Konwersja wewnętrzna 

Procesem konkurencyjnym do przejścia y jest przej¬ 
ście, w którym energia deekscytacji jądra przekazy¬ 
wana jest bezpośrednio jednemu z elektronów powło¬ 
ki atomowej. Przejście takie nazywa się konwersją 
wewnętrzną. Elektron unosi tu energię, moment pędu 
i parzystość przejścia jądrowego, analogicznie, jak 
czyni to emitowany z jądra kwant y. Przejście ma 
więc określoną energię, multipolowość i parzystość. 
Obowiązują te same, co dla przejścia y, reguły wybo¬ 
ru (11-13). Ponieważ całą energię przejścia unosi 
jeden elektron, to widmo elektronów konwersji we¬ 
wnętrznej jest liniowe (prążkowe, dyskretne), w od¬ 
różnieniu od widma elektronów pochodzących z roz¬ 
padu p, które jest ciągłe. 

Stosunek prawdopodobieństwa deekscytacji jądra 
w drodze konwersji wewnętrznej X e do prawdopodo¬ 
bieństwa deekscytacji w drodze przejścia y, 2 V , na¬ 
zywa się współczynnikiem konwersji wewnętrznej a, 
tzn. a = Xe/X y . Współczynnik a silnie zależy od energii 
przejścia i jego multipolowości oraz od ładunku 
jądra Z. Maleje on szybko ze wzrostem energii przej¬ 
ścia, co oznacza, że konwersja wewnętrzna odgrywa 
najważniejszą rolę przy stosunkowo niskich ener¬ 
giach. Rośnie natomiast szybko ze wzrostem stopnia 
multipolowości przejścia /. Fakt ten dostarcza ważnej 
metody określania stopnia multipolowości przejścia 
przez pomiar współczynnika a (-* Spektroskopia 
jądrowa). Współczynnik a silnie rośnie ze wzrostem 
liczby atomowej jądra Z, co oznacza, że rola kon¬ 
wersji wewnętrznej rośnie przy przejściu do pier¬ 
wiastków najcięższych. 


Rozszczepienie 

Rozszczepieniem nazywamy proces, w którym jądro 
rozpada się na dwie lub więcej porównywalnych, co 
do wielkości, części (fragmentów). Występuje ono dla 
jąder ciężkich i zachodzi z większym prawdopodo¬ 
bieństwem w stanie wzbudzonym jądra niż w stanie 
podstawowym (tzw. rozszczepienie samorzutne). 

Prawdopodobieństwo rozszczepienia na dwa frag¬ 
menty (rozszczepienie podwójne) jest największe. 
Stosunkowo jeszcze znaczne jest prawdopodobień¬ 
stwo rozszczepienia, w którym obok dwu ciężkich; 
fragmentów powstaje także cząstka a (tzw. trypar¬ 
tycja). Rozszczepienie takie zachodzi z częstością ok. 
1 przypadku na 400 przypadków rozszczepienia po¬ 
dwójnego. Prawdopodobieństwo rozszczepienia na 3 
lub 4 porównywalne fragmenty jest już znikome. 

Ponieważ rozszczepiające się jądra ciężkie są znacz- 
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nie bogatsze w neutrony ( N/Z ~ 1,6) niż jądra 
średnie (N/Z « 1,3), to i fragmenty rozszczepienia 
są bogate w neutrony. Fragmenty te, powstające 
w silnie wzbudzonych stanach, emitują neutrony 
bezpośrednio po utworzeniu się (neutrony natych¬ 
miastowe) w liczbie średnio ok. 2,5 na jeden akt roz¬ 
szczepienia, a także po rozpadzie $ (neutrony opóź¬ 
nione). Emisja neutronów, które mogą z kolei po¬ 
wodować rozszczepienie innych jąder, stwarza możli¬ 
wość zajścia reakcji łańcuchowej (—> Energia jądrowa). 
W każdym akcie rozszczepienia wyzwala się duża, 
rzędu 200 MeV, energia (energia jądrowa). 

Rozszczepienie jąder ciężkich możliwe jest dzięki 
temu, że są one słabiej związane niż jądra o średniej 
masie, na które się rozpadają. Wiąże się to z odpy¬ 
chaniem kulombowskim między protonami. Energia 
tego odpychania rośnie ze wzrostem liczby atomowej 
Z jak Z 2 , co powoduje silne obniżenie energii wiąza¬ 
nia jąder ciężkich w stosunku do jąder lżejszych. Moż¬ 
liwe energetycznie rozszczepienie nie zachodzi jednak 
natychmiast, lecz z pewnym, dla niektórych jąder 
bardzo dużym, opóźnieniem, co spowodowane jest 
obecnością bariery potencjału. 

Orientacyjnie proces rozszczepienia można opisać 
za pomocą modelu kroplowego jądra (-* Modele 
jądrowe. Proces ten polega na deformowaniu się jądra 
od kształtu kulistego lub prawie kulistego poprzez 
coraz bardziej wydłużony, wydłużony z przewęże¬ 
niem w środku, aż do uformowania się i rozdzielenia 
dwu fragmentów. Zgodnie z modelem kroplowym 
energia potencjalna jądra może być przedstawiona 
jako suma energii powierzchniowej i energii kulom- 
bowśkiej. Energia powierzchniowa jest proporcjonal¬ 
na do pola powierzchni jądra. Ponieważ pole to rośnie 
ze wzrostem deformacji jądra, to i energia powierz¬ 
chniowa rośnie. Energia kulombowska zaś maleje, 
ponieważ deformowanie jądra (a dokładniej, wydłu¬ 
żanie się jego) sprzyja oddalaniu się od siebie odpy¬ 
chających się elektrycznie protonów. Dla małych de¬ 
formacji przyrost energii powierzchniowej jest większy 
od ubytku energii kulombowskiej, dla dużych zaś — 
odwrotnie. Całkowita energia zatem, jako suma ich 
obu, początkowo wzrasta, następnie przechodzi 
przez maksimum i wreszcie maleje ze wzrostem de¬ 
formacji jądra. Powstaje więc bariera potencjału. Ilu¬ 
struje to rys. 9, na którym energia jądra U(d) przed- 



lombowskiego, dążącego do rozpadu. W rozpadzie a 
jest to bariera ze względu na oddalanie się cząstki a 
od jądra, przy rozszczepieniu zaś jest to bariera ze 
względu na deformację jądra. 

Wysokość bariery, a więc i prawdopodobieństwo 
rozszczepienia, a tym samym i czas połowicznego 
zaniku ze względu na ten proces, zależą bardzo silnie 
od stosunku energii odpychania kulombowskiego do 
energii powierzchniowej zwanego parametrem roz- 
szczepialności, który wynosi w przybliżeniu 

1 Z 2 

X ~ 50~~A~ * 

Na przykład dla jądra izotopu uranu 238 U parametr 
rozszczepialności wynosi: x ~ 0,71, a czas połowicz¬ 
nego zaniku ze względu na samorzutne rozszczepie¬ 
nie: T sr •» 6-10 15 lat. Dla cięższego jądra izotopu 
fermu 254 Fm: * « 0,79, a T sr « 220 dni, tzn. jest 
o ok. 16 rzędów krótszy. Dla jeszcze cięższego jądra 
258 104: x £; 0,83, a (zmierzony ostatnio) T S r ~ 0,01 s, 
tzn. jest o ok. dalsze 9 rzędów krótszy. 

Według modelu kroplowego jądra mające x > 1, 
tj. dla których Z 2 (A > 50, nie mogą istnieć. Rozszcze¬ 
piałyby się one natychmiast. Model kroplowy nie 
uwzględnia jednak ważnych dla jądra efektów powło¬ 
kowych (efektów struktury powłokowej jądra), które 
istotnie modyfikują przewidywania tego -modelu. 
M.in. efekty te dopuszczają istnienie jąder bardzo 
ciężkich z Z-/A > 50 (hipoteza jąder superciężkich 
Jądra atomowe w stanach ekstremalnych). Powo¬ 
dują one także, że dla wielu jąder w barierze na roz¬ 
szczepienie pojawia się znaczne wgłębienie, lokalne 
minimum (tzw. drugie minimum), do którego, jeśli 

stan 

izomeryczny 


O 


O CO OO 
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Rys. 9. Zależność energii potencjalnej jądra U od jego deformacji 
d , jaką otrzymuje się w ramach modelu kroplowego. Dla wszy¬ 
stkich. jąder minimum energii (stan podstawowy jądra) otrzy¬ 
mywane jest przy deformacji zerowej (kształt kulisty). Na dole 
rysunku zobrazowane są kształty odpowiadające kilku warto¬ 
ściom parametru deformacj i d 

stawiona jest w funkcji deformacji d. Jądro w stanie 
o energii EW, aby ulec rozszczepieniu, musi przeniknąć 
barierę (efekt tunelowy) od deformacji d x do defor¬ 
macji d 2 . Kształty jądra odpowiadające różnym de¬ 
formacjom d ukazuje rysunek. 

Proces rozszczepienia jest zatem podobny do pro¬ 
cesu rozpadu a. Oba procesy polegają na tunelowym 
przeniknięciu przez barierę potencjału, utworzoną 
przez nałożenie się oddziaływania jądrowego, dążą¬ 
cego do zapobiegnięcia rozpadowi, i odpychania ku- 


deformacja d 

Rys. 10. Zależność energii potencjalnej jądra U od jego defor¬ 
macji d po uwzględnieniu efektów powłokowych. Efekty te po¬ 
wodują, że dla wielu jąder pierwsze, głębokie minimum energii 
potencjalnej, odpowiadające stanowi podstawowemu jądra, 
występuje przy kształcie zdeformowanym (jądra zdeformowane), 
a nie kulistym, jak przewiduje model kroplowy. Efekty powło¬ 
kowe powodują także, że dla niektórych jąder występuje rowmez 
drugie, płytsze minimum energii potencjalnej, odpowiadające 
stanowi izomerycznemu. Ze względu na mniejszą barierę, roz¬ 
szczepienie ze stanu izomerycznego następuje znacznie szybciej 
niż ze stanu podstawowego. Deformacja jądra w stanie podsta¬ 
wowym oznaczona jest przez dp, a w izomerycznym — przez di 

jądro zostanie „schwytane", to trwa w nim stosunko¬ 
wo długo, zanim się rozszczepi. Ilustruje to rys. 10, 
który przedstawia przebieg energii potencjalnej w 
funkcji deformacji dla niektórych jąder. Na rysunku 
widać, że jądro o deformacji di musi pokonać barierę 
zarówno po to, by się rozszczepić, jak też by przejść 
do stanu podstawowego. Stan jądra o tej deformacji 
jest więc metatrwały, a zatem jądro znajdujące się 
w tym stanie jest izomerem. Natura tego izomeru jest 
jednak inna niż izomerów dotąd omawianych. Po¬ 
przednio mówiliśmy o izomerach, których długi czas 
życia związany był z dużą różnicą między spinem stanu 
izomerycznego a spinami stanów osiąganych przez 
rozpad w drodze przejścia elektromagnetycznego. 
W omawianym wypadku zaś długi czas życia izo- 
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izomery mera związany jest z istnieniem bariery potencjału, 
rozszczepia- Izomery tego typu nazywane są izomerami rozszcze- 
jące się piającymi się lub, czasami, izomerami kształtu. Pierw¬ 
szy taki izomer zaobserwowany został w 1962 r. 
w jądrze a42 Am. Obecnie znamy ok. 30 takich izome¬ 
rów. Występują one w jądrach uranu, plutonu, ame- 
ryku, kiuru i berkelu. 

Ze względu na znacznie mniejszą barierę na roz¬ 
szczepienie niż bariera jaką ma jądro w stanie pod¬ 
stawowym (por. rys. 10), prawdopodobieństwo roz¬ 
szczepienia izomerów jest bardzo duże (stąd ich na¬ 
zwa— izomery rozszczepiające się), czyli czasy ich 
życia ze względu na ten proces — bardzo małe. Czasy 


te zawierają się w przedziale od nanosekund (10“ 9 s 
do milisekund (10~ 3 s), są one o 21 do 31 rzędów krót¬ 
sze niż odpowiednie czasy życia stanów podstawo¬ 
wych tych samych jąder. Na przykład czas życia ze 
względu na samorzutne rozszczepienie dla stanu pod¬ 
stawowego jądra 238 U wynosi ok. 6 TO 15 lat, a dla 
rozszczepiającego się izomeru tego samego jądra — 
195 ns, czyli jest o ok. 30 rzędów krótszy. 

L. Groszew, I. Szapiro Spektroskopia jąder atomowych , War¬ 
szawa 1956; D. Halliday Wstęp do fizyki jądrowej, Warszawa 
1957; A. Strzałkowski Wstęp do fizyki jądra atomowego. 
Warszawa 1978; Sz. Szczeniowski Fizyka doświadczalna , cz. 6, 
Warszawa 1974; E. Szpolski Fizyka atomowa, t. 2, cz. 2, War¬ 
szawa 1954. 


Reakcje jądrowe 

Piotr Decowski 

Reakcją jądrową nazywamy proces wynikający z od¬ 
działywania cząstki jądrowej (może nią być cząstka 
elementarna, jak np. nukleon, mezon, foton lub 
cząstka złożona, np. deuteron, cząstka a czy też każde 
inne jądro atomowe, tzw. ciężki jon) z jądrem ato¬ 
mowym. W wyniku zajścia reakcji jądrowej bombar- 
rozpraszanie dowane jądro tarczy może pozostać bez zmiany, 
elastyczne może zostać wzbudzone lub też może powstać inne 
i nieelasty- jądro atomowe w stanie podstawowym czy też wzbu- 
czne dzonym (rys. 1). Procesowi temu towarzyszy zwykle 



Rys. 1. Przykłady różnych reakcji jądrowych: 1. Rozpraszanie 
elastyczne: cząstka a rozprasza się sprężyście w oddziaływaniu 
z jądrem A. Jądro A uzyskuje pewną energię kinetyczną, lecz jego 
stan wewnętrzny nie ulega zmianie. 2. Rozpraszanie nieelastyczne. 
W oddziaływaniu część energii kinetycznej cząstki a zostaje 
zużyta na wzbudzenie jądra A (jądro wzbudzone oznaczamy 
jako A*). 3. Reakcja jądrowa sensu stricto: w wyniku oddziały¬ 
wania powstaje cząstka b i jądro B* 

emisja jednej lub wielu cząstek elementarnych lub 
złożonych. Reakcje jądrowe zachodzą stosunkowo 
szybko — w czasie od 10 -23 s do 10~ 13 s. Stosują się 
do nich wszystkie klasyczne prawa zachowania obo¬ 
wiązujące powszechnie w fizyce (prawo zachowania 
energii, pędu, momentu pędu, ładunku), ponadto 
kwantowy charakter procesu, wynikający z małych 
rozmiarów oddziałujących obiektów oraz małych 
wartości wymienianej energii, narzuca dodatkowe 
prawa zachowania (np. parzystości funkcji falo¬ 
wej). 

Z zasady zachowania energii wynika, że ubytek lub 
zysk całkowitej energii kinetycznej cząstek biorących 
udział w reakcji może mieć źródło tylko w zysku lub 
ubytku łącznej masy cząstek. Różnica łącznej masy 
cząstek wchodzących w reakcję i łącznej masy pro- 
ciepło reakcji duktów reakcji zwana jest ciepłem reakcji. Znajo¬ 


mość ciepła reakcji (np. obliczonego na podstawie 
dokładnych tablic mas jąder atomowych) pozwala 
przewidzieć kinetyczną energię produktów przy zada¬ 
nej energii kinetycznej cząstki wywołującej reakcję. 

Do opisu reakcji jądrowych wprowadza się pojęcie kanał 
„kanału reakcji”. Jest on scharakteryzowany przez reakcji 
rodzaj cząstek oddziałujących lub emitowanych 
w reakcji jądrowej, ich energię, moment pędu w ruchu 
względnym, przestrzenne ustawienie spinów. Tak 
więc mamy „kanał wejściowy” opisujący cząstkę wy¬ 
wołującą reakcję i jądro bombardowane oraz szereg 
„kanałów wyjściowych” opisujących wszystkie mo¬ 
żliwe cząstki i jądra końcowe po zajściu reakcji. 

Miarą prawdopodobieństwa zajścia określonej przekrój 
reakcji jądrowej jest wielkość zwana przekrojem czynny 
czynnym. Przekrój czynny jest liczbowo równy pra¬ 
wdopodobieństwu zajścia reakcji w czasie jednej se¬ 
kundy dla jednostkowego strumienia cząstek wywo¬ 
łujących reakcję (1 cząstka/cm 2 s) podzielonemu 
przez liczbę jąder w bombardowanej próbce (rys. 2). 

Przekrój czynny przedstawia jakby efektywną po¬ 
wierzchnię przekroju jądra atomowego w badanym 
procesie. Przemnożony przez liczbę jąder w próbce 
daje powierzchnię stanowiącą efektywną przegrodę 
dla wiązki cząstek bombardujących (przy założeniu, 
że próbka jest na tyle cienka, że wzajemne „przesła¬ 
nianie” jąder można pominąć). 

Przekroje czynne na oddziaływanie cząstek bom¬ 
bardujących z jądrami są na ogół rzędu rozmiarów 
jąder: 10 -24 cm 2 (choć np. dla powolnych neutronów 


próbka o powierzchni S 
przekroju prostopadłego 
do kierunku wiązki 



Rys. 2. Przekrój czynny w reakcji jądrowej. Przez próbkę prze¬ 
nika 0S cząstek na sekundę. W próbce znajduje się N jąder, 
z których każde reprezentuje przekrój a. Łączna powierzchnia 
czynna zajmowana przez jądra wynosi Na i stanowi Na/S cał¬ 
kowitej powierzchni próbki. Liczba cząstek zderzających się 
w ciągu sekundy z jądrami wynosi: 

(Na/S)0S = No<P 
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mogą osiągać wartości nawet kilkadziesiąt tysięcy 
razy większe). Ze względu na małe wartości wprowa¬ 
dzono dla nich miary specjalne, jednostki zwane bar¬ 
nami (1 b = 10“ 24 cm 2 ). 

Prawdopodobieństwo procesu, w którym cząstki są 
wysyłane w określonym kierunku, wyraża się przez 
kątowy różniczkowy przekrój czynny: da/dQ . Jest on 



Rys. 3. Przekrój czynny Aa dla procesu emisji cząstki w wąskim 
stożku obejmującym kąt bryłowy JO o osi skierowanej w kie¬ 
runku wyznaczonym przez kąty 6 i <p jest określany przez ką¬ 
towy różniczkowy przekrój czynny dajdD: 

Aa = (daldtt)A£2 

graniczną wartością stosunku przekroju czynnego 
Aa procesu emisji cząstki w stożku o osi skierowanej 
w zadanym kierunku do dążącej do zera wartości 
obejmowanego przez stożek kąta bryłowego AQ 
(rys. 3). Zależność przekroju da/dQ od kątów wyzna¬ 
czających kierunek emisji nosi nazwę rozkładu kąto¬ 
wego reakcji. Podobnie tzw. energetyczny różniczko¬ 
wy przekrój czynny da/dE mówi o prawdopodobień¬ 
stwie emisji cząstek o określonej energii. Wyznacza 
on przekrój czynny Aa na emisję cząstek o energiach 
mieszczących się w wąskim przedziale (E, E+AE): 
:Aa = (da/dE) AE. Zależność energetycznego różnicz¬ 
kowego przekroju czynnego od energii emitowanej 
cząstki przy ustalonej energii cząstki padającej, na¬ 
zywa się rozkładem energetycznym lub widmem emi¬ 
towanych cząstek. 

Jądro powstające w wyniku reakcji jądrowej może 
być utworzone w różnych, ale na ogół ściśle określo¬ 
nych stanach energetycznych (jest to konsekwencją 


praw kwantowych rządzących mikroświatem, w myśl 
których dopuszczalne są tylko pewne wartości energii 
stanów układu). W związku z tym w widmie energe¬ 
tycznym cząstek towarzyszących tworzeniu jąder wy¬ 
stępują oddzielne linie odpowiadające poziomom 
energetycznym „jądra końcowego'*. Intensywność 
tych linii wyznacza prawdopodobieństwo wzbudzania 
różnych poziomów energetycznych (rys. 4). 


Badanie reakcji jądrowych 


Badanie reakcji jądrowych zmierza do dwóch celów: 
poznania mechanizmu reakcji oraz poznania budowy 
jądra atomowego i struktury jego stanów wzbudzo¬ 
nych przez wpływ tych czynników na przebieg reak¬ 
cji. Z reguły cząstki oddziałujące z jądrem siłami ją¬ 
drowymi i wywołujące reakcje są, poza jednym wy¬ 
jątkiem — neutronem, naładowane dodatnio (pomi¬ 
jamy tu mezony i hiperony, cząstki tworzone w od¬ 
działywaniach o znacznej energii, ulegające bardzo 
szybko rozpadowi). Aby cząstka taka mogła znaleźć 
się w bezpośrednim sąsiedztwie jądra atomowego na 
tyle blisko, by krótkozasięgowe siły jądrowe mogły 
doprowadzić do oddziaływania, trzeba jej nadać od¬ 
powiednio dużą energię. Energia musi być wystar¬ 
czająca do pokonania elektrostatycznego odpychania 
pochodzącego od dodatnio naładowanego jądra. 

Energia odpychania, zw. barierą kulombowską (rys. bariera 
5), wynosi np. dla protonów bombardujących od 2 kulombo- 
MeV dla jąder najlżejszych do kilkunastu MeV dla wska 
jąder ciężkich (1 MeV = 1,6 10~ 13 J jest energią, jaką 
nabywa ładunek elementarny po przebyciu różnicy 
potencjałów 1 miliona woltów). 



Rys. 5. Energia potrzebna na pokonanie przez protony i cząstki 
a odpychania elektrostatycznego różnych jąder o liczbie ato¬ 
mowej Z. Cząstki a — mające dwa razy większy ładunek niż 
proton — mają barierę w przybliżeniu dwa razy większą 



energia protonów E p 

Rys. 4. Widmo energetyczne protonów emitowanych pod kątem 30° podczas bombardowania tarczy aluminiowej deuteronami o energii 
7 MeV. Część deuteronów ulega reakcji zdarcia —neutron zostaje włączony do jądra ”A1 tworząc jądro * AJ, a proton wylatuje z próbki 
unosząc energię zwiększoną o energię wyzwoloną w reakcji (jest to reakcja egzotermiczna, ciepło reakcji wynosi w tym przypadku 5,5 
MeV). Największa energia protonu — linia 1 — odpowiada powstaniu jądra **A1 w stanie podstawowym, dalsze linie odpowiadają 
kolejnym stanom wzbudzonym (wg J. B. A. England Metody doświadczalne fizyki jądrowej , Warszawa 1981) 
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Cząstki przyspiesza się do odpowiedniej energii 
w różnego typu akceleratorach: elektrostatycznych, 
cyklicznych, liniowych (—► Akceleratory). 

Do rejestracji cząstek używa się wiele typów detek- 
czastek torów. Wszystkie działają na zasadzie rejestracji jo¬ 
nizacji wywoływanej przez cząstkę naładowaną w cza¬ 
sie jej przelotu przez ośrodek wypełniający objętość 
czynną detektora (ośrodkiem tym może być gaz, jak 
np. w licznikach gazowych, ciecz, jak np. w niektó¬ 
rych licznikach scyntylacyjnych lub w komorach pę¬ 
cherzykowych, albo ciało stałe, jak w detektorach 
półprzewodnikowych, kliszach jądrowych itp.). Nie¬ 
kiedy, w celu określenia pędu cząstki analizuje się za¬ 
krzywienie jej toru w znanym polu magnetycznym, 
np. w spektrografie magnetycznym (—*■ Detekcja czą¬ 
stek). 

Wszystkie powyższe metody pozwalają rejestrować 
wyłącznie cząstki naładowane. Do detekcji cząstek 
obojętnych (np. neutronów lub fotonów) należy wy¬ 
korzystywać wywołane przez nie reakcje wtórne, 
w których wytwarzane są cząstki naładowane (np. 
w przypadku fotonów efekt fotoelektryczny). W więk¬ 
szości wypadków zadaniem detektorów jest wyzna¬ 
czenie energii kinetycznej (lub pędu) rejestrowanej 
cząstki. Bardziej złożone układy detektorów (telesko¬ 
py) pozwalają określić jej masę i ładunek. 

Neutrony, pozbawione ładunku elektrycznego, są 
szczególnym rodzajem cząstki wywołującej reakcję. 
Brak bariery kulombowskiej powoduje, że nawet 
bardzo powolne neutrony mogą oddziaływać z jądrem 
atomowym. Źródłem tych neutronów są reaktory 
jądrowe (—► Energia jądrowa). 

wielkości Badania reakcji jądrowych koncentrują się na po¬ 
mierzone miarach zależności przekroju czynnego od energii 
padających cząstek (tzw. krzywa wzbudzenia, reak¬ 
cji — r ys. 6) oraz rozkładów energetycznych i kąto¬ 
wych cząstek wtórnych (rys. 7). Niekiedy cenne jest 
zmierzenie ukierunkowania przestrzennego spinów 
emitowanych cząstek (pomiar polaryzacji). Pomiar 
ten jest równoważny pomiarowi zależności różnicz¬ 
kowego przekroju czynnego od kąta azymutalnego 
odmierzanego względem osi wyznaczonej przez bieg 
wiązki cząstek o spolaryzowanych przestrzennie spi¬ 
nach (rys. 8). 

Informacje uzyskane z takich pomiarów pozwalają 
wysnuć wnioski o przebiegu reakcji (jej mechanizmie). 



Gdy mechanizm reakcji jest dobrze określony, po¬ 
równanie danych eksperymentalnych z przewidywa¬ 
niami teoretycznymi wynikającymi z przyjętego 
modelu mechanizmu reakcji umożliwia poznanie 
struktury jądra. 



Bi 

rozpraszanie nieelastyczne E n ■» 4.2 MeV 

-H-1—H— 
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Rys. 7. Rozkłady kątowe dla rozpraszania elastycznego i nie¬ 
elastycznego neutronów na jądrach bizmutu. Zwraca uwagę za¬ 
sadnicza różnica przebiegu oba rozkładów nasuwająca przypusz¬ 
czenie, że procesy te przebiegają w całkowicie odmienny sposób 
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Rys. 8. Reakcja jądrowa może prowadzić do ^uprzywilejowania 
kierunku spinów emitowanych cząstek (cząstki zostają spolary¬ 
zowane) mimo, że cząstki podające są niespolaryzowane: a) Po¬ 
laryzacja emitowanych cząstek jest funkcją kąta azymutalnego 
aj, natomiast różniczkowy przekrój czynny nie zalezy od tego 
kąta, gdyż przy braku polaryzacji cząstek padających musi 
istnieć symetria procesu względem osi z. b) W przypadku istnie¬ 
nia polaryzacji cząstek wywołujących reakcję, różniczkowy prze¬ 
krój czynny zależy od kąta azymutalnego <p. .. 

Gdy znany jest mechanizm reakcji, badanie polaryzacji czą¬ 
stek emitowanych w sytuacji a) dostarcza identycznych infor¬ 
macji co pomiar różniczkowego przekroju czynnego w sytuacji b) 
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Formalny opis reakcji jądrowych 

paczka Do procesów jądrowych stosuje się opis kwantowy, 
falowa Poruszająca się cząstka jest reprezentowana przez 
tzw. paczkę falową (rys. 9). Kwadrat amplitudy takiej 



Rys. 9. Paczka falowa poruszająca się z prędkością » 


fali określa prawdopodobieństwo znalezienia się 
cząstki w danym punkcie przestrzeni. Przykładem 
paczki falowej w skali makroskopowej jest kulista 
fala rozchodząca się po powierzchni wody po wrzu¬ 
ceniu do niej kamienia. 

Paczka falowa powstaje przez dodanie się do siebie 
wielu fal o nieco różnych długościach. Jej rozmiary 
przestrzenne (Ax na rys. 9) zależą od przedziału dłu¬ 
gości fal tworzących ją — im przedział AX jest większy, 
tym mniejsze jest rozmycie paczki Ax. Fala o długości 
X przedstawia cząstkę o pędzie p — h/k (h — stała 
Plancka). Jeżeli długość fali X nie jest ściśle określona 
(rozmyta), to to samo dotyczy pędu. Ogólnie, ilościo¬ 
wo ujmuje tę zależność zasada nieokreśloności Hei- 
senberga 

Ax-Ap 7* h. 

Paczka falowa przesuwająca się z prędkością u równą 
prędkości poruszania się cząstki mija jakiś punkt 
w przestrzeni w czasie 

At = Ax/v iij(vAp), 

przy tym 

v Ap — AE 

(E = p 2 j2m, gdyż zakładamy, że cząstka porusza się 
tak wolno, że można pominąć efekty relatywistyczne; 
stąd — różniczkując — AE = pAp/m = vAp). 

Zatem z pędowo-położeniową relacją nieokreślo¬ 
ności wiąże się ściśle relacja czasowo-energetyczna: 

AE-At ^ h. 

cząstka W opisie teoretycznym reakcji jądrowych wygodnie 
o określonym jest rozpatrywać cząstkę o dokładnie określonym 
pędzie wektorze pędu (Ap = 0), a tym samym — o ściśle 
określonej energii (AE — 0). Jak wynika z zasady 
Heisenberga cząstka taka jest reprezentowana przez 
paczkę rozmytą na nieskończenie duży obszar — jest 
to po prostu fala płaska, biegnąca w kierunku wektora 
pędu cząstki. Innymi słowy, ponieważ wartość pędu 
cząstki jest dobrze określona, jej położenie jest zu¬ 
pełnie nieokreślone. Gęstość prawdopodobieństwa 
znalezienia cząstki w dowolnym punkcie jest stała 
i nie zależy od współrzędnych punktu. Umownie 
przyjmuje się, że odpowiada ona jednej cząstce 
w 1 cm 3 . Cząstki poruszają się z prędkością v, więc 
taka fala płaska reprezentuje strumień v cząstek/ 
/cm 2 -s. Ze względu na dobrze określoną energię czą¬ 
stki również czas zajścia reakcji jest zupełnie nie¬ 
określony. Nie ma sensu mówić o sytuacji przed zde¬ 
rzeniem lub po zderzeniu — opis powinien zawierać 
wszystkie sytuacje naraz. Strumieniowi cząstek pada¬ 
jących na centrum rozpraszające stale towarzyszy 
strumień cząstek rozproszonych. Naturalnie, można 


wprowadzić rozmycie pędu cząstki i przez to zlokali¬ 
zować ją w przestrzeni. Wówczas jest możliwe opi¬ 
sanie ewolucji procesu w czasie — zbliżanie się czą¬ 
stek do jądra, a po oddziaływaniu — oddalanie się 
cząstki rozproszonej. Opis taki jest jednak bardziej 
skomplikowany matematycznie i przez to mniej 
wygodny. 

Można wykazać, że każdą falę płaską da się przed- y aIa płaska 
stawić w postaci superpozycji nieskończonego szeregu jako super- 
fal kulistych o odpowiednio zmodulowanych ampli- pozycja fal 
tudach zbiegających się do pewnego punktu w przes- kulistych 
trzeni (np. może nim być centrum rozpraszające) oraz 
fal rozchodzących się z tego punktu. Łatwo to wyjaś¬ 
nić stosując zasadę Huygensa, która mówi, że każdy 
punkt powierzchni falowej jest źródłem fali kulistej 



obszar oddziaływania 



Rys. II. Superpozycja fal: a) Nie ma przesunięcia w fazie między 
falą zbiegającą się i falą rozchodzącą się. Powstała w wyniku 
interferencji między nimi fala stojąca ma węzeł w centrum roz¬ 
praszania. b) Fala rozchodząca się jest przesunięta w fazie o 
& = ±tc względem fali zbiegającej się. Powstała fala stojąca 
przesunięta w fazie o S = ±tz{2 posiada strzałkę w centrum roz¬ 
praszania. Duże jest prawdopodobieństwo przebywania cząstki 
w obszarze oddziaływania 
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(rys. 10). Rozkład na fale kuliste jest o tyle pomocny, 
źe, zgodnie z tym co podpowiada intuicja, pojawienie 
się w wyniku oddziaływania strumienia cząstek roz¬ 
proszonych prowadzi do modyfikacji wyłącznie fal 
rozchodzących się z centrum rozpraszającego, a nie 
ma wpływu na fale zbiegające się. 
opis Przyjmijmy, że obszar działania sił rozpraszających 
za pomocą ma kształt kuli o promieniu R, której środek znajduje 
fal kulistych się w początku układu współrzędnych. Fala kulista 
wchodząca do tego obszaru ulega oddziaływaniu, 
w wyniku czego opóźnia się i rozchodzi się dalej 
z pewnym przesunięciem w fazie 5. Interferując 
z napotkaną falą zbiegającą się, tworzy falę stojącą, 
przesłoniętą w fazie o ó = 5/2 w porównaniu z sy¬ 
tuacją bez oddziaływania (rys. 11). 

Gdy nie ma rozpraszania (d = 0), w punkcie 
r — 0 znajduje się węzeł funkcji falowej. Dla oddzia¬ 
ływania, któremu odpowiada strzałka drgań w punk¬ 
cie r = 0 (czyli dla którego <5 = ±^/2), funkcja fa¬ 
lowa ma dużą amplitudę w obszarze oddziaływania — 
duże jest prawdopodobieństwo przebywania bom¬ 
bardującej cząstki w obszarze działania sił rozprasza¬ 
jących, a więc wniknięcia jej do jądra. Mówimy, że 
mamy wówczas do czynienia z rezonansem jądro- 
rezonans wym. Przesunięcie fazowe 6 zależy od energii padają- 
Jądrowy cych cząstek (a więc od długości odpowiadających 
im fal). Okazuje się, że zależność ta jest szczególnie 
silna w obszarze rezonansu (rys. 12). 



Rys. 12. Zależność od energii przesunięcia fazowego fal odpo¬ 
wiadających rozpraszanym cząstkom o orbitalnym momencie 
pędu / = 2 i całkowitym spinie / *=» */a w reakcji łl O (n, n ) ”0. 
Przy energiach ok. 1 MeV i ok. 3,3 MeV występują rezonanse 
w rozpraszaniu neutronów 


Weźmy pod uwagę falę rozchodzącą się od punktu 
r = 0, której faza w wyniku istnienia oddziaływania 
w obszarze r < R ulega przesunięciu o 5 = 2 < 5 . Tę 
falę kulistą można zapisać w postaci: 

exp [/ (kr + 2<5 (E)—Et/ft)] przy r > R, 

gdzie E = fPktjlm i k = p/h — energia i liczba falo¬ 
wa cząstki o masie m i pędzie p. Z takich fal, o nieco 
różnych energiach, tworzy się paczka falowa, której 
maksimum jest w chwili / = 0 umiejscowione w punk¬ 
cie r — 0. Maksimum paczki falowej znajdzie się 
w odległości r = R wtedy, gdy w miejscu tym nastąpi 


konstruktywna interferencja fal tworzących paczkę. 

Odpowiada to warunkowi, że różnica faz fal o nieco 
różnych wektorach falowych k i k' jest w tym miejscu 
minimalna: 

(k-WR+lSW-lóW-a/kKE-E')* = 0 , 
stąd dla E' E 

t = fi R dk/dE -f 2/t dd/dE, 

czyli 

/ = R/v+ 2/i dd/dE, 

gdyż 

dk/dE = m/frk = mjhp = \}hv 
(v — prędkość cząstki). 

Podobnie paczka falowa utworzona z fal zbiegają¬ 
cych się do punktu r = 0 o postaci 

■i- exp [i(—kr—Et/k)] przy r > R t 

reprezentująca cząstki padające, przebiega odcinek 
odr = Rdor = 0w czasie / = Rfv. Tak więc czas t 
potrzebny na przejście cząstki przez całą sferę oddzia¬ 
ływania o średnicy 2 R wynosi: 

t = t 0 + 2 j * dd/dE, 

gdzie t 0 = 2 R/v jest czasem przejścia w nieobecności opóźnienie 
oddziaływania. Oddziaływanie wprowadza opóźnię- cząstki 
nie w ruchu cząstki. Jest ono największe wtedy, gdy 
pochodna dd/dE ma największą wartość, a więc np. 
w maksimum rezonansu (por. rys. 12). Zatem przy 
energiach cząstki odpowiadających rezonansowi 
w oddziaływaniu z potencjałem rozpraszającym, jej 
wyjście z obszaru oddziaływania (emisja) następuje 
z pewnym opóźnieniem i to tym większym, im wartość 
jej energii jest bliższa maksimum rezonansu. Im rap- 
towniejsze są zmiany przesunięć fazowych przy zmia¬ 
nie energii (rezonans ma mniejszą szerokość energe¬ 
tyczną r —jest węższy w skali energii), tym większe 
jest opóźnienie. 

Wartości przesunięcia fazowego wiążą się ściśle 
z przekrojem czynnym na rozpraszanie elastyczne. 

Znając je znamy również postać funkcji falowej poza 
obszarem oddziaływania: yO 5 )- Przez odjęcie fali 
płaskiej opisującej strumień cząstek padających, 
można z niej wyodrębnić falę rozchodzącą się, odpo¬ 
wiadającą cząstkom rozproszonym: 

W = y>(&) —w 



Rys. 13. Krzywa wzbudzenia reakcji wychwytu protonów przez 
jądra ,ł Al w wyniku czego zostaje wysłane promieniowanie 
elektromagnetyczne. Występowanie wąskich rezonansów ozna¬ 
cza, że przy pewnych energiach emisja promieniowania jest 
znacznie opóźniona (tworzą się długożyjące stany wzbudzone 
jądra) 
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Znajomość w -Ikości amplitudy fali rozproszonej 
pozwala ouliczyć strumień cząstek rozproszonych, 
a więc i przekrój czynny dla elastycznego rozprasza¬ 
nia. Tak więc przesunięcia fazowe, które możemy 
określić zakładając postać potencjału oddziaływania 
i rozwiązując odpowiednie równanie falowe (równa¬ 
nie Schrodingera), zdają sprawę z prawdopodobień¬ 
stwa rozpraszania cząstki. 

Reakcje jądrowe mogą przebiegać w bardzo różny 
sposób. Są reakcje szybkie — zachodzące w czasie 
bliskim czasowi przejścia cząstki przez jądro (10“ 22 - 
10“ 21 s), w innych reakcjach może się tworzyć stan 
pośredni, trwający stosunkowo długo (10“ 17 - 
10~ 18 s), i dopiero w trakcie jego rozpadu emitowana 
jest cząstka — produkt reakcji. 

W świetle tego, co powiedziano poprzednio, cechą 
charakterystyczną reakcji szybkich, o małych opóź¬ 
nieniach emisji, jest gładka zależność przekroju czyn¬ 
nego od energii wynikająca ze słabej zależności ener¬ 
getycznej przesunięć fazowych. W przypadku two¬ 
rzenia się długożyjących stanów pośrednich sytu¬ 
acja jest odwrotna — w krzywej wzbudzenia muszą 
występować silne zmiany, wąskie rezonanse, zdające 
sprawę z dużych opóźnień (rys. 13). 


zwę modelu optycznego. Wprowadzenie części uro- model 
jonej potencjału odpowiedzialnej za pochłanianie jest optyczny 
konieczne tym bardziej, że w trakcie bombardowania 
jądra może zachodzić wiele innych procesów, różnych 
od rozpraszania elastycznego. W tych procesach 
cząstki mogą być zarówno wysyłane z jądra wzbu¬ 
dzonego, jak też mogą być wybijane bezpośrednio 
z jądra przez padającą cząstkę. Prowadzi to do usu¬ 
wania cząstek z wiązki rozpraszanej elastycznie. 

Stosując model optyczny można przewidywać 
przekroje czynne na rozpraszanie elastyczne oraz na 
absorpcję cząstek. Model ten jest również przydatny 
przy obliczaniu wielu innych wielkości stosowanych 
do opisu rozpraszania i pochłaniania, jak np. współ¬ 
czynników transmisji określających prawdopodo¬ 
bieństwo wniknięcia do wnętrza jądra cząstki o ok¬ 
reślonej wartości momentu pędu czy też przesunięć 
fazowych. Warunkiem uzyskania właściwych rezul¬ 
tatów jest zastosowanie w obliczeniach odpowiednio 




b) 

Rc 


Mechanizmy reakcji jądrowych 

Przykładem reakcji zachodzącej w krótkim czasie 
może być rozpraszanie elastyczne. Ruch cząstki pa¬ 
dającej zostaje zakłócony przez pole sił działających 
wokół i wewnątrz jądra, jednakże nie wpływa na stan 
wewnętrzny jądra. Jądro można zastąpić po prostu 
pewnym obszarem działania sił. Pole sił opisuje się 
potencjałem jądrowym oraz, gdy cząstka ma ładunek 
dodatni, potencjałem odpychania elektrostatycznego. 
Wystarcza znajomość potencjału, aby w pełni opisać 
zjawisko przez rozwiązanie równania Schrodingera 
różniczkowego równania na funkcję falową układu. 
Opisane zjawisko nie jest jednak jedynym możliwym 
sposobem przebiegu rozpraszania elastycznego. Czą¬ 
stka, po wniknięciu do jądra, może oddziaływać 
z nukleonami powodując ich przegrupowanie. Jej 
energia rozdziela się między wiele nukleonów. Taki 
stan wzbudzenia trwa stosunkowo długo, aż przypad¬ 
kowo energia skupi się ponownie na nukleonie lub 
grupie nukleonów tworzących cząstkę umożliwiając 
jej emisję. Jeśli energia emitowanej cząstki będzie taka 
sama (w układzie środka masy), jak energia cząstki 
padającej, będziemy znowu mieć do czynienia z roz¬ 
praszaniem elastycznym, z tym że teraz emisja nastąpi 
ze znacznym opóźnieniem. 

Aby wyodrębnić procesy szybkie, związane z ma¬ 
łymi przedziałami czasowymi, należy je dobrze zlo¬ 
kalizować w czasie. Zlokalizowana w czasie paczka 
falowa odznacza się dużym rozmyciem wektorów fa¬ 
lowych, czyli dużym rozmyciem energii. Innymi sło¬ 
wy, aby śledzić zachowanie się wielkości związanych 
z procesami szybkimi (np. przekrojów czynnych na 
te procesy), należy dokonać ich uśrednienia po 
dość znacznym przedziale energii (^|1 MeV). Fale, 
odpowiadające emisji z jądra wzbudzonego, są tak 
bardzo opóźnione, że nie dają już wkładu do paczki 
falowej odpowiadającej szybko zachodzącemu roz¬ 
praszaniu bezpośrednio przez potencjał jądrowy. Tak 
więc opóźnione cząstki, tracone z punktu widzenia 
rozpraszania potencjałowego, są pochłaniane przez 
jądro. Pochłanianie padających cząstek można 
uwzględnić dołączając do potencjału reprezentującego 
jądro człon urojony. Rozwiązanie równania Schro¬ 
dingera z takim potencjałem prowadzi do odpowied¬ 
niego zmniejszenia amplitudy funkcji falowych cząstek 
rozpraszanych, a więc też ich strumienia. Jest to pełna 
analogia do opisu za pomocą zespolonego współ¬ 
czynnika załamania przechodzenia światła przez 
mętną, absorbującą i rozpraszającą kulę. Ze względu 
na tę analogię modelowi rozpraszania elastycznego 
pod działaniem zespolonego potencjału nadano na- 

13 - Encyklopedia fizyki współczesnej 



Rys. 14. Kształt części rzeczywistej potencjału jądrowego: a) dla 
neutronów, b) dla protonów. R jest bliskie średniej wartości 
promienia rozkładu nukleonów w jądrze. Re jest promieniem 
kulombowskim jądra 



Rys 15 Porównanie przewidywań modelu optycznego z odpo¬ 
wiednio’dobranymi potencjałami (linie ciągłe) ze zmierzonymi 
rozkładami kątowymi neutronów elastycznie rozpraszanych na 
różnych jądrach (punkty) 
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dobrze dobranego kształtu potencjału. Z reguły przyj¬ 
muje się potencjał jądrowy w kształcie prostokątnej 
jamy z zaokrąglonymi brzegami o rozmiarach odpo¬ 
wiadających rozmiarom jądra (rys. 14). Parametry 
opisujące kształt potencjału dobiera się przez porów¬ 
nanie obliczeń z doświadczalnymi rozkładami kąto¬ 
wymi rozpraszania elastycznego zmierzonymi dla 
wielu jąder i energii padających cząstek (rys. 15). 

Spodziewamy się, że każda reakcja, w której bierze 
udział niewielka liczba nukleonów, a tym samym nie¬ 
wielka liczba stopni swobody (mogą to być również 
kolektywne stopnie swobody, np. oscylacje powierzch¬ 
ni jądrowej lub rotacje całego jądra), powinna być 
procesem szybkim (tzn. niewiele dłuższym od czasu 
przelotu cząstki przez jądro r 0 ). Emisja cząstek na¬ 
stępuje bezpośrednio po zderzeniu się cząstki bom- 
reakcje bardującej z jądrem. Stąd też pochodzi ogólna nazwa 
bezpośrednie nadana takim reakcjom — reakcje bezpośrednie. Ce¬ 
chą charakterystyczną reakcji bezpośrednich jest to, 
że ze względu na udział niewielu stopni swobody, 
stan jądra utworzonego w wyniku reakcji ma wiele 
cech upodabniających go do stanu jądra bombardo¬ 
wanego. Jak się przekonamy później, fakt ten ma 
istotne znaczenie, gdy wykorzystuje się reakcje jądro¬ 
we do badania struktury jądra. Cząstki emitowane 
zachowują również w pewnej mierze kierunek pada¬ 
nia wiązki — wyróżnione są kąty odpowiadające 
emisji do przodu. Cząstka padająca, oddziałując 
z niewieloma stopniami swobody jądra, traci na ogół 
stosunkowo niewiele energii. Stąd też wśród produk¬ 
tów reakcji przeważają cząstki o energii zbliżonej do 
maksymalnej. 

reakcje Do najbardziej typowych reakcji bezpośrednich, 
zdarcia obok rozpraszania elastycznego i nieelastycznego, 
I wychwytu można zaliczyć reakcję jedno- i wielonukleonowego 
zdarcia (reakcja „strippingu”), w której bombardu¬ 
jąca cząstka złożona, oddziałując z jądrem, oddaje 
mu w czasie ruchu jeden lub kilka nukleonów, oraz 
reakcję jedno- lub wielonukleonowego wychwytu 
(reakcja „pick-up”) polegającą na przechwyceniu 
przez cząstkę nukleonów z jądra (rys. 16). Do opisu 



Rys. 16. Przykłady reakcji bezpośrednich: a) Reakcja zdarcia: 
deuteron składający się z protonu i neutronu oddaje neutron 
jądru bombardowanemu. Proton kontynuuje lot. b) Reakcja 
wychwytu: proton wyrywa neutron z jądra bombardowanego, 
powstały deuteron kontynuuje lot 


tych procesów nie wystarcza potencjał optyczny, bę¬ 
dący przybliżeniem pomijającym istnienie nukleonów 
w jądrze czy też jakąkolwiek możliwość wzbudzenia 
oddziały- jądra. Oddziaływanie trzeba uściślić przez dodanie 
wanie do potencjału dodatkowego członu, tzw. oddziały- 
resztkowe wania resztkowego. W obliczeniach teoretycznych za¬ 
kłada się na ogół, że potencjał optyczny wpływa tylko 
na tory i pochłanianie cząstek padających i emitowa¬ 
nych, natomiast za samo przechwycenie nukleonów 
przez cząstkę lub jądro odpowiedzialne jest oddzia- 
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ły wanie resztkowe. Najczęściej przyjmuje się je w bar¬ 
dzo uproszczonej postaci ułatwiającej obliczenia (np. 
funkcja <5 Diraca we współrzędnych przestrzennych 
będąca funkcją różną od zera tylko wtedy, gdy 
współrzędne cząstki padającej i emitowanej są iden¬ 
tyczne). Mimo przybliżeń rezultaty obliczeń są w 
większości wypadków zgodne z doświadczeniem. 

Rozpatrzmy bardziej szczegółowo przebieg reakcji 
jądrowej (rys. 17). Cząstka, np. nukleon po wniknię¬ 
ciu do jądra może zderzyć się z innym nukleonem 



Rys. 17. Schematyczny obraz przebiegu oddziaływania cząstki 
bombardującej z nukleonami jądra bombardowanego. Cząstka 
zderzając się z jednym z nukleonów może przenieść go w stan 
o wyższej energii tracąc swą energię kinetyczną E. W wyniku 
kolejnych zderzeń coraz więcej jest wzbudzonych nukleonów 
i coraz mniejsza jest średnia energia wzbudzenia przypadająca 
na jeden nukleon. Emisja nukleonów jest coraz bardziej utrud¬ 
niona 


przekazując mu część swej energii i następnie może 
opuścić wzbudzone jądro. Przekazana energia może 
być na tyle duża, że cząstka nie będzie mogła pokonać 
sił jądrowych i opuścić jądra — zamiast niej może być 
wysłany uderzony nukleon, który zyskał sporą porcję 
energii. Istnieje jednak taka możliwość, że zderzenie 
nastąpi z jednym z „głębiej” położonych, silniej zwią¬ 
zanych nukleonów. Wówczas może się zdarzyć, że 
żaden z obu nukleonów nie będzie miał energii wy¬ 
starczającej do opuszczenia jądra. Powstaje jak gdyby 
„związany” stan wzbudzony, nie mogący się rozpaść 
przez emisję cząstki (choć całkowita energia stanu 
jest większa niż energia wiązania przez jądro jednego 
nukleonu). Stan ten charakteryzuje się istnieniem 
dwóch wzbudzonych nukleonów oraz luki, „dziury”, stadium 
w miejscu poprzednio zajmowanym przez jeden „dwie 
z nukleonów. Dopiero w wyniku dalszego oddziały- cząstki - 
wania między wzbudzonymi nukleonami jeden z nich jedna 
może uzyskać energię dostateczną do pokonania dziura” 
przyciągających sił jądrowych. Jednak znacznie bar¬ 
dziej prawdopodobne będzie zderzenie wzbudzonego 
nukleonu z jednym z wielu pozostałych nukleonów 
jądra. W ten sposób powstanie stan, w którym ist¬ 
nieją trzy wzbudzone nukleony i dwie dziury. Pra¬ 
wdopodobieństwo emisji nukleonu jest teraz mniej¬ 
sze, gdyż energia jest rozłożona na większą liczbę 
cząstek. W wyniku dalszych oddziaływań coraz więcej 
nukleonów zostaje wzbudzonych i w końcu ustala się 
pewna równowaga, podobna do równowagi termo¬ 
dynamicznej. Jest to stan jądra złożonego, który może jądro 
trwać bardzo długo w skali oddziaływań jądrowych, złożone 
Najbardziej dogodne rozłożenie energii między wzbu¬ 
dzone nukleony zachodzi przy pewnych określonych 
jej wartościach. Na krzywej wzbudzenia reakcji, 
w której tworzone jest jądro złożone, występuje szereg 
wąskich rezonansów odpowiadających długożycio- 
wym stanom jądra złożonego. 

Z przytoczonego opisu wynika, że z powodu dwu- 
ciałowego charakteru oddziaływania jądrowego Gest 
to ogólnie przyjęte założenie) tworzenie jądra złożo¬ 
nego musi zawsze przejść przez stadium „dwie 
cząstki—jedna dziura”. Stany takie są jakby po¬ 
czątkiem bardziej skomplikowanych konfiguracji, 
dlatego też noszą nazwę „stanów wejściowych”. 

W niektórych przedziałach energii cząstki wywołującej 
reakcję tworzenie pewnych stanów wejściowych mo¬ 
że być szczególnie prawdopodobne. Spodziewamy się 
wówczas, że również prawdopodobieństwo tworzenia 
jądra złożonego będzie odpowiednio większe. 

Zasadniczo emisja cząstki może nastąpić w każdym 
stadium rozwoju kaskady jądrowej prowadzącej do 
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powstania jądra złożonego. Najbardziej jest prawdo¬ 
podobna w początkowej fazie rozwoju kaskady, gdy 
energia rozkłada się jeszcze na niewiele nukleonów. 

Z tego też powodu widmo cząstek emitowanych 
przed osiągnięciem przez jądro równowagi termody¬ 
namicznej jest widmem stosunkowo „twardym”, 
o dużym udziale cząstek o większej energii. Wkład 
tego procesu do reakcji może być znaczny, szczególnie 
w przypadku cząstek naładowanych, gdy ich emisję 
z jądra złożonego dodatkowo utrudnia bariera ku- 
lombowska. 

Prawdopodobieństwo emisji z jądra złożonego 
cząstki o określonej energii zależy praktycznie tylko 
od łatwości przechodzenia jej przez barierę potencjału 
w pobliżu powierzchni jądra. Jądro złożone żyje bo¬ 
wiem na tyle długo, że każda możliwa ze względów 
energetycznych konfiguracja wzbudzonych nukleo¬ 
nów pojawia się wielokrotnie. Informację o prawdo¬ 
podobieństwie przejścia cząstki przez barierę daje 
model optyczny. Kierunek emisji cząstki jest w zasa¬ 
dzie dowolny, z tym że musi być zachowany całko¬ 
wity moment pędu układu. Dlatego rozkład kątowy 
produktów reakcji niekoniecznie musi być izotropo¬ 
wy, ale zawsze musi być symetryczny względem kąta 
emisji 90°. ... 

W miarę wzrostu energii wzbudzenia jądra złożo¬ 
nego rośnie liczba możliwych sposobów jego rozpa¬ 
du. Zwiększa się prawdopodobieństwo rozpadu, ma¬ 
leje czas życia, a zatem zwiększa się energetyczna sze¬ 
rokość stanu jądra złożonego. Z drugiej strony szybko 
wzrasta liczba sposobów rozdzielenia energii wzbu¬ 
dzenia między nukleony — gwałtownie rośnie liczba 
poziomów jądra złożonego przypadająca na jednost¬ 
kowy przedział energii wzbudzenia. W rezultacie po¬ 
ziomy jądra złożonego zaczynają się pokrywać. Po¬ 
jawia się możliwość trudnej do przewidzenia i opisu 
interferencji między nimi, istotnie modyfikującej 
prawdopodobieństwo emisji. Przy dalszym wzroście 
energii wzbudzenia liczba pokrywających się pozio¬ 
mów staje się na tyle duża, że obserwowane efekty 
interferencyjne łatwo się uśredniają. Emisję cząstek 
można teraz opisać w sposób statystyczny (stąd na¬ 
zwa — model statystyczny) zakładając, że jej prawdo¬ 
podobieństwo zależy tylko od przenikalności przez 
barierę potencjału oraz gęstości osiąganych po emisji 
stanów jądra końcowego. Im większa jest gęstosć 
stanów, czyli im większa jest energia wzbudzenia jądra 
końcowego, tym większe powinno być prawdopodo¬ 
bieństwo emisji. Z drugiej strony mniejsza jest wów¬ 
czas energia emitowanej cząstki, co utrudnia przejście 
tej cząstki przez skok potencjału na powierzchni jądra. 
W rezultacie w widmie emitowanych cząstek, które 
w obszarze dużej gęstości stanów jądra końcowego 
jest widmem ciągłym, pojawia się dla niezbyt dużych 


Powodzenie obliczeń prowadzonych na podstawie 
modelu statystycznego jest w dużej mierze uwarun¬ 
kowane dobrą znajomością gęstości stanów, funkcji 
bardzo szybko rosnącej wraz ze wzrostem energii 
wzbudzenia. Do wyznaczenia tej funkcji stosuje się 
również metody statystyczne, traktując nukleony 
jako cząstki poruszające się niezależnie w polu sił 
jądrowych (model gazu Fermiego) lub też włączając 
do rozważań pewne możliwości oddziaływania mię¬ 
dzy nukleonami (np. tendencję do łączenia się w pa¬ 
ry tych nukleonów, których rozkłady przestrzenne 
w polu sił jądrowych w dużym stopniu się pokry- 

Jeśli w obszarze pokrywających się poziomów jądra 
złożonego dokładnie prześledzić zależność przekroju 
czynnego od energii dla ściśle określonego kanału 
wyjściowego reakcji, to można zauważyć fluktuacje 
będące wynikiem interferencji emisji z różnych pozio¬ 
mów. Fluktuacje te, zw. fluktuacjami eriksonowskimi 
(od nazwiska T. Ericsona, fizyka, który je zinterpre¬ 
tował), są przypadkowe i szybko nikną przy uśred¬ 
nieniu po pewnym niewielkim przedziale energii. 
Jednakże w przedziałach energii rzędu szerokości 
poziomu fluktuacje nie są zupełnie niezależne, gdyż 
w proces emisji są zaangażowane w przybliżeniu te 
same poziomy jądra złożonego interferujące w okre¬ 
ślony sposób. Można zbudować „funkcję autokore¬ 
lacji” przekrojów czynnych w postaci: 

F(s)(o{E)ct (2T+s))> — (o(Ey) (o(E-\-£)y* 

Nawiasy < > oznaczają uśrednienie w odpowiednio 
dużym przedziale energetycznym AE t a s —pewne 
małe przesunięcie energii. Zbudowanie tej funkcji na 
podstawie danych doświadczalnych pozwala osza¬ 
cować średnią w przedziale AE szerokość poziomu F y 
gdyż F(e) * 0 tylko przy ł < T. Jest to możliwość 
atrakcyjna, gdyż inne metody zawodzą z powodu 
wzajemnego pokrywania się wielu poziomów. 

Statystyczne metody opisu reakcji jądrowych pró¬ 
buje się również zastosować do emisji cząstek w trak¬ 
cie tworzenia jądra złożonego, przed osiągnięciem 
przez nie pełnej równowagi termodynamicznej. Pod¬ 
stawą stosowanych modeli jest założenie, że jest moż¬ 
liwych tak wiele konfiguracji utworzonych z dwóch 
nukleonów i jednej dziury, trzech nukleonów i dwóch 
dziur itd., że można w każdym stadium rozwoju kaska¬ 
dy jądrowej traktować sytuację w sposób uśredniony, 
statystyczny. Prawdopodobieństwo emisji cząstki jest 
uwarunkowane przenikalnością przez barierę poten¬ 
cjału na powierzchni jądra oraz stosunkiem liczby 
możliwych konfiguracji wzbudzonych nukleonów 
i dziur (nadaje im się wspólną nazwę — ekscytony) 
pozostałych po emisji cząstki do liczby możliwych 
konfiguracji ekscytonów przed emisją. 
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Rys. 18. Widmo parowania cząstek z jądra złożonego; E energia 
wyparowanych cząstek, N ich liczba 


energii maksimum odpowiadające optymalnej energii 
emisji (rys. 18). Można się tu doszukać daleko idą- 
cej analogii z parowaniem cząsteczek z powierzchni 
nagrzanej kropli cieczy. Dlatego też widmo energe- 
widmo tyczne emitowanych cząstek często nazywa się wid- 
parowania mem parowania. 


Informacjo o budowie jądra uzyskiwane 
z badania reakcji jądrowych 

Strukturę jądra w wielu sytuacjach dobrze oddaje 
model powłokowy, wg którego średni efekt wzajem¬ 
nych oddziaływań nukleonów w jądrze jest taki, że 
ich ruch odbywa się wzdłuż pewnych orbit scharakte- orbity w 
ryzowanych zorientowaniem w przestrzeni, kierun- modelu po- 
kiem ruchu nukleonu, jego energią, momentem pędu włokowym 
oraz wzajemnym położeniem spinu i momentu pędu. 

Wzdłuż takiej orbity może się poruszać tylko jeden 
nukleon (jest to konsekwencja zakazu Pauliego odno¬ 
szącego się do cząstek o spinach połówkowych; zakaz 
ten głosi, że w określonym stanie kwantowym może 
znajdować się tylko jedna cząstka). Przeniesienie nu¬ 
kleonu z orbity na orbitę wymaga dostarczenia energii 
(lub energia wydziela się, gdy przejście następuje 
z orbity położonej wyżej w skali energetycznej na or¬ 
bitę niższą). Jądro atomowe, będące zespołem silnie 
wpływających na siebie nukleonów, może ulegać 
różnego typu wzbudzeniom. Dostarczona do wnętrza 
jądra energia może być skupiona na jednym nukleonie 
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wzbudzenia (wzbudzenia jednocząstkowe) lub na kilku, może też 
jednocząst- powodować zmianę stanu wielu nukleonów. We wzbu- 
kowe dzeniach o niedużej energii może brać udział tylko 
i kolektywne niewielka liczba nukleonów. Zdarza się, że wzbudze¬ 
nie przenosi się w określony sposób z jednej grupy 
nukleonów na drugą. W rezultacie we wzbudzeniu 
bierze udział wiele nukleonów. Takie kolektywne 
wzbudzenia, których przykładem mogą być drgania 
powierzchni lub obrót jądra, wygodnie jest opisywać 
wprowadzając stopnie swobody związane z ich kolek¬ 
tywnym ruchem. 

badanie Do badania wzbudzeń jednocząstkowych szczegół- 

reakcji nie przydatna jest obserwacja reakcji zdarcia z prze- 
zdarcia kazaniem jednego nukleonu. Przekazany nukleon lo¬ 
kuje się na jednej z orbit bombardowanego jądra. Zi¬ 
dentyfikowanie tej orbity daje informację o stanie 
jądra utworzonego w reakcji. Identyfikacji orbity do¬ 
konuje się określając orbitalny moment pędu prze¬ 
chwyconego nukleonu. W tym celu wystarczy zmie¬ 
rzyć rozkład kątowy cząstek emitowanych w reakcji. 
Kątowi emisji odpowiada pewna wartość pędu prze¬ 
kazana wraz z nukleonem do jądra bombardowanego 
(rys. 19). Okazuje się, że największy wkład do prze- 



Rys. 19. Schemat obrazujący relacje między pędami cząstek bio¬ 
rących udział w reakcji zdarcia. Wraz z nukleonem zostaje do 

jądra przekazany pęd q{d ) *= kt—k/. Przekrój czynny jest maksy¬ 
malny, gdy reakcja zachodzi na powierzchni jądra w pobliżu 

płaszczyzny równikowej prostopadłej do q. Wówczas moment 
pędu wniesiony do jądra wynosi qR 
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kroju czynnego dają przyczynki pochodzące od reakcji 
zachodzącej na powierzchni jądra w pobliżu „równi¬ 
ka” wyznaczonego przez płaszczyznę prostopadłą do 
kierunku przekazanego pędu. Fale reprezentujące 
emitowaną cząstkę, wysyłane z różnych punktów 
„równika”, interferują wówczas konstruktywnie da¬ 
jąc wzmocnienie efektu. Zatem najbardziej korzy¬ 
stnym kątem emisji jest kąt 0, przy którym jest 
spełniony warunek: 

Ih — q(6) • R 



Rys. 20. Typowe kształty rozkładów kątowych dla różnych mo¬ 
mentów pędu wniesionych przez nukleon do jądra (znormalizo¬ 
wane w maksimum) 
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ifh — moment pędu przekazanego nukleonu, h — 
= hlln, h — stała Plancka, ą — przekazany pęd, 
R — promień jądra). Każdej wartości orbitalnego 
momentu pędu odpowiada pewien charakterystyczny 
kąt, przy którym przekrój czynny powinien być mak¬ 
symalny (rys. 20). 

Mierzone rozkłady kątowe można stosunkowo do¬ 
kładnie odtwarzać w obliczeniach teoretycznych. 
Zakłada się, że stan wytworzony w wyniku reakcji 
jest czystym stanem jednocząstkowym —jądro bom¬ 
bardowane + nukleon. Przeważnie jednak każdy 
stan jest mieszaniną różnych konfiguracji wzbudzeń 
nukleonów. Konfiguracja: „jądro bombardowane + 
nukleon” jest tylko jedną z kilku składowych, z któ¬ 
rych skonstruowany jest dany stan. Można powiedzieć, 
że jądro spędza tylko pewną część czasu w konfiguracji 
jednocząstkowej. W związku z tym przekrój czynny 
reakcji jest odpowiednio mniejszy. Porównanie zmie¬ 
rzonego przekroju czynnego z obliczeniem pozwala 
wyznaczyć tzw. czynnik spektroskopowy, mówiący 
o wielkości wkładu konfiguracji jednocząstkowej do 
całkowitej funkcji falowej danego stanu. Z pomiaru 
kątowego różniczkowego przekroju czynnego na 
reakcję zdarcia dowiadujemy się więc o rodzaju 
i wkładzie konfiguracji jednocząstkowej „jądro bom¬ 
bardowane + nukleon” do budowy badanego stanu 
jądra utworzonego w reakcji. Te same wnioski tyczą 
się innych reakcji zdarcia i wychwytu nukleonów: 
wychwyt nukleonu daje informację o konfiguracji 
„jednodziurowej”, przekazanie dwóch nukleonów — 
informację o konfiguracjach par cząstek czy dziur 
i tak dalej. 

Reakcje bezpośrednie dostarczają również innych 
cennych informacji. Na przykład z wielkości prze¬ 
kroju czynnego na tworzenie stanów wzbudzonych 
w reakcjach rozpraszania nieelastycznego można 
otrzymać informację o obrocie jąder zdeformowanych 
i wielkości ich deformacji. Przekroje czynne reakcji 
wzbudzenia kulombowskiego (wzbudzenie jądra 
przez pole elektromagnetyczne przebiegającej w po¬ 
bliżu jądra naładowanej cząstki) pozwalają wysnuć 
wnioski na temat rozkładu ładunku jądra wzbudzo¬ 
nego. Tego typu przykłady można mnożyć. Wspólną 
cechą reakcji bezpośrednich jest dostarczanie infor¬ 
macji o wzbudzeniach związanych z niewielką liczbą 
stopni swobody. 

Reakcje, w których tworzone jest jądro złożone, 
mogą być źródłem informacji o wysoko wzbudzonych 
stanach jądra (np. o ich szerokości) oraz o własno¬ 
ściach statystycznych jąder (np. o gęstości poziomów 
jądrowych). Pomiary parametrów oddzielnych rezo¬ 
nansów jądra złożonego w różnych kanałach wej¬ 
ściowych i wyjściowych umożliwiają wyciągnięcie 
wniosków o najbardziej istotnych w nich konfigura¬ 
cjach nukleonów. 
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Reakcje wywołane przez ciężkie Jony 


Na specjalną uwagę zasługują reakcje wywołane przez 
jądra atomowe, tzw. ciężkie jony, przyspieszone do 
znacznej energii (od kilku do kilkunastu MeV/nu- 
kleon). Cechą charakterystyczną tych reakcji jest 
to, że dzięki dużej masie cząstek długość odpowiada¬ 
jących im fal jest na tyle mała, że ruch cząstek można 
traktować niemal klasycznie. 

Zjawiska towarzyszące bombardowaniu jąder przez 
ciężkie jony można bardzo ogólnie podzielić na trzy 
grupy (rys. 21). 

1. Przy małych energiach lub przy dużych parame¬ 
trach zderzenia, gdy cząstka nie wchodzi w bezpo¬ 
średni kontakt z powierzchnią jądra, głównym pro¬ 
cesem, poza rozpraszaniem elastycznym, jest wzbudze¬ 
nie kulombowskie zarówno jądra bombardowanego, 
jak i ciężkiego jonu. Ze względu na duże ładunki 
oddziałujących obiektów prawdopodobieństwo tego 
procesu jest znaczne. Możliwy, choć mało prawdo¬ 
podobny jest również proces przekazania jednego lub 


rozpraszanie 
elastyczne 
lub wzbu¬ 
dzanie ku¬ 
lombowskie 






kilku nukleonów, zachodzący mimo braku kontaktu 
obu jąder dzięki istnieniu kwantowego efektu tune¬ 
lowego. 



2. Przy energiach przekraczających barierę kulom- 
bowską i przy odpowiednich parametrach zderzenia 
jon „ociera się''' o powierzchnię jądra. Towarzyszy 
temu wymiana pewnej, czasami dość znacznej liczby 
zderzenia nukleonów. Można rozróżnić dwa mechanizmy: zde- 
„kwazi- rżenia „kwazielastyczne”, gdy energia rozproszonego 
elastyczne" jonu zmienia się bardzo mało w porównaniu z energią 


Jądra atomowe w 

Zdzisław Szymański 

Substancja, z której zbudowane jest jądro atomu, nie 
jest podobna do stanów skupienia materii znanych 
nam z codziennego doświadczenia. Małe rozmiary 
jądra oraz duża gęstość i spoistość uniemożliwiają 
wniknięcie w jego strukturę za pomocą prostych i bez¬ 
pośrednich eksperymentów. Wiedza nasza o siłach 
działających pomiędzy nukleonami — podstawowymi 
składnikami jądra —• jest bardzo niepełna. Brak też 
teorii obejmującej całokształt zjawisk jądrowych. 
Kwantowa natura praw fizyki opisujących jądro atomu 
obca jest naszej intuicji, będącej sumą doświadczeń 
z makroskopowego świata fizyki klasycznej. Wszystko 
to sprawia, że własności jądra atomowego są trudne 
do badania i nie w pełni jeszcze znane. 

Otaczająca nas na Ziemi materia zawiera jądra 
w stosunkowo bardzo dobrze określonych stanach 
fizycznych. Jądra te na ogół znajdują się w stanach 
podstawowych. Badanie ich było pierwszym etapem 
poznania x budowy jądra. Jednakże, obok doświad¬ 
czeń zaburzających tylko w minimalnym stopniu 
stan podstawowy, niezwykle cennym źródłem infor¬ 
macji o strukturze jądra i jego własnościach jest wpro- 
ekstremalne wadzenie (lub próba sztucznej produkcji) jądra 
a normalne w stany ekstremalne, różniące się w istotny sposób 
stany od tych, które umownie potraktowaliśmy jako stany 
jąder normalne. 

Chcąc mówić o stanach ekstremalnych jąder ato¬ 
mowych należy najpierw poznać własności jądra 
w stanie normalnymi Jądra atomowe i ich wzbudze¬ 
nia). Możemy przyjąć, że jądro atomowe to układ 
kwantowy wielu nukleonów oddziałujących silnie i 
Oddziaływania silne). Istnieje pogląd, że punktem wyj¬ 
ściowym teorii jądra atomowego powinno być roz¬ 
wiązanie równania Schrodingera dla wielu nukleo¬ 
nów. Obecnie podejście takie napotyka duże trudności, 
związane z rozwiązywaniem równania Schrodingera 


początkową, oraz zderzenia „silnie tłumione”, któ- zderzenia 
rym towarzyszy przekazanie jądru bombardowanemu „silnie 
dużej energii. Przypuszcza się, że w drugim wypadku tłumione" 
dzięki siłom jądrowym jądro bombardujące wiąże się 
na pewien czas z jądrem bombardowanym w układ, 
który szybko ulega rozerwaniu. Przekazanie dużej 
energii można interpretować jako efekt podobny do 
klasycznego efektu działania sił tarcia między dwoma 
ciałami. 

3. Przy energiach przekraczających barierę kulom- fuzja jąder 
bowską i przy małych parametrach zderzenia na¬ 
stępuje połączenie się obu jąder (fuzja). Dzięki swej 
dużej masie ciężki jon może wnieść do utworzonego 
jądra złożonego bardzo duży moment pędu (ok. 

100/i) nie spotykany w innego typu reakcjach jądro¬ 
wych. W ten sposób można wytwarzać i badać jądra 
w bardzo nietypowych stanach. Moment pędu wno¬ 
szony do jądra jest ograniczony z góry przez waru¬ 
nek, aby siła odśrodkowa działająca na środki mas 
obu cząstek w układzie „jon stykający się z jądrem” 
była co najmniej skompensowana przez siły napięcia 
powierzchniowego stykających się kropli materii 
jądrowej. Z tego też względu, ze wzrostem masy 
bombardującego jonu maleje prawdopodobieństwo 
połączenia się obu jąder. 

Najbardziej atrakcyjną stroną reakcji wywoływa¬ 
nych przez ciężkie jony jest możliwość uzyskiwania 
jąder położonych daleko od ścieżki trwałości oraz 
jąder w ekstremalnych stanach, o dużych wartościach 
spinów. Od reakcji tego typu oczekuje się również 
odpowiedzi na temat ewentualnego istnienia tzw. 
jąder superciężkich. 

W.E. Burcham Nuclear Physics, London 1967; J.B.A. Eng- 
land Metody doświadczalne fizyki jądrowej. Warszawa 1981; 

Z. WiLHELMi Fizyka reakcji jądrowych. Warszawa 1976. 


stanach ekstremalnych 


oraz niedostateczną znajomością oddziaływań sil¬ 
nych. Poza tym zgromadzony został bardzo bogaty 
materiał doświadczalny dotyczący jąder atomowych. 

Wobec tego jest rzeczą naturalną ograniczenie się parametry 
do bardziej fenomenologicznego podejścia, poprzez charaktery- 
opis jądra za pomocą wielu parametrów charaktery- żujące jądro 
żujących jego własności. Tak więc obok liczby proto¬ 
nów Z, liczby neutronów N oraz momentu pędu / 
jądra (w jednostkach h) istotną rolę odgrywają pa¬ 
rametry charakteryzujące zmianę kształtu jądra 
w stosunku do kształtu kulistego, takie jak: wydłu¬ 
żenie e 2 (osiowo symetryczne), parametr e 4 — opi¬ 
sujący przewężenie tworzące się w powierzchni jądra 
rozszczepiającego się, asymetria e 3 względem płasz¬ 
czyzny prostopadłej do osi symetrii jądra, odstęp¬ 
stwo od kształtu osiowo symetrycznego y i inne pa¬ 
rametry kształtu, a ponadto parametry opisujące 
radialny rozkład materii w jądrze, wreszcie parametry 
charakteryzujące stopień struktury nadciekłej pow¬ 
stającej w jądrze (w wielu jądrach atomowych wy¬ 
twarzają się korelacje podobne do tych, które wywo¬ 
łują nadciekłość helu w niskich temperaturach). 

Rysunek 1 charakteryzuje schematycznie parametry 
odgrywające istotną rolę w opisie jądra. 

Jądro atomowe w stanie nieekstremalnym odznacza 
się pewnym stosunkiem liczby neutronów N do liczby 
protonów Z odpowiadającym tzw. ścieżce jąder 
trwałych (ścieżka trwałości —► Jądra atomowe i ich 
wzbudzenia, rys. 2), niewielkim momentem pędu (po¬ 
wolny obrót niezaburzający struktury wewnętrznej 
jądra, np. I K 10), niewysokimi energiami wzbudze¬ 
nia, kulistym kształtem (e 2 = — e i == y = 0) lub 

rozkładem masy odpowiadającym niewielkiej defor¬ 
macji kuli, polegającym głównie na wydłużeniu, oraz 
występowaniem słabych korelacji typu nadciekłego 
(u znacznej większości jąder). 
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Stany ekstremalne jąder atomowych odznaczają 
się znacznymi odstępstwami od prawidłowości omó¬ 
wionych powyżej. Do jąder w stanach ekstremalnych 

2-liczba protonów 
AZ-liczba neutronów 
/-moment pędu 


j>- A = Z +N 




Rys. 1. Najważniejsze parametry charakteryzujące jądro 



Rys. 2. Ścieżka jąder trwałych. Linia łamana oraz kropki okre¬ 
ślają położenie jąder trwałych. Obszary zacieniowane opisują 
przebieg procesu r (proces szybkiego wychwytu neutronów). 
Obszar zaznaczony napisem SC odpowiada hipotetycznym 
nuklidom superciężkim 

występowa- można zaliczyć jądra o nadmiarze neutronów, które 
nie jąder mogą powstawać np. jako produkty rozszczepienia 
w stanach jądrowego, bądź też w niezwykle silnych strumieniach 
ekstremal- neutronów, np. w gwiazdach supernowych, jądra 
nych o znacznym niedomiarze neutronów, powstałe w wy¬ 
niku reakcji syntezy ciężkich jonów, oraz jądra o szcze¬ 
gólnie dużych liczbach protonów i neutronów, więk¬ 
szych od znanych obecnie na Ziemi (pierwiastki 
transuranowe lub hipotetyczne pierwiastki supercięż¬ 
kie). Najcięższymi znanymi w przyrodzie pierwiastka¬ 
mi są tor (Th) i uran (U) o liczbach atomowych od¬ 
powiednio Z = 90 oraz Z = 92; występują one na 
Ziemi. Przed paru laty wykryto również na Ziemi 
śladowe ilości cięższego pierwiastka — plutonu (izo¬ 
top 244 Pu). Następny pierwiastek o liczbie atomowej 
Z = 93, nazwany neptunem (Np), był wytworzony 
sztucznie. Izotop 239 Np uzyskano w procesie wychwytu 
neutronów przez jądro uranu *® 8 U. Powstaje wówczas 
cięższy izotop uranu, “•U, który ulega rozpadowi P 
(zamiana jednego z neutronów na proton) z okresem 
połowicznego zaniku T m — 23 min, jak również 


nuklid ^Np, który też nie jest trwały. Kolejny rozpad 
p z okresem połowicznego zaniku T.n — 2,3 dnia 
prowadzi do powstania nowego pierwiastka, plutonu 
(izotop 239 Pu). Opisane powyżej procesy można 
przedstawić za pomocą następującego schematu: 

23 8U + * -> 23«U 4 *39 Np 4 239 P U . 

Próby tworzenia nowych, coraz cięższych pierwia- wytwarzanie 
stków, tzw. transuranowców, są prowadzone nadal, trans- 
Wytworzono i zbadano do chwili obecnej własności uranowców 
wielu izotopów nowych pierwiastków od neptunu 
(Np. Z — 93) aż do pierwiastka Z = 102 (nobel. 

No) oraz Z= 103 (lorens, Lr). W ostatnich latach 
badane są reakcje jądrowe (na ogół polegające na 
bombardowaniu ciężkich jąder innymi ciężkimi ją¬ 
drami przyspieszanymi w akceleratorach ciężkich 
jonów) prowadzące do pierwiastków o liczbach ato¬ 
mowych Z = 104, 105, 106 oraz 107. Nuklidem 
o największej znanej liczbie neutronów (W = 159) 
jest obecnie 259 Fm (ferm). W chwili obecnej udaje 
się jednak wytwarzać zaledwie nieznaczne ilości tych 
pierwiastków, co utrudnia badanie ich własności 
fizycznych i chemicznych. 

Inną grupę jąder ekstremalnych tworzą jądra o du¬ 
żym momencie pędu. Oddziaływania typu siły Corio- 
lisa, występujące w bardzo szybko obracającym się 
jądrze (np. I > 10) prowadzą do zniszczenia w nim 
struktury nadciekłej analogicznie do zjawiska Meiss¬ 
nera (—► Nadprzewodnictwo) występującego w nad¬ 
przewodzącym metalu. Przy jeszcze szybszym obro¬ 
cie (np. / ^ 50 lub nawet I x 100) następuje znaczna 
modyfikacja lub całkowite przeobrażenie potencjału 
jądra i ruchu nukleonów w tym potencjale. Mogą 
również wystąpić silne deformacje jądra, polegające 
np. na znacznym odstępstwie od symetrii osiowej. 

Jeszcze inny typ jądrowych stanów ekstremalnych 
związany jest z gwałtownymi zmianami kształtu jądra. 

Na przykład procesowi rozszczepienia jądra, towa¬ 
rzyszy bardzo znaczne wydłużenie jądra e 2 związane 
z wyraźnym występowaniem przewężenia (f 4 # 0), 
w wielu wypadkach także asymetrii (f 3 ^ 0), a być 
może również odstępstw od osiowej symetrii ([y ^ 

^ 0). Innym przykładem, związanym zresztą najczę¬ 
ściej z procesem rozszczepienia, są tzw. izomery 
kształtu, będące krótkożyciowymi stanami jądra 
o znacznej deformacji prowadzącej do rozpadu przez 
rozszczepienie. 

Szukając możliwości występowania stanów ekstre¬ 
malnych skorzystamy ze znanego powszechnie faktu, 
że jądro atomowe, podobnie jak każdy zamknięty 
układ fizyczny, dąży do przyjęcia konfiguracji odpo¬ 
wiadającej możliwie najniższej energii. Przedstawiając 
zależność energii jądra od parametrów opisujących powierzchnia 
jego stan jako powierzchnię energetyczną (na ogół energetyczna 
wielowymiarową) możemy przypuszczać, że stanowi 
podstawowemu jądra odpowiada absolutne minimum 
na powierzchni energetycznej, podczas gdy innym 
obserwowanym stanom, a więc odznaczającym się ** 
dostatecznie długim czasem życia, odpowiadają lo¬ 
kalne minima tej powierzchni. Stąd badanie własności 
powierzchni energetycznej, jej właściwa parametry¬ 
zacja, poszukiwanie minimów itp. jest podstawową 
metodą teorii jądra atomowego. 

Pojęcie o przebiegu powierzchni energetycznej 
można sobie wyrobić na podstawie znajomości włas¬ 
ności materii jądrowej rozpatrywanej jako całość 
bez wnikania w szczegóły, które zależą np. od kon¬ 
kretnych konfiguracji nukleonów. W tym wypadku 
do opisu powierzchni jądrowej wystarczają na ogół 
prawa fizyki klasycznej (niekwantowej) oraz użycie 
takich wielkości charakteryzujących środowisko 
jądrowe, jak: energia wiązania przypadająca na jeden 
nukleon, energia napięcia powierzchniowego na po¬ 
wierzchni ograniczającej „kroplę” cieczy jądrowej, 
energia symetrii, która decyduje o ustaleniu się od¬ 
powiedniego stosunku ilości neutronów i protonów, 
energia elektrostatycznego odpychania protonów itp. 

W wyniku takiego opisu otrzymujemy ogólny prze- 
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bieg powierzchni energetycznej w postaci wolno- 
zmiennej i na ogół gładkiej funkcji parametrów (np. 
dla modelu kroplowego jądra —► Modele jądrowe). 

Na tę gładką i regularną powierzchnię nakładają 
się fluktuacje wynikające z kwantowej struktury jądra 
atomowego — układu wielu nukleonów. Fluktuacje 
te nazwane ogólnie poprawkami powłokowymi „żło¬ 
bią” w gładkiej powierzchni energetycznej, a zwłasz¬ 
cza w tych jej okolicach, gdzie zależność energii od 
parametrów jest stosunkowo najmniejsza, wiele lo¬ 
kalnych minimów i maksimów, decydując ostatecznie 
o możliwości przybierania przez jądro atomowe okre¬ 
ślonych stanów. Poprawki powłokowe, jakkolwiek 
znacznie mniejsze od energii wyznaczonej przez ogólne 
własności materii jądrowej, mogą więc w sposób 
istotny wpływać na własności jąder. Znak poprawki 
powłokowej (jest ona umownie uznana za ujemną 
wówczas, gdy „żłobi” minimum na powierzchni 
energetycznej) oraz jej wielkość związane są ściśle 
ze strukturą widma kwantowych poziomów energe¬ 
tycznych układu. Jeśli poziomy energetyczne rozło¬ 
żone są mniej więcej w jednakowych odległościach 
(widmo jednorodne), to poprawka powłokowa jest 
bardzo bliska zeru i o losach układu decyduje średni 
przebieg powierzchni energetycznej, wynikający np. 
z modelu kroplowego jądra. Natomiast w stanach, 
w których widmo poziomów energetycznych jest 
niejednorodne, a więc poziomy grupują się w wyraźne 
powłoki, poprawka powłokowa jest duża co do war¬ 
tości bezwzględnej i ujemna, o ile liczba nukleonów od¬ 
powiada wypełnionym powłokom, oraz duża i do¬ 
datnia dla jąder o liczbie nukleonów odpowiadającej 
powłoce wypełnionej do połowy. Tak więc jądro 
atomowe, które dąży do przyjęcia stanu o najniższej 
energii, faworyzuje takie wartości parametrów (licz¬ 
by neutronów N> protonów Z , momentu pędu, pa¬ 
rametrów kształtu itp.), którym odpowiadają silnie 
niejednorodne widma energetyczne o zamkniętych 
powłokach. 

Dlatego też poznanie kwantowych widm energe¬ 
tycznych jądra atomowego ma zasadnicze znaczenie 
w poszukiwaniu stanów ekstremalnych. Widmo po¬ 
ziomów energetycznych jądra można na ogół z do¬ 
brym przybliżeniem traktować jako widmo poziomów 
energetycznych niezależnych nukleonów poruszają¬ 
cych się w średnim potencjale jądra. Fizycy duńscy, 
A. Bohr i B.R. Mottelson, zaproponowali badanie 
widm jąder, a więc i ocenę poprawki powłokowej przez 
uwzględnienie zależności energii e niezależnego nu¬ 
kleonu od liczb kwantowych charakteryzujących stan 
nukleonu w jądrze. Okazuje się, że struktura powło¬ 
kowa w widmie energetycznym może występować 
wówczas, gdy pochodne energii e względem liczb 
kwantowych n l9 n 2l ... mają się do siebie tak, jak nie¬ 
wielkie liczby całkowite: 


de dte 
cn x dn 2 ’ 


— a:b :... 


O) 


Pochodna energii e względem liczby kwantowej m 
(/ = 1, 2...) ma prosty sens fizyczny —jest wielkością 
proporcjonalną do częstości podstawowej coi odpo¬ 
wiadającej /-temu stopniowi swobody nukleonu. 
Relację (1) można więc traktować jako warunek 
współmierności częstości coi (i = 1, 2, ...), który w ję¬ 
zyku fizyki klasycznej oznacza warunek tworzenia 
się orbit zamkniętych. Na przykład gdy ruch składa 
się z dwóch drgań harmonicznych w dwóch wzajem¬ 
nie prostopadłych kierunkach „1” i „2”, otrzymujemy 
ruch po orbicie zamkniętej tylko wówczas, gdy czę¬ 
stości co x oraz co 2 są współmierne; orbity mają naj¬ 
prostszy charakter przy stosunku co x :co 2 równym np. 
1:1, 2:1, 3:2, 3:1 itp. Podobna sytuacja znana jest 
w teorii muzyki, gdzie interwały konsonansowe od¬ 
znaczają się prostymi stosunkami częstości: 1:1 (pry¬ 
ma), 2:l(oktawa), 3:2 (kwinta), 3:1 (duodecima) itp. 

Każdemu układowi liczb całkowitych a , b , ... 
w (1), a więc i każdemu stosunkowi częstości odpo¬ 
wiada inna struktura kwantowego widma poziomów 


energetycznych, a więc takie i orbit jednocząstkowych. 

Liczby cząstek odpowiadające zamkniętym powło¬ 
kom (zwyrodniałym lub prawie zwyrodniałym pozio¬ 
mom kwantowym) określają układy o stosunkowo liczby 
większej trwałości. Nazywa się je liczbami magiczny- magiczno 
mi. W fizyce atomu odpowiadają one konfiguracjom 
gazów szlachetnych. Stopień zwyrodnienia powłoki 
(tj. ilość blisko leżących poziomów energetycznych) 
określa więc liczby magiczne. Jeśli liczba neutronów 
lub protonów w jądrze w danym stanie kwantowym 
jest równa liczbie magicznej, to stan taki będzie fa¬ 
woryzowany przez jądro, a w wypadku szczególnie 
dużej (ujemnej) poprawki powłokowej może to pro¬ 
wadzić do stanu trwałego lub dostatecznie długo- 
życiowego. Poniżej podane są przykłady ilustrujące 
znane bądź też hipotetyczne stany ekstremalne jąder. 

Między innymi uwzględniono związek tych stanów 
z występowaniem odpowiednich liczb magicznych, 
charakterystycznych dla danej konfiguracji. 

Rysunek 2 przedstawia —jak już wspomnieliśmy — 
ścieżkę jąder trwałych, określającą typowe stosunki 
liczb neutronów i protonów. Nuklidy leżące z dala od 
tej ścieżki odznaczają się bardzo krótkimi czasami 
życia względem rozpadu beta (/?“, fi + lub wy¬ 
chwytu elektronu) i wobec tego są na ogół bardzo 
trudne do obserwacji. Jądra o znacznym niedomiarze 
neutronów można wytwarzać doprowadzając do 
reakcji syntezy jąder lżejszych, np. przyspieszając cięż¬ 
kie jony. Tak wytworzone jądra mogą się ponadto 
odznaczać bardzo dużym, przekazanym w reakcji, 
momentem pędu wynoszącym np. / = 50 lub więcej 
jednostek h. Szczegółowe badanie takich nuklidów 
możliwe będzie tylko wówczas, jeżeli okaże się, że 
przy pewnych wartościach Z, N oraz / jądro może 
trwać dostatecznie długo, tzn. wtedy, gdy struktura 
widma energetycznego ma charakter wyraźnych 
powłok. Liczby magiczne Z, N oraz moment pędu 
/ dla takich hipotetycznych stanów jądrowych, okre- stan 
ślanych angielskim terminem „superdizzy” (wirujące „superdizzy" 
z zawrotną szybkością), nie są jeszcze znane, można 
jednak przypuszczać, że w najbliższych latach będą 
przeprowadzane poszukiwania eksperymentalne i teo¬ 
retyczne tych stanów. 

Omówimy teraz jądra charakteryzujące się nadmia¬ 
rem neutronów, a więc takie, które leżą poniżej ścieżki 
trwałości na rys. 2. Nuklidy tego typu mogą pow¬ 
stawać w wyniku rozszczepienia ciężkich jąder. Cie¬ 
kawym przykładem jest podwójnie magiczny izotop 
cyny 132 Sn o magicznych liczbach protonów i neutro¬ 
nów Z = 50, N = 82, badany obecnie w niektórych 
laboratoriach (magiczne liczby protonów i neutronów 
w jądrach o kształcie kulistym są Z, N — 2, 8, 20, 

28, 50, 82 a także N — 126). Każdy inny nuklid 
o niemagicznych liczbach Z, N położony w tak dużej 
odległości od ścieżki trwałości byłby nieobserwowalny 
z powodu zbyt krótkiego czasu życia ze względu na 
rozpad /?. Innym przykładem nuklidów o dużym 
nadmiarze neutronów są jądra występujące w tzw. 
procesie r, zachodzącym prawdopodobnie podczas proces r 
gwałtownych ewolucji gwiazd (supernowych) produ¬ 
kujących niezwykle intensywne strumienie neutro¬ 
nów (-► Reakcje jądrowe w gwiazdach). Powstają 
wówczas nowe izotopy w wyniku wychwytu licznych 
neutronów. Czas życia ze względu na rozpad /? dla 
tych izotopów jest porównywalny z odstępem czasu 
upływającym między dwoma kolejnymi przyłącze¬ 
niami neutronów. Proces ten, którego przebieg jest 
zaznaczony na rys. 2, stanowi jedyne wytłumaczenie 
istnienia na Ziemi pierwiastków cięższych od ołowiu, 
takich jak uran (U) i tor (Th). 

W ciągu ostatnich kilku lat bardzo żywo dyskuto¬ 
wana jest przez fizyków możliwość wytworzenia no¬ 
wych pierwiastków o liczbach protonów Z i neutro¬ 
nów N y większych od znanych obecnie, tzw. pier¬ 
wiastków superciężkich. Prosta ekstrapolacja znanych 
liczb magicznych prowadzi do wniosku, że układ 
złożony z N = 126 protonów mógłby tworzyć pierwiastki 
jądro o dużej (ujemnej) poprawce powłokowej. Jed- superciężkie 
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114 — nowa nakże bardziej prawdopodobny wydaje się obecnie 
liczba ma- wybór pierwiastka o liczbie Z= 114. Aby zrozu- 
giczna mieć, skąd się bierze nowa liczba magiczna 114, 
rozważmy, jak mechanika kwantowa tłumaczy przy¬ 
toczone powyżej liczby magiczne jąder kulistych. 
Energia pojedynczego nukleonu poruszającego się 
w potencjale trójwymiarowego oscylatora harmonicz¬ 
nego dana jest wzorem: 

s(n, /) = hco[2(n-\)+l+3/2] (2) 


(/r, / — odpowiednio radialna liczba kwantowa oraz 
orbitalny moment pędu). Zgodnie ze wzorem (1) 
otrzymujemy stosunek 


de , de = 2 - 
Zn 'BI 


( 3 ) 


poziomy 
energetyczne 
protonu 
w jądrze 
super¬ 
ciężkim 


odpowiadający oktawie w terminologii muzycznej. 
Uwzględniając 2(2/-j-l)-krotne zwyrodnienie pozio¬ 
mów jądrowych w jądrze kulistym związane z kwan¬ 
towaniem przestrzennym i istnieniem spinu, otrzy¬ 
mujemy (przez sumowanie tej krotności dla każdej 
pary liczb n, /, prowadzących do tej samej energii 
a(n, /) danej wzorem 2) liczby magiczne dla kulistego 
jądra o potencjale oscylatora harmonicznego w postaci 
ciągu: 2, 8, 20, 40, 70, 112,... Silne sprzężenie typu 
spin-orbita w jądrze zmienia ten ciąg prowadząc do 
liczb magicznych 2, 8, 20, 28, 50, 82, 126, 184, obser¬ 
wowanych w rzeczywistości z wyjątkiem ostatniej. 
Jednakże rzeczywisty potencjał działający na nukleony 
w jądrze różni się od potencjału oscylatora harmo¬ 
nicznego, zwłaszcza dla jąder cięższych. Odstępstwa 
te są bardziej wyraźne dla protonów, co jest zapewne 
częściowo związane z istnieniem elektrostatycznego 
odpychania. Okazuje się, że w jądrach ciężkich sto¬ 
sunek (< de/dn ): (defdl) jest bliski wielkości 3:1, co 
odpowiada bardziej interwałowi duodecimy niż okta¬ 
wie (2 :1). W tej sytuacji grupy stanów protonowych 
typu (1 j) (2 g); (1?) (2/) oraz (l/z) {Id) są bliskie zwy¬ 
rodnienia (wielkość w nawiasie oznacza wartość 
liczby kwantowej n, litera zaś — wielkość liczby 
kwantowej / zgodnie ze standardową notacją spektro¬ 
skopii; / = 0, 1, 2, 3, 4, 5, 6, 7,... oznaczane jest od¬ 
powiednio przez s , p , d, f g , h , /, /,...). Odnosi się 
to szczególnie do tej części widma, która odpowiada 
całkowitemu momentowi pędu nukleonu jr, równemu 
/+ 1 / 2 (zgodna równoległość momentu orbitalnego 
i spinu protonu). Wynikający stąd układ poziomów 
energetycznych protonu przedstawiony jest na rys. 3. 


protony 


2 /-/+? 



Rys. 3. Schemat poziomów protonowych jąder superciężkich 
Symbolami A * C oznaczono te poziomy, które byłyby zwyrod¬ 
niałe w przypadku spełnienia wzoru (1) dla stosunku odpowied 
nio 3:1, 2:1.W kółkach podane są liczby magiczne 


Widać tu wyraźnie zamkniętą powłokę dla Z = 114. 
Hipotetyczne pierwiastki superciężkie występowałyby 
więc zgodnie z przywidywaniami teorii w okolicy 
Z — 114 oraz N — 184 (rys. 2). Trwałość tych jąder 
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ograniczona jest przez możliwość rozszczepienia lub 
przez rozpad a i fi. Rysunek 4 podaje teoretyczne 
oszacowania czasów życia hipotetycznych jąder su- 



Rys. 4. Teoretyczne oszacowania czasów życia nuklidów super¬ 
ciężkich. Kropki i kółka oznaczają jądra trwałe względem roz¬ 
padu beta, zaś liczby przy konturach — czas życia w latach 
względem rozszczepienia i rozpadu alfa 

perciężkich. Jak widać, czasy te są dostatecznie dłu¬ 
gie na to, by raz wytworzone (lub odkryte w naturze) 
nuklidy superciężkie mogły być poddane różnym ba¬ 
daniom. W ciągu ostatnich kilku lat wiele szczegóło¬ 
wych badań poświęcono próbom znalezienia w na¬ 
turze tych interesujących pierwiastków lub też pró¬ 
bom sztucznego ich wytworzenia. Jak na razie próby 
te nie powiodły się. Jest to zrozumiałe, jeśli uwzględni 
się fakt, że np. na Ziemi, której wiek szacuje się na 
około 10 9 lat, nie mogłyby pozostać nawet niewielkie 
ilości pierwiastków o czasach życia wyraźnie krót¬ 
szych od jej wieku. Poza tym wytworzenie nuklidu problem 
o Z = 114 oraz N — 184, w drodze syntezy dwóch wytworzenia 
jąder lżejszych, jest obecnie niemal niewykonalne ze jąder super- 
względu na fakt, że złożenie fragmentu o Z = 114 ciężkich 
z dwóch ciężkich jonów dostępnych .obecnie w labo¬ 
ratoriach prowadzi z reguły do nuklidu o N znacznie 
mniejszej od 184. Być może przyśpieszenie cięższych 
jonów, takich jak ksenon lub uran pozwoli na roz¬ 
wiązanie tej trudności. Wytworzenie pierwiastków 
superciężkich byłoby doniosłym wydarzeniem nie 
tylko dla fizyki jądra atomowego. Mogłoby się ono 
przyczynić do lepszego zrozumienia lub nawet roz¬ 
wiązania wielu problemów astrofizyki, związanych ze 
wzajemnym przeobrażaniem się pierwiastków w 
gwiazdach. Byłoby krokiem milowym w fizyce ato¬ 
mowej i chemii, gdzie otworzyłyby się możliwości 
badania nowych powłok atomowych i ich wpływu na 
własności chemiczne ciał. Stworzyłoby także fascy¬ 
nujące możliwości sprawdzenia praw elektrodynamiki 
w warunkach ekstremalnych w związku z występo¬ 
waniem bardzo dużych ładunków elektrycznych 
w stosunkowo niewielkim obszarze. 

Innym przykładem ekstremalnego stanu jądra jest proces^ roz¬ 
stań jądra występujący w procesie rozszczepienia, szczepienia 
W stanie, w którym zaczyna się ten proces (punkt 
siodłowy na powierzchni energetycznej) jądro atomo¬ 
we charakteryzuje się znacznym wydłużeniem, od¬ 
powiadającym stosunkowi osi równym w przybliżeniu 
2:1. Ponadto istotną rolę odgrywa parametr e 4 , 























określający tworzenie się przewężenia prowadzącego 
do podziału jądra na dwa fragmenty. Wreszcie fakt, 
że wiele jąder ulega podziałowi na dwie nierówne 
części, wiąże się z przypuszczeniem naruszenia symetrii 
względem płaszczyzny prostopadłej do osi symetrii 




-0.08 


- 0.4 - 0.2 0 
parametr wydłużenia € 2 


Rys. 5. Kształt jądra rozszczepiającego się asymetrycznie (e* ^ 0) 
w konfiguracji siodłowej. Linia przerywana określa kształt jądra 
symetrycznego (e s = 0) 



Rys. 6. Rzut powierzchni energetycznej na płaszczyznę para¬ 
metrów e 2 oraz z 4 . Kontury (warstwice) odpowiadają określo¬ 
nym wartościom energii. Obliczenia odnoszą się do jądra tlJ Fm 
bez uwzględnienia poprawki powłokowej. Literami O i S ozna¬ 
czono odpowiednie położenia konfiguracji stanu podstawowego 
oraz punktu siodłowego i 


parametr wydłużenia 


Rys. 7. Kształt dwugarbnej bariery potencjału (energia w MeV) 
w rozszczepiających się jądrach, które mają izomery kształtu. 
Nad krzywą oraz pod zobrazowane są schematyczne kształty od¬ 
powiadające kolejno: jądru sferycznemu, stanowi równowagi, 
konfiguracji siodłowej pierwszego garbu, stanowi izomerycznemu, 
konfiguracji siodłowej drugiego garbu i wreszcie konfiguracji ro¬ 
zerwania jądra 



1:1 (pryma) 
parametr wydłużenia 


3:2 (kwinta) 


2:1 (oktawa) 



Rys. 8. Poziomy energetyczne niezależnego nukleonu poruszają¬ 
cego się w potencjale oscylatora harmonicznego w funkcji wy¬ 
dłużenia e 2 . Podane są liczby magiczne odpowiadające stosunkom 
częstości 1:1 (pryma) oraz 2:1 (oktawa) 


Rys. 9. Poziomy energetyczne niezależnego nukleonu w poten¬ 
cjale jądrowym dla stosunku częstości 2:1. Z lewej strony wy¬ 
kreślone są poziomy w potencjale oscylatora harmonicznego, 
z prawej zaś — dla bardziej realistycznego potencjału jądrowego. 
W kółkach podane są odpowiednie liczby magiczne określające 
zamknięte powłoki w zdeformowanym potencjale 
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jądra (e 3 ^ 0). Tak rozszczepiające się jądro przybiera 
w punkcie siodłowym kształt zbliżony do gruszki 
(rys. 5). Konfiguracja odpowiadająca punktowi siod¬ 
łowemu odznacza się wyższą energią potencjalną 
w porównaniu z konfiguracją stanu podstawowego. 
Proces rozszczepienia przebiega więc albo przez kwan¬ 
towy efekt tunelowy albo wskutek dostarczenia do 
jądra energii w ilości wystarczającej do pokonania 
bariery potencjału na rozszczepienie (-* Rozpady 
jąder atomowych), tj. różnicy energii w obu wspom¬ 
nianych konfiguracjach. Powierzchnia energetyczna, 
jako funkcja parametru wydłużenia e 2 oraz parametru 
przewężenia e 4 , zilustrowana jest na przykładzie po¬ 
danym na rys. 6, który jest mapą powierzchni ener¬ 
getycznej (linie ciągłe są warstwicami, tj. odpowiadają 
stałej energii). Na rys. 6 zaznaczone są również po¬ 
łożenia konfiguracji stanu podstawowego i punktu 
siodłowego (oznaczone odpowiednio literami O, S ). 

Okazuje się jednak, że wiele spośród jąder ciężkich 
ulegających rozszczepieniu wykazuje znacznie bardziej 
skomplikowaną strukturę powierzchni energetycznej 
w okolicy punktu siodłowego. Obok minimum w sta¬ 
nie podstawowym występuje w tych jądrach drugie 
minimum, odpowiadające bardziej dużemu wydłu¬ 
żeniu o stosunku osi rzędu 2:1. Jądra w takiej kon¬ 
figuracji żyją bardzo krótko i rozpadają się przez 
rozszczepienie z czasem życia o kilka lub kilkanaście 
rzędów wielkości krótszym niż w wypadku rozszcze¬ 
pienia zaczynającego się w stanie podstawowym, 
izomery Takie stany ekstremalne zwane są izomerami kształtu, 
kształtu Były one obserwowane u wielu jąder grupy akty¬ 
nowców. Istnienie tego typu stanów możliwe jest 
jedynie wówczas, gdy w barierze na rozszczepienie 
,,wyżłobione” jest dodatkowe minimum, tak jak to 
przedstawia rys. 7. 

Wyjaśnienie występowania izomerów kształtu na 


gruncie badania struktury widm energetycznych jest 
ciekawym przykładem zastosowania warunku (1) 
Bohra i Mottelsona. Energia pojedynczego nukleonu 
poruszającego się w potencjale anizotropowego oscy¬ 
latora harmonicznego dana jest wzorem 

a = /rcc? i .(ffj.-M)-f^ca 3 (/i a +V 2 ), (4) 

gdzie coj_ oraz co 3 oznaczają dwie różne częstości cha¬ 
rakteryzujące kształt potencjału, zaś n ± i n 3 — od¬ 
powiednie liczby kwantowe. Rysunek 8 przedstawia 
wykres poziomów energetycznych w funkcji wydłu¬ 
żenia s 2 - Widać, że oprócz struktury powłokowej, 
odpowiadającej kształtowi kulistemu (1 :1), istnieje 
wyraźna struktura powłokowa dla co ± : co s = 2:1 
(oktawa), czyli stosunku osi równego 1: 2. Liczby 
magiczne 2, 4, 10, 16, 28, 40, 60, 80, 110, 140, 182 ... 
odpowiadają w tym wypadku potencjałowi czystego 
oscylatora harmonicznego. Istnienie odstępstw od 
potencjału oscylatora harmonicznego prowadzi do 
modyfikacji tego prostego schematu (rys. 9). Wskutek 
tego w rzeczywistych jądrach należy oczekiwać istnie¬ 
nia liczb magicznych... 86, 116, 148... Właśnie 
w pobliżu liczby neutronów N — 148 wykryto szereg 
izomerów kształtu. 

Omówione powyżej przykłady hipotetycznych lub 
obserwowanych jądrowych stanów ekstremalnych nie 
wyczerpują wszystkich możliwości. Można oczekiwać, 
że w przyszłości wysunięte zostaną nowe hipotezy 
i odkryte będą nowe ekstremalne stany jąder atomo¬ 
wych. Będą one niewątpliwie cennym źródłem dal¬ 
szych informacji o strukturze i własnościach jąder ato¬ 
mowych. 

A Bohr, B.R Mottelson Nuclear Structure, Vol 2, Massa¬ 
chusetts (London-Amsterdam-Don Mills, Ontario-Sydney, 
Tokyo) 1975; E.K Hyde i in. The Nuclear Properties of The 
Heavy Elements, Englewood Cliffs, New Jersey 1967; S.G. Nils- 
son Shapes and Shells w Scuola Internationale „Enrico FermC* 
1974, Amsterdam 1956. 


Fizyka ciężkich jonów 

Adam Sobiczewski 


ciężkie jony Ciężkimi jonami nazywamy, dosyć umownie, jony (tzn. 

zjonizowane atomy) pierw-iastków cięższych od helu, 
tj. pierwiastków o liczbie atomowej Z > 2. Przyspie¬ 
szane w akceleratorach do różnych energii, znajdują 
one zastosowanie w wielu dziedzinach nauki (głównie 
fizyka jądrowa, ale także atomowa, ciało stałe, me¬ 
dycyna i in.) oraz techniki. Jądra ciężkich jonów roz¬ 
pędzane do energii o bardzo szerokim zakresie — od 
niskich do bardzo wysokich — mogą wywoływać 
w jądrach tarczy różnorodne procesy, trudne lub nie¬ 
możliwe do osiągnięcia za pomocą cząstek lżejszych, 
jak elektrony, miony czy mezony, a nawet protony, 
deuterony czy jądra helu. Badanie tych procesów do¬ 
starcza jedynej w swoim rodzaju wiedzy o jądrach, 
ich strukturze i przemianach. 

Konieczność przyspieszania jonów sprawia, że 
rozwój fizyki ciężkich jonów jest ściśle związany 
z rozwojem akceleratorów. Pierwszą wiązkę jonów 
ciężkich (węgla 12 C) — o natężeniu jeszcze bardzo 
małym, ale wystarczającym już do badania niektó¬ 
rych reakcji jądrowych — otrzymano w 1950 r. 
w USA (Berkeley). Był to początek zrazu powolnego, 
a ostatnio bardzo burzliwego rozwoju fizyki ciężkich 
jonów. Obecnie potrafimy już przyspieszać jony 
wszystkich pierwiastków, a budowa coraz większych 
akceleratorów umożliwia przyspieszanie ich do coraz 
wyższych energii i z coraz większym natężeniem 
wiązki (—> Akceleratory). 

Szybki i bardzo wszechstronny rozwój fizyki cięż¬ 
kich jonów sprawia, że z pomocniczej uprzednio tech¬ 
niki zaczyna ona wyrastać na samodzielny i ważny 
dział fizyki jądrowej. Wydaje się, że w najbliższych 
latach będzie to jeden z działów najbardziej dyna¬ 
micznych i bogatych w wyniki. 


Do tych kilku uwag dodajmy następującą uwagę 
terminologiczną. Ponieważ w reakcjach jądrowych 
powłoka elektronowa jonu nie odgrywa prawie 
żadnej roli, przeto gdy w fizyce jądrowej mówimy 
o ciężkim jonie czy reakcji z nim, mamy z reguły na my¬ 
śli samo jego jądro czy odpowiednio reakcję z tym 
jądrem. Skrótu tego nie używa się w innych działach 
fizyki, gdzie powłoka elektronowa jonu jest istotna. 

Reakcje wywołane przez ciężkie jony mają kilka cech specyfika 
szczególnych, wyróżniających je spośród innych reakcji reakcji 
jądrowych. Cechy te decydują w dużej mierze o zna- z ciężkimi 
czeniu reakcji. Wymienimy główne z nich: jonami 

1) Duży ładunek elektryczny jądra jonu. Daje to 
możliwość oddziaływania na jądro tarczy silnym po¬ 
lem elektrycznym (wzbudzenie kulombowskie — 
patrz niżej). Pozwala także na utworzenie, choćby 
na krótko (mianowicie na okres czasu, w którym 
jądra ciężkiego jonu i tarczy przebywają w bezpo¬ 
średnim sąsiedztwie), układu o bardzo dużym ładunku. 

Dostarcza to szansy zbadania powłoki elektronowej 
odpowiadającej jądru o ładunku, którego nie można 
otrzymać w inny sposób (atomy superciężkie). 

2) Duża masa jonu. Zderzenia jąder o dużej masie 
umożliwiają przekazanie z jednego jądra do drugiego 
wielu nukleonów, lub wymianę ich między jądrami. 

Oznacza to możność wytwarzania nuklidów znacznie 
różniących się od naturalnych lub wytwarzanych 
w reakcjach z lekkimi cząstkami (nuklidy o dużym nie¬ 
domiarze lub nadmiarze neutronów, nuklidy bardzo 
ciężkie lub nawet superciężkie). 

3) Duży pęd jonu. Wskutek tego duży jest także 
pęd przekazany produktom reakcji, co z kolei sprawia, 
że produkty te „wybijane” są z tarczy i mogą być 
niemal natychmiast poddane badaniom. Jest to 
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szczególnie ważne przy badaniu produktów krótko- 
życiowych. Duża prędkość produktów umożliwia 
także stosowanie wielu specjalnych technik detekcyj¬ 
nych i identyfikacyjnych (np. wykorzystujących ana¬ 
lizatory magnetyczne z selektorem, prędkości, które 
pozwalają na określenie zarówno masy, jak i ładunku 
produktu, czy też- detektorów śladowych). 

4) Duży moment pędu jonu względem jądra tarczy. 
Pozwala on na wytwarzanie jąder złożonych w stanach 
o dużym momencie pędu (spinie). Badanie jądra 
w takim stanie umożliwia poznanie wpływu szybkości 
obrotu jądra na jego strukturę i własności. 

Duże pędy i momenty pędu występujące w reak¬ 
cjach z ciężkimi jonami pozwalają przy tym na korzy¬ 
stanie w dużej mierze z klasycznego i półklasycznego 
ich opisu. 


Rodzaje reakcji z ciężkimi jonami 
i ich mechanizm 


O przebiegu procesu zderzenia ciężkiego jonu 1 z jąd¬ 
rem tarczy 2 decyduje kilka wielkości. Są to (rys. 1): 
liczby atomowe Z u Z 2 obu jąder (a więc i ładunki 



Zi,Ai 



przedłużeniem wektora pędu czy prędkości począt¬ 
kowej padającego jonu. Na przykład 6 = 0 oznacza, 
że jon pada wprost na jądro tarczy (tzw. zderzenie 

czołowe). Łącznie z wektorem p parametr zderzenia 
określa moment pędu jonu względem jądra tarczy, 

T— Vxp f , który jest zachowany w czasie całego pro¬ 
cesu zderzenia. 

Liczby Z, i Z 2 razem z liczbami masowymi A x i A 2 , bariera 
które określają wymiary jąder (-> Jądra atomowe kuiombo- 
i ich wzbudzenia), wyznaczają wartość bariery po- wska 
tencjału między jonem i jądrem tarczy. Pochodzenie 
bariery wyjaśnia schematycznie rys. 2. Z rys. 2a 
widać, że potencjał składa się z dwu części: długoza- 
sięgowej, dodatniej £/ k m(r), opisującej odpychanie 
elektrostatyczne (kulombowskie) między jądrami, 
oraz krótkozasięgowej, ujemnej Uj(r), opisującej 
przyciąganie czysto jądrowe (-► Siły jądrowe). Wobec 
krótkiego zasięgu sił jądrowych przyciąganie wystę¬ 
puje dopiero przy bardzo małej odległości między 
jądrami, niemal wtedy, gdy „stykają się” one swoimi 
powierzchniami. Jest jednak silniejsze od odpychania 
kulombowskiego, toteż nałożenie obu oddziaływań 
daje barierę potencjału (barierę kulombowską) przed¬ 
stawioną na rys. 2b. Jest to ta sama bariera, którą 
musi pokonać cząstka naładowana w procesie od¬ 
wrotnym do opisywanego tutaj (tzn. w procesie wy¬ 
dostania się z jądra), np. cząstka a przy rozpadzie a 
(-► Rozpady jąder atomowych). Jeśli przynajmniej 
jedna ze zderzających się cząstek nie jest naładowana 
elektrycznie (np. neutron), bariera taka nie istnieje. 

Wysokość bariery kulombowskiej można łatwo 
obliczyć. Zgodnie z rys. 2 


Z2, Ai 

Rys. 1. Wielkości charakteryzujące zderzenie ciężkiego jonu 1 
z jądrem tarczy 2 

Z x e i Zj^, gdzie e — ładunek protonu), ich liczby 
masowe A u A 2 , pęd p lub energia E padającego jonu 
(jądro tarczy na początku procesu zderzenia spoczy¬ 
wa) oraz parametr zderzenia b. Parametr ten jest 
odległością środka jądra tarczy od prostej będącej 


£kui = U(R) = 


(Z 1 e)(Z 2 e) 

R 


( 1 ) 


gdzie R jest (w przybliżeniu) odległością między 
środkami jąder przy ich „zetknięciu”, a więc sumą 
ich promieni 

R x R l +R, = rdiP+Aifi' (2) 

We wzorze (2) r 0 = 1,3-1,5 fm. Ponieważ energię 



a) 



Rys. 2. Objaśnienie pochodzenia bariery kulombowskiej (a) oraz 
wykres bariery (b) 



padającego jonu podaje się zwykle w przeliczeniu na energia na 
jeden jego nukleon, tzn. E/A u wygodnie jest barierę pokonanie 
kulombowską podawać również w takim przeliczę- bariery 
niu, tzn. Ewu\/A u a zamiast podawać samą barierę 
kulombowską £kuiMi lepiej podać energię 
jaką ciężki jon musi mieć w układzie laboratoryjnym, 
by mógł pokonać barierę kulombowską jąder tarczy. 

Energia Egg jest barierą kulombowską £kui powięk¬ 
szoną o energię ruchu środka masy. Na rys. 3 podane 
są dwie krzywe przedstawiające w funkcji A x : 

gdy Z 2 = Z x oraz gdy Z 2 = 92. W drugim wypadku 
tarcza wykonana jest z najcięższego pierwiastka 
występującego w naturze, tzn. z uranu. Wartości 
E^aJAi zawarte między obiema krzywymi wyczer- 
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pują zatem niemal wszystkie kombinacje i Z 2 , 
jakie mogą występować (ze względu na symetrię 
wzoru (1) przy zamianie i Z 2 można rozważać tylko 
wypadek, gdy Z 2 > Z^. Z rys. 3 wynika np., że przy 
zderzeniu C+C (węgiel z węglem) wystarczy energia 
ok. 1 MeV/nukIeon, by j‘ony węgla mogły pokonać 
barierę kulombowską, podczas gdy w reakcji C+U 
(węgiel z uranem) trzeba już ponad 5 MeV/nukleon. 
Energia zaś E\A X = 6-1 MeV/nukleon wystarcza 
w zasadzie do pokonania każdej bariery kulombow- 
skiej. 

Obecność bariery kulombowskiej w zderzeniach 
ciężkiego jonu z jądrami narzuca podział tych zderzeń 
na dwie zasadnicze klasy: zderzeń podbarierowych, 
zderzenia gdy E < EW, i nadbarierowych, gdy E > jE ku i. 
podbarie- W pierwszym wypadku jon o energii E może się zbli- 
rowe żyć do jądra najwyżej (przy zderzeniu czołowym) na 
odległość d> R (rys. Ib), może więc spowodować 
tylko proces, w którym występuje oddziaływanie 
kulombowskie (elastyczne rozpraszanie kulombowskie 
zderzenia i wzbudzenie kulombowskie), a nie jądrowe. W wy- 
nadbarie- padku drugim jon może pokonać barierę kulombow- 
rowe ską, dostaje się wtedy do obszaru oddziaływania 
jądrowego i powoduje różnorodne reakcje jądrowe. 

Ze względu na dużą rozpiętość energii ciężkich 
jonów dogodnie jest wydzielić przynajmniej trzy za¬ 
kresy: energii niskich, pośrednich i wysokich. Od¬ 
powiadające tym zakresom procesy są bardzo różne. 

Niskie,, to energie do ok. 10 MeV/nukIeon, a więc 
energie zarówno podbarierowe, jak i nadbarierowe, 
ale niezbyt odległe od wartości bariery kulombows¬ 
kiej. Ten zakres energii j*est najlepiej zbadany, ponie¬ 
waż większość obecnych akceleratorów przyspiesza 
jony do takich właśnie energii. Wysokie, to energie 
od kilkuset do kilku tysięcy MeV/nukleon. W tym 
zakresie jest na razie stosunkowo mało wyników 
doświadczalnych. Wreszcie w zakresie energii po¬ 
średnich brak, jak dotąd, wyników doświadczalnych. 
Jedynie pod względem teoretycznym jest on w pew¬ 
nym stopniu opracowany. 

Zgodnie z tym stanem rzeczy najbardziej szczegó¬ 
łowo omówimy zakres energii niskich. 


Energie niskie 

Przy energii nadbarierowej rodzaj procesu wywoła¬ 
nego ciężkim jonem zależy w istotny sposób od war¬ 
tości parametru zderzenia b. Przy niskiej energii 
mogą zajść następujące procesy (rys. 4): 

a) Przy dużych wartościach b , mianowicie gdy 
zderzenia b > b m (zderzenia odległe), jon nie dostaje się do 

odlegle strefy oddziaływania jądrowego i może oddziaływać 
z jądrem tylko kulombowsko. Przez to oddziaływanie 
może on doznać jedynie rozproszenia elastycznego 
(w którym ani jądro tarczy, ani jon nie zostają wzbu¬ 
dzone) lub nieelastycznego (w którym bądź jądro 
tarczy, bądź jon, bądź też jedno i drugie zostaje 
wzbudzone — wzbudzenie kulombowskie). 

b) Przy wartości b x b m jon dostaje się zaledwie 
„muśnięcie" na granicę oddziaływania jądrowego; zachodzi wów- 



Rys. 4. Różne rodzaje zderzeń ciężkiego jonu J z jądrem tarczy T, 
w zależności od wartości parametru zderzenia b : a) elastyczne 
rozpraszanie kulombowskie ( ERK ) i wzbudzenie kulombowskie 
(tVK), b) reakcja wprost (RW), c) reakcja głęboko nieelastyczna 
C RON) f d) reakcja przez jądro złożone (RJZ) 


czas oddziaływanie tylko między kilkoma nukleonami 
na powierzchni obu jąder. Takie zderzenie „muśnię¬ 
cia" prowadzi do tzw. reakcji wprost, lub inaczej — 
reakcji bezpośrednich. 

c) Przy mniejszych b zderzenie ma charakter głęb¬ 
szy, więcej nukleonów jest w nim zaangażowanych. 
Następuje przekazanie znacznej ilości energii i mo¬ 
mentu pędu od ruchu względnego do wewnętrznych 
stopni swobody obu jąder, a także wymiana pewnej 
liczby nukleonów między jądrami. Takie zderzenie 
nazywa się głęboko nieelastycznym. Jądra po zderze¬ 
niu (jądra końcowe) różnią się od jąder przed zde¬ 
rzeniem (jądra początkowe) bardziej niż w reakcjach 
wprost. 

d) Dopiero przy dostatecznie małych b energia 
i moment pędu ruchu względnego mogą w pełni 
zostać przekazane wewnętrznym stopniom swobody. 
Powstaje wówczas układ silnie wzbudzony, w którym 
energia rozłożona jest między wszystkie nukleony. 
Mówimy, że zachodzi synteza (lub fuzja) zderzają¬ 
cych się jąder lub że zostaje utworzone jądro złożone. 
Jądro to „zapomina" niejako o swojej historii, sposób 
jego późniejszego rozpadu nie zależy od sposobu jego 
powstania. 

Omówimy główne cechy i mechanizm poszczegól¬ 
nych procesów. 

Elastyczne rozpraszanie kulombowskie, zwane tak¬ 
że rozpraszaniem rutherfordowskim, jest najprost¬ 
szym z wymienionych procesów. Nie następuje tu 
żadna zmiana energii ruchu względnego na energię 
wewnętrzną jąder. Pod wpływem odpychania kulom- 
bowskiego jon zostaje odchylony o kąt, który jest 
prostą funkcją energii padania E i parametru zderze¬ 
nia b. Wzór na różniczkowy przekrój czynny rozpra¬ 
szania otrzymać można zarówno na gruncie mecha¬ 
niki klasycznej, jak i kwantowej. Jest to jeden z nie¬ 
licznych wzorów, które w obu wypadkach są iden¬ 
tyczne. Proces rozpraszania rutherfordowskiego nie 
daje jednak prawie żadnej (oprócz ładunku) informacji 
o jądrach tarczy. 

Wzbudzenie kulombowskie jest nadal stosunkowo 
jeszcze prostym i dobrze zrozumianym procesem; 
nie występuje w nim bowiem oddziaływanie jądrowe. 
Jest przy tym stosunkowo łatwe do zrealizowania 
w praktyce — stąd szerokie jego stosowanie. Przelot 
ciężkiego jonu w pobliżu jądra tarczy poddaje jądro 
silnemu zmiennemu polu elektrycznemu (siła oddzia¬ 
ływania dochodzi do kilkudziesięciu kG!); pole po¬ 
woduje dynamiczną deformację jądra lub (jeśli ma 
ono kształt trwale zdeformowany, jak np. jądra 
obszaru ziem rzadkich lub aktynowców) jego obrót. 
Prowadzi to do wzbudzeń kolektywnych typu wibra¬ 
cyjnego (drgania) lub rotacyjnego (obrót; -> Modele 
jądrowe). Najłatwiej zachodzą wzbudzenia kolek¬ 
tywne o niskiej energii i małej multipolowości (tzn. 
o małym spinie), głównie kwadrupolowe (spin 2). 
Łatwość i jednocześnie „czystość" wzbudzeń była 
powodem, że z zastosowaniem ciężkich jonów zo¬ 
stały zbadane stany kolektywne niemal wszystkich 
dostępnych jąder. Wyznaczono energie stanów, 
prawdopodobieństwa ich wzbudzenia (elektromagne¬ 
tycznego), spiny i parzystości, a więc podstawowe 
wielkości charakteryzujące stan wzbudzony i jego 
relację ze stanem podstawowym. 

Prawdopodobieństwo wzbudzenia kulombowskie- 
go rośnie ze wzrostem energii padającej cząstki, 
rośnie też szybko ze wzrostem jej masy. Jeśli np. przy 
jakiejś energii prawdopodobieństwo wzbudzenia za 
pomocą elektronów jest bardzo małe, to za pomocą 
protonów o tej samej energii jest znaczne, a za pomo¬ 
cą ciężkiego jonu — duże. Prawdopodobieństwo 
wzbudzenia stanu kolektywnego przeciętnego jądra 
z obszaru ziem rzadkich jonem 16 Ojest kilka tys. razy 
większe niż protonem — przy takiej samej energii 
jonu na jeden jego nukleon jak energia protonu. Fakt 
ten zdecydował o powszechności stosowania ciężkich 
jonów do wzbudzania kulombowskiego. Pozwolił on 
także na realizowanie za pomocą ciężkich jonów 
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wielokrotnego (lub wielostopniowego) wzbudzenia 
kulombowskiego. W procesie tym w czasie prze¬ 
lotu jonu w pobliżu jądra tarczy jądro doznaje kilku 
kolejnych wzbudzeń. Rys. 5 podaje przykład, w któ¬ 
rym jądro 170 Hf doznaje ośmiu wzbudzeń, a każde 
z nich podwyższa kolejno jego spin o 2 i o pewną 
wartość energii. Stosując odpowiednio ciężkie jony 
można drogą wielokrotnego wzbudzenia kulombow¬ 
skiego osiągać bardzo wysokie spiny. Należy przy 
tym zwrócić uwagę, że prawdopodobieństwo osiąg¬ 
nięcia stanu 4-f bezpośrednio ze stanu 0+ (wzbu¬ 
dzenie jednokrotne) jest znacznie mniejsze niż po¬ 
średnio, przez stan 2+ (wzbudzenie dwukrotne). Od¬ 
nosi się to tym bardziej do stanów o wyższym spinie: 
można je osiągnąć niemal jedynie drogą wielokrot¬ 
nego („drabinkowego”) wzbudzenia kulombowskiego. 
reakcje Reakcje wprost są procesami szybkimi. Czas ich 
wprost trwania jest rzędu czasu swobodnego przelotu jonu 
przez obszar silnego (jądrowego) oddziaływania 
z jądrem tarczy, a więc ok. 10" 22 s. Oddziaływanie 
następuje między kilkoma tylko nukleonami na po¬ 
wierzchni jąder; reszta nukleonów nie bierze udziału 
w zderzeniu, pozostają one tylko jego „obserwa¬ 
torami”. W konsekwencji przekaz energii i momentu 
pędu jest nieduży. Nieduża jest także liczba nukleo¬ 
nów, które zostają przekazane z jednego jądra do 
drugiego. 

reakcje Reakcje głęboko nieelastyczne obejmują cały za- 
głęboko nie- kres między reakcjami wprost a reakcjami przez jądro 
elastyczne złożone. Przekrój czynny, czyli prawdopodobieństwo 
takich reakcji, rośnie ze wzrostem energii zderzenia 
oraz ze wzrostem mas zderzających się jąder. Dość 
duże wartości przekroju czynnego otrzymuje się, 
gdy energia jonu przewyższa barierę kulombowską 
przynajmniej o 1-2 MeV/nukleon, a masy jąder są 
znaczne. 

Czas trwania reakcji głęboko nieelastycznej mieści 
się w szerokim przedziale 10 -22 -10 -18 s, średnio jest 
więc rzędu 10" 20 s. W tym czasie zderzające się jądra 
zdążą przejąć dużą część energii kinetycznej i momentu 
pędu ruchu względnego (dyssypacja energii i momen¬ 
tu pędu), co spowoduje silne ich wzbudzenie we¬ 
wnętrzne. 

Wyniki doświadczalnych badań nad reakcjami głę¬ 
boko nieelastycznymi sugerują następujący ich prze¬ 
bieg (rys. 6). Zderzające się jądra wchodzą w kontakt 



Rys. 6. Przebieg reakcji głęboko nieelastycznej (w układzie środka 
masy): od momentu nalatywania na siebie jąder, przez zlepienie 
się i wirowanie aż do rozerwania 


ze sobą, „zlepiają się” na pewien czas (rzędu 10" 20 s), 
tworząc wspólny układ. Połączenie to ma jednak 
charakter tylko dynamiczny. Czas jego trwania 
wystarcza z reguły do pełnej dyssypacji energii kine¬ 
tycznej radialnego ruchu względnego, nie wystarcza 
jednak do pełnej dyssypacji względnego momentu 
pędu. W rezulatacie — po wykonaniu obrotu o pe¬ 
wien kąt siła odśrodkowa pochodząca od tej części 
względnego momentu pędu, która nie uległa dyssy¬ 
pacji, rozrywa zlepione jądro na dwie części. Podczas 
połączenia między zlepionymi jądrami może nastą¬ 
pić wymiana znacznej liczby nukleonów. 

Z przedstawionego mechanizmu reakcji głęboko 
nieelastycznych widać, że badanie ich może być waż¬ 
nym źródłem wiedzy o wielkości i naturze efektów 
dyssypacyjnych w jądrach. 

reakcje przez Przy odpowiednio małym parametrze zderzenia b 

jądro złożone wartość względnego momentu pędu / jest dostatecznie 
mała, by siła odpychająca (siła odśrodkowa plus 
siła kulombowską), działająca na jądra w czasie ich 
zetknięcia, była mniejsza od siły jądrowej przyciąga¬ 
jącej je do siebie. Powstają wtedy warunki do utwo¬ 
rzenia przez zderzające się jądra układu względnie 


trwałego. Przy utworzeni i jego zarówno energia ki¬ 
netyczna jak i moment pędu ruchu względnego ule¬ 
gają całkowitej dyssypacji i zostają rozłożone między 
wszystkie nukleony. Mówi się, że układ jest w rów¬ 
nowadze (termodynamicznej) i nazywa się go jądrem 
złożonym. W jądrze tym zatarte zostają ślady sposo¬ 
bu, w jaki ono powstało. Ogólne charakteryzujące je 
wielkości, jak liczba masowa A y atomowa Z, energia 
wzbudzenia i spin nie są jednoznacznie związane 
z tym sposobem, można je otrzymać przy zderzeniu 
wielu różnych par jąder. Tylko te wielkości, a nie 
„zapomniany” sposób powstania, mają pewien, sta¬ 
tystyczny w swoim charakterze wpływ na sposób 
rozpadu jądra złożonego. Może to być rozpad przez 
emisję lekkich cząstek, rozpad y lub rozszczepienie. 
Czas tworzenia się jądra złożonego jest rzędu 10" 17 s. 
W skali czasu procesów jądrowych jest to bardzo 
dużo, ok. stu tysięcy razy dłużej, niż trwa reakcja 
wprost. 

Badanie warunków, w jakich może powstać jądro 
złożone, ważne jest m.in. dla poznania możliwości 
syntezy jąder bardzo ciężkich. 

Granica między omówionymi rodzajami reakcji 
niskich energii nie jest ostra. Przy płynnej zmianie 
takich parametrów reakcji jak parametr zderzenia 
b czy względny moment pędu / Jeden rodzaj przechodzi 
pyłnnie w drugi. Tak np. na rys. 7 podany jest wy- 



Rys. 7. Wykres prawdopodobieństwa a\ zajścia procesu o danym 
względnym momencie pędu /, w zależności od I (por. rys. 4). 

kres przekroju czynnego, czyli wykres prawdopodo- zależność o* 
bieristwa zajścia różnego rodzaju procesów w za- momentu 
leżności od /. Przy dużym / zachodzi elastyczne roz- pęcłti 
praszanie kulombowskie ( ERK ) i wzbudzenie kulom- 
bowskie ( !VK) y przy mniejszym — reakcje wprost 
(RW), jeszcze mniejszym — reakcje głęboko nie¬ 
elastyczne (RGN), a dopiero przy • wartościach / 
mniejszych od pewnej wartości krytycznej 4 r tworzy 
się jądro złożone ( RJZ ). Przy przejściu od jednego 
obszaru do drugiego prawdopodobieństwo odpowied¬ 
niego procesu zmienia się stopniowo, płynnie (na 
rysunku linie ciągłe). Rysunek 7 przedstawia w inny 
trochę sposób to samo w zasadzie co poglądowy 
rys. 4. Moment pędu l m = pb m (gdzie p — pęd pa¬ 
dającego jonu) odpowiada zderzeniom, w których 
jądra zaledwie się muskają powierzchniami. Rozdzie¬ 
la on wszystkie możliwe zderzenia na dwie klasy: 
zderzeń bliskich i zderzeń odległych. 


Energie pośrednie 

Przy wzroście energii jonu rośnie rola procesu bez- proces 
pośredniego wybijania ze zderzających się jąder kruszenia 
małych lub większych ich fragmentów (proces kru¬ 
szenia lub fragmentacji). 

Oczekuje się, że w pewnym zakresie energii, właści¬ 
wym już dla obszaru procesów kruszenia, wystąpi 
bardzo charakterystyczny proces, inny niż omówione 
dotychczas. Mianowicie, przy energii większej od ok. 

20 MeV/nukleon ciężki jon może wywołać w jądrze 
tarczy falę uderzeniową. Byłaby to fala zgęszczenia 
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fala uderze- materii jądrowej, analogiczna do fali uderzeniowej 
niowa w w cieczy lub gazie. Jeden z możliwych obrazów roz- 
matearii chodzenia się takiej fali w jądrze 238 U uderzonym 
jądrowej 



jonem 16 0 przedstawia rys. 8. Czoło fali, biegnące 
z prędkością większą od szybkości „dźwięku” w ma¬ 
terii jądrowej jądra 238 U (określonej przez jej ściśli¬ 
wość), oddziela „chłodną” część jądra od silnie „na¬ 
grzanej” (wzbudzonej). Z geometrii procesu widać, 
że emitowane z „gorącego” obszaru cząstki (nukleo¬ 
ny, deuterony, 3 He, 4 He i cięższe) wylatywałyby 
głównie na boki, co by świadczyło o obecności fali. 
jądra Zagadnienie występowania fali uderzeniowej w jąd- 
supergąsta rach związane jest z problemem jąder supergęstych, 
przewidywanych przez teorię. Oczekuje się miano¬ 
wicie, że oprócz znanych jąder o normalnej gęstości 
mogą występować jądra o gęstości znacznie większej 
(ok. dwóch razy). Wytworzenie fal uderzeniowych 
w materii jądrowej mogłoby być pomocne w otrzy¬ 
maniu takich jąder. Dotychczas jednak nie stwier¬ 
dzono istnienia tych fal i nie wiadomo, czy można 
je wytworzyć w jądrze ani też, czy można by za ich 
pomocą otrzymać jądra supergęste. 


Energie wysokie (relatywistyczne) 

Obecnie wytwarza się już wiązki ciężkich jonów ( 20 Ne) 
o energii w zakresie ok. 250-2000 MeV/nukleon. 
Taka energia kinetyczna jest zbliżona lub nawet 
znacznie większa od energii spoczynkowej jonu (wy¬ 
noszącej ok. 940 MeV/nukleon), przeto do opisu 
ruchu należy stosować mechanikę relatywistyczną; 
stąd nazwa „energie relatywistyczne”. 

Przeprowadzone dotychczas badania reakcji jonu 
20 Ne z jądrami tarczy uranowej sugerują następujący 
przebieg procesu (rys. 9). Padający jon wybija w jąd- 



Rys. 9. Przebieg zderzenia jonu *°Ne o relatywistycznej energii 
z jądrem uranu. Padający jon wybija w jądrze tarczy rów. Części 
jąder z obszaru zderzenia poruszają się po zderzeniu jako silnie 
wzbudzony, „ognisty” kawałek materii jądrowej, którego frag¬ 
menty rozlatują się na wszystkie strony. Pozostałe części jąder 
są „chłodnymi” obserwatorami zderzenia 

wybijanie rze uranu „rów” lub „tunel”. Ta część jądra, która 
„ognistych" nie leżała na drodze jonu, pozostaje „chłodnym” 
kawałków obserwatorem zderzenia. Podobnie część jonu, która 
nie napotkała jądra tarczy, pozostaje „chłodna”, mało 
wzbudzona i kontynuuje swój ruch z nie zmienioną 
prędkością początkową. Tylko ta część materii, 
która się znalazła dokładnie w obszarze zderzenia, 
biegnie z odpowiednio mniejszą prędkością jako 
„gorący”, bardzo silnie wzbudzony, „ognisty” — 
jak się często mówi — kawałek pokruszonej materii 
jądrowej. Rozlatują się z niego na wszystkie strony 
nie powiązane już ze sobą jego fragmenty — głównie 


nukleony, lecz także deuterony, jądra 3 He, 4 He oraz 
jądra cięższe. 

Z obrazu tego, zgodnego z wynikami doświadczenia, 
widać, jak bardzo różny jest ten proces od procesu 
wzbudzenia kulombowskiego, od reakcji wprost czy 
nawet reakcji głęboko nieelastycznych, które zacho¬ 
dzą przy energiach niskich i które są reakcjami dwu- 
ciałowymi albo dokładnie (wzbudzenie kulombow- 
skie), albo w dobrym przybliżeniu (reakcje wprost 
i reakcje głęboko nieelastyczne). Dwa silnie wzbudzo¬ 
ne w tych reakcjach jądra końcowe mogą się rozpadać 
dopiero po pewnym czasie od momentu zderzenia 
emitując na ogół niewiele lekkich cząstek lub kwan¬ 
tów y, lub rozszczepiając się. W omówionej zaś reakcji 
wysokiej energii sam pierwotny proces jest od razu 
wielociałowy. 


Zastosowanie w fizyce jądrowej 


Jedno z pierwszych ważnych rodzajów zastosowania 
ciężkich jonów w fizyce jądrowej — wzbudzenie ku- 
lombowskie — omówione zostało w poprzednim pa¬ 
ragrafie. Tutaj opiszemy kilka dalszych, które wraz 
z nim zdecydowały i nadal decydują o rozwoju fizyki 
ciężkich jonów. 


Otrzymywanie i badanie jąder dalekich 
od ścieżki trwałości fi 

Reakcje z ciężkimi jonami są bardzo skuteczną me¬ 
todą otrzymywania jąder dalekich od ścieżki trwałości 
p (-* Jądra atomowe i ich wzbudzenia). Jądra te otrzy¬ 
mywane są zarówno w reakcjach przez jądro złożone, 
jak i w procesie przekazu (transferu) nukleonów w re¬ 
akcji wprost czy reakcji głęboko nieelastycznej. W obu 
tych procesach lekkie jony nie pozwalają odejść dale¬ 
ko od ścieżki trwałości i dopiero jony ciężkie dają 
taką możliwość. Na przykład w reakcjach przez jądro 
złożone z cząstkami a, T(a, xn ), liczba emitowanych 
neutronów jest mała i możemy się oddalić od ścieżki 
tylko o parę jednostek masy. Zapis T(a y xri) oznacza 
tutaj, że jądro złożone utworzone jest przez naświetla¬ 
nie tarczy T cząstkami a i, silnie wzbudzone, emituje 
następnie x neutronów n. 

Rozpatrzymy najpierw proces przez jądro złożone. 
W wytwarzaniu jąder dalekich od ścieżki trwałości 
wykorzystujemy fakt, że im cięższe jest jądro na ścież¬ 
ce, tym większy ma stosunek liczby neutronów N do 
protonów Z. Tak np. w jądrach ^O, JJCa i 2 g|Pb 
stosunek ten wynosi odpowiednio 8/8 = 1,00, 
24/20 = 1,20 i 126/82 x 1,54. Oznacza to, że na 
mapie nuklidów, tzn. we współrzędnych (AT, Z), ścież¬ 
ka trwałości odchyla się od przekątnej coraz silniej 
w kierunku osi N. Fakt ten ilustruje (nieco przesad¬ 
nie) rys. 10, z którego widać, że synteza jonu / 
z jądrem tarczy T zawsze prowadzi do jąder neutro- 
nodeficytowych, tzn. mających za mało neutronów 
w stosunku do odpowiadającego im izotopu trwałego. 
Deficyt neutronów jest tym większy, im cięższy jest 



jądro 

złożone 
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jon J i jądro tarczy T. Pogłębia go jeszcze fakt, że 
silnie wzbudzone jądro złożone JZ emituje kilka 
neutronów (a nie protonów, którym utrudnia taką 
emisję bariera kulombowska) przed przejściem do 
stanu podstawowego. W rezultacie, w procesie przez 
jądro złożone można osiągnąć nuklidy o deficycie 
kilkunastu (do ok. 20) neutronów, zbliżając się w ten 
sposób do linii zerowej energii wiązania protonu 
(-► Jądra atomowe w stanach ekstremalnych). 

Z rys. 10 widać także, że w procesie rozszczepienia, 
który jest pod wieloma względami odwrotny do syn¬ 
tezy, rzecz przedstawia się odwrotnie. Dwa np. 
równe produkty (fragmenty) Z 7 rozszczepienia jądra R 
są neutrononadmiarowe. Nadmiar neutronów może 
wynosić kilkanaście, do ok. 20, podobnie jak niedo¬ 
miar przy syntezie. Samorzutnie rozszczepiają się 
jedynie jądra ciężkie o A x 240, dając produkty 
głównie w obszarze mas A « 100 i A zz 140. Pobu¬ 
dzone jednak ciężkimi jonami, mogą się także roz¬ 
szczepiać jądra znacznie lżejsze, dając odpowiednio 
znacznie lżejsze produkty rozszczepienia F. Dzięki 
ciężkim jonom możemy więc wytwarzać jądra neutro¬ 
nonadmiarowe F niemal wzdłuż (poniżej) całej ścieżki 
trwałości p. 

proces Za pomocą procesu transferu nukleonów osiągnię- 
transferu to również wiele nuklidów dalekich od ścieżki trwa¬ 
łości ; przede wszystkim wśród lekkich jąder neutro- 
nonadmiarowych. Przykładem są reakcje: 

*gTh+ ł }N -* •JJPu+^Li, 

2 ^Th-f-*JNe - "gTh+SNe, 

2 §gTh+f$Ne - 2 S?U+ 24 0. 

Pierwsza z nich — to reakcja zdarcia 4 protonów 
z jądra 1 ?N, druga — przechwytu 4 neutronów przez 
jądro ^Ne, trzecia — zdarcia 2 protonów i prze¬ 
chwytu 4 neutronów przez to jądro. 

W taki właśnie sposób osiągnięto granicę trwałości 
jąder względem emisji neutronu (czyli linię zerowej 
energii wiązania neutronu) dla kilku najlżejszych 
pierwiastków: H, He, Li, Be i B. Przyczyniło się to 
do poprawienia wzorów masowych dla lekkich jąder. 
Uprzednio wzory te przewidywały, że jądra ^Li, 
14 Be, X £B i 2 JC są nietrwałe ze względu na emisję 
neutronu. Po doświadczalnym otrzymaniu ich jednak 
w reakcjach transferu przekonano się, że tak nie jest. 

Niełatwym technicznie problemem jest badanie 
własności jąder położonych z dala od ścieżki trwa¬ 
łości fi. Jądra te mają bowiem bardzo krótkie czasy 
życia i pomiary należy wykonywać możliwie jedno¬ 
cześnie z ich wytwarzaniem. Rozwiązuje się to przez 
ustawienie seperatora izotopów oraz detektorów 
bezpośrednio lub prawie bezpośrednio ,,na wiązce” 
cząstek wywołujących reakcję. 


Synteza ciężkich pierwiastków 

Wszystkie pierwiastki transuranowe, tzn. pierwiastki 
leżące w tablicy Mendełejewa za uranem (Z > 92), 
otrzymano sztucznie. W naturze one nie występują, 
gdyż czas ich życia (czas połowicznego rozpadu) 
jest znacznie mniejszy od wieku Ziemi. Większość 
synteza z nich otrzymano po raz pierwszy w reakcjach z jo- 
trans- nami. Mianowicie pluton (Z = 94) otrzymano w reak- 
uranowców cjach z deuteronami, a kiur (Z = 96), berkel (Z = 97), 
kaliforn (Z = 98) i mendelew (Z = 101) — w reak¬ 
cjach z cząstkami a (tzn. jądrami 4 He). Dalszych 
pierwiastków me można było już otrzymać za pomocą 
lekkich jonów, gdyż nie dysponowano i nadal się nie 
dysponuje dostatecznymi ilościami pierwiastków 
cięższych niż einstein do sporządzenia tarczy. Ko¬ 
nieczne zatem było i jest stosowanie ciężkich jonów. 
Tak np. nobel otrzymano w reakcjach 

*}{Cm+ ł JC 102 No4-4 i*, 

^U+ 2 gNe-> 2 SSNo+6Jrt, 


a pierwiastek o liczbie atomowej Z = 106, ostatni 
z otrzymanych dotychczas — w reakcjach 

2 «Cf+ x |0-, 2 S 3 6 X+4Jrt, 

2 8 0 ?Pb+IlCr-?>;X+3Jrt 

(symbolem X oznaczyliśmy pierwiastki nie mające 
jeszcze uzgodnionej nazwy lub w ogóle jeszcze nie 
znane). 

Obecnie trwają próby nad syntezą pierwiastków 
107 i 108 oraz tzw. pierwiastków superciężkich. Wed- synteza 
ług przewidywań teoretycznych pierwiastki super- pierwiast- 
ciężkie powinny tworzyć wyspę nuklidów o pod wyż- ków super- 
szonej trwałości wokół nuklidu 2 f®X, miałyby więc ciężkich 
o ok. 40 nukleonów więcej niż najcięższe znane do¬ 
tychczas jądro (tj. jądro JgSX; ° czasie życia 0,9 s). A 
zatem i własnościami prawdopodobnie bardzo by się 
różniły od znanych jąder, wobec czego stanowią nie¬ 
zwykle interesujący obiekt badań. 

Obecnie próbuje się otrzymać te jądra za pomocą 
wiązki jonów 48 Ca, np. w reakcji 

2 55Cm-f*oCa --> fJJX-{-2Jrt. 

Duża użyteczność jonów 48 Ca polega głównie na 
dwóch ich własnościach. Pierwsza — to że są one 
bogate w neutrony, co pozwala dostać się za ich 
pomocą stosunkowo blisko środka wyspy jąder su¬ 
perciężkich, a więc do jąder najtrwalszych. Druga — 
to że są one szczególnie silnie związane (są to bowiem 
jądra podwójnie magiczne), co sprzyja stosunkowo 
niskiej energii wzbudzenia wytworzonego za ich po¬ 
mocą jądra superciężkiego. Daje to większe szanse 
przejścia tego jądra do stanu podstawowego, w któ¬ 
rym jest najtrwalsze, i uniknięcia tym samym szyb¬ 
kiego rozpadu ze stanu wzbudzonego. 


Wzbudzanie stanów o wysokim spinie 

Duża masa, pęd, a także spore rozmiary ciężkiego 
jonu sprawiają, że może on tworzyć z jądrem tarczy 
układ o bardzo dużym momencie pędu, nieosiągalnym 
w reakcjach z lżejszymi cząstkami. Na przykład jon 
20 Ne o energii 10 MeV/nukleon może z jądrem tar¬ 
czy 197 Au utworzyć układ o momencie pędu do ok. 

110 jednostek h. Dla porównania—jon deuteronu 
o tej samej energii na nukleon, z takim samym jąd¬ 
rem 197 Au może utworzyć układ o spinie tylko do ok. 

8/r. 

Interesujące są tu dwa zagadnienia. Jedno — to 
wyjaśnienie, co się dzieje z dużym momentem pędu 
ruchu względnego, jaka jego część jest przekazywana 
ruchowi wewnętrznemu zderzających się jąder i jak 
szybko. Jest to więc zagadnienie dyssypacji momentu dyssypacja 
pędu ruchu względnego — zagadnienie mechanizmu momentu 
przekazywania go wewnętrznym stopniom swobody pędu 
jąder. 

Z omówionego wyżej faktu istnienia spinu krytycz¬ 
nego wynika, że przy bardzo dużym momencie pędu 
część momentu pędu, która nie zdąży ulec dyssypacji 
w czasie reakcji, może (wskutek sił odśrodkowych, 
które wywołuje) nie dopuścić do utworzenia się jądra 
złożonego. Drugie zagadnienie dotyczy własności sa¬ 
mego jądra złożonego. Interesujący jest mianowicie 
wpływ wysokiego spinu na te własności i na strukturę 
jądra. Stwierdzono np., że już przy stosunkowo nis¬ 
kich spinach (12-16ń) zachodzi gwałtowna zmiana 
momentu bezwładności jąder zdeformowanych. Zja¬ 
wisko to wiąże się z rozrywaniem par nukleonów 
przez szybki obrót jądra. Niszczenie korelacji par niszczenie 
zwiększa znacznie moment bezwładności i spowalnia kcreiacji 
przejścia elektromagnetyczne między odpowiednimi par 
stanami rotacyjnymi. Duży spin jądra ma także istot¬ 
ny wpływ na sposób jego rozpadu. Podwyższa np. 
prawdopodobieństwo emisji cząstki a w stosunku do 
prawdopodobieństwa emisji pojedynczego nukleonu, 
zwiększa także prawdopodobieństwo rozszczepienia 
jądra. 
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Inne zastosowania 

Omówimy tu tylko kilka spośród wielu zastosowań 
ciężkich jonów poza fizyką jądrową. Będą to zasto¬ 
sowania ich w dziedzinie ciała stałego, techniki, bio¬ 
logii i medycyny. We wszystkich ważne jest oddzia¬ 
ływanie powłoki elektronowej jonu z materią. 

Implantacja ciężkich jonów 

Naświetlanie dowolnego materiału wiązką ciężkich 
jonów jest bardzo dogodnym sposobem wprowadza¬ 
nia („wbijania”, implantacji) atomów dowolnego 
pierwiastka do materiału. Takie wprowadzanie in¬ 
nych, domieszkowych atomów pozwala zmienić w 
bardzo szerokim zakresie własności fizyczne materia¬ 
łu, szczególnie elektryczne i mechaniczne. 

Dogodność implantacji polega na jej prostocie 
i uniwersalności. W procesie tym nie odgrywają roli 
relacje chemiczne między pierwiastkami materiału 
naświetlanego i implantowanego. Możliwość bardzo 
dobrego ogniskowania wiązki ciężkich jonów (bar¬ 
dzo małe jej rozmiary poprzeczne, rzędu 1 mm, 
a niekiedy nawet 1 pm) oraz dokładnego doboru 
energii jonów (a więc dokładnego doboru głębokości 
ich implantacji) pozwala na precyzyjne sterowanie 
geometrią wprowadzanych domieszek. Dzięki temu 
można w naświetlanej próbce — nawet przy minia¬ 
turowych jej rozmiarach — wytwarzać dosyć złożone 
i jednocześnie precyzyjne struktury geometryczne 
o kompleksowych własnościach elektrofizycznych. 
Ponadto, implantację można przeprowadzać przy 
stosunkowo niskich temperaturach, a niepożądane 
uszkodzenia struktury naświetlanej próbki możia 
usunąć przez podgrzanie do niezbyt wysokiej tempe¬ 
ratury. Pozwala to, dzięki uniknięciu silnych pod- 
grzewań, wpływać na własności próbki w sposób 
dobrze kontrolowany. 

Jeśli chodzi o zastosowanie implantacji na skalę 
przemysłową? istotny jest fakt, że proces ten można 
całkowicie zautomatyzować i osiągać prawie dokładną 
powtarzalność własności wytwarzanych materiałów. 
Stosując implantację uzyskuje się istotne polepszenie 
własności tranzystorów i innych układów półprze¬ 
wodnikowych. Np. naświetlanie jonami boru, fosforu, 
tantalu i in. pierwiastków znacznie poprawia własno¬ 
ści krzemowych i germanowych detektorów półprze¬ 
wodnikowych, stosowanych w fizyce jądrowej. 

Implantacja pozwala także na wytworzenie stopów 
o niezwykłych własnościach mechanicznych i ter¬ 
micznych, trudnych lub niemożliwych do wytworze¬ 
nia innymi metodami. Wymagane własności stopu 
Otrzymuje się najczęściej już przy bardzo nieznacz¬ 
nych dodatkach odpowiednio dobranych domieszek. 
Zachęcające są wstępne wyniki stosowania implan¬ 
tacji w badaniach nad zagadnieniem wytwarzania 
nadprzewodników wysokotemperaturowych. Inte¬ 
resująca jest też możliwość zastosowania tej metody 
do wytwarzania światłowodów w układach optyki 
zintegrowanej. Światłowód może być wykorzystywa¬ 
ny do szybkiego przekazywania dużej ilości infor¬ 
macji. 

Modelowanie uszkodzeń radiacyjnych 
w materiałach reaktorowych 

Szybkie neutrony emitowane przy rozszczepieniu 
jądrowym w reaktorze powodują uszkodzenia radia¬ 
cyjne w materiałach konstrukcyjnych reaktora. 
Wybijają one mianowicie jądra z zajmowanych po¬ 
łożeń, wprowadzając zmiany w strukturze materiału. 
Zmiany takie należy uwzględnić przy projektowaniu 
reaktorów. 

Ponieważ ciężki jon oddziałuje z całym atomem, 
a nie tylko—jak neutron — z jądrem, jest on setki 
tysięcy lub nawet miliony razy efektywniejszy w wy¬ 

208 


woływaniu uszkodzeń radiacyjnych. Uszkodzenia 
powstające w materiałach reaktora dużej mocy w cią¬ 
gu kilku lat jego pracy można odtworzyć w ciągu 
kilku godzin przez naświetlanie próbki materiału 
wiązką ciężkich jonów. Próbka staje się przy tym 
mniej promieniotwórcza, co upraszcza badanie. Także 
łatwiejsza i dokładniejsza jest kontrola dawki promie¬ 
niowania, temperatury i innych parametrów. 

Filtry jądrowe 

Ciężkie jony mogą być wykorzystane jako „mikro- 
igły przekłuwające” cienką folię z materiału plastycz¬ 
nego, szkła czy miki. „Przekłucie” jest po prostu 
uszkodzeniem radiacyjnym, które po odpowiedniej 
obróbce chemicznej staje się wąskim kanalikiem, 
a cała naświetlana folia — subtelnym i precyzyjnym 
filtrem (tzw. filtr jądrowy). Średnica kanaliku zależy 
od rodzaju i energii jonu, materiału folii oraz od 
warunków obróbki chemicznej. Obecnie uzyskuje 
się filtry jądrowe o średnicy porów od 4 nm do 
kilkudziesięciu pm (tj. rzędu 10 4 nm). Rysunek 11 
pozwala porównać filtr chemiczny wysokiej jakości 
z filtrem jądrowym. Widać, że pierwszy ma otwory 
o różnych średnicach i nieregularnych kształtach, 
wskutek czego rozmiary przepuszczanych cząstek 
mają duży rozrzut. Filtr jądrowy natomiast ma otwo¬ 
ry o jednakowej niemal średnicy i o regularnym, 
kołowym kształcie. Ponadto istnieje możliwość pra¬ 
wie ciągłej zmiany średnicy w bardzo szerokich, jak 
podano wyżej, granicach. 



Rys. 11. Zdjęcie zwykłego filtru chemicznego o średniej efektyw¬ 
nej średnicy pora 0,45 pm (rys. a) oraz filtru jądrowego o śred¬ 
nicy pora 0,40 pm (rys. b), uzyskane za pomocą mikroskopu 
elektronowego 


filtr 

chemiczny 


filtr 

jądrowy 





radioterapia 


dane 
statyczne i 
dynamiczne 


Filtry jądrowe mogą być wykorzystywane np. do 
zimnej sterylizacji. Ponieważ bakterie mają roz¬ 
miary powyżej 0,5 pm, można je łatwo zatrzymać już 
za pomocą filtrów o średnicy kanalików 0,45 ]im. 

Zastosowanie w medycynie 

Podstawowym zastosowaniem wiązki ciężkich jonów 
w medycynie może być radioterapia, przede wszystkim 
niszczenie komórek nowotworowych. Wielką zaletą tej 
wiązki jest to, że pozwala ona na bardzo dobrą loka¬ 
lizację naświetlanego obszaru zarówno w kierunku 
poprzecznym (możliwość bardzo małych rozmiarów 
wiązki), jak i podłużnym (możliwość naświetlania 
tkanki niemal wyłącznie na żądanej głębokości). 
Można więc uniknąć niszczenia sąsiedniej, zdrowej 
tkanki w czasie naświetlania. Ani stosowane najczę¬ 
ściej w praktyce promieniowanie X i y, ani strumienie 
elektronów i neutronów nie dają możliwości dobrej 
lokalizacji podłużnej. Ilustruje to rys. 12, na którym 
porównane są rozkłady dawki (tj. wydzielonej e- 
nergii) promieniowania w wodzie w funkcji głębokości 
d przy różnych rodzajach naświetlania: promieniami 
y z 60 Co, neutronami o energii 14,6 MeV, mezonami 
7 i~ o energii 65 MeV i jonami 14 N o energii 278 MeV/ 
/nukleon. Widać, że promieniowanie* y i neutronowe 
nie dają w ogóle możliwości lokalizacji podłużnej, 
wiązka mezonów n~ (i podobnie protonów) daje już 
niezłą lokalizację, ale dopiero wiązka ciężkich jonów 
pozwala na lokalizację bardzo dobrą. 

J. Bartke Eksperymenty z jądrami cięższymi od wodoru przy¬ 
spieszonymi do bardzo wysokich energii , Post. Fiz. 24, 423 (1973); 
R. Broda, J. Wilczyński Perspektywy zastosowania ciężkich 
jonów w fizyce jądrowej , Raport no. 922/PL Instytutu Fizyki 
Jądrowej, Kraków 1976; Cyklotron ciężkich jonów U- 200 w In¬ 
stytucie Fizyki Doświadczalnej Uniwersytetu Warszawskiego 
(sprawozdanie z sympozjum), Jabłonna 1972; G.N. Flerow, 
W.S. Baraszenkow Zastosowanie wiązek ciężkich jonów. Post. 
Fiz. 27, 53 (1976); J. Grabowski Aktualny stan teorii reakcji 
jądrowych z ciężkimi jonami , Post. Fiz. 19, 257 (1968); P. Mar- 
MIER AND E. Sheldon Physics of nuclei and particles , v. 2, New 


York 1970; W. Rosiński lmplantacja jonów , Warszawa 1975; 
E. Ruchowska Synteza pierwiastka o Z = 106, Post. Fiz., 26, 
355 (1975); A. Sobiczewski, J. Żylicz Oddziaływanie ciężkich 
jonów z jądrami i synteza nowych pierwiastków , Post. Fiz., 27, 
171 (1976); A. Sobiczewski, Z. Sujkowski Europejska konfe¬ 
rencja fizyki jądrowej uprawianej z pomocą ciężkich jonów w Caen , 
Post. Fiz., 28, 189 (1977); J. Wilczyński Makroskopowe aspekty 
mechanizmu zderzeń ciężkich jonów z jądrami atomowymi , Raport 
no. 900/PL, Inst. Fizyki Jądrowej, Kraków 1975. 



Rys. 12. Zależność dawki promieniowania w wodzie od głębo¬ 
kości d, na której jest ona pochłonięta, przy różnych rodzajach 
promieniowania 


Spektroskopia jądrowa 

Andrzej Hrynkiewicz 


Wszystkie dane eksperymentalne dotyczące własności 
poziomów jądrowych oraz charakteru oddziaływań 
jądrowych są podstawą, na której opierają się kon¬ 
cepcje struktury jąder atomowych. Dane te można 
podzielić na dwie kategorie: 1) parametry statyczne 
stanów jądrowych, takie jak energie wzbudzenia, spi¬ 
ny i izospiny, parzystości i momenty elektromagne¬ 
tyczne oraz masy i rozmiary jąder, 2) wielkości cha¬ 
rakteryzujące dynamikę procesów jądrowych, jak cza¬ 
sy życia i typy rozpadu oraz przekroje czynne na od¬ 
działywanie jąder z cząstkami naładowanymi, neutro¬ 
nami i promieniowaniem elektromagnetycznym. 

Każda metoda umożliwiająca wyznaczanie wielko¬ 
ści charakteryzujących jądra atomowe jest więc meto¬ 
dą badania ich struktury. Tutaj omówimy tylko me¬ 
tody spektroskopii jądrowej, tj. metody, które po¬ 
zwalają wyznaczyć własności jąder promieniotwór¬ 
czych na podstawie emitowanego promieniowania. 

W ciągu wielu lat przedmiotem badań spektrosko¬ 
pii jądrowej były długożyjące nuklidy promienio¬ 
twórcze naturalne lub wytwarzane sztucznie. Długi 
czas życia nuklidów pozwalał transportować te 
źródła promieniotwórcze z miejsca ich wytworzenia 
do odległych nieraz laboratoriów wyposażonych 
w urządzenia spektroskopowe. 

Obecnie większość badań spektroskopowych wyko¬ 
nuje się przy użyciu aparatury pomiarowej ustawio¬ 
nej przy akceleratorach lub reaktorach jądrowych 
(-> Akceleratory cząstek naładowanych, Energia 
jądrowa), co pozwala dokonywać pomiary bezpośred¬ 
nio „na wiązce”, tj. badać krótkożyjące produkty 


reakcji jądrowych. Obiektami badanymi są w tym 
wypadku jądra, których rozpad następuje przeważnie 
w czasie krótszym niż 1 ns (10“* s). 

Spektroskopia jądrowa „na wiązce” rozszerzyła 
również w sensie jakościowym zakres badanych sta¬ 
nów jądrowych. Można badać stany o bardzo wyso¬ 
kiej energii wzbudzenia (niedostępne w rozpadach 
promieniotwórczych) oraz jądra mające znaczny nad¬ 
miar lub niedobór neutronów (w stosunku do nukli¬ 
dów występujących w przyrodzie). W pewnych 
eksperymentach wykorzystywane są prędkości od¬ 
rzutu produktów reakcji oraz orientacja ich spinów 
względem kierunku lotu bombardujących cząstek. 

W pracach spektroskopowych „na wiązce” szcze¬ 
gólne znaczenie ma również detekcja i spektrometria 
cząstek naładowanych i neutronów emitowanych 
w procesie reakcji jądrowej prowadzącej do wytwo¬ 
rzenia interesującego nas nuklidu. 


Spektroskopia elektronów 

Jądra atomowe emitują elektrony ujemne lub do¬ 
datnie w rozpadach i (-> Rozpady jąder ato¬ 
mowych). Niezależnie od tego elektrony są emitowa¬ 
ne z powłoki elektronowej atomu albo w wyniku bez¬ 
pośredniego przekazania im energii wzbudzenia jądra, 
czyli w procesie konwersji wewnętrznej (elektrony 
konwersji) lub też jako tzw. elektrony Augera, któ¬ 
rych emisja towarzyszy procesom wytwarzającym 
dziury w powłoce elektronowej. 


rozkład 
dawki 
w wodzie 


pomiary 
„na wiązce" 
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widma Podstawowym zadaniem spektroskopii elektrono- 
ev?srgetyczvse we J J est wyznaczanie widm energetycznych emitowa- 
©loktronów nych elektronów, tj. liczby elektronów w funkcji ich 



a) 


Na rys. 2 pokazany jest przekrój nowoczesnego spoktrometrj? 
spektrometru fi — urządzenia pozwalającego rejestro¬ 
wać widma energetyczne elektronów. Odpowiednie 
pole magnetyczne ogniskuje na detektorze elektrony 
wylatujące ze źródła (którym może być tarcza bom¬ 
bardowana przez wiązkę cząstek z akceleratora). Za¬ 
leżnie od natężenia pola magnetycznego do detek¬ 
tora trafiają elektrony o różnej energii. Zmieniając 
natężenie pola magnetycznego (przez zmianę na¬ 
tężenia prądu zasilającego elektromagnes) możemy 
wyznaczyć liczbę elektronów o różnych określonych 
wartoścach energii czyli, jak mówimy, „zdjąć” ich 
widmo energetyczne 

Typy spektrometrów fi różnią się między sobą transmisja 
transmisją i energetyczną zdolnością rozdzielczą, i zdolność 
Transmisją nazywamy stosunek liczby elektronów rozdzielcza 
o danej energii docierających do detektora do liczby 
elektronów o tej energii emitowanych przez źródło. 

W przypadku spektrometrów toroidalnych transmisja 
może przekroczyć nawet 20%. Zdolność rozdzielcza 
dana jest przez szerokość (w połowie wysokości) 



energia elektronów 

Rys. 1. Przykłady widm energetycznych elektronów, a) Widmi ciągłe elektronów rozpadu RaE, b) Widmo liniowe elektronów 
konwersji wewnętrznej izotopów złota wytworzonych w reakcji Pt(p, xn)Au 


widmo energii. Na rys. 1 pokazane są przykłady widma ciągłe- 
rozpadu fi £° elektronów rozpadu fi i widma liniowego elektro¬ 
nów konwersji wewnętrznej. W pierwszym przypadku 
widmo elektronów jest ciągłe, gdyż w rozpadzie fi e- 
misji elektronu towarzyszy emisja neutrina, które nie 
jest rejestrowane, a które unosi część energii rozpadu. 
Kraniec widma elektronów fi określa energię rozpadu, 
a z kształtu widma można wyciągnąć wnioski dotyczą¬ 
ce typu rozpadu, np. określić tzw. stopień wzbronie¬ 
nia rozpadu fi i uzyskać informację o zmianie spinu 
i parzystości jądra ulegającego rozpadowi, 
widmo Widmo elektronów konwersji (rys. Ib) wygląda 
elektronów zupełnie inaczej —jest to widmo liniowe. Poszczegól- 
konwersji ne „piki” w widmie odpowiadają dyskretnym warto¬ 
ściom energii emitowanych elektronów. Energia elek¬ 
tronu konwersji jest dana przez wzór 

E = E 0 —Ew, 

gdzie E 0 — energia przejścia jądra z wyższego na 
niższy poziom energetyczny, E w — energia wiązania 
elektronu na danej powłoce w atomie. Pomiar ener¬ 
gii elektronów konwersji pozwala znaleźć energię 
przejścia jądrowego E 0 , a z natężenia linii konwersji 
(z liczby elektronów w danym piku) można wniosko¬ 
wać o konkurencji między konwersją wewnętrzną 
a emisją fotonu promieniowania y, czyli wyznaczyć 
tzw. wyspółczynnik konwersji wewnętrznej. Jego 
wartość jak również stosunki natężeń elektronów 
konwersji pochodzących z różnych powłok elek¬ 
tronowych atomu są źródłem informacji o charakterze 
danego przejścia jądrowego E 0 , co z kolei także do¬ 
starcza danych o spinach i parzystości stanów jądro¬ 
wych. 
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Rys. 2. Schemat spektrometru & z podłużnym polem magnetycz¬ 
nym. Oznaczenia: Ci-C 5 cewki zasilające elektromagnes, J, 
N x i żelazne jarzmo i nabiegunniki, L osłona ołowiana, S źró¬ 
dło promieniotwórcze emitujące elektrony, G-M licznik elek¬ 
tronów Geigera-MOlIera. Liniami przerywanymi niebieskimi 
oznaczone są tory elektronów poruszających się po spiralach 
wokół osi spektrometru 

piku obserwowanego w widmie, odpowiadającego 
monoenergetycznym elektronom emitowanym przez 
źródło. Im lepsza jest zdolność rozdzielcza spektrome¬ 
tru (tzn. im węższe są piki w widmie), tym łatwiej mo¬ 
żemy rozróżnić dwie linie leżące blisko siebie. Zdol¬ 
ność rozdzielcza najbardziej precyzyjnych spektro¬ 
metrów osiąga 0,01% mierzonej energii elektronów. 
Na ogół spektrometry o dużej energetycznej zdol- 
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ności rozdzielczej mają małą transmisję i odwrotnie — 
dużej transmisji towarzyszy niska zdolność roz¬ 
dzielcza, toteż typ przyrządu pomiarowego powinien 
być dobierany odpowiednio do problemu, który należy 
rozwiązać. Obecnie w wielu eksperymentach spektro¬ 
metry magnetyczne są zastępowane półprzewodniko¬ 
wymi detektorami elektronów, które szczególnie 
w obszarze niskich energii elektronów mają zdolność 
rozdzielczą porównywalną ze zdolnością rozdzielczą 
spektrometrów magnetycznych. 


Spektroskopia promieniowania y 

Widmo promieniowania y emitowanego przez jądra 
atomowe jest widmem liniowym (rys. 3), gdyż przej¬ 
ściu jądra ze stanu wzbudzonego na niższy odpowia¬ 
da emisja fotonów o określonej energii. Liniowe jest 
również widmo promieniowania rentgenowskiego, 
którego emisja towarzyszy takim procesom jądrowym, 
jak wychwyt elektronu lub konwersja wewnętrzna. 


Metoda koincydencji w spektroskopii 
jądrowej 

Przy rozwiązywaniu wielu problemów spektroskopii 
jądrow-ej istotne znaczenie ma informacja o czaso¬ 
wych zależnościach emisji przez jądro różnego rodzaju 
promieniowania. Dobrym tego przykładem może być 
problem wyboru między dwoma wariantami rozpadu 
jądra przedstawionymi schematycznie na rys. 4. W obu 
wypadkach w widmie energetycznym zaobserwujemy 
piki odpowiadające fotonom y o energiach E x i £ 2 
i dopiero stwierdzenie, czy emisja fotonów E x i E 2 jest 
skorelowana w czasie (schemat 4a), czy też nie (sche¬ 
mat 4b), umożliwia rozstrzygnięcie, według którego 
schematu przebiegał rozpad. Aby stwierdzić, czy emisji 
fotonu E x towarzyszy (w granicach krótkiego prze¬ 
działu czasowego) emisja fotonu E 2 , należy wykonać 
pomiar koincydencyjny. Stosujemy w tym celu dwa 
detektory promieniowania y, z których jeden rejestruje 
fotony o energii E x , a drugi — fotony o energii E 2t 
następnie impulsy z obu detektorów kierujemy do 



numer kanału analizatora 

Rys. 3. Przykład widma energetycznego promieniowania y emitowanego z ta rczy strontu bombardowanej jonami ‘Li. Liczby nad pikami 
podają energię przejść y w keV 


Jednak pod pikami w widmie obserwuje się ciągłe tło, 
którego głównym źródłem jest rozproszenie promie¬ 
niowania na elektronach (przede wszystkim w zjawis¬ 
ku Comptona) zachodzące w detektorze lub w otacza¬ 
jących go materiałach. 

W spektrometrach y stosowane są detektory reje¬ 
strujące poszczególne fotony i wytwarzające impulsy 
elektryczne, których amplituda jest proporcjonalna 
do energii pochłoniętego fotonu. Widmo energe¬ 
tyczne promieniowania y, takie jak pokazane przykła¬ 
dowo na rys. 3, otrzymuje się za pomocą analizatora 
wielokanałowego, który sortuje impulsy zależnie od 
ich amplitudy. 

Najpowszechniej stosowanymi detektorami pro¬ 
mieniowania y są detektory półprzewodnikowe, prze¬ 
de wszystkim germanowe, które w porównaniu ze 
stosowanymi poprzednio licznikami scyntylacyjnymi 
mają znacznie lepszą (ponad 20-krotnie) energetyczną 
zdolność rozdzielczą. Szerokość piku uzyskiwanego 
za pomocą dobrego, dużego detektora germanowego 
wynosi 2-3 keV, co daje w obszarze mierzonych ener¬ 
gii kilku MeV względną zdolność rozdzielczą rzędu 
0,1%. Wydajność dużych detektorów germanowo- 
litowych (zależna od rozmiarów kryształu germanu) 
jest porównywalna z wydajnością liczników scyntyla¬ 
cyjnych. 


układu elektronicznego, zwanego układem koincyden¬ 
cyjnym. Zadaniem tego układu jest wysłanie impulsu 
wyjściowego tylko wówczas, gdy impulsy z detek¬ 
torów pojawiają się w momentach różniących się 
mniej w czasie niż tzw. czas rozdzielczy układu koin¬ 
cydencyjnego (może on wynosić np. 1 ps). W oma¬ 
wianym przykładzie pojawienie się wyjściowych 
impulsów koincydencji świadczy, że mamy do czynie¬ 
nia ze schematem rozpadu przedstawionym na rys. 4a. 

Stosując układ koincydencyjny o dostatecznie 
krótkim czasie rozdzielczym możemy wykonać po¬ 
miar średniego czasu życia r stanu pośredniego w roz¬ 
padzie 4a. W tym celu, między detektorem rejestru¬ 
jącym fotony E 2 i układem koincydencyjnym umiesz¬ 
czamy linię opóźniającą, która pozwala opóźniać 
dojście impulsu o określony odstęp czasu. Mierząc 
szybkość zliczeń koincydencji N w zależności od wpro¬ 
wadzonego opóźnienia T otrzymamy krzywą pokaza¬ 
ną na rys. 5, której nachylenie w skali logarytmicznej 
jest związane ze średnim czasem życia stanu jądrowe¬ 
go t wzorem 

d(\nN) __1_ 

dT r ' 

Sporządzając więc wykres liczby zliczeń w skali loga¬ 
rytmicznej możemy bezpośrednio wyznaczyć czas 




*2 

2 

a) 


£2 


b) 

Rys. 4. Ilustracja 
zastosowania meto¬ 
dy koincydencji; 
dwa warianty sche¬ 
matu rozpadu: a) 
emisja dwóch foto¬ 
nów y w kaskadzie, 
b) emisja dwóch nie- 
skorelowanych fo¬ 
tonów y 
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życia r wzbudzonego stanu jądrowego. Przedstawiona 
metoda opóźnionych koincydencji, przy zastosowaniu 
odpowiednio szybko reagujących detektorów i no- 



Rys. 5. Przykład krzywej otrzymywanej w pom iarze śred¬ 
niego czasu życia stanu jądrowego metodą opóźnionych 
koincydencji 


pomiary woczesnych układów koincydencyjnych, pozwala do- 
czasów konywać pomiarów czasów życia krótszych nawet niż 
życia * S *,^Y pomiarach, które wymagają dużej czasowej 
zdolności rozdzielczej, stosowane są nadal liczniki 
scyntylacyjne, gdyż wytwarzane w nich impulsy są 
znacznie krótsze od impulsów z detektorów pół¬ 
przewodnikowych. 


źródło promieniotwórcze znajduje się w polu magne¬ 
tycznym skierowanym prostopadle do płaszczyzny, 
w której umieszczone są detektory, a jądro we wzbu¬ 
dzonym stanie pośrednim o czasie życia r ma moment 
magnetyczny /r. Wskutek oddziaływania momentu 
magnetycznego jądra z polem magnetycznym wystąpi 
precesja spinu jądra wokół kierunku pola, co spowo¬ 
duje obrót jądra w czasie życia t o kąt wynoszący 
średnio AB. Wywoła to przesunięcie wykresu funkcji 
korelacji kierunkowej (linia niebieska na rys. 6). 

Wyznaczenie tego przesunięcia pozwala obliczyć 
wartość oddziaływania jądra z polem magnetycznym, wyznaczanie 
a stąd moment magnetyczny stanu jądrowego. W wy- momentu 
padku, gdy w funkcji korelacji można pominąć wyraz magnetycz- 
zawierający ó 4 , krzywa przesunięta jest opisana wzo- nego 
rem 

W{Q,H)= \ + —=h cos2(ę-M), 

]/1+(2cot) 2 

gdzie AB = V 2 arc tg (2cot) 9 a co jest częstością precesji 
momentu magnetycznego jądra fi w polu magnetycz¬ 
nym o natężeniu H: 

co = fiHJIh. 

Jak widać pomiar przesunięcia kątowego A6 pozwala 
wyznaczyć moment magnetyczny fi pod warunkiem, 
że znane jest natężenie pola magnetycznego H, średni 
czas życia r danego stanu jądrowego i jego spin /. 


Metoda korelacji kierunkowych 
promieniowania y 

wyznaczanie Pomiar koincydencji między fotonami E x i Ą (rys. 4a) 
korelacji może być rozszerzony na pomiar kierunkowej za- 
kierunko- leżności emisji obu fotonów kaskady. Możemy ją 
wych wyznaczyć zmieniając kąt, jaki tworzą kierunki od 
źródła promieniotwórczego do detektorów, tzn. o- 
bracając jeden z detektorów wokół źródła i wyzna¬ 



czając dla każdego kąta szybkość zliczeń koincy¬ 
dencji (E u E 2 ) (rys. 6). Prawdopodobieństwo tego, 
że dwa fotony kaskady wylecą w kierunkach tworzą¬ 
cych kąt 6, czyli funkcja korelacji kierunkowej W(d) 
może być zapisana w postaci: 

W(Q) = l-fó 2 cos20-}-ó 4 cos40. 

przy czym współczynniki b 2 i b 4 zależą od spinów 
poziomów, między którymi zachodzi przejście, oraz od 
rodzaju (elektryczne czy magnetyczne) i multipo- 
lowości przejścia. Pomiar współczynników b 2 i b t 
pozwala więc uzyskać informacje o tych parametrach 
jądrowych. Typowy wykres funkcji korelacji kierun¬ 
kowej dla dwóch przejść elektrycznych kwadrupolo- 
wych między poziomami o spinach kolejno 4-2-0 
jest przedstawiony na rys. 6 (linia czarna). 

Metoda korelacji kierunkowych może być wykorzy¬ 
stana do wyznaczania momentów elektromagnetycz¬ 
nych wzbudzonych stan ów jądrowych. Przypuśćmy, że 
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Metoda pomiaru czasu życia stanów 
jądrowych oparta na efekcie 
Dopplera 

Metodą opóźnionych koincydencji, o której była 
mowa wyżej, nie można zmierzyć czasów życia sta¬ 
nów jądrowych żyjących krócej niż 10” 9 -10 -10 s. 
W obszarze krótszych czasów życia może być wy¬ 
korzystana metoda oparta na zjawisku Dopplera, któ¬ 
ra jest z pewnością dobrze znana Czytelnikowi z dzie¬ 
dziny akustyki. Również w optyce częstość odbieranej 
fali elektromagnetycznej zależy od prędkości ruchu 
źródła względem obserwatora. Zmiana rejestrowanej 
przez obserwatora częstości Av dana jest wyrażeniem 

= ±v 0 v/c, 

gdzie v 0 — częstość fali emitowanej przez źródło 
spoczywające względem obserwatora, v — prędkość 
ruchu względnego, c — prędkość światła. Zmiana 
częstości jest dodatnia, gdy źródło i obserwator 
zbliżają się do siebie, a ujemna — gdy się oddalają. 
Ponieważ energia fotonu jest związana z częstością 
drgań: E — hv, to zmianie częstości odpowiada 
zmiana energii rejestrowanego fotonu 

AE = ±E 0 v/c . 

Opisany efekt może być wykorzystany do pomiaru 
czasu życia jądra, które w wyniku reakcji jądrowej 
doznało odrzutu i porusza się z prędkością wyno¬ 
szącą na ogół kilka procent prędkości światła. Ry¬ 
sunek 7 przedstawia zasadę takiego pomiaru. Jądra 
wytworzone w cienkiej tarczy wylatują z niej do 
próżni i po przebyciu drogi d są zatrzymane w folii 
hamującej. Detektor rejestruje fotony y emitowane 


wiązka 

cząstek 


jądra wzbudzone 


foton y emitowany przez 
spoczywające jądro 

bombardu¬ 

jących 


-«t d > 



j - — > 

foton y emitowany 
przez jądro w locie 




tarcza folia hamująca 

Rys. 7. Zasada pomiaru średniego czasu życia stanu wzbudzo¬ 
nego jądra metodą przesunięcia dopplerowskiego. Przykład 
przejścia 0,891 MeV w **Na 





















rozpraszanie 

elastyczne 


przez jądra wytworzone w stanie wzbudzonym. Jeżeli 
czas przelotu odcinka d jest znacznie dłuższy od śred¬ 
niego czasu życia danego stanu jądrowego, to niemal 
wszystkie fotony są wysyłane przez poruszające się 
jądra i mają wobec tego energię wyższą od E 0 o AE. 
Jeżeli natomiast czas przelotu jest znacznie krótszy od 
czasu życia r, to większość fotonów wysyłana jest już 
przez jądra spoczywające, zahamowane w folii, a wo¬ 
bec tego ma energię £ 0 . Zmieniając odstęp d między 
tarczą a folią hamującą obserwujemy w widmie 
energetycznym y zmianę natężenia dwóch pików prze¬ 
suniętych względem siebie o AE. Pierwszy z nich od¬ 
powiada fotonom y emitowanym przez jądra zaha- 



Rys. 8. Przykład widm promieniowania y dla różnych odleg¬ 
łości d między tarczą a folią hamującą 


mowane w folii (natężenie 7 0 ), drugi — fotonom emi¬ 
towanym przez jądra w locie (natężenie I v ) (rys. 8). 
Pomiar stosunku natężeń obu pików I v /I 0 w zależnoś¬ 


ci od odległości d pozwala obliczyć średni czas życia 
stanu jądrowego r ze wzoru 

A = 

Jo 

Metoda ta umożliwia pomiary czasu życia rzędu 
10“ n , a nawet 10 -12 s. 


Inne metody spektroskopii jądrowej 

W tak krótkim opisie nie sposób przedstawić całego 
bogactwa metod spektroskopii jądrowej. Oprócz 
pomiarów energii, natężeń i rozkładów kątowych pro¬ 
mieniowania jądrowego oraz czasów życia wzbudzo¬ 
nych stanów jądrowych można wymienić pomiary 
liniowej i kołowej polaryzacji promieniowania y t 
a także pomiary podłużnej polaryzacji elektronów 
rozpadu/?, tj. stopnia orientacji ich spinów w stosunku 
do kierunku lotu. Na wzmiankę zasługuje również wy¬ 
korzystanie zalet detekcji promieniowania jądrowego 
w pomiarach prowadzonych innymi metodami, jak 
np. metodą magnetycznego rezonansu jądrowego lub 
metodą rezonansu w strumieniu atomowym. Zastoso¬ 
wanie w tych metodach detekcji promieniowania ją¬ 
drowego umożliwia rejestrację pojedynczych jąder 
promieniotwórczych, a więc pracę z bardzo małymi 
ilościami badanych substancji. Korzystne okazało 
się również połączenie metod spektroskopii jądrowej 
z metodą orientacji jąder w bardzo niskich temperatu¬ 
rach. 

Należy także zwrócić uwagę, że metody spektro¬ 
skopii jądrowej znajdują dziś szerokie zastosowanie 
w badaniach własności materii skondensowanej (tzn. 
ciał stałych i cieczy), przy czym jądro atomowe 
w kryształach lub w cząsteczkach związków chemicz¬ 
nych odgrywa rolę mikroskopowego próbnika czułe¬ 
go na własności bezpośredniego otoczenia. 

K. Siegbahn 0-, y-Ray Spectroscopy , Amsterdam 1966; 
A. Strzałkowski Wstęp do fizyki jądra atomowego , Warszawa 
1978; Sz. Szczeniowski Fizyka doświadczalna , cz. 6, Warszawa 
1974. 


Fizyka jądrowa wielkich energii 

Przemysław Zieliński 


Fizyka jądrowa wielkich energii jest dziedziną z po¬ 
granicza fizyki cząstek elementarnych i fizyki jądro¬ 
wej. Zakres wielkich energii nie jest sprecyzowany, ale 
orientacyjnie przyjmuje się, że chodzi o oddziaływania 
z jądrami cząstek mających energię kinetyczną po¬ 
wyżej 1 GeV (1 gigaelektronowolt — 1 TO 9 elektrono- 
woltów). Jest to energia, która przekazana np. jądru 
o liczbie masowej A ok. 100, spowodowałaby, że 
wszystkie nukleony oddaliłyby się od siebie (odpowia¬ 
da to całkowitej energii wiązania tego jądra). Pierwot¬ 
nie w zakres fizyki jądrowej wchodziła również 
fizyka cząstek elementarnych, która w ostatnich dzie¬ 
sięcioleciach rozwinęła się w dyscyplinę samodzielną. 


Rodzaje oddziaływań 

Wymieniony powyżej przykład oddziaływania jest 
bardzo rzadki. Na ogół oddziaływanie powoduje ro¬ 
zerwanie tylko części wiązań nukleonów w jądrze. 
Występują rozmaite rodzaje oddziaływań. Najbar¬ 
dziej charakterystyczne z nich ilustruje schematycznie 
rys. 1. 

Rozpraszanie elastyczne (rys. la) jest procesem 
wyjątkowo prostym. Obie cząstki, zarówno cząstka 
padająca, jak i jądro-tarcza, pozostają w stanie 
podstawowym. Proces ten bardzo dobrze opisuje te¬ 
oria wielokrotnego rozpraszania Glaubera, którą 


rozwinęli m.in. fizycy polscy, a szczególnie prof. Wie¬ 
sław Czyż. Jeżeli cząstka padająca nieznacznie zmieni 
swój pęd (przypadek najczęstszy), to przeważa oddzia¬ 
ływanie z pojedynczym nukleonem, przy większych 
zmianach pędu należy uwzględnić kolejne rozprasza¬ 
nie na dwóch, trzech itd. nukleonach (stąd nazwa 
teorii). Rozkład prawdopodobieństwa rozproszenia 
cząstki pod różnymi kątami przypomina obraz dyf¬ 
rakcyjny promieni świetlnych na kuli i, w przypad¬ 
ku jąder ciężkich, teoria wielokrotnego rozpraszania 
wyjaśnia przewidywania modelu optycznego stosowa¬ 
nego do opisu reakcji jądrowych dla małych i po¬ 
średnich energii (-* Reakcje jądrowe). 

Spójna produkcja cząstek (rys. Ib) jest charaktery¬ 
stycznym procesem występującym wyłącznie w obsza¬ 
rze wielkich energii. Cząstka padająca „dysocjuje” 
w polu jądra (np. proton „dysocjuje” na proton i dwa 
mezony n), przy czym jądro bombardowane pozostaje 
w stanie podstawowym. Ten ciekawy proces, mało 
jeszcze zbadany, jest obecnie przedmiotem wielu 
prac eksperymentalnych i teoretycznych. 

Procesy nieelastyczne są bardzo rozmaite. Na rys. 
lc przedstawiono schematycznie prosty proces, 
w wyniku którego z jądra bombardowanego emitowa¬ 
ny jest jeden fragment jądrowy (np. proton lub deu- 
teron). Reakcje tego typu badane są intensywnie 
szczególnie przy energiach rzędu 100 MeV, łatwiej 
dostępnych ze względu na dużą liczbę akceleratorów 
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cząstek pośrednich energii. Badanie tych reakcji przy 
wielkich energiach dostarcza nowych informacji 
o strukturze jądra, ilustruje to rys. 2. Cząstka o wielkiej 
energii związana jest ze znacznie krótszą falą de Brog- 
Iie*a zgodnie z relacją p = /t/A, gdzie p jest pędem 
cząstki, h — stałą Plancka, a X — długością fali 
i „widzi” — w przeciwieństwie do cząstki o malej 
energii — tylko małą część jądra bombardowanego 
(podobnie krótkie fale rentgenowskie służą do bada¬ 
nia szczegółów struktury sieci krystalicznej, które 
trudno zbadać za pomocą światła widzialnego, mają¬ 
cego znacznie większą długość fali), 
fragmentacja Oddziaływania nieelastyczne mogą mieć jeszcze 
jądra bardziej skomplikowany charakter. Jeżeli np. jądro 
bombardowane w wyniku zderzenia z cząstką padają¬ 
cą ulegnie rozbiciu na wiele części, to proces taki na- 



a) 





Rys. 1. Przykłady oddziaływań cząstki wielkiej energii z jądrem 
atomowym; a) rozpraszanie elastyczne, b) spójna produkcja czą¬ 
stek („dysocjacja” cząstki padającej), c) rozbicie jądra z emisją 
fragmentu jądra, d) rozbicie („fragmentacja”) jądra na wiele 
części, której na ogół towarzyszy wielorodna produkcja nowych 
cząstek (mezonów n, K itd.) 



a) cząstka padająca o wielkiej energii E k £ 1 GeV 


jądro bom 


fragment jądra 
bombardowanego 


bardowane 


b) cząstka padająca o małęj energii E k = 1 MeV 

Rys. 2. Schemat ilustrujący różnicę pomiędzy sposobem oddzia¬ 
ływania z jądrem cząstki o: a) małej, b) wielkiej energii 
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zywamy fragmentacją jądra (rys. Id). Procesy frag- 
mentacji jądra, mimo swojej złożoności, wykazują 
wiele regularności empirycznych (np. zbliżony do 
maxwellowskiego rozkład energii fragmentów), które 
jeszcze nie są wytłumaczone. 

Innym, bardzo złożonym procesem nieelastycz¬ 
nym, który często występuje w zderzeniach cząstki 
o wielkiej energii z jądrem, jest wielorodna produkcja 
cząstek. W wyniku tego procesu nie tylko zmienia się 
stan jądra bombardowanego, z którego wyemitowane 
mogą być zwykłe (składające się z nukleonów) frag¬ 
menty jądrowe, ale wyprodukowane są nowe cząstki 
(np. mezony n). Ogólny opis tego procesu jest bardzo 
złożony, ale i tu stwierdzono proste empiryczne re¬ 
gularności. Na przykład stwierdzono, że krotność 
cząstek wyprodukowanych w zderzeniu z jądrem, 
szczególnie kiedy ograniczymy się do małych kątów 
emisji, nieoczekiwanie mało różni się od krotności 
cząstek wyprodukowanych w zderzeniu proton-pro- 
ton. Analiza tych regularności przyczyni się do głęb¬ 
szego teoretycznego opisu zjawiska, badanego ostatnio 
niezwykle intensywnie. 


Znaczenie poznawcze 

Badanie typów oddziaływań cząstek wielkiej energii 
z jądrami jest źródłem informacji o cząstkach ele¬ 
mentarnych oraz jądrach atomowych. Wiele ważnych 
odkryć w fizyce cząstek elementarnych dokonano 
badając oddziaływania cząstek wielkich energii 
z jądrami (np. odkrycie mezonów n i K, hiperonów, 
hiperjąder i in.). Własności samych cząstek elementar¬ 
nych poznajemy jednak głównie badając wzajemne 
ich oddziaływania, chociaż wiele tych własności można 
zbadać również w oddziaływaniach jądrowych. Na 
przykład w ostatnich latach wielkie zainteresowanie 
fizyków wzbudziły obserwacje wielorodnej produkcji 
mezonów w oddziaływaniach proton-jądro. Wspom¬ 
niana już mała krotność produkcji mezonów inter¬ 
pretowana jest jako przejaw długiego okresu trwania 
oddziaływania, prowadzącego do powstania mezonów 
(cząstki te „nie zdążą się” wytworzyć wewnątrz jądra). 
Obecność innych nukleonów w jądrze może stać się 
w tym wypadku swoistym analizatorem niezwykle 
krótkich czasów (rzędu 10“ 23 s) oddziaływań, które nie 
są dostępne w badaniach bezpośrednich. W ten sposób 
można np. dowiedzieć się o pewnych własnościach 
krótkotrwałych stanów rezonansowych cząstek. 

Powyżej wspomniano o badaniu struktury i włas¬ 
ności jąder za pomocą cząstek o wielkich energiach. 
Jest to dodatkowe źródło informacji w stosunku do 
tej, której dostarcza nam badanie reakcji jądrowych 
o małych energiach. Niektóre jednak własności mate¬ 
rii jądrowej mogą być badane w warunkach ziemskich 
jedynie w oddziaływaniach o wielkich energiach. Na 
przykład w zjawisku fragmentacji jąder cząstka pada¬ 
jąca przekazuje jądru energię porównywalną z całko¬ 
witą energią wiązania. W ten sposób materia jądro¬ 
wa w czasie zderzenia zostaje doprowadzona do stanu, 
w którym w warunkach ziemskich nie występuje 
(z wyjątkiem bardzo rzadkich oddziaływań cząstek 
promieniowania kosmicznego z jądrami). Tego ro¬ 
dzaju ekstremalne stany materii jądrowej mogą istnieć 
jedynie we wnętrzu niektórych osobliwych ciał nie¬ 
bieskich (np. w gwiazdach neutronowych). A zatem 
w laboratorium na Ziemi za pomocą akceleratorów 
cząstek wielkich energii możemy wytworzyć i zbadać 
nowe, dotychczas niedostępne stany i własności 
materii jądrowej. Ostatnio niektórzy wybitni teoretycy, 
m.in. A. Migdał i T.D. Lee, wysunęli hipotezę, że 
w pewnych ekstremalnych warunkach wskutek zgęsz- 
czenia powstałego w wyniku zderzenia z cząstką 
o wielkiej energii materia jądrowa może przejść 
w zupełnie inny jakościowo stan (sięgając do analo¬ 
gii można posłużyć się przykładem lodu, który w od¬ 
powiednim zakresie temperatury i ciśnienia może wy¬ 
stąpić w odmianach allotropowych). 
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Badania oddziaływań jądrowych wielkich energii często jądra żelaza, a nawet jądra znacznie cięższe), informacje 
są pośrednim źródłem dalszych informacji o własno- Ich badanie umożliwia poznanie struktury ciał nie- z dziedziny 
ściach jąder. Mianowicie w zderzeniach jądrowych bieskich i własności przestrzeni kosmicznej. kosmologu 



numer kanału 


Rys. 3. Częstość występowania fragmentów jądrowych, emitowanych w oddziaływaniach protonów o energii 5 GeV z jądrami uranu. 
Na osi odciętej* podany jest numer kanału analizatora mierzącego straty energii w detektorach półprzewodnikowych, użytych dla iden¬ 
tyfikacji cząstek (wg A.M. Poskanzer i in. Physical Review Letters 17, 1271, 1966) 


o wielkiej energii powstają anomalne jądra ekstre¬ 
malne. Kiedy cząstka o małej energii pada na jądro, 
to w wyniku reakcj i jądrowej powstać może niewielka 
ilość różnych produktów końcowych. Jeżeli zwiększa¬ 
my energię cząstki padającej, to mogą zostać wypro¬ 
dukowane rzadkie lub zupełnie nowe jądra, które są 
dalekie od „ścieżki trwałości” (określonej stosunkiem 
ilości protonów do neutronów dla ustalonej liczby 
masowej jąder). Sytuację tę ilustruje rys. 3, na którym 
podane są wyniki identyfikacji niektórych produktów 
reakcji oddziaływania protonów o energii 5 GeV z ją¬ 
drami uranu. W doświadczeniu tym odkryto nowe jąd¬ 
ra n Li, 14 B, 15 B. Wyprodukowane i zarejestrowane w 
tym doświadczeniu jądro n Li składa się z trzech proto¬ 
nów i aż ośmiu neutronów, podczas gdy trwałe izotopy 
litu mają tylko trzy, cztery neutrony! Te anomalne 
jądra są źródłem nowych informacji o własnościach 
sił jądrowych. 

Źródłem interesującej informacji z dziedziny ko¬ 
smologii są oddziaływania jąder padających na 
Ziemię w postaci promieni kosmicznych. W promie¬ 
niowaniu kosmicznym występują oprócz protonów 
również cięższe jądra (wśród nich np. stosunkowo 


Wymienione przykłady ilustrują niektóre tylko 
wyniki badań w tej szybko rozwijającej się dziedzi¬ 
nie. W najbliższym czasie zasięg badań rozszerzy się 
w związku z tym, że kilka akceleratorów protono¬ 
wych (Dubna, Saclay, Berkeley) przyspiesza obecnie 
cięższe jądra do bardzo wielkiej energii. Na przykład relatywisty- 
w Berkeley w Stanach Zjednoczonych akcelerator czna fizyka 
„Bevatron” przyspiesza obecnie jądra lekkie (do jądrowa 
neonu) do energii 3 gigaelektronowoltów na nukleon, 
a synchrofazotron ZIBJ w Dubnej aż do energii 
5 GeV na nukleon. W ten sposób powstała nowa 
dziedzina fizyki — relatywistyczna fizyka jądrowa. 

X. Bartke Eksperymenty z jądrami cięższymi od wodoru przy¬ 
spieszanymi do bardzo wysokiej energii, Post. Fiz. 24,423 (1973); 

W. Czyż Rozpraszanie cząstek wysokich energii na jądrach ato¬ 
mowych w: Cząstki elementarne , Jądro atomowe , Promieniotwór¬ 
czość , W Hołdzie Marii Sklodowskiej-Curie y Warszawa 1967; 

A. Jachołkowski Zastosowania modelu Glaubera do opisu roz¬ 
praszania cząstek elementarnych i jąder atomowych w zakresie 
wielkich energii , Post. Fiz. 26, 167 (1975); M. Mięsowicz Fireball 
Model of Meson Production w Progress in Elementary Particie 
and Cosmic Ray Physics , ed J.G. Wilson, S.A. Wouthuysen, 
vol. 10, 103 (1971); M. Mięsowicz, R. Sosnowski Cluster pro¬ 
duction in high energy reactions , Nukleonika 20, 24 (1975); 

Nuklotron i relatiwistskaja jadiernaja fizika, Sbomik staticj, 

Dubna 1974 


Hiperjądra 

Jerzy Pniewski 


W latach trzydziestych sądzono, że protony i neutro¬ 
ny, nazywane nukleonami, są jedynymi składnikami 
jąder atomowych. Wraz z rozwojem fizyki cząstek 
elementarnych wykryto trzeci składnik, który daje 
się związać siłami jądrowymi z nukleonami w jedną 
strukturę stanowiącą nowy rodzaj materii jądro¬ 
wej. Jest nim hiperon A (lambda), a nowa struktura 
jądrowa, zawierająca poza nukleonami przynajmniej 
jeden hiperon A, zwana jest hiperjądrem. Hiper¬ 
jądra z powłokami odpowiednio obsadzonymi przez 


elektrony tworzą nowe izotopy znanych atomów. Hi¬ 
perjądra zostały odkryte w 1952 roku przez M. Da- 
nysza i J. Pniewskiego. 


Własności hiperjąder 

Neutron i hiperon A są cząstkami elektrycznie obo¬ 
jętnymi, zatem, tak jak w przypadku zwykłego ją¬ 
dra, o liczbie atomowej hiperjądra decyduje liczba 
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nomenklatu- jego protonów. Najprostsze hiperjądro, zawierające 
ra hiperjąder wszystkie trzy składniki (p , n, A) występujące poje¬ 
dynczo, jest hiperjądrem wodoru 3. Nazwy hiper- 
jąder wywodzą się od nazw odpowiednich pierwiast¬ 
ków chemicznych, mówimy więc o hiperwodorze 3 
lub hipertrycie. Jeśli do jądra helu 4, czyli cząstki a, 
dołączyć hiperon A , powstanie najczęściej spotykane 
hiperjądro — hiperhel 5. Przy zapisie hiperjąder 
korzysta się z oznaczeń typowych dla zwykłych jąder, 
zaopatrzonych dodatkowo w symbol hiperonu A. Na 
przykład: hipertryt—*H, hiperhel 5 He. Dotychczas 

zidentyfikowano 22 hiperjądra, czyli jednoznacznie 
wyznaczono ich liczby masowe i atomowe, od hiper- 
wodoru do hiperazotu (tabela). Stwierdzono istnienie 


Znane hipemuklidy 



Kropkami zaznaczono położenia hipernuklidów dotychczas nie 
obserwowanych (Z^8, /4^16), których istnienia można oczeki¬ 
wać na podstawie danych jądrowych (hipemuklidy zidentyfiko¬ 
wane za pomocą emulsji jądrowych w laboratoriach Europejskiej 
Współpracy K~). 

Systematyczne, wieloletnie badania własności hiperjąder prowa¬ 
dzone były przez międzynarodowy zespół laboratoriów zwany 
Europejską Współpracą K~. Współpraca ta ostatecznie skoncen¬ 
trowała się w laboratoriach w Belgradzie, Berlinie, Brukseli, Du¬ 
blinie, Londynie i Warszawie. Prace tego zespołu objęły całą te¬ 
matykę hipcrjądrową dostępną techniką emulsji jądrowych. 
W poszczególnych ośrodkach brał i w niej udział m.in.: D. H. Da- 
vis (Londyn), A. Montwill (Dublin), U. Krecker (Berlin), J. Sa- 
cton (Bruksela), J. Zakrzewski (Warszawa). Ogółem opubliko¬ 
wano blisko 100 prac, wiele z nich dotyczyło B A . 


ciężkich hiperjąder o masach zbliżonych do masy ato¬ 
mu srebra, a nawet większych. Nie udało się jednak 
ustalić ani dokładnych wartości ich liczb masowych, 
ani atomowych (J. Zakrzewski i inni — prace zespo¬ 
łowe od 1961). 

Z ogólnej liczby ponad 200 000 hiperjąder, indy¬ 
widualnie zaobserwowanych w emulsjach jądro¬ 
wych, zidentyfikowano kilkanaście tysięcy. Znane są 
dwa przypadki tzw. hiperjąder podwójnych, zawiera¬ 
jących po dwa hiperony A; są nimi hiperberyl 10 i hi¬ 
perhel 6: 

(°Be-łrA+A) - i^Be; ( a+A+A ) ^«He. 

, rozpady Hiperon A jest cząstką nietrwałą, rozpadającą się 
hiperjąder w wyniku słabych oddziaływań, ze średnim czasem 
życia 2,63 *10" 10 s. W rozpadzie tym traci dziwność, 
opisywaną przez liczbę kwantową S , której ujemne 
wartości stanowią charakterystyczną cechę wszyst¬ 
kich hiperonów. (Liczba kwantowa S cząstek nie- 
dziwnych, np.: nukleonów i pionów, jest równa 0. 
We wszystkich procesach wywołanych oddziaływania¬ 
mi silnymi bądź elektromagnetycznymi liczba S jest 
zachowana). Ponieważ różnica mas hiperonu A i nu¬ 
kleonu jest większa od masy mezonu 7t, istnieją dwa 
główne kanały rozpadu swobodnych cząstek A zwane 
mezonowymi: A p+7C + 37,75 MeV oraz A -* 

«-f7! 0 -i-41,06 MeV. Inne rozpady hiperonu A są 
niezwykle mało prawdopodobne i mogą tu nie być 
brane pod uwagę. Związanie hiperonu A w hiper- 
jądrze, mimo wydzielonej energii wiązania, nie za¬ 
hamowuje procesu jego rozpadu. Przeciwnie, słabe 
oddziaływania z nukleonami otwierają nowe kanały 
rozpadów niemezonowych, w których cząstka A tra¬ 
cąc dziwność zamienia się bezpośrednio w neutron: 
np : A-\~N —*■ n+N+ 176,0 MeV. W ten sposób wszys¬ 
tkie hiperjądra są nietrwałe — są one w pewnym sen- 
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sie promieniotwórcze, ich średni czas życia jest po¬ 
równywalny z czasem życia swobodnej cząstki A. 

Przykłady najczęściej spotykanych rozpadów hiper- 
helu 5: 


mezonowe 


jHe TC+p+o: +34,63 MeV, 

^He -* jT-f </+ 3 He+16,28 MeV, 
jHe -* a+37,94 MeV, 

^He -► w+a-f-172,91 MeV — niemezonowy. 


Charakterystycznym przykładem rozpadu hiper¬ 
jądra jest hiperjądro zidentyfikowane w emulsji jądro¬ 
wej, znalezione i rozpoznane po raz pierwszy w 1952 r. 


: ł 



pierwsze 

hiperjądro 


Rys. 1. Mikroskopowy obraz produkcji i rozpadu pierwszego 
hiperjądra zidentyfikowanego w fotograficznej emulsji jądrowej 
naświetlonej promieniowaniem kosmicznym (M. Danysz 
i J. Pniewski, 1952). Oznaczenia: p tor cząstki pierwotnej pro¬ 
mieniowania kosmicznego, A miejsce oddziaływania z jądrem 
bromu (lub srebra) napotkanym w emulsji fotograficznej, s pęk 
torów szybkich cząstek wtórnych, / tory fragmentów rozbitego 
jądra, h tor fragmentu hiperjądrowego, B miejsce rozpadu hiper¬ 
jądra 


w Warszawie (rys. 1). Jądrowe emulsje fotograficzne, 
ze względu na dużą przestrzenną zdolność rozdzielczą, 
umożliwiają analizę indywidualnych przypadków 
hiperjąder. Analiza kinematyczna rozpadów mezo¬ 
nowych z emisją mezonu n~ stanowi główną podstawę 
identyfikacji hiperjąder. 

W celu otrzymania hiperjądra należy stworzyć produkcja 
warunki do wyprodukowania hiperonu A , a następnie hiperjąder 
związania go w jądrze atomowym. Początkowo obser¬ 
wowano jedynie hiperjądra wytwarzane w zderzeniach 
cząstek promieniowania kosmicznego albo protonów 
i pionów wysokich energii uzyskiwanych z akcelera¬ 
torów protonowych wielkich energii. Jądra atomów 
wchodzących w skład emulsji fotograficznej stanowiły 
tarczę do produkcji hiperonów i materiał wyjściowy 
do uzyskania hiperjąder w formie hiperfragmentów 
jądrowych. Wydajność tego procesu w emulsji jądro¬ 
wej wynosiła około 0,1% wszystkich oddziaływań 
wielkich energii. Następnie zaczęto stosować znacznie 
bardziej wydajną metodę produkcji hiperjąder, jaką 
jest wychwyt zatrzymujących się mezonów K~ po¬ 
siadających tę samą dziwność S = —1 co hiperony A. 

Wydajność produkcji hiperjąder tą metodą w tarczy 
węglowej sięga 10%; w srebrze zaś przekracza 50% 
chwytanych mezonów K~. 



























dziwność Hiperjądrom należy przypisać tę samą dziwność 
hiperjąder S = — 1 co hiperonom A i mezonom K ~, natomiast 
hiperjądrom podwójnym (rys. 2) dziwność S = — 2. 



szawie przez zespół: M. Danysz, K. Garbowska, J. Pniewski 
T. Pniewski, J. Zakrzewski, 1962). 

Autorzy nie wykluczali możliwości interpretacji tego przypadku 
jako przykładu podwójnego hiperberylu 11, uważając ją jednak 
za mniej prawdopodobną. 

Oznaczenia: A miejsce oddziaływania mezonu K~ (1,5 GeV/c) 
i produkcji hiperonu 3~ t B miejsce wychwytu hiperonu przez 
lekkie jądro emulsji (C, N, O) i produkcji hiperjądra ^Be, BC 
tor ^Be, C miejsce rozpadu j^Be, CD tor hiperjądra ^Be, D 
miejsce rozpadu jjBe, linie przerywane są torami mezonów 
K~ i n~ 

Hiperjądra podwójne mogą się tworzyć w reakcji 
wychwytu hiperonów E~ o dziwności S = —2 (np.: 
S~ + U C = *%Bc-\-d+n+\2 y 6 MeV). Inne cząstki o 
dziwności ujemnej pod wpływem silnych oddziaływań 
z nukleonami w szybkim procesie przekazują swą 
dziwność tworzącej się cząstce A, najlżejszemu z hi¬ 
peronów. W ten sposób poza nukleonami hiperony A 
mogą być jedynymi cząstkami wchodzącymi w skład 
materii typu jądrowego. Możliwość wiązania hipe¬ 
ronu A w materii jądrowej, powolny rozpad hipero¬ 
nów i mezonów K na cząstki oddziaływające silnie, 
mimo że produkowane były w szybkim akcie zderzenia 
takich cząstek, wreszcie stwierdzenie skojarzonej pro¬ 
dukcji hiperonów i mezonów K — stały się podstawą 
do wprowadzenia i ugruntowania pojęcia dziwności. 

Fizyka hiperjąder zajmuje się badaniem własności 
hiperjąder, oddziaływań hiperonów A z nukleonami 
oraz dostarcza pewnych informacji o nietrwałych 
zwykłych strukturach jądrowych. Najcenniejszą infor¬ 
macją uzyskiwaną z analizy kinematycznej rozpadów 
energia mezonowych hiperjąder jest energia wiązania hipero- 
wiązania nu A (B A ) y zdefiniowana jako energia potrzebna 
hiperonu A do usunięcia go z hiperjądra. Wartości Ba rosną 
wraz z liczbą masową hiperjądra od (0,13±0,5) MeV 
dla iH do (13,59 ±0,15) MeV dla ”N sięgając 23 MeV 
dla znacznie cięższych hiperjąder (tabela). 


Energia wiązania hiperonu A w różnych hiperjądrach 


Hiper- 

jądro 

B At MeV 

Hiper- 

jądro 

B a% MeV 

Hipcr- 

jądro 

B a , McV 

aH 

0,13±0,05 

aBc 

5,16±0,08 

10 

aB 

8,89±0,12 


2,04±0,04 

aU 

6,80±0,03 

“b 

10,24±0,05 

A lic 

2,39±0,03 

J5bc 

6,84±0,05 


11,37±0,06 

aUc 

3,12 ±0,02 

a Li 

8,53±0,15 


11,69 ±0,12 

^Hc 

4,25±0,10 

> 

6,71 ±0,04 


12,17±0,33 

& 

5,58±0,03 

> 

7,88±0,15 

Ł JSN 

13,59±0,15 


Ciężkie hiperjądra obserwowane w emulsji fotograficznej: 
B A ^23 MeV (wg danych uzyskanych przez laboratoria Europej¬ 
skiej Współpracy K~. Energie B A wyznaczone wg programu opra¬ 
cowanego przez W. Gajewskiego). 


W przypadku rozpadów niemezonowych emisja 
nierejestrowanych w emulsji neutronów czyni te 
rozpady na ogół mało przydatnymi do identyfikacji 
i badania własności hiperjąder. Hipertryt rozpada się 
mezonowo niemal w 100%, w tym w 2 / 3 z emisją 
mezonu naładowanego. W przypadku bardzo cięż¬ 
kich hiperjąder dominują rozpady niemezonowe 


(> 99%). Wartości Ba wyznaczone dla różnych 
hiperjąder są podstawą do badania ich struktury 
i trwałości oraz poznania oddziaływań cząstki A 
z nukleonami. 


Analiza oddziaływania hiperonu A 
z nukleonami oraz hiperonów A między sobą 

Hiperjądra o liczbie masowej A < 5 nazywane są hiperjądra 
5 -powłokowymi, co zgodnie z powłokowym modelem s- i p-powło- 
jądra atomowego odpowiada założeniu, że wszystkie kowe 
ich nukleony wraz z hiperonem A znajdują się w pow¬ 
łoce j. Pozostałe znane hiperjądra noszą nazwę 
p-powłokowych. Mają one zamknięte powłoki s dla 
nukleonów oraz pewną ich liczbę w powłoce p 
(p SJ2 lub p 1/2 ). Zakaz Pauliego nie wzbrania hiperono¬ 
wi A y jako cząstce różnej od protonu i neutronu, 
lokować się w powłoce zamkniętej dla nukleonów. 

Dopiero w podwójnym hiperjądrze ^He powłoka s 
jest zamknięta dla wszystkich trzech składników hi- 
perjądrowych. Cząstka A, wiązana kolejno z coraz 
cięższym rdzeniem jądrowym, może stale być loko¬ 
wana w najgłębszej powłoce s y co uzasadnia wzrost 
jej energii wiązania wraz z liczbą masową A aż do war¬ 
tości 23 MeV dla ciężkich hiperjąder obserwowanych 
w emulsji fotograficznej. W zwykłym jądrze związanie 
nowego nukleonu możliwe jest jedynie w jego ze¬ 
wnętrznej powłoce i nie prowadzi do wzrostu energii 
wiązania wraz ze wzrostem liczby A. Przedstawiając 
oddziaływanie hiperonu A z rdzeniem za pomocą 
uproszczonego średniego potencjału, mającego po¬ 
stać prostokątnej studni o szerokości zależnej od 
rozmiarów hiperjądra, można uzyskać w przybliżeniu 
właściwy związek B A z liczbą A. 

Dla kilku hiperjąder udało się wyznaczyć ich spiny 
na podstawie danych o względnej częstości wystę- 
wania różnych rozpadów mezonowych. Fakt, że 
spiny trzech najprostszych hiperjąder (^H, j[H, *He) 
równe są różnicy spinów ich rdzeni jądrowych i spinu 
cząstki A (odpowiednio: 1 / 2 =1— 0 = V 2 —V 2 , 

0 = */% — 7 2 ) wskazuje, że oddziaływanie hiperonu A 
z nukleonem w stanie singletowym (wypadkowy spin 
równy 0) dominuje nad oddziaływaniem trypletowym 
(wypadkowy spin równy 1). 

Energie wiązania hiperonu A w hiperjądrach zwier¬ 
ciadlanych: jjH (= p, 2w, A) i ^jHe (= 2/?, w, A) są 
nieco różne i wynoszą odpowiednio (2,04 ±0,04) 

MeV i (2,39 ±0,03) MeV. Poprawka na oddziaływanie 
kulombowskie dwóch protonów w J[He powiększa 
jeszcze tę różnicę. Wytłumaczenia należy szukać w ła¬ 
maniu tzw. symetrii ładunkowej w oddziaływaniu 
hiperonu A z nukleonem, tzn. występowaniu pewnej 
różnicy między oddziaływaniami An i Ap. 

Energia B A wyznaczona z rozpadu pierwszej 
cząstki A podwójnego hiperjądra ^Be jest o (4,3 ±0,4) 

MeV większa od wartości B A uzyskanej w drugim 
rozpadzie zwykłego już hiperjądra ®Be. Można stąd 
wnioskować, że oddziaływanie między hiperonami A 
w stanie, w jakim są związane w podwójnym hiper¬ 
jądrze, jest przyciągające. Zebrane dane o energii B A oddziały wa- 
umożliwiły ilościową charakterystykę oddziaływań nie An, Ap 
hiperonu A z nukleonami (m.in. zajmowali się tym: i AA 
R.H. Dalitz — od 1958 r., B.W.Downs, A.R. Bod- 
mer, R.C. Herndon, Y.C. Tang, A. Gal, J. Dąbrow¬ 
ski, A. Deloff). Ustalono w ten sposób, że w struktu¬ 
rach hiperjądrowych dominują przyciągające siły 
dwuciałowe AN y oraz że zasięg tych sił jest mniejszy 
od zasięgu sił występujących między nukleonami. 

Zakłada się, że w pierwszym przybliżeniu zasięgi te 
odpowiadają wymianie dwóch mezonów n, w od¬ 
różnieniu od wymiany jednego mezonu uważanej za 
dominującą w opisie oddziaływań między nukleona¬ 
mi. Dokładniejsza analiza wskazuje na bardziej 
złożony charakter badanych oddziaływań, m.in. 
zakłada się obecnie pewien udział sił niecentralnych 
oraz sił trzyciałowych typu ANN. Oczekuje się, że 
energia wiązania hiperonów A w przypadku stanów 
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wzbudzonych najlżejszych hiperjąder lub równoważna 
tej informacji znajomość energii wzbudzenia winny 
stanowić cenny element w analizie oddziaływań 
hiperonu A z nukleonami. 


Spektroskopia hiperjądrowa 

Duże intensywności wiązek mezonów jakie od 
1969 r. zaczęto uzyskiwać przy użyciu wielkich 
akceleratorów, umożliwiły zastosowanie do badań 
hiperjądrowych techniki licznikowej. W ten sposób 
udało się wykryć emisję fotonów y ze stanów wzbu¬ 
dzonych hiperjąder o liczbie masowej 4, co zapo¬ 
czątkowało badania hiperjądrowej spektroskopii y. 
Również metodami licznikowymi zaczęto identyfiko¬ 
wać i wyznaczać energie mezonów tt towarzyszących 
produkowanym hiperjądrom, co z kolei stworzyło 
podstawy dla spektroskopii hiperjądrowej innego 
typu, opartej na analizie energii mezonów iC. 
stany Podział fenomenologiczny stanów wzbudzonych 
wzbudzono hiperjąder na trzy grupy jest następujący: 
hiperjąder 1) stany rezonansowe o krótkim czasie życia roz¬ 


padające się w wyniku emisji cząstki ciężkiej, np. nu¬ 
kleonu; 



Rys. 3. Widmo energii kinetycznej mezonu irr z wyraźnie widocz¬ 
nym maksimum rezonansowym odpowiadającym stanowi rezo¬ 
nansowemu X ĄC*: lł C =» n-+]f C*, “C* (wg da¬ 

nych Europejskiej Współpracy K~, 1969) 



Rys. 4. Widmo mezonów n~ uzyskane przy użyciu techniki licz¬ 
nikowej dla dwuciałowej reakcji: K -+ ,# 0 = Maksima 

reprezentują widmo energetyczne ”0: a dwa stany wysokowzbu- 
dzonc (uznawane za rezonanse), b stan wzbudzony nicrezonan- 
sowy, c stan podstawowy. Obszar B A ^ 0 odpowiada możliwo¬ 
ści emisji hiperonu (wg B. Povh i inni, 1978) 
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2) stany wzbudzone zanikające wraz z emisją fo¬ 
tonu; 

3) stany izomeryczne o najdłuższym czasie życia, 
obserwowane gdy rozpad hiperonu konkuruje z emisją 
fotonu y lub nawet staje się od niej bardziej prawdo¬ 
podobny. 

Istnieją dane eksperymentalne wskazujące na moż- pierwszy 
liwość tworzenia się stanów wzbudzonych hiperjąder zaobserwo- I 
wszystkich trzech rodzajów. Pierwszym niewątpliwym wany stan 
przykładem stanu rezonansowego hiperjądra był rezonansowy 
stan wzbudzony ^C, powstający w dwuciałowej 
reakcji wychwytu mezonu K~ przez jądro węgla 12: 
tf-+ 12 C = W+^C*, ”C* - p+”B,“B - *-+“C. 

Produkcja stanu rezonansowego “C* (rys. 3) w proce¬ 
sie dwuciałowym zaznacza się wyraźnie w widmie to¬ 
warzyszących mezonów iC. Efekt ten zaobserwowano 
najpierw w emulsji jądrowej, a następnie wykryto 
przy użyciu licznikowego spektrometru pionów. 

Dalszy postęp prac prowadzonych techniką liczniko¬ 
wą doprowadził do odkrycia kilku nowych wysoko- 
wzbudzonych stanów i poznania na tej drodze nowych 
przedstawicieli struktur hiperjądrowych: hipertlenu 
16, hipersiarki 32, hiperwapnia 40 (B. Povh i inni, 

1975). Analiza reakcji dwuciałowych prowadzona 
za pomocą układu elektronicznego umożliwiła wy¬ 
krycie wielu stanów wzbudzonych (rys. 4), jednak w ten 
sposób, w odróżnieniu od techniki emulsyjnej, 
ustalony został jedynie fakt ich produkcji, natomiast 
nie śledzono ich rozpadów. Mimo to stany te uważa 
się za rezonansowe, zanikające w wyniku emisji hipe¬ 
ronu A czy nukleonu. 

W przypadku hipertlenu ł jO zaobserwowano dwa 
stany wysoko wzbudzone, jak również stan podsta¬ 
wowy tego hiperjądra oraz jeden ze stanów najpraw¬ 
dopodobniej zanikający w wyniku emisji fotonu y t 
mimo że tego fotonu również nie obserwowano. 

Wszystkie stany badane na tej drodze znalazły dobre 
uzasadnienie w powłokowym modelu jądra atomo¬ 
wego. Według tego modelu cząstka A powstająca 
z neutronu lokuje się w jednej z powłok jądrowych. 



0,5 1.0 1,5 2,0 MeV 

energia 


Rys. 5. Hiperjądrowa linia 1,09 MeV w widmie y uzyskanym 
z tarczy 7 Li naświetlonej zatrzymującymi się mezonami K~. 
Widoczna dodatkowo linia anihUacji pozytonów odpowiadająca 
energii 0,51 MeV (wyniki zespołu CERN-Heidelberg-Warszawa. 
A. Bamberger, M.A. Faessler, U. Lynen, H. Piekarz, J. Piekarz, 
J. Pniewski,B. Povh,H.G. Ritter, V. Soergel, 1971). W następnym 
eksperymencie wykonanym przez zespół CERN-Lyon-Warszawa 
linia ta została rozszczepiona na dwie przypisane JJH i * He (1979) 














a po usuniętym neutronie powstaje luka w zajmowanej 
przez niego powłoce. Wyniki te dostarczyły informacji 
o wielkości sprzężenia spinu hiperonu A z jego mo¬ 
mentem orbitalnym. 

pierwsza Pierwszą hiperjądrową linię (rys. 5), wyraźnie 
hiperjądrową występującą w widmie y, przypisano jednemu lub 
linia widma y jednocześnie obu hipeijądrom JJH i jJHe, tworzonym 
jako wzbudzone hiperfragmenty w następstwie wy¬ 
chwytu mezonów K~ w tarczach *Li i 7 Li. Wzbudze¬ 
nie tych hipeijąder daje się tłumaczyć modelowo jako 
wynik odwrócenia spinu cząstki A związanej z rdze¬ 
niem jądrowym 3 H lub 3 He. Ponieważ stwierdzono, 
że spiny J{H i ;}He w stanie podstawowym są równe 0, 
należy sądzić, że stanom wzbudzonym odpowiadają 
wartości spinów równe 1. Wyznaczenie energii wzbu¬ 
dzenia obu hiperjąder o masie 4 stanie się szczególnie 
ważnym ogniwem w analizie oddziaływań hiperonu A 
z nukleonami. Obecnie wydaje się, że obserwowana 
poprzednio linia 1,09 MeV powstała w wyniku na¬ 
łożenia się dwóch linii niezbyt od siebie odległych 
dających się przypisać obu hiperjądrom o masie 4. 
Może to stanowić przesłankę wskazującą na zbliżone 
wielkości sprzężenia spinu hiperonu A ze spinami 
protonu i neutronu. 

izomeria Hiperjądro ^ He jest przykładem hiperjądra, które — 

hiperjądrową jak się wydaje — ma izomeryczne stany wzbudzone. 

Wraz z rozpadem zachodzącym w stanie wzbudzo¬ 
nym wyzwolona jest energia wzbudzenia, o którą 


zmniejsza się wyznaczana energia wiązania hiperonu wzbudzenie 
A. Technika emulsyjna wydaje się z kolei być naj- izomeryczne 
lepsza do detekcji tych stanów. W przypadku ^He ^He 
o istnieniu takiego stanu można wnioskować na pod¬ 
stawie występowania odpowiedniego stanu wzbu¬ 
dzonego rdzenia hiperjądrowego będącego jądrem 6 He 
(M. Danysz, J. Pniewski, 1962). 

Dobra zdolność rozdzielcza widm y powinna umo¬ 
żliwić wykrycie nisko położonych stanów wzbudzo¬ 
nych hiperjąder, natomiast widma energetyczne to¬ 
warzyszących pionów wydają się być najbardziej 
przydatne do badania wyżej położonych stanów, 
przede wszystkim stanów rezonansowych, które po 
emisji nukleonu mogą prowadzić do powstania hiper¬ 
jąder lżejszych przez analogię do procesów jądrowych. 

Można oczekiwać, że dalszy rozwój fizyki hiperjąder 
będzie głównie oparty na badaniach spektroskopo¬ 
wych obu typów. Mimo podjętych bezpośrednich 
badań nad rozpraszaniem swobodnych cząstek A 
na protonach, fizyka hiperjądrową jest nadal głów¬ 
nym źródłem informacji o oddziaływaniach tych 
cząstek z nukleonami w obrębie małych energii. 

M. Danysz, J. Pniewski Delayed disintegration of a heavy 
nuclear fragment , Philos. Mag. 44, 348 (1953); D.H. Davis, 

J. SACTON Hypernuclear Physics , High Energy Physics, vol. 2, 
p. 365, New York 1967; J. Pniewski, J. Zakrzewski Hypernuclear 
spectroscopy: A new trend in hypernuclear physics , Nukleonika 
20, 43 (1975); J. Pniewski, D. Ziemińska Present status of exper - 
imental research of hypernuclei, Nukleonika 23, 797 (1978); 

J. Pniewski Początki fizyki hiperjąder. Post. Fiz. 30, 517 (1979). 


Energia jądrowa 

Janusz Mika 

W 1905 r. Albert Einstein sformułował szczególną 
teorię względności, która obaliła wiele niewzruszo¬ 
nych, jak się wydawało wówczas, poglądów w fizyce. 
Jednym z najbardziej rewelacyjnych wniosków wypły¬ 
wających z nowej teorii była równoważność masy 
i energii. Równoważność tę wyraża słynny wzór 
E = mc 2 Einsteina E = mc 2 . Masę należy więc traktować jako 
jedną z form energii, która może przechodzić w inne 
formy energii. 

Masa spoczynkowa układu związanego (jak krysz¬ 
tał, cząsteczka, atom, jądro atomowe) jest mniejsza 
od sumy mas spoczynkowych składników o wartość 
równoważną energii wiązania układu, czyli energii 
potrzebnej na całkowite rozdzielenie składników. 
Dlatego procesom tworzenia układów związanych 
towarzyszy wydzielanie się energii (np. energii che¬ 
micznej podczas spalania lub energii jądrowej podczas 
syntezy lekkich jąder). Energia wydziela się również 
przy przejściu układu ze stanu słabo związanego, 
tzn. o mniejszej energii wiązania na jeden składnik, 
w stan związany silniej (np. przy rozszczepieniu cięż¬ 
kich jąder). Ponieważ siły wiązania nukleonów w ją¬ 
drze są znacznie potężniejsze niż siły wiązania elek¬ 
tronów w atomie — energie wydzielające się w reak¬ 
cjach jądrowych są ok. milion razy większe od energii 
wydzielanych w reakcjach chemicznych (np. spalenie 
1 g węgla najwyższej wartości opałowej daje zaledwie 
ok. 36 kJ, a „spalenie” 1 g uranu — 86 GJ). 
energia O praktycznym wykorzystaniu energii zawartej 
jądrowa w postaci masy w jądrze atomowym, czyli o energii 
jądrowej można było mówić dopiero po przeprowa¬ 
dzeniu pierwszej reakcji jądrowej w skali makrosko¬ 
powej. 

Zjawisko rozszczepienia jąder uranu pod wpływem 
neutronów zostało odkryte w 1938 r. Stwierdzono, 
że w reakcji rozszczepienia jądro prawie zawsze dzieli 
się na dwa fragmenty i neutrony swobodne, przy czym 
średnio na jeden akt rozszczepienia przypada ich po¬ 
nad dwa. Dzięki temu pojawiła się możliwość uzy¬ 
skania łańcuchowej reakcji rozszczepienia w skali 
makroskopowej. Istotnie, już po czterech latach 
w Chicago zbudowany został pierwszy reaktor jądro¬ 


wy (atomowy), a wkrótce potem bomba jądrowa (ato¬ 
mowa). Po czterdziestu latach od odkrycia reakcji 
rozszczepienia znaczna część produkowanej w świecie 
energii elektrycznej pochodzi z reaktorów jądrowych. 

Z energią termojądrową pochodzącą z reakcji 
syntezy lekkich jąder mamy do czynienia na co dzień 
w postaci energii słonecznej. Na razie nie udało się 
jednak, mimo ogromnych wysiłków, zbudować 
reaktora termojądrowego, w którym reakcja syntezy 
zachodziłaby w sposób kontrolowany, chociaż skon¬ 
struowano bombę termojądrową o mocy tysiąc razy 
przewyższającej moc bomby atomowej (—► Energia 
termojądrowa). 


Reakcje jądrowe zachodzące 
w reaktorze 


Neutron, jako cząstka obojętna, odgrywa szczególną 
rolę w reakcjach jądrowych, ponieważ w przeciwień¬ 
stwie np. do cząstek a lub protonów wnikając do jądra 
nie musi pokonywać sił odpychania elektrostatyczne¬ 
go; neutrony o bardzo nawet małej energii kinetycznej 
mogą więc łatwo wywoływać reakcje jądrowe. Do 
najważniejszych reakcji jądrowych z neutronami za¬ 
chodzących w reaktorze należą: rozpraszanie spręży¬ 
ste, rozpraszanie niesprężyste, wychwyt radiacyjny 
i rozszczepienie (-* Reakcje jądrowe). 

Reakcja rozpraszania sprężystego nie przechodzi 
przez etap jądra złożonego i polega na zderzeniu neu¬ 
tronu z jądrem przy spełnieniu zasad zachowania 
energii kinetycznej i pędu. Rozpraszanie sprężyste 
zachodzi głównie na lekkich jądrach. 

W pozostałych trzech reakcjach pierwszy etap jest 
taki sam i polega na utworzeniu jądra złożonego. 
Rozpraszanie niesprężyste zachodzi w wypadku roz¬ 
praszania neutronów o dużych energiach (powyżej 
kilkuset keV) na ciężkich jądrach. Energia wzbudze¬ 
nia jądra złożonego jest wówczas na tyle duża, że na¬ 
stępuje powtórna emisja neutronu o energii niższej 
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niż energia neutronu padającego, a nadwyżka energii 
jest wypromieniowana w postaci kwantu y. W tej 
sytuacji nie jest zachowana energia kinetyczna. 

Jeśli energia wzbudzenia jest za mała, aby spowodo¬ 
wać wyrzucenie neutronu z jądra, w drugim etapie 
reakcji jądro przechodzi do stanu podstawowego wy- 
promieniowując kwant y, a w wyniku powstaje jądro 
o liczbie masowej o jeden większej. Jest to reakcja 
wychwytu radiacyjnego. 

Jeśli chodzi o reakcję rozszczepienia, to jak wynika 
z kształtu krzywej na rys. 1, wszystkie jądra o liczbie 
masowej większej niż 100 powinny, zgodnie z zasadą 

MeV 



liczba masowa wiązki A 


Rys. 1. Zależność wiązania nukleonu w jądrze od liczby masowej 
jądra (zob. też rys. 1 str. 175) 



Rys. 2. Deformacje kropli materii jądrowej w procesie rozszcze¬ 
pienia 


zachowania energii, ulegać spontanicznemu roz¬ 
szczepieniu. Dlaczego jądra takie występują jednak 
w przyrodzie, wyjaśnia model kroplowy (-* Modele 
jądrowe). Rysunek 2 przedstawia deformacje kropli 
materii jądrowej w procesie rozszczepienia, a rys. 3 — 
zależność energii potencjalnej jądra od kształtu kropli. 



Rys. 3. Zmiana energii potencjalnej jądra w procesie rozszcze¬ 
pienia; punkty A C E odpowiadają stanom kropli z rys. 2, 
R\ i R t oznaczają promienie fragmentów 


szczepieniu zgodnie ze schematem: rozszczepie- 

Jeżeli energia kinetyczna po- n *° 236 ^ 
chłoniętego neutronu jest równa zeru, to energia 
wzbudzenia jądra złożonego “‘U jest równa różnicy 
energii wiązania jąder “•U i *® 5 U, tj. ok. 6,8 MeV, 
podczas gdy energia krytyczna 236 U wynosi jedynie 
6,6 MeV. 

Obok m U drugim izotopem uranu występującym 
w przyrodzie jest 238 U, który stanowi 99,3% uranu 
naturalnego. Energia krytyczna M8 U wynosi 7,0 MeV, 
natomiast różnica energii wiązania jąder *® 9 U i 238 U próg roz- 
tylko 5,5 MeV. Tak więc minimalna energia kinetycz- szczepienia 
na neutronu potrzebna do rozszczepienia jądra 238 U, 
czyli tzw. próg rozszczepienia, powinna być równa 
1,5 MeV. Ze względu na przybliżony charakter przy¬ 
toczonego rachunku liczba ta nie jest dokładna, 
a w istocie, jak stwierdzono doświadczalnie, próg 
rozszczepienia “•U wynosi ok. 1,1 MeV, tzn. roz¬ 
szczepienie 238 U mogą wywołać neutrony, których 
energia kinetyczna jest co najmniej równa 1,1 MeV. 

Obok dwóch izotopów uranu występujących w sta¬ 
nie naturalnym istnieje wiele nuklidów rozszczepial¬ 
nych wytwarzanych sztucznie. Do najważniejszych 
z praktycznego punktu widzenia należy izotop plu¬ 
tonu 239 Pu, którego właściwości ze względu na roz¬ 
szczepienie są podobne do właściwości M *U. 

Reakcja rozszczepienia jądra uranu czy też innego 
pierwiastka rozszczepialnego prowadzi prawie zawsze 
do podziału jądra na dwa fragmenty o mniej więcej 
równych masach. Rozkład mas fragmentów rozszcze¬ 
pienia przedstawia rys. 4. Jak widać, liczby masowe 
większości jąder powstających z rozszczepienia są 



Rys. 4. Rozkład mas fragmentów rozszczepienia 


Z rysunków widać, że aby wywołać rozszczepienie, 
trzeba jądru dostarczyć energię równą co najmniej 
energii krytycznej (energii aktywacji), potrzebną na 
pokonanie krótkozasięgowych sił jądrowych. Energia 
krytyczna maleje wraz z liczbą masową jądra i osiąga 
zero przy liczbie równej ok. 260. Tak więc dopiero 
jądra o liczbach masowych większych niż 260 są rze¬ 
czywiście niestabilne ze względu na spontaniczne roz¬ 
szczepienie. 

Jądro pochłaniające neutron uzyskuje energię równą 
różnicy energii wiązania jądra złożonego i jądra poch¬ 
łaniającego neutron (energia ta jest w przybliżeniu rów¬ 
na energii wiązania na 1 nukleon w powstałym jądrze 
złożonym) powiększoną o energię kinetyczną padają¬ 
cego neutronu. Jeśli energia krytyczna jądra złożone¬ 
go jest mniejsza niż energia wiązania na 1 nukleon, 
wówczas rozszczepienie można wywołać za pomocą 
neutronów o dowolnie niskich energiach. Taka sytua¬ 
cja zachodzi w wypadku jądra ** ł U, które ulega roz- 


zawarte pomiędzy 80 a 110 i pomiędzy 125 a 155. 
Obserwuje się również tzw. rozszczepienia potrójne, 
ale ich udział jest niewielki, tak że nie mają one 
istotnego znaczenia w łańcuchowej reakcji rozszcze¬ 
pienia. Jak wynika z rys. 5, w miarę zwiększania się 
liczby masowej rośnie stosunek liczby neutronów do 
liczby protonów w jądrach trwałych, tak że podział 
jądra na dwa fragmenty prowadzi do nadmiaru 
neutronów i emisji swobodnych neutronów w liczbie 
od 1 do 6 na jeden akt rozszczepienia. Średnia liczba 
neutronów rozszczepieniowych dla 235 U wynosi 2,44, 
jeśli neutrony, które wywołały rozszczepienie, miały 
energie 0,025 eV. Wraz ze wzrostem energii neutro¬ 
nów liczba ta rośnie i osiąga wartość 2,50 przy energii 
neutronów 1 MeV. Rozkład energii neutronów roz¬ 
szczepieniowych dla 235 U pokazuje rys. 6. Maksymalna 
energia neutronu równa się ok. 10 MeV, natomiast 
obliczona na podstawie tego rozkładu średnia energia 
wynosi ok. 2 MeV. Dla neutronów wtórnych pocho- 
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liczba neutronów 



Rys. 5. Zależność między liczbą neutronów i liczbą atomową 
nuklidów trwałych (ścieżka trwałości nuklidów) 



Rys. 6. Rozkład energetyczny neutronów pochodzących z roz¬ 
szczepienia 23 *U 


z jakim pojawiają się one w reakcji łańcuchowej, 
równe jest ok. 12,5 s. W skali procesów zachodzących 
w reaktorze jest to czas bardzo długi i neutrony opóź¬ 
nione odgrywają zasadniczą rolę w praktycznej reali¬ 
zacji łańcuchowej reakcji rozszczepienia. 

W reakcji rozszczepienia 235 U ok. 0,1% masy jądra 
zamienia się w energię dając ok. 200 MeV. Największa 
część tej energii przypada na energię kinetyczną frag¬ 
mentów rozszczepienia, reszta zaś na energię promie¬ 
niowania p i y. Podobne relacje liczbowe występują 
w odniesieniu do rozszczepienia innych jąder roz¬ 
szczepialnych. 

Bardzo ważną z praktycznego punktu widzenia rolę 
odgrywa zależność przekrojów czynnych od energii 
padającego neutronu. Dla większości nuklidów (wy¬ 
jątek stanowi wodór) przekrój czynny na rozprasza¬ 
nie sprężyste słabo zależy od energii i można go w 
praktyce uważać za stały. Natomiast przekrój czynny 


przekrój 
czynny 
na pochła¬ 
nianie 



Rys. 7. Zależność od energii neutronu przekroju czynnego kadmu 
i indu na pochłanianie neutronów 



Rys. 8. Przekrój czynny 2 ||U na pochłanianie neutronów 


dzących od innych jąder rozszczepialnych wartości 
parametrów są podobne. 

Emisja neutronów swobodnych w procesie roz¬ 
szczepienia nie wyczerpuje ich nadmiaru, tak że 
fragmenty rozszczepienia również zawierają zbyt 
wielką w stosunku do liczby protonów liczbę neutro¬ 
nów, w związku z tym są z reguły ^-promieniotwórcze, 
tzn. emitują elektrony. Poza tym niektóre fragmenty 
neutrony lub nuklidy powstające z fragmentów rozszczepienia 
opóźnione emitują neutrony. Że względu na to, że neutrony te 
nie są wydzielane w momencie rozszczepienia jądra, 
nazywają się neutronami opóźnionymi w przeciwień¬ 
stwie do pozostałych neutronów rozszczepieniowych, 
zwanych neutronami natychmiastowymi. Udział 
neutronów opóźnionych jest bardzo mały i w wypadku 
wynosi ok. 0,7%, natomiast średnie opóźnienie, 


na rozpraszanie niesprężyste (rys. 7) spada bardzo 
silnie wraz z energią i dochodzi do zera przy kilkuset 
keV; zależność od energii przekrojów czynnych na 
wychwyt radiacyjny i rozszczepienie jest podobna. 

Z tego względu wystarczy rozpatrywać sumę tych 
przekrojów, którą przyjęto nazywać przekrojem 
czynnym na pochłanianie. 

W zakresie od zera do ok. 0,1 eV energii neutronów 
przekrój czynny na pochłanianie neutronów maleje 
wraz z energią odwrotnie proporcjonalnie do pier¬ 
wiastka kwadratowego z energii. Od 0,1 eV do ok. 

1 keV rozciąga się zakres energii rezonansowych, 
w którym występują ostre maksima i minima. Szcze¬ 
gólnie silne pochłanianie rezonansowe neutronów pochłanianie 
obserwuje się na jądrach nuklidów rozszczepialnych, rezonansowe 
np. rys. 8 ukazuje przebieg całkowitego przekroju neutronów 
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czynnego 238 U. Wzrost przekroju czynnego na po¬ 
chłanianie neutronów o małych energiach i efekt 
rezonansowy mają poważne konsekwencje praktyczne 
w reaktorze jądrowym. 


Warunki pracy reaktora 
jądrowego 


Spowalnianie neutronów 

Przekrój czynny na rozszczepienie oy dla nuklidów 
rozszczepialnych rośnie bardzo szybko wraz ze 
zmniejszaniem się energii padającego neutronu. W wy¬ 
padku m U (rys. 9) przy energii neutronów 10 keV 



0.01 0.1 1.0 10 10 2 10 3 10 4 10 5 eV 
energia neutronów 


Rys. 9. Przekrój czynny 2 ||U i 2 ||U na rozszczepienie 


wynosi on 4 b, natomiast przy energii 0,025 eV — 
579 b(l b = 10" 28 m 2 ). Tak więc zmniejszając ener¬ 
gię neutronów wywołujących rozszczepienie można 
zwiększyć efektywność reakcji łańcuchowej. W związ- 
moderator ku z tym do reaktora wprowadza się moderator, 
którego zadaniem jest spowalnianie neutronów 
w reakcji rozpraszania sprężystego. Reakcja ta prze¬ 
biega podobnie jak zderzenie dwóch kul doskonale 
sprężystych. Przy zderzeniu sprężystym kula poru¬ 
szająca się (neutron) przekazuje część swej energii 
kinetycznej kuli nieruchomej (jądro). Ilość pokaza¬ 
nej energii zależy od kąta padania i średnio jest tym 
większa, im mniejsza jest masa kuli nieruchomej 
w stosunku do masy kuli ruchomej. Widać więc, że 
najefektywniej spowalnianie neutronów zachodzić 
będzie na lekkich jądrach. Dobry moderator musi 
spełniać poza tym dwa dodatkowe warunki. Po 
pierwsze, jego gęstość musi być dostatecznie duża (nie 
może on być np. w stanie gazowym), a po drugie, jego 
przekrój czynny na wychwyt neutronów musi być 
stosunkowo niewielki. 

W obecności moderatora proces spowalniania trwa 
dopóty, dopóki neutrony nie osiągną energii porów¬ 
nywalnych z energią ruchu cieplnego i nie znajdą 
się w równowadze termicznej z otoczeniem. O takich 



Rys. 10. Rozkład Maxwella prędkości neutronów; v p — pręd¬ 
kość najbardziej prawdopodobna, Va — prędkość średnia 


neutronach mówi się, że mają energię termiczną lub 
neutrony że są neutronami termicznymi. Rozkład energii neu- 
termiczne tronów termicznych możr a z dość dużą dokładnością 
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opisać za pomocą rozkładu Maxwella (rys. 10). W 
temperaturze 300 K średnia prędkość neutronów 
wynosi 2200 m/s, a średnia energia 0,025 eV. 


Bilans neutronów 

Warunki, w których może zachodzić w sposób sta¬ 
cjonarny łańcuchowa reakcja rozszczepienia z udzia¬ 
łem neutronów termicznych, przeanalizujemy na przy¬ 
kładzie nieskończonego układu materialnego, zawie¬ 
rającego jednorodną mieszaninę paliwa (np. uran na¬ 
turalny) i moderatora. Przyjmijmy, że w pewnej 
chwili w układzie znajduje się 5 swobodnych neutro¬ 
nów termicznych. Wprawdzie neutrony ulegają roz¬ 
padowi, jednak ich czas życia (rzędu 12 min) jest bar¬ 
dzo duży w porównaniu z czasem charakteryzującym 
łańcuchową reakcję rozszczepienia. Tak więc można 
uważać wszystkie neutrony termiczne w reaktorze za 
cząstki trwałe, które zostaną w rozpatrywanym 
układzie nieskończonym pochłonięte. 

Ponieważ pochłanianie w moderatorze prowadzi 
jedynie do wychwytu radiacyjnego, tylko fS neutro¬ 
nów liczy się w dalszym bilansie, gdzie/oznacza praw¬ 
dopodobieństwo pochłonięcia neutronu termicznego 
w paliwie, czyli tzw. współczynnik wykorzystania 
cieplnego. Zgodnie z definicją / jest zawsze mniejsze 
od jedności. Pochłonięcie neutronu w paliwie nie 
oznacza jeszcze, że wywoła on rozszczepienie. Jeśli 
a wyraża stosunek liczby neutronów powodujących 
rozszczepienie do liczby neutronów pochłoniętych 
w reakcji wychwytu radiacyjnego w paliwie, to osta¬ 
tecznie liczba rozszczepień wywołanych przez 5 
neutronów termicznych będzie równa a/5. Ponieważ 
w 1 akcie rozszczepienia powstaje średnio v neutro¬ 
nów rozszczepieniowych, to liczba neutronów wtór¬ 
nych przypadająca na 5 neutronów termicznych rów¬ 
nać się będzie va fS albo rjfS, gdzie rj = va oznacza 
średnią liczbę neutronów wtórnych na 1 akt pochło¬ 
nięcia w paliwie. 

Neutrony prędkie o energii większej niż 1,1 MeV 
mogą wywołać rozszczepienie 23B U (zob. rys. 8). Pro¬ 
wadzi to do zwiększenia liczby neutronów prędkich 
o tzw. współczynnik efektu prędkiego s, który z de¬ 
finicji jest większy lub co najmniej równy jedności. 
Tak więc całkowita liczba neutronów prędkich po¬ 
chodzących od 5 neutronów termicznych jest równa 
erjfS. 

Neutrony prędkie są spowalniane w moderatorze 
i mogą zostać pochłonięte w 238 U w zakresie energii 
rezonansowych. Jeśli przez p oznaczyć prawdopodo¬ 
bieństwo uniknięcia wychwytu rezonansowego przez 
neutrony o energiach wyższych niż energia termiczna, 
to ostatecznie całkowita liczba neutronów w pokole¬ 
niu następnym, pochodząca od 5 neutronów w poko¬ 
leniu poprzednim, równać się będzie perjfS. 

Iloczyn czterech czynników k = perjf nazywa się 
współczynnikiem mnożenia w układzie nieskończo¬ 
nym. Warunkiem tego, aby reakcja łańcuchowa prze¬ 
biegała w sposób stacjonarny, jest stała liczba neutro¬ 
nów w kolejnych pokoleniach, czyli k = 1. Wtedy 
mówi się, że rozpatrywany układ jest krytyczny. 
Gdy k < 1, to w kolejnych pokoleniach liczba neu¬ 
tronów maleje i reakcja łańcuchowa zanika, a układ 
nazywany jest układem podkrytycznym. Natomiast 
gdy k > 1, to liczba neutronów rośnie, a układ jest 
nadkrytyczny. Układ krytyczny może działać w za¬ 
sadzie przy dowolnej gęstości neutronów, a co za tym 
idzie — przy dowolnej mocy. 

W praktyce każdy układ fizyczny jest skończony 
i neutrony mogą uciekać poza jego granicę. Prawdo¬ 
podobieństwo uniknięcia tej ucieczki oznacza się 
zwykle przez P i do czterech czynników perjf trzeba 
dołączyć piąty; otrzymuje się w ten sposób tzw. efek¬ 
tywny współczynnik mnożenia w układzie skończo¬ 
nym k c t = Pperjf= Pk. Tak jak poprzednio — 
układ skończony jest podkry tyczny przy ket < 1, 
krytyczny przy ket = 1 i nadkrytyczny przy ket > 1 • 
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Dotychczas rozpatrywany układ składający się 
z jednorodnej mieszaniny paliwa i moderatora byłby 
z praktycznego punktu widzenia zupełnie nieprzy¬ 
datny. Zwykle w reaktorze paliwo rozmieszcza się 
w moderatorze w postaci regularnej siatki elementów 
paliwowych. Ponieważ w paliwie pochłanianie neu¬ 
tronów zarówno w zakresie energii termicznych jak 
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Rys. 11. Rozkład gęstości neutronów termicznych i rezonanso¬ 
wych w reaktorze niejednorodnym 


i rezonansowych jest znacznie silniejsze niż w mode¬ 
ratorze, to i gęstość neutronów jest mniejsza (rys. 11). 
Powoduje to zmniejszenie prawdopodobieństwa po¬ 
chłonięcia neutronu w paliwie, co pociąga za sobą 
zmniejszenie współczynnika wykorzystania cieplnego 
/ i zwiększenie prawdopodobieństwa uniknięcia wy¬ 
chwytu rezonansowego p. Ostatecznie jednak iloczyn 
pf w reaktorze niejednorodnym o odpowiednio do¬ 
branym stosunku ilości paliwa i moderatora może być 
znacznie większy niż w odpowiednim układzie jedno¬ 
rodnym. 

Dążenie do najkorzystniejszego bilansu neutronów 
w reaktorze nie jest główną przyczyną stosowania 
elementów paliwowych i struktury niejednorodnej. 
Po pierwsze, większość nuklidów powstających w pro¬ 
cesie rozszczepienia jest silnie radioaktywna i trzeba 
koniecznie izolować je od otoczenia (najwygodniej¬ 
szym rozwiązaniem jest paliwo otoczone szczelną 



Rys. 12. Przekroje elementów paliwowych: a) element wieloprę- 
towy; b) element płytkowy; c) element rurowy; d) element z płytek 
profilowanych 


koszulką metalową). Po drugie, w procesie rozszczepie¬ 
nia w paliwie wydziela się ciepło i trzeba je odprowa¬ 
dzać na zewnątrz reaktora. W tym celu przez reaktor 
przepuszcza się chłodziwo, które omywa elementy 
paliwowe, odbiera od nich ciepło i oddaje je poza 
reaktorem. Aby uzyskać jak najlepsze warunki od¬ 
bioru ciepła stosuje się elementy paliwowe o bardzo 
silnie rozwiniętej powierzchni (na rys. 12 pokazano 
przekroje takich elementów). 


Stany nieustalone reaktora 


Omówione już zostały warunki, w których można 
zrealizować stacjonarną reakcję łańcuchową rozszcze¬ 
pienia w układzie krytycznym. Zrozumiałą jest jed¬ 
nak rzeczą, iż w praktyce reaktor jądrowy często 
znajduje się w stanie podkrytycznym lub nadkrytycz- 
nym, choćby w związku z koniecznością jego urucha¬ 
miania i zatrzymywania, a więc trzeba zmieniać moc 
reaktora. 

Moc reaktora, w którym efektywny współczynnik 
mnożenia wynosi k e r, a średni czas życia jednego po¬ 
kolenia neutronów 2, w przybliżeniu rośnie lub ma¬ 
leje wykładniczo zgodnie z wzorem 


M(t) = 


gdzie M 0 oznacza początkową wartość mocy. Moc 
reaktora maleje lub rośnie tym szybciej, im bardziej 
ket różni się od jedności, dlatego też różnicę q = 
= ket— 1 przyjęto nazywać reaktywnością. Im więk¬ 
sza jest reaktywność danego reaktora (dodatnia lub 
ujemna), tym gwałtowniejsze zmiany mocy w nim 
zachodzą. 

Czas życia neutronów (przy pominięciu neutronów 
opóźnionych) w reaktorze, A (drugi parametr, który 
określa szybkość zmian mocy reaktora), zawarty jest 
w granicach 10“ 7 -10“ 3 s. Przy takich wartościach 
nawet niewielkie zmiany reaktywności powodowałyby 
tak gwałtowny spadek lub wzrost mocy reaktora, że 
w praktyce niemożliwa byłaby bezpieczna jego eksplo¬ 
racja. Udział neutronów opóźnionych zwiększa jed¬ 
nak czas życia neutronów o kilka rzędów, tak że X 
wynosi ok. 0,1 s, a to już umożliwia regulację reak¬ 
tora. 

Wzór na moc reaktora obowiązuje jedynie wtedy, 
gdy reaktywność q < 0,007, tzn. jest mniejsza od 
udziału neutronów opóźnionych. Po przekroczeniu 
przez reaktywność tej granicy, neutrony opóźnione 
przestają już praktycznie wpływać na przebieg reakcji 
łańcuchowej, a o zachowaniu się reaktora decydują 
jedynie neutrony natychmiastowe o bardzo krótkim 
czasie życia. Tak więc eksploatację reaktora trzeba 
prowadzić tak, aby nigdy reaktywność nie zbliżyła 
się do granicy 0,007. 

Zasadniczym czynnikiem regulującym pracę reakto¬ 
ra są sprzężenia temperaturowe, które polegają na 
tym, że wzrost mocy powoduje wzrost temperatury, 
ten z kolei wywołuje zmianę przekrojów czynnych, 
a co za tym idzie zmianę reaktywności. W większości 
reaktorów występują ujemne sprzężenia temperaturo¬ 
we i wzrost gęstości neutronów powoduje spadek 
reaktywności. Ujemne sprzężenie temperaturowe sta¬ 
nowi oczywiście naturalny czynnik stabilizujący pracę 
reaktora. 

W czasie normalnej eksploatacji reaktora zachodzą 
powolne zmiany parametrów jądrowych, związane 
z tworzeniem się produktów rozszczepienia oraz 
zmianą składu paliwa. Na ogół zmiany te powodują 
stopniowy spadek reaktywności. Dlatego też zwykle 
okres eksploatacji paliwa w reaktorze zależy od czasu, 
w ciągu którego reaktor staje się podkrytyczny. Nie¬ 
kiedy na okres ekpsloatacji wpływają również zmiany 
strukturalne zachodzące w paliwie. 

Produkty rozszczepienia często pochłaniają neu¬ 
trony, wywierają więc ujemny wpływ na reaktywność 
i z tego względu są nazywane truciznami. Rozróżnia 
się dwie grupy trucizn: stałe i przejściowe. Pierwsza 
grupa obejmuje kilkadziesiąt nuklidów trwałych 
i długożyjących, z których najważniejszy jest izotop 
samaru 149 Sm o przekroju czynnym na pochłanianie 
neutronów termicznych równym 5-10 4 b. W grupie 
trucizn przejściowych istotną rolę odgrywa właściwie 
jedynie izotop ksenonu 135 Xe, który odznacza się 
niezwykle dużym przekrojem czynnym na pochłania¬ 
nie neutronów termicznych (2* 10 6 b). Czas życia 
135 Xe wynosi 19,2 h, natomiast wydajność w procesie 
rozszczepienia ok. 6,3%. Z tego pewna część powstaje 
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bezpośrednio z rozszczepienia, reszta zaś w wyniku 
reakcji rozpadu: 


235t t i i„ rozszczepienie 

92 "T 0™ 


2433 13,8 Ł 


19,2 h 


Czas życia 135 Cs jest rzędu 3 • 10 6 lat, tak że z praktycz¬ 
nego punktu widzenia jest on nuklidem trwałym. 

Fakt, że 135 Xe powstaje głównie z rozpadu izotopu 
jodu 13B J, powoduje bardzo ważne z punktu widzenia 
eksploatacji reaktorów zjawisko tzw. jamy jodowej. 
Polega ono na tym, że po upływie określonego czasu 
nieprzerwanej pracy reaktora przy ustalonej mocy 
ilość ksenonu osiąga wartość nasycenia w wyniku 
ustalenia się równowagi pomiędzy powstawaniem 
jąder 135 Xe z rozpadu 135 J a ich przemianą w 136 Xe 
wywołaną pochłanianiem neutronów. Wzrost ilości 
ksenonu w reaktorze zmniejsza reaktywność, czyli 
wywołuje zatrucie. Nagle wyłączenie reaktora powo¬ 
duje wzrost zatrucia ksenonem, który w dalszym ciągu 
powstaje z rozpadu jodu, a nie jest usuwany z reaktora 
przez pochłanianie neutronów. Dopiero po upływie 
ok. 10 h po wyłączeniu zatrucie ksenonem zaczyna się 
zmniejszać wskutek rozpadu zarówno jodu jak i kse¬ 
nonu. Wielkość jamy jodowej zależy od mocy reakto¬ 
ra, a samo zjawisko występuje nie tylko przy wyłącze¬ 
niu, ale także przy zmianach mocy reaktora. 

Zmiany składu paliwa w czasie eksploatacji reak¬ 
tora polegają przede wszystkim na wypalaniu się 
nuklidów rozszczepialnych. Gdy paliwem jest uran 
naturalny lub wzbogacony izotopem 235 U, to stopnio¬ 
wo zmniejsza się koncentracja tego izotopu. Z drugiej 
strony pochłanianie neutronów w 238 U prowadzi do 
powstawania plutonu 239 Pu 


+ In ■ 


” 2 5?Np - 


l!Pu. 


Okazuje się, że jądro 238 Pu ma właściwości bardzo 
zbliżone do właściwości 235 U. Ma ono bardzo duży 
przekrój czynny na rozszczepienie pod wpływem neu¬ 
tronów termicznych, a średnia liczba neutronów 
rozszczepieniowych na 1 akt rozszczepienia wynosi 
2,91. Jest więc pluton doskonałym paliwem reaktoro¬ 
wym. 

Zjawisko powstawania nuklidów rozszczepialnych 
z materiałów rodnych, takich jak np. 238 U, charakte¬ 
ryzuje współczynnik przemiany paliwa określony jako 
stosunek liczby jąder uzyskanych nuklidów rozszcze¬ 
pialnych do liczby wypalonych jąder paliwa przy koń¬ 
cu okresu eksploatacji. W reaktorach termicznych 
z uranem naturalnym współczynnik przemiany się¬ 
gać może 0,7. Jeśli współczynnik przemiany jest 
większy od jedności, to zachodzi tzw. powielanie pali¬ 
wa. W praktyce powielanie paliwa udało się dotych¬ 
czas zrealizować jedynie w reaktorach prędkich. 

Oprócz cyklu uranowo-plutonowego istnieje rów¬ 
nież cykl torowo-uranowy, w którym nuklidem rod¬ 
nym jest 232 Th, a powstającym z niego nuklidem roz¬ 
szczepialnym pod wpływem neutronów termicznych 
jest 233 U. Cykl torowo-uranowy jest bardzo atrakcyj¬ 
ny* gdyż istnieje możliwość powielania paliwa również 
w reaktorach termicznych. 

Omówione wyżej zmiany izotopowe nie wyczerpują 
wszystkich zjawisk zachodzących w paliwie w czasie 
eksploatacji reaktora. Paliwo staje się mieszaniną wie¬ 
lu nuklidów z grupy aktynowców. Część z tych nukli¬ 
dów ma właściwości materiałów rodnych, a część — 
materiałów rozszczepialnych. 


Sterowanie reaktorem 


Metody sterowania polegają na zmianie objętości p rety 
paliwa, moderatora, reflektora lub substancji pochła- sterownicze 
niającej neutrony. W reaktorach termicznych naj¬ 
częściej stosuje się ruchome pręty sterownicze wyko¬ 
nane z materiałów silnie pochłaniających neutrony 
termiczne, takich jak kadm lub bor. Można je podzie¬ 
lić na trzy.grupy: 

1) Pręty bezpieczeństwa, wprowadzające do układu 
dużą reaktywność ujemną, służące do gwałtownego 
wyłączania reaktora. Są one połączone z mechaniz¬ 
mem napędowym — zwykle elektrycznym, lub też 
hydraulicznym albo pneumatycznym. Pręty bezpie¬ 
czeństwa w wypadku awarii spadają do rdzenia pod 
wpływem siły ciężkości. Aby przyspieszyć ich spada¬ 
nie mogą być zastosowane wyrzutnie stalowe lub ła¬ 
dunki wybuchowa. 

2) Pręty kompensacyjne, służące do zmniejszania 
reaktywności po wstępnym okresie eksploatacji paliwa. 

3) Pręty regulacyjne, powodujące niewielkie stosun¬ 
kowo zmiany reaktywności, służące do kompensacji 
przypadkowych odchyleń mocy reaktora od stanu 
równowagi, a także do uruchamiania i zatrzymywania 
reaktora (il. 43, tabl. 12). 

Często w reaktorach energetycznych zamiast prę¬ 
tów kompensacyjnych stosuje się trucizny, które wy¬ 
palają się w trakcie eksploatacji. Zjawisko pochłania¬ 
nia neutronów w prętach sterowniczych stosuje się 
również do wytwarzania nuklidów promieniotwór¬ 
czych. W reaktorach prędkich, ze względu na małe 
pochłanianie neutronów o dużych energiach, zwykle 
do sterowania reaktorem stosuje się ruchome ele¬ 
menty paliwowe łub ruchome części reflektora. 


Teoria transportu neutronów 
i obliczanie reaktorów 

Wyznaczenie wielkości określających efektywny 
współczynnik mnożenia oraz innych wielkości istot¬ 
nych z punktu widzenia eksploatacji reaktora wy¬ 
maga znajomości przekrojów czynnych i rozkładu 
neutronów w rozpatrywanym układzie. Pomiary prze¬ 
krojów Czynnych należą do dziedziny fizyki jądrowej, r 
natomiast do fizyki reaktorowej należą pomiary lub 
teoretyczne przewidywanie rozkładu neutronów. 

Opisu zachowania się swobodnych neutronów 
w ośrodku materialnym dostarcza dział fizyki staty¬ 
stycznej zwany teorią transportu neutronów. Pod¬ 
stawowym równaniem tej teorii jest liniowe równanie teoria 
Boltzmanna, które swą liniowość zawdzięcza założę- transportu 
ni u, że zderzenia pomiędzy neutronami są niezwykle neutronów 
mało prawdopodobne i można je pominąć. Poza tym 
zakłada się, że neutrony poruszają się zgodnie z za¬ 
sadami mechaniki klasycznej, a efekty relatywistyczne 
i kwantowe są pomijalne. 

Rozkład neutronów opisuje funkcja N(r y v, r) y 
w której argumentami są: wektor położenia neutronu 

r, wektor prędkości v i czas t. Jej sens fizyczny jest ta¬ 
ki, że N(r y v y t)ArAv oznacza średnią liczbę neutronów 
znajdujących się w chwili / w elemencie objętości Ar 
wokół punktu r o prędkościach zawartych w „ele¬ 
mencie” Av wokół prędkości v. Równanie Boltzmanna równanie 
wyraża bilans neutronów wchodzących i wychodzą- Boltzmanna 
cych z elementu ArAv i jest równaniem różniczkowo- 
-całkowym. 


Jak każde urządzenie wytwarzające energię, reaktor 
musi być wyposażony w układ sterowania, ponieważ 
stabilizujące działanie ujemnego sprzężenia tempera¬ 
turowego jest niewystarczające, a poza tym zachodzi 
konieczność uruchamiania i wyłączania, a także zmia¬ 
ny mocy reaktora. 


Stany statyczne reaktorów 

W rzeczywistych sytuacjach fizycznych rozwiązywa¬ 
nie równania Boltzmanna jest, nawet przy użyciu 
komputerów, bardzo uciążliwe; a niekiedy, przy ist¬ 
niejących możliwościach obliczeniowych, niewyko- 
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przybliżenie nalne. Z tego względu w obliczeniach reaktorowych 
dyfuzyjne stosuje się z reguły metody przybliżone. Do najważ- 
i wielo- niejszych z nich należą: przybliżenie ^dyfuzyjne, 
grupowe w którym zakłada się, że funkcja N(r y jv, t) zależy 

tylko od wartości bezwzględnej wektora v, tzn. tylko 
od energii neutronu, a nie od kierunku jego prędkości 
oraz przybliżenie wielogrupowe, w którym przyjmuje 
się, że energia neutronów może przybierać tylko war¬ 
tości dyskretne. 

Obliczenia reaktora jądrowego są wykonywane 
zwykle w kilku etapach za pomocą programów nu¬ 
merycznych na maszynę cyfrową, czyli tzw. kodów 
obliczenia reaktorowych. Pierwszy etap stanowią obliczenia 
komórkowe komórkowe. Polegają one na znajdowaniu uśrednio¬ 
nych parametrów charakteryzujących rozkład neutro¬ 
nów w komórce elementarnej reaktora niejednorod¬ 
nego. Przez komórkę elementarną reaktora rozumie 
się element paliwowy, tzn. paliwo wraz z koszulką, 
otoczone warstwą chłodziwa i moderatora. Dla 
uproszczenia obliczeń zwykle zakłada się, że komórka 
elementarna ma symetrię cylindryczną, a reaktor za¬ 
stępuje się układem nieskończonym składającym się 
z takich komórek. 

Obliczenia komórkowe są prowadzone w przybliże¬ 
niu wielogrupowym dla kilkudziesięciu grup energe¬ 
tycznych. Na ogół nie stosuje się przybliżenia dyfu¬ 
zyjnego, gdyż w komórce, która ma stosunkowo nie¬ 
wielki rozmiar i zawiera materiały silnie pochłaniające 
neutrony termiczne lub rezonansowe, prowadziłoby 
to do zbyt dużych błędów. W wyniku obliczeń ko¬ 
mórkowych otrzymuje się tzw. stałe wielogrupowe, 
charakteryzujące energetyczny rozkład neutronów 
uśredniony na cały obszar komórki, 
obliczenia Drugi etap, tzw. obliczenia widmowe, polega na 
widmowe redukcji kilkudziesięciu grup energetycznych do 
kilku (zwykle nie więcej niż czterech) przez odpowied¬ 
nie procedury uśredniania. W widmowych kodach 
reaktorowych uwzględnia się w sposób przybliżony 
to, że rozkład neutronów zmienia się od komórki do 
komórki. 

Na podstawie wyników obliczeń komórkowych 
i widmowych można określić czynniki wchodzące 
w skład wzoru na współczynnik mnożenia k. Tak 
więc obliczenia komórkowe i widmowe odpowiadają 
obliczeniu współczynnika mnożenia nieskończonego 
układu niejednorodnego. 

obliczenia Trzeci etap stanowią obliczenia krytyczne. Z reguły 
krytyczne polegają one na rozwiązywaniu układu równań dyfu¬ 
zyjnych dla kilku grup energetycznych przy użyciu 
stałych znalezionych w poprzednim etapie obliczeń. 
W wyniku otrzymuje się efektywny współczynnik 
mnożenia Ar e r. Tak więc obliczenia krytyczne w istocie 
rzeczy sprowadzają się do znalezienia prawdopodo¬ 
bieństwa uniknięcia ucieczki neutronów z układu, 
zestaw Obliczenia komórkowe, widmowe i krytyczne moż- 
wykładniczy na sprawdzać doświadczalnie na zestawach wykładni- 
i zostaw czych lub krytycznych. Zestawy takie zbudowane są 
krytyczny z takich samych materiałów co reaktor i mają tę samą 
strukturę komórki podstawowej. Zestaw wykładniczy 
ma zbyt małe rozmiary, aby osiągnąć stan krytyczny. 
Jego nazwa wynika stąd, że rozkład neutronów po¬ 
chodzących z umieszczonego w nim źródła ma charak¬ 
ter wykładniczy. Zestaw krytyczny jest właściwie reak¬ 
torem o bardzo małej mocy, w którym chłodzenie za¬ 
pewnia konwekcja naturalna powietrza lub wody. 
W związku z tym koszt budowy zestawu krytycznego 
jest znacznie niższy niż koszt budowy reaktora o peł¬ 
nej mocy, szczególnie reaktora energetycznego. Poza 
tym zestaw krytyczny może być łatwo przebudowany, 
co pozwala na sprawdzanie różnorodnych rozwiązań 
konstrukcyjnych reaktora. 

obliczenia Dalszym krokiem w obliczeniach reaktorowych są 
eksploata- obliczenia eksploatacyjne, których celem jest określe- 
cyjne nie, jak zmieniają się parametry reaktora, a przede 
wszystkim k c t, w miarę eksploatacji określonej porcji 
paliwa. Zwykle obliczenia eksploatacyjne polegają na 
wykonywaniu obliczeń krytycznych w kolejnych chwi¬ 


lach, połączonym z rozwiązywaniem równań różnicz¬ 
kowych opisujących zmiany składu paliwa i powsta¬ 
wanie trucizn. Dzięki obliczeniom eksploatacyjnym 
można wybrać optymalny sposób wymiany paliwa 
i przedłużyć czas jego przebywania w reaktorze, a w 
ten sposób obniżyć koszt eksploatacji. Ma to szczegól¬ 
ne znaczenie w reaktorach energetycznych. 
Dotychczas omawiane obliczenia dotyczyły stanów 
statycznych reaktora lub bardzo powolnych zmian 
zachodzących w czasie jego eksploatacji. Prcewidy- 
waniem zachowania się reaktora w stanach nieustalo¬ 
nych zajmuje się tzw. dynamika reaktorów. 


Dynamika reaktorów 

Jak już wspomniano, podstawowe równanie Boltz- 
manna opisujące zachowanie się neutronów w reakto¬ 
rze o niewielkiej mocy jest liniowe, gdyż nie zawiera 
członu opisującego zderzenia neutronów między so¬ 
bą. Dotyczy to również wszelkich równań przybliżo¬ 
nych, opisujących stany nieustalone reaktora o małej 
mocy. 

W reaktorze o większej mocy istotną rolę odgrywa 
sprzężenie temperaturowe i w równaniach opisujących 
stany nieustalone reaktora pojawiają się człony nie¬ 
liniowe. Poza tym do równań opisujących gęstość 
neutronów i gęstość jąder, z których powstają neutro¬ 
ny opóźnione, trzeba dołączyć równania przewod¬ 
nictwa ciepła i przepływu chłodziwa. 

Najważniejszym zadaniem dynamiki jest ustalenie, 
czy reaktor jest stabilny w warunkach normalnej pracy 
i w stanach awaryjnych, od tego bowiem zależy bez¬ 
pieczna jego eksploatacja. Sprowadza się to do ba¬ 
dania stabilności równań nieliniowych, co na ogół 
jest problemem bardzo skomplikowanym z matema¬ 
tycznego punktu widzenia. Właściwe obliczenia dy¬ 
namiczne polegają na rozwiązywaniu równań dyna¬ 
miki reaktora przy zadanych warunkach początko- kody 
wych. W pracach projektowych stosuje się kody dy- dynamiczne 
namiczne, które uwzględniają zależność przestrzenną 
gęstości neutronów i in. wielkości wchodzących 
w skład równań dynamiki. Zwykle są one bardzo 
skomplikowane i obliczenia zajmują dużo czasu na¬ 
wet przy użyciu szybkich komputerów. 

Podczas eksploatacji reaktora zachodzi również 
konieczność przewidywania jego stanów przejścio¬ 
wych, ale ze względu na bezpieczeństwo czas wykony¬ 
wania obliczeń musi być stosunkowo krótki. W tym 
wypadku więc stosuje się znacznie prostsze kody dy¬ 
namiczne, oparte na ogół na tzw. modelu jedno- 
punktowym, w którym brak zależności przestrzen¬ 
nych. Aby uniknąć poważniejszych błędów, parame¬ 
try wchodzące w skład równań dynamiki ustala się 
na podstawie ich pomiarów lub przez porównanie wy¬ 
ników obliczeń ze zmierzonym przebiegiem gęstości 
neutronów w zależności od czasu. W ten sposób moż¬ 
na wybrać optymalną strategię sterowania łańcucho¬ 
wą reakcją rozszczepienia w reaktorze, zarówno z 
punktu widzenia bezpieczeństwa, jak i ekonomii. 


Budowa i klasyfikacja 
reaktorów jądrowych 

W różnych krajach zbudowano dotąd kilka tysięcy 
reaktorów, z czego kilkaset służy do produkcji energii 
elektrycznej (il. 41-45, tabl. 12). Ogromna większość 
pracujących reaktorów to reaktory termiczne, czyli 
takie, w których większość rozszczepień zachodzi pod reaktory 
wpływem neutronów termicznych. Istnieją również termiczne 
reaktory prędkie (nie zawierające moderatorów), w i prędkie 
których rozszczepienia są wywoływane głównie przez 
neutrony o dużych energiach (średnia energia neutro¬ 
nów wynosi w nich ok. 100 keV). Zasadniczą zaletą 
reaktorów prędkich jest możliwość powielania paliwa 
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w cyklu uranowo-plutonowym. Z tego względu uważa 
się, że przyszłość energetyki opartej na reaktorach 
jądrowych leży w prędkich reaktorach powielających. 
Warto dodać, że bomba jądrowa oparta na reakcji 
rozszczepienia jest właściwie reaktorem prędkim, 
w którym reaktywność znacznie przekracza grani¬ 
cę 0,007 określoną przez udział neutronów opóźnio¬ 
nych i reakcja łańcuchowa rozwija się w sposób wy¬ 
buchowy. 

Rozróżnia się kilka typowych rozwiązań konstruk- 
reaktor cyjnych reaktorów. Przede wszystkim reaktory wodne 
wodny o małych mocach są zwykle budowane w dużych zbior¬ 
nikach wodnych, często z otwartym lustrem wody 
(reaktory basenowe). Reaktory wodne o większych 
mocach są umieszczone z reguły w zbiorniku ciśnie¬ 
niowym. Znane są również rozwiązania konstruk¬ 
cyjne, w których każdy element paliwowy wraz z opły¬ 
wającą go warstwą wody chłodzącej jest zawarty 
w rurze stalowej i utrzymywany pod ciśnieniem. 
W reaktorach z moderatorem stałym, jak grafit lub 
beryl, sam moderator stanowi materiał konstrukcyjny 
rdzenia. Cały reaktor może być także umieszczony 
w zbiorniku ciśnieniowym. 

Najkosztowniejszym składnikiem reaktora jądro¬ 
wego jest paliwo, natomiast znacznie tańszy jest mo¬ 
derator. Z tego względu reaktor jest zwykle podzie- 
rdzeń lony na dwie strefy. Pierwsza — tzw. rdzeń, zawiera 
paliwo, moderator, chłodziwo i materiały konstruk¬ 
cyjne oraz pręty regulacyjne, kompensacyjne i bez- 
reflektor pieczeństwa. Druga — tzw. reflektor, jest zbudowana 
z moderatora i otacza rdzeń, a służy do zatrzymywa¬ 
nia części neutronów uciekających z rdzenia. W wielu 
rozwiązaniach konstrukcyjnych rdzeń i reflektor znaj¬ 
dują się w szczelnych zbiornikach stalowych i otoczo¬ 
ne są specjalnymi osłonami. Zbiornik ciśnieniowy 
utrzymuje odpowiednie ciśnienie w reaktorze i za¬ 
pewnia znacznie większe bezpieczeństwo na wypadek 
awarii. W reaktorach wodnych ciśnienie wewnątrz 
zbiornika dochodzi do 14, a w gazowych — do 4 
megapaskali. Osłony reaktora zmniejszają inten¬ 
sywność promieniowania w otoczeniu do wartości 
dopuszczalnych ze względu na zagrożenie obsługi. Są 
one również stosowane do ochrony niektórych urzą¬ 
dzeń pomocniczych i aparatury przed zniszczeniem 
lub promieniotwórczością wzbudzoną, 
osłona Ponieważ największe pochłanianie neutronów w ma¬ 
terii zachodzi w zakresie energii termicznych, osłona 
reaktorowa powinna zawierać moderator spowalnia¬ 
jący neutrony prędkie wychodzące z reaktora oraz 
materiał odznaczający się znacznym przekrojem czyn¬ 
nym na pochłanianie neutronów termicznych. Poza 
tym powinna efektywnie pochłaniać promieniowanie 
y wychodzące z reaktora, jak również powstające 
w osłonie. Promieniowanie a lub fi ma bardzo nie¬ 
wielki zasięg i praktycznie nie wydostaje się poza 
pierwszą warstwę osłony. 

Największa ilość ciepła powstającego w osłonie wy¬ 
dziela się w warstwie przylegającej do reaktora. 
Z tego względu warstwa ta, zwykle oddzielona od 
reszty osłony, jest chłodzona wodą lub powietrzem 
i nazywa się osłoną termiczną. Pozostała część pełni 
rolę osłony biologicznej. Osłona termiczna jest naj¬ 
częściej wykonana z płyt stalowych z dodatkiem boru, 
natomiast biologiczna z ciężkich betonów, składają¬ 
cych się z cementu, drobnego złomu stalowego oraz 
rudy barytowej, limonitowej lub magnetytowej, 
paliwo Reaktory mogą różnić się od siebie rodzajem paliwa 
(uran naturalny, uran wzbogacony izotopem 235 U 
lub nuklidem 2S9 Pu), postacią, w jakiej paliwo wystę¬ 
puje w reaktorze (paliwo metaliczne, węgliki lub 
tlenki uranu itp.) oraz kształtem elementów paliwo¬ 
wych. Początkowo stosowano głównie uran natural¬ 
ny, obecnie w większości reaktorów paliwem jest 
uran wzbogacony izotopem 23 5 U, przy czym wzboga¬ 
cenie waha się od 1% do 93%. Dzięki temu uzyskuje 
się znacznie lepsze parametry krytyczne reaktora 
i lepszy rozkład neutronów. Obok uranu stosuje się 
również 239 Pu otrzymywany z przemiany jądrowej 


236 U. W przyszłości coraz większą rolę będzie odgry¬ 
wać paliwo plutonowe, a także 233 U. Paliwo uranowe 
lub plutonowe stosuje się w postaci metalicznej lub 
ceramicznej (tlenki lub węgliki), a także w postaci 
roztworu metalu w ceramice, a elementy paliwowe są 
koszulkowane stalą nierdzewną, cyrkonem lub alu¬ 
minium. 

Moderator jest bardzo istotnym elementem reaktora moderator 
termicznego i często używanym kryterium klasyfika¬ 
cyjnym. Rozróżnia się więc następujące zasadnicze 
typy reaktorów termicznych: wodne, ciężkowodne 
i grafitowe. W niektórych rozwiązaniach stosuje się 
również beryl w połączeniu z wodą, spełniającą jed¬ 
nocześnie rolę moderatora i chłodziwa. Istnieją rów¬ 
nież reaktory, w których moderatorem i chłodziwem 
są ciekłe związki organiczne, głównie polifenyle; takie 
reaktory nie mają jednak dużego znaczenia praktycz¬ 
nego. Najpowszechniej używanym moderatorem jest 
zwykła woda, która ma doskonałe właściwości jądro¬ 
we i termiczne, a jest przy tym bardzo tania. 

Chłodziwa reaktorowe można podzielić na 3 grupy: chłodziwo 
gazy, ciecze niemetaliczne i ciecze metaliczne, bardzo 
różniące się pomiędzy sobą właściwościami fizyczny¬ 
mi, które decydują o efektywności przejmowania 
i przenoszenia ciepła. Ważną rolę w wypadku chło¬ 
dziw odgrywają również właściwości jądrowe, jak np. 
pochłanianie neutronów czy promieniotwórczość 
wzbudzona oraz właściwości korozyjne. Do najczę¬ 
ściej stosowanych chłodziw w reaktorach termicznych 
należy zwykła woda. Używa się również dwutlenku 
węgla, a także helu. W reaktorach prędkich chłodzi¬ 
wem jest zwykle ciekły sód lub jego stopy, ale również 
przeprowadzane są próby chłodzenia gazem dysocju¬ 
jącym, np. N 2 0 4 , który dysocjuje na N0 2 pochłaniając 
ciepło z reaktora i redysocjuje poza reaktorem, będąc 
w ten sposób bardzo efektywnym nośnikiem ciepła. 

Wadą sodu jest znaczna aktywność chemiczna zarów¬ 
no w stosunku do powietrza jak i wody, a także silne 
właściwości korozyjne. Powoduje to bardzo poważne 
trudności konstrukcyjne i eksploatacyjne w reakto¬ 
rach chłodzonych sodem. 

W reaktorach termicznych chłodziwo spełniać rów¬ 
nież może funkcję moderatora. Z tego względu naj¬ 
częściej jako chłodziwo stosowana jest zwykła woda, 
dwutlenek węgla, hel i niekiedy związki organiczne. 

Woda jako chłodziwo może znajdować się pod ciśnie¬ 
niem atmosferycznym lub podwyższonym. W tym 
ostatnim wypadku mówi się o reaktorach wodnych 
ciśnieniowych. Niekiedy dopuszcza się do wrzenia, 
tak że chłodziwem w tzw. reaktorach wodnych wrzą¬ 
cych jest mieszanina wody z parą. 

Chłodzenie dwutlenkiem węgla jest stosowane w 
reaktorach grafitowych z uranem naturalnym, jednak 
ten typ chłodzenia nie ma wielkiej przyszłości, po¬ 
dobnie jak chłodzenie związkami organicznymi. W no¬ 
woczesnych reaktorach grafitowych dwutlenek węgla 
jest zastąpiony helem, co pozwala znacznie zwiększyć 
temperaturę chłodziwa na wyjściu reaktora (do 
1000° Q. 


Zastosowanie reaktorów 
jądrowych 

Z uwagi na przeznaczenie reaktory można podzielić 
w zasadzie na dwie kategorie: badawcze i energetycz¬ 
ne, przy czym te ostatnie obejmują reaktory stacjo¬ 
narne i napędowe. 

Reaktory badawcze, do których zaliczyć należy reaktory 
również zestawy krytyczne, służą jako narzędzia ba- badawcze 
dań w zakresie fizyki reaktorowej, chemii radiacyjnej, 
radiochemii, właściwości materiałów, energetyki ją¬ 
drowej itp. oraz jako źródła promieniowania (głów¬ 
nie neutronów i promieniowania y) do produkcji ra¬ 
dioizotopów (nuklidów promieniotwórczych), stoso¬ 
wanych w medycynie, biologii, rolnictwie, przemyśle 
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itd. Niektóre reaktory badawcze z uranem natural¬ 
nym lub niskowzbogaconym o dużym współczynniku 
przemiany paliwa stanowią również źródło nowego 
paliwa plutonowego. 

Reaktory badawcze są wyposażone w kanały do¬ 
świadczalne, dochodzące do reflektora i rdzenia reak¬ 
tora. Dąży się do tego, aby strumień neutronów 
i objętość kanałów doświadczalnych były jak najwięk¬ 
sze. Szczególnie duży strumień neutronów jest nie¬ 
zbędny w reaktorach przeznaczonych do badań ma¬ 
teriałowych, w których sprawdza się w praktyce 
zachowanie się elementów paliwowych projektowa¬ 
nych reaktorów energetycznych. 

W Polsce w Instytucie Badań Jądrowych w Świerku 
znajduje się kilka zestawów krytycznych i dwa reak¬ 
tory badawcze (il. 42,44; 45, tabl. 12). Pierwszy polski 
reaktor reaktor EWA (Eksperymentalny Wodny Atomowy) 
EWA został uruchomiony w 1958 r. Jego paliwem jest uran 
wzbogacony w izotop 235 U do 36%. Jako moderator 
i reflektor służy zwykła woda i częściowo beryl, chło¬ 
dziwem jest zwykła woda. Reaktor EWA jest umiesz¬ 
czony w zbiorniku betonowym, który służy jako 
osłona biologiczna dla osób pracujących w hali 
reaktora. Obecna moc reaktora wynosi 8 MW (po¬ 
czątkowa 2 MW), a strumień neutronów termi¬ 
cznych w kanałach doświadczalnych dochodzi do 
2-10 14 «/cm 2 s. Reaktor służy do produkcji radio¬ 
izotopów i do badań w zakresie fizyki i chemii, 
reaktor Drugi polski reaktor MARIA (nazwany tak na 
MARIA cześć Marii Skłodowskiej-Curie) osiągnął stan kry¬ 
tyczny w grudniu 1974 r. Jego moc nominalna wy¬ 
nosi 30 MW, a strumień maksymalny 5* 10 14 n/cm 2 s. 
Paliwem jest uran wzbogacony w izotop * 35 U do 80%. 
Jako moderator służy beryl, reflektor jest zbudowany 
z grafitu, chłodziwem i zarazem moderatorem jest 
woda pod ciśnieniem 1,7 MPa. MARIA jest reakto¬ 
rem uniwersalnym, przeznaczonym głównie do bada¬ 
nia materiałów i do produkcji radioizotopów, 
raaktory Reaktory energetyczne są przeznaczone do pro- 
napędowe dukcji energii w elektrowniach lądowych lub na stat¬ 
kach (reaktory napędowe). Reaktory napędowe nie 
różnią się w zasadzie od stacjonarnych, poza tym, że 
konstrukcyjnie są znacznie trudniejsze. Muszą one 
bowiem odznaczać się małymi rozmiarami, co doty¬ 
czy również osłon, i zapewniać bezpieczną eksploa¬ 
tację również w nie sprzyjających warunkach w czasie 
podróży. Dotychczas reaktory (wyłącznie wodne ci¬ 
śnieniowe) znalazły zastosowanie do napędu łodzi 
podwodnych, okrętów wojennych i statków morskich. 


Elektrownie jądrowe 


Pierwsza elektrownia jądrowa (atomowa) o mocy 
5 MW (elektrycznych) została zbudowana w 1954 r. 
w ZSRR, a już w 1976 r. na świecie pracowało kilka¬ 
set elektrowni jądrowych o mocach dochodzących do 
1000 MW. Początkowo energia z elektrowni jądro¬ 
wych była znacznie droższa niż z elektrowni klasycz¬ 
nych (węglowych lub wodnych). W miarę jednak roz¬ 
woju techniki reaktorów cena energii jądrowej spada 
i w 1976 r. była już porównywalna z ceną energii 
z innych źródeł. Dotychczasowe doświadczenia wska¬ 
zują, że elektrownie jądrowe są bardzo bezpieczne 
wbrew dość rozpowszechnionym poglądom, iż każdy 
reaktor jądrowy stanowi potencjalną bombę. Poza 
tym elektrownie jądrowe nie powodują tak wielkiego 
zanieczyszczenia środowiska jak elektrownie węglowe, 
które wyrzucają ogromne ilości produktów spalania 
węgla do atmosfery. Zasadniczym problemem w wy¬ 
padku elektrowni jądrowych jest tzw. zanieczyszcze¬ 
nie termiczne, które polega na wzroście temperatury 
wód wywołanym odprowadzanym z elektrowni cie¬ 
płem, a także gromadzenie się odpadów promienio¬ 
twórczych. Wydaje się jednak, że nauka potrafi 
w przyszłości uporać się z obydwoma problemami. 


Najważniejszym jednak argumentem przemawiają¬ 
cym za rozwojem energetyki jądrowej jest gwałtowne 
kurczenie się zasobów paliw klasycznych, co bez 
udziału energii jądrowej doprowadziłoby już wkrótce 
do ostrego kryzysu energetycznego. 

REAKTOR 


pręty 

sterownicze 


moderator 


rdzeń reaktora 
paliwo uranowe 


zbiornik ciśnieniowy osłona przepływ chłodziwa 
Rys. 13. Schemat reaktora energetycznego 

Na rys. 13 przedstawiono schemat typowego reak- reaktor 
tora energetycznego stacjonarnego lub napędowego, energetycz- 
Chłodziwo opuszczając zbiornik reaktora unosi ze ny 
sobą ciepło, które następnie oddane w wymienniku 
ciepła powoduje tworzenie się pary wodnej używanej 
do poruszania turbiny i wytwarzania energii elek¬ 
trycznej odprowadzanej do sieci energetycznej lub, 
w reaktorach napędowych, używanej do napędu sil¬ 
ników. 



para 



Rys. 14. Schemat elektrowni jądrowej z reaktorem wodnym ci¬ 
śnieniowym 


Najczęściej spotykanym typem reaktora energe- reaktory 
tycznego jest reaktor wodny ciśnieniowy (rys. 14). wodne 
Elektrownie z tymi reaktorami pracują j uż w wielu 
krajach. W ZSRR i w innych krajach socjalistycznych 
działają reaktory wodne ciśnieniowe o rozwiązaniu 
konstrukcyjnym nazwanym W WER. Pierwsza polska 
elektrownia jądrowa, która ma być zbudowana nad 
Jeziorem Żarnowieckim w woj. gdańskim będzie wy¬ 
posażona właśnie w reaktor WWER o mocy 440 WM 
(elektrycznych). Drugim typem reaktora wodnego 
jest reaktor wodny wrzący, w którym dopuszcza się 
do wrzenia wody w rdzeniu reaktora, co pozwala 
obniżyć ciśnienie w zbiorniku reaktora. Jednakże 
reaktory wodne wrzące są nieco trudniejsze kon¬ 
strukcyjnie. 
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Rys. 15. Schemat elektrowni z reaktorem chłodzonym gazem 
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reaktory Pierwszymi reaktorami energetycznymi chłodzo- 
grafitowe nymi gazem (dwutlenek węgla) były reaktory w Cal- 
der Hall (Wielka Brytania) oddane do eksploatacji 
w 1956 r. Moderatorem był grafit, a paliwem uran na¬ 
turalny. Schemat działania reaktora z chłodzeniem 
gazowym pokazany jest na rys. 15. Obecnie prowadzi 
się intensywne prace nad ulepszonymi wersjami ener¬ 
getycznych reaktorów grafitowych z chłodzeniem ga¬ 
zowym, tzw. reaktorów wysokotemperaturowych, 
w których temperatura gazu na wyjściu osiąga 1000°C. 
Gaz o tej temperaturze pozwala osiągnąć znacznie 
wyższą sprawność cieplną elektrowni jądrowej. 
Szczególnie interesującym rozwiązaniem jest reaktor, 
w którym paliwem jest złoże usypane z kul uranowych 
pokrytych grafitem, a chłodziwem hel. Prototyp tego 
reaktora pracuje w Julich (RFN). 


Reaktory wysokotemperaturowe odznaczają się 
bardzo dużą sprawnością i pozwalają na dobre wyko¬ 
rzystanie paliwa. Dodatkową zaletą jest możliwość 
użycia tych reaktorów w przemyśle chemicznym. 

Ze względu na fakt, że ogromna większość uranu 
znajdującego się w przyrodzie to 238 U, przyszłość 
energetyki jądrowej leży w prędkich reaktorach po¬ 
wielających. Reaktory prędkie są jednak znacznie 
trudniejsze zarówno z punktu widzenia konstrukcyj¬ 
nego jak i eksploatacyjnego i ciągle jeszcze znajdują 
się w stadium prototypów. Pierwsze duże elektrownie 
jądrowe z reaktorami prędkimi pojawią się zapewne 
dopiero po 1990 r. 

S. Glasstone Podstawy techniki reaktorów jądrowych , War¬ 
szawa 1958; S. Glasstone i M. C. Edlund Podstawy teorii re¬ 
aktorów jądrowych, Warszawa 1957; J. Mika i A. Zmysłowski 
Energia jądrowa i jej zastosowanie , Warszawa 1962. 


Energia termojądrowa 

Lech Jakubov/ski i Marek Sadowski 


Energia jądrowa może się wyzwalać nie tylko w pro¬ 
cesach rozszczepienia ciężkich jąder atomowych, ale 
również w reakcjach syntezy (tj. łączenia) jąder naj¬ 
lżejszych w jądra cięższe. Aby reakcja syntezy mogła 
dojść do skutku, jądra muszą pokonać siły wzajem¬ 
nego odpychania elektrostatycznego i zbliżyć się na 
odległość rzędu 10" 12 cm. W temperaturze pokojo¬ 
wej średnia energia kinetyczna ruchu cieplnego jąder 
atomowych jest zbyt mała, aby tego rodzaju reakcja 
mogła zachodzić. Natomiast w temperaturze wielu 
milionów stopni, jaka panuje np. we wnętrzu Słońca 
i innych gwiazd, energia ruchu cieplnego jest tak duża, 
że wystarcza do pokonania sił kulombowskich mię¬ 
dzy jądrami, co umożliwia połączenie tych jąder. 
Procesy łączenia jąder atomowych, które zachodzą 
na skutek ruchów termicznych w bardzo wysokich 
temperaturach, nazywamy reakcjami syntezy termo¬ 
jądrowej, a wydzieloną w tych procesach energię — 
energią termojądrową. 

W dostatecznie wysokich temperaturach następuje 
samorzutna jonizacja materii — atomy rozpadają się 


na dodatnio naładowane jony i swobodne elektrony, 
tworząc kwazineutralną mieszaninę — tzw'. plazmę. 
Istotne jest, że dodatnie i ujemne cząstki występują 
w plazmie w takich proporcjach, że wypadkowy ła¬ 
dunek elektryczny jest równy zeru (kwazineutral- 
ność). W plazmie o niskiej temperaturze i małym 
stopniu jonizacji mogą występować atomy niezjoni- 
zowane (plazma niskotemperaturowa). W tempera¬ 
turze wielu milionów stopni, w której mogą zachodzić 
reakcje termojądrowe, materia ulega całkowitej jo¬ 
nizacji, powstaje wówczas plazma wysokotempera¬ 
turowa — tzw. plazma gorąca. 

W warunkach ziemskich plazmę spotyka się sto¬ 
sunkowo rzadko. Plazma o niskiej temperaturze wy¬ 
stępuje we wnętrzu płomienia, w iskrze lub łuku elek¬ 
trycznym oraz w potężnych wyładowaniach atmo¬ 
sferycznych. Zewnętrzne warstwy atmosfery ziemskiej 
stanowi plazma o małej gęstości tworząca jonosferę. 
Ponad jonosferą istnieją obszary zawierające zjonizo- 
waną materię, nazywane pasami van Allena. W ob¬ 
szarach międzygwiezdnych występuje również plazma 
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Rys. 1. Występowanie plazmy w przyrodzie oraz zakres badań nad plazmą. Prostokąt ukazuje zakres koncentracji i temperatur, którymi 
interesują się fizycy prowadzący badania termojądrowe; czarne punkty odpowiadają najważniejszym eksperymentom 
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niku takich reakcji swobodne neutrony mogą być 
pochłaniane przez jądra ciężkie, tworząc w ten spo¬ 
sób coraz cięższe jądra atomowe. 


o bardzo małej gęstości. Natomiast gorąca plazma 
występuje we wnętrzu miliardów gwiazd, w tym także 
naszego Słońca. Zatem tylko znikoma część materii 
we Wszechświecie występuje w trzech podstawowych 
stanach skupienia. Ponad 99,9% materii Wszech¬ 
świata znajduje się w stanie zjonizowanym — stano¬ 
wi plazmę, którą można uważać za odrębny stan ma¬ 
terii (rys. 1). 

W gorącej plazmie we wnętrzu gwiazd między czą¬ 
stkami obdarzonymi wielką energią kinetyczną za¬ 
chodzą reakcje syntezy termojądrowej. W reakcjach 
tych powstają nowe cięższe jądra atomowe, a jed¬ 
nocześnie wydzielane są ogromne ilości energii, której 
część dociera do nas w postaci promieniowania. 


Reakcje syntezy termojądrowej 
i ich znaczenie 

Reakcje przebiegające we wnętrzu gwiazd 

Jako przykład zwykłej reakcji syntezy jądrowej roz¬ 
patrywać można przetworzenie czterech jąder wodoru 
(protonów) w jądro helu. Prawdopodobieństwo jed¬ 
noczesnego zderzenia się czterech protonów jest jed¬ 
nak bardzo małe, nawet w warunkach jakie panują 
we wnętrzu gwiazd. Przetworzenie protonów w jądra 
helu możliwe jest poprzez szereg reakcji pośrednich, 
czyli w wyniku cyklicznej reakcji jądrowej, np. tzw. 
cyklu protonowo-protonowego, składającego się z na¬ 
stępujących reakcji 

D*+H 1 -^He 3 +y 

cykl 

protonowo- 2He 3 ->He 4 +2H 1 

-protonowy lub 

HeS He 4 -*Be 7 
Be 7 +<?--» Li 7 
Li 7 -fH 1 -^2He 7 . 

Obecnie uważa się, że energia wydzielona w reak¬ 
cjach cyklu protonowo-protonowego jest głównym 
źródłem energii w gwiazdach, których temperatura 
wnętrza nie przekracza 15 min K. Oprócz podanego 
wyżej cyklu protonowo-protonowego we wnętrzach 
gwiazd możliwy jest także cykl węglowo-azotowy 
(cykl Bethego) 

C 12 +H 1 ->*N 13 +y 

*N 13 -*C 13 -f/? + 4-)' 

cykl C“+HP-N “+y 

Bethego N 14 -|-H 1 ->*0 ,5 -f y 

*0 15 -N 15 '-H?+ + y 

N 15 +H 1 ->-C 12 -ł-He 4 , 

gdzie * oznacza jądro wzbudzone. 

„spalanie" Korzystając z terminologii chemicznej, można po¬ 
wodom wiedzieć, że powyższe reakcje opisują proces „spala¬ 
nia” wodoru na hel, w którym rolę „katalizatorów” 
spełniają jądra węgla, azotu i tlenu. Wydajność ener¬ 
getyczna podanych reakcji syntezy wynosi ok. 
26 MeV na cykl, co oznacza, że ze spalenia 1 g wo¬ 
doru można uzyskać ok. 6-10 11 dżuli energii. Oma¬ 
wiane cykle nie wyczerpują wszystkich możliwości. 
W temperaturach panujących we wnętrzach gwiazd 
przebiegać mogą również reakcje syntezy z udziałem 
innych pierwiastków lekkich, np. litu, berylu i boru. 
Produktem końcowym tych reakcji jest również hel. 
W temperaturze ok. 100 min K zachodzą także inne 
reakcje, np. C 13 -fHe 4 ->O ie 4 n. Powstające w wy¬ 


znaczenie reakcji termojądrowych 
przebiegających na Słońcu 

Omawiane procesy przebiegają bardzo powoli; we 
wnętrzu Słońca w ciągu jednego roku w procesach 
syntezy zużyte zostaje tylko jedno jądro na milion. 

Ze względu na ogromne rozmiary i masę Słońca, wy¬ 
starcza to jednak do utrzymania odpowiedniej tem¬ 
peratury i pokrycia wszystkich strat energii związa¬ 
nych z promieniowaniem. 

Aby ocenić znaczenie reakcji termojądrowych za- źródła energii 
chodzących we wnętrzu Słońca należy zauważyć, że na Ziemi 
prawie wszystkie zasoby energetyczne, z których ko¬ 
rzystamy dotychczas na Ziemi, są pochodzenia sło¬ 
necznego. Węgiel kamienny powstał ze szczątków 
roślin, które w minionych epokach wytworzone zo¬ 
stały w procesie fotosyntezy pod wpływem promie¬ 
niowania. Z przemiany szczątków zwierzęcych i ro¬ 
ślinnych, a więc pośrednio kosztem energii Słońca, 
powstała także ropa naftowa. Nawet energia wyko¬ 
rzystywana w hydroelektrowniach jest pochodzenia 
słonecznego, gdyż woda rzek pochodzi w większości 
z opadów atmosferycznych, a więc z pary wodnej, 
która powstaje głównie nad morzami, na skutek 
ogrzania ich przez Słońce. Podobnie jest z energią 
wiatrów. Można więc stwierdzić, że istnienie życia na 
Ziemi zależy w rzeczywistości od reakcji syntezy ter¬ 
mojądrowej, które przebiegają nieustannie we wnę¬ 
trzu Słońca — w ogromnym reaktorze termojądro¬ 
wym o wymiarach liniowych rzędu 10 5 km, i tem¬ 
peraturze kilkunastu milionów K. 


Reakcje syntezy termojądrowej możliwe 
do realizacji w warunkach ziemskich 

W dążeniu do poznania praw natury i opanowania 
nowych źródeł energii badacze zaczęli się zastanawiać, 
czy reakcje termojądrowe można realizować na Ziemi. 

Okazało się, że w warunkach ziemskich dysponujemy paliwa termo - 
doskonałym paliwem termojądrowym — ciężkimi izo- jądrowe 
topami wodoru — deuterem i trytem: 

D 2 4D 2 ->T 3 4-/>44,0 MeV 

D2 +D 2_^ He 3 + „ + 3 2 MeV 

D 2 +T 3 ->He 4 -f « + 17,6 MeV 

D 2 4 He 3 -> He 4 +p 418,4 MeV. 

Interesujące są również reakcje syntezy z udziałem 
litu: 

Li 6 4 /z~>He 4 4*T 3 44,8 MeV 
Li 6 4p-*-He 4 4 He 3 -f 3,9 MeV 
Li 6 4D 2 -*-2He 4 422,3 MeV. 

Podstawowym warunkiem realizacji reakcji syn¬ 
tezy termojądrowej jest wytworzenie odpowiednio 
wysokiej temperatury. Występuje tu pewna analogia 
do temperatury zapłonu paliwa chemicznego. Oczy- temperatura 
wiście z tą różnicą, że temperatura „zapłonu” reakcji „zapłonu" 
termojądrowych jest o wiele wyższa, wynosi dzie¬ 
siątki, a nawet setki milionów stopni. W tak wyso¬ 
kich temperaturach materia może istnieć tylko w po¬ 
staci całkowicie zjonizowanego gazu, czyli gorącej 
plazmy. Taka gorąca plazma intensywnie promie¬ 
niuje, z czym związane są duże straty energetyczne. 

Jednak w miarę podwyższania temperatury energia 
wydzielana z reakcji termojądrowych wzrasta szyb¬ 
ciej niż energia tracona na promieniowanie (rys. 2). 

W związku z powyższym za temperaturę zapłonu 
reakcji termojądrowych można uważać wartość tern- 
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temperatura peratury, przy której energia wydzielana i tracona są 
zapłonu sobie równe. W wypadku reakcji D-D temperatura 
reakcji ta wynosi ok. 350 min K, a w wypadku reakcji D-T — 
D-D i D-T ok. 45 min K. 



Rys. 2. Określenie temperatury zapłonu reakcji termojądro¬ 
wych deuter-deutcr (D + D) oraz deuter-tryt (D + T) przy zało¬ 
żeniu, że gorąca plazma nie zawiera domieszek ciężkich atomów, 
które mogłyby powodować wzrost strat na promieniowanie 


Warunki realizacji kontrolowanych 
reakcji termojądrowych 

Warunek podstawowy, dotyczący ogrzania termoją¬ 
drowego paliwa do temperatury zapłonu, omówiony 
został wcześniej. Dalsze warunki dotyczą odizolowa¬ 
nia tej gorącej plazmy od otoczenia i utrzymania jej 
przez dostatecznie długi czas. Gorąca plazma musi 
przy tym posiadać odpowiednią gęstość. Równo¬ 
czesne spełnienie tych warunków jest bardzo trudne. 
O skali trudności świadczą następujące dane: dla plaz¬ 
my o koncentracji odpowiadającej normalnej gęsto¬ 
ści powietrza (ok. 3 - 10 19 cząstek/cm 3 ) w tempera¬ 
turze 100 min K ciśnienie osiąga wartość ok. 2 • 1 0 11 Pa. 
W praktyce nie ma takich materiałów, które mogły¬ 
by wytrzymać działanie tak wysokich temperatur 
i tak wielkich ciśnień. Konieczne jest zatem obniże¬ 
nie ciśnienia gorącej plazmy, np. przez zmniejszenie 
koncentracji cząstek. Ponieważ reakcja syntezy za¬ 
chodzi tylko w trakcie zderzeń cząstek, zmniejszeniu 
koncentracji plazmy powinno jednak towarzyszyć 
wydłużenie czasu jej utrzymania w danym obszarze, 
kryterium Jako kryterium może zatem służyć wartość iloczynu 
Lawsona koncentracji n oraz czasu utrzymania r (tzw. kry¬ 
terium Lawsona). Według tego kryterium, przy okre¬ 
ślonych wyżej temperaturach zapłonu muszą być speł¬ 
nione następujące warunki: 

dla reakcji D-D nr = 10 1 * cząstek-s/cm 3 , 
dla reakcji D-T nr — 3 • 10 14 cząstek- s/cm 3 . 

W warunkach laboratoryjnych do utrzymywania 
gorącej plazmy wykorzystuje się silne pola magne¬ 
tyczne. Kwazistacjonarne utrzymywanie plazmy jest 
jednak możliwe tylko wtedy, gdy ciśnienie wywierane 
przez pole magnetyczne jest równoważne lub większe 
od ciśnienia panującego w plazmie. Ciśnienie plazmy 
można przedstawić w postaci sumy dwóch składni¬ 
ków: 

p g = nekTe+mkTi, 

gdzie n e oraz m — odpowiednio koncentracja elek- 
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tronów i jonów, k — stała Boltzmanna, T e oraz 7* — 
odpowiednia temperatura elektronów i jonów. Ci¬ 
śnienie pola magnetycznego o indukcji B 0 wyraża się 
natomiast wzorem p m = B%fSn. Korzystając z poda¬ 
nych wyżej zależności łatwo obliczyć, ile dla plazmy 
o temperaturze T e = Ti = 400 min K wynosi jej kry- krytyczna 
tyczna koncentracja, przy której można utrzymać pla- koncentracja 
zmę polem magnetycznym (tabela). plazmy 


B',T 

mn-yt, cząstek/cm ł 

B 0 ,T 

wicry t, cząstek/cm* 

1 

10" 

50 

2,5-10" 

5 

2,5-10" 

100 

10“ 

10 

10“ 




Za pomocą znanych dotychczas środków tech¬ 
nicznych, można wytwarzać w sposób kwazistacjo- 
namy pola do 100 kGs. Uzyskanie silniejszych pól 
magnetycznych jest możliwe tylko w urządzeniach 
pracujących impulsowo, a w wypadku pól powyżej 
1 MGs — w sposób wybuchowy, niszczący (-> Naj¬ 
silniejsze pola magnetyczne). Koncentracja plazmy, 
którą można utrzymać w sposób kwazistacjonarny, 
wynosi ok, 10 15 -10 16 cząstek/cm 3 , a więc według 
kryterium Lawsona czas utrzymywania takiej plazmy 
powinien wynosić dla reakcji D-D — od 1 do 10 s, 
a dla reakcji D-T odpowiednio — od 0,03 do 0,33 s. n j e stabil ość 
W praktyce największą przeszkodą w osiągnięciu pi a2my 
czasu potrzebnego na utrzymanie gorącej plazmy są 
różne niestabilności magnetohydrodynamiczne (rys. 3) 


a) b) 

Rys. 3. Niestabilności sznura plazmowego: a) przewężanie 
sznura; b) wyginanie, również prowadzące do rozerwania sznura. 

Okręgi (kolor czarny) obrazują linie sil pola magnetycznego wy¬ 
tworzonego przez prąd elektryczny przepuszczany przez plazmę 

oraz mikroniestabilności plazmy. Warunkiem reali¬ 
zacji kontrolowanych reakcji termojądrowych jest 
zatem również wyeliminowanie lub odpowiednie ogra¬ 
niczenie niestabilności plazmowych. 

Oprócz omówionych wyżej warunków, należy wy- wpływ 
mienić jeszcze jedno wymaganie: gorąca plazma nie domieszek 
powinna zawierać domieszek ciężkich jonów. Nawet 
niewielkie zanieczyszczenie plazmy ciężkimi jonami 
wywołuje bowiem duży wzrost strat energii na pro¬ 
mieniowanie, w związku z czym znacznie podwyższa 
się temperatura zapłonu reakcji termojądrowych. Na¬ 
leży więc dążyć do uzyskania bardzo czystej plazmy 
deuterowej (lub deuterowo-trytowej). W celu jak naj¬ 
szybszego osiągnięcia dodatniego bilansu energetycz¬ 
nego trzeba również dążyć do obniżenia strat energii 
we wszystkich urządzeniach pomocniczych: w uzwo¬ 
jeniach wytwarzających pole magnetyczne, w ukła¬ 
dach pomp próżniowych oraz w urządzeniach kon¬ 
trolnych i pomiarowych. 

















Militarne wykorzystywanie energii 
termojądrowej 

O możliwości wytworzenia gorącej plazmy i zreali¬ 
zowania niekontrolowanych reakcji termojądrowych 
w warunkach ziemskich przekonano się ostatecznie 
w 1952 r., kiedy na atolu Eniwetok przeprowadzono 
eksplozję pierwszej amerykańskiej bomby termoją¬ 
drowej. Paliwem w tej bombie był ciekły deuter i tryt. 
niekontrolo- W rzeczywistości była to nie bomba, ale mała fabryka 
wane reakcje wyposażona w potężne urządzenia chłodnicze o wa- 
termo- dze ponad 80 ton. Jako źródło energii inicjującej reak- 
jądrowe cje termojądrowe wykorzystano wówczas bombę 
atomową o mocy 5-krotnie większej od tej, która 
zniszczyła Hiroszimę. W efekcie eksplozja miała 
energię równoważną wybuchowi wielu milionów ton 
trotylu (TNT — trójnitrotoluen). W około 10 mie¬ 
sięcy później w ZSRR zrealizowano wybuch bomby 
termojądrowej, w której wykorzystano reakcje z litem. 

Następnie, w 1954 r. Stany Zjednoczone przepro¬ 
wadziły wybuch bomby litowej na atolu Bikini. Była 
to potężna eksplozja wyzwalająca ok. 15 megaton 
TNT energii, która prawie 10-krotnie przewyższała 
siłę wybuchową wszystkich bomb zrzuconych na te¬ 
rytorium Niemiec w latach II wojny światowej. Wtedy 
właśnie doszło do tragicznego wy padku z japońskimi 
rybakami, którzy ulegli napromieniowaniu w odle¬ 
głości ok. 200 km od miejsca eksplozji. Od czasu wy¬ 
buchu tych pierwszych bomb termojądrowych aż do 



kula berylowa 
(reflektor neutronów) 


uran 23S U lub pluton 239 Pu 

zwykły materiał wybuchowy 

warstwa deuterku litu 6 LiD 
płaszcz z naturalnego uranu 


Rys. 4. Schemat budowy bomby termojądrowej typu 3F 


1958 r., kiedy to wstrzymano eksperymenty z bronią 
jądrową, przeprowadzono eksplozje wielu bomb 
wodorowych i litowych: były to eksplozje naziemne, 
powietrzne, podziemne i podwodne. 

Współczesne bomby termojądrowe są przeważnie 
typu 3F, co oznacza „fission-fusion-fission” (roz- 
szczepienie-synteza-rozszczepienie). Schemat ich bu¬ 
dowy przedstawia rys. 4. W bombach tych materia¬ 
łem podstawowym jest deuterek litu ®LiD otoczony 
płaszczem z naturalnego uranu 238 U. Reakcję termo¬ 
jądrową inicjuje wybuch zwykłej bomby atomowej 
zawierającej uran m U lub pluton 239 Pu. Potem roz¬ 
wija się reakcja syntezy termojądrowej z udziałem 
litu *Li. Wytwarzane przy tym neutrony prędkie 
przenikają do płaszcza z uranu 238 U, powodując 
reakcję rozszczepieniową i zwiększając wypadkowy 
efekt wybuchowy. Warto tutaj zestawić następujące 
dane: 

1 kg uranu w procesie zwykłego rozszczepienia 
wyzwala energię równoważną wybuchowi 20 ki- 
loton TNT, 

1 kg 6 LiD w reakcji syntezy wyzwala energię 68 ki- 
loton TNT, 

1 kg mieszaniny D+T w reakcjach syntezy wy¬ 
zwala energię rzędu 8G~kiloton TNT. 

Dla porównania należy przypomnieć, że do komplet¬ 
nego zniszczenia Hiroszimy wystarczyła bomba ato¬ 
mowa o energii równoważnej 20 kilotonom TNT. 


Łatwo wyciągnąć stąd wniosek, że w arsenałach wielu 
państw (broń termojądrową mają obecnie również 
Anglia, Francja i Chiny) drzemią dziś ogromne siły, 
których niszczycielskie użycie groziłoby całkowitym 
zniszczeniem naszej cywilizacji. 


Możliwości pokojowego wykorzystania 
energii termojądrowej 

Potężne wybuchy termojądrowe można wykorzysty¬ 
wać do wielkich robót ziemnych, do kopania ogrom¬ 
nych kanałów lub drążenia podziemnych zbiorni¬ 
ków. Istnieją także projekty uzyskiwania energii 
z podziemnych eksplozji termojądrowych. W warun¬ 
kach laboratoryjnych i przemysłowych nie można 
jednak jako zapalnika stosować bomb atomowych. 
Konieczne jest zatem opanowanie kontrolowanych 
reakcji termojądrowych przebiegających w sposób 
regulowany przez człowieka. Program ten napotyka 
jednak duże trudności i wymaga wielkich nakładów 
finansowych. Zanim szczegółowo omówimy te za¬ 
gadnienia warto się zastanowić, czy cel, jakim jest 
opanowanie kontrolowanej syntezy termojądrowej, 
wart jest tych zabiegów? 

W pierwszej kolejności warto poznać następujące 
dane: 

1 kg węgla daje do 7 kWh energii, 

1 kg uranu daje od 70 000 kWh (praktycznie) do 

12 000 000 kWh (teoretycznie), 

1 kg deuteru w reakcjach syntezy mógłby wytwo¬ 
rzyć 24 000 000 kWh. 

Zasoby węgla są eksploatowane bardzo intensywnie 
i obecnie ocenia się, że wystarczy ich jeszcze na około 
100 lat. Podobna sytuacja jest ze złożami ropy nafto¬ 
wej. Zasoby uranu, natomiast, przy obecnej spraw¬ 
ności przetwarzania (gwarantującej zużycie zaledwie 
0,7% masy paliwa) mogą wystarczyć zaledwie na kil¬ 
kadziesiąt lat. Uran naturalny może stanowić trwałe 
źródło energii tylko w reaktorach powielających, któ¬ 
rych wykorzystanie w praktyce napotyka jeszcze trud¬ 
ności (-> Energia jądrowa). Poważny problem ener¬ 
getyki jądrowej stanowią również odpady promie¬ 
niotwórcze. 

W porównaniu z zasobami paliw tradycyjnych 
i uranu zapasy paliwa termojądrowego — deuteru — 
są właściwie niewyczerpalne. Deuter występuje w wo¬ 
dach mórz i oceanów w ilości 1 atom izotopu na 
5000 atomów wodoru zwykłego. Łączne zasoby deu¬ 
teru wynoszą około 10 17 kg, co odpowiada zapasom 
energetycznym rzędu 10 24 kWh. Przyjmując, że zu¬ 
życie energii utrzyma się na poziomie dzisiejszym (co 
odpowiada wykorzystaniu mocy rzędu 5 miliardów 
kW) deuteru wystarczy na 20 miliardów lat. Nawet 
przy najbardziej intensywnym rozwoju energetyki 
termojądrowej paliwa tego nie zabraknie. Koszty wy¬ 
dobycia tego paliwa są przy tym bardzo małe. Współ¬ 
czesnymi metodami produkcji, kosztem 3 zł z 1 1 
wody wydziela się ok. 1/30 g deuteru. W reakcjach 
termojądrowych z takiej ilości deuteru wyzwolić 
można energię równoważną spaleniu 300 1 benzyny. 
Wykorzystanie tych ogromnych zasobów energetycz¬ 
nych jest jednak uzależnione od opanowania kontro¬ 
lowanych reakcji termojądrowych, a w pierwszej ko¬ 
lejności— od poznania własności materii w bardzo 
wysokich temperaturach. 


Własności plazmy 


Kwazineutralność plazmy 

Do podstawowych własności plazmy zaliczyć należy 
wspomnianą na wstępie kwazineutralność elektryczną. 
W rzeczywistości w plazmie występuje pewne roz¬ 
dzielenie ładunków. Koncentracja dodatnich i ujem- 
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nych cząstek jest jednak tak duża, zwłaszcza w plaz¬ 
mie o dużej gęstości, że nawet małe rozdzielenie ła¬ 
dunków wywołuje bardzo silne pole elektryczne ( E) y 
które przeciwdziała dalszym zmianom. W plazmie 
wówczas mogą powstawać oscylacje elektrostatyczne. 
Natomiast w obecności zewnętrznego pola magne¬ 
tycznego H 0 w plazmie mogą występować także drga¬ 
nia o charakterze elektromagnetycznym. Do najważ¬ 
niejszych należą podłużne fale magnetohydrostatycz- 

ne, czyli tzw. fale Alfvćna (dla których k\\H 0y E J_ H 0 > 

gdzie k jest wektorem falowym — reprezentującym 
kierunek rozchodzenia się fali), oraz poprzeczne fale 
magnetoakustyczne, czyli tzw. fale magnetodiwię- 

kowe ( k±H 0 , E±H 0 ). 


Promieniowanie plazmy 

Inną podstawową własnością plazmy jest jej promie¬ 
niowanie. Przy niskich temperaturach i małym stop¬ 
niu jonizacji plazma emituje przede wszystkim pro¬ 
mieniowanie o widmie dyskretnym — każda linia 
widmowa odpowiada przejściom elektronów między 
określonymi poziomami energetycznymi atomów lub 
jonów. Ze wzrostem temperatury (i jonizacji) plazmy 
wzrasta udział promieniowania o widmie ciągłym, 
pochodzącego z procesów rekombinacji jonów i elek¬ 
tronów oraz z procesu hamowania swobodnych elek¬ 
tronów w polu elektrycznym jonów. Zgodnie ze zna- 
pochłanianie ną zasadą, emisji promieniowania towarzyszy jego 
plazmy absorpcja (pochłanianie). Im większa jest gęstość 
i grubość warstwy plazmowej, tym silniej pochłania 
ona promieniowanie. Warto zwrócić uwagę na tę 
własność plazmy, ponieważ od niej zależy istnienie 
życia na Ziemi. Gdyby gorąca plazma Słońca była 
zupełnie przezroczysta, to promieniowanie, które do¬ 
cierałoby do powierzchni naszej planety, zamieniłoby 
wszystko w popiół. W rzeczywistości ze Słońca do¬ 
ciera do nas promieniowanie tylko z zewnętrznej 
warstwy plazmowej. 

Zgodnie z tym, co powiedziano wyżej, gorąca plaz¬ 
ma może emitować promieniowanie o bardzo szero¬ 
kim widmie — od fal radiowych do twardego pro¬ 
mieniowania rentgenowskiego. Przez plazmę może 
przenikać tylko promieniowanie, którego c zęstość co 
jest większa od częstości plazmowej co 0 = ]/4nne 2 lm e 
gdzie n, e, m e są odpowiednio koncentracją, ładun¬ 
kiem i masą elektronu. Analiza tego promieniowania 
umożliwia określenie podstawowych parametrów 
plazmy—jej koncentracji i temperatury. 

W świetle molekulamo-kinetycznej teorii budowy 
materii temperatura jest miarą średniej energii ruchu 
cieplnego, która jest proporcjonalna do kwadratu 
średniej prędkości ruchu cząstek. Należy przy tym 
zauważyć, że nie wszystkie cząstki mają taką samą 
temperatura energię kinetyczną. Istnieją cząstki poruszające się 
plazmy bardzo wolno i takie, które obdarzone są dużymi 
prędkościami i ulegają większej liczbie zderzeń. W wy¬ 
niku tych zderzeń ustala się zwykle stan równowagi 
termodynamicznej, w którym rozkład prędkości czą¬ 
stek (a tym samym ich rozkład energetyczny) moż¬ 
na opisać funkcją maxwellowską. Pojęcie temperatury 
jest dobrze zdefiniowane jedynie dla stanu równowagi 
termodynamicznej. 

W praktyce pojęcie temperatury stosuje się również 
w wypadkach odchyleń od rozkładu maxweIlowskiego 
rozpatrując np. oddzielnie funkcje rozkładu dla ru¬ 
chów poprzecznych lub podłużnych (w stosunku do 
wyróżnionego kierunku). Często rozkład energetycz¬ 
ny elektronów w plazmie różni się od rozkładu ener¬ 
getycznego jonów lub resztek atomów neutralnych, 
temperatura (Wprowadza się wówczas pojęcie temperatury elek- 
elektronowa tronowej T e oraz temperatury jonowej 7>.) Przy do- 
i Jonowa statecznie dużej gęstości plazmy, w wyniku zderzeń 
między cząstkami, ustala się w plazmie po pewnym 
czasie stan równowagi termodynamicznej (wówczas 
T e = Tj). Czas ten nazywa się czasem relaksacji. 
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Należy pamiętać, że „temperatura” oznacza wówczas 
tylko miarę średniej energii kinetycznej i nie charak¬ 
teryzuje w pełni stanu cieplnego danego ośrodka. 

Ze względu na proporcjonalność temperatury i śred¬ 
niej energii kinetycznej cząsteczek, temperaturę wy¬ 
raża się czasem w jednostkach energetycznych — 
elektronowoltach. Energii 1 eV odpowiada przy tym 
temperatura 11 600 K (w przybliżeniu 1 eV = 10 4 K. 


Inno własności plazmy 

Występowanie w plazmie dużej ilości swobodnych 
elektronów i jonów powoduje, że w odróżnieniu od 
normalnego gazu plazma posiada zdolność przewo¬ 
dzenia prądu elektrycznego. W przeciwieństwie do 
zwykłych przewodników metalicznych wraz ze wzro¬ 
stem temperatury opór elektryczny plazmy maleje, 
zmieniając się proporcjonalnie do J~ 3 / 2 . W rezultacie 
gorąca plazma wykazuje dużą przewodność elektrycz¬ 
ną i w temperaturze kilkunastu min K jej opór wła¬ 
ściwy jest mniejszy od oporu najlepszych przewodni¬ 
ków metalicznych. 

Ze względu na występowanie w plazmie dużej licz¬ 
by swobodnych cząstek naładowanych plazma pod¬ 
lega również działaniu sił pola elektrycznego i magne¬ 
tycznego, co można wykorzystać do jej utrzymania 
w określonym obszarze w tzw. pułapce magnetycznej. 
Prawa, które rządzą ruchem cząstek naładowanych 
w polach elektrycznych i magnetycznych, dają wy¬ 
tłumaczenie wielu zjawisk zachodzących w plazmie. 
Konieczne jest jednak uwzględnienie, że w plazmie 
ruch swobodnych cząstek naładowanych zakłócony 
jest przez zderzenia. Ponieważ naładowane cząstki 
wytwarzają pola elektryczne o stosunkowo dużym za¬ 
sięgu, w plazmie o dużej gęstości występują oddziały¬ 
wania kolektywne. Polega to na tym, że plazma wy¬ 
kazuje skłonność do rozprzestrzeniania zaburzeń lo¬ 
kalnych na cały obszar plazmowy. Jeżeli takie zabu¬ 
rzenia nie są dostatecznie tłumione, występuje nie¬ 
stabilność plazmy (zob. rys. 3). Zjawiska te utrud¬ 
niają utrzymywanie plazmy w pułapkach magnetycz¬ 
nych przez dłuższy czas. 

Plazmę o małej gęstości można traktować jako 
zbiór pojedynczych cząstek, z których każda oddzia¬ 
łuje niezależnie—jest to tzw. model jednocząstko- 
wy. Plazmę o większej gęstości można rozpatrywać 
jako przewodzący ośrodek ciągły, który opisują rów¬ 
nania hydrodynamiki i elektrodynamiki —jest to 
tzw. model magnetohydrodynamiczny (model mhd). 

Omówione wyżej własności plazmy są bardzo isto¬ 
tne zarówno z punktu widzenia badań podstawowych, 
jak również badań zmierzających do opanowania 
energi i termojądrowej. 


Metody wytwarzania gorącej 
plazmy 

Z wytwarzaniem plazmy związany jest problem po¬ 
miaru wartości bardzo wysokich temperatur. Do po¬ 
miarów takich temperatur nie przydatne są oczywi¬ 
ście ani termometry cieczowe, ani gazowe. Nie można 
też stosować termometrów oporowych lub termoelek¬ 
trycznych. Specjalne sondy kalorymetryczne pozwa¬ 
lają wprawdzie mierzyć temperaturę rzędu kilku ty¬ 
sięcy kelwinów, ale ulegają szybkiemu zużyciu, a prócz 
tego zaburzają badany ośrodek. Dlatego do pomia¬ 
rów wysokich temperatur najbardziej przydatne są 
metody optyczne. Powyżej 1000 K powszechnie sto¬ 
sowany jest np. pirometr optyczny, którego działa¬ 
nie oparte jest na porównaniu promieniowania ba¬ 
danego obiektu z promieniowaniem włókien żarów¬ 
ki— wzorca. Za pomocą takiego przyrządu można 
np. określić temperaturę płomienia, która może 
sięgać ok. 2000 K. 
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metody spek- Do pomiarów jeszcze wyższych temperatur wyko- 
troskopowe rzystuje się fakt, że gorąca plazma wysyła promienio- 
pomiaru wanie o różnych długościach fal, od fal radiowych 
temperatury do krótkofalowego promieniowania nadfioletowego 
a nawet rentgenowskiego. Badania tego promienio¬ 
wania można przeprowadzić za pomocą spektrogra¬ 
fów i monochromatorów. Na podstawie pomiaru 
stosunku natężeń linii widmowych emitowanych 
przez jony tego samego pierwiastka (ale o róż¬ 
nych stopniach wzbudzenia) można np. ocenić tem¬ 
peraturę T e > nawet jeśli wynosi ona wiele milionów 
kelwinów. Do określenia temperatury 7> można na¬ 
tomiast wykorzystać zależność szerokości linii wid¬ 
mowych od ruchu jonów (tzw. dopplerowskie rozsze¬ 
rzenie linii). 

Metody wytwarzania plazmy o bardzo wysokich 
temperaturach można podzielić na dwie zasadnicze 
kategorie. Do pierwszej należą metody polegające na 
wytworzeniu plazmy (lub wiązki cząstek) o wysokiej 
energii w specjalnych urządzeniach akceleracyjnych, 
a następnie — na iniekcji tej plazmy (lub cząstek) do 
wnętrza pułapki magnetycznej. Do drugiej kategorii 
zaliczają się metody, które polegają na wytworzeniu 
chłodnej plazmy od razu wewnątrz pułapki magne¬ 
tycznej, a następnie — na ogrzewaniu tej plazmy do 
bardzo wysokich temperatur. Można tu podać pew¬ 
ną analogię: metody pierwszej kategorii przypomi¬ 
nają napełnianie termosu gorącym płynem, a metody 
drugiej kategorii odpowiadają nagrzewaniu płynu 
wewnątrz zamkniętego kociołka. Klasyfikacja metod 
wytwarzania gorącej plazmy według miejsca jej po¬ 
wstawania jest jednak zbyt powierzchowna i dlatego 
konieczne jest rozważenie różnych procesów fizycz¬ 
nych, na których te metody się opierają. Poniżej po¬ 
damy bardziej szczegółowy opis niektórych metod 
wytwarzania gorącej plazmy i porównamy ich moż¬ 
liwości. 


Metoda grzania omowego 

Jest to najprostsza metoda wytwarzania gorącej plaz¬ 
my polegająca na przepuszczeniu przez zjonizowany 
gaz bardzo silnych prądów elektrycznych, w wyniku 
czego następuje dalsza jonizacja gazu i wzrost jego 
temperatury. Wydzielanie ciepła wiąże się przy tym 
ze zderzeniami między nośnikami prądu (elektronami) 
i innymi cząstkami gazu. Ponieważ przy podwyższaniu 
temperatury opór plazmy szybko maleje (przeciwnie 
niż w przypadku zwykłych przewodników metalicz¬ 
nych), możliwości grzania omowego są ograniczone. 
Stosując omawianą metodę można osiągnąć tempera¬ 
tury ok. kilku keV (rzędu 10 7 K), ale ze wzrostem 
temperatury wydajność tej metody maleje. Nie po¬ 
maga również zwiększanie natężenia przepuszczanych 
prądów, ponieważ w pewnych warunkach może to 
wywołać niestabilność plazmy. 

Metoda grzania omowego jest jednak bardzo wy¬ 
godna i może być wykorzystana w różnych układach 
eksperymentalnych. Grzanie omowe można stosować 
w układach typu otwartego (patrz rozdział następny) 
wykorzystując zewnętrzne elektrody i przepuszczając 
przez plazmę impulsy prądu o natężeniu rzędu milio¬ 
nów A. Uzyskuje się wówczas plazmę o temperaturze 
ok. kilkuset eV (kilku milionów K) i koncentracji 
rzędu 10 16 cząstek/cm 3 , ale o bardzo krótkim czasie 
trwania (rzędu 10” 5 s), co spowodowane jest niestabil¬ 
nością sznura plazmowego. 

Grzanie omowe stosuje się również w zamkniętych 
(toroidalnych) pułapkach magnetycznych, w których 
prądy w plazmie wytwarzane są metodą indukcyjną 
za pomocą odpowiednich transformatorów. Przykład 
toroidalnego układu eksperymentalnego, wyposażo¬ 
nego w transformator do grzania omowego, przedsta¬ 
wiono na rys. 5. Ze względu na swoją prostotę, me¬ 
toda grzania omowego stosowana jest w większości 
układów zamkniętych. Przy pomocy tej właśnie me¬ 
tody w urządzeniach typu tokamak udało się uzyskać 


plazmę o koncentracji 6-10 13 cząstek/cm 3 i tempera- Alcator 
turze Ti « 700 eV (ok. 7 milionów K) i utrzymać ją 
przez stosunkowo długi czas (ok. 30 ms). 

transformator bezrdzeniowy 



Rys. 5. Schemat układu toroidalnego Alcator (zbudowany w Sta¬ 
nach Zjednoczonych), w którym stosuje się grzanie omowe plaz¬ 
my prądem indukowanym przez transformator bezrdzeniowy. 
Maksymalne natężenie tego prądu osiąga wartość 650 kA. Mała 
średnica toroidalnej komory układu wynosi 25 cm, duża — 
ok. 100 cm. Do utrzymywania plazmy wykorzystuje się silne ze¬ 
wnętrzne pole magnetyczne £max = 12 T 


Metody grzania turbulencyjnego 

Grzanie turbulencyjne występuje przy oddziaływaniu 
z plazmą wiązki elektronów, gdy natężenie tej wiązki 
przekracza pewną wartość krytyczną. Można je zreali¬ 
zować dwoma sposobami. Przy stosowaniu pierwsze¬ 
go sposobu najpierw wytwarza się gęstą, ale stosun¬ 
kowo zimną plazmę, wykorzystując inne metody 
(np. wstępną jonizację gazu resztkowego w komorze 
lub iniekcję plazmy z zewnątrz). Następnie przez 
umieszczoną w polu magnetycznym plazmę prze¬ 
puszcza się krótkie impulsy prądu o bardzo dużym 
natężeniu przykładając do elektrod impulsy wysokie¬ 
go napięcia. Przy pomocy takiej metody udało się 
w pułapkach typu zwierciadlanego otrzymać plazmę 
o koncentracji 2-10 13 cząstek/cm 3 i temperaturze Tj 
wynoszącej 3-5 keV (rzędu 10 7 K). W pułapkach 
zamkniętych uzyskano omawianą metodą zbliżone 
wartości temperatury, ale mniejszą koncentrację 
plazmy. 

Przy stosowaniu drugiego sposobu plazmę wytwa¬ 
rza od razu wiązka elektronowa przechodząca przez 
gaz niezjonizowany. Wymagane są wówczas mniejsze 
prądy, niż przy omawianej wyżej metodzie, ale im¬ 
pulsy znacznie dłuższe. Przy zastosowaniu omawia¬ 
nego sposobu w pułapce typu zwierciadlanego udało 
się uzyskać plazmę o koncentracji 10 n -10 12 czą¬ 
stek/cm 3 , temperaturze T) x 1 keV i bardzo wysokiej 
temperaturze T e x 150 keV. Podobne wyniki (z wy¬ 
jątkiem tak wysokiej temperatury elektronowej) uzy¬ 
skano ostatnio także w pułapkach toroidalnych. Na¬ 
leży podkreślić, że procesy powodujące grzanie plazmy \ 
przy oddziaływaniu wiązka-plazma są bardzo skom¬ 
plikowane i nie mają jeszcze pełnej interpretacji teore¬ 
tycznej . 

Metody grzania rezonansowego 

Do wytwarzania gorącej plazmy w różnych pułapkach 
magnetycznych stosowane jest również grzanie rezo¬ 
nansowe, które występuje przy oddziaływaniu z plaz¬ 
mą silnych fal elektromagnetycznych o odpowiednio 
dobranej częstości. Ponieważ w polu magnetycznym 
naładowane cząstki plazmy (elektrony i jpny) wyko¬ 
nują m.in. ruchy wirowe z częstością cyklotronową — 
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fce oraz fdy to dobierając odpowiednio częstość fali 
elektromagnetycznej / można wywołać elektronowy 
rezonans cyklotronowy (gdy / = / c «), lub jonowy re¬ 
zonans cyklotronowy (gdy / = / C f); prowadzi to do 
wzbudzenia intensywnego ruchu cząstek kosztem 
energii fali. Dla przykładu — w polu o indukcji 
B — 5T częstość cyklotronowa elektronów wynosi 
fce = 140 GHz, co odpowiada fali o długości 2 mm, 
a częstość cyklotronowa protonów wynosi f c i — 
78 MHz, co odpowiada fali o długości ok. 4 m. 

Elektronowy rezonans cyklotronowy można uzy¬ 
skać stosując zewnętrzny generator mikrofalowy 
i doprowadzając falę elektromagnetyczną do plazmy 
przez odpowiednie falowody. Należy przy tym zauwa¬ 
żyć, że tłumienie fali elektromagnetycznej i przekazy¬ 
wanie energii plazmie może następować nie tylko 
w wyniku rezonansu cyklotronowego, ale również 
przy jednakowych prędkościach fazowych fali i czą¬ 
stek plazmy (występuje wtedy tzw. tłumienie Landaua), 
Metoda elektronowego rezonansu cyklotronowego 
może być stosowana zarówno w zamkniętych jak 
i otwartych pułapkach magnetycznych. W stellarato- 
rach za pomocą tej metody otrzymano plazmę o kon¬ 
centracji 10 10 -10 12 cząstek/cm 3 i temperaturze T e ~ 
« 30 eV. W otwartej pułapce typu zwierciadlanego 
z dodatkowym polem stabilizacyjnym (eksperyment 
INTEREM) udało się uzyskać w ten sposób plazmę 
o koncentracji 10 12 cząstek/cm 3 i bardzo wysokiej 
temperaturze T e x 100 keV. 

Do wzbudzenia jonowego rezonansu cyklotrono¬ 
wego nie można wykorzystać falowodów ze względu 
na znaczną długość fali (rzędu kilku metrów), tak że 
fale elektromagnetyczne muszą być doprowadzane 
do plazmy innym sposobem. Stosuje się do tego celu 
układy specjalnych cewek (tzw. cewki Stixa), zasilane 
z silnych generatorów pracujących na częstości ra¬ 
diowej. Metoda jonowego rezonansu cyklotronowego 
jest także wykorzystywana zarówno w pułapkach 
zamkniętych jak i otwartych. Udało się za jej pomocą 
wytworzyć w Stellaratorze C plazmę o koncentracji 
10 12 -10 13 cząstek/cm 3 i temperaturze Tj x 550 eV. 
W eksperymentach z otwartymi pułapkami zwiercia¬ 
dlanymi przy zastosowaniu omawianej metody uzy¬ 
skano plazmę o koncentracji 10 14 cząstek/cm 3 i tem¬ 
peraturze Tj ^ 1,5 keV (przy absorpcji ok. 30% do¬ 
starczanej energii). 

Do metod rezonansowych zalicza się również tzw. 
stochastyczne grzanie elektronów, które można zrea¬ 
lizować w następujący sposób. Do szczeliny w metalo¬ 
wej przegrodzie komory eksperymentalnej przykłada 
się napięcie o częstości rzędu kilku MHz. Elektrony, 
które powstają w wyniku jonizacji gazu w tej komorze, 
dostają się do obszaru wytwarzanego pola i uzyskują 
wówczas dodatkową energię. Osiągana temperatura 
elektronowa jest proporcjonalna do wielkości (/(7) 2/3 , 
gdzie /—częstość stosowanego napięcia, U — jego 
amplituda. Wykorzystując powyższą metodę w pu¬ 
łapce typu stellarator uzyskano plazmę o koncentracji 
10 9 cząstek/cm 3 i temperaturze Te ~ 300 eV. 


Metody iniekcyjne 

Do napełniania pułapek magnetycznych (zwłaszcza 
pułapek typu otwartego) bardzo często stosowane są 
metody iniekcyjne, które polegają na wstrzeliwaniu 
do wnętrza pułapki strumienia gorącej plazmy, wiązki 
wysokoenergetycznych jonów lub szybkich atomów 
neutralnych. 

Do iniekcji plazmy stosowane są różnego typu mięk¬ 
in Sektory tory plazmowe (tzw. działa plazmowe). Najczęściej 
współosiowe w tym celu wykorzystuje się iniektory współosiowe 
typu Marshalla. Schemat budówy takiego iniektora 
przedstawiono na rys. 6. Jest on wyposażony w dwie 
cylindryczne i współosiowe elektrody. Jego zasada 
działania jest następująca: najpierw do obszaru mię¬ 
dzy elektrodami wpuszcza się impulsowo określoną 
ilość gazu pod normalnym ciśnieniem (np. wodoru 
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lub deuteru). Następnie elektrody iniektora przyłącza 
się do baterii naładowanych do wysokiego napięcia 
kondensatorów. Wyładowanie elektryczne, które roz- 
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Rys 6. Schemat współosiowego iniektora plazmowego (nazywa¬ 
nego także działem plazmowym lub koaksjalnym akceleratorem 
plazmy) 


wija się w obszarze międzyelektrodowym, powoduje 
jonizację wpuszczonego wcześniej gazu i utworzenie 
się warstwy plazmy, przez którą płynie prąd wyłado¬ 
wania. Pole magnetyczne, które towarzyszy przepły¬ 
wowi tego prądu, wywołuje przesuwanie i stopniowe 
przyspieszanie utworzonej warstwy plazmy w kierun¬ 
ku wylotu iniektora. W rezultacie z iniektora wyrzu¬ 
cany jest strumień wysokoenergetycznej plazmy lub 
oddzielne zgęstki plazmowe — tzw. plazmoidy. plazmoidy 

Oprócz współosiowych iniektorów plazmowych, 
do wytwarzania strumieni gorącej plazmy stosuje się 
również inne typy iniektorów, np. bezelektrodowe 
iniektory indukcyjne oraz iniektory typu Halla. 

W iniektorach indukcyjnych plazmę wytwarza się 
przez szybkie rozładowanie baterii kondensatorów 
przez spiralne uzwojenie, które otacza stożkową iniektory 
komorę szklaną lub ceramiczną. W czasie przepływu indukcyjne 
prądu przez uzwojenie pojawia się szybkozmienne 
pole magnetyczne, które indukuje wirowe pole elek¬ 
tryczne, wywołujące z kolei jonizację gazu i powstanie 
plazmy. Oddziaływanie z zewnętrznym polem mag¬ 
netycznym prowadzi w rezultacie do przyspieszenia 
wytworzonej plazmy. 

W iniektorach typu Halla wyładowanie plazmowe iniektory 
inicjowane jest w polu elektrycznym skrzyżowanym Halla 
z kwazistacjonarnym polem magnetycznym, np. we 
współosiowych iniektorach Halla stosuje się podłużne 
pole elektryczne E z oraz radialne pole magnetycz¬ 
ne B r . 

Interesującą odmianą iniektora plazmowego jest 
tzw. działo prętowe RPI, które opracowano w Instytu- 

szybkodziałający zawór izolator elektrody prętowe 



Rys. 7. Schemat plazmowego działa prętowego RPI, opracowa¬ 
nego w Instytucie Badań Jądrowych w Świerku. Ażurowa kon¬ 
strukcja elektrod ułatwia ruch cząstek naładowanych i umożliwia 
ogniskowanie strumienia plazmy wzdłuż osi układu 


























działo cie Badań Jądrowych w Świerku. Działo RPI ma rów- 
prętowe nież cylindryczne elektrody, ale — w odróżnieniu od 
RPI zwykłych iniektorów współosiowych — zbudowane 
są one z dużej liczby cienkich prętów ułożonych 
współosiowo na obwodzie cylindrycznych pierścieni 
(rys. 7). W czasie wyładowań elektrycznych cząstki 
naładowane mogą poruszać się swobodnie między 
prętami elektrod i ulegać przyspieszeniu. Ponieważ 
powierzchnia czynna elektrod jest w tym wypadku 
mniejsza niż w iniektorze z elektrodami pełnymi, wy¬ 
twarzana plazma może zawierać mniej zanieczyszczeń 
pochodzących z powierzchni elektrod iniektora. 

Omawiane wyżej iniektory mogą wytwarzać plaz- 
moidy o koncentracji 10 13 -10 15 cząstek/cm 3 , zależnie 
od typu iniektora i warunków jego pracy. Przy odpo¬ 
wiednim doborze warunków pracy iniektora wytwa¬ 
rzane plazmoidy mogą mieć bardzo duże prędkości 
rzędu 10 7 -10 8 cm/s, a ich średnia energia kinetyczna 
może osiągać wartość kilku keV. Ze względu na to, 
że znaczna część tej energii związana jest z ruchem 
uporządkowanym, a nie z chaotycznym ruchem ciepl¬ 
nym cząstek, temperatura wytwarzanej plazmy nie 
przekracza kilkuset eV (tj. kilku milionów kelwinów). 

Przy iniekcji plazmy do wnętrza pułapki magne¬ 
tycznej wstrzeliwana plazma musi pokonać barierę 
pola magnetycznego, co wpływa na obniżenie jej kon¬ 
centracji i prędkości, a w niektórych wypadkach —- 
także temperatury. Efekty te zależą od konfiguracji 
i natężenia pola magnetycznego pułapki. Stosując 
iniekcję plazmy w pułapkach otwartych typu Probko- 
tron uzyskano plazmę o koncentracji 10 a cząstek/cm 3 
i temperaturze Tj x 5 keV. W pułapkach typu stel- 
larator za pomocą iniektorów plazmowych uzyskano 
plazmę o koncentracji lCP-lO 11 cząstek/cm 3 i tempera¬ 
turze jonowej 30-100 eV. 


Iniekcja wysokoenergetycznych jonów 

Gorącą plazmę można również wytwarzać przez 
iniekcję do pułapek magnetycznych wiązek wysoko¬ 
energetycznych jonów, które uzyskuje się za pomocą 
akceleratorów cząstek naładowanych. Bardzo dobre 
rezultaty daje przy tym metoda polegająca na Wstrze¬ 
liwaniu jonów cząsteczkowych D*, które wewnątrz 
pułapki ulegają dysocjacji na neutralne atomy deuteru 
i jony atomowe D + . Neutralne atomy uciekają wów¬ 
czas z pułapki, unosząc pewną część energii i pędu, 
a jony D+ są zatrzymywane w polu magnetycznym, 
powodując jonizację (tzw. „wypalanie”) resztek gazu 
w komorze eksperymentalnej. 

układ DCX Omówiona metoda stosowana była w amerykań¬ 
skich urządzeniach DCX, których zasadę budowy 
przedstawiono na rys. 8, a widok ogólny na ilustracji 
46 (tabl. 12). W urządzeniach tych wstępna dyso- 
cjacja jonów D 2 następowała w łuku elektrycznym, 
który palił się między dwiema elektrodami umiesz¬ 
czonymi w pułapce magnetycznej typu zwierciadla- 
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Rys. 8. Zasada budowy amerykańskich urządzeń typu 
DCX. Wyładowanie łukowe powoduje dysocjacje wstrzeliwanych 
jonów molekularnych Dj\ a do utrzymywania gorącej plazmy słu¬ 
ży pułapka magnetyczna typu zwierciadlanego 


nego. Wysokoenergetyczne jony D + zderzając się 
z cząsteczkami pozostałego w komorze gazu wytwa¬ 
rzały obłok gorącej plazmy. Energii wstrzeliwanych 
jonów odpowiadała temperatura rzędu 6 miliardów K. 

Tak wysoką temperaturę uzyskiwała jednak tylko 
część cząstek plazmy; pozostałe cząstki miały tempe¬ 
raturę znacznie niższą. 

Iniekcja jonów była również stosowana w jednym 
z największych urządzeń radzieckich — w układzie 
OGRA. Komora tego układu miała średnicę ok. 2 m 
i długość ok. 20 m. W odróżnieniu od układów DCX, układ 
w układzie tym nie stosowano pomocniczego wyłado- OGRA 
wania łukowego, a dysocjacja jonów molekularnych 
następowała na skutek zderzeń tych jonów z neutral¬ 
nymi cząsteczkami pozostałego w komorze gazu. 
Podobnie jak w urządzeniach DCX w urządzeniu 
OGRA uzyskiwano temperatury setek milionów K. 


Iniekcja wysokoenergetycznych 
atomów neutralnych 

Plazma o bardzo wysokiej temperaturze może być 
wytwarzana także za pomocą intensywnych wiązek 
prędkich atomów neutralnych. Wiązki takie można 
uzyskać przepuszczając wiązkę wysokoenergetycz¬ 
nych jonów przez komorę zawierającą znaczną liczbę 
cząsteczek gazu. Część jonów wychwytuje elektrony 
i biegnie dalej jako prędkie atomy neutralne. Uzyska¬ 
ną w ten sposób wiązkę wysokoenergetycznych ato¬ 
mów neutralnych można następnie wprowadzić do 
pułapki magnetycznej, gdzie przy odpowiednio do¬ 
branych warunkach, atomy te ulegają ponownej joni¬ 
zacji tworząc plazmę o odpowiednio wysokiej tem¬ 
peraturze. 

Metoda ta wykorzystana została w amerykańskich 
urządzeniach Baseball, w angielskim układzie Pho- 
enix, a także w radzieckim urządzeniu OGRA II. 
W urządzeniach tych uzyskano plazmę o koncentracji 
10 8 -10 9 cząstek/cm 3 i maksymalnej temperaturze 
Tj * 20 keV (tj. 200 min K). 


Metody kompresji adiabatycznej 

W celu podwyższenia temperatury i koncentracji 
plazmy, która została wytworzona w procesie joniza¬ 
cji wstępnej lub iniekcji i znajduje się wewnątrz pu¬ 
łapki magnetycznej, można zastosować metodę kom¬ 
presji adiabatycznej. Polega ona na ściśnięciu plazmy 
w wyniku przyłożenia dodatkowego rosnącego pola 
magnetycznego. Jeżeli zmiany pola i objętości plazmy 
następują w sposób adiabatyczny, następuje wówczas 
wzrost gęstości i temperatury plazmy (rys. 9). 

Metoda kompresji adiabatycznej stosowana była 
dotychczas głównie w układach typu otwartego, np. w 
pułapkach zwierciadlanych uzyskano tą metodą plazmę 
o koncentracji 10 u cząstek/cm 3 i temperaturze Te ~ 

~ 10 keV. Ostatnio kompresja adiabatyczna stoso¬ 
wana jest coraz częściej także w pułapkach typu zam¬ 
kniętego, np. w amerykańskim układzie toroidalnym 
ATC przy pomocy tej metody udało się uzyskać z plaż- układ ATC 
my o koncentracji 4 10 13 cząstek/cm 3 i temperaturach 
Te 1 keV i Tj sj 200 eV — plazmę o koncentracji 
2-10 14 cząstek/cm 3 oraz temperaturach T e x 2 keV 
i Tj 600 eV. 

Inne metody grzania plazmy 

Do nagrzewania plazmy wykorzystuje się również 
zjawiska, które występują przy rozchodzeniu się fal 
o bardzo dużej amplitudzie — tzw. fal uderzeniowych wyko rzy sta- 
(-> Fale uderzeniowe). Do bardziej znanych zalicza nie fal ude- 
się przy tym metodę grzania plazmy za pomocą fal rzeniowych 
uderzeniowych, których grubość frontu jest mniejsza 
niż długość drogi swobodnej cząstek plazmy. Metoda 
ta różni się od omówionej wyżej metody grzania 
turbulencyjnego tym, że nie wymaga wymuszania 
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Rys. 10. Metoda „plasma focus”. Mechanizm formowania ognis¬ 
ka plazmowego w pobliżu wylotu iniektora współosiowego. 
Warstwa zjonizowanego gazu, przez którą przepływa prąd wy¬ 
ładowania, po wyrzuceniu z obszaru iniektora ulega odkształ¬ 
ceniu i radialnej kompresji. Na osi układu tworzy się wówczas 
obszar gęstej i bardzo gorącej plazmy. Obok seria zdjęć wylotu 
współosiowego iniektora plazmowego ukazująca różne fazy ogni¬ 
ska plazmowego 


plazma 



• uzwojenia, w których aktualnie płynie prąd 
O uzwojenia okresowo niezasilane 

Rys. 9. Adiabatyczna kompresja plazmy przez narastające pole 
magnetyczne. Wzrostowi natężenia pola towarzyszy zmniejszenie 
obszaru zajmowanego przez plazmę oraz wzrost koncentracji 
i temperatury ściskanej plazmy. Rysunki przedstawiają kolejne 
fazy zjawiska 

przepływu prądów wzdłuż linii sił pola magnetycz¬ 
nego. Brak jeszcze pełnej interpretacji teoretycznej 
tych zjawisk, eksperymentalnie jednak stwierdzono, 
że przy prędkościach znacznie większych od pręd¬ 
kości dźwięku w plazmie występuje anomalna lep¬ 
kość, co prowadzi do grzania jonów. Przy odpowied¬ 
nim doborze liczby Macha i innych parametrów moż¬ 
na tą metodą wytwarzać plazmę o określonym sto¬ 
sunku temperatur T e jTi i bardzo wysokiej tempera¬ 
turze elektronowej. 

W badaniach eksperymentalnych stosowane są bar¬ 
dzo często metody mieszane. Na przykład w niektó¬ 
rych układach zamkniętych wykorzystuje się najpierw 
grzanie omowe i rezonansowe, a następnie realizuje 
się kompresję adiabatyczną. Pozwala to poprawić 
parametry plazmy, zwiększyć jej koncentrację i tem¬ 
peraturę lub wydłużyć czas jej utrzymania. 

Ograniczone możliwości omówionych wyżej spo¬ 
sobów wytwarzania plazmy wysokotemperaturowej 
powodują, że nadal poszukuje się nowych, bardziej 
efektywnych metod. W ostatnich latach szczególnie 
intensywnie rozwinęły się badania nad wyładowania¬ 
mi typu plasma focus (ognisko plazmowe) oraz ba¬ 
dania nad wytwarzaniem gorącej plazmy za pomocą 
laserów. 


Wyładowanie typu plasma focus 

Metoda oparta na wyładowaniach typu plasma focus 
jest właściwie odmianą metody iniekcyjnej, w której 
stosuje się iniektory współosiowe o specjalnej kon¬ 
strukcji, przystosowane do pracy przy stosunkowo 
wysokim ciśnieniu gazu roboczego i dużych prądach 
wyładowania. W takich warunkach w obszarze mię- 
dzyelektrodowym iniektora może uformować się 
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wyraźna warstwa zjonizowanego gazu (tzw. warstwa 
prądowa), przez którą przepływa prawie cały prąd 
wyładowania. Pod wpływem sił elektrodynamicznych 
warstwa ta przesuwa się wzdłuż iniektora, a po dojś¬ 
ciu do końca elektrod ulega wygięciu i radialnej 
kompresji (rys. 10). 

Największa kompresja i nagrzanie plazmy wystę¬ 
puje na osi symetrii układu, w pobliżu końca elektro¬ 
dy wewnętrznej. W obszarze tym powstaje „ognisko 
plazmowe”, które w pewnych przypadkach może 
mieć bardzo małe rozmiary — średnicę rzędu 1 mm 
i długość rzędu kilku mm (efekt takiego ogniskowania 
ukazuje seria fotografii przedstawiona na rys. 10). 
W ognisku plazmowym można uzyskać plazmę o bar¬ 
dzo dużej koncentracji i bardzo wysokiej tempera¬ 
turze. W wielu eksperymentach typu plasma focus 
uzyskuje się plazmę o koncentracji 5-10 1# cząstek /cm* 
i temperaturze rzędu 2,5. keV. W największych ukła¬ 
dach osiągane są rekordowe koncentracje 10 20 czą¬ 
stek/cm 3 i temperatury ok. 6 keV. Mimo że czas 
życia otrzymywanej w ten sposób plazmy jest bardzo 
krótki (10 -8 -10~ 7 s), istnieją w niej warunki do wy¬ 
twarzania neutronów z reakcji syntezy jądrowej. Dla¬ 
tego podczas wyładowań typu plasma focus obser¬ 
wuje się silne impulsy promieniowania neutronowego. 
Średnia wydajność neutronów jest przy tym w przy¬ 
bliżeniu proporcjonalna do kwadratu energii kumu¬ 
lowanej w układzie przed wyładowaniem. W najwięk¬ 
szych działających obecnie układach typu plasma 
focus obserwuje się wytwarzanie 10 10 -10 12 neutronów 
na jedno wyładowanie. 

Uzyskanie bardzo dużych koncentracji i temperatur 
plazmy, a także silnych impulsów neutronowych, 
spowodowało duży wzrost zainteresowania wyłado¬ 
waniami plasma focus. Badania w tym kierunku pro¬ 
wadzone są w wielu krajach — w Stanach Zjednoczo¬ 
nych, w Związku Radzieckim, Wielkiej Brytanii, Re¬ 
publice Federalnej Niemiec i we Włoszech, a także 
w Polsce. 


Metody laserowe 

Kierunek badawczy, któremu poświęca się obecnie 
wiele uwagi, stanowią prace nad wytwarzaniem go¬ 
rącej plazmy za pomocą laserów. Metody takie opie¬ 
rają się głównie na wykorzystaniu impulsowych lase¬ 
rów wielkiej mocy. Jeżeli wiązka z takiego lasera jest 
ogniskowana w obszarze gazowym lub na powierz¬ 
chni ciała stałego i gęstość strumienia energii świetlnej 
w ognisku osiąga wartość 10 10 -10 12 W/cm 2 , następuje 
proces jonizacji i rozwija się wyładowanie plazmowe. 
Zjawisko to może być wykorzystane do wytwarzania 
plazmy o wysokiej temperaturze, ponieważ część pro¬ 
mieniowania lasera może być pochłaniana przez plaż- 














































mę powstającą w czasie rozwoju wyładowania. Kiedy 
stopień jonizacji gazu w obszarze przed nagrzaną 
plazmą osiąga dostatecznie dużą wartość, nowa warst¬ 
wa plazmy staje się nieprzepuszczalna dla rozpatry¬ 
wanego promieniowania. W ten sposób strefa pochła¬ 
niania przemieszcza się w kierunku lasera. Proces 
ten przebiega bardzo szybko (z prędkością rzędu 
10 7 cm/s) i uniemożliwia wydzielenie się całej energii 
impulsu w małym obszarze początkowego wyłado¬ 
wania, co utrudnia osiągnięcie bardzo wysokich tem¬ 
peratur. 


Utrzymywanie gorącej plazmy 

Plazmę jako zbiór cząstek naładowanych najłatwiej 
jest utrzymać w określonym obszarze przez otoczenie 
jej polem magnetycznym o odpowiedniej konfiguracji. 
Silne pola magnetyczne potrzebne do tego celu wy¬ 
twarza się za pomocą elektrycznych prądów przepusz¬ 
czanych przez specjalne uzwojenie zewnętrzne lub za 
pomocą prądów płynących przez badaną plazmę. 
Możliwe jest również połączenie obu tych sposobów. 


wiązka, laserowa 



wzmacniacz laserowy wielkiej mocy 

/ 


Rys. 11. Zasada eksperymentu, w którym gorąca plazma jest wytwarzana 
przez zogniskowanie bardzo silnej wiązki laserowej 
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Rys. 12. Schemat eksperymentu laserowego, w którym wysokotemperaturowa plazma była wytwarzana przez 9.wiązek laserowych 
Wiązki te oświetlały jednocześnie małą kulkę deuteryzowanego polietylenu (o promieniu 0,25 mm). Łączna energia impulsów lasero¬ 
wych osiągała 1300 J, a czas ich trwania wynosił 2-16 ns, co zapewniało bardzo dużą moc promieniowania 


Wielka moc współczesnych układów laserowych 
(10 12 -10 13 W przy czasie trwania impulsu 10 _11 -10~ 9 s) 
umożliwia jednak skuteczną jonizację cienkich folii 
metalowych i organicznych, drobnych cząsteczek 
deuterku litu lub małych kulek zamrożonego wodoru 
(deuteru). W eksperymentach tego typu (rys. 11) prze¬ 
ciętnie na jedno wyładowanie uzyskuje się 10 15 -10 17 
jonów o średniej energii 100-1000 eV. W celu zwięk¬ 
szenia energii i mocy dostarczanej do plazmy, a także 
dla uzyskania lepszej symetrii wyładowania najwięk¬ 
sze eksperymenty laserowe realizowane są w układach 
wielowiązkowych (rys. 12). W eksperymentach tego 
typu uzyskuje się plazmę o rekordowej koncentracji 
5 -10 22 cząstek na 1 cm 3 i temperaturze jonowej Tj » 
* 500 eV. 


Zjawisko pinchu 

Rozpatrzmy najpierw utrzymywanie plazmy za po¬ 
mocą pola magnetycznego wytwarzanego przez prąd 
elektryczny, który przepływa wzdłuż osi cylindrycznej 
kolumny plazmowej. Pole magnetyczne, które towa¬ 
rzyszy przepływowi tego prądu, ma wówczas kieru¬ 
nek azymutalny. Oddziaływanie takiego pola z po¬ 
osiowym prądem elektrycznym powoduje radialne 
ściśnięcie plazmy w cienki sznur plazmowy (rys. 13). 
Omawiane zjawisko nazywa się pinchem liniowym 
lub Z-pinchem (ang. pinch ‘ściskać’). Wykorzystując 
zjawisko Z-pinchu zbudowano wiele urządzeń do ba¬ 
dań plazmowych, np. przedstawiony na il. 47 (tabl. 
12) Columbus II. 


Z-pinch 
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Rys. 13. Zjawisko pinchu liniowego. Przepływowi prądu przez 
plazmę towarzyszy azymutalne pole magnetyczne. Zwiększenie 
natężenia prądu powoduje wzrost natężenia pola magnetycznego 
oraz ściśnięcie kolumny plazmowej w cienki sznur plazmowy 





Ściśnięcie sznura plazmowego może być również 
wywołane przez szybko narastające zewnętrzne pole 
magnetyczne B z . Takie pole można wytworzyć drogą 
rozładowania dużej baterii kondensatorów przez od¬ 
powiednio masywną cewkę. Natężenie prądu elek¬ 
trycznego w takiej cewce może osiągnąć miliony am- 
perów. W plazmie indukowane są wówczas silne prą¬ 
dy elektryczne l z o kierunku azymutalnym, które 
w oddziaływaniu z zewnętrznym polem B z wywołują 
ściśnięcie plazmy ku osi symetrii układu (rys. 14). 
Ze względu na kierunek prądów omawiany proces 
nazywa się theta-pinchem (0-pinch). Wykorzystując 
0*pinch zjawisko 0-pinchu zbudowano wiele urządzeń ba¬ 
dawczych, m.in. amerykańskie układy Scylla oraz 
angielski układ Thetatron. Zdjęcie ilustrujące ściska¬ 
nie plazmy w takim układzie przedstawia rys. 14b. 
W układach z 0-pinchem można wytwarzać plazmę 
o koncentracji 10 1# -10 17 cząstek/cm 3 i stosunkowo wy¬ 
sokich temperaturach T t « 0,3-1,5 keV i T } x 4 keV, 
ale czas jej utrzymywania jest bardzo krótki — 
rzędu 10 ps. 

Zasadniczą wadą omówionych wyżej układów typu 
Z-pinch lub 0-pinch jest krótki czas utrzymywania 
plazmy spowodowany szybką ucieczką cząstek nała- 
0-pinch dowanych przez oba końce komory eksperymentalnej, 
toroidalny Aby wyeliminować te straty w ostatnich latach pod¬ 
jęto badania 0-pinchu toroidalnego w układach zam¬ 
kniętych w kształcie pierścienia (rys. 15). W zwykłej 


prąd 1$ indukowany w plazmie 
cewka 

cylindryczna warstwa 
zjonizowanego 
gazu (plazmy) 


bateria kondensatorów 
do zasilania cewki 


kierunek wy - 
twarzanego pola 
magnetycznego kierunek kompresji 
plazmy 


/ 

iskiernik 


straty ^ 
cząstek plazmy 

obszar plazmowy po kompresji 

Rys. 14. Zjawisko 0-pinchu. a) Szybko narastające osiowe pole 
magnetyczne indukuje azymutalne prądy, które nagrzewają 
zjonizowany gaz, a następnie (pod wpływem działania sił elek¬ 
trodynamicznych) powodują ściskanie plazmy w kierunku osi 
układu, b) Zdjęcia kolejnych faz zjawiska wykonane wzdłuż 
osi cylindrycznej komory eksperymentalnej za pomocą ultra¬ 
szybkiej kamery fotograficznej w odstępach co 2 ps 
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Rys. 15. Zjawisko pinchu toroidalnego. Wzrostowi indukowanego 
w plazmie prądu towarzyszy zwiększenie pola magnetycznego, 
które powoduje ściskanie pierścienia plazmowego 


komorze toroidalnej na plazmę działają dodatkowe 
siły radialne, gdyż linie sił pola magnetycznego mają 
większą krzywiznę przy wewnętrznej stronie komory. 
Siły te dążą do przesunięcia sznura plazmy w stronę 
zewnętrznej ścianki torusa. Ich działanie można wy¬ 
eliminować stosując specjalną konfigurację sznura 
plazmowego, w której wewnętrzna powierzchnia plaz¬ 
mowego torusa jest odpowiednio „pofałdowana**. 
Siły naruszające stabilność można również skompen¬ 
sować w układzie toroidalnym, w którym indukowany 
jest dostatecznie silny prąd h. Pole magnetyczne po¬ 
chodzące od tego prądu nakłada się wtedy na zew¬ 
nętrzne pole magnetyczne i daje pole wypadkowe, 
którego linie sił owijają po linii śrubowej sznur plaz¬ 
mowy. Wyładowania tego typu noszą nazwę „screw- 
-pinch”. Największe urządzenie do badań 0-pinchu 
toroidalnego stanowi obecnie układ Scyllac (USA), 
w którym duża średnica toroidalnej komory próżnio¬ 
wej wynosi 4 m, a do wytwarzania pola magnetycz¬ 
nego wykorzystana jest bateria kondensatorów 
o energii 15 MJ. 


Pułapki megnetyczne typu otwartego 

Do utrzymywania gorącej plazmy w pożądanym ob¬ 
szarze stosuje się również układy z kwazistacjonar- 
nymi polami magnetycznymi — tzw. pułapki magne¬ 
tyczne. Najprostszymi pułapkami magnetycznymi są 
pułapki zwierciadlane (ang. mirror machines; rys. 16). 
W urządzeniach tych stosuje się uzwojenia zewnętrzne 
wytwarzające osiowe pole magnetyczne słabsze w 
środkowej części komory, a silniejsze na obu jej koń¬ 
cach. Zagęszczające się na końcach komory linie sił 
pola magnetycznego tworzą wówczas tzw. zwierciadła 
magnetyczne, które odbijają część uciekających z pla¬ 
zmy cząstek z powrotem do wnętrza komory. Cząstki, 
które mają zbyt dużą składową prędkość wzdłuż osi 
komory, uciekają z układu. 

W prostych pułapkach zwierciadlanych nie udało 
się jednak utrzymać plazmy o dużej gęstości, np. 
w największym tego typu układzie Ogra I (ZSRR) 
uzyskano plazmę o koncentracji n # 10 8 cząstek/cm 3 
i czasie utrzymania t tu 0,3 ms, a w układzie DCXII 
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(USA) plazmę o parametrach n a 8 *10 9 cząstek/cm 3 
oraz t ^ 30 ms. Inną wadą układów z pułapkami 
zwierciadlanymi było występowanie niestabilności 
magnetohydrodynamicznych. Niestabilności te można 
jednak wyeliminować przez zastosowanie pułapek 
typu „minimum-B”, w których pole magnetyczne 
pułapki wzrasta we wszystkich kierunkach od środka układu, 
„mini- np. pułapka typu „karo” (ang. cuspgeometry; rys. 17). 
mum-B" Ze względu na duże straty cząstek czas utrzymywania 


plazma kierunek prądu 



Rys. 16. Zasada budowy pułapki magnetycznej typu zwiercia¬ 
dlanego. Pole magnetyczne silniejsze na obu końcach komory 
powoduje zawracanie uciekających z plazmy cząstek naładowa¬ 
nych i działa jak zwierciadło magnetyczne 

plazmy w pułapkach karo jest krótki — wynosi zwy¬ 
kle kilkadziesiąt ps. W układach tego typu można 
jednak metodą iniekcji wytworzyć plazmę o koncen¬ 
tracji 10 13 -10 14 cząstek/cm 3 , co w rezultacie daje po¬ 
równywalne z pułapkami zwierciadlanymi wartości 
iloczynu nr. Pułapkami otwartymi typu minimum-B 
są również pułapki zwierciadlane z prętami stabiliza¬ 
cyjnymi (tzw. pułapki typu Joffe, rys. 18). Zbudowano 
szereg urządzeń eksperymentalnych tego typu, z któ¬ 
rych najbardziej znane są radzieckie Probkotrony. 
Osiągnięto w nich koncentrację plazmy rzędu 5 TO 9 
cząstek/cm 3 , temperaturę Tj x 4 keV oraz czas utrzy¬ 
mywania plazmy r ^ 10 ms, a więc znacznie dłuższy 
niż w układach typu karo. Pułapką tego typu był 
radziecki układ OGRA II (il. 50, tabl. 13). 

Zmniejszając tylko liczbę prętów do 4 i łącząc od¬ 
powiednio ich końce, zbudowano pułapki minimum-B 
z uzwojeniami w kształcie szwu na piłce tenisowej. 
Pułapki takie zastosowane są w układach eksperymen¬ 
talnych Baseball i Alice (USA), Phoenix (Anglia) oraz 
DECA II (Francja). W układach tego typu, stosując 
iniekcję wysokoenergetycznych cząstek neutralnych, 



Rys. 17. Zasada budowy pułapki magnetycznej typu karo. Prze¬ 
ciwnie skierowane pola magnetyczne tworzą obszar, który ma 
2 stożki ucieczki orapierścieniową szczelinę ucieczki w płasz¬ 
czyźnie symetrii układu. W środku tego obszaru występuje mi¬ 
nimum pola magnetycznego (minimum-B) 


uzyskano plazmę o koncentracji 2-10 8 cząstek/cm 3 
i czasie utrzymania 50 ms (Alice), a przy wyko¬ 
rzystaniu iniekcji strumieni plazmowych — plazmę 
o koncentracji 10 13 -10 l 4 cząstek/cm 3 , ale o krótszym 
czasie utrzymania 50 ps (DECA II). 

Omówione wyżej pułapki z minimum-B mają jed¬ 
nak istotną wadę; między równoległymi uzwojeniami 
stabilizacyjnymi występują liniowe szczeliny, przez 
które ucieka część cząstek plazmy. Wady tej pozba- 


cewkl elektromagnesu linie sił pola 



Rys. 18. Zasada budowy pułapki zwierciadlanej z prętami stabi¬ 
lizacyjnymi (pułapka typu Joffe). Prądy płynące przez prze¬ 
wody ułożone współosiowo na obwodzie cylindrycznej komory 
eksperymentalnej wytwarzają pola magnetyczne, które nakła¬ 
dają się na pole zwykłej pułapki zwierciadlanej. W rezultacie 
plazma wypełnia obszar pokazany w przekroju po prawej stronie 
rysunku 

wioną jest pułapka typu SM (Spherical Multipole ), 
którą opracowano w Instytucie Badań Jądrowych pułapka SM 
w Świerku. Pułapkę typu SM można zrealizować 
rozmieszczając symetrycznie na powierzchni kulistej 
komory próżniowej odpowiednio skierowane dipole 
magnetyczne, a w praktyce — silne elektromagnesy. 

Rozkład linii sił pola magnetycznego w takiej pułapce 
jest pokazany na ilustracji 51 (tabl. 13). Jak wynika 
z rozważań topologicznych i modelowych, w pułapce 
typu SM nie ma liniowych szczelin ucieczki plazmy, 
występuje natomiast pewna liczba wąskich stożków 
ucieczki. Przy odpowiednim doborze natężeń skła¬ 
dowych pól magnetycznych wszystkim stożkom ucie¬ 
czki w takiej pułapce może jednak odpowiadać kąt 
bryłowy mniejszy niż w innych pułapkach mini¬ 
mum-B. W przeprowadzonych dotychczas ekspery¬ 
mentach z pułapką SM uzyskano czas utrzymywania 
plazmy w przybliżeniu 3-krotnie dłuższy niż w kon¬ 
wencjonalnej pułapce typu karo. Prowadzi się obec¬ 
nie badania w celu uzyskania jeszcze lepszych para¬ 
metrów plazmy, np. przez wykorzystanie mieszanych 
pól magnetycznych — tzw. konfiguracji hybrydo¬ 
wych, oraz stosowanie różnych metod wytwarzania. 


Pułapki magnetyczne typu zamkniętego 

W ostatnich latach szczególnie intensywnie prowa¬ 
dzone były badania nad pułapkami magnetycznymi 
typu zamkniętego, których typowymi przykładami są 
układ toroidalny przedstawiony na rys. 19 oraz an¬ 
gielski układ ZETA. 

Wadą prostych układów toroidalnych jest występo¬ 
wanie radialnych nieskompensowanych gradientów 
pola magnetycznego, które wywołują przemieszczanie 
cząstek naładowanych w poprzek linii sił pola ogra- układy 
niczającego (ruchy dryfowe) i prowadzą do niestabil- toroidalne 
ności plazmy. Ruchy dryfowe można ograniczyć przez 
odpowiednie skręcenie linii sił pola magnetycznego, 
np. przez nadanie komorze kształtu ósemki lub przez 
zastosowanie skręconych uzwojeń ułożonych na ob¬ 
wodzie komory toroidalnej. Koncepcję tę wykorzysta¬ 
no budując amerykańskie układy toroidalne, które 
otrzymały nazwę stellaratorów (rys. 20), szereg urzą- stellaratory 
dzeń w Anglii, we Francji i NRF, a także radziecki 
stellarator Uragan (il. 48, tabl. 13). 
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tokamaki Innym rodzajem pułapek zamkniętych są układy 
toroidalne typu tokamak (ii. 49, tabl. 13), których 
zasadę budowy ilustruje rys. 22. W odróżnieniu od 
omówionych wyżej prostych układów toroidalnych 
(typu ZETA), w układach typu tokamak pole stabi¬ 
lizujące B z jest znacznie silniejsze od pola B<p. 

Wielką zaletą omówionych wyżej pułapek toroidal¬ 
nych jest brak możliwości ucieczki cząstek nałado¬ 
wanych wzdłuż linii sił pola magnetycznego. W pułap¬ 
kach tego typu, oprócz zwykłej dyfuzji cząstek spo¬ 
wodowanej zderzeniami binarnymi (dwucząstkowy- 



pierwotne uzwojenie 
transformatora 


linie sil pola magnetycznego, 
które towarzyszy prądowi wyładowania 


rdzeń transformatora 


układ zasilający 


toroidalna komora próżniowa 


Rys. 19. Zasada budowy zamkniętych pułapek magnetycznych 
typu toroidalnego. Plazma w komorze eksperymentalnej stanowi 
wtórne uzwojenie transformatora, co umożliwia indukowanie 
prądów powodujących wytwarzanie i nagrzewanie plazmy 



uzwojenie wytwarzające 


uzwojenie wytwarzające pole Bq 

Rys. 20. Zasada budowy pułapek typu stellarator. Dodatkowe 
uzwojenia powodują skręcenia linii sił wypadkowego pola mag¬ 
netycznego i wpływają stabilizująco na wyładowanie plazmowe. 
Na rysunku pominięto rdzeń transformatora, który się stosuje 
zwykle do zasilania wyładowań 


uzwojenia w postaci pierścieni 
wytwarzające pole B z 



komora próżniowa plazma 


przewodzący pierścień 
wytwarzający pole B<p 


Rys. 21. Zasada budowy pułapki Levitron. Wewnątrz toroidalnej 
komory otoczonej uzwojeniami stabilizującymi umieszczony jest 
pierścień z prądem, który wytwarza dodatkowe pole magnetyczne, 
stabilizujące plazmę 
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mi), występuje jednak dyfuzja anomalna, która po¬ 
woduje znaczne straty cząstek i zmniejsza czas życia 
plazmy. W ostatnich latach udowodniono jednak, że 
można stworzyć warunki, w których uzyskuje się 
znacznie dłuższy czas życia plazmy. W eksperymen¬ 
tach przeprowadzonych w stellaratorze Wendelstein 
w Garching (NRF) otrzymano czas utrzymania 
r » IOOtb — (gdzie t b — czas życia plazmy obliczo¬ 
ny teoretycznie), a w urządzeniach tokamak zbudo¬ 
wanych w Instytucie Energii Atomowej w Moskwie ut¬ 
rzymano plazmę o koncentracji (3-6) -10 13 cząstek/cm 3 , 
temperaturach T e x 1000eV (12 min K) i 7> « 700 eV 
(8 min K) przez czas r = 30r B (ok. 70 ms). 

W Moskwie zbudowano bardzo wiele układów 
typu tokamak, z których największy obecnie jest 
układ T-10. Duży promień toroidalnej komory tego 
układu wynosi 1,5 m, maksymalne pole magnety¬ 
czne Bz — 5 T, a prąd wyładowania 7 m ax = 500 kA. 
Parametry plazmy otrzymywanej w tokamakach są 
tak dobre, że nawet dla oszczędności czasu i środków 
w Princeton (USA) przebudowano na tokamak naj¬ 
większy stellarator amerykański — Model C (il. 49, 
tabl. 13). Podjęta została również budowa nowych 
tokamaków w USA, Anglii, Francji, NRF oraz 
w Japonii. Część tych układów jest obecnie budowana 
w ramach współpracy międzynarodowej. 

Równocześnie z pracami nad ulepszeniem pułapek 
toroidalnych wzrosło także zainteresowanie innymi 
pułapkami typu zamkniętego. Badania różnych ukła¬ 
dów zamkniętych wykazały jednak, że spełnienie wa¬ 
runków minimum-B jest topologicznie niemożliwe. 
W związku z tym zwrócono uwagę na możliwość za- 



metalowy torus komory próżniowej 




kierunek prądu 
stabilizującego 
wyładowanie 


kierunek 
wypadkowego pola 
magnetycznego 


Rys. 22. Zasada budowy pułapek typu tokamak. Sznur plaz¬ 
mowy utrzymywany jest polem magnetycznym pochodzącym 
od prądu wyładowania. Do stabilizacji wykorzystuje się silne 
pole magnetyczne B z , wytwarzane przez cewki umieszczone na 
obwodzie toroidalnej komory eksperymentalnęj. Linie sił wy¬ 
padkowego pola magnetycznego są silnie skręcone 



komora 

przewodzące pierścienie plazma próżniowa 

wytwarzające pole magnetyczne 

Rys. 23. Zasada budowy pułapki typu kwadrupola toroidalnego. 
Plazma jest utrzymywana głównie przez pole magnetyczne po¬ 
chodzące od prądów płynących w dwóch pierścieniowych uzwo¬ 
jeniach wewnętrznych. W analogiczny sposób można zbudować 
oktupol toroidalny lub układ jeszcze wyższego rzędu 


układ 

T-10 


























koncentracja plazmy, liczba cząstek/cm 


warunek pewnienia „średniego” minimum-B wzdłuż określo- 
average n ych torów ruchu cząstek plazmy (czyli tzw. average 
minimum-B minimum-B). Spełnienie warunku average mini¬ 
mum-B można osiągnąć nie tylko w stellaratorach 
i tokamakach, ale również w pułapkach typu Levi- 
tron lub spherator, w których wewnątrz toroidalnej 
(lub elipsoidalnej) komory umieszczone jest dodatko¬ 
we pierścieniowe uzwojenie z odpowiednio silnym 
prądem, Pole magnetyczne B* pochodzące od tego 
prądu nakłada się na pole toroidalne B z , wywołując 
„skręcenie” linii sił pola wypadkowego, W rezultacie 
plazma utrzymywana jest wokół pierścieniowego 
uzwojenia wewnętrznego (rys. 21). Inną odmianę pu¬ 
łapek zamkniętych, spełniających warunek average 
minimum-B, stanowią pułapki toroidalne ąuadrupo- 
lowe lub oktupolowe, w których wewnątrz toroidalnej 
komory umieszcza się odpowiednio 2 lub 4 pierścienie 
z prądem (rys. 23), W pułapkach tego typu plazma 
zajmuje obszar wokół i pomiędzy przewodzącymi 
pierścieniami, które zapewniają najlepszą stabilność 
magnetohydrodynamiczną. 

Porównując różne pułapki typu zamkniętego można 
stwierdzić, że największy postęp w technice otrzymy¬ 
wania i utrzymywania gorącej plazmy został dotych¬ 
czas osiągnięty w urządzeniach tokamak, dlatego 
też wysiłek wielu ośrodków badawczych skierowany 
jest obecnie na budowę i badanie dużych układów 
typu tokamak. Równocześnie prowadzi się badania 
w różnych innych kierunkach. 


Perspektywy dalszych osiągnięć 


Dotychczasowe osiągnięcia w dziedzinie badań ter¬ 
mojądrowych ujmuje wykres, na którym podane są 
podstawowe parametry wytwarzanej plazmy: jej tem- 



Rys. 24. Wykres zestawiający najlepsze wyniki, uzyskane w róż¬ 
nych urządzeniach do badań termojądrowych. Zaznaczone na 
rysunku płaszczyzny odpowiadają określonym wartościom ilo¬ 
czynu koncentracji n i czasu utrzymania plazmy r. Warunkiem 
uzyskania dodatniego bilansu energetycznego reakcji termoją¬ 
drowej w mieszaninie deuter-tryt o temperaturze powyżej 45 min 
K jest nz ^ 10* 4 s/cm 1 


peratura, gęstość oraz czas utrzymywania (rys. 24). 

Wykres umożliwia porównanie wyników, które udało 
się osiągnąć w różnych układach eksperymentalnych 
przy wykorzystaniu wyżej wymienionych metod wy¬ 
twarzania i nagrzewania plazmy. Na szczególną uwa¬ 
gę zasługują rekordowe wartości iloczynu koncentra¬ 
cji i czasu utrzymania plazmy (nr x 10 13 cm" 3 - s), 
które osiągnięto w ostatnich latach w niektórych 
urządzeniach typu plasma focus oraz w eksperymen¬ 
tach z laserem. 

Należy przy tym zauważyć, że nie ma zasadniczych 
trudności z wytworzeniem jonów o jeszcze większych 
energiach i uzyskaniem jeszcze wyższych temperatur. 

Poważne trudności związane są natomiast z utrzymy¬ 
waniem plazmy w izolacji w tak wysokich tempera¬ 
turach i dlatego ciągle poszukuje się nowych bardziej 
efektywnych metod. 

Potrzeba rozwoju badań termojądrowych zintensy¬ 
fikowała postęp w technice i technologii. W dziedzi¬ 
nie techniki wysokiej próżni zbudowano np. układy 
pompujące o próżni granicznej rzędu 10“ 7 Pa i wy¬ 
dajności wielu tysięcy l/s oraz opanowano technolo¬ 
gię wysokopróżniowych materiałów konstrukcyjnych, 
potrzebnych do budowy przyszłego reaktora termoją¬ 
drowego. Bardzo duży postęp nastąpił także w dzie¬ 
dzinie budowy elektromagnesów, zwłaszcza nadprze¬ 
wodzących, potrzebnych do utrzymywania gorącej 
plazmy. Wiele wysiłku włożono również w rozwój 
techniki wysokich napięć. 

Zbudowano generatory udarowe, zdolne do kumu¬ 
lowania energii do kilkunastu milionów dżuli i wy¬ 
twarzania impulsów prądowych o amplitudzie do kil¬ 
ku milionów amperów. 

W chwili obecnej istnieje już wiele wstępnych pro- technologia 
jektów technicznych reaktorów termojądrowych reaktorów 
o różnych zasadach działania. Projekty te opierają termo- 
się zwykle na założeniu, że w przyszłym reaktorze jądrowych 
termojądrowym komora próżniowa, która zawierać 
będzie gorącą plazmę, otoczona zostanie grubą war¬ 
stwą moderatora neutronów. Badania nad różnego 
typu materiałami wykazały, że ścianki takiej komory 



Rys. 25. Projekt konstrukcj i jednego z sektorów reaktora ter¬ 
mojądrowego z komorą toroidalną o średnicy zewnętrznej rzędu 
kilkunastu metrów 
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mogą być wykonane z niobu i molibdenu lub niobu 
i wanadu, a moderator — z czystego litu, ze stopu 
lit-beryl lub z eutektycznego związku (LiF) 2 BeF 2 . 
Umieszczone na zewnątrz moderatora uzwojenia 
elektromagnesów mogą być natomiast wykonane 
z materiałów nadprzewodzących pracujących w od¬ 
powiednio niskich temperaturach. Poza tym, przyszły 
reaktor termojądrowy musi mieć oczywiście odpo¬ 
wiednią konstrukcję wspierającą i specjalne osłony 
biologiczne. Schemat ideowy takiego reaktora przed¬ 
stawiono na rys. 25. 

Z analizy różnych możliwych konfiguracji wynika, 
że dla przyszłego reaktora termojądrowego korzystna 
byłaby konfiguracja typu tokamak (lub stellarator), 
o ile uda się uzyskać odpowiednio długi czas utrzy¬ 
mywania plazmy i zwiększyć osiągane wartości ilo¬ 
czynu nr. Obliczenia wykazały również możliwość 
wykorzystania konfiguracji typu otwartego (np. pu¬ 
łapek zwierciadlanych), pod warunkiem, że uda się 
opracować odpowiednio wydajny system iniekcyjny 
oraz ograniczyć straty cząstek naładowanych. Istnieją 
także projekty impulsowych reaktorów termojądro- 


Radioizotopy 

Lech Stolarczyk 

Jądro atomowe jest układem złożonym z protonów 
i neutronów silnie ze sobą związanych siłami jądro¬ 
wymi. Jądro o określonych liczbach protonów p i ne¬ 
utronów n (liczba atomowa Z i liczba masowa A) 
może znajdować się w jednym z możliwych dla niego 
kwantowych stanów energetycznych. Najtrwalszym 
nuklid stanem danego jądra (czyli inaczej nuklidu) jest stan 
o najniższej możliwej energii, czyli tzw. stan podsta¬ 
wowy. Jądra w stanie podstawowym bez ingerencji 
z zewnątrz albo trwają niezmienione — są to izotopy 
trwałe, albo z określonym prawdopodobieństwem 
ulegają samorzutnej reakcji (przemianie) jądrowej — 
są to izotopy promieniotwórcze, inaczej radioizotopy 
(-> Rozpady jąder). Samorzutna przemiana radioizo¬ 
topów w izotopy lub radioizotopy (na ogół innego 
pierwiastka) zachodzi przez emisję cząstek elementar¬ 
nych lub jąder (np. helu). Najważniejszymi samo¬ 
rzutnymi przemianami są: emisja £ + , /?", a, wychwyt 
K oraz samorzutna reakcja rozszczepienia. Rozszcze¬ 
pieniu ulegają tylko jądra najcięższe, nigdy nie jest 
to proces dominujący (np. dla izomeru kalifornu 
2 H m Cr stanowią one 3,1 % samorzutnych reakcji 
jądrowych, a dla uranu 238 U — ok. 10~ 4 %). 

Jądra powstające w reakcjach jądrowych są bardzo 
często w stanie wzbudzonym, mogą one ulec przemia¬ 
nie jądrowej albo w jednym lub kilku etapach wypro- 
mieniow'ać energię wzbudzenia w postaci fotonów 
(promieniowanie y) i przejść do stanu podstawowego, 
przemiana y Proces emisji promieniowania y, zwany przemianą y, 
jest na ogół bardzo szybki. Zwykle zachodzi on 
z prawdopodobieństwem bliskim 1 w ciągu czasu ok. 
10 -15 s. Zdarzają się jednak takie stany wzbudzone, 
w których przemiana y jest znacznie wolniejsza 
(mniej prawdopodobna), i wtedy jądro może trwać 
w takim stanie znacznie dłużej. Na przykład izotop 
bizmutu 2l0 Bi, trwały w stanie podstawowym, posiada 
taki stan wzbudzony, dla którego nawet po upływie 
milionów lat prawdopodobieństwo przejścia do stanu 
podstawowego jeszcze znacznie różni się od 1. Takie 
względnie trwałe stany wzbudzone izotopów nazy- 
stan meta- wamy stanami metatrwałymi. Jądra tego samego izo- 
trwały topu znajdujące się w różnych stanach (podstawowym 

1 metatrwałym) nazywamy izomerami. Izomery róż¬ 
nią się nieco masą. Izomeria jądrowa nie jest zjawis¬ 
kiem częstym, a tylko kilka izotopów ma więcej niż 

2 izomery. Jądra w stanie wzbudzonym, w szczegól¬ 
ności w stanie metatrwałym, są mniej trwałe od jąder 

izomer w stanie podstawowym; mogą one ulegać takim re- 


wych opartych na wykorzystaniu metod lasero¬ 
wych. 

Wszystkie przeprowadzone dotychczas obliczenia 
techniczne wskazują na to, że przyszłe reaktory ter¬ 
mojądrowe będą prawdopodobnie miały stosunkowo 
duże rozmiary (promień samej komory próżniowej — 
rzędu kilku do kilkunastu metrów). Moc tych reak¬ 
torów będzie prawdopodobnie osiągać wartości od 
kilku do kilkunastu gigawatów. 

Można śmiało powiedzieć, że ludzkość jest już bar¬ 
dzo blisko zdobycia nowego niewyczerpalnego źródła 
energii. Na drodze do tego celu piętrzą się jednak 
jeszcze poważne trudności, tak że nie sposób dokład¬ 
nie określić termin uruchomienia pierwszego reak¬ 
tora termojądrowego. 

L.A. Arcimowicz Czwarty stan materii , Warszawa 1972; 
J. Crussard Energia termojądrowa > Warszawa 1967; A.W. Czer- 
nietski Wstęp do fizyki plazmy, Warszawa 1971; D.A. Frank- 
Kamieniecki Plazma — czwarty stan materii , Warszawa 1963; 
W.F. Kalinin Termojądrowy reaktor przyszłości. Warszawa 1968; 
S. Kaliski Lasery — synteza termojądrowa , Warszawa 1975; 
J.G.Linhart Fizyka plazmy , Warszawa 1963; M. Sadowski 
Świat wysokich temperatur , Warszawa 1975; W. Zonn As¬ 
trofizyka ogólna , Warszawa 1955. 


akcjom, które byłyby niemożliwe, gdyby jądra były 
w stanie podstawowym. 

Izotopy i radioizotopy oznaczamy symbolami lite¬ 
rowymi odpowiedniego pierwiastka chemicznego do¬ 
pisując przed tymi symbolami u dołu liczbę Z, 
a u góry — liczbę A. W skróconym zapisie opuszcza¬ 
my liczbę Z, ponieważ jest ona zaszyfrowana w sym¬ 
bolu chemicznym. Wyjątkowo izotopy wodoru zapi¬ 
sujemy często innymi literami niż jego symbol che¬ 
miczny H: D od deuter i T od tryt. Symbole, w któ¬ 
rych po liczbie masowej dopisuje się literę m ozna¬ 
czają izomery w stanie wzbudzonym metatrwałym 
(np. 2l0 Bi to stan podstawowy, a 210m Bi to wspo¬ 
mniany, wyjątkowo trwały izomer wzbudzony). W wy¬ 
padku izomerii wielokrotnej oraz na oznaczenie 
innych niż metatrwałe stanów wzbudzonych posłu¬ 
gujemy się symbolami izotopu z odpowiednimi do¬ 
piskami, znakami (np. gwiazdka za symbolem) itp. 

Dobrą miarą trwałości izotopu jest okres połowicz- okres 
nego rozpadu / 1/2 , czyli czas, w ciągu którego połowa połowicznego 
jąder danego izotopu (izomeru) ulega rozpadowi, rozpadu 
Dla izotopów trwałych / 1/2 = oo. Im trwalszy radio¬ 
izotop, tym mniejsze prawdopodobieństw-o zajścia 
reakcji i tym dłuższe jest t lf2 . Radioizotopy o bardzo 
długich t lł2 (np. dłuższych od 10 17 lat ) są niewykry- 
walne. Podział izotopów na izotopy trwałe i radio¬ 
izotopy jest nieostry, zależny od dokładności metod 
pomiarowych. Istnieje nieliczna grupa izotopów', 
których nietrwałości nie można ani teoretycznie 
wykluczyć, ani doświadczalnie potwierdzić (zob. 
rys. 5, str. 221). Praktycznie granicą doświadczalnego 
zidentyfikowania nuklidu jako radioizotopu jest 
jego trwałość odpowiadająca nie krótszemu t lf2 niż 
10" 6 s. Granica ta nie jest oczywiście ostra. W pew¬ 
nym sensie umownie możemy więc radioizotopy 
określić jako nuklidy mające w stanie podstawowym 
(a w wypadku izomerów — w stanie metatrwałym) 
wartości t lf2 leżące w przedziale od 10” e s do 
10 17 lat. 

Jednak nawet w grupie izotopów trwałych możemy energia 
mówić o zróżnicowanej trwałości jąder. Miarą tej wiązania 
trwałości jest energia wiązania E n przypadająca na 
jeden nukleon. Najtrwalszymi jądrami są jądra z licz¬ 
bą masową 25 < A < 150, mające największą energię 
E n . Jądra o parzystych liczbach p i n (parzysto-parzy- 
ste) są na ogół trwalsze od jąder o jednej z tych liczb 
nieparzystej (nieparzysto-parzystych lub parzysto-nie- 
parzystych), a jądra nieparzysto-nieparzyste są zawsze 
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*i /2 = 1590 lat można wykryć przy zawartości w prób¬ 
ce 10“ 9 g; gdy radioizotop ma * 1/2 krótszy — wykry¬ 
walna ilość substancji jest znacznie mniejsza. 


Otrzymywanie radioizotopów 


Znanych izotopów jest blisko 1800, a tylko ok. 270 
to izotopy trwałe, resztę stanowią radioizotopy. Ale 
tylko nieliczne z nich występują w przyrodzie. W du¬ 
żych skupiskach spotyka się tylko radioizotopy 
o długich /j/ 2 , należące do pokazanych na rys. 1 
rodzin promieniotwórczych. Towarzyszą im w bardzo 
małych stężeniach krótkożyjące radioizotopy z tych 
rodzin. Wyodrębnienie poszczególnych radioizoto¬ 
pów ze źródeł naturalnych jest zawsze bardzo kosz¬ 
towne i rzadko opłacalne. Wiele różnych radioizoto¬ 
pów, ale w bardzo małych stężeniach, powstaje 
w reakcjach jądrowych inicjowanych przez promie¬ 
niowanie kosmiczne, np. izotop węgla l4 C występuje 
w atmosferycznym dwutlenku węgla CO z w stężeniu 
ok. 10~ 10 %. Izotop 14 C można wykryć w jeszcze 
znacznie mniejszym stężeniu, jednak otrzymywanie 
go ze środowiska naturalnego jest niemożliwe, a ściśle 
mówiąc byłoby ono niesłychanie kosztowne. Po¬ 
wszechnie w środowisku naturalnym występują też 
w małych stężeniach i inne radioizotopy o długim 
* 1 / 2 * np- izotop potasu 40 K. 

Przeprowadzane wybuchy jądrowe wprowadziły 
do środowiska naturalnego znaczne ilości różnych 
innych radioizotopów, z których trwalsze stanowią 
nawet poważne zagrożenie, głównie ze względu na 
wywołane ich promieniowaniem przyspieszanie de- 
generacyjnych mutacji, wzrost zachorowań na bia¬ 
łaczkę i in. I te radioizotopy nie mogą jednak być 
otrzymywane ze środowiska naturalnego. 


znacznie mniej trwałe. W tej ostatniej grupie spoty¬ 
kamy tylko cztery izotopy trwałe (D, e Li, 10 B oraz 
14 N). Pierwiastki o Z parzystym mają często po kilka 
trwałych izotopów i wiele radioizotopów, a pier¬ 
wiastki o Z nieparzystych tworzą znacznie mniej 
nuklidów o porównywalnej trwałości. Dla dużych 
liczb masowych energia E n maleje do zera i tak dla 
Z > 83 nie ma już izotopów trwałych, a dla Z < 83 
jedynie technet (nieparzyste Z = 43) nie ma żadnego 
trwałego izotopu. 


Metody radiometryczne 
pomiaru radioizotopów 

Najczęściej w pomiarach ilościowych wykorzystuje 
się zdolność cząstek naładowanych i promieni y 
do jonizacji ośrodka, do którego cząstka i promienie 
oddziały- trafiają (metody jonizacyjne). Cząstka a lub fi prze- 
wanie kazuje wzdłuż toru swego lotu energię cząsteczkom 
a, fi lub y ośrodka, a część tej energii zużywa się na wytworzenie 
z materią jonów. Fotony (a więc promienie y) mogą całą swą 
energię lub jej część przekazać jakiemuś elektronowi 
ośrodka (zjawisko fotoelektryczne lub efekt Compto- 
na), który wyrwany ze swego położenia przejmuje 
tę energię jako energię kinetyczną. W wypadku foto¬ 
nów o energii większej od 1,022 MeV możliwe jest 
zjawisko tworzenia par, w którym foton znika, a pow¬ 
staje para negaton-pozyton. Masa spoczynkowa 
powstałych cząstek równoważna jest energii 1,022 
MeV, a nadwyżka energii fotonu ponad tę wartość 
pojawia się jako energia kinetyczna tych cząstek. 
Wytworzone cząstki jonizują ośrodek wzdłuż swych 
torów, a spowolniony pozyton anihiluje następnie 
z którymś z elektronów (negatonów) ośrodka — 
obie cząstki znikają, a na ich miejsce pojawiają się 
dwa fotony o energii 0,511 MeV. Fotony te mogą dalej 
oddziaływać z ośrodkiem. We wszystkich więc wy¬ 
padkach ośrodek ulega jonizacji wzdłuż toru pier¬ 
wotnych lub wtórnych cząstek. 

Jeżeli jonizacja wywołana przez promienie a, fi lub 
y zajdzie w komorze z rozrzedzonym gazem i dołą¬ 
czonymi elektrodami, to przykładając do elektrod 
odpowiednie napięcie możemy „wyłapać” na elektro¬ 
dach cały ładunek wytworzonych jonów (liczniki 
proporcjonalne). Ponieważ każdy rodzaj promienio¬ 
wania musi przekazać ośrodkowi określoną energię 
licznik na wytworzenie określonej liczby (ładunku) jonów, 
proporcjo- liczniki proporcjonalne pozwalają zmierzyć energię 
nalny promieniowania przekazaną ośrodkowi. Gdy pro¬ 
mieniowanie jest bardzo słabe, pomiar taki staje się 
jednak niemożliwy. Można wtedy przyłożyć do elek¬ 
trod znacznie wyższe napięcie, tak aby wytwarzane 
przez promieniowanie jony ulegały przyspieszeniu 
w polu elektrycznym w komorze i wywoływały joni¬ 
zacje wtórne (liczniki Geigera-Mullera — GM). 
Każde trafienie cząstki jonizującej w licznik spowoduje 
licznik w tych warunkach przepływ prądu trwający od 1 ps 
Geigera- do 1 ms (zależnie od konstrukcji licznika). Licznik 
Mullera GM umożliwia zliczanie cząstek (lub fotonów) 
jonizujących trafiających w licznik. 

Zastąpienie gazu w komorze półprzewodnikiem 
znacznie rozszerza możliwości badawcze, a odpowied¬ 
nia konstrukcja detektorów (komór, liczników) 
promieniowania umożliwia tworzenie zestawów z de¬ 
tektorów i współpracujących z nimi urządzeń elektro¬ 
nicznych (tabl. 14, il. 53). Zmiany te umożliwiają 
ilościową i jakościową analizę promieniowania, czyli 
określenie ilości i energii cząstek emitowanych przez 
radioizotopy. 

Metody radiometryczne cechuje wysoka czułość 
i duża dokładność, dzięki czemu można szybko iden- 
warunek tyfikować i określać ilościowo różne radioizotopy, 
wykrywał- Warunkiem wykrywalności radioizotopu jest takie 
ności jego stężenie, aby w próbce zachodziło przynajmniej 
radioizotopu kilka rozpadów w ciągu sekundy. Izotop B26 Ra o 


Aktywacja neutronowa 

Ogromna większość wykorzystywanych radioizoto¬ 
pów jest celowo wytwarzana w specjalnie prowa¬ 
dzonych, kontrolowanych reakcjach jądrowych (-► 

Energia jądrowa). Z punktu widzenia techniki wy¬ 
twarzania radioizotopów w większych ilościach aktywacja 
najważniejsze są reakcje przebiegające w wyniku neutronowa 
trafienia w jądro neutronem (aktywacja neutronowa) 
oraz reakcje należące do szeregu konsekutywnych 
procesów samorzutnych, inicjowanych takim tra¬ 
fieniem. Reakcje te przeprowadza się na wielką skalę 
wprowadzając do kanałów reaktora jądrowego różne 
substancje, zwane ogólnie materiałami tarczowymi. 

W reakcji 59 Co-f n —► 60 Co otrzymuje się z trwałego otrzymy- 
izotopu kobaltu b9 Co radioaktywny izotop S0 Co, wanie 
stosowany na wielką skalę jako źródło użytecznego kobaltu 
promieniowania y. Radioizotopu 80 Co nie wyodręb- 60 Co 
nia się z masy macierzystego izotopu trwałego, ale 
wykorzystuje mieszaninę izotopów tym bogatszą 
w radioizotop, im większe było natężenie strumienia 
neutronów w reaktorze i im dłużej materiał tarczowy 
przebywał w kanałach reaktora. Podobnie w reakcji: 

“N-fJ/t-* l ?N* 1 iC4lH powstaje promienio¬ 
twórczy izotop węgla, który można chemicznie od¬ 
dzielić od macierzystego materiału tarczowego i prze¬ 
kształcić w potrzebny związek chemiczny. 

W analogicznych reakcjach otrzymuje się z trwa¬ 
łych izotopów Cl oraz cenne radioizotopy 
i|S i IIP. Wszystkie wymienione radioizotopy emitują 
promieniowanie fi ", któremu w wypadku 60 Co towa¬ 
rzyszy wtórna emisja dwóch fotonów y o energiach 
1,17 i 1,33 MeV emitowanych przez wzbudzony 60 Ni. 

Materiał tarczowy, w którym w kanałach reaktora 
powstały znaczne ilości radioizotopów, jest potężnym 
źródłem promieniowania i bezpośrednie zetknięcie 
się z nim byłoby zabójcze dla każdej istoty żywej. 

Dlatego wydobywanie tego materiału oraz jego dalsza 
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przeróbka mechaniczna (np. porcjowanie, pakowanie] 
lub chemiczna muszą być prowadzone w specjalnych 
komorach, zwanych gorącymi, izolowanych osłonami 
biologicznymi (ciężkie betony, ściany z cegieł ołowia¬ 
nych, wzierniki z grubego szkła ołowiowego itp.) za 
pomocą manipulatorów (il. 56, tabl. 15). Otrzymy¬ 
wane po obróbce próbki, kształtki itp. umieszcza się 
w specjalnych pojemnikach stanowiących właściwą 


biologiczną osłonę radioizotopu, która umożliwia 
bezpieczny transport (ii. 54, tabl. 14). 

Równorzędnym źródłem użytecznych radioizoto¬ 
pów jest sam proces łańcuchowego rozszczepienia 
przebiegający w materiale paliwowym reaktora. 
W jednym akcie rozszczepienia powstają dwa jądra, 
przy czym dla danych A i Z jądra macierzystego 
liczby masowe jąder produktów rozszczepienia wy¬ 



trwamy 
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244 



przeróbka 

wypalonego 

paliwa 

reaktoro¬ 

wego 


235,, 




aktynouran 



Rys. 1. Rodziny promieniotwórcze (historyczne nazwy radioizotopów podano w kolorze niebieskim) 


kazują rozrzut w granicach od 70 do ok. 160 z maksi¬ 
mami wokół wartości 95 i 140. Najważniejszymi, 
długożyjącymi radioizotopami powstającymi w ten 
sposób są 90 Sr (t Jrz ok. 19,9 lat), 137 Cs(/ 1/2 ok. 331 lat), 
95 Zr (t 1/2 ok. 65 dni), 91 Y (f 1/2 ok. 61 dni), *°Tc (/ 1/2 ok. 
2,12 lat), 140 Ba (/ 1/2 ok. 13,4 dni), 147 Pm(r 1/2 ok. 2,26 lat), 
103 Ru (/ 1/2 ok. 40 dni), I4, Cs(/ 1/2 ok. 282 dni). Obok 
nich powstają znaczne ilości innych, krócej żyjących 
radioizotopów. 

Wiele powstałych izotopów silnie pochłania neu¬ 
trony, co powoduje spowolnienie reakcji łańcuchowej, 
a z czasem jej zanik. Wyjmowanie paliwa wypalonego 
przeprowadza się jednak dopiero wtedy, gdy pochła¬ 
nianie neutronów przez wytworzone izotopy uniemoż¬ 
liwia dalszą pracę reaktora, a wówczas w paliwie po¬ 
wstają już tak wielkie ilości radioizotopów, że wy¬ 
palone paliwo jest ogromnym źródłem promieniowa¬ 
nia. Paliwo takie przechowuje się więc przez pewien 
czas w specjalnych schronach, a po zniknięciu w nim 
najkrócej żyjących, ale najsilniej promieniujących 
radioizotopów może być poddane przeróbce chemicz¬ 
nej. Urządzenia do przeróbki paliwa są jednak znacz¬ 
nie większe i kosztowniejsze od przedstawionych na 
il. 15 (tabl. 56) urządzeń do przeróbki zaktywowa- 
nego w kanałach reaktora materiału tarczowego. 
Obecnie przeróbkę taką prowadzą jedynie nieliczne 
kraje. Głównym jej celem nie jest uzyskanie radio¬ 
izotopów, ale odzyskanie zawartego w paliwie wy¬ 
palonym materiału rozszczepialnego, w szczególności 
uzyskanie wytworzonego plutonu. Radioizotopy 
wydziela się niejako ubocznie w ilościach określo¬ 
nych zapotrzebowaniem na nie. 

Niektóre radioizotopy otrzymywane z reakcji roz¬ 
szczepienia, zwłaszcza radioizotopy krótkożyjące 
(t lł2 rzędu kilku dni) można otrzymywać w zwykłych 
urządzeniach do przeróbki materiału tarczowego. 
Wprowadza się w tym celu materiał rozszczepialny 
do kanałów reaktora i wyjmuje go wcześniej niż pa¬ 
liwo wypalone. Na przykład 235 U wprowadzony do 
kanału reaktora ulega oczywiście reakcji rozszcze¬ 
pienia i gromadzą się w nim radioizotopy — pro¬ 
dukty rozszczepienia. Uran w kanale reaktora nie 
jest jednak prętem paliwowym, czas jego przebywania 


w reaktorze nie jest uzależniony od technologii pracy 
reaktora i wyjmuje się go z kanału wtedy, gdy na¬ 
gromadzą się w nim odpowiednie ilości potrzebnych 
radioizotopów. Aktywność takiego materiału roz- 
szczepieniowego jest wtedy jeszcze znacznie niższa 
od aktywności paliwa wypalonego. Dlatego wydzie¬ 
lanie radioizotopów można tu prowadzić w konwen¬ 
cjonalnych komorach gorących. Co więcej, radio¬ 
izotopy takie, podobnie jak i radioizotopy wytwa¬ 
rzane innymi sposobami, rozpadają się w czasie 
prowadzenia procesu ich wytwarzania, a więc w ten 
sposób osiąga się prawie stałe stężenie w czasie kilka¬ 
krotnie dłuższym od ich / 1/2 . Stąd optymalny czas 
przebywania 235 U w komorze w celu wytworzenia wytwarzanie 
izotopu "Mo (f 1/2 ok. 67 godzin) wynosi od kilkunastu 99Mo 
do kilkadziesięciu dni, a nie wiele miesięcy — aż do 
wypalenia się paliwa. Ten sam izotop można otrzy¬ 
mywać aktywując neutronem trwały izotop "Mo, 
ale wówczas nie można go chemicznie oddzielić od 
materiału tarczowego (ten sam pierwiastek). Dlatego 
stosowany w medycznej scyntygrafii radioizotopowej 
"Mo otrzymuje się opisaną metodą. 


Zastosowanie radioizotopów 


Radioizotopy długożyjące (f, /2 od godzin do tysięcy 
lat) wykorzystuje się w badaniach naukowych i tech¬ 
nice jako atomy znaczone. Niektóre radioizotopy, 
szczególnie z / 1/2 rzędu lat, są wygodnymi, o różnej 
wydajności lub aktywności źródłami promieniowania 
a, /?iy. Wreszcie radioizotopy krótkożyjące (t, /2 
często rzędu sekund), ale łatwo powstające z okre¬ 
ślonych izotopów trwałych pod wpływem zderzeń 
z neutronami lub fotonami, mają zastosowanie w 
chemii analitycznej w metodzie zwanej analizą akty¬ 
wacyjną. 

Pierwsze z wymienionych zastosowań pozwala 
badać mechanizm i kinetykę wielu reakcji chemicz¬ 
nych, procesów biologicznych i procesów związanych atomy 
z wędrówką materiałów (substancji, atomów, faz), znaczono 
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substancja Jeżeli np. jako jeden z substratów reakcji wprowadzi 
znaczona się substancję znaczoną, tzn. zawierającą w swym 
składzie izotopowym niewielką domieszkę określo¬ 
nego radioizotopu, to można śledzić, w jakim pro¬ 
dukcie reakcji, a nawet w jakim miejscu w molekule 
wbudowuje się ten radioizotop. Domieszkę radio¬ 
izotopu wprowadza się w takiej ilości, aby nie sta¬ 
nowiła ona zagrożenia ze względu na swoje promie¬ 
niowanie, a przy tym, żeby można było przeprowa¬ 
dzać pomiary metodami radiometrycznymi. 


Zastosowanie w medycynie 

Podobnie w badaniach fizjologicznych (np. w medy¬ 
cynie) dodając związki znaczone do pokarmu, leku 
czy wprowadzając do organizmu inną drogą (np. 
przez iniekcje) możemy śledzić w organizmie żywym 
ich drogę, badać gromadzenie się, przetwarzanie 
i wydalanie. W medycynie, szczególnie w diagnostyce, 
są stosowane dziesiątki, a może nawet setki różnych 
metod wykorzystujących radioizotopy jako atomy 
znaczone. 

Jedną z najnowszych metod z tej dziedziny jest 
scyntygrafia scyntygrafia radioizotopowa, omówiona dokładniej 
radioizoto- w artykule „Fizyka medyczna”. Wykorzystuje się tu 
topowa głównie izomer technetu 99m Tc o / 1/2 ok. 6 h, który 
emitując y przechodzi w znacznie trwalszy "Tc. 
Promieniowanie y tego procesu jest łatwo wykry¬ 
walne przy natężeniach jeszcze zupełnie nieszkodli¬ 
wych. Izomer " m Tc otrzymujemy z molibdenu w reak¬ 
cji "Mo —* -f 99m Tc. 

Do zakładu leczniczego dostarcza się tzw. generator 
technetu, czyli rurkę zawierającą radioizotop "Mo 
osadzony na podłożu. Tutaj powstały w generatorze 
izomer technetu " m Tc jest wymywany za pomocą 
standardowych zestawów odczynników i wprowa¬ 
dzany do organizmu badanej osoby, gdzie umiejsca¬ 
wia się na lub w odpowiednich narządach. Promienio¬ 
wanie y " m Tc pozwala badać te narządy, wykrywać 
w nich zmiany niedostrzegalne innymi metodami. 
Natężenie tego promieniowania jest niewielkie, a krót¬ 
ki / 1/2 sprawia, że maleje ono szybko w czasie. Dla¬ 
tego metoda jest nieszkodliwa dla badanych. Suma¬ 
ryczne dawki wprowadzonego do organizmu pro¬ 
mieniowania są w tej metodzie mniejsze, niż w prze¬ 
świetleniu promieniami rentgenowskimi. Powstały 
z "™Tc trwalszy radioizotop "Tc zawarty jest w ta¬ 
kich ilościach, że jego promieniowanie jest już nie 
tylko nieszkodliwe, ale praktycznie niewykrywalne. 


Zastosowanie w technice 

W technice szczególnie użyteczne okazują się radio¬ 
izotopy do śledzenia przebiegu procesów w niedo¬ 
stępnej z zewnątrz aparaturze, w reaktorach itp. 
Badanie radioizotopowe ustala rzeczywisty przebieg 
procesów w aparaturze, co pozwala na wykrycie 
i usunięcie nieprawidłowości, maksymalną wydajność 
i optymalizację procesów. W instalacjach, w których 
reagentami są ciecze lub gazy (np. przemysł rafine¬ 
ryjny, petrochemiczny, koksochemiczny itp.), wpro¬ 
wadza się rozpuszczalne lub lotne związki znaczone 
radioizotopami, a następnie radiometrycznie określa 
szybkości przepływu i czasy zatrzymania się reagen¬ 
tów w różnych częściach aparatury. Czujniki radio¬ 
metryczne umieszcza się na zewnątrz aparatury 
bezpośrednio przy miejscach badanych lub wprowa¬ 
dza się je do wnętrza aparatury lub rurociągu, 
bezpieczeń- Ilości radioizotopów i ich rodzaj tak są do- 
stwo pracy bierane, aby badania można było bezpiecznie prze¬ 
prowadzić z wymaganą dokładnością i aby końcowe 
stężenie wprowadzonego radioizotopu, rozcieńczo¬ 
nego materiałem nieaktywnym, było niższe od stę¬ 
żenia dopuszczalnego przepisami ochrony radiolo¬ 
gicznej, albo aby wprowadzony radioizotop po użyciu 
mógł być oddzielony i zabezpieczony w pojemniku. 


Nad spełnieniem tych wymogów czuwają w Polsce 
specjalnie przeszkoleni inspektorzy ochrony przed 
promieniowaniem, a nadzór nad ich szkoleniem 
i wszelką działalnością związaną z radioizotopami 
prowadzi Centralne Laboratorium Ochrony Radio¬ 
logicznej (CLOR). 

Badając procesy dotyczące sypkich ciał stałych 
radioizotop wprowadza się często w postaci grudek 
lub igiełek. Przykładem przemysłowego wykorzysta¬ 
nia metody atomów znaczonych może być badanie 
w Polsce w Wizowie i w NRD w Coswig przyczyn zastosowanie 
zaklejania się pieców cementowych. Po przeprowa- wcemen- 
dzeniu badania okazało się, że w wyniku fluidyzacji towni 
ruch materiałów w niektórych partiach pieców obro¬ 
towych był szybszy od przewidywanego i do strefy 
wysokotemperaturowej dostawał się nierozłożony 
siarczan wapnia. Wmontowanie w piece progów 
spowalniających ruch materiału pozwoliło na usu¬ 
nięcie tych nieprawidłowości. Przykłady takie można 
mnożyć. Na pewno jednak można powiedzieć, że 
upowszechnienie stosowania radioizotopowych me¬ 
tod badania procesów technologicznych stanowi 
jeden z podstawowych, ciągle jeszcze niedostatecznie 
wykorzystywanych czynników usprawniania techno¬ 
logii i poprawy zarówno jakości produktów, jak i eko¬ 
nomii ich wytwarzania. 

Innymi przykładami zastosowania radioizotopów wykrywanie 
jako atomów znaczonych mogą być: wykrywanie wad 
nieszczelności czynnych rurociągów (radioizotop urządzeń 
przenika przez nieszczelności i gromadzi się w ich technicznych 
pobliżu), badanie rozchodzenia się ścieków w zbior¬ 
nikach wodnych, badanie rozkładu zanieczyszczeń 
w atmosferze i wiele innych. 


Zastosowanie źródeł promieniowania 


Radioizotopy jako źródła promieniowania bywają 
wykorzystywane na wielką skalę w defektoskopii, 
czyli do wykrywania wad w odlewach, spawach 
i innych urządzeniach. Stosuje się tu niewielkie źródła 
przenikliwego promieniowania y, które łatwo jest 
wprowadzić w rozmaite zakamarki badanych obiek¬ 
tów i wykonać odpowiednie prześwietlenia. Radio¬ 
izotopowe źródełka można wprowadzać w miejsca, 
w których nie zmieściłaby się lampa rentgenowska 
i dlatego defektoskopia radioizotopowa jest znacznie 
wszechstronniejsza od rentgenowskiej, jakkolwiek 
zasady obu tych metod są takie same. 

Ilustracja 53 (tabl. 14) przedstawia jednoczesne defektosko* 
prześwietlanie sześciu zaworów tym samym defekto- pia radio- 
skopem zawierającym radioizotop 60 Co, obok wi- izotopowa 
dzimy jedno z otrzymanych w ten sposób zdjęć. 

Aktywność radioizotopu jest tak dobrana, aby prze¬ 
bywanie w pobliżu źródła w czasie potrzebnym na 
jego ustawienie lub usunięcie powodowało wprowa¬ 
dzenie do ciała operatora dawki znacznie mniejszej 
od dopuszczalnej. Natomiast wymagane naświetlenie 
kliszy osiąga się odpowiednio dobierając czas ekspo¬ 
zycji, w trakcie której operator nie jest potrzebny. 


Rys. 2. Schemat izoto¬ 
powego urządzenia do 
pomiaru grubości błon 


elektroda do układu 



Innym zastosowaniem radioizotopów jako źródeł 
promieniowania są rozmaite czujniki i wskaźniki; na 
rys. 2 widzimy schemat urządzenia do ciągłego po- 













miaru grubości błony opartego na zasadzie pochła¬ 
niania promieniowania /?. Z jednej strony błony 
znajduje się źródełko radioizotopowe, a z drugiej —- 
detektor radiometryczny. Sygnał z urządzenia może 
automatycznie korygować grubość produkowanej 
błony. Urządzenia tego typu można stosować do re¬ 
gulacji grubości, np. w produkcji papieru, blach 
w walcowniach i in. 

poziomo- Przykładami urządzeń o podobnej zasadzie dzia- 
mierz łania są: pływakowy poziomomierz izotopowy oraz 
wskaźnik poziomu cieczy w zbiorniku zaopatrzonym 


licznik 

promieniowania 



zamknięty promieniotwórczym 


promieniowanie to (drobna jego część) skierowuje 
się na tkankę nowotworową. Czas napromieniania 
dobiera się tak, aby tkanka nowotworowa uległa 



przeciwwaga i osłona personelu 


y trafiają 
w nowotwór 


Rys. 4. Schemat kanadyjskiej medycznej bomby kobaltowej 
Theratron 


zniszczeniu, a słabiej napromieniowane tkanki są¬ 
siednie doznały tylko odwracalnych zmian (np. 
możliwe do zagojenia rany) (rys. 4 oraz il. 52, tabl. 14). 

Jeszcze silniejsze źródła promieniowania y stosuje sterylizacja 
się w niektórych procesach technologicznych — 
np. w produkcji sprzętu medycznego jednorazowego 
zastosowania oraz sterylnych opatrunków. Stosowa¬ 
ne tu radioizotopy to głównie kobalt 60 Co, a także na 
mniejszą skalę cez 157 Cs. Moc promieniowania y 
emitowanego przez te źródła nieraz przekracza 
10 kW. 


Analiza aktywacyjna 


wskaźnik natężenia 
promieniowania' 



zbiornik zamknięty 



izotopowe 


promieniowania 


której 
przesuwa się 
licznik 

promieniowania 


przesuwa się 
źródło z izotopem 
promieniotwórczym 


Rys. 3. Schematy poziomomierzy izotopowych: a) poziomomierz 
pływakowy; b) poziomomierz ze źródłem umieszczonym na 
zewnątrz zbiornika 


w zewnętrzne źródło promieniowania (rys. 3). W po- 
ziomomierzach pływakowych wykorzystuje się fakt, że 
promieniowanie jest znacznie silniej pochłaniane przez 
ciała stałe i ciecze niż przez gaz, a w działaniu pozio- 
momierza odgrywa głównie rolę zmniejszanie się 
natężenia promieniowania w miarę oddalania się 
detektora od źródła punktowego, 
bomba Znacznie większe źródła promieniowania są sto- 
kobaltowa sowane w medycynie do niszczenia tkanek nowotwo¬ 
rowych. Są to tzw. bomby kobaltowe, czyli źródła 
zawierające (w odpowiedniej osłonie) radioizotop 60 Co 
w takiej ilości, że wypromieniowywana przezeń 
energia promieniowania y ma moc ok. jednego lub 
kilku watów. Przez zastosowanie specjalnych osłon 


Trzecią ważną dziedziną niejako pośredniego wyko¬ 
rzystania radioizotopu jest analiza aktywacyjna. 

Metoda ta, jak już wspomnieliśmy, polega na napro¬ 
mienieniu, najczęściej neutronami, a czasem fotonami 
o energii regulowanej w zakresie od 10 do 30 MeV, 
badanych próbek i analizie emitowanego po aktywacji aktywacja 
promieniowania. W czasie aktywacji neutronowej neutronami 
z izotopów trwałych powstają w próbce możliwe do j fotonami 
wykrycia i zidentyfikowania radioizotopy. W akty¬ 
wacji fotonami niektóre trwałe izotopy z próbki 
ulegają wzbudzeniu i emitują promieniowanie y. 

Obserwujemy wtedy rozproszenie promieniowania 
padającego, występujące rezonansową dla energii 
odpowiadających energiom wzbudzenia i emisji y 
izotopów trwałych zawartych w próbce. Aktywacja 
fotonami może również wywoływać rozpady wzbu¬ 
dzonych energetycznie jąder, co prowadzi do powsta¬ 
wania wykrywalnych radiometrycznie radioizotopów. 

Ilość każdego powstałego radioizotopu jest w danych 
warunkach aktywacji proporcjonalna do ilości ma¬ 
cierzystego izotopu trwałego, analiza aktywacyjna 
pozwala zatem na wykrycie i oznaczenie ilością ma¬ 
cierzystych izotopów trwałych w badanej próbce. 

W wypadku rozpraszania rezonansowego te same 
informacje uzyskuje się na podstawie analizy promie¬ 
niowania pochłanianego i rozpraszanego. Czułość czułosc 
analizy aktywacyjnej przewyższa znacznie nie tylko analizy akty- 
czułość tradycyjnych metod chemicznych, ale i ana- wacyjnej 
lizy spektralnej. Co więcej, analiza aktywacyjna 
pozwala na określenie zawartości wielu pierwiastków, 
których widmo spektralne leży w dalekim nadfiolecie 
i które z tego względu nie są wykrywalne zwykłymi 
metodami spektralnymi. 

Aktywację neutronową nieraz prowadzi się w kana¬ 
łach reaktora, ale wtedy nie można wykorzystać 
wielu przydatnych w analizie aktywacyjnej radioizo¬ 
topów o krótkim r 1/2 . Dlatego lepsze są inne źródła 
neutronów aktywujących próbki. Często stosuje się 
np. źródła radowo-berylowe, w których zachodzą 
reakcje: 226 Ra — 222 Rn+ 4 He i JHe-f-JBe -> CJQ -*■ 

12 C-ro"- Natężenie neutronów z takiego źródła 
jest jednak słabe, co ogranicza czułość metody. Nąj- 
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większe możliwości w nowoczesnej analizie aktywa¬ 
cyjnej stwarza generator neutronów złożony z akcele¬ 
ratora przyspieszającego jądra deuteru D i wstrzeli- 
wującego je w tarczę z tytanu lub cyrkonu nasyco¬ 
nego trytem T. Jądra deuteru otrzymuje się w proce¬ 
sie hydrolizy ciężkiej wody, które następnie w zmien¬ 
nym polu elektrycznym wielkiej częstotliwości (w tzw. 
źródle jonów) ulegają dysocjacji. Otrzymywane jądra 
deuteru przyspieszane napięciem 150-200 kV tra¬ 
fiają w jądra trytu i zachodzi reakcja syntezy jądrowej 
fD-f-JT -> JHe+Jtf. Powstałe neutrony mają energię 
14 MeV. 

Aktywacja fotonami jest metodą uzupełniającą, 
ponieważ jest dla pewnych pierwiastków lepsza, 
a dla innych gorsza od aktywacji neutronowej. Wzbu¬ 
dzona radioaktywność próbek badanych analizą 
aktywacyjną jest na tyle krótkotrwała i słaba, że 
można analizę aktywacyjną zaliczyć do grupy metod 
nieniszczących. 

Ilustracją czułości analizy aktywacyjnej może być 
zastosowanie przykład jej wykorzystania w kryminalistyce do okre- 
w kry mi- ślania, z jakiej odległości (w zakresie od 0 do 4 m) 
nalistyce został oddany strzał do ofiary. Badanie polega na 
określeniu ilości i rozmieszczenia antymonu osadzo¬ 
nego na ciele (ubraniu) ofiary w pobliżu wlotu po¬ 
cisku, a wydzielonego podczas wybuchu spłonki 
z zawartego w niej siarczku antymonowego. Obłok 
siarczku antymonowego w miarę oddalania się od 
wylotu lufy staje się większy i rzadszy. W wypadku 
strzału z odległości 2 m w pobliżu wlotu pocisku 
osadza się ok. 10 _9 g antymonu. Po strzale z bliższej 
odległości ilość osadzonego antymonu jest większa 
i jest on osadzony bliżej wlotu. Problem ustalenia 
J odległości strzału bywa nieraz najważniejszy w wy¬ 
padku istnienia alternatywy samobójstwa lub mor¬ 
derstwa. 


Datowanie promieniotwórcze 

Oprócz wymienionych głównych dziedzin zastosowań 
radioizotopów istnieją inne, nie mieszczące się w po¬ 
wyższej klasyfikacji. Najważniejszą ich grupę sta¬ 
nowią metody datowania promieniotwórczego, wy¬ 
korzystujące stałość okresu / 1/2 . Najbardziej znaną 
metodą tego rodzaju jest określanie zawartości radio¬ 
izotopu 14 C w szczątkach organicznych. Radioizotop 
ten pod wpływem promieniowania kosmicznego 
nieustannie powstaje w atmosferze z zawartego w niej 
azotu 14 N i nieustannie rozpada się z = 5740 lat. 
Oba procesy prowadzą do wytworzenia się w atmo¬ 
sferycznym dwutlenku węgla C0 2 izotopu 14 C o sta¬ 
łym, ale bardzo małym natężeniu. W procesie foto¬ 
syntezy CO* izotop przyswajają organizmy żywe, 


a w skorupach korali, mięczaków i in. związany 
jest z wapniem Ca w CaCÓ 3 . Po ustaniu procesów 
życiowych ustaje też przyswajanie 14 C z atmosferycz¬ 
nego C0 2 i w szczątkach organicznych oraz w wytwo¬ 
rzonym wapieniu zawartość 14 C spada w czasie. Mie¬ 
rząc stężenie 14 C można więc określić, jak dawno zo¬ 
stały wytworzone badane szczątki organiczne lub 
wapienie. Czułość metody pozwala na datowanie 
próbek nie starszych niż 70 000 lat. Do oznaczania 
wieku starszych próbek geologicznych (rzędu milio¬ 
nów lat) można wykorzystać słabo promieniotwórczy, 
naturalny radioizotop potasu 4<ł K o / 1/2 = ok. 1,3 10 9 
lat. Radioizotop ten emituje pozyton i przekształca 
się w trwały izotop argonu 40 Ar, wykrywalny w bar¬ 
dzo małych stężeniach metodami analizy aktywa¬ 
cyjnej. Wytworzony argon pozostaje uwięziony w 
skale zawierającej radioaktywny potas. Czas upły¬ 
wający od wytworzenia się skały można obliczyć 
oznaczając w niej stosunek stężeń 40 Ar do 40 K. 

Wskaźniki radioizotopowe można wykorzystać 
również do niezawodnego określenia daty produkcji kontrola 
wyrobów przemysłowych, których czas używalności terminu 
jest ściśle ograniczony. W tym celu wystarczy dodać ważności 
do wyrobu dwa radioizotopy o różnych / 1/2 w okre- produktów 
ślonym stosunku stężeń, a po pewnym czasie z po¬ 
miarów radiometrycznych określić stosunek ich stę¬ 
żeń. Inaczej mówiąc — wprowadzamy do wyrobu 
wewnętrzny zegar izotopowy. Dodane ilości radio¬ 
izotopów muszą być oczywiście bezpiecznie małe. 

Zegar izotopowy jest niezależny od dalszych procesów 
technologicznych, jak np. porcjowanie, pakowanie. 

Podane przykłady nie wyczerpują wszystkich moż¬ 
liwych zastosowań radioizotopów w różnych dzie¬ 
dzinach nauki, techniki. Wystarczy powiedzieć, że 
katalogi producentów związków znaczonych za¬ 
wierają tysiące pozycji i wszystkie one znajdują od¬ 
biorców. 

W Polsce radioizotopy i związki znaczone produku¬ 
je Ośrodek Produkcji i Dystrybucji Izotopów (OPiDI) 
w Świerku koło Otwocka. Ośrodek OPiDI zajmuje się 
nie tylko dystrybucją zwiąków znaczonych i radio¬ 
izotopów wyprodukowanych w kraju, ale i importo¬ 
wanych z zagranicy. Ze względów ekonomicznych 
i technicznych w Polsce nie prowadzi się przeróbki 
paliwa wypalonego, a radioizotopy produkuje się 
w kanałach reaktorów Instytutu Badań Jądrowych 
(IBJ) w Świerku. Z tych radioizotopów w OPiDI 
tworzy się (dozowanie, pakowanie) źródła wzorcowe, 
źródła dla defektoskopii i innych celów oraz wyrabia 
i pakuje związki znaczone. W OPiDI wyrabia się 
również wspomniane uprzednio generatory technetu 
dla medycyny. 

R. Szepke Radiometria stosowana , Warszawa 1967; W. Szy 
mański Wstęp do fizykochemii jądrowej, Toruń 1974; O. WOL- 
czek Izotopy ,Warszawa 1965. 
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CHEMIA KWANTOWA 

Józef Stanisław Kwiatkowski 


W trakcie wyko¬ 
nywania badań 
zarówno doświad¬ 
czalnych^ jak i te¬ 
oretycznych otrzy¬ 
muje się czasami 
nieoczekwane wy¬ 
niki. Obok podany 
rysunek przedsta¬ 
wia obliczone przez 
fizyków jądrowych 
war sf wice gęsto¬ 
ści dla jądra 32 S. 
Czyżby odkryto 
„szczęśli we ” jądro 
atomowe? 

Kiedy przed pięćdziesięciu laty powstała mechanika 
kwantowa, i kiedy z powodzeniem zaczęto stosować 
jej prawa do wyjaśniania elementarnych zjawisk 
zachodzących w mikroświecie atomów i cząsteczek, 
zaczęto rozumieć, że w teorii kwantów sformułowane 
zostały podstawowe prawa obejmujące znaczną część 
fizyki, całą chemię, a nawet niektóre zjawiska biolo¬ 
giczne. Przedmiotem chemii kwantowej jest zastoso¬ 
wanie mechaniki kwantowej do opisu budowy ato¬ 
mów i cząsteczek, oddziaływań między nimi i ele¬ 
mentarnych procesów chemicznych. W realizacji tego 
napotykamy jednak poważne trudności, gdyż prawa 
mechaniki kwantowej wymagają stosowania równań, 
których nie można rozwiązać ściśle. Ta trudność 
matematyczna przez długi czas hamowała rozwój 
chemii kwantowej. Wprowadzano wiele drastycznych 
przybliżeń do teorii kwantowej, ograniczając się do 
jakościowego wyjaśniania własności cząsteczek. 

Pojawienie się i rozwój elektronicznych maszyn 
cyfrowych (komputerów) nastąpił niezwykle szybki 
rozwój chemii kwantowej. Obecnie możemy obliczać 
i przewidywać wiele własności cząsteczek bez zna¬ 
jomości wartości doświadczalnych dla tych układów. 
Dzięki rozwojowi techniki obliczeniowej możemy 
uzyskiwać dla małych cząsteczek teoretyczne wartości 
fizyczne o dokładności porównywalnej z dokładnością 
najprecyzyjniejszych pomiarów lub przekraczającej 
dokładności tych pomiarów. Również dla większych 
cząsteczek w wielu wypadkach teoria może z powo¬ 
dzeniem współzawodniczyć z doświadczeniem w prze- 
chemia widywaniu ich własności, 
kwantowa Metody obliczeniowe chemii kwantowej stanowią 
jako jakby „teoretyczną technikę pomiarową” lub „przy- 
narzędzie rządy teoretyczne”, których zdolność rozdzielcza 



(dokładność) zwiększa się z dnia na dzień. W chwili 
obecnej zdolność rozdzielcza „przyrządów teoretycz¬ 
nych” dla małych układów jest bardzo duża, nato¬ 
miast dla układów dużych zdolność rozdzielcza jest 
jeszcze mała, chociaż i w tym wypadku metody obli¬ 
czeniowe chemii kwantowej mają czasami przewagę 
nad pomiarami doświadczalnymi. Możemy bowiem 
obliczyć takie wartości, które dla cząstek są bardzo 
trudne do zmierzenia lub w ogóle nie są mierzalne 
(np. próbka nie jest rozpuszczalna lub związek che¬ 
miczny występuje w tak rzadkiej formie tautome- 
rycznej, że nie można dokonać pomiaru). 

Coraz częściej więc chemicy zastanawiają się, czy 
jakąś konkretną wielkość fizyczną cząsteczki mierzyć, 
czy też lepiej ją obliczyć, rezygnując czasami z bardzo 
pracochłonnych i uciążliwych pomiarów na rzecz 
wartości teoretycznej, która jest wprawdzie mniej 
dokładna (powiedzmy, że dokładność jest rzędu 
10-15%), ale którą otrzymuje się stosunkowo szybko. 
Coraz częściej w pracach chemicznych konfrontuje 
się wartości mierzone z wartościami obliczonymi lub 
używa się poglądowych metod chemii kwantowej do 
wyjaśnienia faktów doświadczalnych. Chemia kwan¬ 
towa zajmuje się bowiem nie tylko obliczeniami z za¬ 
stosowaniem komputerów, ale głównie teoretycznym 
wyjaśnianiem podstawowych zjawisk przyrody (w jaki 
sposób atomy łączą się tworząc cząsteczki, dla¬ 
czego określona cząsteczka ma takie a nie inne 
własności itp.), formułowaniem ogólnych praw 
dotyczących układów chemicznych oraz wyjaśnia¬ 
niem własności konkretnych układów. Chemia 
kwantowa przekłada również abstrakcyjny język 
mechaniki kwantowej na język poglądowy, tworząc 
np. poglądowy model cząsteczki i jej oddziaływania 
z otoczeniem. Oczywiście model ten musi być zgodny 
z prawami mechaniki kwantowej. Od mechaniki 
kwantowej, jak od każdej innej teorii fizycznej, 
oczekujemy wyjaśniania znanych faktów doświadczal¬ 
nych i przewidywania nowych. 

Konfrontacja naszych wyobrażeń o świecie atomów 
i cząsteczek z faktami doświadczalnymi potwierdza jak 
dotąd słuszność naszych poglądów na budowę ukła¬ 
dów chemicznych. Należy zdawać sobie jednak spra¬ 
wę, że zgodność wyników teoretycznych z doświad¬ 
czeniem nie jest nigdy bezwzględnym potwierdzeniem 
teorii, gdyż każda teoria (a więc i mechanika kwanto¬ 
wa) ma ograniczony zakres stosowalności. Wcześniej 
czy później zostaną wykonane doświadczenia, których 
wyniki będą sprzeczne z teorią uznawaną obecnie za 
słuszną. I chociaż zostanie stworzona nowa teoria, to 


dokładność 

obliczeń 

kwantowych 


chemia 
kwantowa 
jako teoria 
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stara teoria będzie nadal stosowana, tylko granice jej 
stosowalności zostaną zawężone i dokładniej sprecyzo¬ 
wane. Omawiana tutaj chemia kwantowa jest nierela- 
tywistyczną mechaniką kwantową atomów i cząste¬ 
czek. Jest to więc metoda przybliżona, nie uwzględnia¬ 
jąca wielu subtelnych efektów związanych z zależ¬ 
nością masy od prędkości. Wszystkie dotychczasowe 
wyniki świadczą jednak o tym, że nierelatywistyczna 
chemia kwantowa, z wyjątkiem bardzo nielicznych 
wypadków, zadowalająco opisuje układy chemiczne 
i zachodzące w nich procesy. 


Fizyczne określenie układu 
chemicznego 


Chemicznie interesującym układem może być atom, 
jon, cząsteczka, kompleks molekularny, cały kryształ 
lub zespół atomów, jonów, cząsteczek itd. poruszają¬ 
cych się względem siebie lub biorących udział w rea¬ 
kcji chemicznej. Każdy z tych układów składa się 
z zespołu jąder atomowych i elektronów, które od¬ 
działują ze sobą za pomocą sił elektrostatycznych; 
ruchy tych zespołów opisane są prawami mechaniki 
kwantowej. 

funkcja Dwoma podstawowymi pojęciami mechaniki kwan- 
falowa towej są funkcja falowa i operator. Funkcja falowa 
a stan opisuje stan układu, tj. stan zespołu jąder atomowych 
układu i elektronów układu. Innymi słowy, funkcja falowa 
układu dla określonego stanu określa wszystkie wła¬ 
sności cząstek * danym stanie. Funkcja falowa 


Funkcja falowa, gęstość prawdopodobieństwa, prawdopo¬ 
dobieństwo 


Wielkość 

Zapis 

Funkcja falowa stanu stacjo¬ 

PC*,*. 

Zl>X t ,y Sf Z. . Xn,yn,Z„) 

narnego n cząstek 

lub 1P(1,2, n) 

Gęstość prawdopodobień¬ 

Pi 1,2,... 

, n) >= 

stwa w stanie opisanym ~ 
funkcją V 

= ^(1,2, 

.n)!P*(l,2,...,n) 

Prawdopodobieństwo znale¬ 
zienia cząstki 1. w elemen¬ 
cie objętości dv , = dx x dy 1 dz l 
przy zupełnie dowolnych 
położeniach pozostałych 

cząstek 

Prawdopodobieństwo znale¬ 

p0»2, ... 

>n)dv i 

zienia cząstki 1. w du^cząstki 
2. w dv 2 ,..., cząstki n-tej w 
dv n 

p(l, 2,.. 

., n) dv x do t .. ,dv n 

Prawdopodobieństwo znale¬ 



zienia układu n cząstek w 
całej przestrzeni 

/ Pd, 2, 

..., ń) dv x dv x ... di m n = 1 


Zamiast współrzędnych x u y lt z x cząstki I. użyto symbolu 1. Po¬ 
dobnie oznaczono współrzędne cząstki 2 .,..., n-tej 


układu n cząstek zależy od współrzędnych wszystkich 
cząstek (tj. od 3 n współrzędnych położeń cząstek i ich 
n współrzędnych spinowych, chociaż te ostatnie 
współrzędne w rozważaniach pominiemy) oraz, w wy¬ 
padku stanów niestacjonarnych, dodatkowo od czasu 
(zob. tabela powyżej). 

W dalszych rozważaniach będziemy ograniczali 
uwagę tylko do układów stacjonarnych, których ener- 
gęstość gia nie zależy od czasu. Kwadrat funkcji falowej, 
prawdopo- a ściślej iloczyn funkcji falowej pomnożony przez jej 
dobieństwa wielkość sprzężoną W* (funkcja falowa może być 
funkcją zespoloną) nazywamy gęstością prawdopo¬ 
dobieństwa q. Funkcja falowa musi być unormowana, 
tzn. scałkowanie gęstości prawdopodobieństwa po 
całej przestrzeni daje 1, co fizycznie oznacza, że 
prawdopodobieństwo znalezienia w całej przestrzeni 
układu cząstek znajdującego się w stanie opisanym 
funkcją ^(1, 2,..., n) jest równe pewności. 

Drugim podstawowym pojęciem stosowanym w me¬ 
chanice kwantowej jest pojęcie operatora, szczególnie 
operatora Hamiltona. Operator ten, zwany też hamil- 
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tonianem, jest operatorem całkowitej energii układu 
cząstek i można go przedstawić w postaci 

H= f+V, 

gdzie T oznacza operator energii kinetycznej, a Fjest 
operatorem energii potencjalnej. Dla każdej cząstki 
o masie nu operator energii kinetycznej jest operato¬ 
rem różniczkowym mającym postać sumy drugich 
pochodnych cząstkowych 


. _ ń 2 /a 2 e*_\ 

Ti ~~ ~~ lnu \ x\ + Ą z\ y 

gdzie h jest stałą Plancka h podzieloną przez 2 n. Opera¬ 
tor energii kinetycznej całego układu n cząstek jest 

po prostu sumą operatorów energii kinetycznej po¬ 
ra 

szczególnych cząstek, tj. T = £ fi. Natomiast ope- 

<«i 

rator energii potencjalnej jest sumą energii elektrosta¬ 
tycznego oddziaływania wszystkich cząstek ze sobą 


V 


1 ^ z^e 2 

2 ~ Zj Zj ~^T y 

i-i /-i 


gdzie Zi€ i zje są ładunkami cząstek odpowiednio 
/-tej oraz /-tej, a m jest odległością pomiędzy tymi 
cząstkami. 

Operator Hamiltona, jako sumę operatora T oraz 
K, możemy bardzo łatwo podać dla dowolnego układu 
chemicznego. Innymi słowy, dla dowolnego zespołu 
jąder atomowych i elektronów możemy hamiltonian 
traktować jako znany. Posługując się tak określonym 
operatorem Hamiltona można sformułować podsta¬ 
wowe równanie mechaniki kwantowej (równanie 
Schródingera) opisujące stany stacjonarne układu 
chemicznego: 


równanie falowe*. 



funkcja własna 
(funkcja stanu) 


wartość własna 
(energia stanu) 


Równanie (1) jest równaniem różniczkowym (na¬ 
zywanym w mechanice kwantowej zagadnieniem na 
wartości własne), które należy rozwiązać, aby znaleźć 
funkcję falową układu oraz odpowiadającą tej funkcji 
wartość energii. Okazuje się, że z rozwiązania równa¬ 
nia (1) otrzymujemy wiele (cały układ) funkcji IPi 
opisujących poszczególne stany układu oraz odpowied¬ 
nie energie tych stanów Et: 


rozwiązanie równania falowego: 



ogólnie 


stan podstawowy 


stany wzbudzone 
ogólnie 


V; 


E> 


energia stanu energie stanów 

podstawowego wzbudzonych 


Ważną właściwością układu chemicznego, związaną 
z postacią energii potencjalnej w hamiltonianie, jest 
to, że układ w stanie stacjonarnym może przyjmować 
tylko określone dyskretne wartości energii. Najniższa 
wartość własna jest zawsze skończona (tutaj jEJ, 
a odpowiedni stan jest nazywany stanem podstawo¬ 
wym (opisuje go funkcja IPi), podczas gdy pozostałe 
dyskretne wartości energii (E 2 , E z itd.) odnoszą się do 
stanów wzbudzonych (opisanych odpowiednio funk¬ 
cjami itd.). Przy wyższych energiach występuje 

na ogół kontinuum, które odpowiada ciągłemu roz¬ 
kładowi energii (rys. 1). Fizycznie oznacza to stany 


hamiltonian 


równanie 

Schródingera 


(D 


funkcje 

własne 


( 2 ) 


wartości , 

(energie) 

własne 












energia 

zerowa 

układu 


atom 

jedno- 

elektronowy 


zjonizowane lub zdysocjowane. Energia zerowa ukła¬ 
du jest z definicji energią stanu, w którym wszystkie 
jądra atomowe i elektrony są oddalone na nieskoń¬ 
czoną odległość jedne od drugich. Poziomy energe¬ 
tyczne stanów związanych mają więc energie ujemne. 
Wartość liczbowa całkowitej energii układu w stanie 
podstawowym jest równa energii niezbędnej do całko- 



£4 


£3 


*2 


widmo dyskretne stanów 
związanych £ < 0 


Rys. 1. Schematyczne przedstawienie rozwiązania równania 
(1). Energie Ei dyskretnych stanów opisanych funkcjami *Pi są 
uporządkowane ze względu na wzrastającą ich wartość (stany 
związane mają ujemne wartości energii). Poziom o energii 
E = 0 odpowiada jonizacji, powyżej tego poziomu widmo 
energii jest ciągłe; wybór poziomu zerowego jest wyłącznie 
sprawą umowy 


witego zjonizowania i zdysocjowania układu. Dla 
dużych układów ich energia może być rzędu tysięcy 
elektronowoltów. Z drugiej strony, mierzone w czą¬ 
steczkach organicznych energie przejść ze stanu pod¬ 
stawowego do stanu wzbudzonego są rzędu kilku 
elektronowoltów. Aby teoretycznie otrzymać energię 
przejścia, należy obliczyć energię odpowiedniego 
stanu wzbudzonego i odjąć od niej, również obliczo¬ 
ną, energię stanu podstawowego układu. Musimy 
więc najpierw obliczyć dwie bardzo duże liczby i przez 
odjęcie ich od siebie otrzymać małą liczbę odpowiada¬ 
jącą mierzonej energii przejścia. Przykład ten ukazuje, 
jak dokładne muszą być obliczenia mechaniki kwan¬ 
towej, aby poprawnie interpretować wielkości fizyko¬ 
chemiczne układów. Nic dziwnego, że kilkanaście 
lat temu jeden z twórców chemii kwantowej, 
C.A. Coulson, przyrównał obliczenia chemii kwanto¬ 
wej do znajdowania masy kapitana statku przez zwa¬ 
żenie statku wraz z kapitanem, a potem — statku bez 
kapitana. 



Rys. 2. Atom jednoelektronowy można poglądowo przedstawić 
w postaci układu składającego się z jądra o ładunku 4* Ze i ma¬ 
sie M oraz elektronu o ładunku —e i masie m. Położenie elek¬ 
tronu względem jądra określa się wówczas jednoznacznie po¬ 
dając jego współrzędne kartezjańskie y, z lub współrzędne 
biegunowe r, 0, <p 


Atomy jednoelektronowe 


Równanie Schródingera można rozwiązać w sposób 
ścisły (tzn. w postaci analitycznej, za pomocą znanych 
funkcji) wyłącznie dla atomów jednoelektronowych. 
W wypadku każdego innego układu chemicznego rów¬ 
nanie (1) można rozwiązać jedynie w sposób przybliżo¬ 
ny (może to jednak być rozwiązanie bardzo dokładne, 
przekraczające dokładnością pomiary doświadczal¬ 
ne!!!). 

Funkcje falowe opisujące stany związane elektro¬ 
nu (o energiach E<0) w atomie jednoelektronowym 
mają we współrzędnych biegunowych (rys. 2) postać 


-funkcja radialna 


Rn.(r) 'r-MWiJdi 

l-ó:-'. żśwm 


- funkcja kątowa 


i l = 0,1.2.n - 1 

kwantowe m=s/ . -i- 2 ,- 1, - £ 

w której funkcje radialne, zależne wyłącznie od odle¬ 
głości elektronu od jądra, wyrażone są za pomocą 
dobrze znanych w matematyce wielomianów La- 
guerre’a, natomiast funkcje kątowe wyrażone są za 
pomocą stowarzyszonych wielomianów Legendre’a. 
Funkcje falowe (3) oznaczone są trzema liczbami 
kwantowymi n , /, m , z których pierwsza może przyj¬ 
mować dowolne, ale wyłącznie dodatnie wartości cał¬ 
kowite (nie może jednak być równa 0), natomiast 
liczby / i m mogą przyjmować ograniczone wartości. 
Fakt, że wspomniane liczby mogą przyjmować ściśle 
określone wartości, wynika z warunków matematycz¬ 
nych na istnienie rozwiązania równania (1) dla elektro¬ 
nu w atomie jednoelektronowym. Funkcje falowe 



-10 


- £,*-13,6 1 

Rys. 3. Energie elektronu w atomie wodoru w stanie podstawo¬ 
wym i w stanach wzbudzonych. Dla przejrzystości opuszczono 
wartości energii elektronu w stanach on = 5, 6, 7, 8, 9. Wynoszą 
one odpowiednio —0,54, —0,38, —0,28, —0,21, —0,17 eV. 
Wzór (4) jest tylko częścią rozwiązania równania (1) dla atomu 
wodoru, opisującą najbardziej interesujące chemika i fizyka stany 
związane elektronu. Obszar widma ciągłego (E > 0) także wynika 
z rozwiązania równania (1) 


( 3 ) 


funkcja 
kątowa 
i funkcja 
radialna 


liczby 

kwantowe 
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opisujące stan elektronu w tym atomie „ponumero¬ 
wane” są więc trzema wskaźnikami; nie jest to sprzecz¬ 
ne z tym, co powiedziano już wcześniej, że funkcje 
własne i energie własne otrzymane z rozwiązania rów¬ 
nania (1) można ponumerować za pomocą kolejnych 
liczb całkowitych. Poszczególne trójki liczb n 9 l i m 
można przecież przyporządkować jednoznacznie ko¬ 
lejnym liczbom całkowitym. 

Rozwiązując zagadnienie na wartości własne dla 
atomu jednoelektronowego, otrzymujemy oprócz 
funkcji własnych W n im wartości własne odpowiadają¬ 
ce danym funkcjom: 


energie 

elektronu 


f*Z*e* 

2 9 


( 4 ) 


gdzie masa zredukowana (x = mMftm -f M). Jak wynika 
ze wzoru, energia elektronu zależy wyłącznie od licz¬ 
by kwantowej n (rys. 3). Tak więc różne funkcje własne 
mm różniące się liczbami / i m , ale mające takie samo 
«, mają identyczną wartość własną (liczba stanów 
o takiej samej energii E n wynosi /i 2 ). Inaczej można 
powiedzieć, że różne stany elektronu w atomie jedno- 
elektronowym mogą mieć takie same energie. Takie 
wypadki nazywamy degeneracją stanów (w przypadku 
degeneracja at °mów jednoelektronowych mówimy o degeneracji 
stanów typu / oraz ni). 

Nie będziemy podawać ogólnej postaci analitycz¬ 
nej rozwiązania (3) dla elektronu w atomie. Podamy 
jedynie kilka funkcji 'Pnim , a właściwie pewne ich 
kombinacje. Okazuje się, że funkcje Ym występujące 
w funkcji Wnim dla 1 są funkcjami zespolonymi 
(a więc i funkcje 'Pnim są wówczas zespolone). Dla 
celów praktycznych w wielu wypadkach wygodniej 
jest posługiwać się funkcjami rzeczywistymi (można je 


wówczas łatwo przedstawić graficznie). Dlatego parę 
funkcji ^nzm i Ym m r różniących się znakiem liczby 
m (tzn. m — —ni) zastępujemy parą funkcji 



Funkcje falowe elektronu atomu jednoelektronowego oraz 
powierzchnie graniczne 


Funkcja falowa 

Powierzchnia graniczna 

vp = 
"*100 

sl:- N ls e-Z'l* o 

a) 

^200 ~ 




s e- z 02».(2-Zr/oj 

b) 

^11 

Viv x s 2 p x = 



= N 2p t~ Zr l ia ox 

c) 

V«-i 

= 2py = 


= N 2p e- Zr i**oy 

d) 

^10 = 

Y2P Z = 2 P z - 



N 2p c~ Zr > 2a oz 

e) 



a 0 «=* h 2 jme x = 0,0529 nm (promień orbity Bohra), 
r = (odległość elektronu od jądra), 

Z—liczba porządkowa atomu (dla atomu wodoru Z = 1) 



Funkcje falowe atomu wodoru oznacza się tradycyjnie w spe¬ 
cjalny sposób. Każda funkcja, dla której / = 0 jest oznaczona 
symbolem s, funkcja, dla której / «= 1 oznaczona jest symbolem 
p , dla / = 2 używa się symbolu d itp. Przed każdym z tych 
symboli umieszcza się wartość głównej liczby kwantowej. U do¬ 
łu symboli p t d itd. zaznacza się własności kątowe funkcji. 
Dla funkcji typu ns, które nie zależą od kątów, nie umieszcza 
się żadnego indeksu. Funkcje falowe atomu wodoru można 
zapisywać w różny sposób, np. lub po prostu 1$. 




Zależność funkcji falowej elektronu w atomie wodoru w stanie podstawowym i jej kwadratu od odległości od jądra 
oraz rozkład przestrzenny chmury elektronowej 


gęstość prawdopo- 

funkcja a) ¥ As dobieństwa b) ę u 


gęstość radialna c} 
Plr)-4xr*f u 


prawdopodobieństwo J1 ( r) 
znalezienia elektronu 
w odległości od jądra 
mniejszej od r 


powierzchnia graniczna 
chmury elektronowej 8] 







0,002 



warstwice funkcji W-\ s warstwice gęstości prawdopodobieństwo 

prawdopodobieństwa £ 1s znalezienia elektronu 

w płaszczyźnie przecho¬ 
dzącej przez jądro d) 


0,8 



warstwice prawdo¬ 
podobieństwa I7(r) 



przecięcie powierzchni 
granicznej fi, 
płaszczyzną yz 


*) Wartości *F 1S podane są w jednostkach b ) Wartości p ls podane są w jednostkach 1/rar*. c ) Wielkość zakreskowanego pola 

przedstawia prawdopodobieństwo znalezienia elektronu w odległości między r ± i r t +dr t od jądra. ^Prawdopodobieństwo jest proporcjo¬ 
nalne do gęstości linii. Najbardziej prawdopodobnym miejscem znalezienia elektronu w przestrzeni jest powierzchnia kuli o promieniu 
a 0 (ściślej: w warstwie kulistej zawartej między kulami o promieniach a t —s oraz Oo+e, gdziee jest bardzo małe). ®) Powierzchnia kuli. 
wewnątrz której znajduje się praktycznie cały ładunek. Atom wodoru w stanie podstawowym ma tylko 10% ładunku na zewnątrz kuli 
o promieniu 2,6n# = 0,14 nm. 
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Postępowanie takie jest uzasadnione matematycznie 
i podyktowaDe jest wyłącznie celami praktycznymi. 
W tabeli na stronie 252 przedstawiliśmy tylko kilka 
funkcji falowych. Czytelnik powinien pamiętać, że 
jest ich jednak nieskończenie wiele i oczywiście dla 
n > 3 postać funkcji jest bardziej skomplikowana 
aniżeli postać funkcji dla n = 1 i n — 2. Należy pod¬ 
kreślić jeszcze raz, że wspomniane funkcje (3) i energie 
(4) odpowiadające tym funkcjom są rozwiązaniami 
ścisłymi (1). 


Atom wodoru 


turów w obu wypadkach są takie same. Istotna róż¬ 
nica polega na tym, że funkcja falowa może w pew¬ 
nych obszarach być dodatnia (dla stanu podstawowe¬ 
go atomu wodoru funkcja ¥** przyjmuje zawsze war- 




Elektron w stanie podstawowym atomu wodoru opi¬ 
sany jest funkcją falową nato¬ 

miast gęstość prawdopodobieństwa dla tego stanu 
wynosi g l8 = | lg j 2 = Z postaci tych 

funkcji widać, że zarówno W lg jak i g l8 zależą funkcyj¬ 
nie jedynie od odległości elektronu od jądra atomu 
wodoru. Obie funkcje mają kulistą symetrię względem 
początku układu. 

Istnieje kilka sposobów przedstawiania właściwoś¬ 
ci przestrzennych tych funkcji. Zarówno funkcja 

l8 , jak i jej kwadrat mają największą wartość w po¬ 
czątku układu (r = 0), w miarę oddalania się od 
tego punktu maleją wykładniczo. Elektron wyobraża¬ 
my sobie jako rozmyty ładunek rozłożony w prze¬ 
strzeni z gęstością prawdopodobieństwa eo (scałko- 
wanie po całej przestrzeni gęstości eg daje —e, tj. ła¬ 
dunek elektronu; ładunek elektronu będziemy ozna¬ 
czali dalej przez e , ale pamiętajmy, że ładunek elektro¬ 
nu jest ujemny). Elektron jest więc „chmurą elektro¬ 
nową” o gęstości eg. Chmura ta w stanie podstawo¬ 
wym atomu wodoru jest sferycznie symetryczna, 
chmura Dokonując przekroju tej chmury dowolną płaszczyzą 
elektronowa i łącząc punkty o jednakowej gęstości ładunku otrzy¬ 
mamy warstwice ładunku. W podobny sposób można 
przedstawić wartstwice funkcji falowej x i / ls . Intere¬ 
sujące jest prawdopodobieństwo znalezienia elektro¬ 
nu na pewnej odległości r od środka układu (ściślej 
w warstwie kulistej między kulami o promieniach 
r i r+dr). W tym celu należy obliczyć gęstość radialną 
P(r) — w przypadku stanu podstawowego atomu 
wodoru P(r) = g xs (ryXnr*. Funkcja ta ma dla r = 0 
wartość 0, a na odległości a 0 ma maksimum. Mnożąc 
gęstość radialną P(r) przez grubość warstwy kulistej 
dr otrzymujemy wspomniane prawdopodobieństwo 
znalezienia elektronu (ogólnie cząstki) w warstwie 
kulistej. Jeżeli wielkość P(r)dr scałkujemy po r od 
wartości 0 do jakiejś wartości r\ to otrzymamy praw¬ 
dopodobieństwo znalezienia elektronu wewnątrz kuli 

r' 

o promieniu r': i7(r0 = jP(r)dr. Ponieważ r ' możemy 
o . . 

wybierać w sposób dowolny, 17 jest funkcją promienia. 
W przestrzeni funkcję I7(r) dla danego r można przed¬ 
stawić jako powierzchnię kuli o promieniu r. W miarę 
oddalania się od jądra prawdopodobieństwo znale¬ 
zienia elektronu w kuli o promieniu r jest coraz więk¬ 
sze. Dobierając promień tak, aby wewnątrz kuli 
powierzchnia znajdował się prawie cały ładunek (czyli ellif') x e) y 
graniczna otrzymujemy kulę o powierzchni zwanej powierz¬ 
chnią graniczną chmury elektronowej lub po prostu — 
powierzchnią graniczną, lub konturem granicznym. 

Dla celów porównawczych promień kuli dobiera się 
zwykle tak, aby powierzchnia graniczna obejmowała 
90-95% ładunku. Tego typu powierzchnie graniczne 
wystarczą do zrozumienia wielu podstawowych 
zagadnień strukturalnych chemii bez szczegółowego 
rozpatrywania warstwie ładunku. W wielu wypadkach 
wystarczy nawet znajomość tylko powierzchni gra¬ 
nicznej. 

Powierzchnie graniczne (kontury) można oczy¬ 
wiście wykreślić nie tylko dla kwadratów funkcji falo¬ 
wych, ale również dla samych funkcji. Kształty kon- 



Rys. 4. Powierzchnie graniczne funkcji falowych elektronu w ato¬ 
mie wodoru dla n = 1 i n — 2. U dołu pokazano przecięcie po¬ 
wierzchni granicznej funkcji typu ns dowolną płaszczyzną prze¬ 
chodzącą przez jądro oraz przecięcie funkcji typu np x płasz¬ 
czyzną xy. Funkcje typu ns (1$, 2s,...) są funkcjami kulistosy- 
metrycznymi (nie zależą one od kątów). Funkcje typu np x , np v 
i np z zależą od kątów i są antysymetryczne względem odbicia 
w płaszczyźnie odpowiednio yz , xz i xy. Znaki + oraz — ozna¬ 
czają wartości dodatnie i ujemne funkcji falowych 

tości dodatnie), a w innych ujemna, podczas gdy 
gęstość prawdopodobieństwa jest zawsze wielkością 
dodatnią. 

Omawialiśmy dotychczas stan podstawowy atomu 
wodoru opisany funkcją falową SF',*. W podobny 
sposób można przedstawić funkcje falowe opisujące stany 
poszczególne stany wzbudzone atomu wodoru, wzbudzone 
Z różnego rodzaju przedstawień graficznych funkcji atomu 
falowych najbardziej użyteczne są kontury funkcji wodoru 
falowych (lub ich przekroje płaszczyzną; rys. 4). 

Kontur każdej funkcji typu s, tzn. l P ls , jak również 
^P 28 , itd., ma kształt kulisty, a kule te są tym więk¬ 
sze, im większa jest wartość głównej liczby kwantowej 
n. Jest to związane z faktem, że w wyższych stanach 
„chmura elektronowa” jest bardziej rozmyta w prze¬ 
strzeni, należy więc przestrzeń otoczyć kulą o więk¬ 
szym promieniu, aby wewnątrz tej kuli znalazł się 
prawie cały ładunek elektronowy. Najbardziej 
prawodpodobna odległość elektronu od jądra w sta¬ 
nie W 28 atomu wodoru wynosi (3+j/3)tfo, czyli jest 
ponad pięć razy większa aniżeli analogiczna odległość 
w stanie podstawowym Funkcje falowe dla n — 2 
i / = 1 zależą od kątów (innymi słowy są one ukie¬ 
runkowane). 

Na przykład funkcja 2 f 2px jest proporcjonalna do 
x , i znika dla x = 0. Dla dodatnich wartości x fun¬ 
kcja ta jest dodatnia, natomiast dla ujemnych x 
przyjmuje wartości ujemne. Te własności kątowe 
funkcji oznaczone są na powierzchni granicznej zna¬ 
kami + i—. Łatwo prześledzić w analogiczny sposób 
własności przestrzenne funkcji Wzpy i ^Pzpz. Powie¬ 
rzchnie graniczne dla funkcji falowych, dla których 
n > 3 i / > 2, są bardziej skomplikowane. Nie 
będziemy ich jednak tutaj przedstawiać. 
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Spin elektronu 

Badania doświadczalne nad wpływem pola magne¬ 
tycznego na własności atomów srebra wykazały, że 
elektron ma pewien własny moment pędu nazwany 
spinem. Nie będziemy szczegółowo uzasadniać istnie¬ 
nia tej wielkości (wymagałoby to odwołania się do 
relatywistycznej mechaniki kwantowej); dla naszych 
celów wystarczy wiedzieć, że spin elektronu jest pew¬ 
nym dodatkowym momentem pędu nie związanym 
z ruchem orbitalnym elektronu wokół jądra. Czasami 
tłumaczy się istnienie spinu jako wynik obrotu elek¬ 
tronu dookoła własnej osi, ale nie należy tego brać 
zbyt dosłownie, gdyż spin nie ma swojego odpowiedni¬ 
ka w mechanice klasycznej. 

Do pełnego opisu stanu elektronu nie wystarczy 
podać funkcję falową W n i m zależną od trzech współ¬ 
rzędnych przestrzennych r, S, <p. Poprawna funkcja 
falowa powinna zawierać również informacje o spinie 
elektronu. W tym celu wystarczy funkcję Wnim po¬ 
mnożyć przez funkcję opisującą stan spinu elektronu 
(jest to słuszne tylko w nierelatywistycznej mechanice 
kwantowej, którą się właśnie zajmujemy). Spin jedne¬ 
go elektronu jest jednoznacznie określony przez po¬ 
danie tzw. rzutu spinu na wyróżnioną oś; rzut ten 
może przyjmować tylko dwie wartości m$ = + 1 / 2 fi 
lub m s = (albo 1/2 lub —1/2 w jednostkach 

fi). Mówimy, że „elektron ma spin 1/2 lub —1/2”, 
i tę sytuację charakteryzujemy za pomocą strzałek 
t lub l. Umówimy się dalej, że funkcję spinową opi¬ 
sującą stan, w którym nu = 1/2, oznaczać będziemy 
przez a, natomiast przez /? oznaczymy funkcję spino¬ 
wą elektronu, dla którego m$ = —1/2. Tak więc po¬ 
prawna funkcja falowa opisująca stan elektronu 
w atomie jednoelektronowym ma postać. 

| 'PnlmCC dla t 

hnlmm. = { • ( 5 ) 

{Wnimp dla l 

Pojęcie spinu w zasadzie nie jest potrzebne dla zro¬ 
zumienia własności stanów elektronu i ich energii 
w przypadku atomu jednoelektronowego. Jest ono 
natomiast konieczne przy opisie zespołu elektronów. 
Zanim zaczniemy omawiać bardziej złożone układy, 
wprowadzimy jeszcze pojęcie multipletowości stanu. 
Jest to wielkość określona wyłącznie własnościami 
spinów poszczególnych elektronów układu. Jak już 
wspominaliśmy, każdy elektron ma spin 1/2 lub —1/2. 
Elektrony można więc podzielić na dwie grupy — 
elektrony o spinach 1/2 i elektrony o spinach —1/2. 
Multipletowością stanu (lub jego krotnością) nazy¬ 
wamy wielkość M = l\]?m 8 \ +1, gdzie suma przebiega 
po wszystkich elektronach układu. Tak więc stan 
elektronu w atomie jednoelektronowym ma multi- 
pletowość równą 2 (stan dubletowy), gdyż M = 2 • 
*1/2+1 = 2. Dla dwóch elektronów możemy mieć 
dwie multipletowości. Jeżeli elektrony mają taki sam 
spin, wówczas M = 3 (stan trypletowy), a gdy spiny 
są przeciwne, wówczas mamy stan singletowy, gdyż 
M — 1. Bardzo łatwo jest obliczyć multipletowość 
dowolnego stanu układu elektronów, jeżeli tylko wie¬ 
my, jakie są spiny poszczególnych elektronów. 


Metody przybliżone mechaniki 
kwantowej 


Jak już poprzednio wspomnieliśmy, problem ruchu 
elektronu w polu działania jądra atomowego o ładun¬ 
ku Ą-Ze (inaczej — zagadnienie ruchu dwóch cząstek) 
ma ścisłe rozwiązanie w mechanice kwantowej — rów¬ 
nania (3) i (4). Jest to problem analogiczny do proble¬ 
mu ruchu dwóch ciał w mechanice klasycznej. Na 
przykład równania Newtona, które opisują ruch Ziemi 
wokół Słońca z pominięciem wpływu innych ciał 


Układu Słonecznego, mają rozwiązania ścisłe. Dobrze 
wiadomo jednak, że ruch Ziemi w Układzie Słonecz¬ 
nym zależy nie tylko od oddziaływania pomiędzy Słoń¬ 
cem a Ziemią, lecz także od wpływu wszystkich planet 
i innych ciał Układu Słonecznego i chociaż potrafimy 
sformułować równania Newtona opisujące ruch wszy¬ 
stkich ciał, nie potrafimy rozwiązać tych równań 
w sposób ścisły. 

Podobna sytuacja występuje w mechanice kwanto¬ 
wej, gdzie nawet dla atomu helu (trzy cząstki: jądro+ 
+dwa elektrony), dla którego znamy równanie 
Schródingera (rys. 5), nie potrafimy tego równania 
rozwiązać w sposób ścisły. 


Rozwiązanie numeryczne równania 
Schródingera 

Czytelnik interesujący się rozwojem i możliwościa¬ 
mi komputerów zaproponuje niewątpliwie nume¬ 
ryczne rozwiązanie równania (1) dla atomu helu. 
I rzeczywiście tak można uczynić. W tym celu należy 
ustalić w przestrzeni położenie np. elektronu drugiego 
i rozwiązać numerycznie równanie (1), opisujące ruch 
elektronu pierwszego znajdującego się w polu działa¬ 
nia jądra oraz „unieruchomionego” elektronu drugie¬ 
go. Pole działające na elektron pierwszy nie jest już po¬ 
lem centralnym (jak to było w wypadku elektronu 
w atomie jednoelektronowym) i rozwiązanie równania 
(1) nie ma postaci analitycznej; jest ono przedstawione 
w postaci zbioru wartości funkcji falowej dla poszcze¬ 
gólnych położeń elektronu pierwszego w przestrzeni 
(rozwiązanie numeryczne). Rozwiązanie będzie tym 
bardziej dokładne, im więcej zostanie podanych war¬ 
tości funkcj ifalowej dla różnych położeń elektronu 
pierwszego. 

Przyjmijmy, że zadowoli nas podanie wartości 
funkcji falowej w 1000 punktach przestrzeni. Ponieważ 
atom helu ma dwa elektrony, to aby mieć rozwiązanie 
numeryczne opisujące ruch obu elektronów w atomie, 
należy drugi elektron umieścić w 1000 punktach prze¬ 
strzeni i dla każdego „ustalonego” położenia roz¬ 
wiązywać równanie ruchu dla pierwszego elektronu 
w 1000 punktach. Przedstawienie takiej funkcji falo¬ 
wej w postaci książkowej wymagałoby wydania tomu 
o 1000 stronach, z 1000 wartości funkcji na każdej 
stronie. Obliczona w ten sposób funkcja falowa dla 
atomu litu (3 elektrony) wymagałaby całego księgo¬ 
zbioru (1000 książek 1000-stronicowych, a na każdej 
stronie 1000 wartości funkcji. 1 !!). Proszę wyobrazić 
sobie podobne przedstawienie funkcji falowej dla 
cząsteczki benzenu zawierającej 12 jąder i 42 elektro¬ 
ny. Nic dziwnego, że ten sposób przedstawienia sta¬ 
nów układu chemicznego jest nie tylko niepopularny, 
ale jest zupełnie bezużyteczny. Na szczęście mechanika 
kwantowa dysponuje metodami przybliżonymi, które 
pozwalają opracować metody obliczeniowe, za po¬ 
mocą których w wielu wypadkach można uzyskać 
wyniki zgodne z danymi doświadczalnymi. 


Rachunek zaburzeń 

Pierwszą z metod przybliżonych mechaniki kwantowej rachunek 
jest rachunek zaburzeń. Omówimy schematycznie tyl- zaburzeń 
ko jedną z wersji tej metody, tzw. rachunek zaburzeń Rayleigha- 
Rayleigha-Schródingera. Rozważmy układ chemiczny Schrodin- 
opisany równaniem falowym (1) HW = EW. Dowol- gera 
ny stan układu opisany jest funkcją falową Wi 
o energii Ei (por. wzory (1) i (2)). Oczywiście nie znamy 
rozwiązania równania HW — EW, ale szukamy tego 
rozwiązania w szczególny sposób. Przyjmijmy miano¬ 
wicie, że hamiltonian układu H można zapisać 
w postaci sumy operatora #<°> i operatora#', przy 
czym załóżmy, że znamy rozwiązanie równania falo¬ 
wego w przypadku operatora #<°>, tzn. znamy roz¬ 
wiązanie równania #<°> <p (0 > = Ć<°> <p w (znamy więc 
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operator zbiór funkcji własnych ę>J. 0) i energii ć£ 0> ). Podziału 
zaburzeniowy hamiltonianu U na dwie części należy dokonać 
w taki sposób (istnieje kilka sposobów tego podziału), 
aby operator H' (operator zaburzeniowy) był mały 
w stosunku do operatora j fr<°>. Wówczas szukana 
funkcja falowa ^ i energia Ei układu dają się wyrazić 
jako sumy odpowiednich wielkości niezaburzonego 
układu, tzn. ę>< 0) i C J 0) oraz poprawek zaburzeniowych 
różnego rzędu: 

+ 3 )+... 

Et = ć (0 > + ^£J 1 )+ó£< 2 ) + <5£ , < 3 )+... (6) 

gdzie 

..., óEp, ÓE[ 2 \ ... 

są poprawkami 1 ., 2 .,... rzędu odpowiednio do funkcji 
falowej i energii układu w i-tym stanie. Kolejne popraw¬ 
ki óWi i SEi wyrażone są przez całki, których wartość 
zależy jedynie od hamiltonianu zaburzeniowego H' 
oraz od funkcji własnych ę^ 0) i energii własnych 
układu niezaburzonego. Stosunkowo prostą postać ma 
poprawka zaburzeniowa 1. rzędu do energii. Wyraża się 

ona prostą całką óisj 1 * = JV<°>* a więc po¬ 

prawka ta zależy jedynie od H' oraz od jednej 
funkcji falowej układu niezaburzonego. Niestety, 
istotną wadą rachunku zaburzonego w podanym 
tu sformułowaniu jest to, że w przypadku poprawek 
1 . rzędu do funkcji falowej oraz poprawek wyższych 
rzędów do energii i funkcji falowych, musimy posługi¬ 
wać się sumami nieskończonymi (musimy znać wszyst¬ 
kie funkcje własne i wszystkie energie własne układu 
niezaburzeniowego). Niemniej, wspomniany rachunek 
zaburzeniowy umożliwia w prosty sposób obliczenie 
poprawki 1 . rzędu do energii, i w wielu wypadkach 
energia układu Ei x ć* 0) + stosunkowo dobrze 
zgadza się z danymi doświadczalnymi, 
stan Zilustrujemy powyższe rozważania na przykładzie 
podstawowy stanu podstawowego atomu helu. W atomie tym 
atomu helu (rys. 5 ) operatorem /ł<°> może być suma energii kine¬ 
tycznej obu elektronów (7i+ T 2 ) i energii potencjalnej 



Rys. 5. Schematyczny obraz atomu helu; pod spodem hamiltcT 
nian opisujący ruchy elektronów w tym atomie, Ti i T t operatory 
energii kinetycznej elektronu 1 i 2, V x i V t operatory elektrosta¬ 
tycznego oddziaływania pomiędzy jądrem i elektronem 1 oraz 
jądrem i elektronem 2, e*lr l2 oddziaływanie między elektronami. 
Gdyby usunąć jeden z elektronów, tzn. gdyby zjonizować atom 
helu, to ruch pozostałego elektronu opisany byłby w sposób 
ścisły funkcjami (3) o energiach ze wzoru (4) przy Z — 2 

obu elektronów w polu jądra atomu helu (Fi 4 -K 2 ). 
Operatorem zaburzeniowym jest wówczas energia po¬ 
tencjalna oddziaływania elektrostatycznego pomiędzy 
elektronami e 2 /r 12 . Ponieważ w operatorze H <°> nie ma 
oddziaływania pomiędzy elektronami, równanie falo¬ 
we ir< 0 > 9 >< 0 > = ć< 0 > 9 ?<°) rozbija się na dwa równania, 
z których każde opisuje elektron 1 lub elektron 2 
w polu działania jądra o ładunku +2e. A więc każde 
z tych równań opisuje przypadek atomu jednoelektro- 
nowego dla Z = 2. Rozwiązanie tych równań ma po¬ 
stać ścisłą: funkcje falowe mają postać (3), natomiast 
energie można obliczyć ze wzoru (4) (należy oczywiś¬ 
cie za Z podstawić 2). Układ dwóch elektronów atomu 
helu, w wypadku gdy pomiędzy elektronami pominięto 


oddziaływanie, opisany jest funkcją falową, która jest 
iloczynem funkcji falowych opisujących oddzielnie 
każdy z elektronów w jonie atomu helu, natomiast 
energia układu tych elektronów jest sumą energii obu 
elektronów w poszczególnych stanach jonu. Dla stanu 
podstawowego energia obu elektronów (energia 
niezaburzonego układu) wynosi ći 0> = 2 E 1 = 2Z 2 
(—13,6 eV)= —108,8 eV (lub w tzw. jednostkach 
atomowych energii —4,0j.at.). 

Jednostki atomowe wprowadza się w celu uniezależnienia wiel- jednostki 
kości charakteryzujących układ (energia, odległości między czą- atomowe 
stkami układu itp.) od dokładności pomiaru stałych uniwersal¬ 
nych, jak ładunek i masa elektronu, stała Plancka. Przyjmując, 
że m = 1, e = 1 oraz h = 1, energia elektronu w stanie podsta¬ 
wowym wodoru wynosi JET, = —0,5 j.at. « —13,6 eV. Tak więc 
1 j.at. energii « 27,2 eV. Za jednostkę atomową odległości przyj¬ 
muje się a t (1 bohr) = 0,0529 nm. 

Doświadczalna wartość energii obu elektronów 
w stanie podstawowym atomu helu wynosi —78,98 eV 
(—2,90 j.at.). Jak widać, jeżeli pominiemy oddziały¬ 
wanie pomiędzy elektronami, opis własności obu elek¬ 
tronów w atomie helu nie jest poprawny. Obliczona 
energia układu niezaburzonego różni się o przeszło 
30% od energii doświadczalnej. Jak już wspominaliś¬ 
my poprzednio można łatwo obliczyć poprawkę 
1 rzędu do energii. Funkcją falową układu niezaburzo¬ 
nego jest w przypadku stanu podstawowego helu ilo¬ 
czyn dwóch funkcji ^ 100 ze wzoru (3) dla Z = 2 
(tabela str. 252). Obliczona poprawka 1 rzędu do 
energii stanu podstawowego jest równa SE[^ = 34 eV, 
a więc energia całkowita atomu helu obliczona z do¬ 
kładnością do poprawki 1 rzędu wynosi £, = ć[ 0) -ł- 
-fćjEp = — 74,8 eV(—2,75 j.at.), i zgadza się stosun¬ 
kowo dobrze z wartością doświadczalną (obliczona 
wartość energii stanowi 95% energii doświadczalnej). 

Rachunek zaburzeń ograniczony do poprawki 1 
rzędu do energii, nie daje bardzo dokładnych wyni¬ 
ków. Nic zresztą dziwnego, gdyż energia zaburzeń 
wcale nie jest małą i wynosi przeszło 30% energii rzędu 
zerowego. Natomiast uwzględnienie poprawki 2 rzę¬ 
du do energii daje już energię całkowitą stanu pod¬ 
stawowego atomu helu z dokładnością do 0,5% warto¬ 
ści doświadczalnej. Istnieje wiele sformułowań ra¬ 
chunku zaburzeń, i w różnych wersjach był on stoso¬ 
wany do obliczenia m.in. energii stanu podstawowego 
atomu helu. W jednej z tych wersji poprawka 18 rzędu 
do energii wynosi 5-10 _ 9 eV. Pomimo trudności 
z obliczaniem poprawek wyższych rzędów rachunek 
zaburzeń ma duże znaczenie w mechanice kwanto¬ 
wej, a szczególnie przy opisie oddziaływań między- 
cząsteczkowych lub przy opisie wpływu pól zewnętrz¬ 
nych działających na rozważany układ. 


Zasada wariacyjna 

Drugą z metod przybliżonych mechaniki kwantowej 
jest metoda oparta na zasadzie wariacyjnej. Jest ona 
w wielu wypadkach bardziej dogodna od rachunku za¬ 
burzeń, gdyż można ją stosować do dowolnego ukła¬ 
du, dla którego szukamy rozwiązania ( 2 ) równania 
falowego (1). Opis tej metody ograniczymy do stanu 
podstawowego układu E u a potem zilustrujemy przy¬ 
kładowymi obliczeniami dla stanu podstawowego 
atomu helu. 

Wybierzmy dowolną funkcję próbną 0, która w spo- funkcja 
sób przybliżony opisuje stan podstawowy rozważane- próbna 
go układu. Z zasady wariacyjnej wynika, że obliczona 
energia stanu podstawowego układu opisanego tą 
próbną funkcją nie jest nigdy mniejsza niż dokładna 
energia E 1 z dokładnego rozwiązania równania (1), 
tzn. 

Ć = J <P*H<Pdv > E x . (7) 

Próbne funkcje falowe 0 można wybierać różnymi 
sposobami. Jeżeli wybierzemy kilka funkcji próbnych 
0u 02 , 0&, .... to z wszystkich obliczonych energii 
Ćj, ć 2 , ć 3 ,... najlepsze przybliżenie do energii dokładnej 
Ei będzie mieć energia Ci o najmniejszej wartości. 
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Na ogół jednak postępujemy trochę inaczej. Uza¬ 
leżniamy wybór funkcji próbnej 0 opisującej układ n 
elektronów od parametrów c l9 c 2 ,..., c*, tzn. funkcja 
parametry falowa powinna mieć postać <£(!, 2 ,...,«; c Xl . ...c*). 
wariacyjne Mamy więc niejedną funkcję 0 , ale cały zbiór funkcji, 
ponieważ dla każdego zbioru parametrów mamy inną 
funkcję. Energia układu opisanego próbną funkcją 
zależy oczywiście od tych parametrów, tzn. C = C(c u 
c 2 ,..., c k ). Z zasady wariacyjnej wynika po pierwsze 
to, że należy tak dobrać parametry c l9 ...,Ck, aby 
energia C była najmniejsza, ponieważ ta najmniejsza 
wartość energii Cmin(c u ..., c*) będzie najbliższa warto¬ 
ści dokładnej, a po drugie to, że przy wprowadzeniu 
dodatkowych parametrów cfc + 1 ,...,c* + z otrzymujemy 
ćmin(ci,c 2 , ...,Cfc+i)< ćmin{c u ...,C}c) ijednocześnie funk¬ 
cję falową 0 ( 1 , 2 c x ,...,ca:+z) o lepszym przybliże¬ 
niu do funkcji falowej opisującej dokładnie stan ukła¬ 
du. A więc zwiększenie ilości tzw. parametrów waria¬ 
cyjnych w funkcji falowej pozwala obliczyć energię 
całkowitą układu z coraz większą dokładnością 
(należy przy tym pamiętać, że wartość Cmia(c l9 c 2 ,...) 
nigdy nie może być niniejsza od wartości dokładnej 
jEi!!!). Jeżeli więc użyjemy bardzo wielu parametrów 
w próbnej funkcji falowej, uzyskać możemy wartość 
energii układu bardzo zbliżoną do energii dokładnej 
E x (czasami takie obliczenia są bardzo kłopotliwe 
z powodu dużej liczby niezbędnych parametrów). 

Funkcję próbną 0 można w różny sposób uzależniać 
od parametrów c p . Szczególnie prosta sytuacja jest 
wówczas, gdy funkcja próbna 0 jest przedstawiona 
w postaci liniowej kombinacji znanych funkcji xp 

m 

O = CpXv ( 8 ) 

p-i 

Mówimy wówczas, że funkcja 0 zależy liniowo od 
parametrów c p . Zbiór funkcji xp może być zbiorem 
dowolnych znanych funkcji, ale przy jego wyborze 
kierujemy się oczywiście intuicją fizyczną lub chemicz- 
metoda ną. Zasada wariacyjna w przypadku funkcji 0 postaci 
Rifza ( 8 ) daje prosty sposób (metoda Ritza), na znajdowanie 
współczynników c p —należy mianowicie rozwiązać 
układ równań liniowych m-te go stopnia na szukane 
współczynniki 

m 

2 c p (Hpq—ĆSpq) = 0, dla 4 = 1,2,..., m, (9) 

gdzie H pq = f x* p Hx t dv, S pq = f x P Xtdv. 

W równaniach tych H pą i S vq są całkami, które mo- 
żerny obliczyć, gdyż zależą one od H oraz od znanych 
funkcji xp • Niewiadomymi wielkościami są współ¬ 
czynniki c p , t jak również ć, które daje się jednak wyzna¬ 
czyć z warunku istnienia rozwiązania układu równań 
(9). Mianowicie układ ten ma rozwiązanie tylko wów¬ 
czas, gdy znika wyznacznik zbudowany z wyrazów 
przy niewiadomych współczynnikach c p (pomijamy 
tutaj trywialne (zerowe) rozwiązanie równań (9), 
gdy wszystkie c P są równe 0 ), tzn. gdy 

det \H P q —<5»Spęj = 0 . 

Ostatnie wyrażenie jest równaniem stopnia m na 
niewiadome C. Rozwiązanie ma m pierwiastków Cu 
<f 2 ,..., Numerujemy je zgodnie ze wzrastającą 
energią; tak więc C x będące najmniejszą liczbą ze 
wszystkich Ci jest energią stanu podstawowego ukła¬ 
du opisanego próbną funkcją 0 postaci ( 8 ). Aby podać 
szczegółową postać tej funkcji, należy, wstawiając 
Ci do układu ( 9 ), znaleźć układ współczynników c P 
odpowiadający danej energii C x . Oczywiście w ten 
sam sposób można obliczyć funkcje próbne 0 odpo¬ 
wiadające energiom ć 2 ,...,ćm. Jak widać, każdemu 
C% {i — 1 ,...,/«) odpowiada inna funkcja próbna 0. 
Dlatego funkcję ( 8 ) oznaczamy dodatkowo indek- 

m 

sem i f, tzn. zapisujemy ją w postaci 0i = 2 c pWp ( c p* 

p-y 

jestp-tym współczynnikiem do /-tej funkcji próbnej). 
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Rozpatrzmy teraz stan podstawowy atomu helu. stan 
W przypadku jonu He + wiadomo, że jeden elektron podstawowy 
opisany jest w sposób ścisły funkcją falową ^ = atomu helu 
= N ls e~ Zrla °, gdzie Z = 2. W przypadku atomu helu, 
gdy mamy w atomie dwa elektrony, możemy przyjąć, 
że w przybliżeniu własności każdego z elektronów 
opisane są funkcją falową 0 ls podobną do funkcji 
ale nie mamy już powodu, aby przyjmować, że 
ładunek jądra wynosi +2e. Jeden z elektronów, po¬ 
wiedzmy elektron 1, „widzi” bowiem jądro atomu 
helu nie o ładunku -f-2c, ale o ładunku Z'e gdyż 
elektron 2 ekranuje ładunek jądra. Analogicznie, 
elektron 2 „widzi” jądro atomu o ładunku Z'e, takim 
samym jak w przypadku rozważanego elektronu 1. 

Intuicyjnie należy oczekiwać, że Z' będzie zawarte po¬ 
między 1 a 2, tzn. należy oczekiwać ładunku pośred¬ 
niego między ładunkiem atomu wodoru a ładunkiem 
jonu He + . Możemy więc przyjąć, że funkcje opisujące 
każdy z elektronów w atomie helu mają postać 
q> xs = N xs e~ z ' r I a °. Funkcja falowa opisująca układ 
tych dwóch elektronów zależy więc bezpośrednio od 
współrzędnych obu elektronów oraz od jednego pa¬ 
rametru wariacyjnego Z', tzn. 

<P (1,2; Z') = ?i«(1)?k( 2) = |Ał ls | 2 e- z '< ri+,s)0 ». 

Energia układu opisanego taką funkcją falową wynosi obliczanie 
C x = (Z') 2 —27/8Z'. Przyjmując więc różne ładunki energii 
Z', otrzymujemy różne funkcje próbne 0 (1,2; Z') 
i różne energie układu odpowiadające tym funkcjom. 

Najlepszą funkcją 0 (1,2; Z') jest funkcja dla takiego 
Z', dla którego <?i(Z') ma wartość minimalną (rys. 6), 

H i- 

ca 

D> 


-2,5 


-2,75 

-2,8477 

-2,9037 

-3,0 


1 1,687' 2 © 

ładunek jądra Z* 

Rys. 6. Energia C x układu dwóch elektronów w stanie podsta¬ 
wowym atomu helu obliczona przy założeniu, że każdy z elek¬ 
tronów jest opisany funkcją <p ls = ijVn (Z'fa 0 y i c~ z ' rla o (Z' 
ładunek jądra). Linia przerywana odpow-iada dokładnej energii 
atomu helu 

tzn. dla Z' = 1,6875 (jak widać Z'jest rzeczywiście 
zawarte pomiędzy 1 a 2). Przy tej wartości Z' energia 
C x = —2,8477 j.at. stanowi 98,07% energii dokładnej, 
a więc różnica między wartością obliczoną a energią 
dokładną jest bardzo mała. Różnicę tę można jeszcze 
bardziej zmniejszyć, modyfikując funkcję próbną. 
Przyjmijmy np. że funkcja falowa opisująca jeden 
elektron w atomie helu ma postać <p xs = N ls r n " l - 
.e" z ' r/ °°, gdzie «'jest bliskie jedności, tak że czynnik 
r n '-i nieznacznie tylko zmienia poprzednio użytą 
funkcję <p xs (zarówno ri 9 jak i Z' traktujemy jako 
parametry wariacyjne). Funkcja układu dwóch elek¬ 
tronów, będąca iloczynem powyższych funkcji jedno- 
elektronowych, ma wówczas postać 0 (1,2; Z'). 

Okazuje się, że energia układu C x dla tej funkcji jest 
minimalna wówczas, gdy Z' = 1,61162 oraz ri = 
= 0,955, i wynosi —2,8542 j.at. Widać więc wyraźnie, 
że zwiększenie liczby parametrów w próbnej funkcji 
polepsza zgodność energii obliczonej z energią do¬ 
kładną (obliczona energia C x w drugim wypadku sta- 
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potencjał 
jonizacyjny 
atomu helu 


spinorbital 


AO — orbital 
atomowy 
MO — orbita! 
molekularny 


nowi już 98,30% energii dokładnej). Funkcję próbną 
można jeszcze bardziej uogólnić, mnożąc #(1,2; Z') 
np. przez wielomian typu (1 +c l r^+c 2 r 9 2 +c z r^), gdzie 
Ci, c 2 , c z oraz p t q i s są parametrami. Energia ć a 
obliczona przy użyciu takiej funkcji stanowi jeszcze 
lepsze przybliżenie do energii dokładnej. W 1958 r. 
C. L. Pekeris użył w obliczeniach dla atomu helu 
funkcji próbnej zawierającej kilkaset parametrów. 
Obliczony przez niego potencjał jonizacyjny atomu 
helu, wynoszący 198310,67 cm" 1 , nie tylko zgadza się 
z wartością doświadczalną 198310,8 ±0,15 cm" 1 , 
ale jest od niej bardziej dokładny! 

Porównywaliśmy wyniki obliczeń ći za pomocą 
funkcji próbnej <P z energią dokładną E x . Dla atomu 
helu nie znamy funkcji falowej a więc i nie znamy 
E x . Co oznacza więc wspomniana energia dokładna 
wynosząca —2,9037 j.at.? Czy jest nią wartość energii 
otrzymana z pomiarów doświadczalnych? I tak, i nie. 
Mierząc wartość energii otrzymujemy rzeczywistą 
wielkość energii dla układu, który podlega prawom 
relatywistycznej mechaniki kwantowej. Ponieważ zaj¬ 
mujemy się tutaj mechaniką kwantową nierelatywis- 
tyczną, mierzoną wartość doświadczalną należy więc 
„przecechować” do wielkości, z którą możemy po¬ 
równywać wyniki otrzymane z rozwiązania nierela- 
tywistycznego równania (1). W tym celu należy od 
zmierzonej wielkości doświadczalnej odjąć szereg 
poprawek, np. poprawki relatywistyczne i promieniste. 
Zmierzona energia stanu podstawowego atomu helu 
wynosi —2,9033 j.at., a wspomniane poprawki są 
małe, rzędu 0,0004 j.at. Tak więc cytowana już wcześ¬ 
niej wielkość —2,9037 j.at. jest „przecechowaną” 
energią doświadczalną. Warto dodać, że ponieważ 
obliczona przez Pekerisa wielkość energii stanu pod¬ 
stawowego atomu helu (—2,90372 j.at.) jest bardziej 
dokładna od wielkości mierzonej, z wynikiem teore¬ 
tycznym Pekerisa porównywane są wszystkie inne wy¬ 
niki przybliżonych obliczeń dla atomu helu. 


Przybliżenie jednoelektronowe 


Przybliżeniem oddającym ogromne usługi przy opi¬ 
sie własności układu elektronów w atomie lub w czą¬ 
steczce i będącym podstawą opisu struktur chemicz¬ 
nych jest tzw. przybliżenie jednoelektronowe. Zgodnie 
z nim, ruch każdego elektronu układu rozpatruje się 
w polu jądra (lub jąder) i w uśrednionym polu pocho¬ 
dzącym od pozostałych elektronów układu. Innymi 
słowy stan każdego elektronu układu opisany jest 
jednoelektronową funkcją falową, zależną od współ¬ 
rzędnych określonego elektronu oraz od jego spinu. 
Funkcje takie nazywamy spinorbitalami i oznaczamy 
je symbolem (czytelnik nie powinien utożsamiać 
spinorbitali h z funkcją falową Xnimm s (5), która opisuje 
w sposób ścisły stan elektronu w atomie jednoelektro- 
nowym). W wypadku pominięcia efektów relatywis¬ 
tycznych, spinorbital jest iloczynem orbitalu atomo¬ 
wego (AO — atomie orbital) lub orbitalu molekularne¬ 
go (MO — molecular orbital) przez funkcję spinową 
oc lub fi (wzór 10). 

Orbitalem atomowym lub molekularnym na¬ 
zywać będziemy tutaj funkcję zależną od współrzęd¬ 
nych jednego elektronu, opisującą ten elektron w 
atomie lub cząsteczce. Funkcję falową opisującą stan 
wszystkich rt elektronów układu można zapisać w 
postaci wyznacznika: 


0 ( 1 , 2 , ...,«) = -— 

\n\ 


^(1) Ż 1 (2)...A 1 («) 
ż 2 (l) 2 2 (2 )...ż 2 (/i) 


( 11 ) 


Xn\l)Xn (2)...A»(«) 


Przedstawienie funkcji falowej 0 w postaci (11) po¬ 
dyktowane jest ogólnymi własnościami układu n elek¬ 
tronów, takimi jak to, że: 1) elektrony są nierozróż- 
nialne, 2) dowolne dwa elektrony układu nie mogą 
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być opisane takim samym spinorbitalem — zasada 
Pauliego (ale ten sam AO lub MO może opisywać dwa 
elektrony, ponieważ w myśl (10) z każdego orbitalu 


stan elektronu stan elektronu 

w atomie w cząsteczce 


% 

/ \ 

spinorbital orbital 

atomowy atomowy (AO) 



spinorbital orbital mole- 
molekularny kulamy (MO) 


można utworzyć dwa spinorbitale) oraz 3) funkcja 
opisująca układ n elektronów musi być antysymetrycz- 
na ze względu na zamianę współrzędnych dwóch elek¬ 
tronów, tzn. np. 0(1,2,...,»)= —0(2,1,...,«). 

W przybliżeniu jednoelektronowym stan podsta- konfiguracja 
wowy układu (rys. 7) można opisać wprowadzając elektronowa 
konfigurację elektronową, która przedstawia upo¬ 
rządkowany ze względu na wzrastającą energię ciąg 
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Rys. 7. Konfiguracja opisująca w przybliżeniu stan podstawowy 
układu 6 elektronów w atomie (AO — lub w cząsteczce 
(MO — yr<). Liczba elektronów na danym orbitalu podana jest 
u góry symbolu orbitalu (ę>ł — jeden elektron na orbitalu <pi, 

<Pi — dwa elektrony na orbitalu <pi) \ a) orbitale są niezdegenero- 
wane; b) dwa orbitale są zdegenerowane 

orbitali z podaniem „obsadzenia” poszczególnych 
orbitali przez elektrony. Zgodnie z zasadą Pauliego na 
każdym z orbitali „umieszczamy” po dwa elektrony 
o przeciwnych spinach, rozpoczynając „obsadzanie” 
od najniższego energetycznie orbitalu. Może się zda¬ 
rzyć, że jakieś dwa orbitale mają taką samą energię degeneracja 
orbitalną (degeneracja orbitali). Spośród kilku moż- orbitali 
liwości rozmieszczenia dwóch elektronów na zdege- 
nerowanych orbitalach (pamiętajmy, że energia 
układu dwóch elektronów nie równa się sumie energii 
orbitalnych) wybieramy najbardziej korzystną ener¬ 
getycznie —jest nią sytuacja, gdy każdy z elektronów 
jest na różnych orbitalach, ale oba elektrony mają 
takie same spiny (reguła Hunda). reguła Hunda 


Równanie Hartree'ego-Focka 

Aby otrzymać przynajmniej jakościowy opis konfi¬ 
guracji elektronów w atomie lub cząsteczce i podać 
względne energetyczne rozmieszczenie orbitali, na¬ 
leży znać postać tych orbitali. Jeśli chodzi o atomy 
sytuacja jest stosunkowo prosta, gdyż należy intui¬ 
cyjnie spodziewać się, że orbitale atomowe mogą mieć 
zbliżony charakter do funkcji falowych \F 1S , 

itd. opisujących w sposób ścisły elektron w ato¬ 
nie jednoelektronowym. Orbitale atomowe <fi mogą 
np. różnić się ładunkiem efektywnym Z'e (jak to było 
w przypadku atomu helu) w stosunku do ładunku 
Ze atomu jednoelektronowego (tabela str. 252). Ale 
czy takie orbitale atomowe są najlepszymi jednoelek- 
tronowymi funkcjami opisującymi elektron w ato¬ 
mie? Orbitale atomowe można przecież wybierać róż¬ 
nymi sposobami. Odpowiedź na pytanie wynika z za- 
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sady wariacyjnej. Szukamy próbnej funkcji falowej 
<P (1,2,..., n) postaci (11) — należy więc tak zmieniać 
postać AO lub MO, aby energia konfiguracji była jak 
najmniejsza. Zasada wariacyjna pozwala otrzymać 
równania (tzw. równania Hartree’ego-Focka lub 
w skrócie równania HF), z rozwiązania których otrzy¬ 
mujemy orbitale atomowe yi lub molekularne 
oraz odpowiadające im energie orbitalne et. W przy¬ 
padku gdy mamy parzystą liczbę elektronów oraz 
tzw. zamkniętopowłokową konfigurację stanu pod¬ 
stawowego (po dwa elektrony na każdym orbitalu), 
równania HF mają postać 

F<f‘i = Bi<Pi 

lub (12) 

Fyi — atpi (dla / = l,...,w/2). 

Jest to postać równań bardzo zbliżona do ogólnego 
równania Schrodingera (1). Zasadnicza różnica polega 
na znacznym uproszczeniu równań HF. Podczas gdy 
równanie (l)było równaniem na znajdowanie jednej 
funkcji falowej dla całego układu, równania HF są 
układem h/2 równań na orbitale jednoelektronowe 
opisujące w sposób przybliżony każdy z elektronów 
oddzielnie. 

Operator Hartree’ego-Focka F występujący w (12) 
zależy od energii kinetycznej jednego elektronu, od 
jego oddziaływania z jądrem atomu (lub jądrami czą¬ 
steczki) oraz od uśrednionego potencjału oddziały¬ 
wania ze wszystkimi pozostałymi elektronami. Uśred¬ 
niony potencjał jest niestety określony przez wszy¬ 
stkie orbitale, których szukamy. Oznacza to, że ope¬ 
rator F zależy od współrzędnych określonego elek¬ 
tronu, np. 1 oraz parametrycznie od orbitali <pt lub 
Wu tzn. F = F(l;<p u <p 2f ... y (p n jt) lub F = F (1; y lt ..., 
V'n/ 2 ). Znalezienie rozwiązania układu równań (12) 
nie jest więc proste, rozwiązuje się je metodą itera- 
cyjną. 

W skrócie postępowanie iteracyjne jest następujące. 

1. Zakładamy początkowe orbitale <pty t ..., 

<Pnfz i definiujemy F <0) (1; ę> ( J\..., ); rozwiązujemy 
układ równań F (0) <Pi = ei<pi dla /= 1,..., n/2 znajdu¬ 
jąc orbitale , <P ( n }{. 

2. Definiujemy F (1) (l; <p ( {\ rozwiązu¬ 

jemy układ równań F* 1 ^ = a<pi dla 1 = 1,..., n/2 
znajdując orbitale <p ( p, <p ( P ,...» <pfy. 

3. Definiujemy F (2 >( 1; <p ( l\ <p ( l\ ...»9>*V 2 , itd. 

Znalezione w m-tym cyklu obliczeń orbitale ..., 
<P<$1 używamy do określenia operatora F (m >, i roz¬ 
wiązujemy układ równań = ei<Pi dla i = 1,..., 

n/2 znajdując orbitale Jeżeli ten 

układ orbitali nie różni się od orbitali <p ( ™> z po¬ 
przedniego cyklu, obliczenia przerywamy, gdyż dal¬ 
sze postępowanie iteracyjne nie zmieni już postaci 
orbitali. Oczywiście tak samo rozwiązuje się równa¬ 
nia HF w przypadku cząsteczki. 


Orbitale pola samouzgodnionego SCF 

Orbitale otrzymane w wyniku rozwiązania iteracyj- 
nego równań ( 12 ) nazywa się orbitalami pola samouz¬ 
godnionego (SCF — Self Consistent Field), gdyż orbi¬ 
tale określają „samouzgodniony” potencjał uśred¬ 
niony (pole) działający na poszczególne elektrony 
układu. 

Cząsteczka jest o wiele bardziej złożonym układem 
niż atom. W atomie położenia elektronów określone 
są względem jednego centrum (jądro atomu) — orbi¬ 
tale atomowe są więc jednocentrowe. W cząsteczce 
elektrony są własnością całej cząsteczki, a orbitale 
molekularne są wielocentrowe. Nie znamy jednak ich 
ogólnej postaci, dlatego też rozwiązywanie równań 
HF dla cząsteczek nastręcza duże trudności, czasami 
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wręcz nie do pokonania. Wobec tego rozwiązujemy 
równania ( 12 ) w uproszczonej postaci (tzw. równania 
Hartree*ego-Focka-Roothaana lub po prostu równa¬ 
nia HFR). Orbitale molekularne przybliża się przez równania 
liniową kombinację znanych funkcji jednoelektrono- HFR 
wych 

Vt = £ Cpi<p P . (13) 

Układ funkcji <p p nazywa się bazą. Bardzo często jako 
bazę wybiera się orbitale atomowe <p atomów wcho¬ 
dzących w skład cząsteczki. Mówimy wówczas, że 
orbitale molekularne przybliżone są przez liniową 
kombinację orbitali atomowych (LCAO — Linear LCAO 
Combination of A O). Rozwiązanie równań HF z przy¬ 
bliżeniem (13) — równań HFR, daje wówczas orbi¬ 
tale molekularne, które nazywa się orbitalami SCF 
LCAO-MO. Warto dodać, że stosując coraz większą orbitale 
bazę gdy w wyrażeniu (13) m -*00 otrzymujemy roz- SCF LCAO- 
wiązania odpowiadające równaniom HF (12). Użycie -MO 
bazy nieskończonej jest oczywiście niemal niemożliwe 
(prowadzi to do rozwiązywania wyznacznika nieskoń¬ 
czonego rzędu, por. ( 8 ) i (9)). Obliczenia wykazują 
jednak, że użycie dużej skończonej bazy dla małych 
układów (np. dla atomów) daje zbliżone wyniki do 
rozwiązania równań HF (12). 



Atomy wieloelektronowe 

Wspominaliśmy już o tym, że użycie przybliżenia 
jednoelektronowego dla układu n elektronów wy¬ 
jaśnia wiele własności atomów lub cząsteczek. Jak 
opisujemy w tym przybliżeniu atomy wieloelektro¬ 
nowe? Na rys. 8 podano schematyczne przedstawie¬ 
nie konfiguracji stanów podstawowych atomów wo¬ 
doru, litu, itd. aż do neonu. Podobne konfiguracje 
można zbudować dla pozostałych pierwiastków ukła¬ 
du okresowego. Zanim omówimy krótko charaktery¬ 
styczne własności konfiguracji elektronowych ato¬ 
mów, powiemy kilka słów o orbitalach atomowych 
potrzebnych do określania konfiguracji. 


Orbitale atomowe 

Orbitale atomowe mogą mieć różną postać — mogą 
to być np. funkcje „podobne” do funkcji (3) atomu 
wodoru. Tego typu orbitale nazywane są orbitalami 
wodoropodobnymi. Bardzo często używane są orbi- orbitale 
tale typu Slatera w postaci Slatera 

<Pn'lm = Nn'r n/ - J e- z ' r i n ' a °Yim(&, <?), (14) 

gdzie An' jest stałą normalizacyjną, ri jest tzw. efek¬ 
tywną liczbą kwantową (według reguł Slatera n' = n 
dla n = 1,2 i 3, ale n' nie musi być w ogólności liczbą 
całkowitą), natomiast Z'e jest efektywnym ładunkiem 
jądra. Dla orbitali poszczególnych atomów łatwo 
znajduje się ładunki według reguł, które podał Slater 
(reguły te pominiemy, ponieważ nie będziemy z nich 
dalej korzystać). Część kątowa Yim orbitali Slatera 
jest taka sama, jak w funkcjach (3). 

Orbitale Slatera są tylko przybliżonymi orbitalami 
atomowymi, ale mają bardzo wygodną postać anali¬ 
tyczną. Najlepszymi jednak orbitalami są funkcje orbitale 
otrzymane z rozwiązania równań HF (orbitale ato- atomowe HF 
mowę HF, <p HF ), które z kolei nie mąją zbyt dogodnej 
postaci, wyniki bowiem są podane w postaci zbioru 
liczb (tabel), a nie w postaci funkcji analitycznych. 

Wcześniej już wspominaliśmy o zniechęcającym spo¬ 
sobie przedstawiania numerycznego równania ( 1 ) dla 
funkcji wieloelektronowej układu. Dla atomu helu 
np., taka funkcja wymagałaby zapisania całego tomu, 
dla atomu litu potrzebny już byłby cały księgozbiór. 

Jeśli chodzi o orbitale HF sytuacja jest o wiele prost¬ 
sza. Do opisu atomu helu potrzebny jest jeden orbi- 
tal; numeryczne przedstawienie tej funkcji wymaga- 



rozwinięcie 
na orbitale 
Slatera 


więc np. tabeli z tysiącem wartości funkcji. Dla litu atomu jednoelektronow^ego (tabela str. 252 i rys. 4). 
musimy znać dwa orbitale, a więc należy podać dwie Ze względu na to, że w atomach wieloelektronowych 
podobne tabele, itd. Operowanie takimi tabelami na każdy elektron atomu nie działa już potencjał cen- 


?2p 

?2s 


-4- 

44 

4- 

44 

9^s -4“ 

44 

44 

44- 

44- 

wodór H 

hel He 

lit Li 

beryl Be 

bor B 

1 s 

is 2 

1s 2 2s 

ls 2 2s 2 

1s 2 2s 2 2p 

< p 2 P -4-r- — 

-4 -f-4- 

-fi- -4—ł- 

44- 44- -4- 

44 44* 44 

?2s -H- 

44 

44 

44 

44 

vu 44- 

-h- 

44- 

44- 

41 

węgiel C 

azot N 

tlen O 

fluor F 

neon Ne. 

1s 2 2s 2 2p 2 

1s 2 2s 2 2p 3 

1s 2 2s 2 2p 4 

ls 2 2s 2 2p 5 

1s z 2s z 2p° 


Rys 8. Konfiguracje elektronowe pierwszych 10 atomów układu okresowego pierwiastków. Dla atomu wodoru orbita 1$ jest ścis¬ 
łym rozwiązaniem równania (1). Dla pozostałych atomów orbitale li.ls oraz 2 p są przybliżonymi funkcjami jednoelektronowymi. 
W każdej konfiguracji uwzględniono względne rozmieszczenie energetyczne orbitali, czyli ci* < £su < e iPx — £svy ■ ale me uw¬ 
zględniono zróżnicowania energetycznego orbitali między różnymi konfiguracjami (rys. 10) 


(funkcjami) jest również kłopotliwe. Aie postęp 
w technice obliczeniowej jest bardzo duży i nie tabela- 
ryzuje się już funkcji HF dla atomów. Szybciej bo¬ 
wiem można taką funkcję obliczyć mając program 
obliczeniowy na komputer, aniżeli przepisać ją 
z tablicy bezbłędnie. Bardzo często funkcje HF zapi¬ 
sane są na taśmach magnetycznych, tak że wykorzy¬ 
stanie ich w obliczeniach jest proste. 

Istnieje jeszcze inny sposób postępowania. Za po¬ 
mocą liniowej kombinacji funkcji typu Slatera (14) 
można przybliżyć orbitale HF z dowolnym stopniem 
dokładności. Orbital HF ma wówczas postać 

m 

<r“ F = £ c v tj, 

t - 1 

gdzie (fj oznacza orbital Slatera (14) z parametrem 
Z' traktowanym jako nieznany. E. Clementi pokazał, 
że orbitale HF dla atomów od litu do neonu są bardzo 
dobrze przybliżone przez układ 9 funkcji Slatera. 
Energie całkowite atomów obliczone w tym przybli¬ 
żeniu zgadzają się z energiami HF z dokładnością do 
0,0001 j.at. Przybliżenie orbitali HF przez liniową 
kombinację orbitali atomowych (nie muszą to być 
koniecznie orbitale Slatera) jest korzystne, gdyż orbi¬ 
tale HF są wówczas scharakteryzowane przez podanie 
małego układu liczb (współczynniki cy oraz np. war¬ 
tości parametrów Z' dla poszczególnych orbitali Sla¬ 
tera). 

Orbitale atomowe mają pew-ną cechę wspólną. 
Kontury tych orbitali, jak również kontury gęstości 
są bardzo podobne do odpowiednich konturów ato¬ 
mu jednoelektronowego. Dlatego też poszczególne 
orbitale oznacza się symbolami <p is , <Pz$, <Pzp itd ; , a w 
przypadku orbitali Hartree ł ego-Focka dodaje się do¬ 
datkowo indeks HF u góry orbitali <Pis F > <P% F itd. Bar¬ 
dzo często skraca się cały zapis, oznaczając orbitale 
jedynie symbolami 1 s, 2 s, 2 p (2 p x> 2py, 2-Pz) itd. Tak 
więc orbitale atomowe użyte do konstrukcji konfigu¬ 
racji elektronowych atomów (rys. 8) są orbitalami 
przybliżonymi albo orbitalami HF. 

Na rys. 9 pokazano warstwice gęstości poszczegól¬ 
nych orbitali HF dla atomów od wodoru do neonu 
(w przypadku wodoru orbitale HF są ścisłymi fun¬ 
kcjami (3)) oraz warstwice całkowitych gęstości elek¬ 
tronowych dla atomów. Widać wyraźnie, że zmie¬ 
niają się rozmiary określonych orbitali przy przejściu 
od atomu do atomu, ale zasadniczo charakter prze¬ 
strzenny jest taki sam, jak dla odpowiednich funkcji 


tralny, jak to było w przypadku atomu jednoelektro- zależność 
nowego, energia poszczególnych orbitali zależy od energii od 
liczby kwantowej n oraz / (tzn. np. e^s ^ ^ n r / i Z 

£ 3j > # £sd). Dla określonego atomu sekwencja 
energii orbitalnych jest następująca: 

Bis < E2s < £2 p (b 2 v x — £2 p y — £ 2 ^) < £33 < € 3 p < £4S < 

^ £ 3 d itd. Jeszcze jedną charakterystyczną cechą kon¬ 
figuracji elektronowych jest to, że energie poszczegól¬ 
nych orbitali ulegają obniżeniu, gdy liczba elektro¬ 
nów w atomie zwiększa się. Widać to szczególnie wy¬ 
raźnie na rys. 10. Bardzo znacznemu obniżeniu ule¬ 
gają energie orbitalne £ ls . Dla atomu wodoru 
£ 1 s (H) = —0,5 j.at. (-13,6 eV), podczas gdy dla 
węgla e 18 (C) = —11,3255 (-308,2), a dla azotu i tlenu 
energie e 18 wynoszą odpowiednio —15,6290 (—425,3) 



Rys. 10. Energie orbitali U, 2s i 2 p pierwszych 10 pierwiastków 
układu okresowego obliczone metodą HF (energia e ia = —0,5 
j.at. = —13,6 eV dla atomu wodoru wynika ze ścisłego rozwią¬ 
zania równania (!)• Orbitale typu 2 p każdego atomu są potrójnie 
zdegenerowane (fi*p x = £a p v — £ip z ) 
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liczba porządkowa pierwiastka N 

Rys. 11. Porównanie doświadczalnych wartości potencjałów jonizacyjnych z wartościami obliczonymi metodą HF dla atomów o licz¬ 
bach porządkowych od 3 do 54 (dane liczbowe wg S. Fraga i in., Canad. J. Phys., 51,2063 (1973) oraz C. Roctti, E.Clcmcnti, J. Chem. 
Phys. 61,2062 (1974) 


oraz —20,6686 (—562,4); pierwsze wartości są wj.at., 
a w nawiasach — w eV. Z drugiej strony energie orbi¬ 
talne B 2 s oraz e 2p ulegają znacznie słabszemu obni¬ 
żeniu, np. e 2s (C) = —0,7056 (—19,2), e 2P (C) «= 
= -0,4333 (-11,8), £ 2 s (N) = -0,9453 (-25,7), 
s 2p (N) = -0,5675 (-15,4), e 2s (O) = -1,2443 

(—33,9), £ 2p (0) = —0,6319 (—17,2) i są porówny¬ 
walne z energią orbitalną s is dla wodoru. Mówimy, 
że elektrony znajdujące się na orbitalach ls (skróto¬ 
wo: elektrony ls) w atomach węgla, azotu czy tlenu 
są energetycznie znacznie głębiej położone aniżeli 
elektrony 2s czy 2 p tych atomów. Okaże się to szcze¬ 
gólnie ważne przy omawianiu budowy cząsteczek. 

Orbitale HF dają najlepszy obraz atomu w przy¬ 
bliżeniu jednoelektronowym. Na poprzednich stro¬ 
nach porównywaliśmy wyniki obliczeń dla atomu 
helu. Użyte orbitale były orbitalami Slatera. Według 
reguł Slatera dla orbitalu <p is atomu wieloelektrono- 
wego należy przyjąć Z' = 1,70. Obliczona energia 
atomu helu przy użyciu takiej funkcji Slatera jest 
rzędu 98% energii dokładnej (rys. 6). Używając orbi¬ 
tali HF (rys. 9) obliczona energia wynosi ć HF (He) = 
—2,8617 j.at., co stanowi 98,55% energii dokładnej. 
Jest to najlepszy wynik uzyskany w przybliżeniu jed¬ 
noelektronowym — lepszego już nie można uzyskać 
w tym modelu, gdyż równania HF wynikają z zasady 
wariacyjnej. Dla atomu litu energia HF atomu wy¬ 
nosi ć IIF (Li) = —7,4327 j.at. (stanowi to 99% energii 
dokładnej litu —7,47807 j.at.), a dla atomu berylu 
ć HF (Be) = —14,5730 j.at. zgadza się w 99,3% z ener¬ 
gią dokładną. Jak wskazują te liczby, obliczenia Hart- 
ree’ego-Focka dla atomów dają dobre wyniki dla 
energii całkowitych atomów. Inne wielkości obliczone 
tą metodą też zgadzają się z danymi doświadczalny¬ 
mi. Z rys. 11 wynika, że chociaż w niektórych wypad¬ 
kach obliczone potencjały jonizacyjne atomów są niż¬ 
sze od odpowiednich wartości doświadczalnych, to 
jednak teoretyczne wyniki doskonale przewidują 
zmiany wartości potencjałów przy przejściu od atomu 
do atomu. 


Korelacja elektronów 

Metoda Hartree’ego-Focka ma charakter przybliżo¬ 
ny. Podstawą tej metody jest model elektronów (ogól¬ 
nie cząstek) niezależnych, w którym każdy elektron 
porusza się niezależnie od pozostałych. Innymi słowy 
prawdopodobieństwo znalezienia elektronu w okre¬ 
ślonym obszarze przestrzeni nie zależy od tego, gdzie 
przebywa drugi elektron. Intuicyjnie wiemy jednak, 
że z powodu odpychania się kulombowskiego elek¬ 
tronów przebywanie np. dwóch elektronów w atomie 


helu po przeciwnych stronach jądra powinno być energia 
uprzywilejowane. Ruchy elektronów nie są nieza- korelacji 
leżne od siebie, są one skorelowane. Obliczając ener¬ 
gie metodą Hartree’ego-Focka popełniamy błąd, gdyż 
nie uwzględniamy korelacji elektronów. Ten błąd 
nosi nazwę energii korelacji (Js kor ) i jest różnicą 

JTkor _ £dokł _ 

gdzie E* okl oznacza dokładną wartość energii dla da¬ 
nego układu otrzymaną z rozwiązania równania (1) 

(lub wartość doświadczalną energii atomu po odjęciu 
poprawek relatywistycznych itp.). 

Energia korelacji jest mała. Dla atomu helu wynosi 
ona —0,042 j.at. (ok. 1,5% energii dokładnej), 
a dla litu —0,045 j.at. (1% energii dokładnej). W ato¬ 
mie berylu energia korelacji równa się —0,094 j.at., 
ale stanowi ona tylko 0,7% energii całkowitej. Ener¬ 
gia korelacji dla innych atomów jest również mała 
i stanowi mniej niż 1% energii dokładnej. Bezwzględ¬ 
na wartość energii korelacji w atomach oczywiście 
rośnie wraz ze wzrostem liczby elektronów w atomie. 

Wzrost ten nie jest jednak równomierny. Na przykład 
energia korelacji helu i litu oraz neonu i sodu jest 
praktycznie taka sama, a energia korelacji berylu jest 
około dwukrotnie wyższa od energii korelacji litu. 

Porównanie z konfiguracjami tych atomów (rys. 8) 
wskazuje, że najważniejszą rolę odgrywa korelacja energia 
par elektronów ls 2 lub 2s 2 , natomiast korelacja mię- korelacji 
dzy parą ls 2 a elektronem 2s lub między parą ls 2 a konfigura- 
i parą 2s* (np. w berylu) nie ma istotnego znaczenia, cja 
Gdy przechodzimy od berylu o konfiguracji \s 2 2s 2 do 
innych atomów zapełniając orbitale 2 p f energia 
korelacji wzrasta. Wzrost ten związany jest ze zbliżo¬ 
nymi energiami orbitali 2s i 2 p oraz z efektami de¬ 
generacji orbitali 2 p. Wyjaśnienie tych spraw wyma¬ 
gałoby jednak szerszej dyskusji. 

Zwróćmy jeszcze uwagę na fakt, że energie korela¬ 
cji dla jonu Li+ oraz atomu Li są praktycznie takie 
same, a stanie się jasne, dlaczego obliczony potencjał 
jonizacyjny litu za pomocą metody Hartree’ego-Focka 
(rys. 11) jest w bardzo dobrej zgodności z doświad¬ 
czeniem. Zgodnie z definicją potencjału powinniśmy 
odejmować od energii dokładnej Li + energię dokład¬ 
ną Li. Ale £’ dokJ (Li+) = ć HF (Li+)-f£ kor (Li+) oraz 
£dokł(Li) = ć**F(Li) -j-E kor (Li), a ponieważ energie 
korelacji Li+ i Li są takie same, więc ^^(Li+j — 

-E d oW(Li) = £HF(Li+)-ć HF (Li). Tak więc, odej¬ 
mując dwie przybliżone liczby (energie HF) otrzy¬ 
maliśmy potencjał jonizacyjny w bardzo dobrej 
zgodności z doświadczeniem, ponieważ przy odejmo¬ 
waniu skasowały się błędy (energie korelacji). Podob¬ 
na sytuacja występuje dla sodu (liczba porządkowa 
11) i jego jonu oraz dla potasu (liczba porządkowa 19) 
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i jego jonu, natomiast dla innych atomów już nie, 
ponieważ energia korelacji atomu nie jest na ogół 
równa energii korelacji jego jonu. 

W jaki sposób można uzyskać lepsze wyniki aniżeli 
uzyskiwane metodą Hartree’ego-Focka? Należy wyjść 
poza przybliżenie jednoelektronowe i uwzględnić 
korelacje elektronów. Można to zrobić kilkoma spo¬ 
sobami — omówimy tutaj tylko jeden, tzw. metodę 
oddziaływania konfiguracji (metoda CI— Configu- 
metoda Cl rationlnteraćtiori). 


Metoda oddziaływania konfiguracji 

Omawialiśmy poprzednio konfiguracje podstawowe 
układu elektronów. Ale można oczywiście dla każ¬ 
dego układu elektronów przyporządkować orbitale, 
które nie są obsadzone przez elektrony konfiguracji 
podstawowej; pozwala to zbudować tzw. konfiguracje 
konfiguracje wzbudzone układu (rys. 12). Każda z konfiguracji 
wzbudzone opisana jest funkcją mającą postać wyznacznika (lub 
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Rys. 12. Konfiguracja podstawowa i kilka konfiguracji wzbudzo¬ 
nych atomu helu. Pierwsze cztery konfiguracje są singletami, 
ostatnia konfiguracja jest trypletcm 


sumy wyznaczników) postaci (11). Jeżeli znamy postać 
orbitali dla konfiguracji podstawowej (np. mogą to 
być orbitale wyznaczone metodą HF) oraz dla kon¬ 
figuracji wzbudzonych, wówczas możemy szukać fun¬ 
kcji próbnej opisującej układ elektronów w postaci 
(por. wzór 8 ): 

m 

0 i>r = JP A P 0 P , 

J»'l 

gdzie <P p jest funkcją opisującą różne konfiguracje. 
Okazuje się, że dla m — oo za pomocą powyższego 
rozwinięcia można wyrazić funkcję dokładną dane¬ 
go układu. Oczywiście w praktyce bierze się skończo- 


Energie atomów helu i berylu obliczone metodą Hartre- 
e’ego-Focka i metodą oddziaływania konfiguracji 


Liczba konfiguracji 

Energia, j.at. 

Błąd, j.at. 

HEL 



1 (HF) 

-2,8617 

-0,0421 

20 (CI) 

-2,9028 

-0,0009 

35 (CI) 

-2,9032 

-0,0005 

wartość dokładna 

-2,9037 

_ 

BERYL 


1 (HF) 

-14,573 

-0,094 

2 (CI) 

-14,617 

-0,050 

55 (CI) 

-14,661 

-0,006 

wartość dokładna 

-14,667 

— 


porównanie ną sumę (skończoną liczbę konfiguracji), a współczyn- 
wyników niki A p oblicza się metodą Ritza. Uzyskana funkcja 
metod H F falowa 0 pr jest tym lepsza od funkcji Hartree’ego-Foc- 
i Cl im więcej uwzględnia się konfiguracji wzbudzo¬ 
nych. W tabeli podano przykładowo wyniki dla helu 
i berylu uzyskane metodą HF oraz metodą CI. 

Metoda oddziaływania konfiguracji wyraźnie pod¬ 
kreśla przybliżony charakter pojęcia konfiguracji 
elektronowej atomu. Na przykład dla atomu berylu 
przy użyciu funkcji falowej będącej kombinacją linio¬ 
wą dwóch konfiguracji 1 $ 2 2$ 2 oraz \s z 2p z otrzymuje 
się energię stanu podstawowego atomu znacznie lep¬ 
szą niż metodą HF. Z drugiej strony, ze współczynni¬ 
ków rozwinięcia wynika, że konfiguracja l.y 2 2 .s 2 wy¬ 
stępuje ze współczynnikiem A x — 0,95, natomiast 
konfiguracja \s z 2p z ze współczynnikiem A z = 0,31. 
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Współczynniki te oczywiście zmieniają się w przypad¬ 
ku użycia większej liczby konfiguracji. Jak więc widać, 
model jednoelektronowy (tzn. przypisanie elektro¬ 
nów określonym orbitalom) jest przybliżonym, ale 
bardzo użytecznym, opisem rzeczywistej sytuacji. 


Podstawy spektroskopii 
molekularnej 


W równaniu Schrodingera (1) opisującym dowolny 
układ chemiczny, np. cząsteczkę, elektrony i jądra 
układu są traktowane w ten sam sposób. Jednakże 
masa najlżejszego jądra (protonu) jest przeszło 1800 
razy większa niż masa elektronu. Dlatego też jądra 
w cząsteczce poruszają się znacznie wolniej niż elek¬ 
trony; fakt ten jest przyczyną wielu istotnych włas¬ 
ności cząsteczek. 


Rozdzielenie ruchu elektronów i jąder 

Różnice pomiędzy ruchem jąder i ruchem elektronów 
cząsteczki powodują, że jej stany energetyczne można 
opisać w pewien przybliżony sposób. Można poka¬ 
zać mianowicie, że równanie Schrodingera (1) opi¬ 
sujące dowolną cząsteczkę można zastąpić układem 
dwóch równań 

jt/el y/el — jJTel ijE/el (16a) 

(W+E*)W = EWK (16a') 

Pierwsze równanie, zwane elektronowym równaniem elektronowe 
Schrodingera, opisuje ruch elektronów cząsteczki równanie 
w polu nieruchomych jąder. Hamiltonian elektrono- Schrodingera 
wy H cl składa się z energii kinetycznej wszystkich 
elektronów, energii oddziaływania elektronów z nie¬ 
ruchomymi jądrami, energii oddziaływania elektro¬ 
statycznego pomiędzy elektronami oraz z wyrazu 
opisującego elektrostatyczne oddziaływanie pomię¬ 
dzy jądrami (stały wyraz w przypadku nieruchomych 
jąder). Równanie elektronowe rozwiązuje się dla róż¬ 
nych ustalonych położeń jąder cząsteczki. Funkcje 
elektronowe 9 /el oraz energie E cl zależą więc parame¬ 
trycznie od położeń jąder. 

Drugie równanie opisuje ruch jąder, na które 
działa potencjał E ęl pochodzący od elektronów. 

Hamiltonian W jest operatorem energii kinetycznej 
wszystkich jąder cząsteczki. 

Z postaci równań (16) i (16a') wynika, że nie są to 
równania niezależne od siebie. Wprawdzie pierwsze 
równanie można rozwiązać nie znając rozwiązania 
drugiego równania, ale nie odwrotnie. Rozwiązania 
równań (16) związane są z rozwiązaniem równania 
( 1 ) w prosty sposób: 

R) = <pei(7 ; 7)9%??). 

E = E*'(R)+EK (17) 

Przez podanie r i R jako argumentów funkcji falowych 
zaznaczono tutaj bezpośrednią ich zależność od zbioru 
wektorów opisujących położenia wszystkich elektro- przybliżenie 
nów (r) i wszystkich jąder (/?); występowanie R , Borna- 
jako argumentu w E el oznacza, że energia elektrono- Oppenhei- 
wa cząsteczki zależy parametrycznie od położeń mera (BO) 
jąder. Przyjęcie funkcji falowej i energii w postaci 
(17) nosi nazwę przybliżenia Borna-Oppenheimera 
(przybliżenie BO). Jest to najczęściej stosowane 
przybliżenie przy opisie własności cząsteczek. Nie¬ 
kiedy (ale bardzo rzadko) stosuje się przybliżenie adia¬ 
batyczne— do potencjału E el (R) w (17) i w rów¬ 
naniu (16a') dodaje się poprawkę uwzględniającą drob¬ 
ny wpływ ruchu jąder na ruch elektronów. Poprawkę przybliżenie 
tę można obliczyć, jeśli znamy funkcję falową opi- adiabatyczne 









sującą układ elektronów cząsteczki w przybliżeniu 
BO. Poprawkę adiabatyczną oblicza się jednak tylko 
w nielicznych przypadkach, gdyż jest ona bardzo 
mała. Na przykład dla cząsteczki wodoru poprawka 
adiabatyczna do energii dysocjacji cząsteczki jest 
rzędu 0,01% tej energii. Jeszcze mniejsze znaczenie 
mają efekty nieadiabatyczne. Należałoby je uwzględ¬ 
nić np. w obliczeniach, w których jest potrzebna 
wysoka dokładność wyników. 

cząsteczka Zajmijmy się teraz równaniem elektronowym (16a). 
dwuatomowa Dla uproszczenia za podstawę rozważań weźmiemy 
cząsteczkę dwuatomową, choć uogólnienie rozważań 
na cząsteczki wieloatomowe nie sprawia żadnego 
kłopotu. Jak wspomnieliśmy już poprzednio, aby 
opisać ruch elektronów w cząsteczce należy rozwią¬ 
zać równanie elektronowe dla ustalonych położeń 
jąder cząsteczki. Niestety, jak wiadomo, nie można 
uzyskać ścisłego rozwiązania w postaci analitycznej 
dla układu większego niż jednoelektronowy. Roz¬ 
wiązanie równania elektronowego znajdujemy więc 
stosując metody przybliżone chemii kwantowej 
(przeważnie metodę wariacyjną). Równanie to ma 
wiele rozwiązań—jest nim zbiór funkcji falowych 

Wgir; oraz zbiór odpowiadających im energii 

Eg(R). Indeks n numeruje poszczególne stany cząste¬ 
czek (w ogólności n jest tylko indeksem i nie ma nic 
wspólnego z główną liczbą kwantową dla atomów 
jednoelektronowych). Umówimy się, że stan podsta¬ 
wowy oznaczać będziemy indeksem n — 0 , a stany 
wzbudzone numerować będziemy kolejnymi liczbami 



Rys. 13. Schematyczne przedstawienie zależności energii E * x od 
odległości międzyjądrowej R dla kilku stanów elektronowych 
cząsteczki dwuatomowej (krzywe energii potencjalnej). Eg — 
energia stanu podstawowego cząsteczki (cząsteczka stabilna), kmin 
odległość międzyjądrowa, przy której występuje minimum energii 
elektronowej stanu podstawowego; E\ l , E^ —energie elektro¬ 
nowe odpowiednio niestabilnego i stabilnego stanu wzbudzonego 
cząsteczJci 

całkowitymi. Typowe Wykresy Eg (R ) dla stanu pod¬ 
stawowego oraz dla kilku stanów wzbudzonych 
cząsteczki dwuatomowej są przedstawione na rys. 13. 
Wykresy te nazywane są krzywymi energii potencjal¬ 
nej. Należy pamiętać, że mamy nieskończoną liczbę 
stanów elektronowych cząsteczki, ale w praktyce 
krzywe ograniczamy się tylko do rozważania stanu podsta- 
energii wowego i kilku najniżej leżących stanów wzbudzo- 
potencjalnej nych. Kształt krzywej energii potencjalnej ukazującej 
zmianę energii Eg jako funkcji odległości między- 
jądrowej jest jedną z najbardziej charakterystycznych 
właściwości struktury cząsteczki. Stabilność cząsteczki 
jest uwarunkowana faktem występowania względ¬ 
nego minimum funkcji Eg. Każdej wartości Eg dla 
określonej odległości międzyjądrowej odpowiada 
funkcja falowa Wg, która jest przedstawiona w po¬ 
staci numerycznej. Uogólnienie pojęcia krzywych 
energii potencjalnej podanych na rys. 13 w stosunku 
do cząsteczki wieloatomowej jest bardzo proste. 
Dla cząsteczki dwuatomowej funkcje Eg są zależne 


od jednego parametru — odległości międzyjądrowej cząsteczka 
R. Dla cząsteczki wieloatomowej należy uwzględnić wieloatomo- 
wszystkie parametry wyznaczające względne położę- wa 
nia jąder cząsteczki (zbiór tych parametrów oznacza¬ 
my nadal symbolem R). Energie Eg ( R ) cząsteczki 
wieloatomowej są funkcjami wieloparametrowymi —- 
są to powierzchnie energii potencjalnej w przestrzeni 
wielowymiarowej. Przedstawienie graficzne tych krzy¬ 
wych dla cząsteczek wieloatomowych jest niemożli¬ 
we. Nie przeszkadza to zupełnie w dyskusji stanów 
elektronowych cząsteczek złożonych posługiwać się 
krzywymi przedstawionymi na rys. 13. 

Oscylacje i rotacje cząsteczek 

W przypadku cząsteczek dwuatomowych — w sposób 
ścisły, a dla cząsteczek wieloatomowych — z bardzo 
dobrym przybliżeniem, równanie (16a') opisujące ru¬ 
chy jąder cząsteczki rozbija się na dwa równania 
postaci 

H rot(£, <p) y/rot(^ > <p) = £rot ^rot^, <p) y (16b) 

(Hosc (R) +Eg(R)+Erft) WgfiW = E nvJ 

(16c) 

gdzie W = H voi +H°* c , W = !P rot ^ osc 

oraz E* — E rot +E osc . 

W równaniach powyższych kąty # oraz <p charakte¬ 
ryzują położenie cząsteczki podczas obrotu. Pierwsze 
z powyższych równań (zapisane tutaj w postaci sym¬ 
bolicznej) opisuje ruch obrotowy (rotację) cząsteczki 
dwuatomowej i jest bardzo dobrze znane matematy¬ 
kom. Rozwiązaniem tego równania są funkcje kąto¬ 
we takiej samej postaci, jak dla atomu wodoru, por. 
wzór (3). Ze względu na tradycję, w przypadku ruchu 
rotacyjnego zamiast używania indeksu / jak w (3), 
wprowadza się liczbę kwantową J, określającą stany liczba _ 
rotacyjne cząsteczki. Oczywiście, tak jak liczba /, rotacyjna J 
liczba rotacyjna / może przyjmować wartości 7 = 0 , 1 , 

2,.... Energie poszczególnych stanów rotacyjnych 
y/rot wynoszą E J ot = BJ (J+ 1), gdzie B jest tzw. 
stałą rotacyjną. 

Równanie (16c) opisuje ruch związany ze zmianą 
współrzędnej R — opisuje więc ono oscylacje jąder 
cząsteczki zachodzące w polu sił o potencjale równym 
sumie potencjału elektronowego Eg dla różnych sta¬ 
nów oraz członu rotacyjnego zależącego od rotacyjnej 
liczby kwantowej 7. Dla danych n oraz 7 równanie 
(16c) ma wiele rozwiązań, które rozróżniamy wskaźni¬ 
kiem v. Dlatego też w (16c) funkcje falowe V /osc oraz stan 
energie E zostały oznaczone trzema wskaźnikami elektronowy, 
/?, r, 7 oznaczającymi odpowiednio stan elektro- oscylacyjny 
nowy, oscylacyjny i rotacyjny. ' rotacyjny 

Równania (16a), (16b) oraz (16c) mają zasadnicze 
znaczenie dla spektroskopii molekularnej. Rozwiązu¬ 
jąc układ tych równań znajdujemy układ poziomów 
energetycznych cząsteczki i odpowiadające im funkcje 
falowe; możemy więc znaleźć różnice pomiędzy ener¬ 
giami poziomów energetycznych (różnice te są mie¬ 
rzone w doświadczeniu), jak również potrafimy obli¬ 
czyć prawdopodobieństwa przejść, czy też określić 
reguły wyboru dla określonych typów przejść. 

Z równań (16aM16c) wynika, że w przybliżeniu 
funkcja falowa cząsteczki ¥ == ^ cl ¥ /osc !F rot , na¬ 
tomiast jej energia wynosi E — E cl -b£ osc +i^ ot . 

Określając stan energetyczny cząsteczki musimy więc 
oprócz podania stanu elektronowego określić jej 
stan oscylacyjny oraz stan rotacyjny. Na rys. 14 
przedstawiono schemat diagramu poziomów ener¬ 
getycznych cząsteczki dwuatomowej (rysunek ten 
można traktować oczywiście jako uogólniony dia¬ 
gram poziomów energetycznych dla cząsteczki wielo¬ 
atomowej). 

Spektroskopia molekularna zajmuje się badaniem 
oddziaływań pomiędzy materią (cząsteczki) a promie¬ 
niowaniem elektromagnetycznym. Używając pomia¬ 
rowych technik absorpcyjnych lub emisyjnych wy- 
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różnice znaczamy różnice energii pomiędzy różnymi stanami 
energii mię- cząsteczki. Jak widać z rys. 14 różnice energii pomię¬ 
dzy stanami dzy stanami elektronowymi są dużo większe aniżeli 
różnice pomiędzy stanami oscylacyjnymi określonego 
stanu elektronowego, a te z kolei są większe niż 
różnice pomiędzy poziomami rotacyjnymi. Typowe 
różnice wartości energii wynoszą: dla przejść rota¬ 
cyjnych od 0,001 do 0,01 eV, dla przejść oscylacyjnych 
od 0,05 do 0,2 eV, dla przejść elektronowych od 2 do 



Ry s . 14. Poziomy energetyczne cząsteczki dwuatomowej. Krzywe 
energii potencjalnej wykreślone są dla elektronowego stanu pod¬ 
stawowego E c oraz dla pierwszego stanu wzbudzonego Przed¬ 
stawiono kilka stanów oscylacyjnych oraz kilka stanów rotacyj¬ 
nych dla poziomów oscylacyjnych v <= 0, v = 1 oraz dla v' = 4. 
Dla trzech typów przejść użyto różnych skal energetycznych. Na 
prawo pokazano ten sam układ poziomów energetycznych, ale 
bez krzywych energii potencjalnej — poziomy E % oraz E y odpo¬ 
wiadają położeniu minimum odpowiednich krzywych 


.2 

’ 6 > 



r 2 


7, 



Rys. 15. Dwa różne sposoby przedstawiania stanów energetycz¬ 
nych złożonej cząsteczki. W przybliżeniu nierelatywistycznym 
każdy stan ma określoną multipletowość zależną od wzajemnego 
ukierunkowania spinów elektronów cząsteczki (zob. rys, 12). Dla 
cząsteczek o parzystej liczbie elektronów elektronowy stan pod¬ 
stawowy jest stanem singletowym (5 0 ). Na schemacie zaznaczono 
po dwa wzbudzone stany singktowe (S„ Sa) i trypletowe (7^, T.). 
Symboli S n i T n używa się zamiast funkcji falowych lP el określa¬ 
jących poszczególne stany elektronowe cząsteczki. Dla trzech 
stanów S 0 , Si i 7\ zaznaczono w kółkach kierunki spinów dwóch 
elektronów położonych najwyżej energetycznie w konfiguracji 
elektronowej opisującej dany stan cząsteczki — linie poziome 
oznaczają orbitale molekularne. Połowa pozostałych elektronów 
w każdym ze stanów ma spiny skierowane przeciwnie do spinów 
drugiej połowy elektronów. Z obliczeń kwantowych wynika, że 
dwa stany opisane konfiguracjami różniącymi się tylko kierun¬ 
kiem spinów (np. stany S, i 7\) mają różną energię. W wypadku 
stanów’ singletowych i trypłetowych zawsze ten ostatni stan ma 
niższą energię aniżeli odpowiadający mu stan singlctowy. Każ¬ 
demu stanowi elektronowemu odpowiada układ stanów oscyla¬ 
cyjnych 
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5 eV. Jak widać, różne typy przejść obserwuje się podział 
w różnych częściach widma elektromagnetycznego, spektroskopii 
Rozróżniamy dlatego m.in. spektroskopię mikro¬ 
falową, podczerwieni oraz światła widzialnego i nad¬ 
fioletu. Podział ten oczywiście nie wyczerpuje wszyst¬ 
kich możliwości technicznych. Istnieje dziedzina 
zwana spektroskopią ramanowską (badanie widm 
oscylacyjnych w obszarze widzialnym i nadfioletu). 

Ściśle ze spektroskopią molekularną wiążą się spek¬ 
troskopia magnetycznego rezonansu jądrowego oraz 
spektroskopia elektronowego rezonansu spinowego 
(“► Spektroskopia rezonansów magnetycznych). 

Dla dużych cząsteczek, kiedy zahamowana jest ich 
rotacja (szczególnie gdy cząsteczki znajdują się w roz¬ 
tworze lub w ośrodku sztywnym) na schemacie pozio¬ 
mów energetycznych podawane są tylko stany elek¬ 
tronowe i stany oscylacyjne (rys.-15). Aby okreś¬ 
lić stan takiej złożonej cząsteczki, należy oprócz 
podania funkcji falowej określającej stan elektrono¬ 
wy (rozwiązanie równania 16a) podać funkcję fa¬ 
lową ^ /osc opisującą określony stan oscylacyjny cząs¬ 
teczki. Innymi słowy, w przypadku pominięcia rotacji, 
należy znać rozwiązanie równań (16a) i (16c). Aby 
podać rozwiązanie tego ostatniego równania, należy 
przede wszystkim 2 nać energię E* 1 (R). Dla cząsteczki 
dwuatomowej należy podać przebieg krzywej energii 
potencjalnej (rys. 13). Postać tej funkcji, jak już 
wspomnieliśmy poprzednio, jest nieznana. Stosuje się 
jednak wiele uproszczeń opisujących przebieg takich 
krzywych. 


Oscylator harmoniczny 

W przypadku cząsteczki dwuatomowej najprostszym cząsteczka 
przybliżeniem funkcji energii Eg(R) jest parabola dwuatomowa 
postaci V(R) = l / 2 k(R— Rmm) 2 , gdzie k jest tzw. 
stałą siłową charakteryzującą siły powstające w cząs¬ 
teczce przy przesunięciu jąder z ich położenia równo¬ 
wagi Rmin- Założenie to jest równoważne przyjęciu, 
że jądra drgają ruchem harmonicznym (jest to przy¬ 
padek tzw. oscylatora harmonicznego). Rozwiązanie 
równania (16c) dla tego przypadku jest bardzo do¬ 
brze znane. Funkcje własne charakteryzujące 

poszczególne stany oscylacyjne cząsteczki, mają po¬ 
stać analityczną (nie będziemy podawali tutaj tych 
funkcji, ale przebieg ich dla kilku stanów oscylacyj¬ 
nych pokazany jest na rys. 16), a wartości własne 
jE£ sc wynoszą 

Eos c = hv(v+'/ 2 ), (18) 

gdzie v jest częstością oscylacji, natomiast v jest oscy¬ 
lacyjną liczbą kwantową (v — 0, 1, 2,...). Model 




odległość międzyjądrowa R 


Rys. 16. Porównanie energii cząsteczki dwuatomowej i oscyla¬ 
tora harmonicznego: a) poziomy energetyczne i przebieg odpo¬ 
wiednich funkcji falowych oscylatora harmonicznego, b) krzywa 
energii potencjalnej cząsteczki dwuatomowej 
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oscylatora harmonicznego opisuje w dobrym przy¬ 
bliżeniu tylko najniższe stany oscylacyjne cząsteczki. 
Związane jest to z faktem, że parabola V(R) jest do¬ 
brym przybliżeniem dla krzywej E Ql (R) tylko w pobli¬ 
żu jej minimum. W rzeczywistości drgania oscylacyjne 
w cząsteczce są anharmoniczne. Anharmoniczność ta 
powoduje, że odstępy pomiędzy poziomami oscyla¬ 
cyjnymi cząsteczki dwuatomowej maleją ze wzrostem 
pobudzenia, podczas gdy w oscylatorze harmonicz¬ 
nym są one stałe (rys. 16). 



Rys. 17. Schematyczne przedstawienie trzech stanów energetycz¬ 
nych złożonej cząsteczki (zob. rys. 15) z zaznaczonymi kształtami 
funkcji oscylacyjnych (funkcje oscylacyjne zaznaczono tylko dla 
dwóch najniższych stanów oscylacyjnych oraz dla stanu oscyla¬ 
cyjnego o dużej wartości liczby kwantowej r). Natężenie różnych 
przejść między stanem podstawowym S 0 i stanem wzbudzonym 
(np. S,) jest m.in. proporcjonalne do kwadratu całki nakrywania 
odpowiednich stanów oscylacyjnych. Na przykład, dla sytuacji 
przedstawionej na rysunku przejście 
v = 0 —► v" r ~ l" jest silniejsze niż przejście 
v" = 0", ponieważ 

/ jp,T dc > f r“ c r™; dv 

Ważną konsekwencją wzoru (18) jest to, że dla 
v = 0 energia oscylacyjna £J SC = l / 2 fiv i cząsteczka 
nie może nigdy mieć energii całkowitej odpowiadają¬ 
cej minimalnej wartości E el (R) dla R — Rmin. 

Rozważania dotyczące cząsteczki dwuatomowej mo¬ 
żna rozszerzyć na cząsteczki wieloatomowe (rys. 17). 
Cząsteczka złożona z N jąder posiada 3N—6 drgań 
podstawowych (lub 3N—5 drgań w przypadku 



Rys. 18. Krzywa energii potencjalnej cząsteczki dwuatomowej 
w stanie podstawowym. Zaznaczono energię wiązania i energię 
dysocjacji 


cząsteczki liniowej) i w przybliżeniu każde z tych 
drgań można opisać równaniami oscylatora harmo¬ 
nicznego. Tak więc całkowita energia oscylacyjna 
cząsteczki jest sumą energii poszczególnych oscyla- 

»A T -6 

torów harmonicznych, tzn. E osc — £ ftvi(vi-\- L / 2 ). 

<~i 

Model oscylatora harmonicznego można użyć do 
przybliżonego opisu oscylacji stanu podstawowego 
cząsteczki, jak również do opisu oscylacji jej stanów 
wzbudzonych. Pozwala to wyjaśnić wiele jakościo¬ 
wych właściwości widm elektronowych złożonych 
układów (np. różnice w natężeniu pasm oscylacyjnych 
widma elektronowego). 


Cząsteczka H 2 

Zanim zaczniemy omawiać zastosowania metod che¬ 
mii kwantowej do opisu właściwości cząsteczek, po¬ 
święcimy kilka słów cząsteczce wodoru. Cząsteczka ta 
zajmuje szczególne miejsce w mechanice kwantowej 
atomów i cząsteczek. Jest ona najprostszą cząsteczką 
zawierającą dwa elektrony, nic więc dziwnego, że 
mimo iż nie można było dla niej znaleźć ścisłego roz¬ 
wiązania równania Schródingera, od początku pow¬ 
stania chemii kwantowej usiłowano obliczyć w sposób 
przybliżony jej energię wiązania (rys. 18). Zagadnie- energia 
niu temu poświęcono wiele prac, uzyskując teoretycz- wiązania 
ne wielkości, które mniej lub bardziej zgadzały się 
z doświadczalną wartością energii wiązania wynoszą¬ 
cą 4,75 eV. Już w 1933 r. H.M. James i A.S. Coolidge 
wykonali obliczenia dla cząsteczki wodoru używając 
funkcji falowej typu (8), gdzie funkcje %p zawierały 
wielomiany postaci (zob. oznaczenia na rys. 19): 

Jest to szereg potęgowy pomnożony przez czynnik 
wykładniczy zależny od nieznanego parametru a. 



Rys. 19. Oznaczenia położeń elektronów 1 i 2 oraz jąder a i b 
w cząsteczce wodoru. Zamiast współrzędnych kartezjańskich r a 
lub r& można użyć współrzędnych eliptycznych 


Ć - 


r a + r b 

~R 


oraz tj 


Ta—rb 
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Oczywiście w wyrażeniu (8) bierze się pod uwagę 
skończoną liczbę wyrazów, a współczynniki c v oraz 
parametr a wyznacza się wariacyjnie. Im więcej wyra¬ 
zów będzie występowało w rozwinięciu funkcji (8), 
tym uzyskane wyniki będą dokładniejsze. 

James i Coolidge stosując 13-członowe rozwinięcie 
funkcji falowej (8) uzyskali dla energii wiązania 
wartość 4,72 eV, zgadzającą się dobrze z wynikiem 
doświadczalnym. 

Interesowano się jednak wykonaniem bardziej do¬ 
kładnych obliczeń, które umożliwiłyby zbadanie sto¬ 
sowalności praw mechaniki kwantowej dla układów 
cząsteczkowych (m.in. można byłoby sprawdzić sto¬ 
pień dokładności szeregu przybliżeń stosowanych 
w chemii kwantowej). 

Obliczenia tego typu stały się dopiero możliwe 
po pojawieniu się w pracowniach naukowych kompu¬ 
terów. W 1959 r. W. Kołos i C.C.J. Roothaan, roz¬ 
szerzając obliczenia Jamesa i Coolidge’a i stosując 
40-członowe rozwinięcie, uzyskali energię wiązania 
D e — 38 286,9 cm” 1 , a w kilka miesięcy później 


wynik 
Jamesa 
i Coo3idge'a 


wynik 
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pomiar Herzberg i Monfils zmierzyli dokładniej wartość tej 
Herzberga energii uzyskując D e = 38 287,0^0,8 cm" 1 . Pomiary 
i MonfiSsa energii wiązania, jak również jej obliczona wartość 
były tak dokładne, że podanie wartości D e w „dużych 
jednostkach” jakimi są jednostki atomowe energii 
(1 j.at. energii ^ 2,19 TO 5 cm" 1 ) czy elektronowolty 
(1 eV ^ 8 *10 3 cm" 1 ) nie jest celowe. 

Jak widać, wartość teoretyczna i doświadczalna 
prawie idealnie zgadzały się ze sobą. Była to jednak 
zgodność pozorna. Należało oczekiwać, że energię 
wiązania można obliczyć jeszcze dokładniej przy 
użyciu lepszej funkcji próbnej (zawierającej więcej 
parametrów wariacyjnych), aniżeli ta, którą użyto 
w 1959 r. Nieznane były różnego rodzaju poprawki, 
np. poprawki relawistyczne wynikające z zależności 
masy od prędkości, czy też poprawki promieniste 
związane z oddziaływaniem pomiędzy naładowanymi 
cząstkami. Nie znano dokładnie poprawek adiaba¬ 
tycznych na ruch jąder, ani poprawek wynikających 
z efektów nieadiabatycznych. Zastrzeżenie budziło 
też porównywanie teoretycznej i doświadczalnej 
energii wiązania, gdyż ta ostatnia wielkość nie jest 
bezpośrednio mierzalna. Należało raczej obliczyć 
bardzo dokładnie krzywą energii potencjalnej, a na¬ 
stępnie należało obliczyć energię najniższego poziomu 
oscylacyjnego, a tym samym energię dysocjacji. Do¬ 
piero tak obliczoną wartość D 0 można porównać 
z bezpośrednio mierzoną wartością energii dysocjacji 
cząsteczki. 

obliczenia Obliczenia takie przeprowadzili W. Kołos (Uniwer- 
Kołosa i sytet Warszawski) oraz L. Wolniewicz (Uniwersytet 
Wolniewicza Mikołaja Kopernika w Toruniu) w czasie pobytu 
na University of Chicago. Po opracowaniu specjalnego 
programu obliczeniowego, korzystając z 80-człono- 
wego rozwinięcia funkcji falowej (8) uzyskali wyniki, 
które przedstawiono w tabeli. Jak widać, przybliże¬ 
nie adiabatyczne daje wartość energii dysocjacji D 0 
nie różniącą się wiele od D 0 obliczonej w przybliżeniu 
BO. Różnica ta wynosi tylko 5,9 cm -1 . Ale wynik 
doświadczalny był znany wówczas z dokładnością 


Energia dysocjacji cząsteczki wodoru 


Metoda obliczenia 

Otrzymana wartość, cm -1 

Przybliżenie Borna-Oppenbeimera 

Z> 0 =36112,2 

Przybliżenie adiabatyczne 

D 0 =36118,1 

Poprawki relatywistyczne 

AD? = -0,5 

Poprawki promieniste 

AD T * d = -0,2 

Całkowita wartość teoretyczna 

36117,3 


do ±0,3 cm" 1 , dlatego bardzo ważne było obliczenie 
D 0 w przybliżeniu adiabatycznym. Poprawki relaty¬ 
wistyczne i promieniste chociaż bardzo małe, musiały 
być również uwzględnione w tak dokładnych oblicze¬ 
niach. Zupełnie niedawno okazało się, że nie uwzględ¬ 
nione początkowo przez Kolosa i Wolniewicza efekty 
nieadiabatyczne są zupełnie do pominięcia. 

Ostateczna teoretyczna wartość energii dysocjacji 
D 0 — 36 117,3 cm" 1 zaskoczyła teoretyków (rys. 20). 
Była ona większa niż wartość doświadczalna! Było 
to nie tylko dziwne, ale również niepokojące. Zgodnie 
bowiem z zasadą wariacyjną, jeśli korzystając z szere¬ 
gu funkcji próbnych obliczymy odpowiadające 
tym funkcjom energie dysocjacji £>P r , to najlepszym 
przybliżeniem do doświadczalnej energii dysocjacji 
będzie ta wartość D^ y która jest największa. Ale nigdy 
obliczona wartość D 0 (po uwzględnieniu poprawek) 
nie powinna być większa od wartości doświadczalnej 
(rys. 21).'Tymczasem wartość teoretyczna była więk¬ 
sza od doświadczalnej o 3,7 cm" 1 , a więc wynosiła 
znacznie więcej niż błąd pomiaru doświadczalnego 
(rys. 20). Co więcej, należało oczekiwać, że gdyby 
obliczyć D 0 z jeszcze lepszą funkcją próbną lub gdyby 
uwzględnić efekty nieadiabatyczne (później okazało 
się, że te ostatnie poprawki są nieistotne), to wówczas 
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energia dysocjacji jeszcze zwiększyłaby się, a tym sa¬ 
mym powiększyłaby się rozbieżność pomiędzy do¬ 
świadczeniem a teorią. Było to bardzo niepokojące. 
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Rys. 20. Porównanie energii dysocjacji D 0 cząsteczki wodoru 
wyznaczonej doświadczalnie oraz obliczonej teoretycznie 
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Rys. 21. Wartość energii dysocjacji obliczana metodą wariacyjną 
przy użyciu przybliżonej (próbnej) funkcji falowej nie może być 
większa od wartości otrzymanej z dokładnego rozwiązania rów¬ 
nania Schródingera 


bo gdyby tak było w rzeczywistości, to metod chemii 
kwantowej nie można byłoby stosować do układów 
cząsteczkowych, ściślej mówiąc, zasada wariacyjna 
nie mogłaby być używana do znajdowania kresu 
dolnego obliczonej energii cząsteczek. Traciłyby wów¬ 
czas sens jedne z podstawowych równań, opisujące 
w przybliżony sposób cząsteczki — równania Hart- 
ree ł ego-Focka. Nie miałaby sensu metoda oddziały¬ 
wania konfiguracyjnego. 

Istniała jednak pewna szansa wytłumaczenia wy¬ 
stępującej rozbieżności, np. wyniki obliczeń mogły być 
błędne lub mogły być niepoprawne wyniki pomiarów 
lub ich interpretacja. Doświadczalną wartość energii 
dysocjacji uważano jednak wówczas za bardzo do¬ 
kładną, natomiast sceptycznie odnoszono się do 
wyniku obliczonego. Rozbieżność spowodowaną 
nieuwzględnianiem w obliczeniach nie znanego do¬ 
tychczas efektu można było śmiało wykluczyć, gdyż 
obliczenia kwantowe np. dla atomu helu dały wyniki 
zgodne z doświadczalnymi. 

Kołos i Wolniewicz udali się powtórnie do USA 
i powtórzyli obliczenia energii dysocjacji dla cząstecz¬ 
ki wodoru. Obliczenia te zostały wykonane za po¬ 
mocą nowego programu obliczeniowego i z zastoso¬ 
waniem lepszej funkcji falowej (100-członowe roz¬ 
winięcie). Obliczenia prowadzono w tzw. podwójnej 
precyzji eliminującej ewentualne błędy wynikające 
z zaokrąglenia. Poprzednie wyniki zostały w pełni 
potwierdzone — stosując lepszą funkcję falową uzys¬ 
kali oni wynik teoretyczny lepszy od poprzedniego 
o 0,1 cm" 1 . Tym razem zaniepokoił się Herzberg 
o swoje poprzednie pomiary — powtórzył je w innych 
warunkach i z większą dokładnością. Wynik nowych 




















pomiarów był nieoczekiwany. Okazało się bowiem, 
że poprzednie wyniki były fałszywe. Herzberg stwier¬ 
dził tym razem zachodzenie na siebie linii widmo- 
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Rys. 22. Nowe pomiary energii dysocjacji cząsteczki wodoru 
wykazały, że energia ta była poprzednio zmierzona niepoprawnie 


wych i niestety nie udało mu się dokładnie wyznaczyć 
nowy pomiar nowej wartości energii dysocjacji. Mógł on jedynie 
Herzberga stwierdzić, że energia dysocjacji jest zawarta pomię¬ 
dzy 36 118,3 a 36116,3 cm -1 (rys. 22). Ostateczny 
wynik teoretyczny otrzymany przez Kołosa i Wolnie- 
wicza prawie dokładnie odpowiadał wartości poś¬ 
redniej zakresu danych doświadczalnych. 

Wyniki obliczeń wykonane przez Kołosa i Wolnie- 
wicza dla cząsteczki H 2 mają ogromne znaczenie dla 
podstaw chemii kwantowej. Wykonane zostały dla 
bardzo małej cząsteczki, ale wykazały, że wyniki 
teoretyczne mogą współzawodniczyć z powodzeniem 
w dokładności z wynikami doświadczalnymi, a co 
więcej, że dzięki nim można nawet korygować błędy 
w wynikach pomiarów. Na ogół, kiedy porównuje się 
jakieś wartości obliczone z odpowiednimi danymi 
zmierzonymi, mówi się, że „wyniki teoretyczne zga¬ 
dzają się z danymi doświadczalnymi”, natomiast 
w przypadku cząsteczki wodoru należało powiedzieć, 
że „wynik doświadczalny zasadniczo zgadzał się 
z wartością teoretyczną”. 

Warto podkreślić, że oprócz energii dysocjacji 
obliczono dla H 2 wartości wielu innych wielkości 
mających znaczenie dla spektroskopii (m.in. wiel¬ 
kości charakteryzujące oddziaływania pola elektro¬ 
magnetycznego z cząsteczką, jak momenty elektryczne 
czy polaryzowałność). Okazuje się, że obliczenia te 
mają również praktyczne znaczenie. Na przykład 
obliczony tzw. moment kwadrupolowy cząsteczki H 2 
został niedawno zastosowany przez astronomów do 
wyznaczania zawartości wodoru na Jowiszu. Obliczo¬ 
no również potencjał jonizacyjny dla cząsteczki H 2 — 
wartość teoretyczna 124 416,8 cm -1 zgadza się bardzo 
dobrze z wartościami doświadczalnymi zmierzonymi 
przez Herzberga (124 418,4 ±0,4 cm” 1 ) lub przez 
Takezawę (124 417 i 2 cm” 1 ). Z innych wielkości, 
które obliczono, warto wymienić energie poziomów 
oscylacyjnych stanu podstawowego cząsteczki H 2 , 
jak również krzywe energii potencjalnej dla kilku 
stanów wzbudzonych cząsteczki. Podobne oblicze¬ 
nia wykonano dla cząsteczek D 2 i HD. 


Cząsteczki dwuatomowe 


Aby wyjaśnić wiele istotnych właściwości cząsteczek, 
nie musimy wykonywać tak skomplikowanych obli¬ 
czeń, jak dla cząsteczki wodoru. Stan elektronów w 
cząsteczce decyduje w przeważającej mierze o jej 
właściwościach fizykochemicznych. Aby określić 
ten stan, należy oczywiście rozwiązać równanie elek¬ 
tronowe, które jest bardzo podobne do równania 
elektronowego dla atomu. Oba równania różnią się 
jedynie energią potencjalną — w atomie występuje 
oddziaływanie z jednym jądrem, natomiast w cząs¬ 


teczce ruch elektronów zachodzi w polu co najmniej 
dwóch jąder. 

Najprostszy opis stanu elektronów w cząsteczce 
otrzymujemy w modelu jednoelektronowym (por. 
Przybliżenie jednoelektronowe), a najlepszymi orbi¬ 
talami molekularnymi są orbitale uzyskane za pomocą 
rozwiązania równań Hartree’ego-Focka. Niestety, 
dla cząsteczek wieloatomowych numeryczne rozwią¬ 
zywanie tych równań jest niemożliwe i zadowalamy 
się przybliżeniami analitycznymi, które szczególnie 
dla dużych cząsteczek są mało dokładne. Niemniej, 
wyznaczone w ten sposób orbitale molekularne umoż¬ 
liwiają poglądowe wyjaśnienie właściwości cząste¬ 
czek i powiązanie ich z właściwościami atomów. Za¬ 
dawalające jakościowe wyniki można uzyskać również 
w przypadku posługiwania się orbitalami moleku¬ 
larnymi nie wyznaczonymi metodą SCF. 

Rozpatrzmy najprostszą cząsteczkę, jaką jest jon jon Hj 
HJ. Przy dużych odległościach między jądrami układ 
ten składa się w zasadzie z atomu wodoru oraz pro¬ 
tonu (sytuacja a lub b na rys. 23). Jeśli jednak od¬ 
ległość między jądrami jest mała, wówczas nie można 
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Vb^9A + ?B 


Rys. 23. Cząsteczka H+ przy dużej (a, b) i małej (c) odległości 
międzyjądrowej. Zaznaczono przekroje konturów orbitali ato¬ 
mowych (pa ora z (po typu li- oraz wiążącego orbitalu molekular¬ 
nego i//&. Kropkami zaznaczono położenie protonów 


elektronu przypisać ani jądru A ani też jądru B — 
elektron jest wspólną własnością obu jąder. Elektron 
w cząsteczce przy dużej odległości międzyjądro- 
wej R jest opisany albo orbitalem atomowym ya 
albo <pb (oba typu \s). W przypadku skończonej od¬ 
ległości międzyjądrowej stan podstawowy elektronu 
w Hf opisujemy orbitalem molekularnym y i natu¬ 
ralne jest przybliżenie MO w postaci y = c x <pA- 1- 
-{-c 2 <pb. Współczynniki c x oraz c 2 można łatwo wy¬ 
znaczyć z warunku normalizacji orbitalu y oraz 
z własności symetrii układu. Otrzymujemy wówczas 
dwa orbitale molekularne. 


= , — — — (<Pa+<Pb) 

j/2(l+S) 

= , 1 (<Pa-<Pb) 

Vu\~S) 


(19) 




gdzie S = / <PA<PBdv jest całką nakrywania przyj- 
mującą wartości pośrednie pomiędzy 0 oraz 1 
(rys. 24). Znając orbitale molekularne możemy ob¬ 
liczyć przyporządkowane im energie orbitalne. W przy¬ 
bliżeniu energie te wynoszą 


O 

SsssO 


£b = en-tfi, sa = SH—fi, ( 20 ) 

gdzie en jest energią elektronu atomu wodoru w sta¬ 
nie opisanym orbitalem <pa (lub yz?), natomiast fi jest 
tzw. całką rezonansową. Nie będziemy tutaj szczegóło¬ 
wo omawiać tej całki, zaznaczymy jedynie, że jej 


Rys. 24. Nakrywanie się przekrojów konturów orbitali atomowych 
typu ls przy różnych odległościach międzyjądrowych R 
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całka wartości nie są większe od zera (tzn. fi ^ 0), oraz że 
rezonansowa P -* 0, gdy R -► oo. Jak więc widać energia orbitalna 
€b jest niższa od energii orbitalnej €«. Ze wzorów 

tya 

s Jo 


/ 

_ /** 

atom A atom B 

cząsteczka A-B 

Rys. 25. Poziomy energetyczne w rozełz i clonych atomach i w dwu- 
atomowej cząsteczce homojądrowej. Znaki -f oraz — przy wią¬ 
żącym i anty wiążącym orbitalu oznaczają, że orbitale te są przy¬ 
bliżone odpowiednio przez sumę lub różnicę orbitali atomowych 
(fi a oraz <fiB 



n) 


<Pa <?b 



Rys. 26. Wykresy wartości funkcji falowych wzdłuż osi między- 
jądrowej: a) orbitale atomowe i <fiB typu 1 s, b) wiążący i anty- 
wiążący orbital molekularny, c) kwadraty orbitali molekularnych 


(20) wynika również, że energia ma niższą wartość 
od energii orbitalu atomowego <pa (lub <pb\ natomiast 
energia e a ma wartość wyższą od tych energii 
(rys. 25). 

Rysunek 26 przedstawia schemat wykresu obu 
orbitali molekularnych oraz wykres kwadratów tych 
funkcji. Na wykresie |y^| 2 widać wyraźnie, że naj¬ 
większa gęstość prawdopodobieństwa = e|yi>j 2 zna¬ 
lezienia elektronu w cząsteczce jest przy jądrach. Cha¬ 
rakterystyczny przy tym jest fakt, że gęstość prawdo¬ 
podobieństwa znalezienia elektronu pomiędzy jądrami 
jest duża — oznacza to, że istnieje wiązanie elektrono¬ 
we pomiędzy jądrami. Orbital molekularny opisujący 
orbita! to wiązanie nazywamy dlatego orbitalem wiążącym 
wiążący (indeks b przy funkcji jest skrótem wyrazu bonding). 

Wiążący orbital molekularny nie ma symetrii sferycz¬ 
nej, jak orbitale atomowe typu 1 j, lecz ma symetrię 
cylindryczną wokół osi międzyjądrowej. O każdym or¬ 
bitalu molekularnym tego typu będziemy mówili, że 
ma symetrię a lub po prostu, że jest to MO typu cr. 
wiązanie o Wiązanie elektronowe, które jest opisane takim orbi¬ 
talem, nazywać będziemy wiązaniem o , a elektrony 
opisane takim orbitalem nazywać będziemy elektro- 
elektrony cr nami a. 

Wykres |v>a| 2 jest zupełnie inny od wykresu kwadra¬ 
tu funkcji Jeżeli elektron jest opisany orbitalem 
molekularnym y> a , wówczas gęstość prawdopodobień¬ 
stwa Qa — e\tp a \ 2 znalezienia elektronu jest największa 
przy jądrach i jest zdecydowanie mała w obszarze 
między jądrami cząsteczki (g a = 0 dokładnie w środku 
odległości międzyjądrowej). Łatwo też zauważyć, że 
gęstość prawdopodobieństwa znalezienia elektronu 
poza obszarem międzyjądrowym jest dość duża dla 
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niewielkich odległości od jądra. Te własności orbitalu orbital 
molekularnego y a uzasadniają nazywanie go orbita- antywiąźący 
lem anty wiążącym (indeks a przy funkcji y> a jest skró¬ 
tem wyrazu antibonding). Zauważmy też, że orbital 
y>a ma podobnie jak orbital symetrię cylindryczną; 
ma więc on symetrię a. Aby jednak wyróżnić jego 
antywiąźący charakter, oznaczać będziemy orbital 
tp a symbolem a*. 

Jaki wpływ na energię cząsteczki Hf mają omówio¬ 
ne różnice w rozkładzie ładunku elektronowego? Mo¬ 
żemy to wyjaśnić za pomocą prostego modelu elektro¬ 
statycznego (rys. 27). Układ składający się z dwóch ła¬ 
dunków dodatnich (protony cząsteczki Hf) jest ukła¬ 
dem nietrwałym (sytuacja a). Wyobraźmy sobie, że 
między ładunkami dodatnimi pojawił się mały ładu¬ 
nek ujemny (sytuacja b). Układ ten jest nadal nietrwa- 

a)-*— + 


b) ^- 


c>-*— ri- 

Rys. 27. Model elektrostatyczny wyjaśniający zależność wiążą¬ 
cych i antywiążących własności orbitalu od rozkładu ładunku 



Rys. 28. Krzywe energii 
potencjalnej dla dwóch 
najniższych stanów ele¬ 
ktronowych (wiążącego 
i anty wiążącego) jonu 
H+; en jest energią ele¬ 
ktronu w stanie podsta¬ 
wowym atomu wodoru 



odległość międzyiądrowa R 


ły, gdyż mały ładunek ujemny nie jest w stanie skom¬ 
pensować odpychających sił pomiędzy ładunkami do¬ 
datnimi. Dopiero gdy ładunek ujemny jest wystarcza¬ 
jąco duży (sytuacja c), układ jest trwały w wyniku 
kompensacji sił odpychających przez siły przyciągają¬ 
ce występujące pomiędzy ładunkami. Ten prosty mo¬ 
del tłumaczy trwałość cząsteczki Hf wówczas, gdy 
elektron jest opisany orbitalem (orbitalowi temu 
odpowiada wzrost gęstości ładunku elektronowego 
między jądrami), oraznietrwałość cząsteczki, gdy elek¬ 
tron jest opisany orbitalem y> a (orbitalowi temu odpo¬ 
wiada mały ładunek elektronowy pomiędzy jądrami). 
Zrozumiały się staje teraz przebieg krzywych poten¬ 
cjalnych E cl (R) dla cząsteczki Hf przedstawiony na 
rys. 28. 


Cząsteczki dwuatomowe homojądrowe 

Orbitale molekularne oraz y> a dla cząsteczki Hf są 
orbitalami przybliżonymi utworzonymi z orbitali ato¬ 
mowych typu 1 s. Dla cząsteczki Hf, jak również dla 
innych homojądrowych cząsteczek dwuatomowych, 
można utworzyć przybliżone orbitale molekularne 
z orbitali atomowych odpowiadających stanom wzbu¬ 
dzonym atomu wodoru. Na przykład można łatwo 
utworzyć orbitale molekularne z orbitali typu 2 s: 

tpb ~ 2 sa +2sb , ya 2 sa—2sb. 

Zarówno niższy energetycznie orbital wiążący, jak 
i orbital antywiąźący mają symetrię a . W przypadku 
tworzenia orbitali molekularnych z orbitali atomo- 
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elektronowe 


jon Hej 
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wych typu 2p, ze względu na ukierunkowanie tych 
ostatnich, mamy dwa rodzaje MO (rys. 29) — orbi¬ 
tale o symetrii a i orbitale o symetrii n. Te ostatnie 
orbitale są antysymetryczne względem odbicia 
w płaszczyźnie przechodzącej przez oś wiązania. 
Wprowadzona symbolika orbitali molekularnych 
(por. rys. 29, 30) wymaga krótkiego wyjaśnienia. 
Homojądrowe cząsteczki dwuatomowe mają tzw. 
środek symetrii, którym jest punkt leżący w środku 
odległości między jądrami cząsteczki. Orbitale mo¬ 
lekularne, które są symetryczne względem odbicia 
w środku symetrii oznacza się wskaźnikiem g (niem. — 
gerade ), natomiast MO będące antysymetrycznymi 
względem tego odbicia mają wskaźnik u (niem. — 
ungercde). 

Znając przybliżoną postać orbitali molekularnych 
możemy ustalić elektronowe konfiguracje dla homo- 
jądrowych cząsteczek dwuatomowych. Należy oczy¬ 
wiście każdemu MO przyporządkować określoną 
energię. Niestety, nie można tego zagadnienia roz¬ 
wiązać w sposób ogólny — dla każdej cząsteczki 
należy wykonać oddzielnie obliczenia numeryczne. 
Tak się jednak składa, że względna kolejność pozio¬ 
mów energetycznych na ogół nie zależy od rodzaju 
cząsteczki (rys. 30). Warto zwrócić uwagę na fakt, 
że orbitale n(2p x ) i n*(2p x ) różnią się od odpowiednich 
orbitali n(2p z ) i n*(2pz) jedynie obrotem o 90° wokół 
osi y. Ponieważ żaden z kierunków prostopadłych 
do osi cząsteczki nie jest wyróżniony, orbitale n(2p x ) 
i 7t(2p z ) mają taką samą energię orbitalną (podobna 
sytuacja jest dla orbitali n*(2p x ) i n*(2pz)); wystę¬ 
pują więc poziomy podwójnie zdegenerowane. 

Ustalenie konfiguracji elektronowej określonej 
cząsteczki jest bardzo proste (rys. 7). Poszczególne 
orbitale molekularne obsadzamy kolejno elektro¬ 
nami zaczynając od orbitali najniższych energetycz¬ 
nie i pamiętając, że na każdym orbitalu mogą być 
najwyżej dwa elektrony o przeciwnie skierowanych 
spinach* oraz pamiętając o regule Hunda. Podane 
w tabeli konfiguracje elektronowe dla kilku cząsteczek 
i ich niektórych jonów tłumaczą w prosty sposób 
obserwowane różnice w charakterze wiązań wystę¬ 
pujących w cząsteczkach i ich jonach. Na przykład 
cząsteczka H 2 różni się od swojego dodatniego jonu 
tym, że na orbitalu wiążącym ma dwa elektrony, 
a nie jeden. Wiązanie w H* ma więc dokładnie taki 
sam charakter, jak wiązanie w jonie H J. Jest ono jed¬ 
nak znacznie silniejsze w neutralnej cząsteczce, gdyż 
wiązanie to pochodzi od dwóch elektronów. Dlatego 
też odległość między jądrami w H 2 jest mniejsza od 
odległości między jądrami w HJ. Jak widać więc 
dla utworzenia kowalencyjnego wiązania chemicznego 
nie jest niezbędna para elektronów. Niemniej wiąza¬ 
nie dwuelektronowe odgrywa w pewnym sensie wy¬ 
różnioną rolę, gdyż jest silniejsze od wiązania jedno- 
elektronowego. Jest to jednak różnica ilościowa, a nie 
jakościowa. 

Rozpatrzmy z kolei jon Hej. W jonie tym dwa 
elektrony znajdują się na orbitalu wiążącym oraz 
jeden na orbitalu antywiążącym. Mamy więc w tym 
wypadku wiązanie trójelektronowe. Jest ono jednak 
słabsze od wiązania.dwuelektronowego, gdyż efekty 
energetyczne jednego z elektronów znajdującego się 
na MO wiążącym i elektronu na MO antywiążącym 
znoszą się wzajemnie (zob. wzór (20)) — ściślej biorąc 
efekt anty wiążący przeważa trochę nad efektem 
wiążącym. Jon dodatni cząsteczki helu jest układem 
trwałym, a jego wiązanie pochodzi w zasadzie od 
jednego elektronu znajdującego się na orbitalu wią¬ 
żącym. Zrozumiały jest również fakt, że w przedsta¬ 
wionym schemacie jak i w rzeczywistości cząsteczka 
He a będzie układem nietrwałym (efekt wiążący dwóch 
elektronów na orbitalu 1 o g jest znoszony przez efekt 
antywiążący dwóch elektronów na orbitalu 1 cr u ). 
Dwa atomy helu odpychają się więc wzajemnie (od¬ 
pychanie walencyjne) nie tworząc cząsteczki. 

Na przykładzie cząsteczki Li 2 można wytłumaczyć 
znany dobrze z chemii fakt, że elektrony powłok 


wewnętrznych nie biorą udziału w tworzeniu wiązań cząsteczka 
chemicznych. W miarę zbliżania się dwóch atomów Li 2 
litu przy tworzeniu cząsteczki przenikają się najpierw 
orbitale 2s (są one bardziej rozmyte w przestrzeni niż 
orbitale 1$) i tworzy się orbita! wiążący i antywiążący. 

Koncentracja ujemnego ładunku elektronowego 
w obszarze między jądrami cząsteczki powoduje dal¬ 
sze zbliżanie się atomów. Jednocześnie jednak nastę- 
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Rys. 29. Przekroje konturów orbitali molekularnych utworzo- 0(2~) Og 

nych w wyniku dodawania lub odejmowania orbitali atomowych 
2s i 2 p umieszczonych w punktach położeń jąder A i B. Kontury 
orbitali molekularnych utworzonych z orbitali atomowych Ir 
są podobne do konturów orbitali <r(2 s) 
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Rys. 30. Poziomy energetyczne rozdzielonych atomów oraz dwu- 
atomowej cząsteczki homojądrowej 
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Konfiguracje elektronowe cząsteczek i jonów 


Cząsteczka lub jon 

Konfiguracja elektronowa 

D 0 lub Dt (w na¬ 
wiasie), eV 

Re, rm 

H a + 

\Og 

(2,79) 

0,106 

H, 


(4,75) 

0,073 

He, + 

1 «\ lo u 

(ok. 3) 


He, 

la} I 



Li, 

loj lal 20 i 

0,05) 

0,267 

K 

1 Og l°l 2 Og 1^1 20g 

8,72 

0,121 

N, 

lo\ lal 2o\ 2ol Ul 3oJ 

9,76 

0,1108 

o; 

lOg 1 Ol 20g 2 ol 2o‘ U‘ \ltg 

6,48 

0,1123 

o, 

lOg lal 20g 2 ol 3 o\ U 4 u 1Ą 

5,08 

0,1207 

F, 

lOg 1 ol 2 Og 2&1 Ul 20g lttg 

0,68) 

0,142 



puje zwiększenie się odpychania kulombowskiego 
pomiędzy jądrami atomów litu oraz pojawia się od¬ 
pychanie walencyjne elektronów na orbitalach 1 o g 
i lcr u . Dlatego w cząsteczce litu mamy w zasadzie 


pojedyncze wiązanie (wiązanie a) pochodzące od 
dwóch elektronów znajdujących się na orbitalu 
wiążącym 2 a g . 

Elektrony w cząsteczce opisane orbitalami moleku- 
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Rys. 31. Warstwice gęstości elektronowych 7 homojądrowych cząsteczek dwuatomowych (wiązaniakowalencyjne) otrzymane zobliczen 
metodą HF (zob. rys. 9, podpis). Zewnętrzne warstwice odpowiadają gęstości 6,1 *10“ # ejal. Warstwice gęstości elektronowych cząste¬ 
czek He 2 , Be* oraz Ne a , które nie są stabilne w stanie podstawowym, nie zostały wykreślone 
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wiązanie zi y larnymi typu n będziemy nazywali elektronami jt, 
elektron n a wiązanie elektronowe opisane orbitalem n będziemy 
nazywali wiązaniem 71 . Często zdarza się, że obok 
wiązań n występują w cząsteczce wiązania c. Na przy¬ 
kład w cząsteczce N 2 (zob. podane w tab. Konfigu¬ 
racje elektronowe cząsteczek i jonów, zob. rys. 31) 
mamy wiązanie potrójne utworzone przez sześć elek¬ 
tronów: dwa wiązania n oraz jedno wiązanie a (efekty 
wiążące elektronów na orbitalach \o g i 2 a g są zno¬ 
szone przez efekty anty wiążące elektronów na orbi¬ 
talach odpowiednio 1 a u i 2a u ). 

Uważny czytelnik zapewne zwróci uwagę na fakt, 
że dla cząsteczek N 2 , N£ oraz F 2 sekwencja orbitali 
3 <y g oraz \n u została odwrócona w porównaniu z rys. 
30. W pierwszych dwóch przykładach zostało to uczy¬ 
nione wbrew obliczeniom (najdokładniejsze obliczer 
nia przewidują sekwencję taką jak na rys. 30), bowiem 
stwierdzono doświadczalnie dla tych cząsteczek, że 
wyższym energetycznie orbitalem jest 3 o g a nie l7r«. 
Natomiast dla cząsteczki F 2 obliczenia Hartree’ego- 
Focka podają odwróconą kolejność wspomnianych 
orbitali (rys. 31). 

Z podanego schematu orbitali molekularnych wy¬ 
nika, że jonizacja cząsteczki N 2 prowadzi do oder¬ 
wania elektronu znajdującego się na orbitalu wiążą¬ 
cym 3 <y g i wobec tego jon Nf ma słabsze wiązanie 
(Z> 0 = 8,72 eV) niż neutralny układ N 2 (D 0 = 9,76 eV). 
Jeśli chodzi o cząsteczkę tlenu, to jej stan podstawo¬ 
wy jest trypletem ze względu na degenerację orbitali 
anty wiążących ln g (reguła Hunda, zob. rys. 7). Wy¬ 
jaśnienie tego faktu było jednym z większych osiąg¬ 
nięć teorii MO. Widzimy dalej, że zjonizowanie nie¬ 
których cząsteczek wzmacnia wiązanie między ato¬ 
mami (porównaj wartości D 0 oraz R e dla 0 2 z od¬ 
powiednimi wartościami dla Oj), gdyż odrywając 
elektron z orbitalu antywiążącego 1 n g zmniejszamy 
efekt antywiążący w cząsteczce. Zrozumiałą jest rów¬ 
nież rzeczą, że w jonach ujemnych Oj oraz 0§“ 
efekty antywiążące są większe niż w 0 2 , a tym samym 
w jonach wiązania są słabsze i dłuższe (dla 0 2 , Oj 
oraz Of- wartości R c w nm wynoszą odpowiednio 
0,121; 0,126 oraz 0,149). 


Cząsteczki dwuatomowe heterojądrowe 

Wiele trudności napotykamy przy tworzeniu orbitali 
molekularnych z orbitali atomowych dla dwuato- 
mowych cząsteczek heterojądrowych. Nie występuje 
już w tym wypadku płaszczyzna symetrii prostopadła 
do osi cząsteczki i wobec tego współczynników w roz¬ 
winięciu y = ca<pa+cb<pb należy szukać metodą 
wariacyjną. Kłopotliwy jest również dobór orbitali 
atomowych <p A oraz yn, gdyż różnego typu AO 
w różnych atomach mają różne energie. Korzysta się 
tutaj jednak z takich orbitali atomowych, aby ich 
kombinacje liniowe były jak najbardziej efektywne. 
Oznacza to m.in., że energie określonych i <Pb 
nie powinny wiele różnić się między sobą. Dlatego 
też tworząc orbitale molekularne na przykład dla 
cząsteczki LiH powinniśmy pamiętać, że energia 
orbitalu l5n jest bliższa energii orbitalu 25 li , aniżeli 
energii Dli (por. rys. 10). Dwa elektrony znajdujące 
się na orbitalu atomowym 1 s litu nie odgrywają 
asteczka lstotne J ro ^ w tworzeniu wiązania w cząsteczce LiH 
czą (rola tych elektronów sprowadza się w zasadzie do 

ekranowania jądra Li), natomiast wiązanie w cząs¬ 
teczce jest głównie utworzone przez elektron 1$ wo¬ 
doru i elektron 25 litu — para ta zajmuje w stanie 
podstawowym cząsteczki orbital molekularny po¬ 
staci y> = c A ls£-{-CB2sl i . Cząsteczki heterojądrowe 
mają, podobnie jak homojądrowe, symetrię osiową, 
dlatego nadal obowiązuje podział orbitali molekular¬ 
nych na orbitale typu a oraz n (nie występuje tutaj 
jednak środek symetrii). Dlatego wspomniany wyżej 
orbital w LiH ma symetrię a. 

Przy tworzeniu orbitali molekularnych dla innych 
heterojądrowych cząsteczek dwuatomowych sytuacja 


jest na ogół bardziej złożona. Na przykład w cząs¬ 
teczce CO orbitale 15 zarówno węgla jak i tlenu są 
skoncentrowane blisko odpowiednich jąder i prak¬ 
tycznie nie nakrywają się zupełnie z orbitalami 1 s 
drugiego atomu. Nakrywanie się ich z orbitalami 2s 
lub 2 p y (przy założeniu, że oś y pokrywa się z osią 
cząsteczki drugiego atomu) jest trochę większe, jed¬ 
nak różnica pomiędzy energiami orbitali (por. rys. 10), 
np. 1 5 tlenu i 25 lub 2 p y węgla, jest tak duża, że i w tym 
wypadku nie mamy efektywnej kombinacji liniowej 
orbitali atomowych. Tak więc, elektrony powłok 
wewnętrznych cząsteczek heterojądrowych nie biorą 
również udziału w tworzeniu wiązania chemicznego. 

Natomiast orbitale atomowe 25 i 2 p obu atomów elektrony 
tworzą już efektywne kombinacje liniowe. Ogólnie walencyjne, 
można powiedzieć, że wiązania są tworzone przez orbitale 
elektrony walencyjne znajdujące się na orbitalach walencyjne 
walencyjnych (orbitale walencyjne — orbitale ato¬ 
mowe o największej dla danego atomu wartości głów¬ 
nej liczby kwantowej n w stanie podstawowym). 

W celu otrzymania orbitali molekularnych dla 
cząsteczki CO tworzymy efektywne kombinacje linio- cząsteczka 
we walencyjnych orbitali atomowych. Z orbitali 2 p x CO 
tlenu oraz 2 p x węgla otrzymujemy wiążący i antywią¬ 
żący orbital molekularny typu n. Podobnie z orbitali 
2 p z otrzymujemy orbitale n. Natomiast gdy chcemy 
otrzymać orbitale molekularne typu a z orbitali ato¬ 
mowych 25 i 2p y poszczególnych atomów postępu¬ 
jemy inaczej. W przypadku cząsteczki heterojądro- 
wej nie potrafimy rozstrzygnąć, które z czterech orbi¬ 
tali (orbitale 25 i 2 p y atomu tlenu oraz orbitale 2s 
i 2p y atomu węgla) będą tworzyły najbardziej efek¬ 
tywną kombinację liniową (z porównania energii 
orbitalnych nie możemy skorzystać, gdyż energie 
tych czterech orbitali są bliskie sobie). Dlatego też 
orbitale molekularne a dla cząsteczki CO zakładamy 
w postaci 

y>i = c a 2sc+c i2 2p y c + c i3 2so+Cu2p !/ o, 

gdzie wskaźniki C i O odnoszą się odpowiednio do 
atomów węgla i tlenu. Z czterech orbitali atomowych 
można utworzyć cztery orbitale molekularne, różniące 
się współczynnikami (oraz energiami orbitalnymi) — 
dwa z nich są orbitalami wiążącymi, a dwa' orbi¬ 
talami anty wiążącymi. 

Trudno jest nam ustalić konfigurację elektronową ustalanie 
cząsteczek heterojądrowych, ponieważ m.in. dla róż- konfiguracji 
nych cząsteczek kolejność orbitali może być różna. 

Zazwyczaj dzieli się po prostu wszystkie orbitale na 
orbitale a i tt, a w obrębie każdej grupy numeruje się 

je kolejno lcr, 2 a . 1 iz 9 2n y ... według wzrastającej 

energii orbitalnej (podobnie postąpiono w przypadku 
cząsteczek homojądrowych, por. rys. 31). Dla 
cząsteczki CO ustalono (korzystając z wyników doś¬ 
wiadczalnych i teoretycznych) następującą konfigu¬ 
rację elektronową CO: lcr 2 2tf s 3er 2 4<7 2 l7r 4 5<7 2 . 

Chcąc uzyskać możliwie najdokładniejsze wyniki 
ilościowe dla cząsteczek, nie należy ograniczać się 
do przybliżania orbitali molekularnych za pomocą 
dwóch tylko orbitali atomowych, jak to uczyniono 
w przypadku cząsteczek homojądrowych. Dla cząs¬ 
teczek dwuatomowych, ze względu na występującą 
w nich symetrię osiową, można obliczyć dokładne 
orbitale HF, które dają najlepszy obraz cząsteczki 
w przybliżeniu jednoelektronowym. Rysunki 31 i 32 
przedstawiają warstwice gęstości elektronowych dla 
kilku dwuatomowych homo- i heterojądrowych 
cząsteczek. Widać tu wyraźnie, jak poszczególne 
orbitale molekularne zmieniają się przy przejściu od 
cząsteczki do cząsteczki. Widać również wyraźnie, 
jak zmieniają się energie poszczególnych orbitali 
molekularnych w serii cząsteczek. 


Wiązanie chemiczne 

Obliczenia gęstości elektronowych w układach dwu¬ 
atomowych są pomocne w zrozumieniu koncepcji 
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cząsteczka, konfiguracja całkowita gęstość 

sianu podstawowego elektronowa 


orbitalna gęstość elektronowa 
część kationowa część anionowa 




LiF 

1 o 2 2 o 2 3 o 2 4 o 2 1 tt 4 


NaF 

1 o 2 2 o 2 3 o 2 4 o 2 5 o 2 6 o 2 - 
17i 4 2 tu 4 


KF 

1o 2 2o 2 3o 2 4o 2 5o 2 6o 2 - 
7 a 2 8 o 2 1 ti 4 2 tt 4 3 u 4 


LiCI 

1 o 2 2 o 2 3 o 2 4 o 2 5 a 2 6 o 2 - 
1^ 4 2x 4 


NaCI 

lO^O^O^C^So^O 2 - 
7 o 2 8 o 2 1 tc 4 2 tt 4 3 Ti 4 


1$ 25 2/3/7 2pcr 35 3/3/7 3 po 



-106,978832 

-2,45539 
(2 o) 



-261,372233 -2,81091 -1,53279 

(3 o) (4 a) 

-40,99253 -1,53560 
{1 o) (1 n) 


1 s 2s 2pn 2 po 3 s 3prj 3p? 



-26,12023 -0,48384 

(la) (1;r) 

-1,38967 -0,50556 

(3 o) {4 o) 



-26,06527 -0,42032 

(2 o ) (2 7 [) 

-1,31697 -0,43015 

(5o) (6 a) 



-698, 664548 


• O 


e o 



-14,50644 -11.,53588 -0,97356 
(3 o) (4 o) (2 tc) 


-133,54887 -11,53652 -0,96494 

(1 o) (1 Ti) -1,76483 <7 o) 

(5 o) 



-467,011591 




-2,58036 
(4 o) 



-26,01738 -0,37249 

(2 o) (3 Jt) 

-1,26973 -0,37767 

(6 o) (8 o) 



-104,70159 -7,89396 -0,94055 -0,36525 

^o) (1 TT) (5 o) (6c] 

-10,42823 -7,89499 -0,34798 

< 2 °) (3 o) (2 tt) 



-621,436935 



-2,86591 -1,58904 

(5 a) (6 a) 

-40,54773 -1,58855 
(2 o) <2 Ti) 


• O 8 



-104,69210 -7,88635 -0,93555 -0,35835 

(1 o) (1 tt) (7 o) (8G) 

-10,42057 -7,88735 -0,34378 

(3 o) (4 o) (3 it) 


KCI 

1 o 2 2 o 2 3 0^4 a 2 5 o 2 6 o 2 7 a 2 - 
8 a 2 9 o 2 10 o 2 1 tc 4 2 tt 4 3 tc 4 4 7 i 4 

-1058,7525 -14,5186 -11,5481 -0,9866 

(3 o) (4 o ) (3 tc) 

-133,5603 -11,5484 -1,7789 -0,9901 

(1 o) (1 tt) (7 o) (8 o) 



• O 8 



-104,6711 -7,8645 -0,9078 

(2 o) (2 n) (9 a) 

-10,3986 -7,8653 

(5 o) (6 o) 


0,3245 
(4 tc) 


-0,3326 
(10 o) 


Rys. 32. Warstwice gęstości elektronowych 6 halogenków metali alkalicznych (wiązania jonowe) otrzymane z obliczeń metodą Hartree’ego-Focka. 
Warstwice gęstości elektronowych dla poszczególnych orbitali uporządkowano ze względu na ich jonowe pochodzenie (zob. rys. 9, podpis) 


cząsteczka atom 

litku sodu sodu 

NaLi Na 




atom 

litu 

Li 




Rys. 33. Warstwice gęstości elektronowych (obliczone z funkcji HF) stabilnej cząsteczki NaLi i atomów tworzących tę cząsteczkę. Obok podano 
warstwice „różnic gęstości elektronowych”, tzn. różnic między gęstością stabilnej cząsteczki i gęstościami niezaburzonych atomów umieszczonych 
względem siebie w odległości odpowiadającej położeniu równowagi cząsteczki. Linie ciągłe oznaczają obszary dodatnich wartości różnic gęstości 
(w wyniku utworzenia cząsteczki z atomów gęstość elektronowa w tym obszarze zwiększyła się), linie przerywane oznaczają obszary ujemnych warto¬ 
ści różnic gęstości (w wyniku utworzenia cząsteczki z atomów gęstość elektronowa w tym obszarze zmniejszyła się). Zob. rys.9, podpis 
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wiązania chemicznego. Możemy bowiem analizować 
wiązanie chemiczne badając różnice w gęstościach 
elektronowych cząsteczki i atomów (rys. 33). W przy¬ 
padku stabilnej cząsteczki gęstość elektronowa w ob¬ 
szarze między jądrami cząsteczki jest większa w po¬ 
równaniu do gęstości elektronowej izolowanych ato¬ 
mów. 

Za pomocą obliczeń możemy obserwować zmiany 
zachodzące w gęstościach elektronowych poszczegól¬ 
nych atomów przy ich wzajemnym zbliżaniu się 
(praktycznie prawie przy ciągłej zmianie odległości 
międzyjądrowej, rys. 35). Szczególnie interesujący jest 
wiązanie przypadek cząsteczki o wiązaniu jonowym LiF 
jonowe (rys. 35B). Rozkład gęstości elektronowej w cząsteczce 
przy dużych odległościach międzyjądrowych odpo¬ 
wiada rozkładowi gęstości elektronowej w izolowa¬ 
nych neutralnych atomach litu i fluoru (rys. 9). 
Rozkład ten ulega gwałtownej zmianie już przy od¬ 
ległości ok. 13,9fl 0 (ok. 0,74 nm); (rys. 35B, punkt B). 
Tworzą się wówczas jony Li + oraz F~, które prawie 
nie zmienione zbliżają się nadal do położenia równo¬ 
wagi przy ok. 2,94 ć7 0 (ok. 0,156 nm). A więc układ 
jonowy Li + F~ tworzy się przy znacznie większej 
odległości międzyjądrowej niż położenie równowagi 
cząsteczki! W układzie He 2 dwa atomy helu odpy¬ 
chają się, w przeciwieństwie do dwóch atomów wo¬ 
doru w układzie H 2 . Gęstość elektronowa w układzie 
He 2 jest wypychana z obszaru międzyjądrowego. 
Takie zachowanie się atomów jest charakterystyczne 
dla atomów gazów szlachetnych posiadających za¬ 
pełnione powłoki elektronowe. 


Pomiary a obliczenia 

Podobnie jak w obliczeniach Hartree’ego-Focka dla 
atomów, tak i dla cząsteczek obliczone energie HF 
stanowią przeszło 99% energii dokładnej cząsteczki 
(np. dla Li 2 : ćhf = —14,8715 j.at.; £do$w = 
= -14,9944 j.at.; dla F 2 :ć H f = -198,7683 j.at., 
£d 0 św = —199,670 j.at.). Znacznie gorsze wyniki uzy¬ 
skuje się przy obliczaniu energii wiązania lub energii 
dysocjacji cząsteczek. Na przykład obliczona metodą 
HF energia dysocjacji cząsteczki 0 2 wynosi 1,43 eV, 
co stanowi zaledwie 27% wartości doświadczalnej 
5,21 eV. Dla cząsteczki F 2 , której doświadczalna ener¬ 
gia wiązania wynosi 1,68 eV, obliczenia metodą HF 
wykazują, że jest ona nietrwała (ujemna energia wią¬ 
zania—1,37 eV!). 

Przyczyną tych rozbieżności jest stosowanie przy¬ 
bliżenia jednoelektronowego, w którym pomija się 
korelację elektronów. Energia korelacji dla F 2 jest 
większa o ok. 3 eV od energii korelacji dla dwóch izo¬ 
lowanych atomów fluoru — wystarcza to, aby otrzy¬ 
mać za pomocą metody HF absurdalny wynik dla 
energii wiązania cząsteczki F 2 . Wspominaliśmy już, że 
energię korelacji można uwzględnić w obliczeniach, 
posługując się metodą oddziaływania konfiguracyjne¬ 
go. Połączenie metody CI z procedurą SCF dało dla 
F 2 energię wiązania 1,67 eV w doskonałej zgodności 
z doświadczeniem. Podobnie dla cząsteczki 0 2 
uwzględnienie oddziaływania konfiguracyjnego daje 
nie tylko dobry wynik dla energii dysocjacji cząsteczki 
(4,72 eV, tj. 91% wartości doświadczalnej), ale prze¬ 
bieg krzywej energii potencjalnej jest również w dobrej 
zgodności z krzywą doświadczalną (rys. 34). 

W wielu przypadkach obliczenia Hartree’ego-Focka 
dają wartości teoretyczne, które są w dobrej zgodności 
z danymi doświadczalnymi. Na przykład przewidywa¬ 
ne położenia równowagi dla halogenków alkalicz¬ 
nych, obliczone momenty dipolowe (charakteryzujące 
niejednorodność rozkładu ładunku elektrycznego w 
cząsteczkach), jak również wartości wielu wielkości 
spektroskopowych są w zasadzie w bardzo dobrej 
zgodności z doświadczeniem (tabela). 

Nie zawszejednak taka zgodność występuje, zwłasz¬ 
cza gdy zmierzone wartości doświadczalne są małe, 
np. gdy moment dipolowy cząsteczki jest mniejszy od 

18 - Encyklopedia fizyki współczesnej 


1 D (1 debaja). Dobrym przykładem ilustrującym wy- moment 
stępujące tu trudności jest przypadek cząsteczki CO. dipolowy 
Wartość doświadczalna momentu dipolowego cza- cząsteczki 



odległość międzyjądrowa R 

Rys. 34. Porównanie doświadczalnej krzywej energii potencjalnej 
dla stanu podstawowego cząsteczki 0 2 z krzywą obliczoną me¬ 
todą H artree’ego-Focka (HF) oraz obliczoną przy uwzględnie¬ 
niu oddziaływania konfiguracyjnego; wg H.F. Scheafer III, 
J. Chem. Phys. 54, 2207 (1971) 


Momenty dipolowe i stałe spektroskopowe halogenków 
alkalicznych otrzymane metodą Hartree’ego-Focka. Wy¬ 
niki porównano z danymi doświadczalnymi (wartości w na¬ 
wiasach) 


Wielkość 

LiCl 

NaF 

NaCl 

KF 

Moment dipo¬ 

7,256 

8,367 

9,138 

8,720 

lowy fi t D 

(7,128) 

(8,206) 

(9,002) 

(8,6) 

(debaj) 



3,18 

3,05 

Energia wiąza¬ 

3,83 

3,05 

nia D t , eV 

(4,84) 

(4,95) 

(4,22) 

(5,09) 

Odległość mię- 

3,825 

(3,819) 

3,628 

4,485 

4,188 

dzyjądrowa 

(3,639) 

(4,460) 

(4.104) 

Re » O 0 , 

Częstość drgań 


558 

378 

449 

podstawo¬ 

672 

wych, COc, 

(641) 

(536) 

(365) 

(426) 

cm -1 




0,2686 

Stała rotacyjna 

0,7042 

0,439 

0,2155 

cm' 1 

Poprawka an- 

(0,7065) 

(0,437) 

(0,2181) 

(0,2799) 


4,39 

2,59 

2,48 

harmoniczna 

4,67 

(Ocx e , cm -1 
Poprawka do 

(4,2) 

(3,83) 

(2,05) 

(2,43) 





poziomów ro¬ 
tacyjnych oc«. 

0,00444 

0,00468 

0,00180 

0,00214 

cm~ ł 

— 

(0,00457) 

(0,00162) 

(0,00233) 

Stała siłowa 




1,51 

wiązania, k e , 

1,55 

1,91 

1,17 

mdyn/nm 

(1,41) 

(1,76) 


(1,31) 


Wg R.L. Matca, J. Chem. Phys. 47, 4595, 5295 (1967); 48, 
335 (1968); 49, 1264(1968). 


steczki jest -0,112 D (znak - oznacza kierunek mo¬ 
mentu dipolowego C~0 + ). Moment dipolowy obli¬ 
czony metodą HF różni się od doświadczalnego mo¬ 
mentu o ok. 0,4 D i ma przeciwny znak (C + 0“), wy¬ 
nosi bowiem 0,274 D. Dopiero uwzględnienie w obli¬ 
czeniach oddziaływania konfiguracyjnego poprawia 
teoretyczny wynik do wartości —0,077 D. 

Porównanie teoretycznych wartości z danymi do¬ 
świadczalnymi wskazuje, że obliczenia HF dla ukła¬ 
dów dwuatomowych mogą niejednokrotnie dawać 
wyniki, które różnią się od danych doświadczalnych 
nie więcej niż o ok. 10-20%* Taka dokładność w wielu 
wypadkach jest wystarczająca dla celów porównaw¬ 
czych. Dlatego też kilka lat temu powstał pomysł zbu- 
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dowania „instrumentu obliczeniowego”, za pomocą 
którego chemik lub fizyk, którzy nie są specjalistami 
z zakresu programowania i nie znają szczegółów me¬ 
tod matematycznych potrzebnych do rozwiązywania 
równań HF, mogliby otrzymywać teoretyczne warto¬ 
ści określonych wielkości fizykochemicznych czą¬ 
steczki. Szczególne znaczenie ma to wówczas, gdy wy¬ 
konanie pomiarów jest bardzo trudne (np. wymagają¬ 
ce budowania specjalnej aparatury) lub nawet niebez¬ 
pieczne (praca ze związkami trującymi). Chemik lub 
fizyk może wówczas zdecydować czy wykonywać po¬ 
miary, czy też oprzeć się na wartościach teoretycznych 
(wprawdzie przybliżonych, ale stosunkowo łatwo osią¬ 
galnych). Kilka lat temu A.C. Wahl i jego współpra¬ 
cownicy z Argonne National Laboratory (USA) zbu¬ 
dowali system obliczeniowy nazwany BISONem. 

Za pomocą tego systemu można obecnie dla dowol¬ 
nego układu dwuafomowego obliczać funkcje falowe 
Hartree’go-Focka, a następnie uzyskiwać informacje 
o gęstościach elektronowych w stanie podstawowym 
oraz w stanach wzbudzonych, obliczać parametry czą¬ 
steczek (np. momenty dipolowe) czy też stałe spektro¬ 
skopowe, jak również analizować krzywe energii po¬ 
tencjalnej. Wyniki końcowe w zależności od życzenia 
mogą być wydrukowane na papierze, przedstawione 
na ekranie kineskopu lub za pomocą filmu (np. 
zmiany w czasie gęstości ładunku elektronowego przy 
tworzeniu cząsteczki). Rys. 9 oraz 31-33 i 35 zostały 
właśnie otrzymane za pomocą systemu BISON. Co 
BI SON ciekawsze, BISON został tak skonstruowany, aby 
fizyk czy chemik mógł porozumieć się z „przyrządem 
obliczeniowym” za pomocą mowy ludzkiej. Muszą oni 
jednak używać pewnych słów kodu zrozumiałego dla 
systemu BISON. Typowa konwersacja pomiędzy che¬ 
mikiem a BISONem może wyglądać następująco : 
Chemik: Chciałbym znać wartość momentu dipolo¬ 
wego najniższego energetycznie stanu duble¬ 
towego n cząsteczki tlenku wapnia (CaO). 
BISON: Przy jakiej odległości międzyjądrowej? 
Chemik: Przy odległości równowagi. 

BISON: Jeżeli należy obliczyć położenie równowagi, 
czas obliczeń będzie wynosił ok. 4 h. Praw¬ 
dopodobny błąd momentu dipolowego bę¬ 
dzie wynosił ok. 20%. Czy mam wykonywać 
obliczenia? 

Jeżeli chemik odpowie „Tak”, system obliczeniowy 
zacznie wykonywać operacje obliczeniowe. 

Dokładność wyników teoretycznych uzyskiwanych 
za pomocą systemu BISON w niektórych wypadkach 
nie jest oczywiście zadowalająca. Dlatego też konty¬ 
nuowane są prace nad modyfikacją tego systemu. 
W przyszłości chemik lub fizyk będzie mógł uzyskiwać 
za pomocą tego systemu (lub podobnego) wyniki teo¬ 
retyczne, które będą bardziej dokładne od dotychcza¬ 
sowych (system zostanie udoskonalony m.in. przez 
uwzględnienie oddziaływania konfiguracyjnego). Nie¬ 
mniej już dzisiaj chemik kwantowy może w wielu wy¬ 
padkach uzyskiwać wyniki teoretyczne, które dostar¬ 
czają cennych wskazówek doświadczalnikom. I to nie 
tylko dla małych układów cząsteczek dwuatomowych, 
ale również dla znacznie większych — dużych ukła¬ 
dów wieloatomowych. 


Małe układy wieloatomowe 


Wspominaliśmy już o tym, że znajdowanie orbitali 
molekularnych HF dla cząsteczek zbudowanych z wię¬ 
cej niż dwóch atomów stwarza duże trudności nume¬ 
ryczne. Praktycznie dla takich układów znajduje się 


orbitale molekularne przybliżone przez liniową kom¬ 
binację funkcji jednoelektronowych (13). Niemniej 
takie orbitale molekularne znajdowane metodą SCF 



Rys. 36. Tworzenie cząsteczki wody z atomu wodoru i cząsteczki 
OH. Warstwice gęstości elektronowej OH, H oraz H 2 0^ obli¬ 
czone zostały metodą HF. Wewnętrzne warstwice dla OH i H 2 0 
odpowiadają gęstości 1,0e/aj, a dla atomu wodoru gęstości 
0,25e/aJ; warstwice zewnętrzne odpowiadają gęstości 4,9'JO - * 
ef a l; wg A.C. Wahl, U. Blukis, J. Chem. Educ. 45, 787 (1968) 


dają np. poprawny opis całkowitego ładunku elek¬ 
tronowego w cząsteczce. Można więc przyjąć, że na 
przykład rys. 36 poprawnie przedstawia rozkład ła¬ 
dunku elektronowego w cząsteczce wody. Dzięki obli¬ 
czeniom teoretycznym możliwe jest szczegółowe 
przeanalizowanie zmian rozkładu ładunku elektrono¬ 
wego cząsteczki; wówczas, gdy znajduje się ona w są¬ 
siedztwie innej cząsteczki (lub atomu), w wyniku od¬ 
działywania między nimi nastąpi reakcja chemiczna 
(rys. 37). 

Metody chemii kwantowej mogą być również z po¬ 
wodzeniem zastosowane do badania reakcji chemicz¬ 
nych za pomocą tzw. powierzchni energii potencjalnej 
układów. Określenie tych powierzchni jest pierwszym 
krokiem przy teoretycznej dyskusji na temat szybkości 
reakcji chemicznych. Ogólne własności powierzchni 
energii potencjalnych można prześledzić na przykła¬ 
dzie liniowej reakcji F-fH 2 —► FH-fH. Rysunek 38 
przedstawia względną energię całkowitą układu trzech 
atomów (fluor oraz dwa atomy wodoru) przy ich róż¬ 
nych wzajemnych odległościach. Energię tę obliczano 
przez odjęcie energii substancji reagujących (tzn. ener¬ 
gii atomu F i energii cząsteczki H 2 ) od energii całko¬ 
witej układu: jeden atom fluoru -f- dwa atomy wodoru. 
Obliczenia dla wspomnianej reakcji wykonano w przy¬ 
bliżeniu jednoelektronowym metodą SCF oraz z 
uwzględnieniem efektów korelacji metodą SCF CI. 
Rysunek 38 przedstawia powierzchnię energii poten¬ 
cjalnej uzyskaną za pomocą tego drugiego, bardziej 
dokładnego, sposobu. Linie stałej energii naniesione 
są jako linie warstwicowe. Powierzchnia energii po¬ 
tencjalnej utworzona jest z dwóch długich wąskich 
dolin przedstawiających trwałe cząsteczki H 2 i HF. 
Obszar odpowiadający substancjom reagującym (stan 
początkowy) oddzielony jest od obszaru odpowiada¬ 
jącego produktom (stan końcowy) obszarem o wyż¬ 
szej energii, w wyniku czego reakcja ma energię akty¬ 
wacji (odpowiada jej bariera reakcji AEb zaznaczona 
na rys. 38). Obliczona wysokość bariery metodą SCF 
CI wynosi 5,8 kcal/mol (metoda SCF bez oddziaływa- 


Rys. 35. Sekwencja warstwie całkowitej gęstości elektronowej w układach H 2 , LiF i He 2 przy różnej odległości międzyjądrowej R. 
A) Wiązanie kowalencyjne: tworzenie cząsteczki wodoru H z . B) wiązanie jonowe: tworzenie cząsteczki fluorku litu LiF. C) odpychanie 
między atomami gazów szlachetnych na przykładzie oddziaływania między atomami helu. Wewnętrzna warstwica dla H 2 odpowiada 
gęstości 0,25e/a^, a wewnętrzne warstwice dla LiF i He 2 odpowiadają gęstości 1,0 ej<Ą. Warstwice zewnętrzne odpowiadają gęstości 
4,9-10Wykresy u dołu ukazują zmiany całkowitej energii cząsteczek wraz ze zmianą R 
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odległość pomiędzy jądrami R 


■ 



^ s ’ Zy rea , k 9 c cł !®{ n,czl } c scharakteryzowane przy pomocy warstwie obrazujących różnice w gęstości elektronowych substratów 
i produktów reakcji; obliczenia przeprowadzone zostały metodą HF 


a) b) 
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nia konfiguracyjnego daje wysokość bariery równą aż 
34,3 kcal/mol), podczas gdy wyznaczona doświadczal¬ 
nie energia aktywacji wynosi ok. 1,7 kcal/mol (ok. 

7 kJ/moI). Przy tak małych wartościach energii akty¬ 
wacji nie można jej porównywać bezpośrednio z wy¬ 
sokością bariery reakcji. Prawdopodobnie doświad¬ 
czalna bariera reakcji ma wysokość rzędu 5 kcal/mol 
(ok. 20 kJ/mol) lub nieco mniej. Wskazuje to na bar¬ 
dzo dobrą zgodność wyników obliczeń metodą SCF 
CI z doświadczeniem w porównaniu z obliczeniami 
SCF nie uwzględniającymi efektów korelacji. Oblicze¬ 
nia SCF CI dają jeszcze jeden bardzo interesujący wy¬ 
nik — wskazują one mianowicie, że reakcja F-F H 2 -> reakcja 
-> FH+H jest reakcją egzotermiczną. Obliczona bo- F+H 2 ->FH+H 
wiem energia końcowa reakcji jest niższa od energii 
początkowej o 20,4 kcal/mol, co stosunkowo dobrze 
zgadza się z odpowiednią wartością doświadczalną 
wynoszącą 31,2 kcal/mol. Warto w tym miejscu pod¬ 
kreślić, że obliczenia SCF bez CI nie przewidują, że 
reakcja jest egzotermiczna — różnica pomiędzy ener¬ 
gią stanu końcowego a energią stanu początkowego 
reakcji została obliczona jako dodatnia (-j- 0,6 kcal/ 

/mol). Uwzględnienie efektów korelacyjnych w obli¬ 
czeniach^ w których porównuje się różnice wielkości, 
ma w wielu przypadkach istotne znaczenie (zwięk¬ 
szenie rozmiarów oddziaływania konfiguracyjnego z 


Rys. 38. Teoretyczny opis reakcji chemicznej: a) Tradycyjna 
dwuwymiarowa powierzchnia energii potencjalnej liniowego 
układu FH 2 wyznaczona na podstawie obliczeń SCF CI. Energia 
podana jest w kcal/mol. Odległość F-H zmienia się od 1,4 a 0 
do8,Oa 0 , a odległość H-H od l,On 0 do 7 ,6a 0 . Linia przerywana 
oznacza ,, drogę” reakcji odpowiadającą najmniejszej energii, 
b) Schematyczne przedstawienie zależności energii reakcji od 
współrzędnej reakcji, czyli od odległości wzdłuż drogi reakcji 
o najmniejszej energii (linia przerywana na rys. a). Zaznaczono 
wysokość bariery AEb (energię aktywacji) oraz energię JE C gz 
charakteryzującą egzotermiczność reakcji 






















































Porównanie wyników obliczeń metodą SCF dla cząsteczki 
NH, z danymi doświadczalnymi 



Wartość 

Wielkość 

obliczona 

metodą 

SCF 

doświad¬ 

czalna 

Długość wiązania N—H, nm 

Kąt między wiązaniami H—N—H, 

0,1000 

0,10116 

stopnie 

107,2 

106,8 

Moment dipolowy /r, D 

1,66 

1,48 

Energia całkowita, j.at. 

-56,2219 

-56,578 

Bariera dla inwersji, kcal/mol 

5,1 

5,8 


Wg A. Rauk, L.C. Allen, E. Clcmenti, J. Chem. Phys. 52, 
(1970). 
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214 konfiguracji do 338 konfiguracji poprawiło zgo¬ 
dność obliczonej energii AE ezz z wartością doświad- 


układów obliczenia są kosztowne, a wyniki uzyskiwa¬ 
ne, jak już wspominaliśmy kilkakrotnie, są mało do¬ 
kładne. Aby uzyskać bowiem dla danego układu jak 
najlepszy obraz orbitalny, tzn. aby wyniki uzyskane 
metodą SCF MO były jak najbardziej zbliżone do wy¬ 
ników metody Hartree^go-Focka, przy szukaniu orbi¬ 
tali molekularnych w postaci (13) musimy używać jak 
najdłuższej bazy Oak największe m w (13)). Z punktu 
widzenia rachunkowego nie jest to jednak proste. 
Przyjęcie dużej liczby funkcji bazy powoduje, że 
dla układu wieloatomowego rośnie liczba całek jedno- 
i dwuelektronowych występujących w równaniach 
SCF (12). Gdy liczba funkcji bazy wynosi w, wów¬ 
czas liczba całek jednoelektronowych równa jest 
/w(m+l)/2, natomiast liczba całek dwuelektrono¬ 
wych wynosi [m(m+l)/4] [/?x(j7t-f*l)/2 + l]. Jak widać 
liczba tych ostatnich całek gwałtownie rośnie wraz ze 
wzrostem liczby funkcji bazy (wprawdzie dla m — 10 



cząsteczka 

amoniaku 


inwersja 


H2+ F 

/mol jest większa o ok. 10% od wartości doświad¬ 
czalnej). 

Obliczenia metodą SCF wykonano dla wielu czą¬ 
steczek kilku- i nawet kilkudziesięcioatomowych. 
Jednakże obliczenia takie dla dużych układów są mało 
dokładne (str. 279). Natomiast dla układów kilku- 
atomowych uzyskiwane wyniki z obliczeń SCF wyka¬ 
zują nieraz bardzo dobrą zgodność z wielkościami 
mierzonymi. Przykładowo w tabeli porównano obli¬ 
czenia SCF z danymi doświadczalnymi dla cząsteczki 
amoniaku. Na uwagę zasługuje fakt, że obliczenia 
SCF dają nie tylko poprawny opis geometrii cząstecz¬ 
ki, ale również poprawnie przewidują wysokość barie¬ 
ry dla inwersji w cząsteczce. Cząsteczka NH 3 bowiem 
ma kształt piramidy, a przejście atomu azotu z jednej 
pozycji do drugiej (inwersja) wymaga pokonania 
bariery potencjału, którą można zarówno zmierzyć, 
jak i obliczyć. Jak widać na przykładzie cząsteczki 
NH 3 , obliczenia SCF z powodzeniem zostały zastoso¬ 
wane do opisu tej bariery (mogą więc one być zastoso¬ 
wane do badan konformacyjnych). 


Metody nieempiryczne 
i empiryczne chemii kwantowej 

Metoda SCF MO, w której orbitale molekularne po¬ 
szukiwane są w postaci (13), może być zastosowana do 
dowolnego układu chemicznego. Jednakże dla dużych 


liczba całek jednoelektronowych wynosi* 55, a całek 
dwuelektronowych 4540, ale dla m — 100 całek jed¬ 
noelektronowych mamy 5050, a dwuelektronowych 
już 12 751250). Obliczanie dużej liczby całek jest bar¬ 
dzo pracochłonne nawet dla szybkiego komputera. 

Czytelnik zdaje sobie oczywiście sprawę, że rozmiar 
użytej bazy zależy od tego, czy zbieżność rozwinięcia 
(13) jest szybka, czy też nie, tzn. czy używając okre¬ 
ślonej bazy (wybrana postać funkcji bazy ora? ich licz¬ 
ba) wyniki uzyskane metodą SCF MO są zbliżone do 
wyników metody HF. Okazuje się, że używając orbi¬ 
tali atomowych jako bazy uzyskujemy stosunkowo 
szybką zbieżność rozwinięcia (13). Pojawia się jednak 
wówczas dodatkowy kłopot. Dla cząsteczek zawiera¬ 
jących więcej niż dwa atomy obliczanie niektórych 
całek występujących w równaniach (12) jest skompli¬ 
kowane. Można uniknąć tego kłopotu używając w roz- 
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zbieżność 

rozwinięcia 



























































































































winięciu (13) nie orbitali atomowych (AO mają wy¬ 
kładniczą zależność od odległości elektronu od jądra 
postaci e“ z ' r / a<> , zob. (14)), ale tzw. funkcji gaussow¬ 
skich postaci e _Gtra . Niestety, unikając kłopotu z obli¬ 
czeniem szeregu wspomnianych całek w (12), traci się 
zbieżność rozwinięcia (13). Innymi słowy, aby zrepro- 
dukować wyniki obliczeń uzyskane dla określonej czą¬ 
steczki metodą SCF przy użyciu AO musimy, używa¬ 
jąc jako bazy funkcji Gaussa, użyć znacznie większego 
rozwinięcia (13). A to z kolei zwiększa liczbę całek 
jedno-, a szczególnie dwuelektronowych. 

Pomimo trudności typu numerycznego, wykonano 
obliczenia za pomocą metody SCF MO dla wielu zło¬ 
żonych układów, np. dla zasad kwasów nukleinowych 
i dla ich pary guanina-cytozyna (układ 136 elektro¬ 
nów), a ostatnio dla 2,4,7-trójnitrofluorenonu zawie¬ 
rającego aż 160 elektronów. E. Clementi i jego współ¬ 
pracownicy, którzy wykonali te obliczenia przyznają, 
że wyniki obliczeń są bardzo przybliżone, a jednocześ¬ 
nie bardzo pracochłonne. Na przykład dla pary gua¬ 
nina-cytozyna należało obliczyć ok. 70 mld całek 
dwuelektronowych. Pomimo tego, że autorzy ci wy¬ 
konywali obliczenia na bardzo szybkim komputerze 
IBM 360/195 (obliczał ok. 10 5 całek na 1 s), obliczenia 
SCF trwały ok. 8 dni. Autorzy wspominają, że wyko¬ 
nywane przez nich 4 lata wcześniej obliczenia na IBM 
7094 dla reakcji NH 3 + HC1 ^NH 4 CI przebiegały 
ok. 400 razy wolniej (a więc gdyby chciano wówczas 
wykonać obliczenia dla pary guanina-cytozyna, mu¬ 
siano by zużyć na to 3200 dni!). W ciągu kilku lat na¬ 
stąpił więc bardzo duży postęp w technice obliczenio¬ 
wej. Ale nie tylko w technice obliczeniowej. Autorzy 
powyższych obliczeń w ciągu kilku lat zmodyfikowali 
i udoskonalili także program obliczeniowy SCF MO. 
Połączenie myśli matematycznej programistów (mate¬ 
matyków, chemików kwantowych) z jednoczesnym 
rozwojem komputerów doprowadziło do takiego 
przyspieszenia obliczeń. 

Obliczenia HF czy też SCF MO, o których wspo¬ 
minaliśmy dotąd, są obliczeniami nieempirycznymi. 
W obliczeniach tego typu nie korzysta się z danych 
doświadczalnych — wychodząc z założeń i postulatów 
mechaniki kwantowej wykonuje się obliczenia aż do 
uzyskania wyników, które można porównać z danymi 
doświadczalnymi. Jedynymi wartościami doświadczal¬ 
nymi stosowanymi w teorii są stale uniwersalne, takie 
jak ładunek i masa elektronu, czy też stała Plancka, 
teorie Teorie takie w chemii kwantowej nazywane są często 
ab initio teoriami ab initio , bowiem w teoriach tych obliczane 
są wszystkie całki występujące od momentu rozpoczę¬ 
cia obliczeń (czyli ab initio). 

Mimo dynamicznego rozwoju w dziedzinie kompu¬ 
terów, wysoki koszt obliczeń ab initio i ich niewystar¬ 
czająca dokładność dla dużych układów chemicznych 
powodują, że nadal w chemii kwantowej używane są 
metody przybliżone, szczególnie metody półempirycz- 
ne. W metodach tych niektóre całki występujące w 
teorii wyznacza się z danych doświadczalnych. Omó¬ 
wiliśmy poprzednio w sposób jakościowy wiązanie 
chemiczne w układach dwuatomowych (str. 267). Za¬ 
miast obliczać wartość całki rezonansowej /? występu¬ 
jącej w wyrażeniu na energię orbitalu wiążącego 
(wzór (20)), możemy tak dobrać jej wartość, aby pew¬ 
ne wyniki, np. energię cząsteczki łub jej potencjał joni¬ 
zacyjny otrzymać zgodne z doświadczeniem. Postępo¬ 
wanie takie umożliwia nieraz wyznaczenie innych 
wielkości teoretycznych, już bez odwoływania się do 
teorie pół- doświadczenia. W taki sposób sformułowana teoria 
empiryczne nosi nazwę teorii półempirycznej, a całki, które trak¬ 
tuje się jako wielkości dobierane, nazywamy para¬ 
metrami teorii. Teorie półempiryczne są często bar¬ 
dziej przydatne od teorii ab initio , szczególnie w od¬ 
niesieniu do dużych cząsteczek. Jednak rozmiar ukła¬ 
dów chemicznych, dla których obliczenia ab initio 
stają się użyteczne, zwiększa się z każdym rokiem. 

W ciągu kilkudziesięcioletniej historii chemii kwan¬ 
towej opracowano tak dużo wersji różnych metod pół- 
empirycznych, że nie sposób je tu wszystkie omówić. 


Wspomnijmy jedynie o najbardziej charakterystycz¬ 
nych metodach. 

Najstarsza metoda półempiryczna chemii kwanto¬ 
wej wyrosła na gruncie badań własności cząsteczek 
organicznych. Elektrony walencyjne atomów wcho¬ 
dzących w skład tych cząsteczek tworzą charakterysty¬ 
czne dwie grupy wiązań — wiązania o oraz wiązania n . 

Te ostatnie wiązania utworzone są przez układ elek¬ 
tronów 7t odpowiedzialny za wiele charakterystycz¬ 
nych własności cząsteczek organicznych. W przybliżę- przybliżenia 
niu ^-elektronowym rozpatruje się jedynie układ elek- ^-elektrono- 
tronów n cząsteczki, tzn. znajduje się funkcję falową we 
i energię dla tych tylko elektronów. Zakłada się, że 
elektrony n poruszają się w pewnym potencjale po¬ 
chodzącym od jąder cząsteczki i układu elektronów o. 

W najprostszym sformułowaniu Zaproponowanym metoda HMO 
przez E. Hiickla (metoda HMO — Hiickel MO) po- — Hiickel MO 
szukuje się orbitali molekularnych dla elektronów n 
cząsteczki w postaci LCAO (jako bazę funkcji w (13) 
wybiera się jedynie orbitale walencyjne atomów odda¬ 
jących elektrony tz do układu). Drastycznym przybli¬ 
żeniem wprowadzonym w metodzie HMO jest pomi¬ 
nięcie oddziaływania między elektronami n w hamil¬ 
tonianie ^-elektronowym — przyjmuje się go w posta¬ 
ci H = JT7/ ef (0, gdzie suma przebiega po wszyst- 

i-1 

kich elektronach tz cząsteczki. Współczynniki c P i roz¬ 
winięcia MO na AO (13) oblicza się metodą Ritza 
(por. wzory (8) oraz (9)). Parametrami empirycznymi 
teori i są całki kulombowskie a P (= H PP — fy p H e1 y p dv ) 

oraz całki rezonansowe fi pą (==H PQ = j(p P H et (p q dv). 

Rozwiązując układ równań typu (9), otrzymujemy 
orbitale molekularne yn oraz odpowiadające im 
energie orbitalne £*. 

Gdy uwzględniamy w hamiltonianie 7r-elektrono- 
wym bezpośrednio oddziaływanie między elektronami 
(tzn. w hamiltoniaanie ^-elektronowym występuje wy¬ 
raz y^e^lnu gdzie suma przebiega po wszystkich 
\<i 

elektronach tz\ orbitale molekularne yt są nadal przy¬ 
bliżone, tak jak w metodzie HMO w postaci LCAO 
(13), ale znajduje się je przez rozwiązanie równań 
SCF. Parametrami empirycznymi metody są w zasa¬ 
dzie całki rezonansowe typu fi PQ , jednak dodatkowo 
wiele całek występujących w elementach macierzowych 
operatora Hartree’go-Focka F w (12) przybliża 
się przez wartości doświadczalne (np. przez potencja¬ 
ły jonizacyjne czy też powinowactwa elektronowe 
poszczególnych stanów walencyjnych atomów) lub 
też przyjmuje się na nie przybliżoną postać (np. wzory 
ekstrapolacyjne na całki dwuelektronowej. Metoda 
półempiryczna SCF LCAO MO jest szczególnie uży¬ 
teczna przy interpretacji elektiouowych widm absorp¬ 
cyjnych cząsteczek organicznych. Okazuje się jednak, 
że w tym celu należy użyć konfiguracyjnego oddziały¬ 
wania (zob. Korelacja elektronów) — konfiguracje 
wzbudzone dla cząsteczki tworzy się z orbitali mole¬ 
kularnych uzyskanych z rozwiązań równań SCF. Taką 
wersję metody półempirycznej nazywa się metodą 
SCF LCAO MO CI, a jej bardzo popularny wariant 
z przybliżeniami wyprowadzonymi przez trzech che¬ 
mików kwantowych nosi nazwę metody Parisera-Par- 
ra-Pop!e’a (lub metody PPP), od nazwisk autorów 
metody. 

Obie wspomniane metody można rozszerzyć na 
elektrony walencyjne cząsteczki (i to oczywiście nie 
tylko dla cząsteczek organicznych, ale dla dowolnego rozszerzona 
układu chemicznego). Rozszerzenie metody HMO teoria Hiickla 

nosi nazwę rozszerzonej teorii Hiickla (EHT — Ex - EHT 

tended Hiickel Theory) — najbardziej popularna wer¬ 
sja tej metody została opracowana przez R. Hoffman¬ 
na w latach 1963-64. W metodzie tej, podobnie jak 
w HMO, hamiltonian układu elektronów walencyj¬ 
nych jest określony w postaci H = Ęh* (i) (tutaj 

suma przebiega po wszystkich elektronach walencyj¬ 
nych układu), a orbitale molekularne (będące kombi- 
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metody AVE 
(CN-DO/2; 

INDO; 
MIN DO/2) 


CNDO/S Cl 


nacją liniową orbitali walencyjnych atomów tworzą¬ 
cych cząsteczkę) znajduje się metodą Ritza. W meto¬ 
dzie EHT sposób oceny całek <x p oraz f$ pq jest inny niż 
w metodzie HMO, pominiemy jednak tutaj szczegóły 
parametryzacji. 

Jeśli w hamiltonianie dla elektronów walencyjnych 
uwzględni się bezpośrednie oddziaływania pomiędzy 
elektronami, to orbitale molekularne znajduje się 
wówczas za pomocą procedury SCF. Niektórzy ba¬ 
dacze wprowadzili niezależnie od siebie różne przybli¬ 
żenia na poszczególne całki występujące w elemen¬ 
tach macierzowych operatora F — przybliżeń tych 
jest dużo, i nie będziemy ich tutaj wymieniać. Naj¬ 
bardziej popularne z tych metod są: metoda CNDO/2 
opracowana przez J.A. Pople’a i G.A. Segala (1966), 
oraz wersja tej metody z dołączonym konfiguracyj¬ 
nym oddziaływaniem — metoda CNDO/S CI (J. Del 
Bene i H.H. Jaflfe, 1968), metoda INDO (J.A. Popie 
i współpracownicy 1967) oraz metoda MINDO/2 
(M.J.S. Dewar i E. Haselbach, 1970). Metody te, 
uwzględniające elektrony walencyjne i oparte na pro¬ 
cedurze SCF, nazywane są często metodami AVE 
(Ali Valence Electrons). 

Półempiryczne teorie miały i mają nadal bardzo 
duże znaczenie dla chemii. Niekorzystną sytuację 
stwarza fakt, że jest tych teorii za dużo. Każda ze 
wspomnianych metod (HMO, SCF MO CI, EHT, 
AVE) ma wiele wariantów różniących się sposobem 
oceny parametrów półempirycznych czy też sposobem 
przybliżeń wprowadzonych do oceny całek. Przyczyną 
takiej sytuacji jest to, że nie można sformułować teorii 
półempirycznej w ten sposób, aby interpretowała ona 
wszystkie fakty doświadczalne. Wartość wyznaczo¬ 
nych parametrów półempirycznych określonej metody 
zależy od tego, do interpretacji jakich własności fizy¬ 
kochemicznych cząsteczki została użyta teoria. Na 
przykład metoda CNDO/2 odnosi duże sukcesy w in¬ 
terpretacji geometrii cząsteczek, natomiast przewidy¬ 
wane widma elektronowe cząsteczek nie pokrywają 
się z doświadczeniem. Poprawną interpretację widm 
elektronowych otrzymuje się wówczas, gdy nie tylko 
dołączy się konfiguracyjne oddziaływanie, ale gdy do¬ 
datkowo w metodzie CNDO/2 zmieni się niektóre 
całki (dokonać więc trzeba zmiany parametryzacji). 
Taka zmieniona metoda CNDO/S CI poprawnie opi¬ 
suje własności spektroskopowe cząsteczek, ale nie jest 
już ona w stanie opisać poprawnie ich geometrii stanu 
podstawowego. Nic więc dziwnego, że chemicy kwan¬ 
towi rozbudowują obliczenia ab initio, aby uwolnić się 
od niepewności spowodowanej wprowadzoną para¬ 
metryzacją. 

Dlatego też należy z dużą ostrożnością podchodzić 
do wyników obliczeń półempirycznych. Niemniej, 
kilkudziesięcioletnia praktyka tych obliczeń wskazuje, 
że metody półempiryczne w wielu przypadkach opisują 
poprawnie korelacje pomiędzy własnościami serii 
podobnych cząsteczek. 


Duże układy 


Przez duże układy będziemy rozumieli tutaj wielo- 
elektronowe układy chemiczne, np. cząsteczkę orga¬ 
niczną lub nieorganiczną, kompleks tych cząsteczek, 
kryształ lub polimer. Ograniczymy nasze rozważania 
w zasadzie jedynie do cząsteczek organicznych (ukła¬ 
dy te były przedmiotem najbardziej intensywnych ba¬ 
dań teoretycznych). Są to na ogół układy płaskie (lub 
też układy, których niektóre części są płaskie), odzna¬ 
czające się dużą stabilnością energetyczną. Zanim 
omówimy niektóre zastosowania chemii kwantowej 
do badania własności tych układów, opiszemy jako¬ 
ściowo strukturę elektronową najprostszych cząste¬ 
czek, rozpoczynając od skrótowego przedstawienia 
pojęcia orbitali zhybrydyzowanych na przykładzie 
cząsteczki etylenu. 


Orbitale zhybrydyzowane 

Cząsteczka etylenu CaH* jest układem płaskim i sy¬ 
metrycznym — odległości między środkami atomów 
węgla i wodoru (długość wiązania C—H) są takie 
same, a kąty H—C—H utworzone między dwiema 
prostymi liniami wyrysowanymi od środka atomu cząsteczka 
węgla do atomu wodoru wzdłuż wiązań (kąty wiązań) etylenu 
są prawie równe 120°. W najprostszym schemacie 
jednoelektronowym (str. 251) wiązania w etylenie 
utworzone są przez elektrony walencyjne atomów 
wchodzących w skład cząsteczki (elektrony 2 s i 2 p 
dwóch atomów węgla i elektrony ls czterech atomów 
wodoru). Omawiając konfiguracje elektronowe ato¬ 
mów (zob. Atomy wieloelektronowe) podaliśmy dla 
węgla konfigurację stanu podstawowego \sP2sP2p 2 . 

Jest to konfiguracja elektronowa stanu podstawowe¬ 
go swobodnego atomu węgla. Gdyby taką konfigura¬ 
cję przyjąć dla węgla w cząsteczce, nie można by było 
wytłumaczyć w prostym schemacie równocenności 
szeregu wiązań cząsteczki. W cząsteczce atom nie jest 
swobodny; jest on otoczony innymi atomami, które 
powodują zmianę rozkładu elektronów walencyjnych 
atomu w porównaniu z atomem swobodnym. Mówi- stan 
my, że atom w cząsteczce znajduje się w określonym walencyjny 
stanie walencyjnym. Przez stan walencyjny atomu bę- atomu 
dziemy rozumieli pewien hipotetyczny rozkład elek¬ 
tronów atomu. Stan walencyjny określonego atomu 
węgla np. w cząsteczce etylenu to taki rozkład elek¬ 
tronów tego atomu, który powstałby w wyniku usu¬ 
nięcia wszystkich pozostałych atomów z cząsteczki 
z ich elektronami do nieskończoności przy niezmie¬ 
nionym ukierunkowaniu wiązań. W stanie walencyj- 



Rys. 40. Kształty orbitali zhybrydyzowanych i niezhybrydyzo- 
wanych atomów węgla i wodoru w cząsteczce etylenu: a) przekrój 
powierzchni granicznej orbitalu zhybrydyzowanego typu sp x ; 
b) przekroje powierzchni granicznych orbitali zhybrydyzowa¬ 
nych sp l atomów węgla i orbitali lr atomów wodoru; c) orbitale 
2p g atomów węgla 
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nym atomu elektrony znajdują się na tzw. zhybrydy- 
zowanych orbitalach, które można przedstawić jako 
liniową kombinację AO swobodnego atomu (każdy 
orbital zhybrydyzowany ma więc częściowo cechy 
różnych orbitali swobodnego atomu). W przypadku 
atomu węgla w cząsteczce etylenu mamy do czynienia 
z hybrydyzacją trygonalną (lub hybrydyzacją typu 
sp 2 ) -- w wyniku mieszania jednego orbitala typu 2s 
i dwóch orbitali typu 2p otrzymujemy trzy równoważ¬ 
ne orbitale (hybrydy) sp 2 : 

hi = C|{9?2«+c 2 £9?tjp 2 .-f-C3^ 2 p 3/ , (i = 1, 2, 3). 

Podczas hybrydyzacji tego typu jeden z orbitali 2 p 
(tutaj 2 p z ) pozostaje niezmieniony. 

Na rys. 40 przedstawiono przekroje powierzchni 
granicznych orbitali sp 2 . Okazuje się, że orbitale sp 2 
są symetryczne względem odbicia w płaszczyźnie czą¬ 
steczki (przy przyjęciu układu współrzędnych jak na 
rys. 40 jest nią płaszczyzna xy). Natomiast orbital 2p z 
jest antysymetryczny względem odbicia w płaszczyź¬ 
nie cząsteczki. 

Korzystając więc z orbitali zhybrydyzowanych moż¬ 
na bardzo łatwo wytłumaczyć tworzenie się wiązań 
w cząsteczce etylenu. Cząsteczka ta ma pięć wiązań 
typu <s. Jedno z tych wiązań, wiązanie C—-C, utwo¬ 
rzone jest przez dwa zhybrydyzowane orbitale sp 2 ato¬ 
mów węgla cząsteczki i opisane jest wiążącym orbita- 
lem molekularnym (analogicznie jak w przypadku 
cząsteczek dwuatomowych orbital molekularny jest 
kombinacją liniową dwóch zhybrydyzowanych orbi¬ 
tali atomowych sp 2 zlokalizowanych na dwóch ato¬ 
mach węgla). Cztery pozostałe wiązania typu a (są to 
wiązania C—H) opisane są orbitalami molekularny¬ 
mi utworzonymi z kombinacji liniowych orbitala ato¬ 
mowego 1 s atomu wodoru i jednego zhybrydyzowa- 
nego orbitala sp 2 atomu węgla. W cząsteczce etyle¬ 
nu— oprócz wspomnianych pięciu wiązań — wystę¬ 
puje dodatkowe wiązanie. Jest ono utworzone wsku¬ 
tek silnego przenikania się orbitali atomowych 2p z 
atomów węgla. To dodatkowe wiązanie opisane jest 
wiążącym orbitalem molekularnym utworzonym przez 
kombinację liniową orbitali atomowych 2 p z (por. rys. 
29) zlokalizowanych na atomach węgla cząsteczki 
(jest to wiązanie typu n). W cząsteczce etylenu wystę¬ 
puje więc wiązanie podwójne pomiędzy atomami węg¬ 
la — jedno wiązanie a i jedno wiązanie n. Własności 
przestrzenne obu wiązań są oczywiście odmienne. 
Oprócz omówionej powyżej hybrydyzacji typu sp x 
bardzo użyteczne w chemii są hybrydyzacje typu sp 3 
oraz typu sp. Nie będziemy jednak ich tu omawiali. 
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Rys. 41. Układ orbitali molekular¬ 
nych cząsteczki etylenu. Strzał¬ 
kami zaznaczono obsadzenie orbi¬ 
tali przez elektrony walencyjne 
(konfiguracja stanu podstawowego) 


Z rozważań energetycznych wynika, że orbitale mo¬ 
lekularne opisujące wiązania a w cząsteczce mają niż¬ 
szą energię aniżeli orbitale molekularne typu n. Każ¬ 
dy z tych orbitali molekularnych w stanie podstawo¬ 
wym cząsteczki jest zajęty przez dwa elektrony o prze¬ 
ciwnie skierowanych spinach (por. rys. 41). Nad orbi¬ 
talami wiążącymi znajdują się orbitale molekularne 
antywiążące, nieobsadzone w stanie podstawowym 
przez elektrony. 

W podobny sposób, w jaki rozpatrywaliśmy tworze¬ 
nie orbitali molekularnych w etylenie, można rozwa¬ 
żać orbitale molekularne cząsteczek bardziej złożo¬ 
nych, jak benzenu, naftalenu itp. Komplikacje wiążą 
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się wyłącznie ze zwiększeniem się liczby elektronów 
walencyjnych. I tak np. w benzenie (30 elektronów 
walencyjnych) mamy sześć atomów węgla o hybrydy¬ 
zacji sp 2 i sześć atomów wodoru. Każdy atom węgla 
tworzy jedno wiązanie ctc-h z atomem wodoru oraz 
dwa wiązania <rc-c z sąsiednimi atomami węgla. 

Mamy więc w benzenie 6 wiązań ctc-h i 6 wiązań 
<7c-c. Każdy z atomów węgla ma po jednym nie- 
zhybrydyzowanym orbitalu atomowym typu 2 p z . 

Z orbitali tych możemy utworzyć więc wiązania 
typu 7i. W jaki sposób? Czy w taki sam sposób jak 
w etylenie? W cząsteczce etylenu dwa orbitale 2 pz 
tworzą wiązanie typu n i wspólnie z wiązaniem erc-c 
w cząsteczce zostaje utworzone wiązanie podwójne. 

Fakt ten zaznaczony jest we wzorze strukturalnym 
etylenu przez podwójną kreskę pomiędzy atomami 

węgla W benzenie powinniśmy w za¬ 

sadzie wyróżnić trzy wiązania — benzen powinien 
mieć trzy wiązania podwójne (struktura a). Struktura 
taka jest jednak sprzeczna z własnościami benzenu. 

Na przykład wszystkie długości wiązań pomiędzy ato¬ 
mami węgla są jednakowe, cząsteczka ma wysoką sy¬ 
metrię/)^. Fakty te związane są z własnościami elek¬ 
tronów opisanych orbitalami atomowymi typu 2 p z . 

Okazuje się, że są one bardzo „ruchliwe”, w przeci¬ 
wieństwie do elektronów tworzących wiązania a nie 
ograniczają swojej obecności do obszaru, gdzie two¬ 
rzą wiązania. Nie można po prostu odróżnić wiązań 
7t (struktura b). Orbitale atomowe 2p z poprzez liniowe 
kombinacje tworzą orbitale molekularne. W czą¬ 
steczce benzenu sześć orbitali atomowych 2 p z tworzy 
sześć liniowo niezależnych orbitali molekularnych: 
trzy z nich są wiążącymi orbitalami, a trzy orbitalami 
antywiążącymi. 

W cząsteczkach organicznych zawierających tlen elektrony 
lub azot, oprócz elektronów a i tz rozróżnia się jeszcze typu n 
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Rys. 42. Układ orbitali molekularnych w cząsteczkach benzenu 
i pirydyny. Strzałkami zaznaczono obsadzenie orbitali moleku¬ 
larnych przez elektrony walencyjne atomów (konfiguracja stanu 
podstawowego) 














































































cząsteczka jeden rodzaj elektronów — elektrony typu n. Własno- 
pirydyny ści tych ostatnich elektronów omówimy na przykła¬ 
dzie cząsteczki pirydyny (rys. 42). Swobodny atom 
azotu w stanie podstawowym ma konfigurację elektro¬ 
nową l&lsfilp 2 — ma więc on pięć elektronów walen¬ 
cyjnych. W pierścieniu pirydynowym orbitale atomo¬ 
we azotu mają, podobnie jak orbitale węgla, hybrydy¬ 
zację sp 2 . Dwa elektrony walencyjne atomu azotu 
opisane hybrydami sp 2 tworzą wiązanie z elek¬ 
tronami sp 2 sąsiednich atomów węgla. Trzeci orbital 
orbita! sp 2 azotu nie tworzy żadnego wiązania, gdyż w jego 
niewiążący sąsiedztwie nie ma innego atomu ani grupy. Orbital 
(orbita! n) ten nazywamy orbitalem niewiążącym (od ang. non - 
bonding) lub po prostu orbitalem n. Na orbitalu tym 
znajduje się para elektronów n mających przeciwnie 
skierowane spiny. Warto podkreślić, że orbital nie¬ 
wiążący opisujący elektrony n jest symetryczny wzglę¬ 
dem odbicia w płaszczyźnie cząsteczki (jest to zrozu¬ 
miałe, gdyż orbital n jest po prostu orbitalem zhybry- 
dyzowanym sp 2 ). Ostatni, piąty elektron walencyjny 
azotu, jest opisany orbitalem 2pz i jest po prostu elek¬ 
tronem 7i. Elektron ten wchodzi w sprzężenie z pię¬ 
cioma elektronami n pochodzącymi od atomów węgla 
cząsteczki. Mamy w ten sposób utworzony, podobnie 
jak w benzenie, układ sześciu elektronów n. I zupełnie 
w ten sam sposób jak w benzenie z sześciu orbitali 
atomowych 2 p z możemy utworzyć sześć niezależnych 
orbitali molekularnych n y z których trzy najniższe 
energetycznie będą obsadzone przez sześć elektronów 
w stanie podstawowym cząsteczki pirydyny. Na uwagę 
zasługują pewne różnice pomiędzy orbitalami mole¬ 
kularnymi benzenu i pirydyny. W benzenie, mającym 
wysoką symetrię, współczynniki rozwinięcia orbitali 
molekularnych na orbitale atomowe 2 p z można łatwo 
wyznaczyć, korzystając z własności symetrii układu. 
Tak więc postać takich przybliżonych orbitali mole¬ 
kularnych benzenu jest wyznaczona przez topologię 
układu. Natomiast dla pirydyny, wykorzystując jedy¬ 
nie własności symetrii cząsteczki nie można wyzna¬ 
czyć postaci orbitali molekularnych. Dalsza różnica 
polega na tym, że w benzenie występują orbitale mole¬ 
kularne Ti zdegenerowane, natomiast w pirydynie nie 
występuje degeneracja orbitali ti. 

Pomiędzy układem wiążących orbitali molekular¬ 
nych ti pirydyny a układem anty wiążących orbitali n* 
znajduje się orbital niewiążący n zajęty w stanie pod¬ 
stawowym cząsteczki przez dwa elektrony. Tak wyso¬ 
kie energetycznie położenie orbitalu n związane jest 
z tym, że nie tworzy on żadnego wiązania. 

Posługując się orbitalami zhybrydyzowanymi moż¬ 
na bardzo łatwo określić, ile elektronów typu er i ti ma 
dana cząsteczka, a tym samym można określić, ile 
orbitali molekularnych typu o i ti można zbudować 
dla niej. Hybrydyzacja orbitali atomowych jest tylko 
procedurą matematyczną i chociaż jest ona bardzo 
użyteczna przy opisie jakościowym wiązań w cząs¬ 
teczce, nie jest wcale konieczna. Zgodnie bowiem 
ze schematem przybliżenia jednoelektronowego, każ¬ 
dy elektron walencyjny cząsteczki opisany jest orbita¬ 
lem molekularnym, który może być przybliżony przez 
LCAO. Jako rozwinięcia MO na LCAO można użyć 
orbitali atomowych walencyjnych atomów tworzących 
cząsteczkę (taką bazę używa się w obliczeniach pół- 
empirycznych), ale baza może być oczywiście większa. 
W tym sformułowaniu orbital molekularny opisujący 
elektron o lub ti jest rozciągnięty po całej cząsteczce, 
i nie charakteryzuje określonego wiązania pomiędzy 
dwoma atomami cząsteczki. 

Niezależnie od rodzaju przybliżenia użytego do 
opisu orbitali molekularnych wszystkie MO cząstecz¬ 
ki organicznej (jeśli jest ona płaska) dzielimy na dwa 
typy — orbitale a (tutaj wchodzą też orbitale n y które 
mają symetrię a) i orbitale ti. Orbitale zajęte przez 
elektrony w konfiguracji podstawowej nazywamy 
orbitalami wiążącymi, natomiast orbitale nie zajęte 
przez elektrony w tej konfiguracji nazywamy orbitala¬ 
mi antywiążącymi. Względne rozmieszczenie energe¬ 
tyczne orbitali molekularnych o y ti oraz n w cząsteczce 


pokazane jest na rys. 43. Obliczenia półempiryczne 
typu EHT lub AVE, jak również obliczenia ab initio 
pokazują, że w złożonych cząsteczkach organicznych 
niektóre orbitale molekularne a znajdują się pomię- 
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Rys. 43. Schematyczny uJc- 
ład orbitali molekularnych 
w cząsteczce organicznej. 
Strzałki oznaczają okreś¬ 
lone przejścia elektronowe 
związane z absorpcją pro¬ 
mieniowania elektroma¬ 
gnetycznego 
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dzy orbitalami ti — w takich układach nie ma więc 
ścisłego podziału obszarów energii orbitalnych na 
obszar energii orbitali a , ti oraz n. W ogólności jednak 
orbitale a mają niższe energie niż orbitale 7t y a te z ko¬ 
lei niższe niż orbitale n. Schemat energetyczny orbi¬ 
tali molekularnych przedstawiony na rys. 43 tłuma¬ 
czy niektóre fakty z elektronowej spektroskopii mo¬ 
lekularnej (-► Spektroskopia molekularna — Widma 
elektronowe cząsteczek). Tak więc promieniowanie 
elektromagnetyczne padające na cząsteczkę powoduje 
różnego typu przejścia elektronowe, mające swoje 
charakterystyczne własności. Zadaniem spektros¬ 
kopii doświadczalnej, jak również teoretycznej jest 
m.in. określenie natury stanów wzbudzonych (tzn. 
rodzaju przejścia: przejście n -> ti * czy n -> ti* itd.) 
cząsteczek organicznych (zob. rys. 15). 


Własności fizykochemiczne cząsteczki 

Korzystając z określonej metody półempirycznej lub 
ab initio można dla danej cząsteczki wyznaczyć jej 
orbitale molekularne, a tym samym można wyznaczyć 
przybliżoną funkcję falową opisującą konfigurację 
stanu podstawowego cząsteczki. Za pomocą tej funk- 


Kąty między wiązaniami w różnych cząsteczkach 


Cząsteczka 

Kąt 

Wartość, stopnic 

doświadczalna 

teoretyczna 

(metoda 

CNDO/2) 

NH, 

H—N—H 

103 

107 

H,0 

H—O—H 

104 

107 

CO, 

O—C—O 

ISO 

180 

NF, 

F—N—F 

104 

103 

CH, 

H—C—H 

120 

120 

NH, 

H—N—H 

107 

107 

BF, 

F—B—F 

120 

120 

H,CO 

H—C—H 

117 

115 

F,CO 

F—C—F 

108 

109 

c,h 4 

H—C—C 

122 

123 


Wg G. Klopman, B. 0’Leary, Topics Curr. Chcm. 15.445 (1970); 
B, Roos, I. Fischer-Hjalmars, Kcmisk Tidskrift, No. 12,10(1970). 


układ orbitali 
molekular¬ 
nych 


przejścia 

rr n* 
n —> n * 


281 


























































cji falowej możemy pokusić się o interpretację wielu Metody pólempiryczne opisujące własności elek- 
wlasności fizykochemicznych cząsteczki. tronów n cząsteczki mogą być użyte do interpretacji 

W zależności od geometrii układu zawierającego geometrii, tj. długości wiązań, nie dla całej cząsteczki, 
elektrony jr, delokalizacja tych ostatnich w cząsteczce ale tylko tych ich części t w których występuje delokali- 



Rys. 44. Długości wiązań w cząstcczco naftalenu i azulenu. Linie niebieskie — wartości doświadczalne, linie czarne — wartości obli¬ 
czone metodą PPP; linia pozioma odpowiada wartości 0,1397 nm (długość wiązania C—C w cząsteczce benzenu). W różnych pomia¬ 
rach otrzymano różne wartości długości wiązań w azulenie (dwie linie niehdeskie); wg I. Fischer-Hjalmars, B. Roos, Kemisk Tidskrift, 
No. 11,28 (1970) 




c) 



Rys. 45. Widma absorpcyjne w zakresie nadfioletu z kilku cąsteczek 
organicznych. Obliczone metodą PPP położenia maksimów pasm absor¬ 
pcyjnych oznaczone są liniami pionowymi (wysokość linii j est propor¬ 
cjonalna do obliczonego natężenia oscylatora / lub do Ig/); związek 
między ekstynkcją molarną e i natężeniem / jest postaci: Ig e = 4— 
—Ig/; a) anilina, fenol i anion fenolu; wg M. Tichy, R. Zahradnfk, 
J. Phys. Chem. 73, 534 (1969); b) forma laktimowa pirydyno-2-aldoksy- 
mu, jego kation i anion oraz forma Iaktamowa związku; wg J.S. Kwiat¬ 
kowski, W. Herzog (Boniewicz), B. Szczodrowska, J. Molec. Struct., 
26,333 (1975); c) 2,6-dwu(bisetyloamino)puryna; wg J.S. Kwiatkow¬ 
ski, Buli. Inst. Phys. Res. Atom. (Bułgaria) 21, 327 (1971) 


zachodzi w różny sposób. Długości wiązań w czą¬ 
steczkach organicznych są więc zależne od tej delokali- 
zacji. Rysunek 44 podaje np. porównanie pomiędzy 
doświadczalnymi i teoretycznymi długościami wiązań 
w naftalenie i azulenie. Z rysunku tego widać również, 
że pomimo tego, iż obie cząsteczki mają po 10 elektro¬ 
nów n, to różnice w topologii cząsteczek mają istotne 
znaczenie dla długości wiązań w cząsteczkach. 


zacja elektronów n. Nie można więc na podstawie 
tych metod obliczyć np. długości wiązań C—H w czą¬ 
steczkach. Można to uczynić natomiast na podstawie 
metod półempirycznych typu AVE. Metody te (a 
szczególnie metoda ĆNDO/2 lub MINDO/2) w wielu 
wypadkach interpretują poprawnie nie tylko war¬ 
tości długości wiązań, ale również i wartości kątów 
w różnego typu cząsteczkach. 
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energia przejścia AE 


Metody półempiryczne interpretują poprawnie tak¬ 
że wartości innych wielkości fizykochemicznych czą¬ 
steczek, jak np. momentów dipolowych, potencjałów 
jonizacyjnych, ciepła tworzenia cząsteczek jak rów¬ 
nież wartości całego szeregu wielkości charakteryzu¬ 
jących widma tak jądrowego, jak i elektronowego re¬ 
zonansu paramagnetycznego. 

Gdy chcemy zinterpretować elektronowe widma ab¬ 
sorpcyjne w zakresie nadfioletu szczególnie użyteczna 
okazuje się metoda PPP. Rysunek 45 podaje krzywe 
absorpcyjne kilku związków organicznych wraz z po¬ 
łożeniami przewidywanych przez teorię położeń pasm 
absorpcyjnych. Teoria nie tylko interpretuje popraw¬ 
nie położenia pasm absorpcyjnych cząsteczek, ale 
również położenia pasm absorpcyjnych ich anionów 
i kationów oraz różnych form tautomerycznych 
cząsteczek. Metoda PPP jest szczególnie użyteczna 
przy interpretacji przesunięć pasm absorpcyjnych w 
serii podobnych cząsteczek (rys. 46). 


Biochemia kwantowa 

Rozpatrywanie podstawowych procesów biologicz¬ 
nych jako procesów zachodzących na poziomie mole¬ 
kularnym lub submolekularnym pociągnęło za sobą 
rozwój teorii tych zjawisk — rozwój biologii moleku¬ 
larnej. W ostatnich kilkunastu latach zaczęto coraz 
częściej stosować metody mechaniki kwantowej do 
zagadnień biologicznych, co spowodowało nawet wy¬ 
dzielenie odrębnego działu nazywanego biologią 
kwantową (lub w węższym znaczeniu biochemią 
kwantową, obejmującą badanie metodami chemii 
kwantowej własności cząsteczek o znaczeniu bioche¬ 
micznym). Ten nowy dział obejmuje badania teore¬ 
tyczne nad własnościami wielu leków (farmakologia 
kwantowa), modelowych białek i składników kwasów 
nukleinowych (biochemia kwantowa kwasów nuklei¬ 
nowych). Badania z dziedziny biochemii kwantowej 
prowadzone są w wielu laboratoriach na całym świe 



badanie 

konformacji 



la 



Ib 


Metody chemii kwantowej stosowane są w wielu 
wypadkach do badania konformacji cząsteczek. Kon¬ 
formację cząsteczki można badać bezpośrednio obli¬ 
czając zmianę energii całkowitej cząsteczki wraz ze 
zmianą geometrii części cząsteczki (np. przy obrocie 
określonej grupy wokół wiązania) lub też w sposób po¬ 
średni przez obliczenie wielu własności cząsteczki dla 
jej różnych konformacji i porównanie tych własności 
z własnościami doświadczalnymi. Na przykład dane 
doświadczalne pokazują, że cząsteczka 3-fonnylopiry- 
dyny występuje w roztworze jako mieszanina dwóch 
form cis (la) i trans (Ib), a mierzony moment dipolo¬ 
wy cząsteczki (ściślej biorąc zmierzony moment dipo¬ 
lowy mieszaniny obu form) wynosi 2,37 D. Momenty 
dipolowe obliczone dla formy (la) i (Ib) wynoszą od¬ 
powiednio 1,13 D i 3,90 D. Przyjmując, że w roztwo¬ 
rze występuje mieszanina obu form w proporcji ok. 
40% formy (la) i ok. 60% formy (Ib), otrzymuje się 
obliczony moment dipolowy dla mieszaniny w zgod¬ 
ności z wartością doświadczalną. Obliczona w ten 
sposób zawartość procentowa obu form w mieszani¬ 
nie jest w bardzo dobrej zgodności z wartością wyzna¬ 
czoną doświadczalnie za pomocą pomiarów jądrowe¬ 
go rezonansu magnetycznego (30% formy la, 70% 
formy Ib). 


cie, a niektóre laboratoria zajmują się wyłącznie tymi 
badaniami. 

Wyniki zastosowań metod chemii kwantowej do badanie 
opisu struktury elektronowej zasad kwasów nukleino- kwasów 
wych, ich licznych pochodnych i oddziaływań między nukleino- 
nimi są dobrą ilustracją szczególnie żywej współpracy wych 
fizyków i chemików teoretyków z biologami. Kwasy 
nukleinowe są odpowiedzialne za przekazywanie in¬ 
formacji genetycznej (-*• Kwasy nukleinowe). Zmiany 
informacji genetycznej są przyczyną powstawania mu¬ 
tacji, które mogą być spowodowane np. niewielką 
zmianą konfiguracji atomów w kwasie dezoksyrybo¬ 
nukleinowym (DNA); są to więc zjawiska, którymi 
rządzą prawa mechaniki kwantowej. Nic więc dziw- 
nego, że próbowano i próbuje się nadal rozwiązać 
problemy teoretyczne związane z budową oraz funk¬ 
cją kwasów nukleinowych. 

W celu zbadania struktury elektronowej podstawo¬ 
wych składników kwasów nukleinowych (cytoz>my, 
uracylu, tyminy, guaniny, adeniny, jak również wielu 
ich pochodnych) użyto wszystkich znanych metod obli¬ 
czeniowych chemii kwantowej (tak półempirycznych 
jak i nieempirycznych). Pozwoliło to wyjaśnić wiele 
problemów związanych z własnościami stanu podsta¬ 
wowego tych cząsteczek. Na przykład, na długo przed 
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moment zmierzeniem momentów dipolowych i potencjałów 
dipolowy jonizacyjnych zasad kwasów nukleinowych wykonano 
cytozyny i obliczenia wartości tych wielkości, a późniejsze po¬ 
gnani ny miary potwierdziły obliczone wartości. Jednak mo¬ 
menty dipolowe cytozyny i guaniny nie zostały dotąd 
zmierzone, a informacje o nich można uzyskać tylko 
z obliczeń. Ma to istotne znaczenie dla zrozumienia 
oddziaływań pomiędzy zasadami w łańcuchu DNA. 

, 'i . 

^ -5.6 *“5,2 “5,8 /' 

~ 6 ’ 2 -6,5 /' 

-7,6 * “6,7 



Rys. 47. Energia oddziaływania (w kcal/mol) między cząsteczką 
cytozyny i cząsteczką wody przy różnych wzajemnych ustawie¬ 
niach. Linie grube oznaczają miejsca najbardziej prawdopo¬ 
dobne (największa energia oddziaływania) na przyłączenie czą¬ 
steczki wody do cytozyny. Linie ciągłe oznaczają ustawienie obu 
cząsteczek w tej samej płaszczyźnie, linie przerywane oznaczają 
ustawienie cząsteczki wody prostopadle do płaszczyzny cyto¬ 
zyny; wg G.N.J. Port, A. Pullman, FEBS Letters 31, 70 (1973) 
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Rys. 48. Komplementarne pary adenina-tymina (A-T) oraz gua- 
nina-cytozyna (G-C) w DNA; podano też pary nieprawidłowe, 
powstające gdy jedna z zasad występuje w rzadkiej formie tau¬ 
tomerycznej (oznaczona gwiazdką) 
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Obliczenia kwantowe dla stanu podstawowego za¬ 
sad DNA pozwoliły wyjaśnić wiele problemów zwią¬ 
zanych z reaktywnością chemiczną tych cząsteczek 
jak również przewidzieć najbardziej prawdopodobne 
miejsca w zasadach na przyłączenie cząsteczki wody 
(rys. 47). 

Obliczenia kwantowe dla zasad kwasów nukleino- tautomeria 
wych są bardzo ważne w związku z obserwowaną w za¬ 
sadach tautomerią. W proponowanej przez Watsona 
i Cricka strukturze DNA zasady połączone w komple¬ 
mentarnych parach występują w ściśle określonych 
formach tautomerycznych (formy aminowe i lakta- 
mowe). Jeśli jedna z zasad wystąpi w rzadkiej formie 
tautomerycznej, następuje wówczas zmiana własności 
kompleksowania i w łańcuchu DNA zostanie wbudo¬ 
wany niewłaściwy nukleotyd (powstaje wówczas błąd 
w tworzeniu pary zasad a w konsekwencji organizm 
syntetyzować może niewłaściwe białka, powodując 
„chorobę” organizmu). Rysunek 48 przedstawia na 
- przykładzie par adenina-tymina oraz guanina-cyto- 
zyna powiązanie zmian w tautomerii ze zmianami 
w tworzeniu komplementarnych par zasad. Prawdo¬ 
podobieństwo występowania określonej zasady DNA 
w rzadkiej formie tautomerycznej jest bardzo małe. 

Zwiększa się ono w istotny sposób pod wpływem dzia¬ 
łania wielu czynników, np. promieniowania elektro¬ 
magnetycznego, czynników jonizujących czy też wsku¬ 
tek działania mutagenów chemicznych na zasady. 

W ostatnim wypadku, w wyniku działania hydroksy¬ 
loaminy lub hydrazyny na cytozynę, powstają między 
innymi pochodne cytozyny, dla których prawdopodo¬ 
bieństwo występowania w rzadkiej formie jest o wiele 
większe niż w wypadku niepodstawionej cytozyny. 

Fakt ten tłumaczy występowanie licznych mutacji pod 
wpływem działania tych związków na DNA. 

Znając własności poszczególnych zasad można za¬ 
jąć się zagadnieniem własności par zasad, znaczeniem 
wiązań wodorowych, za pomocą których połączone 
są pary zasad, zagadnieniem stabilności podwójnego 
heliksu DNA i wreszcie strukturą kwasów nukleino¬ 
wych. Wykonano np. obliczenia oddziaływań pomię¬ 
dzy parami zasad przy zmiennej orientacji zasad. Po¬ 
kazano, że w wypadku pary guanina-cytozyna naj¬ 
bardziej prawdopodobne ustawienie zasad jest takie, 
jakie jest obserwowane w podwójnym heliksie DNA. 

Natomiast dla pary adenina-uracyl oprócz ustawienia 
obserwowanego w spirali DNA możliwe było inne 
ustawienie wzajemne zasad, co znalazło potem po¬ 
twierdzenie w kryształach pochodnych adeniny i ura¬ 
cylu. 

Wiele prac z dziedziny chemii kwantowej zostało wiązania 
poświęconych badaniu własności szczególnego typu wodorowe 
wiązań zwanych wiązaniami wodorowymi, za pomocą 
których połączone są komplementarne pary zasad 
w DNA (rys. 48). Wiązanie wodorowe X—H—Y po¬ 
wstaje wówczas, kiedy atom wodoru H połączony 
jest z silnie elektroujemnym atomem X (np. atomem 
azotu lub tlenu), natomiast atom Y ma tzw. wolną 
parę elektronów (np. wiązania wodorowe N—H—O 
lub N—H—N pomiędzy zasadami DNA na rys. 48). 

Wiązania wodorowe są kilkadziesiąt razy słabsze od 
przeciętnych wiązań chemicznych (np. energia wiąza¬ 
nia wodorowego dla dwóch cząsteczek wody wynosi 
ok. 5 kcal/mol ~ 21 kJ/moI), niemniej są one jednym 
z czynników decydujących o komplementarności za¬ 
sad i mają specyficzny wpływ na trwałość pary. Po¬ 
przez wiązanie wodorowe zachodzi częściowa deloka- 
lizacja elektronów n obu zasad; jest to między innymi 
przyczyną większej stabilności pary w stosunku do 
układu izolowanych dwóch zasad. Oprócz prac pogłę¬ 
biających wiadomości dotyczące oddziaływań między 
poszczególnymi zasadami prowadzone są także ba¬ 
dania większych zespołów zasad, takich jak polinu- 
kleotydy. Jednakże wyciąganie ogólnych wniosków 
dotyczących własności DNA z tego typu badań jest 
jeszcze przedwczesne. 

Zrozumienie roli i funkcji jaką pełnią kwasy nuklei¬ 
nowe w żywym organizmie powoduje nadal ogromne 




zainteresowanie strukturą tych kwasów. Nic więc 
dziwnego, że biologia kwantowa rozwija się bardzo 
intensywnie, i należy spodziewać się, że będzie rozwi¬ 
jała się w najbliższej przyszłości. Być może badania 
kwantowe nad strukturą kwasów nukleinowych i biał¬ 
kami pomogą wyjaśnić procesy starzenia się organiz¬ 
mu, czy też wyjaśnią przyczyny powstawania chorób. 
Może powstanie więc „kwantowa teoria raka”, a może 
powstanie „medycyna kwantowa”, która nie tylko 
znajdzie skuteczne lekarstwo przeciw rakowi, ale rów¬ 
nież przeciw innym chorobom. 

Podany w niniejszym artykule przegląd niektórych 
zastosowań mechaniki kwantowej w chemii z ko¬ 
nieczności jest powierzchowny i niepełny. Zostały 
pominięte tutaj zastosowania teorii kwantowych do 
interpretacji budowy związków kompleksowych. Nie 
omówiono szczegółowo zastosowania metod kwanto¬ 


wych do badania własności kwasów nukleinowych, 
pominięto zastosowanie tych metod do badania bia¬ 
łek i witamin oraz zastosowanie w farmakologii. Nie 
wspomniano zupełnie o teorii reakcjił fotochemicz¬ 
nych itp. zagadnieniach. 

Autor uzna jednak, że artykuł ten spełni swoje za¬ 
danie, jeśli Czytelnik wyrobi sobie nowy pogląd na 
budowę cząsteczek i nowy sposób myślenia o ukła¬ 
dach chemicznych. 

C.A. Coulson Wiązania chemiczne , Warszawa 1963; A. Go¬ 
łębiewski Chemia kwantowa związków nieorganicznych , War¬ 
szawa 1969; A. Gołębiewski Chemia kwantowa związków orga¬ 
nicznych , Warszawa 1973; W. Kolos Kwantowe teorie w chemii 
i biologii t Wrocław 1971; W. Kolos Chemia kwantowa , Warsza¬ 
wa 1978; J. S. Kwiatkowski, B. Pullman, Adv. Heterocycl. 
Chem. 18, 200 (1975); A. Pullman Topics Curr. Chem. 31, 45 
(1972); B. Pullman, A. Pullman Quantum Biochemistry , New 
York 1963; A. J. Sadlej Elementarne metody chemii kwantowej , 
Warszawa 1966. 


SPEKTROSKOPIA 


Oddziaływanie promieniowania elektromagnetyczne¬ 
go lub korpuskulamego z materią we wszystkich jej 
makro- i mikroskopowych formach jest podstawą ca¬ 
łej spektroskopii, niezależnie od tego czyjej przedmio¬ 
tem badań jest struktura izolowanego elementu mikro- 
lub makroukładu, czy też zjawiska i procesy zacho¬ 
dzące w tych układach. Najważniejszą konsekwencją 
takiego oddziaływania jest fakt, że energia jest po¬ 
chłaniana lub wysyłana przez materię w pewnych dy¬ 
skretnych, skończonych porcjach — kwantach energii. 
Badając częstość lub długość fali pochłanianego czy 
wysyłanego promieniowania możemy wyznaczyć wiel¬ 
kość zmian energii w procesie oddziaływania promie¬ 
niowania z materią, a tym samym określić dyskretne 
poziomy energetyczne badanego układu. Każdy układ 
materialny ma charakterystyczne dla siebie poziomy 
energetyczne, co umożliwia podział spektroskopii na 


podstawowe działy: spektroskopię jądrową, której 
przedmiotem badań są poziomy energetyczne i włas¬ 
ności jąder atomowych; spektroskopię atomową, hi¬ 
storycznie najstarszy dział spektroskopii, zajmujący 
się badaniem poziomów energetycznych atomów; 
spektroskopię molekularną, badającą poziomy ener¬ 
getyczne i strukturę cząsteczek oraz oddziaływania 
międzycząsteczkowe; spektroskopię kryształów, któ¬ 
rej przedmiotem badań jest struktura energetyczna 
kryształów oraz czynniki określające i wpływające na 
tę strukturę. 

Spektroskopia wraz z jej zastosowaniami stanowi 
jeden z najbardziej podstawowych działów fizyki, che¬ 
mii i innych dyscyplin pokrewnych. Poniżej omówio¬ 
ne zostaną podstawy i zastosowania wybranych dzia¬ 
łów spektroskopii oraz metody badań spektroskopo¬ 
wych. 


Spektroskopia atomowa 

Tadeusz Skaliński 


Promieniowanie optyczne wysyłane przez pary ato¬ 
mowe wzbudzone do świecenia przez wyładowanie 
elektryczne, przez ogrzanie do wysokiej temperautry 
lub optycznie zawiera w sobie ogromną ilość informa¬ 
cji o atomach, które to promieniowanie wysłały. Aby 
tę informację wyzyskać, winniśmy promieniowanie ro¬ 
złożyć w widmo, tj. przeanalizować, jak przebiega 
w nim zależność natężenia od częstości drgań. W od¬ 
różnieniu od promieniowania o widmie ciągłym, wy¬ 
syłanego przez rozżarzone ciała stałe, promieniowa¬ 
nie par atomowych ma widmo liniowe. 

Badanie tych widm ujawniło liczne prawidłowości, 
których interpretacja pozwoliła na wyciągnięcie da¬ 
leko idących wniosków o strukturze atomu. Ten za¬ 
kres zagadnień jest przedmiotem badań spektroskopii 
atomowej. 


Atom wodoropodobny i jego widmo 

Zagadnienie wyznaczenia energii stanów stacjonar¬ 
nych atomu o jednym elektronie i ładunku jądra Ą-Ze 
atom może być rozwiązane w sposób konsekwentny meto- 
wodoropo- darni relatywistycznej mechaniki kwantowej (równa- 
dobny nie Diraca). Ujęcie nierelatywistyczne, w którym 
w mechanice punktem wyjścia jest równanie Schródingera, prowa- 
kwantowej dzi do wyznaczenia funkcji własnych i wartości włas¬ 


nych operatora energii (-* Chemia kwantowa). Ener¬ 
gia stanów stacjonarnych 


W n « - 


2 K*e*mZ* 
hW ’ 


( 1 ) 


gdzie e, m — oznaczają ładunek i masę elektronu, 
h = 6,626176-10" 34 J.s —stałą Plancka;/i= 1,2,3... 
— główną liczbę kwantową. 

W nierelatywistycznej mechanice kwantowej wpro¬ 
wadza się jeszcze dwie liczby kwantowe: / — orbitalne¬ 
go momentu pędu elektronu hl ()/j = }//(/+1) ss /*, 

h — h/2n) oraz mi — rzutu / na kierunek kwantowa¬ 
nia; rzut ten jest równy hmi (rys. 1). Liczby kwantowe 
/?, /, mi (wszystkie całkowite) spełniają następujące 
warunki: 0 < / ^ n —1 i \mi\ < /. Z wyrażenia na 
W n widać, że w tym ujęciu energia stanu nie zależy od 
/ (mówimy o zwyrodnieniu względem /). Zależność 
energii stanu od orientacji momentu orbitalnego ujaw¬ 
nia się dopiero po przyłożeniu pola zewnętrznego 
(zob. str. 288). 


Rys. 1. Skwantowane ustawienie wektora l względem kierunku 
wyróżnionego; / = 2; = |/6 (promień okręgu). Zaznaczone 

położenia odpowiadają wartościom mi «= 2, 1,0, —1, —2. Kie¬ 
runek składowej prostopadłej do osi kwantowania nie jest okre¬ 
ślony — wszystkie są jednakowo prawdopodobne 
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Rys. 2. Skwantowane ustawienia wektora s względem kierunku 
wyróżnionego; s = V»; s* = V${2 (promień okręgu). Te dwie 
możliwości ustawienia Spinu względem kierunku wyróżnionego 
zostały potwierdzone w doświadczeniu nad odchylaniem atomów 
srebra biegnących w poprzek niejednorodnego pola magnetycz¬ 
nego 

W okresie powstawania mechaniki kwantowej anali¬ 
za struktury widm (głównie metali alkalicznych) do¬ 
prowadziła Uhlenbecka i Goudsmitha do wniosku, że 
każdy elektron jest obdarzony własnym, wewnętrznym 
momentem pędu — spinem. Jest on stały i jego liczba 
kwantowa s = 1 / 2 . Podobnie jak w wypadku momen¬ 
tu orbitalnego spin elektronu wynosi sl r, przy czym 

\s\ = 1/5(5+!) = 5* = Vjj/ 3 . Rzut spinu na oś 
kwantowania jest równy m s h — (rys- 2). Spin 

sumuje się z orbitalnym momentem pędu, tworząc 
całkowity moment pędu elektronu (j es t to specyficz¬ 
ny sposób sumowania, zarazem wektorowy i spełnia¬ 
jący reguły kwantowe). Podkreślić tu należy, że spin 
elektronu nie wynika z rozważań nierelatywi stycznej 
mechaniki kwantowej i w tym schemacie jest wielko¬ 
ścią dołączoną fenomenologicznie. To dołączenie 
znajduje swój wyraz w dodaniu do zespołu liczb kwan¬ 
towych opisujących stan elektronu liczby kwantowej 
m a = ± 1 / 2 oraz w przedstawieniu funkcji stanu elek¬ 
tronu w postaci = y(n, /, Spin elektro¬ 

nu (ogólniej — spin każdej cząstki elementarnej) jest 
wielkością fizyczną charakterystyczną dla świata ato¬ 
mowego i nie ma analogii w fizyce klasycznej. 


Widmo wodoru 

Podstawowa zależność fizyki kwantowej wiążąca róż¬ 
nicę energii stanów układu fizycznego AW z częstością 
wysłanego (lub pochłoniętego) promieniowania ma 
postać: 

AW = kv = hvc y 

przy czym v jest częstością promieniowania, v = 
= vjc — liczbą falową (w cm -1 ). Jeśli wyrażenie 
InWml&c oznaczymy przez R, to energia W n = 
= — RZ 2 hcln 2 . R jest bardzo ważną stałą fizyczną; 
jest to tzw. stała Rydberga, ma ona wartość 109737,31 
cm -1 . Wyrażona w skali liczb falowych różnica energii 
między stanem początkowym i i końcowym/wynosi 
zatem: 



Gdy Z = 1, przy n/ = 1 (stan podstawowy) i m — 
= 2, 3, 4,... (/i może przy przejściu zmieniać się o do¬ 
wolną liczbę jednostek), otrzymamy liczby falowe ko- 
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Rys. 3. Diagram układu poziomów energetycznych atomu wodoru 
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lejnych linii pierwszej serii widmowej wodoru (serii 
Lymana), leżącej w dalekim nadfiolecie (rys. 3). Gdy 
m 00, to v +R; stała Rydberga wyraża więc 
w liczbach falowych energię wiązania elektronu w sta¬ 
nie podstawowym atomu wodoru. Podobnie — przyj¬ 
mując stan o «/ = 2 jako końcowy, otrzymamy dla 
m = 3, 4, 5... kolejne linie serii Balmera (il. 131, 
tabl. 33) itd. 

Atom wieloelektronowy 

Analiza struktury widma atomu wieloelektronowego 
sprowadza się (przez analogię z widmem wodoru) do 
wyznaczenia energii stanów stacjonarnych, obliczenia 
ich funkcji stanu i ustalenia reguł dozwalających na 
przejścia między różnymi stanami. Zagadnienie to 
jest jednak bardzo skomplikowane (zagadnienie wielu 
ciał) i można je rozwiązać jedynie wprowadzając da¬ 
leko posunięte uproszczenia. 

Z zasady Pauliego, wg której elektrony należące 
do atomu (ogólniej — do określonego mikroukładu 
fizycznego) muszą być w różnych stanach kwanto¬ 
wych (tj. stanach opisanych przez nie powtarzające się 
w danym układzie kombinacje liczb kwantowych n , /, 
m t i m ,), oraz z ograniczeń nałożonych na te liczby 
wynika, że gdy elektrony wypełniają powłoki o okreś¬ 
lonym n w powłoce może być 2/x 2 elektronów. Po¬ 
nadto elektrony obsadzają kolejne stany o najniż¬ 
szej energii, a ponieważ energia stanu zależy głównie 
od liczby kwantowej n, będziemy mieli do cenienia 
z kolejnym wypełnianiem powłok od pierwszej (n = 1) 
począwszy. Można wykazać, że wypełnione powłoki 
charakteryzują się szczególną trwałością i słabą ak¬ 
tywnością chemiczną. To samo, acz w mniejszym 
stopniu, odnosi się do wypełnionych podpowłok 
(tj. zbioru stanów o określonych nil). Wypadko¬ 
we momenty pędu (orbitalnego i spinowego) oraz 
związane z nimi momenty magnetyczne w wypełnio¬ 
nych powłokach i podpowłokach zerują się. 

Przybliżenia i założenia upraszczające są następu¬ 
jące: 

a) rozważamy stany wzbudzenia jednoelektrono- 
wego; 

b) oddziaływanie elektrostatyczne elektronu optycz¬ 
nego z pozostałymi elektronami przedstawiamy za po¬ 
mocą obliczonego w sposób uproszczony potencjału; 

c) uwzględniamy oddziaływanie magnetyczne mię¬ 
dzy momentami orbitalnymi i spinami elektronów 
powłoki walencyjnej; 

d) uwzględniamy reguły wyboru ustalające możli¬ 
wości przejścia promienistego między określonymi 
poziomami. 

W spektroskopii atomowej stosuje się następującą 
konwencję: wartości liczby kwantowej orbitalnego 
momentu pędu elektronu / — 0, 1, 2, 3, 4, 5, 6 ... za¬ 
stępuje się umownymi oznaczeniami 5 , p> d,f\ g, h, i ... 
Oznaczenie literowe poprzedza się główną liczbą 
kwantową, np. 3 p oznacza elektron w stanie o« = 3 
i / = 1. Przy opisie konfiguracji powłoki elektronowej 
górny wskaźnik oznacza liczbę elektronów w określo¬ 
nym stanie (np. I 5 2 2 s* 2p oznacza konfigurację, w któ¬ 
rej pierwsza podpowłoka jest wypełniona dwoma 
elektronami, a druga zawiera dwa elektrony 25 i jeden 
elektron 2 p). 

Momenty orbitalne i spiny elektronów powłoki wa¬ 
lencyjnej atomu wieloelektronowego po dodaniu 
dają całkowity moment pędu powłoki elektronowej. 
Jeśli nie ma oddziaływań zewnętrznych, moment ten 
pozostaje niezmienny, przy czym (podobnie jak i mo¬ 
menty poszczególnych elektronów) jest skwantowa- 
ny; jego składowa wzdłuż osi kwantowania wynosi 
hMj y a wielkość całkowitego momentu pędu jest 

równa hJ, gdzie |7| = }//(/+1) s J*. Liczby kwan¬ 
towe Mj i J charakteryzują stan atomu. / jest liczbą 
dodatnią (całkowitą lub połówkową) lub zerem. 
Mj przybiera jedną z 2/+1 wartości—/+1,...» 
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Ze sposobu otrzymania rzutu J na oś kwantowania 
wynika, że gdy liczba elektronów w powłoce walen¬ 
cyjnej jest nieparzysta, Mj jest liczbą połówkową (nie¬ 
parzysta liczba rzutów poszczególnych spinów, z któ¬ 
rych każdy jest równy i 1 /*), gdy jest ona parzysta, 
Mj jest całkowite. Ponieważ zaś J jest równe maksy¬ 
malnej wartości A/>, więc ta sama uwaga dotyczy J. 

Ważną cechą charakterystyczną kwantowania prze¬ 
strzennego całkowitego momentu pędu powłoki elek¬ 
tronowej jest to, że ustalona jest wyłącznie wielkość 
składowej wzdłuż osi kwantowania, orientacja skła¬ 
dowej poprzecznej pozostaje nieoznaczona — wszyst¬ 
kie jej położenia są jednakowo prawdopodobne. Moż¬ 
na ten stan zobrazować modelowo przyjmując, że 

wektor J wykonuje jednostajną precesję dokoła osi 
kwantowania. 

Przy przejściach promienistych jednofotonowych 
reguły wyboru na J i Mj są następujące: AJ — 0, ± 1 
(przejście / = 0 -► / = 0 jest wzbronione), AMj — 
= 0, ±1* Ten symboliczny zapis należy rozumieć na¬ 
stępująco: tylko te przejścia promieniste są w atomie 
dozwolone, w których liczby kwantowe J i Mj sta¬ 
nów początkowego i końcowego spełniają podane 
wyżej warunki. 

W metalach alkalicznych (Li, Na, K, Rb, Cs) oraz w 
jonach o strukturze izoelektronowej z nimi (Be + , Mg + , 
Ca + , Ba + , Sr + , B 8+ , Al 2+ itp.) mamy jeden elektron 
na zewnątrz wypełnionych powłok elektronowych. 
Całkowity orbitalny moment pędu elektronów atomu 
L jest więc równy momentowi orbitalnemu / elektronu 
walencyjnego (l — L t a stany atomu odpowiednio do 
wartości L będą oznaczone literami 5, P, D, F, G y 
ff y /...). 

W układzie, w którym jest określony wypadkowy 
orbitalny moment pędu powłoki elektronowej, obo¬ 
wiązują następujące reguły wyboru dla liczby L: 
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Rys. 4. Schemat poziomów atomu sodu i serie występujące w jego 
widmie. Rozszczepienia stanów 3P t 4 P i 3 D są wielokrotnie po¬ 
większone 


AL = ± 1 (AL = 0 wzbronione!). Sprzężenie wypad¬ 
kowego momentu orbitalnego L ze spinem S daje 

całkowity moment powłoki J. Stosownie do tego bę¬ 
dziemy mieli następujące ciągi termów: nS , nP, nD ... 
Każdy z nich (z wyjątkiem termów nS) rozszczepia się 
na dwa poziomy struktury subtelnej o J = L± 1 j 2 
(nPy 2 i «jP 3 / 2 ; nD Z j ft i nD 5 j 2 itd.). Termy S są pojedyn¬ 
cze o J = 1 U(nS 1 j 2 ). Rysunek 4 ukazuje omówione 
tu układy termów w atomie sodu. Stanem podsta¬ 
wowym jest 3S 1/2 . 


Struktura subtelna poziomów atomu wodoru 

Relatywistyczna mechanika kwantowa Diraca prowa¬ 
dzi do wniosku, że struktura subtelna poziomów wo¬ 
doru wykazuje zwyrodnienie względem L : energia za¬ 
leży jedynie od liczb kwantowych n i J. Wyrażenie na 
energię stanu stacjonarnego W n > wzór (1), zostaje 
uzupełnione w pierwszym przybliżeniu wyrazem po¬ 
prawkowym rzędu wielkości a 2 (a = e 2 jhc x 1/137 — 
jest to tzw. stała struktury subtelnej Sommerfelda) 
i zależnym od n i J. Obliczoną zgodnie z tym wzorem 
strukturę poziomów wodoru o n = 2 i n — 3 oraz 
strukturę pierwszej linii serii Balmera H a ukazuje 
rys. 5. Zgodnie z regułami wyboru linia ta winna mieć 
5 składowych, których metodami spektroskopii trady¬ 
cyjnej nie można rozdzielić (wskutek rozszerzenia linii 
wywołanej efektem Dopplera). Mimo to jednak już 
prace H.G. Kuhna i G.W. Seriesa oraz R.C. Willia- 
msa nad H i D, prowadzone metodami interferome¬ 
trycznymi, wykazały pewne odstępstwa od przewidy¬ 
wań teoretycznych. Badania doświadczalne były sty¬ 
mulowane przez równoczesny rozwój elektrodynamiki 
kwantowej, która analizując efekty związane z fluk- 


3 2 ^ 5/2 



Rys. 5. Struktura linii H t wodoru: a) wg teorii Diraca; b) z uw¬ 
zględnieniem przesunięcia Lamba 


tuacjami w zerowym polu promieniowania, przewi¬ 
dywała dodatkowe przesunięcia wzajemne poziomów 
w stosunku do położeń przewidzianych przez teorię 
Diraca. To przesunięcie nazwano przesunięciem Lam¬ 
ba i Retherforda. Dodatkowa poprawka do wzoru, 
w której występuje zależność od liczby kwantowej 
L, jest rzędu a 3 . Z jej postaci wynika, że największych 
przesunięć można oczekiwać dla stanów S i małych 
wartości liczby kwantowej głównej n. Uwzględnienie 
przesunięcia prowadzi do komplikacji układu pozio¬ 
mów i struktury subtelnej linii H a (rys. 5). W szczegól¬ 
ności teoria przewidywała podwyższenie energii po¬ 
ziomu 2 2 Sij 2 w stosunku do 2 2 P 1/2 o 1057,99±0,16 
MHz. Pierwsze dokładne pomiary przesunięcia Lam¬ 
ba przeprowadzono łącząc metody spektroskopii 
optycznej i mikrofalowej. Ich zasadę w ogromnym 
uproszczeniu przedstawia rys. 6. Zauważymy naj¬ 
pierw, że stan 2*Sij 2 jest stanem metatrwałym, tzn. 
mimo, że jest to stan wzbudzony, reguły wyboru 
zakazują przejścia promienistego do stanu podstawo- 
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wego 1 *S\j 2 (odpowiadałoby to przejściu o AL = 0). 
Czas życia atomów w tym stanie jest bardzo długi 
i energia wzbudzenia (przekraczająca 10 eV) może być 



Rys. 6. Schemat doświadczenia Lamba-Retherforda: S źródło 
atomów wodoru, D układ diafragm wydzielających smukłą 
wiązkę atomów, W urządzenie do przyspieszania elektronów 
i wzbudzania atomów wodoru przez zderzenia, R obszar pomia¬ 
rowy, w którym można wytwarzać zmienne pole elektromagne¬ 
tyczne, Z — elektroda zbiorcza, El — układ elektrometryczny 


doświadczę- stracona jedynie niemal w procesie bezpromienistym 
nie Lamba- (zderzenia). W aparaturze Lamba i Retherforda wiąz- 
Retherforda ka atomów wodoru była wzbudzona przez zderzenia 
z elektronami do stanów o n = 2. Z tej mieszaniny 
atomów w stanach: podstawowym 1 2 5 1/2 i wzbudzo¬ 
nych 2*5!/*, 2 2 P 1/2 , 2 2 P 3/2 atomy w stanach 2 P 
wysyłały w czasie ok. 1 ns foton linii Ly a (pierwszej 
linii serii Lymana) i powracały do stanii podstawowe¬ 
go. W swej dalszej drodze przechodziły przez obszar 
pomiarowy (obszar oddziaływania z polem mikro¬ 
falowym) i dochodziły do układu detekcyjnego, nie 
wywołując żadnych efektów (podobnie jak atomy, 
które nie zostały w ogóle wzbudzone). Inaczej było 
z atomami w stanie metatrwałym 2 2 5 1 / 2 . Gdy docho¬ 
dziły one do detektora, kosztem ich energii wzbudze¬ 
nia wyrzucane były elektrony rejestrowane następnie 
w układzie elektromedycznym. W doświadczeniu 
chodziło o to, by przez przyłożenie w obszarze po¬ 
miarowym oscylującego pola elektromagnetycznego 
o częstości odpowiadającej rozszczepieniu poziomów 
2 z S 1{tr 2 2 Pij2 (ok. 1058 MHz) wymusić przejście do 
stanu promienistego, a z niego, po emisji fotonu, 
otrzymać atom w stanie podstawowym, nie oddziału¬ 
jący już z detektorem. Wymuszenie przejścia ma 
charakter bardzo ostrego rezonansu, co sprawia, 
że badany efekt jest niezmiernie czuły na dostrojenie. 
Można więc wyznaczyć szukane rozszczepienie z do¬ 
kładnością lepszą niż 0,1 MHz. Otrzymany wynik 
1057,77±0,10 MHz doskonale się zgadza z podaną 
wyżej przewidywaną wartością teoretyczną. 

Dzięki rozwojowi różnych technik spektroskopii 
współczesnej (omawianych dalej) stało się możliwe 
rozszerzenie zakresu badań na wyższe stany wzbu¬ 
dzone atomu wodoru i na wielokrotnie zjonizowane 
atomy różnych pierwiastków cięższych, 
widma W układach wieloelektronowych istnieją różne typy 
atomów sprzężeń momentów elektronowych w powłoce wa- 
o kilku lencyjnej atomu. Z nich dwa najprostsze to: 
elektronach ^ s prZ ęż en j e ~LS (Russela-Saundersa). Z tym ty- 
walencyjnych pem sprz ę zen j a mamy do czynienia wówczas, gdy od¬ 
działywania wzajemne między momentami orbital¬ 
nymi poszczególnych elektronów oraz między spinami 
znacznie górują nad oddziaływaniami spin-orbita. 
Wówczas tworzy się wypadkowy moment orbitalny 

sprzężenie powłoki walencyjnej L = / 1 +/ 2 + ••• oraz wypadkowy 
LS spin 5 = s^+s 2 + ... Oba momenty wypadkowe do¬ 
dają się, tworząc w ogólności dla każdego L liczbę 
25+1 możliwych kombinacji prowadzących do róż¬ 
nych wartości J (rozszczepienie multipletowe ter- 

- J mów). Rozszczepienia multipletowe wykazują regu- 

Aj lamości. Za przykład może służyć reguła odległoś- 

_ j _ i ciowa Landćgo: rozszczepienie pary kolejnych po- 

Au- 1 ) ziomówJj: — J•(/—})} (/—2). Reguła 

— 2 - J -2 nia duże znaczenie przy analizie nadsubtelnej 

—— J-3 struktury linii widmowych. 
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Terminu „multiplet” używa się na ogół w dwóch multiplet 
różnych znaczeniach, odnosi się go albo do termu 
energii, albo do układu linii widmowych. Pierwsze 
znaczenie odpowiada sytuacji omawianej w tekście. 

Gdy np. w rtęci, mającej w powłoce walencyjnej dwa 
elektrony, spiny są równoległe (5 = 1), wówczas każ¬ 
dy z termów L (np. P t D ...) rozszczepi się na 25+1 = 

= 3 poziomy o / = L— 1, L , L+ 1 (np. 6 3 jP 0 » 6 3 /\, 

6 3 jP 2 ). Mamy trypletowy układ poziomów. Natomiast 
grupę linii widmowych powstałych z przejść między 
poziomami dwu różnych rozszczepionych na multi¬ 
plety termów (np. nazwiemy multipletem 

widmowym. 

W układach wieloelektronowych sumowanie spi¬ 
nów prowadzi, zależnie od ich orientacji, do różnych 
wartości wypadkowej 5, co oznacza, że w określonym 
atomie może występować kilka układów termów 
o różnej krotności. W układzie dwuelektronowym 
wypadkowa 5 może być równa bądź 0, bądź 1 i ter¬ 
my są odpowiednio pojedyncze (układ singletowy) 
lub potrójne (układ trypletowy). Ważnym warunkiem 
uzupełniającym reguły wyboru dla przejść promieni¬ 
stych jest zakaz interkombinacji AS — 0. Przejściu 
promienistemu nie może towarzyszyć przeoriento¬ 
wanie się spinu. Ta reguła nie jest bezwzględnie zacho¬ 
wana w atomach ciężkich (np. linia 253,7 nm rtęci). 

Jednak przejścia promieniste zachodzące z jej naru¬ 
szeniem są znacznie mniej prawdopodobne niż inne, 
przy których reguła ta jest spełniona. . . 

2) Sprzężenie {/,/}. Oddziaływania spin-orbita sprzężenie 
znacznie górują nad oddziaływaniami wzajemnymi {i. /} 
momentów orbitalnych oraz spinów. W konsekwencji 
dla każdego elektronu oddzielnie tworzą się najpierw 

wypadkowe momenty całkowite l x +$i =j\; U+s 2 = 

= a następnie moment całkowity tworzy się 

przez złożenie A+A+ ... = 7 . Nie możemy teraz 
mówić ani o wypadkowym momencie orbitalnym, ani 
o wypadkowym spinie powłoki walencyjnej. Umowny 
zapis stanu atomu w wypadku sprzężenia {/,/} jest: 

*iWa{ji,A}r. , . 1 1 a * 

W atomach mających więcej mz jeden układ ter¬ 
mów napotykamy stany wzbudzone (stany metatrwa- 
łe), z których promienisty powrót do stanów niżej eta y trwa « e 
położonych (w szczególności do stanu podstawowego) 
nie jest dozwolony ani pośrednio, ani bezpośrednio, 
np. stany 2 Z S X i 2 l S 0 w He lub 6 3 P 0 i 6 3 P Z w rtęci. 

Atomy w takich stanach mają czasy życia od ok. 10" 2 s 
do 1 s. Dezaktywacja ich zachodzi głównie w sposób 
bezpromienisty przy zderzeniach ze ściankami naczy¬ 
nia, w którym gaz jest zamknięty. Jednakże w szcze¬ 
gólnych warunkach można obserwować przejścia pro¬ 
mieniste z tych stanów. Są to tzw. linie wzbronione, 
o bardzo małym w porównaniu z liniami dozwolony¬ 
mi natężeniu. Występują one np. w widmach mgławic 
lub w świeceniu górnych warstw atmosfery (w zorzy 
polarnej). Atomy w stanach metatrwałych odgrywają 
istotną rolę w wyładowaniach elektrycznych w gazach 
rozrzedzonych. Szczególnie w gazach szlachetnych, 
w mieszaninie He i Ne, atomy He w stanach meta¬ 
trwałych stanowią rezerwuar energii przekazywanej 
do stanu 3 s z neonu stanowiącego stan wyjściowy do 
akcji laserowych. 


Rozszczepienie poziomów energetycznych 
atomu w polu magnetycznym 
(zjawisko Zeemana) 

Badania rozszczepienia poziomów atomowych, a co 
za tym idzie — i linii widmowych w polu magnetycz¬ 
nym dostarczają wielu cennych informacji pomocnych 
przy identyfikacji i systematyzacji widm i poziomów 
energetycznych. Doprowadziły one również do stwo¬ 
rzenia nowych metod spektroskopii atomowej. 

Z momentami pędu elektronu (orbitalnym i spineih) 
są związane elementarne momenty magnetyczne 
(-►Teoria magnetyzmu): 










atom 
o jednym 
elektronie 
walencyjnym 
w silnym polu 


eh r - eh - 

1*1 = — -/ i [*s - -^ • 

2mc mc 

Zjawisko Zeemana należy rozpatrywać jako oddziały¬ 
wanie między polem zewnętrznym i tymi elementar¬ 
nymi momentami. Zasadniczym czynnikiem charak¬ 
teryzującym sytuację fizyczną po wprowadzeniu pola 
magnetycznego jest wyznaczenie kierunku kwanto¬ 
wania jednakowego dla wszystkich atomów zbioru. 
Drugim istotnym czynnikiem, który należy wziąć pod 
uwagę przy analizie tego zjawiska jest stosunek wiel¬ 
kości oddziaływania między polem magnetycznym 
i momentami atomowymi do wielkości oddziaływań 
wewnątrzatomowych sprzęgających ze sobą różne 
momenty. 

Ograniczymy się przy tym do rozpatrzenia tylko 
przypadków krańcowych: a) pola silnego — gdy ener¬ 
gia oddziaływania poszczególnych momentów z polem 
jest duża w porównaniu z energią sprzężeń między 
tymi momentami; wówczas to sprzężenia wewnątrz- 
atomowe zostają przełamane i każdy z momentów 
ustawia się niezależnie względem pola; b) pola słabe¬ 
go— gdy energia oddziaływania z polem stanowi 
tylko niewielkie zaburzenie sprzężeń wewnątrzato- 
mowych, które zostają zachowane; skutkiem oddzia¬ 
ływania z polem jest tylko skwantowane ustawianie 
się momentu wypadkowego względem pola. 

Moment magnetyczny powłoki walencyjnej o jed¬ 
nym elektronie wynosi 

fi = jii+fis = - e^ (l+2s)—fi B (lĄ-2s) y 


gdzie fiB = “ 2 ^.'jest magnetonem Bohra (moment ma¬ 
gnetyczny elektronu w stanie p; l = 1). W nieobec¬ 
ności pola kierunki fi różnych atomów są rozłożone 
chaotycznie w przestrzeni. Gdy natomiast wprowadzi¬ 
my silne pole H y sprzężenie LS zostanie przełamane 
i każdy z momentów ustawi się niezależnie w sposób 

skwantowany względem pola H. Rzuty / i 5 będą opi¬ 
sane przez liczby kwantowe mi i m s = i x / 2 . Tak więc 

rzut fi na kierunek H: 

fi H = — PB(mi+2m g ), 


a energia oddziaływania z polem 

W H — — fi-H = fiBH(ł?n-\-2m s ). 

Każdej wartości / odpowiada 2/4-1 wartości mu 
a ponadto dwie wartości m s = ±V 2 , zatem poziom 
ulega rozszczepieniu. Wartości nawiasu otrzymane 
przy sumowaniu różnych mi i m s częściowo się powta¬ 
rzają i otrzymujemy ostatecznie 21 4 - 3 różnych war¬ 
tości liczbowych. Energia całkowita W = fV 0 + 
gdzie W 0 jest energią w nieobecności pola. Liczby 
falowe linii składowych struktury zeemanowskiej 
przejścia między poziomami i i/opisuje wzór: 

v" -(»'*- fv f )/hc = L [( w\ +<)-(<+ rr')i 

Wprowadzając na W H wyrażenia zależne od mi 
i m $y stosując reguły wyboru Ami = Olub ±1 i Am s — 
= 0(!) (zachowanie orientacji spinu w przejściu pro¬ 
mienistym) otrzymujemy: 

v" = v’+ Ami = ±LHAmi ; 

0 4nmc 2 0 

L = 4,68604 m^T" 1 jest tzw. jednostką Lorentza. Ot¬ 
rzymujemy w ten sposób rozszczepienie linii na 3 skła¬ 
dowe odpowiednio do wartości Ami : 

= v^±LH, gdy mi = ±1 (składowe o) 

v i/ = v*/, gdy mi — 0 (składowa n). 


Jest to tzw. tryplet Lorentza — jak to przewidywała 
klasyczna teoria tego zjawiska. Rozsunięcie składo¬ 
wych bocznych jest proporcjonalne do natężenia pola 


magnetycznego. 

Aby zaobserwować zjawisko Zeemana, winniśmy obserwacjo 
umieścić źródło promieniowania między biegunami zjawiska 
silnego elektromagnesu. Stosowane są dwa typy Zeemana 
obserwacji: podłużna — promieniowania rozchodzą¬ 
cego się wzdłuż linii sił pola (do obserwacji służy kanał 

przewiercony w rdzeniu elektromagnesu), i poprzecz- __ 1 _ 

na — prostopadle do linii sił (rys. 7). W każdym z tych _ v o 

kb 




Rys. 7. Dwa sposoby obser¬ 
wacji zjawiska Zeemana (ob¬ 
serwacja podłużna i poprze¬ 
czna) 



spektrometr 


przypadków otrzymuje się inny obraz składowych 
(rys. 8 ). Przy obserwacji podłużnej obserwuje się tylko 
składowe cr. Są one spolaryzowane kołowo, o przeciw¬ 
nych zwrotach (rys. 8 a). Przy obserwacji poprzecznej 
mamy wszystkie trzy składowe: składowa nie prze¬ 
sunięta (tt) jest spolaryzowana liniowo, równolegle 

do kierunku H; składowe o są również spolaryzowane 


1 JL 

b) 

Rys. 8. Rozszcze¬ 
pienie zeemanow- 
skie w silnym polu 
magnetycznym i ro¬ 
dzaje polaryzacji 
linii: a) obserwacja 
podłużna, b) obser¬ 
wacja poprzeczna 


polaryzacja 

składowych 


liniowo, prostopadle do H (rys. 8 b). Tego typu struk¬ 
tura nosi czasem nazwę normalnego zjawiska Zeema¬ 
na. Nazwa ma pochodzenie historyczne — rozszcze¬ 
pienie na trzy składowe wynikało z teorii elektronów 
Lorentza, przeto struktury, które były zgodne z tą 
teorią, nazywano normalnymi, wszystkie inne stano¬ 
wiły zjawisko anomalne. 

Słabe pole zewnętrzne nie narusza sprzężeń we- 
wnątrzatomowych i stanowi w stosunku do nich jedy- 
nie niewielkie zaburzenie. Na przykład przy sprzęże¬ 
niu ~LS całkowity moment powłoki elektronowej / w s fabym 
pozostaje wielkością dobrze określoną, a skutkiem po lu 

oddziaływania z polem jest taka orientacja J względem 


pola H, że rzut J na kierunek pola wynosi Mjh . 
Energia oddziaływania z polem będzie więc (podobnie 
jak poprzednio) proporcjonalna do rzutu Mj całko¬ 
witego momentu pędu na kierunek pola: 


ehH 

W h = ~linć gM J = 


gdzie g jest stałą charakteryzującą dany poziom i wy¬ 
rażającą się w wypadku sprzężenia LS bardzo prosto 
przez liczby kwantowe L, S i J: 

, . /(y4-i)+W4-i)-^a+i) 

* =1+ -27(7+1) 

(w innych rodzajach sprzężeń wyrażenie na g jest 
znacznie bardziej złożone). Stałe g różnych poziomów 
są w ogólności różne, zależne od L, S i /; a więc: 

=v l /+LH(g i M i J -g f M / J ). 

Reguły wyboru na Mj są następujące: AMj = 0 
lub ±1. Przejściu o AMj = 0 odpowiadają składowe 
7 r, a przejściu o AM J = ± 1 — składowe er. Ich wa¬ 
runki obserwacji i stan polaryzacji jest podobny jak 
w silnym polu. 

Struktura zeemanowska stanów o tych samych 
liczbach kwantowych L, 54 /, a więc stanów odpowia¬ 
dających tej samej sekwencji termów (np. 6 3 P : , 7 3 P ly 
S 3 P X itd.), jest identyczna. Różni się natomiast struk¬ 
tura stanów tworzących określony multiplet (np. 6 3 P©, rozszczepie- 
6 ?P l9 6 3 P«), bo różne są wartości J (chociaż L i S są nie dubletu 
takie same). Rozszczepienia dubletu sodu w słabym sodu 
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19 - Encyklopedia fizyki współczesnej 

















polu przedstawia rys. 9. Trzem stanom 3 2 5!/ 2 , 3 2 P 1/2 > 
3 2 P a/2 odpowiadają wartości g' = 2, g" = 2 /s i = 
= 4 / 3 . Charakterystyczną cechą otrzymanej struktury 


Mj 



Rys. 9. Struktura zeenoanowska dubletu rezonansowego sodu 
w słabym polu magnetycznym 

składowe a i n Jest zgrupowanie składowych er na zewnątrz struktury, 
a składowych n — w obszarze bliskim położenia linii 
w polu zerowym, v 0 . Ze wzrostem natężenia pola skła¬ 
dowe a odsuwają się coraz dalej, a wskutek postępu¬ 
jącego przełamywania sprzężenia wewnątrzatomo- 
wego grupują się, tworząc w końcu obraz taki jak 
w silnym polu. Widać wreszcie, że ponieważ w sła¬ 
bym polu o obrazie zeemanowskim decyduje całko¬ 
wity moment pędu powłoki elektronowej, nie ma 
potrzeby rozpatrywania oddzielnie sytuacji, gdy 
w powłoce walencyjnej jest jeden elektron lub gdy jest 
ich kilka. 


Rładsubtelna struktura linii widmowych 

Badanie widm za pomocą urządzeń spektralnych 
o wielkiej zdolności rozdzielczej (interferometry) 
ujawniło, że linie widmowe mają niejednokrotnie 
strukturę bardzo złożoną, rozszczepiają się na kilka, 
a czasem nawet kilkanaście składowych. Strukturze 
tej nadano nazwę nadsubtelnej struktury linii, a jej 
zbadanie nie tylko pozwoliło na odkrycie nowych 
i ważnych efektów związanych z oddziaływaniem 
elektronów powłoki z jądrem atomu, lecz również 
doprowadziło do wyznaczenia podstawowych para¬ 
metrów charakteryzujących jądro, 
szerokość Badanie struktury nadsubtelnej utrudnia fakt, że 
gj n jj linie widmowe mają skończoną szerokość spektral- 
widmow rch n ?’ 00 w y Q ^ a z nałożenia się kilku efektów. Wspom¬ 
nimy tu o dwóch. Szerokość naturalna jest związana 
z nieokreślonością energii AW stanu atomowego, 
zgodnie z zasadą Heisenberga AWr ^ h, gdzie r jest 
czasem życia atomu w tym stanie. Przechodząc do 
częstości, otrzymujemy Av = AW/k ^ (l/2nr) i przy 
typowych czasach życia stanów wzbudzonych (r = 
= 10“ 9 s) Av x 1,5-10 8 Hz. Jedynie stan podstawo¬ 
wy i stany metatrwałe można uważać za spektralnie 
ostre. Szerokość dopplerowska linii wiąże się z tym, 
że promieniowanie jest wysyłane przez zbiór atomów 


o chaotycznie rozłożonych prędkościach ruchu ter¬ 
micznego. Szerokość ta Avd = 8,6* 10" 7 TU* za¬ 
leży więc od częstości przejścia v 0 , od temperatury 
bezwzględnej gazu T i jego masy cząsteczkowej >u. 
Szerokość dopplerowska jest dla przejść optycznych 
co najmniej o rząd wielkości większa od szerokości 
naturalnej, którą możemy wówczas w pierwszym 
przybliżeniu pominąć. Przy badaniach nadsubtelnej 
struktury stosujemy więc źródła promieniowania tak 
zbudowane, -by rozszerzenie dopplerowskie linii zmi¬ 
nimalizować. 

Podobieństwo między strukturą hipermultipletów 
(tak nazwano multiplety nadsubtelnej struktury) 
i multipletów struktury subtelnej nasunęło hipotezę 
(W. Pauli 1924 r.) t że jądro atomowe jest obdarzone 
własnym momentem pędu (spinem jądrowym), z któ¬ 
rym jest związany również moment magnetyczny. Spin 

jądrowy #/jest opisany przez liczbę kwantową / (|/| = 

= VW+T) = n- 

Jądra o nieparzystej liczbie masowej mają w ogól¬ 
ności spin połówkowy (/ = 1 / 2 , 3 / 2 ...). Gdy liczba ma¬ 
sowa jest parzysta, spin jądra jest na ogół równy zeru. 
Wśród jąder trwałych niewiele jest wyjątków od tej 
reguły: £ H(/ = 1), *Li (/ = 1), “N(/ = 1), 40 K (/ = 4). 

Oddziaływanie między spinem jądrowym I i całko¬ 
witym momentem pędu powłoki elektronowej J pro¬ 
wadzi do wytworzenia całkowitego momentu pędu 

atomu F = I+J (podobnie jak sprzężenie momentów 
L i S w J). Z niezwykłej małości rozszczepienia nad- 
subtelnego wnioskujemy, że oddziaływanie między 1 

i J jest bardzo słabe i nie narusza istniejących w po¬ 
włoce elektronowej sprzężeń. Analiza widm nadsub¬ 
telnej struktury ujawniła prawidłowości analogiczne 
do widm struktury subtelnej. Ułatwiło to poważnie 
rozwikłanie tych struktur i wyznaczenie na tej pod¬ 
stawie spinu jądrowego /. Przez wiele lat analiza nad¬ 
subtelnej struktury była jedynym źródłem informacji 
o spinie jądrowym i większość danych dotyczących 
jąder trwałych pochodzi z tych właśnie pomiarów. 

W dotychczasowych rozważaniach traktowano 
jądro jako twór punktowy. Nawet wprowadzenie spi¬ 
nu jądrowego nie wymagało dodatkowych założeń 
o jego skończonych rozmiarach. Jednakże staranne 
wyznaczenie rozszczepień nadsubtelnych wykazało, 
że w wielu wypadkach napotykamy wyraźne odstęp¬ 
stwa od wzmiankowanych poprzednio reguł odległoś¬ 
ciowych. Te odstępstwa powiązano z modyfikacją wy¬ 
rażenia na energię oddziaływania elektrostatycznego 
między jądrem i elektronem walencyjnym, wynikają¬ 
cą ze skończonych rozmiarów jądra i z faktu, że jądro 
(a zatem i rozkład ładunku elektrycznego) nie jest 
kuliste. Jądro jest elipsoidą obrotową (spłaszczoną lub 
wydłużoną; -*• Modele jądrowe). Natężenie pola 
elektrycznego pochodzącego od powłoki elektronowej 
zmienia się w obszarze jądra i występuje dodatkowe 
oddziaływanie, zależne od stanu powłoki elektrono¬ 
wej. Wskutek tego oddziaływania rozszczepienia nad- 
subtelne ulegają modyfikacji. Aby efekty można było 
zaobserwować, musi być spełniony warunek / ^ 1 
i / > 1. Analiza modyfikacji struktury nadsubtelnej 
pozwala na obliczenie elektrycznego momentu kwa¬ 
dra poi owego jądra (wielkości tensorowej będącej 
miarą odstępstwa rozkładu ładunku w jądrze od roz¬ 
kładu kulistego), a stąd na wnioskowanie o kształcie 
jądra. 

Na nadsubtelną strukturę linii widmowych wpływa 
skład izotopowy pierwiastka. Na przykład rtęć w po¬ 
staci naturalnej jest mieszaniną sześciu izotopów. 
Dwa z nich C 9e Hg i 201 Hg) obdarzone są spinem 
jądrowym, pozostałe ( 19 *Hg, 200 Hg, 202 Hg i 204 Hg) 
mają spin jądrowy równy zeru. 

Analiza zaobserwowanej struktury linii wykazała 
istnienie przesunięcia izotopowego, przesunięcia o in¬ 
nym charakterze niż wywołane przez różnice w wiel- 
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kości masy zredukowanej m układu jądro-elektron. 
Powodem przesunięcia izotopowego jest tzw. efekt 
objętościowy. 

•Różne izotopy tego samego pierwiastka mają 
w jądrze różne liczby neutronów. Ze wzrostem liczby 
neutronów wzrasta objętość jądra, a zatem ulega 
zmianie rozkład pola kulombowskiego w jego bez¬ 
pośrednim otoczeniu. Wynikają stąd niewielkie mo¬ 
dyfikacje energii stanów elektronowych, szczególnie 
widoczne wówczas, gdy dodając neutron, przechodzi¬ 
my od wypełnionej powłoki neutronowej w jądrze do 
obsadzania następnej. 

Informacje uzyskane z omówionych efektów nie 
stanowią wszystkich informacji, jakie można uzyskać 
z badań nadsubtelnej struktury linii. Osiągnięto w tej 
dziedzinie taką dokładność pomiarów, że przy inter¬ 
pretacji zaobserwowanego rozszczepienia "zachodzi 
np. konieczność uwzględnienia skończonych rozmia¬ 
rów dipola magnetycznego, jakim jest jądro, a przy 
dyskusji efektu oddziaływania kwadrupolowego trzeba 
wprowadzić poprawkę uwzględniającą to, że skończo¬ 
ne rozmiary ładunku jądra i jego odstępstwo od roz¬ 
kładu kulistego wywołują ze swej strony pewne de¬ 
formacje w powłoce elektronowej, częściowo kom¬ 
pensujące oddziaływanie kwadrupolowe. 

Rozwinięcie metod pompowania optycznego i spek¬ 
troskopii laserowej (zob. niżej) pozwoliło rozszerzyć 
badania nadsubtelnej struktury linii widmowych na 
krótkożyjące (czas życia rzędu 1 min) izotopy róż¬ 
nych pierwiastków dalekie od tzw. ścieżki trwałości 
(-> Jądra atomowe i ich wzbudzenia), zawierające 
znaczny nadmiar lub niedobór neutronów, dostępne 
w bardzo małych ilościach. 

W wielu doświadczeniach, które objęły zbadanie 
izotopów baru {A 125-135), metali alkalicznych: sodu 
(A 21-31), rubidu (A 76-98), cezu (A 118-145) i fransu 
(A 208-213), wreszcie rtęci (A 181-206), stosowano 
bardzo wyspecjalizowane techniki spektroskopii lase¬ 
rowej nieraz połączone np. z metodami pompowania 
optycznego, separacji stanów przez odchylanie wiązek 
atomowych w niejednorodnym polu magnetycznym 
lub zestrajania częstości wzbudzenia optycznego ato¬ 
mu z częstością lasera przez skierowanie wiązki ato¬ 
mowej i światła współliniowo i dobór przesunięcia 
doppłerowskiego przez nadanie atomom odpowied¬ 
niej prędkości. Z badań tych można wnioskować 
o kształcie jąder i o nośnikach momentów jądrowych. 


Metoda pompowania optycznego 


Przy omawianiu nadsubtelnej struktury linii widmo¬ 
wych zwróciliśmy uwagę na ograniczenie możliwości 
badania wąskich struktur spowodowane rozszerze¬ 
niem dopplerowskim linii widmowych. Metodami tra¬ 
dycyjnymi wyznaczamy rozszczepienie poziomów po¬ 
średnio— jako różnicę liczb falowych składowych 
rozszczepionych linii A — va—vb (rys. lOa), co stano¬ 
wi dalsze ograniczenie precyzji pomiarów. Gdy w do¬ 
datku rozszczepiają się oba stany zaangażowane w 
przejściu, wówczas zaobserwowana struktura zależy 
od rozszczepienia obu stanów, a to komplikuje proce¬ 
durę analizy rozszczepienia (rys. lOb). 

Metoda pompowania optycznego, zainicjowana 
i rozwinięta przez A. Kastlera i J. Brossela, jest sposo¬ 
bem przygotowania układu atomowego do pomiarów 
pozwalających m.in. na bezpośrednie mierzenie nie¬ 
wielkich rozszczepień określonego poziomu. Przygo¬ 
towanie to polega na tym, że za pomocą wzbudzenia 
optycznego (promieniowaniem o odpowiednio dobra¬ 
nym składzie spektralnym, kierunku rozchodzenia się 
wiązki i rodzaju jej polaryzacji; rys. 7, 8, 9) możemy 


Rys. 10. Nadsubtelna struktura linii widmowych. Schematy 
przejścia i odpowiadające im struktury: a) jeden stan rozszcze¬ 
piony, b) oba stany rozszczepione 


otrzymać selektywne obsadzenie wybranych po.dpo- 
ziomów badanej struktury. Różni się ono znacznie od 
obsadzenia, które odpowiada stanowi równowagi ter¬ 
modynamicznej. Tak przygotowany układ możemy 
poddać działaniu pól elektromagnetycznych o często¬ 
ści rezonansowej dla przejścia między podpoziomami 
zeemanowskimi lub nadsubtelnymi i obserwować re¬ 
zonans magnetyczny, tj. przejścia wymuszone przez 
pole magnetyczne, albo też przerwać pompowanie 
i obserwować samorzutny powrót układu do stanu 
równowagi termodynamicznej (relaksację układu). 
W obu rodzajach doświadczeń sygnał pomiarowy jest 
niesiony przez promieniowanie świetlne, co ppewma 
bardzo wysoką czułość detekcji. Częstości przejść 
między rozszczepionymi podpoziomami zawierają się 
w obszarze od niewielu kHz (rezonanse jądrowe) do 
kilkunastu GHz (przejścia między podpoziomami 
nadsubtelnej struktury), czyli w zakresie częstości 
radiowych i mikrofalowych. 

W omawianym zakresie częstości szerokość dopple- 
rowska sygnału jest tak mała, że można jej zupełnie 
nie brać pod uwagę. W ten sposób zostaje połączona 
bardzo wielka precyzja wyznaczania częstości w ob¬ 
szarze pól radiowych z ogromną czułością detekcji 
optycznej. 


Pompowanie optyczne par atomowych 
w stanie podstawowym 

Zasadę pompowania optycznego w stanie podstawo¬ 
wym rozpatrzymy na przykładzie sodu. Dla uprosz¬ 
czenia pominiemy na razie obecność spinu jądrowego. 
Komórka szklana K zawierająca parę sodu pod nie- 



Rys. 11. Układ do badania pompowania optycznego w stanie 
podstawowym: K komórka z parami sodu, L lampa spektralna. 
Fi CP filtry wydzielające linię D x i polaryzujące jej światło koło¬ 
wo, FT i FR fotopowielacze elektronowe mierzące sygnał światła 
przepuszczonego lub fluorescencji rezonansowej; H 0 stałe pole 
magnetyczne, H x pole magnetyczne oscylujące 


Mj 


Rys. 12. Schemat prze¬ 
biegu pompowania. Roz¬ 
szczepienie zeemanow- 
skie jest bardzo małe w 
porów naniu z odległością 
poziomów. Skuteczne dla 
pompowania jest przej¬ 
ście 7t . Relaksacje R 
przeciwdziałają pompo¬ 
waniu 

wielkim ciśnieniem (pis a ~ 10" 5 Pa) jest umieszczona 
w polu magnetycznym H 0 (rys. 11). Parę sodu wzbu¬ 
dzamy światłem linii rezonansowej (rys. 12) spo¬ 
laryzowanym kołowo i biegnącym wzdłuż linii sił 
pola. Badamy bądź promieniowanie przepuszczone 
przez komórkę, bądź też promieniowanie fluorescen¬ 
cji rezonansowej obserwowane w kierunku prosto¬ 
padłym do wiązki wzbudzającej. Z obrazu struktury 
zeemanowskiej linii D x sodu widzimy, że wzbudzenie 
promieniowaniem o polaryzacji kołowej <r+ (odpowia- 
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dającej AMj = +1) działa tylko na atomy w stanie 
podstawowym o mj = - 1 / 2 i prowadzi do stanu 
3 z Pj /2 o Mj — + 1 I 2 . Jest to w rozpatrywanych wa¬ 
runkach jedyne przejście dozwolone przez reguły wy¬ 
boru. W ten sposób, chociaż pewna część atomów 
powróci do stanu wyjściowego, pozostałe znajdą się 
w stanie o mj — X U i pozostaną w nim (nie ma z nie¬ 
go absorpcji). Gdy będziemy pompowali światłem 
o dostatecznie dużym natężeniu, po upływie krótkiego 
czasu przeważająca część atomów zostanie przeniesio¬ 
na do stanu o nu = + V 2 . Oczywiście będą wystę¬ 
powały równocześnie procesy relaksacyjne R, dążące 
do przywrócenia stanu równowagi termodynamicznej, 
umiemy jednak zmniejszyć je do tego stopnia, by 
w czasie doświadczenia utrzymać znaczną przewagę 
obsadzenia podpoziomu mj = + 1 / 2 nad obsadzeniem 
mj = — x /*. Zmiany w obsadzeniu podpoziomu dol¬ 
nego są sygnalizowane przez wzrost przezroczystości 
komórki (przepompowanie większości atomów z pod¬ 
poziomu mj = — l U do mj — + 1 / 2 eliminuje ze zbio¬ 
ru te, które mogą pochłaniać padające promieniowa¬ 
nie o użytej polaryzacji). Zmniejszeniu absorpcji 
oczywiście towarzyszy spadek natężenia fluorescencji 
rezonansowej. Oba przebiegi ilustruje rys. 13. Przy¬ 
puśćmy, że wskutek pompowania w ogólnej liczbie N 


szczepieniu podpoziomów zeemanowskich. Wymusza 
ono przejście między podpoziomami o mj = 1 / 2 
i mj = — V 2 , wyrównując ich obsadzenia. Ostrość 
sygnału przy przejściu przez rezonans pozwala na 
bardzo dokładne zmierzenie / 0 , a stąd — rozszczepie¬ 
nia zeemanowskiego. Częściej (ze względów technicz¬ 
nych) stosuje się pewną modyfikację opisanego ukła¬ 
du: częstość generatora pola oscylującego f 0 jest usta¬ 
lona, a przez obszar rezonansu przechodzimy zmie¬ 
niając powoli natężenie rozszczepiającego pola mag¬ 
netycznego (rys. 14). 

W atomie rzeczywistym, którego jądro ma spin 
różny od zera, obraz pompowania nie różni się istotnie 
od opisanego powyżej, jakkolwiek jego przebieg 
i opis ilościowy są bardziej skomplikowane. Obecność 
spinu jądrowego powoduje pojawienie się nadsubtel- 
nej struktury poziomów, ich rozszczepienie zeema- 
nowskie jest więc bardziej złożone; słabość oddziały¬ 
wania nadsubtelnego sprawia przy tym, że już w nie¬ 
wielkich polach (rzędu 10“ 4 T) sprzężenie między / i J 
zostaje naruszone, podpoziomy zeemanowskie prze¬ 
stają być równoodległe i przy ustalonej częstości /♦ 
rezonanse między sąsiednimi podpoziomami zeema- 
nowskimi pojawiają się przy różnych wartościach H. 
Badanie widma rezonansowego (za przykład może 



czas 


Rys. 13. Zmiany natężenia wiązki przechodzącej Ir oraz fluore¬ 
scencji rezonansowej /> w czasie pompowania (0 ^ ^ f t ). Prze¬ 

bieg It znajdujemy stosując niezależną od pompowania słabą 
wiązkę sondującą. Pompowanie przerywamy w chwili / x i dla 
t > fj przebiegi ilustrują relaksację w ciemności 


atomów sodu w cm 3 ustala się taki rozkład, iż na 
poziomie mj = 1 / t znajduje się n + atomów, na pozio¬ 
mie nu — — 1 / 2 znajduje się n~ atomów (w stanie rów¬ 
nowagi w każdym z tych podpoziomów jest N/2 ato¬ 
mów w cm 3 ). Stopniem orientacji (lub polaryzacją) 
zbioru atomów nazywamy wielkość P = ( [n + —rT)}N . 
Zbiór zorientowany ma makroskopowy moment pędu 
o gęstości g = (fi/2)NP (/ = V*) i związany z nimi 
makroskopowy moment magnetyczny o gęstości 
9 # = y(fi/2)NP (tutaj y — współczynnik geomagne¬ 
tyczny). 

W słabym polu magnetycznym H 0 rozszczepienie 
zeemanowskie f 0 sąsiednich (tj. o nu różniącym się 
o 1) podpoziomów wynosi f 0 = gUBHJh. Jeżeli teraz, 
przy ustalonym natężeniu wiązki pompującej, wy¬ 
tworzymy w obszarze komórki oscylujące pole magne¬ 
tyczne H x (prostopadłe do H 0 ) o częstości / przestra- 


h 


Rys. 14. Sygnał rezonansu 
magnetycznego. Częstość ge- 
I neratora pola oscylującego 

__. ^ jest ustalona, a pole roz¬ 
szczepiające jest zmieniane 
stopniowo 

pole magnetyczne H 

janej w obszarze/„, to przy / = / 0 zaobserwujemy rap¬ 
towne zmniejszenie natężenia wiązki przechodzącej 
przez komórkę. Odpowiada to rezonansowi częstości 
pola oscylującego z częstością odpowiadającą roz¬ 




Rys. 15. Widmo rezonansowe cezu. Liczby przy maksimach 
oznaczają zmiany kwantowej liczby magnetycznej (Mf 
Oprócz przejść jednokwantowych (JMf = 1) widoczne są ostre 
maksima przejść wielokwantowych (JMf — 2, 3) 

służyć widmo Cs, rys. 15) przy różnych wielkościach 
pola rozszczepiającego i różnych f 0 jest ważnym źród¬ 
łem informacji o przebiegu rozszczepienia zeema¬ 
nowskiego w polach pośrednich. 

Gdy komórkę wypełnimy substancją, której stałe 
rozszczepienia zeemanowskiego są doskonale znane, 
wyznaczenie częstości rezonansowej f 0 pozwoli wy¬ 
znaczyć natężenie pola magnetycznego, w którym się 
komórka znajduje. Na tej zasadzie zbudowano bar¬ 
dzo precyzyjne magnetometry do mierzenia słabych 
pól (m.in. do badań przestrzeni kosmicznej). 

Pompowanie atomów o różnym od zera spinie ją¬ 
drowym prowadzi za pośrednictwem sprzężenia I J 
do orientacji spinów jądrowych. W ten sposób można 
otrzymać układy zorientowanych jąder promienio¬ 
twórczych i obserwować np. anizotropię rozkładu 
przestrzennego wysyłanego promieniowania jądro¬ 
wego /? lub y. Niepromieniotwórcze jądra mogą być 
użyte jako zorientowane (spolaryzowane) tarcze lub 
źródła zorientowanych wiązek w badaniach rozpra¬ 
szania. 
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Procesy relaksacji 

Wspomnieliśmy o tym, że wytworzeniu różnicy obsa¬ 
dzeń towarzyszy występowanie procesów relaksacyj¬ 
nych, dążących do sprowadzenia układu do stanu 
równowagi termodynamicznej. Przy stałym pompo¬ 
waniu, procesy relaksacyjne prowadzą do ustalenia 
się stanu stacjonarnego, w którym uzyskany stopień 
orientacji zależy od szybkości obu procesów. Gdy 
pompowanie zostaje wyłączone, relaksacja sprowadza 
układ do stanu równowagi termodynamicznej (rys. 13, 
przebiegi krzywych przy t >/i). Z czasowego przebiegu 
zaniku orientacji (mamy do czynienia zazwyczaj z za¬ 
nikiem wykładniczym lub kombinacją zaników wy¬ 
kładniczych o różnych stałych czasu) możemy wnio¬ 
skować o naturze procesów relaksacyjnych. Są one 
związane ze zderzeniami, jednak zależnie od sytuacji 
oddziaływa- fizycznej — natura mechanizmów dezorientujących 
nia prowa- może być różna. Przy pompowaniu par metali alka- 
dzące do licznych potężnym czynnikiem relaksacyjnym są zde- 
relaksacji rżenia atomów zorientowanych ze ściankami szkla¬ 
nymi lub kwarcowymi komórki. Zderzeniu ze ścianką 
towarzyszą oddziaływania chemiczne wiążące na niej 
atom metalu. W ten sposób orientacja wywołana przez 
pompowanie zostaje całkowicie utracona. Aby zredu¬ 
kować wpływ ścianek, napełnia się komórki rezonan¬ 
sowe gazem buforującym (jest to najczęściej gaz szla¬ 
chetny pod ciśnieniem od dużego ułamka hPa do kil¬ 
kuset hPa) albo też pokrywa się ścianki komórki cien¬ 
ką warstwą nieaktywnej chemicznie substancji (cięż¬ 
kie parafiny lub silany). W pierwszym wypadku droga 
swobodna zorientowanych atomów ulega znacznemu 
skróceniu i atomy wolniej dyfundują ku ściankom, 
w drugim — zderzenie ze ściankami wywiera tak słabe 
działanie relaksacyjne, że można uzyskać wysoki sto¬ 
pień orientacji. Dzięki pokryciu ścianek warstwą 
ochronną lub użyciu gazu buforującego dezorientacja 
następuje dopiero po wielu zderzeniach, 
natura pro- Oddziaływania międzyatomowe prowadzące do re- 
cesów laksacji są więc różnorodne. Na podstawie analizy 
relaksacji procesów relaksacji stworzono liczne modele opisu¬ 
jące mechanizmy zderzeń. Badanie przebiegów re¬ 
laksacji przyczyniło się do głębszego poznania tak 
podstawowego zjawiska fizycznego, jakim jest zde¬ 
rzenie. Odkryto m.in. tworzenie się chwilowych czą¬ 
steczek w zderzeniach potrójnych oraz zerwanie w 
czasie trwania zderzenia wewnątrzatomowego sprzę¬ 
żenia IJ (niezmiernie słabego w porównaniu z potęż¬ 
nymi siłami występującymi w zderzeniu); sprzężenie 
zostaje przywrócone po zakończeniu zderzenia (z inną, 
przypadkową wartością F ) i dalsza ewolucja stanu 
atomu następuje przy jego zachowaniu — aż do na¬ 
stępnego zderzenia. 

Oprócz analizy procesów zderzeniowych badanie 
relaksacji w obecności gazu buforującego pozwala na 
dokładne wyznaczenie współczynnika dyfuzji atomów 
zorientowanych w gazie, badanie zaś relaksacji na 
ściankach komórki pokrytych warstwą ochronną do¬ 
starcza wielu informacji o procesie adsorpcji na takiej 
warstwie. 

Relaksacje bada się obserwując przebiegi zmian na¬ 
tężenia światła wiązki sondującej w różnych proce¬ 
sach nieustalonych (zanik orientacji po przerwaniu 
pompowania lub czasowy przebieg narastania orien¬ 
tacji przy pompowaniu niezmiernie słabą wiązką). 
Skład spektralny i rodzaj polaryzacji wiązki sondują¬ 
cej jest taki sam jak wiązki pompującej, jednak jej na¬ 
tężenie winno być możliwie małe, by uniknąć efektów 
pompowania przez nią. Stałe czasowe relaksacji T 
zależą oczywiście od warunków fizycznych. W typo¬ 
wych warunkach doświadczalnych T przybiera war¬ 
tości od kilku setnych do kilku dziesiątych sekundy. 

Gaz buforujący może wnosić pewne dodatkowe za¬ 
burzenie. Gdy jego ciśnienie jest wystarczająco duże, 
by czas między kolejnymi zderzeniami był mniejszy 
od czasu życia atomów w stanie wzbudzonym, wów¬ 
czas zderzenia wywołują wyrównanie obsadzeń pod- 
poziomów zeemanowskich w tym samym stanie i wszy¬ 


stkie podpoziomy stanu podstawowego zostają wsku¬ 
tek reemisji równomiernie zapełnione. Do wytwo¬ 
rzenia różnicy obsadzeń w stanie podstawowym moż¬ 
na wtedy doprowadzić przez intensywne pompowa¬ 
nie, które wydajnie opróżnia jeden z podpoziomów. 


Pompowanie optyczne par atomowych 
w stanie wzbudzonym. Podwójny rezonans 

Selektywne obsadzenie wybranych podpoziomów zee¬ 
manowskich stanu wzbudzonego można uzyskać przez 
odpowiednią polaryzację światła wzbudzającego. Ry¬ 
sunek 16 przedstawia w znacznym uproszczeniu układ 
doświadczenia Brossela nad pompowaniem rtęci w 
stanic rezonansowym, a rys. 17 — schemat pozio- 



Rys. 16. Uproszczony schemat doświadczenia nad podwójnym 
rezonansem: K komórka z parą rtęci, H 0 stałe pole magnetyczne, 
H x oscylujące pole magnetyczne, FP1 i FP2 fotopowielacze, 
W wzmacniacz różnicowy 
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Rys. 17. Schemat poziomów rtęci zaangażowanych przy podwój¬ 
nym rezonansie (wzbudzenie i reemisja): a) w nieobecności re¬ 
zonansowego pola oscylującego, b) w wypadku rezonansu (RF 
częstość radiowa) 


mów jednego z jej parzystych izotopów. Komórka 
kwarcowa wypełniona rtęcią umieszczona jest w sta¬ 
łym polu magnetycznym H 0 . Wzbudzenie linią rezo¬ 
nansową o polaryzacji 7r następuje prostopadle do kie¬ 
runku pola. Wzbudzona fluorescencja rezonansowa 
jest wykrywana w dwu kierunkach obserwacji. Wzdłuż 
pola H 0 wydzielamy składowe o polaryzacji <r, pro¬ 
stopadle do niego składową n. W nieobecności zabu¬ 
rzeń (pola rezonansowego częstości radiowej, zderzeń) 
z obsadzonego przez wzbudzenie podpoziomu Mj = 0 
następuje bezpośredni powrót do stanu podstawo¬ 
wego — wysłane promieniowanie ma polaryzację n 
(równoległą do H 0 ) i tylko fotodetektor FP2 może je 
wykryć. Zgodnie z prawami przestrzennego rozkładu 
promieniowania n emisja wzdłuż pola H 0 nie zachodzi 
(rys. 17a). Jeśli jednak atomy w komórce zostaną pod¬ 
dane działaniu pola oscylującego o częstości re¬ 
zonansowej dla przejścia między podpoziomami 
Mj = 0-*Mj = ±1, wówczas w emisji pojawią się 
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podwójny składowe a struktury zeemanowskiej (rys. 17b), co 
rezonans zostanie zarejestrowane przez fotodetektor FPL Gdy 
ustalimy częstość pola radiowego i będziemy powoli 
przestrajać H 0 przez obszar rezonansu, to ze wzmac¬ 
niacza różnicowego otrzymamy sygnał odpowiada¬ 
jący rezonansowi magnetycznemu. Kształt krzywej 
rezonansu magnetycznego (amplitudę w funkcji H 0 ) 
możemy przewidzieć teoretycznie analizując procesy, 
od których jest on zależny, a więc: wzbudzenie atomu 
rtęci ze stanu podstawowego 6 l S 0 do stanu rezonan¬ 
sowego 6 Z P U oddziaływanie w stanie wzbudzonym 
z polem radiowym wymuszającym przejście Mj — 0 
do Mj = ±1, emisję samorzutną po średnim czasie 
r i powrót atomu do stanu podstawowego. Funkcja 
zatem opisująca kształt linii rezonansowej będzie za¬ 
wierała: zależność od odstrojeniactf—o> 0 częstości pola 
radiowego od częstości rezonansowej co 0i zależność 
od amplitudy tegoż pola i zależność od czasu życia 
r stanu wzbudzonego. Kształt otrzymanych krzywych 
znakomicie się zgadza z przewidywanym teoretycznie 
(rys. 18). Prosty rachunek pozwolił powiązać szero¬ 
kość połówkową krzywej rezonansowej Acq IJ2 w gra¬ 
nicznym wypadku dążących do zera amplitud H x 



natężenie pola magnetycznego, jedn. dowolne 
a) b) c) 


Rys. 18. Krzywe rezonansowe otrzymane w doświadczeniu 
Brossela. Punkty — wyniki pomiarów, linie ciągłe — krzywe 
teoretyczne (jeden punkt rodziny krzywych dopasowano do wy¬ 
niku doświadczenia). Układy krzywych (a, b, c) odpowiadają 
różnym gęstościom nasyconej pary rtęci; krzywe każdego układu 
odpowiadają różnym amplitudom pola częstości radiowej; 
d.v szerokość naturalna linii 

z czasem życia stanu wzbudzonego (Aco lJt = 2/r). 
Można więc zmierzyć bezpośrednio szerokość natu¬ 
ralną linii (jak wiemy, w obszarze częstości radiowych 
rozszerzenie dopplerowskie nie odgrywa żadnej roli) 
oraz rozszczepienie zeemanowskie, a stąd z kolei — 
stałą Landćgo (stałą g). Oba pomiary doprowadziły 
do bardzo ciekawych wyników. Okazało się miano¬ 
wicie, że rozszczepienie zeemanowskie stanu wzbu¬ 
dzonego różni się nieco od tego, które odpowiada do¬ 
skonałemu sprzężeniu LS: 

gexp = 1,4383±0,0004; fg t - 1,5. 

Różnica przekracza wielkość błędu pomiarowego 
i pozwala wnioskować o pewnej niedoskonałości 

sprzężenia LS w atomie rtęci w stanie 6 3 /Y Na ten 
sam fakt wskazuje równocześnie zachodzenie przej¬ 
ścia interkombinacyjnego, łączącego singletowy stan 
podstawowy z trypletowym stanem rezonansowym, 

które w sprzężeniu LS jest silnie wzbronione. Wpływ 
tego wzbronienia zaznacza się wyraźnie w stosunkowo 
długim czasie życia stanu 6®^ (r = l,18 10” 7 s). 

Pomiary rozszczepienia zeemanowskiego i wyzna¬ 
czenie stałej Landćgo z taką dokładnością, na jaką 
pozwala metoda pompowania optycznego, dostar¬ 
czają na ogół bardzo dobrych informacji o naturze 
sprzężenia. 
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Spójna dyfuzja promieniowania 
rezonansowego 


Przy opisywaniu stanu atomu (ogólniej — elementarnego ukła¬ 
du kwantowego, czyli mikroukładu), za pomocą funkcji falowej 
należy sprecyzować, jakimi wielkościami (obserwablami) jeste¬ 
śmy zainteresowani. Musimy pamiętać przy tym, że zgodnie 
z podstawowymi prawami mechaniki kwantowej nie wszystkie 
obserwable mogą być wyznaczone w jednym pomiarze. W za¬ 
gadnieniach spektroskopii najczęściej interesuje nas energia stanu 
i związane z nią wielkości kwadratu całkowitego momentu pędu 
oraz jednej z jego składowych. Odpowiada to tzw. reprezentacji 
energetycznej i sprowadza się do rozwiązania równania Schró- 
dingera dla stanu stacjonarnego HW = EW (gdzie H jest opera¬ 
torem energii układu). Rozwiązanie tego równania polega na 
znalezieniu takiego zbioru funkcji stanu v/ £ ,by zachodziło: Hwt — 
— (Et jest liczbą). Funkcjenazywamy funkcjami własnymi 

układu, liczby zaś E { są to wartości własne energii (przedstawia¬ 
jące jedyne wyniki, jakie możemy otrzymać z pomiaru energii 
naszego mikroukładu). Można teraz rozróżnić dwie sytuacje 
w odniesieniu do stanu naszego mikroukładu. Mówimy, że jest 
on w stanie własnym \i/ it jeżeli pomiar energii przeprowadzony 
na nim daje z pewnością wielkość E t . Jeśli natomiast pomiar 
energii daje nam wielkość E x z amplitudą prawdopodobieństwa 
a\, wielkość Ej z amplitudą aj itd., to stan jozważanego układu 
nazywamy stanem superpozycji i przedstawiamy jako liniową 
kombinację stanów własnych: 

w = Cl^1+02^2+ ••• = JT a i v it 

i 

przy tym E jatJ* = 1. Zbiór funkcji fj/t musi spełniać pewne warun¬ 
ki kompletności (winien tworzyć bazę). Gdy widmo energii wła¬ 
snych układu jest ciągłe, a nie punktowe, definicje stanu superpo¬ 
zycji ulegają prostemu uogólnieniu. Widać wreszcie, że możemy 
uważać stan własny za szczególny przypadek stanu superpozycji, 
gdy tylko jedna z wartości a t = t, pozostałe zaś są równe zeru. 
Jeśli mikroukład poddany jest zewnętrznemu zaburzeniu zależ¬ 
nemu od czasu, wówczas stan ulega ewolucji i każde aj =» 

W ogólnym wypadku ewolucje przebiegają w każdym mikron r. ła¬ 
dzie niezależnie. Istnieją jednak pewne specjalne sytuacje (i te 
właśnie nas obecnie interesują), gdy pod wpływem zaburzenia 
zewnętrznego wszystkie mikroukłady należące do określonego 
zbioru makroskopowego (ansamblu) dokonują ewolucji w pe¬ 
wien skoordynowany sposób. Tego typu ewolucje obserwujemy 
w zbiorze atomów pompowanych optycznie i poddanych rezo¬ 
nansowemu polu częstości radiowej. Długość fali radiowej wie¬ 
lokrotnie przewyższa rozmiary komórki rezonansowej i można 
przyjąć, że oddziaływanie między polem i atomem odpowiada 
w całym obszarze komórki tej samej fazie drgań pola. Wówczas 
ewolucja a f (t) we wszystkich atomach zachodzi jednakowo, czyli 
w uzgodnieniu fazowym (identyczne mikroukłady poddane syn¬ 
chronicznie periodycznemu zaburzeniu). Tego typu zjawiskiem 
jest np. uzgodniona w fazie precesja atomowych momentów mag¬ 
netycznych dokoła kierunku pola H 0 , prowadząca do wytworze¬ 
nia wirującej składowej poprzecznej makroskopowego momentu 
magnetycznego. Ponieważ w opisanym przypadku ewolucja mi¬ 
kroukładów zachodzi w zbiorze przy uzgodnieniu fazowym, 
będziemy mówili, że w tych warunkach występuje spójność sta¬ 
nów kwantowych. 

Omówiony obraz teoretyczny superpozycji sta¬ 
nów kwantowych znajduje piękne potwierdzenie 
w doświadczeniach nad pompowaniem optycznym 
w stanach wzbudzonych, w zjawisku zwężenia linii re¬ 
zonansu magnetycznego w stanie 6 3 Pi atomu rtęci ze 
wzrostem ciśnienia pary (nawet poniżej szerokości 
naturalnej). 

Od dawna było znane zjawisko uwięzienia promie¬ 
niowania rezonansowego. Przy podwyższeniu ciśnie¬ 
nia pary foton fluorescencji rezonansowej podlega 
reabsorpcji (jednorazowej lub kilkakrotnej), co wy¬ 
dłuża czas jego przebywania w komórce. Nie jest to 
rzeczywiste przedłużenie czasu życia atomu w stanie 
wzbudzonym i nie może prowadzić do zwężenia linii. 
Atomy poddane radiowemu polu rezonansowemu 
znajdują się jednak nie w stanie własnym, lecz w stanie 
superpozycji 

^ = a+•(') %+a 0 (0 'h + a -i(0 y>-u 

gdzie <7i(0 i vi (i = 4-1, 0, —1) oznaczają odpowied- 
nio amplitudy i funkcje własne stanów o Mj = 4-1, 
0 , - 1 . 

Z ogólnych rozważań wynika, że kwant wysłany 
przez atom w stanie superpozycji po pochłonięciu go 
przez inny, identyczny atom wzbudzi go również do 
stanu superpozycji, a ten z kolei pod wpływem pola 
radiowego będzie kontynuował ewolucję poprzed¬ 
niego itd. W tych warunkach, zgodnie z kwantową 
zasadą nierozróżnialności atomów, nie możemy wska¬ 
zać, czy to pierwszy atom wykonywał ewolucję w sta¬ 
nie wzbudzonym przez czas odpowiednio dłuższy. 
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czy też foton przechodził z atomu do atomu, tylko że 
ich ewolucje były utrzymywane przez rezonansowe 
pole radiowe w ustalonej fazie. Taka sytuacja w isto¬ 
cie prowadzi do zwężenia linii. Jeśli się teraz prze¬ 
prowadzi serie pomiarów szerokości linii rezonansu 
magnetycznego w funkcji ciśnienia pary, to się okaże, 
że wraz z malejącym ciśnieniem pary szerokość linii 
wzrasta (!), dążąc do wartości odpowiadającej rze¬ 
czywistemu czasowi życia atomu w stanie wzbudzo¬ 
nym (widać to wyraźnie na wykresach przedstawio¬ 
nych na rys. 18). 

Dalsza analiza wyrażeń na natężenie promienio¬ 
wania wysłanego przez zbiór atomów w takich warun¬ 
kach prowadzi do wniosku, że gdy emisja następuje 
w obecności rezonansowego pola częstości radiowej, 
natężenie promieniowania winno być zmodulowane 
z częstością Larmora lub podwójną. Te modulacje 
w istocie były zaobserwowane, zgodnie z przewidywa¬ 
niami teoretycznymi. 

Spójne wzbudzenie stanów można uzyskać nie tyl¬ 
ko w obecności radiowego pola rezonansowego. 
Dobre wyniki dało wzbudzanie bardzo krótkimi 
(najwyżej nanosekundowymi) błyskami. Szerokość 
spektralna błysku (impulsu) jest wtedy wystarczająca, 
by objąć całą badaną strukturę (zeemanowską, nad- 
subtelną lub nawet subtelną). Wzbudzenie wszystkich 
atomów następuje właściwie w tym samym momencie 
(stałe czasowe ewolucji są znacznie dłuższe niż czas 
wzbudzenia) i zanika wykładniczo z nałożoną modu¬ 
lacją o częstości równej rozszczepieniu stanów (zob. 
str. 297). 

W doświadczeniach nad pompowaniem optycznym 
w stanie podstawowym rezonansowe pole radiowe 
wprowadza spójność między podpoziomami zeema- 
nowskimi. Można ją wykryć za pośrednictwem modu¬ 
lacji wiązki poprzecznej i wykorzystać do powiększe¬ 
nia dokładności pomiarów (m.in. magnetometrycz- 
nych). 



Rys. 19. Rozszczepienia zeemanowskie poziomów energetycznych 
He należących do n — 2 w układzie trypletowym. Stan 2 3 £ Ł jest 
metatrwały i może stanowić bazę przejść w układzie trypletowym. 
Linia X = 1083,034 nm jest w nim linią rezonansową. Przecięcia 
poziomów zaznaczone czarnymi okręgami dają sygnały, na pod¬ 
stawie których można obliczyć rozszczepienie stanów 3 P, —> 3 P ?f 
wynoszące 2291 t 56±0,09 MHz. Odległość między 3 P X i obli¬ 
czona na podstawie analizy teoretycznej rozszczepienia subtel¬ 
nego stanu 3 jP helu, wynosi 29 650^280 MHz. Czas życia stanu 
2 3 P obliczony z szerokości sygnału był również zgodny ze zmie¬ 
rzonym bezpośrednio. Przecięcia poziomów oznaczone okręga¬ 
mi niebieskimi nie spełniają warunku dmj — 2 i takie sygnały 
nie były obserwowane przy użytej polaryzacji światła 


Metoda „przecinania poziomów" 

Wzbudzenie atomów do spójnej superpozycji sta¬ 
nów może być osiągnięte wówczas, gdy znajdują się 
one w polu magnetycznym o stosownie dobranym 
natężeniu 

Rysunek 19 przedstawia diagram energii stanów 
2 3 jP 0 , i, 2 helu. Każda gałąź wykresu odpowiada sta¬ 
nowi o określonych liczbach kwantowych (7, Mj ) 
i obrazuje zależność energii tego stanu od natężenia 
pola magnetycznego. Weźmy pod uwagę przecięcie ga¬ 
łęzi (2, 1) i (/, — 1 ) przy H c 2ć 0,057 T. W tych warun¬ 
kach dwóm różnym stanom odpowiadać będzie ta 
sama energia. Jeśli teraz wzbudzimy fluorescencję 
rezonansową atomów znajdujących się w polu magne¬ 
tycznym i przejdziemy przez obszar H c (zmieniając 
stopniowo natężenie pola), to zaobserwujemy zmia¬ 
nę natężenia fluorescencji w obszarze „przecięcia 
poziomów”. Na podstawie ogólnej teorii zjawiska 
Zeemana możemy z dobrym przybliżeniem obliczyć 
zmianę energii stanu wywołaną przez przejście od H — 
= 0 do H — H c . Z rys. 19 widać, że suma zmian 
energii poziomów (2, /) i (/, — 1) daje wprost rozszcze¬ 
pienie poziomów 3 jP 2 i a F z . Szerokość sygnału (w skali 
H , którą łatwo przeliczyć na MHz) zależy tylko od 
szerokości naturalnej poziomów, daje więc informację 
o czasie życia stanu wzbudzonego. Dzięki swej pro¬ 
stocie metoda wyznaczania tych dwóch ważnych 
parametrów stanów atomowych jest ostatnio bardzo 
szeroko stosowana, szczególnie przy badaniach wyso¬ 
kich stanów wzbudzenia atomów trudno dostępnych 
innymi metodami. Z rys. 19 widać również, że gdy 
H = 0, przecinają się więcej niż dwa poziomy. Syg¬ 
nał „przecięcia poziomów” w polu zerowym może być 
również wykorzystany do obliczenia czasu życia stanu 
wzbudzonego. Ostatnio stosowanie tej metody roz¬ 
ciągnięto również na stany wzbudzone prostych 
cząsteczek. 


Pompowanie nadsubtelne 

Przy pompowaniu optycznym w stanie podstawowym 
atomów o niezerowym spinie jądrowym wytwarzamy 
różnicę obsadzeń nie tylko między podpoziomami 
zeemanowskimi, lecz również między poszczególnymi 
składowymi hipermultipletu. Można to w-ykryć przez 
zmianę sygnału optycznego po przyłożeniu rezonan¬ 
sowego pola elektromagnetycznego. W metalach al¬ 
kalicznych częstości rezonansowe Av przejść między 
podpoziomami struktury nadsubtelnej odpowiadają 
już jednak obszarowi mikrofalowemu (np. Av — 1772 
MHz dla 23 Na, Av = 6834,7 MHz dla 87 Rb i Av = 
= 9192,6 MHz dla l33 Cs). Szczególnie interesujące są 
wypadki, w których jest możliwe przeprowadzenie 
pompowania w nieobecności pola zewnętrznego, 
wówczas bowiem częstość przejścia (tzw. przejścia re¬ 
zonansowego nadsubtelnego) może być wyznaczona 
z olbrzymią dokładnością (dzięki niezależności od 
ewentualnych fluktuacji pól zewnętrznych). Można 
więc ją przyjąć jako dogodny wzorzec częstości. Po 
bardzo licznych badaniach i dyskusjach jako definicję 
sekundy przyjęto w 1967 r. czas równy 9 192 631 770 
okresów promieniowania odpowiadającego przejściu 
między podpoziomami nadsubtelnej struktury F — 
— 4 —► F' = 3 (Mf — Mf* = 0) w stanie podstawo¬ 
wym 6 2 5 1/2 atomu izotopu cezu 133 Cs. Wzorcem pier¬ 
wotnym jest układ, w którym atomy cezu biegną w 
postaci promienia atomowego (smukłej, równoległej 
w'iązki atomów) i separacja atomów w stanach F i F' 
następuje w polu magnetycznym (—► Spektroskopia 
mikrofalowego rezonansu rotacyjnego), a nadsubtelne 
pompowanie optyczne wykorzystuje się w precyzyj¬ 
nych wzorcach wtórnych, w których się stosuje op¬ 
tyczną detekcję rezonansu mikrofalowego. Pompo¬ 
wanie odbywa się przez wzbudzanie jedną z dwu skła¬ 
dowych nadsubtelnej struktury linii D v Linia D x w 
widmie metali alkalicznych składa się w rzeczywistości 
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z czterech składowych, jednak rozszczepienie nad- 
subtelne stanu wzbudzonego jest wielokrotnie mniej¬ 
sze od rozszczepienia stanu podstawowego; w przy¬ 
rządzie o niezbyt wielkiej zdolności rozdzielczej wy¬ 
dzielamy jedną z dwu par składowych i pompując nią, 
struktura opróżniamy jeden z podpoziomów nadsubtelnych 
nadsubtelfta stanu podstawowego (rys. 20). 


f=l+ 1/2 
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Rys. 20. Struktura 
nadsubtelna linii Di 
metalu alkalicznego o 
spinie jądrowym / 

Wielkie możliwości wydajnego pompowania nad- 
subtelnego otwiera stosowanie strojonych laserów 
barwnikowych o działaniu ciągłym, a zastosowanie 
gazu buforującego i wykorzystanie wywołanego 
przezeń specyficznego efektu zwężenia linii rezonansu 
nadsubtelnego pozwala uzyskać dokładność przy wy¬ 
znaczaniu rozszczepienia nadsubtelnego do ułamka 
Hz (przy częstości 9* 10 9 Hz). 

powiązanie Ogólna zasada powiązania częstości z wzorca ato- 
zegara z mowego z zegarem (w tym wypadku z wysoce stabil- 
wzorc&m nym generatorem elektronicznym, umożliwiającym 
zsyntetyzowanie częstości wzorcowej i zaopatrzo¬ 
nym w urządzenie do zliczania okresów) polega na 
porównaniu obu częstości drgań metodą interferencji. 
Przy bardzo bliskich częstościach interferujących fal 
otrzymujemy dudnienia, których liczba w sekundzie 
daje wprost odstrojenie zegara od wzorca atomowego. 

Ostatnio podjęto dalsze próby zwiększenia dokład¬ 
ności wzorca częstości. Wykorzystuje się układy lase¬ 
rów o działaniu ciągłym i o częstości stabilizowanej 
na wybranych liniach widma molekularnego. Uzyski¬ 
wanie częstości kombinacyjnych przez zdudnianie 
wiązek laserowych (dzięki wykorzystaniu nielinio¬ 
wych zjawisk optycznych) pozwala na nawiązanie 
częstości optycznych do częstości mikrofalowych 
i uzyskanie dokładności rzędu 10 -15 , a stabilności 
nawet do 10 -17 (N.P. Chebotaev). Ta dokładność na¬ 
suwa poważne problemy związane ze znacznie mniej 
dokładną definicją innych podstawowych stałych fi¬ 
zycznych. 



Zderzenia wymienne 

W mieszaninie dwu rodzajów atomów paramagnetycz¬ 
nych A i B (np. Rb i Cs) orientacja układu atomów A 
uzyskana przez pompowanie optyczne może być w 
zderzeniach przekazana atomom B. Wynik zderzenia 
wymiennego jest więc taki, jak gdyby zderzające się 
atomy wymieniały wzajemnie swe elektrony walen¬ 
cyjne (stąd nazwa: zderzenia wymienne). Symbolicznie 
można to przedstawić w postaci reakcji A\+B\-+ 
—► gdzie strzałki wskazują orientację wekto¬ 

rów spinu elektronu walencyjnego. Ten proces jest, 
jak widać, pompowaniem atomów B oraz równocześ¬ 


nie jednym z czynników relaksacji atomów A. W ten 
sposób można uzyskiwać orientację atomów, których 
bezpośrednie pompowanie jest ogromnie niewygodne, 
a czasem wręcz niemożliwe. Za pomocą zderzeń wy¬ 
miennych uzyskano orientację wszystkich izotopów 
wodoru ( 1 H, 2 H, 3 H), azotu ( 14 N, 13 N), fosforu 32 P 
a także elektronów swobodnych e~. 

W rzeczywistości zderzenie wymienne prowadzi do 
utworzenia układu przejściowego, złożonego ze skład¬ 
ników A i B y mającego charakter chwilowej cząsteczki. 
Jej czas życia, ok. 10“ 12 s, jest wystarczająco długi, 
by powstało sprzężenie w powłoce elektronowej, 
i jednocześnie dość krótki na to, by sprzężenia mię¬ 
dzy powłoką elektronową i jądrami atomów zostały 
zerwane. 


Czysto jądrowa orientacja atomów 

Przy pompowaniu optycznym (lub przez zderzenia 
wymienne) atomów obdarzonych spinem jądrowym 
i mających w stanie podstawowym wypadkowy mo¬ 
ment magnetyczny powłoki elektronowej równy zeru 
mamy do czynienia z ciekawym przypadkiem czysto 
jądrowej orientacji. Przykładem mogą tu służyć 3 He 
(/ = 7 S , stan podstawowy HĄ o zerowym momencie 
orbitalnym i zerowym wypadkowym spinie elektro¬ 
nowym) oraz 1M Hg (Z = 1 / 29 stan podstawowy 6 1 S 0 ). 
Rtęć można pompować czysto optyczną metodą (rys. 
21), wykorzystując przy tym koincydencję nadsubtel- 
nej składowej A (J = V 2 F = Va) i linii parzystego 
izotopu 204 Hg. Pompowanie 3 He jest znacznie bardziej 
złożone: za pomocą słabego wyładowania wytwarza¬ 
my w He atomy w stanie metatrwałym 2 3 £ 1 i pompu¬ 
jemy je optycznie linią 1083 nm (rys. 19). Przez 
sprzężenie między powłoką elektronową i spinem 
jądrowym pompowanie wywołuje częściową orientację 

6 3 P (F= 1/2); 




Rys. 2!. Pompowa¬ 
nie jądrowe izotopu 
1,# Hg. Na rys. zaz¬ 
naczono strukturę 
zeemanowską tylko 
składowej A 

jądrową. W zderzeniach wymiennych z atomami he¬ 
lu w stanie podstawowym atomy zorientowane prze¬ 
kazują partnerom zderzenia energię wzbudzenia i orien¬ 
tację powłoki elektronowej, natomiast orientacja 
jądrowa pozostaje niezaburzona. Wypełniona powło¬ 
ka elektronowa o konfiguracji ls 2 stanowi znakomitą 
ochronę jądra przed oddziaływaniami zaburzającymi, 
atomy 3 He mogą więc zachowywać orientację jądrową 
przez długie godziny, stanowiąc w ten sposób zorien¬ 
towany zbiór przygotowany do doświadczeń fizyki 
jądrowej. 


1 I 

*1 I 


- -t-i/z 
■ - 1/2 


• * * 


m F 

- + 1/2 
. - 1/9 


Atomowa spektroskopia 
laserowa 


Omówimy tu kilka zasadniczych kierunków, w ja¬ 
kich się rozwija zastosowanie laserów w spektroskopii 
atomowej. 


mechanizm 

wymiany 


pompowanie 

jądrowe 
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użycie 1) Użycie lasera jako przestrajanego źródła pro- 
przestraja- mieniowania w badaniach absorpcyjnych. Szerokość 
nych laserów spektralna źródła laserowego może być bardzo mała 
(do kilku MHz). Wiązka z lasera zostaje podzielona 
za pomocą półprzezroczystej płytki na dwie, z któ¬ 
rych jedna przechodzi przez badany ośrodek, druga 
zaś jest wiązką odniesienia. Odpowiednie wy wzorco¬ 
wanie pozwala nałożyć na widmo absorpcji skalę 
częstości. 

2) Użycie lasera impulsowego do obserwacj i zaniku 
fluorescencji i dudnień kwantowych, powstających 
przy spójnym wzbudzeniu nierozszczepionej struktury, 
i wnioskowaniu stąd o wielkości rozszczepienia po¬ 
ziomów i o czasach ich życia. 

atomowa Rozszczepienie subtelne stanów atomowych szyb- 
spektrosko- ko maleje ze wzrostem głównej liczby kwantowej n 
pia błyskowa i liczby kwantowej momentu orbitalnego L, toteż nie 
można go obserwować w badaniach wyższych sta¬ 
nów prowadzonych zwykłymi metodami spektrosko¬ 
powymi (rozszczepienie staje się znacznie mniejsze 
wykorzysta- od szerokości dopplerowskiej linii, przeto struktury 
nie dudnień subtelnej w ogóle nie można zaobserwować). Wyko- 
kwantowych rzystanie zjawiska dudnień kwantowych pozwoliło na 
przeprowadzenie bardzo dokładnych pomiarów roz¬ 
szczepień subtelnych (np. S. Haroche zmierzył tą me¬ 
todą rozszczepienia stanów D^-D^ w sodzie i w ce¬ 
zie, od stanu 9 D do 16D). Idea doświadczenia (prosta 
w schematycznym przedstawieniu, lecz bardzo trudna 
i skomplikowana w realizacji) polegała ną tym, że 
atomy badanej pary wzbudzano ze stanu podstawo¬ 
wego krótkimi (najlepiej nanosekundowymi) błyskami 
ze strojonego lasera barwnikowego. Stan podstawowy 
w metalach alkalicznych jest stanem 5, a więc przejście 
bezpośrednie do stanu D jest wzbronione przez reguły 
wyboru dla liczby kwantowej L. Jednak (i to jest 
bardzo wygodne) wiązka laserowa o dużej mocy może 
wywołać przejście dwufotonowe — każdy z fotonów 
niesie kwantową jednostkę momentu pędu i P rz y 
jednoczesnej absorpcji dwu fotonów możliwe są 
przejścia ze zmianą liczby kwantowej L o dwa lub bez 
jej zmiany (AL^ ot = 0 lub 2). Musi być spełniony 
również warunek zachowania energii hv s _ D = hv x Ą-hv 2y 
przy czym w najprostszym wypadku v s _ D = 2v h 
(wszystkie fotony z lasera mają częstość v L ). Krótki 
błysk wzbudza atomy do stanu superpozycji i fluore- 
scencja obserwowana prostopadle do wzbudzenia 
gaśnie wykładniczo, co daje bezpośrednią informację 
o czasie życia t stanu wzbudzonego, a krzywa zaniku 
fluorescencji jest modulowana z częstością odpowiada¬ 
jącą częstości dudnień. Gdy na sygnał modulowanego 
zaniku nałożymy sygnały czasu, z częstości modulacji 
wywnioskujemy bezpośrednio o częstości rozszczepie¬ 
nia stanów. 

Zauważymy wreszcie, że jeśli struktura jest bardziej 
złożona (np. wysokie stany wzbudzenia układu try- 
pletowego), to modulacja ma postać złożoną i wid¬ 
mo częstości znajdujemy jako transformatę fourierow¬ 
ską czasowego przebiegu modulacji. Zarówno od¬ 
dzielenie modulacji od wykładniczego zaniku, jak 
też jej fourierowska analiza są dokonywane przez 
urządzenia elektroniczne. 




Rys. 22. Zasada metody spektroskopii nasyceniewej: a) linia 
absorpcyjna o rozkładzie dopplerowskim; b) zmiana absorpcji 
wskutek nasycenia w odległości Jv od środka linii v 0 ; c) zmiana 
absorpcji w środku linii wskutek nasycenia; strzałki oznaczają 
te częstości wiązki sondującej, przy których następowałyby efekty 
nasycenia (wiązka sondująca biegnie w kierunku przeciwnym do 
wiązki nasycającej) 


3) Badanie wąskich struktur metodami spektro¬ 
skopii nasyceniowej; eliminują one rozszerzenie dop- 
plerowskie i umożliwiają rejestrację widma szerokości 
takiej jak szerokość spektralna wiązki sondującej. 

Idea metody jest objaśniona na rys. 22. Przy prze- spektro- 
świetlaniu ośrodka pochłaniającego wiązką z lasera skopia 
o bardzo małej szerokości spektralnej (np. rzędu nasyceniowa 
kilku lub kilkunastu MHz) padające promieniowanie 
jest pochłaniane tylko przez te atomy, których ruch 
wywołuje przestrojenie dopplerowskie częstości przej¬ 
ścia v 0 atomu w spoczynku do częstości v wiązki z la¬ 
sera. Przepuszczenie przez ośrodek wiązki z lasera 
o dużym natężeniu może wywołać znaczne zmniej¬ 
szenie liczby atomów zdolnych do jej pochłaniania 
(następuje nasycenie absorpcji, rys. 22b). Wykorzystaj¬ 
my teraz do sondowania osłabioną wiązkę laserową. 

Przesyłamy ją przez kuwetę absorpcyjną w kierunku 
przeciwnym do wiązki nasycającej. Jeżeli częstość 
wiązki nasycającej nie przypadnie akurat w środku 
badanej linii (co odpowiada jej absorpcji przez atomy 
o zerowej składowej prędkości ruchu termicznego 
wzdłuż kierunku wiązki laserowej), to nasycenie 
absorpcji nie będzie odpowiadało częstości powraca¬ 
jącej wiązki sondującej i nie wywrze żadnego wpływu 
na jej osłabienie przy przejściu przez kuwetę. Dopiero 
dokładne dostrojenie wiązki nasycającej do środka 
linii badanej będzie sygnalizowane przez ostre maksi¬ 
mum wiązki sondującej (rys. 22c). 

Nawet względne pomiary ilościowe rozszczepień 
struktury tą metodą są trudne i wymagają wzorcowa- 



Rys. 23. Struktura linii D x serii Balmera deuteru. Oznaczenia 
składowych odpowiadają przejściom wskazanym na rys. 5; 
sygnał wzorcujący pochodzi ze stabilizowanego lasera He-Ne 
(wg T. W. HSnscha, A. L. Schawlowa i in.) 

nia układu za pomocą linii o długości fali nawiązanej 
bezpośrednio do kryptonowego wzorca długości. 

Pokonanie tych trudności daje jednak w rekompensa¬ 
cie pomiar z dokładnością nigdy przedtem nie osiąga¬ 
ną. Strukturę linii D x serii Balmera deuteru przed¬ 
stawia rys. 23. 

Jednym ze szczytowych osiągnięć metody spektro- przesunięcie 
skopii nasyceniowej (dwufotonowej) był bezwzględny Lamba 
pomiar przesunięcia Lamba stanu podstawowego w w wodorze 
wodorze. Wiązka z lasera barwnikowego po podwo¬ 
jeniu częstości do X 243,0 nm w nieliniowym krysz¬ 
tale (-> Optyka nieliniowa) wywoływała dwufotono¬ 
wą absorpcję w wodorze, powodując przejście 15 -> 

-> 25, które można obserwować pośrednio przez śle¬ 
dzenie indukowanej w zderzeniach (25 —► 2 P) linii 
Ly* oX = 121,5nm. Przez wzbudzenie dwufotonowe 
wiązkami przeciwbieżnymi zwężono spektralny obszar 
wzbudzenia poniżej 2% szerokości dopplerowskiej 
linii. Równocześnie podstawowa częstość lasera 
wzbudza linię H P (25, P -*• 45, P, D; vlv x — 4v// /J ). 

T. W. Hansch otrzymał niezwykle dokładne wyzna¬ 
czenie częstości przejścia Ly a rejestrując w czasie 
przestrajania lasera przez obszar absorpcji dwufoto¬ 
nowej równocześnie przebieg zmian absorpcji linii Hp 
(wzorcując zatem bardzo dokładnie częstość podsta¬ 
wową Vft). Jest ona o 8,6 ±0,8 GHz dla wodoru 
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i 8,3 ±0,3 GHz dla deuteru mniejsza od przewidywa¬ 
nej teoretycznie częstości linii Ly «, bez uwzględnienia 
przesunięcia Lamba poziomu \S (rys. 24). 



dwufoto¬ 
nowe 
wzbudzenie 
bez rozsze¬ 
rzenia 
dopplerow- 


Rys. 24. Wyznaczenie przesunięcia Lamba poziomu 15 w deu- 
terze. Wykres górny — zapis struktury linii fi serii Balmera; 
wykres dolny — krzywa dwufotonowego wzbudzenia linii a 
serii Lymana; odcinki — teoretyczna struktura linii Hp. Skala 
dolnego wykresu, a więc i zaznaczonego przesunięcia Lamba po¬ 
ziomu 15, w v/4 (wg T. W. Hanscha, A. L. Schawlowa i in.) 

4) Dwufotonowe wzbudzenie z eliminacją rozsze¬ 
rzenia dopplerowskiego (B. Cagnac) — metoda o bar¬ 
dzo dużej zdolności rozdzielczej. Jeśli na komórkę K> 
zawierającą np. parę sodu, pada wzdłuż jej osi silna 
i bardzo wąska spektralnie wiązka z przestrajanego 
lasera o częstości v bliskiej v 0 (przy tym 2y 0 jest czę- 
skiego stością przejścia np. 3 2 S 1I2 -3*D ir2 ), to staje się możliwe 
dwufotonowe wzbudzenie atomów sodu wprost do 
stanu 3 *jE>i / 2 (ogólnie do i?D) lub n 2 S 1/2 ). Jednak nawet 
przy dostrojeniu lasera dokładnie do częstości v 0 
wzbudzenie jest słabe, bowiem pochłaniać mogą tylko 
te atomy, których składowe prędkości bezładnego 
ruchu cieplnego v z = 0. Gdy częstość wiązki v' ^ v„, 
pochłaniać mogą atomy dla których 

v = v 0 (l+vx/c). 

W układzie odniesienia związanym z tymi atomami 
„widziana” przez nie częstość wiązki odbitej od 
zwierciadła Z, ustawionego za kamórką, wynosi 

v" = v 0 (l —Vz/Ć). 

Przy jednoczesnym oddziaływaniu obu wiązek (rezo¬ 
nans) energia pochłonięta (równa hvi—hv/) wyniesie 




/zv 0 |l + -~-J ±Av o|l —= 2&v 0 . 


Warunek zgodności energii przejścia dwufotonowego 
jest jak widać spełniony dla wszystkich atomów nie¬ 
zależnie od ich prędkości, przy czym prawdopodo¬ 
bieństwo wzbudzenia przez dwa fotony biegnące w 
kierunkach przeciwnych jest czterokrotnie większe 
niż gdy fotony poruszają się w tym samym kierunku. 
Nastąpi więc bardzo silne wzbudzenie dwufotonowe; 
szerokość spektralna sygnału jest określona przez sze¬ 
rokość spektralną wiązki laserowej, 
badanie Ważne zastosowanie tej metody to: a) Badania 
struktury struktury subtelnej bardzo wysoko wzbudzonych sta- 
subtelnej nów atomowych (tzw. stanów rydbergowskich) przy 
I nadsubtelnej n rzędu kilkudziesięciu. Atom ma wówczas osobliwą 
stanów ryci- stiukturę: na zewnątrz rdzenia o rozmiarach 10 5 cm 
bergowskich rozciąga się chmura elektronu walencyjnego na obszar 
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tysiące razy większy. B. Stoicheff zbadał w ten sposób 
rozszczepienie poziomów struktury subtelnej stanów 
D w rubidzie aż do n = 65 (A65 D 3ł2t 5/2) = 35 MHz, 
zaś położenie tych stanów aż do n = 85 (0,16 cm -1 
poniżej granicy jonizacji). Czasy życia atomów w sta¬ 
nach rydbergowskich są bardzo długie (proporcjo¬ 
nalne do «*), nie jest więc możliwa bezpośrednia obser- 
wacjafluorescencji z tych stanów. Podstawową metodą 
badania jest wyznaczanie energii jonizacji przez bada¬ 
nie elektronów wyzwolonych w tym procesie, b) Ba¬ 
dania struktury nadsubtelnej wysoko wzbudzonych 
stanów (rozszczepiono struktury odległe o kilkadzie¬ 
siąt MHz i wyznaczono przesunięcie izotopowe linii), 
c) Badania rozszerzenia ciśnieniowego linii widmo¬ 
wych sodu przy bardzo małych ciśnieniach gazu za¬ 
burzającego (wyniki bardzo ważne przy analizie 
procesów oddziaływania w zderzeniach), d) Uzyskanie 
możliwości selektywnego obsadzania wybranego po¬ 
ziomu w układzie złożonym z wielu bardzo blisko le¬ 
żących poziomów. Ma to znaczenie przy badaniach 
mechanizmów zderzeniowych przekazywania wzbu¬ 
dzenia, a także przy realizacji metody rozdzielania 
izotopów przez selektywne wzbudzanie optyczne. 


Spektroskopia wiązka-tarcza 


Omówione w poprzednich rozdziałach metody sto¬ 
suje się do badań stanów podstawowych i wzbudzo¬ 
nych atomów neutralnych. Badania widm jonów są 
znacznie bardziej skomplikowane (szczególnie przy 
wielokrotnej jonizacji) wskutek trudności w wytwo¬ 
rzeniu i zmagazynowaniu dostatecznej liczby jonów 
w obszarze obserwacji oraz w uzyskaniu wielokrotnej 
jonizacji. Inne trudności w badaniach atomowych po¬ 
chodziły z ograniczonej rozdzielczości czasowej foto¬ 
detektorów i układów elektronicznych. Wiele z nich 
można przezwyciężyć dzięki wprowadzonej przed kil¬ 
ku laty metodzie spektroskopowej: wiązka-tarcza 
(S. Bashkin, H.J. Andra). 

W tej metodzie jony badanych atomów zostają 
przyspieszone w akceleratorze (np. van de Graaffa 
lub liniowym) i zależnie od rodzaju doświadczenia 
uzyskują energię 100 keV-kilku MeV (nabywają one 
prędkość l-10mm/ns). Przyspieszone jony przechodzą 
następnie przez niesłychanie cienką folię węglową 
(ok. lOjig/cm 2 ). W czasie przejścia trwającego At « 
~ 10“ 2 ps zachodzi oddziaływanie z folią i dalsza 
jonizacja, prowadząca niejednokrotnie do całkowitego 
niemal odarcia atomu z elektronów (wytworzone zo¬ 
stają jony dziesięcio-, a nawet kilkunastowartościowe, 
np. Ar 17+ ). 

Spektroskopia wiązka-tarcza dostarczyła niezwykle 
interesujących wyników. Okazało się możliwe połą¬ 
czenie z nią specjalnych metod omówionych po¬ 
przednio i uzyskanie niezmiernie wysokiej precyzji 
pomiarów. Ponadto możliwe jest osiągnięcie wzbudze¬ 
nia bardzo wysokich stanów (praktycznie dowolnych). 
Przy pomiarach tą metodą nie ma zaburzeń wprowa¬ 
dzonych przez zderzenia. Badania można przepro¬ 
wadzać w ogromnie szerokim obszarze widma (od 
promieni rentgenowskich do czerwonego krańca wid¬ 
ma widzialnego). Gdy wzbudzamy stany o liczbie 
kwantowej J > 1, występują zależne od \Mj\ różnice 
obsadzeń, co daje możliwość prowadzenia doświad¬ 
czeń z rezonansem magnetycznym i jego optyczną 
detekcją. Ponieważ czas wzbudzenia J/jest rzędu 10“ 2 
ps, a nawet 10“ 3 ps, otrzymujemy spójne wzbudzenie 
blisko leżących stanów i modulowany zanik wysyła¬ 
nego promieniowania. Szybkość wiązki atomowej 
wynosi ok. 10 8 cm/s, co zapewnia rozdzielczość po¬ 
miarów czasowych lepszą niż 0,1 ns. 

Pierwsze badania widm metodą wiązka-tarcza 
przyniosły ogromny materiał, w którym oprócz linii 
znanych z pomiarów metodami tradycyjnymi znalezio¬ 
no ogromną liczbę linii nowych. 
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badania widm Wychodzące z folii wiązki jonów o różnej krotno- 
atomów ści rozdzielano w separatorach. Badając świecenie 
zjonizo- rozdzielonych grup, można było przypisać nowo od- 
wanyoh kryte linie określonym jonom. Niejednokrotnie do¬ 
datkową informację przynosiło wyznaczenie czasu gaś- 
nięcia różnych linii. Z dużą dozą prawdopodobień¬ 
stwa można przypuszczać, że linie o tym samym cza¬ 
sie gaśnięcia wychodzą z tych samych stanów. 

Badaniom poddawano systematycznie pewne grupy 
jonów, a więc np. widma jonów o strukturze izoelek¬ 
tronowej: Lii, Bell, Bill, CIV itd. (widmo atomu 
obojętnego oznacza się cyfrą rzymską I, jonu jedno- 
wartościowego — cyfrą II; tak więc np. CV oznacza 
widmo, lub układ termów, węgla czterokrotnie jo¬ 
nizowanego, ArXVIII — widmo argonu zjonizowane- 
go siedemnastokrotnie, Ar 17+ ), o strukturze homolo¬ 
gicznej: Neli, Arii, KrII, XeII. Ważnym elementem 
tych badań było wyznaczanie prawdopodobieństw 
przejść dla sekwencji jonów o strukturze izoelektro¬ 
nowej i porównywanie wyników doświadczalnych 
z przewidywaniami teoretycznymi, opartymi na 
przybliżonych obliczeniach funkcji falowych. Wyniki 
mogły ocenić dobroć przybliżenia, 
badan ie Metoda pomiaru czasu życia w wiązce wzbudzonych 

czasów atomów jest stosunkowo prosta i polega na pomiarze 
życia gaśnięcia badanej linii wzdłuż wiązki, w funkcji 
wzbudzonych odległości od folii. Układ spektrometryczny i pole 
jonów obserwacji są stałe, a folię przesuwa się skokami, 
(ich wielkość waha się od 0,05-0,01 mm zależnie od 
warunków. Te skoki połączone są z przestrajaniem 
kanałów analizatora układu elektronicznego groma¬ 
dzącego dane pomiarowe. 


Pomiar przesunięcia Lamba przy dużych Z 

Wyrażenie na rozszczepienie Lamba, o którym była 
mowa na str. 287, jest prz>bliżone. W rzeczywistości 
jest ono opisane przez podwójne rozwinięcie względem 
a i (aZ). W wodorze wyrazem znaczącym (mającym 
udział przekraczający 99% wielkości rozszczepienia) 
jest wyraz zawierający a (aZ) 4 . Wyrazy wyższego rzę¬ 
du można więc pominąć. Tymczasem w jonach o więk¬ 
szym Z (np. 0 7+ ), w stanie o n = 2, udział wyrazów 
wyższego rzędu wzrasta niemal do 10% ; zbadanie ich 
poprawności i zgodności z doświadczeniem staje się 
rzeczą bardzo interesującą. Bezpośredni pomiar roz¬ 
szczepienia stanów przy użyciu metody Lamba i Re- 
therforda w jonach wodoropodobnych o większym Z 
napotyka jednak ogromne trudności. Jeżeli nawet 
pominąć trudności związane z ogniskowaniem szyb¬ 
kich jonów w polach magnetycznych, to i tak w wy¬ 
padku ciężkich jonów będziemy mieli do czynienia 
z bardzo znacznymi częstościami ^ rezonansowymi 
między rozszczepionymi stanami, leżącymi w bardzo 
niedogodnym obszarze widma (przesunięcie 5 wynosi 
783 GHz dla C 5+ , a 2200 GHz dla 0 7+ ; jest to obszar 
dalekiej podczerwieni). Do wyznaczenia 5 potrzebna 
więc będzie inna metoda, która wykorzystuje zjawisko 
mieszania się stanów 2 5j/s i 2 Pi/ 2 > Sdy atomy wiązki 
adiabatycznie wchodzą w pole elektryczne. (Termin 
„przejście adiabatyczne” oznacza tu, że czas nara¬ 
stania pola elektrycznego jest bardzo długi w porówna¬ 
niu z okresem przejścia 2 2 5,/ 2 -> 2 2 /\/ 2 ). Zmieszanie 
stanów wywołuje skrócenie czasu życia poprzednio 
metatrwałego stanu 2 2 Sij2- To skrócenie zależy od 
natężenia pola elektrycznego E, a także od wielkości 
przesunięcia Lamba S i wyraża się wzorem: 

1 1 \V(E)\ 2 

^7 t 2 p 6 2 (s 2 +ii P )’ 

gdzie r jest czasem zaniku stanu 25 po wprowa¬ 
dzeniu atomu w pole elektryczne, ? 2P czasem za¬ 
niku promienistego stanu 2P , V(E) — funkcją natęże¬ 
nia pola elektrycznego wyrażającą zaburzenie stanu 
z Sii 2 - Przesunięcie 5 wyznacza się z pomiaru czasu 
zaniku t 2S * linii Ly®, wysłanej ze stanu 25 , w funkcji 


natężenia pola elektrycznego E. Czas r^ jest znany 
z licznych doświadczeń. Wyniki prowadzą do dosko¬ 
nałej zgodności z przewidywaniami teoretycznymi: 


5(C 5+ )teor = 783,68 ±0,25 GHz, 
5(C 5+ )ex P = 780,1 ±8,0 GHz, 
5(0 7+ )teor = 2205,17± 1,56 GHz, 
5(0 7+ )ex P = 2202,7 ±11 GHz. 


Zastosowanie metody wiązka-tarcza umożliwiło badame ^ 
badanie wzbudzeń wieloelektronowych (wzbudzo- wzbudzeń 
ne dwa —lub więcej — elektrony w stosunku do wieloeSektro- 
konfiguracji odpowiadającej stanowi podstawowemu nowych 
atomu). Systematyczne badania wzbudzenia dwuelek- 
tronowego rozpoczęto w 1969r. (W.S. Bickeli M. Du- 
fay). W wiązce poza folią znaczna część atomów znaj¬ 
dowała się w stanie dwuelektronowego wzbudzenia. 

Widma wysyłane przez te atomy zawierały ogromną 
liczbę linii nie znanych uprzednio. Dotychczasowe 
badania obejmują zaledwie kilka najlżejszych pier¬ 
wiastków i jonów, np. H~, Hel i układy izoelektro¬ 
nowe Liii, BIV oraz Lii i układy izoelektronowe 
Bell, CIV. Napotyka się wiele różnych trudności. 

Jedną z najpoważniejszych stanowi proces autojom- 
zacji. Gdy energia stanu wzbudzenia dwuelektrono¬ 
wego przewyższa energię jonizacji atomu przy 
wzbudzeniu jednoelektronowym, wówczas w wyniku 
oddziaływania prowadzącego do mieszania stanów 
o różnych konfiguracjach (tu dyskretnego stanu 
wzbudzonego dwuelektronowo i kontinuum joniza¬ 
cji) _ bardzo się zwiększa prawdopodobieństwo 
przejścia bezpromienistego do stanu kontinuum po¬ 
wyżej granicyjednoelektronowej jonizacji, połączone 
z emisją elektronu. Proces ten może wywołać skrócenie 
czasu życia stanu wzbudzenia dwuelektronowego tak 
znacznie (do 10" 1 * s), że inne przejścia z niego będą 
zupełnie nieobserwowalne. Pomiary utrudnia fakt, ze 
znaczna część przejść ze wzbudzenia dwuelektrono¬ 
wego leży w obszarze bardzo dalekiego, próżniowego 
nadfioletu, graniczącego z obszarem miękkich promie¬ 
ni rentgenowskich, a nawet zachodzącego na ten ob¬ 
szar. Przejścia autojonizacyjne są jednak częściowo og¬ 
raniczone przez reguły wyboru i to sprawia, że wiele 
stanów ma czasy życia już uchwytne w pomiarach 

(10 -10 -10 -9 s). t . . . 

W badaniu wzbudzeń dwuelektronowych otrzyma- badanie 
no dwa typy widm: jedne z nich odpowiadają przej- wzbudzeń 
ściom od konfiguracji wzbudzenia dwuelektrono- dwuelektro- 
wego do poziomów dyskretnych wzbudzenia jedno- nowych 
elektronowego (rys. 25), inne — przejściom między 
różnymi, nie podlegającymi autojonizacji stanami 
układu wzbudzenia dwuelektronowego (rys. 26). 

Pomiary położeń linii widmowych oczywiście były 
uzupełnione wyznaczeniem ich natężeń i czasów ży- 


2p 2 3 P 



5 $, 


2 * 


2s2p 3 P 


Rys. 25. Przejścia w Hel między stanami wzbudzenia dwu- i jed- 
noelektronowego: linią przerywaną oznaczono przejścia dozwo¬ 
lone, lecz nie obserwowane (wg H.G. Berry ego) 
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cia, co w metodzie spektroskopii wiązka-tarcza nie 
nastręcza szczególnych trudności, aż do czasów 
rzędu 10 ps. Przyporządkowanie zaobserwowanych 



Rys. 26. Przejścia w układzie trypletowym między stanami wzbu¬ 
dzenia dwuelcktronowego w Hel zaobserwowane w doświad¬ 
czeniach wiązka-tarcza 

linii przejściom między określonymi stanami wymaga¬ 
ło trudnej i wnikliwej analizy teoretycznej. Trzeba było 
przyjąć model opisujący konfigurację i oddziaływania 
w powłoce elektronowej, przeprowadzić przybliżone 
obliczenia funkcji falowych i policzyć stąd energie sta¬ 
nów i czasy życia. Na ogół otrzymano dobrą zgod¬ 
ność otrzymanych wyników dla Hel, Liii i Lii, któ¬ 
rych diagramami poziomów przy różnych konfigura¬ 
cjach wzbudzenia dwuelektronowego już dysponuje¬ 
my. Obliczenia dotyczące układów o większej liczbie 
elektronów dają gorszą zgodność z doświadczeniem. 

Bardzo ważnym uzupełnieniem badań spektrosko¬ 
powych jest badanie widma energetycznego elektro¬ 
nów pochodzących z procesu autojonizacji. Ich energia 


składa się z dwóch części: energii związanej z ruchem 
atomów w wiązce i energii związanej z procesem 
autojonizacji z określonego stanu wzbudzenia dwu¬ 
elektronowego. Po oddzieleniu pierwszej części e- 
nergii otrzymujemy widmo energetyczne elektronów 
z procesu autojonizacji. Jego kolejne maksima od¬ 
powiadają energii kolejnych stanów wzbudzenia dwu¬ 
elektronowego. 

Wzbudzenie wiązka—laser 

Mimo wielu niewątpliwych zalet metoda wzbudza¬ 
nia atomów w folii ma pewne wady: np. nieselektywne 
jednoczesne wzbudzanie atomów do różnych stanów, 
a nawet produkcja wielu różnych stopni jonizacji, 
lub efekty kaskadowe (atom osiąga kaskadowo ba¬ 
dany stan) w zaniku stanów, utrudniające analizę 
wyników pomiarów. Często można uniknąć tych efek¬ 
tów wzbudzając przyspieszone w akceleratorze jony 
wiązką laserową. Metoda ta pozwala na celowy wybór 
szerokości spektralnej wiązki z lasera, na precy¬ 
zyjne dostrojenie częstości przez regulację kąta na¬ 
chylenia wiązki laserowej względem wiązki atomów 
(dostrojenie dopplerowskie). Omówione poprzednio 
pomiary można w ten sposób przeprowadzić ze znacz¬ 
nie zwiększoną dokładnością; dotyczy to np. pomiaru 
czasu zaniku fluorescencji z określonych stanów pro¬ 
stych, badania efektów modulacyjnych (przy użyciu 
do wzbudzenia wiązki laserowej o takiej szerokości 
spektralnej, która by wystarczyła do objęcia wszyst¬ 
kich poziomów badanej struktury, pomiaru nadsub- 
telnej struktury dolnego stanu przez stopniowe prze- 
strajanie częstości wzbudzającej zmianą nachylenia 
wiązki laserowej względem wiązki atomów i obser¬ 
wację efektywności wzbudzenia. 

Dokładność otrzymanych tą metodą wyników na¬ 
leży do szczytowych osiągnięć nie tylko spektroskopii, 
lecz badań fizycznych w ogóle. Pomiary czasu życia 
są obarczone błędem rzędu 0,02 ns; rozszczepienie 
poziomów w stanie wzbudzonym można mierzyć z do¬ 
kładnością do ułamka MHz. Prowadzi to do dokład¬ 
niejszego wyznaczenia wielkości stałych powszech¬ 
nych; ostatnie pomiary stałej Rydberga dały wartość 
R = 109 737,3143(4) cm" 1 . 

H.A. Enge, M.R. Wekr, J.A. Richards Wstęp do fizyki ato¬ 
mowej , Warszawa 1981; W. Hanle, H. Kjlbinpoppen Progress in 
Atomie Spectroscopy , A i B Plenum Press... 1979; D. Kunisz Fi¬ 
zyczne podstawy emisyjnej analizy widmowej , Warszawa 1973; 
Z. LeŚ Wstęp do spektroskopii atomowej , Kraków 1969; artykuły 
w Postępach Fizyki: 9, 495 (1958); 11,379 (1960); 12, 533 (1961); 
13, 27 (1962); 13, 41 (1962); 19, 557 (1968); 18, 287 (1968); 21 
209 (1970); 21,511 (1970); 21,543 (1970); 25,497 (1974); 26, 303 
(1975); 2 7 , 297 (1976); 28, 29 (1977); 28, 167 (1977); 29, 3 (1978); 
29, 419 (1978). 


Spektroskopia molekularna 


Podstawowe pojęcia 
spektroskopii molekularnej 

Jerzy Prochorow 

Zanim przejdziemy do szczegółowego omówienia za¬ 
kresu i przedmiotu badań spektroskopii molekular¬ 
nej, poświęcimy nieco uwagi ogólnym cechom cząste¬ 
czek i promieniowania elektromagnetycznego, oraz 
metodom badania ich wzajemnego oddziaływania. 


Energia cząsteczek 

Jeżeli izolowana cząsteczka ma pewną energię, związa¬ 
ną np. z ruchem jaki wykonuje, lub z określonym od¬ 
działywaniem pomiędzy jej elementami, to mówimy, 
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że cząsteczka znajduje się w określonym stanie 
energetycznym, a ilość energii, jaką ma, określa 
ten stan energetyczny. 

Próbując określić energię cząsteczki stosujemy za¬ 
zwyczaj uproszczenie polegające na założeniu, że 
poszczególne ruchy i oddziaływania w obrębie cząs¬ 
teczki są od siebie niezależne, a suma ich energii sta¬ 
nowi całkowitą energię cząsteczki. Można wyróż¬ 
nić cztery podstawowe źródła energii cząsteczki. 

Pierwszym źródłem energii jest ruch translacyjny 
(postępowy) cząsteczki jako całości. Cząsteczka 
o masie M poruszająca się z prędkością v w danym 
kierunku ma energię kinetyczną £trans = Mi? 2 /2. Pręd¬ 
kość, a więc i energia kinetyczna cząsteczki w gazie 
zależy od temperatury gazu, przy czym z kinetyczno- 
molekularnej teorii gazów wynika, że średnia energia 
kinetyczna ruchu translacyjnego jest równa £ t rans = 
— kT (k — stała Boltzmanna, T —temperatura). 


stała 

Rydberga 


translacja 

cząsteczki 













Energia ta, w odróżnieniu od innych rodzajów enegrii 
cząsteczki, zmieniać się może w sposób ciągły (nie 
przybiera dyskretnych wartości, albo jak mówimy, nie 
jest skwantowana). 

rotacja Oprócz ruchu postępowego cząsteczka może roto- 
cząsteczfci wać, tzn. obracać się jako całość wokół określonej 
w przestrzeni osi, co jest kolejnym źródłem energii 
cząsteczki. Jeżeli moment bezwładności względem wy¬ 
branej osi cząsteczki izolowanej jest równy /, to 
energia ruchu rotacyjnego 


Erot — 


ruchy oscy¬ 
lacyjne 
cząsteczki 


h 2 

87 i 2 I 


J(J+ 1). 


energia 

elektronową 

cząsteczki 


stan 

podstawowy 

cząsteczki 


Liczba / nazywa się kwantową liczbą rotacji i może 
przybierać wartości J = 0,1, 2, 3,.... A zatem energia 
rotacyjna może przybierać tylko pewne (nie wszystkie 
możliwe) wartości. Dlatego właśnie poziomy rotacyjne 
(stany energetyczne rotacji) są dyskretne (energia ro¬ 
tacji jest skwantowana). 

Innym źródłem energii cząsteczki są ruchy oscyla¬ 
cyjne (drgania) atomów w cząsteczce względem ich 
położeń równowagi. Oscylacje takie można rozpatry¬ 
wać, tak jakby to były drgania harmoniczne, a wtedy 
każdemu drganiu atomów, zachodzącemu z częstoś¬ 
cią v, można przypisać energię E 0sc = hv(v+\); 
tutaj h jest stałą Plancka, v — tzw. kwantową liczbą 
oscylacyjną, która podobnie jak kwantowa liczba 
rotacyjna, może przybierać tylko pewne wartości, 
a mianowicie?; = 0,1, 2, 3, .... Tym samym również 
i poziomy oscylacyjne (stany energetyczne oscyla¬ 
cji) są poziomami dyskretnymi (energia oscylacji jest 
skwantowana). 

Dwa pierwsze źródła energii związane są z cząs¬ 
teczką traktowaną jako całość, trzecie wiąże się z ru¬ 
chem elementów składowych cząsteczki, jakimi są 
atomy (bądź ściślej jądra atomowe). 

Czwarte źródło energii wiąże się z elektronami 
w cząsteczce. Elektrony mogą być w cząsteczce rozło¬ 
żone w różny sposób, a z każdym takim możliwym 
rozkładem ładunku elektronowego związana jest inna 
energia. Energię tę nazywamy energią elektronową 
cząsteczki, a stany energetyczne odpowiadające ener¬ 
gii elektronowej nazywamy stanami elektronowymi 
cząsteczki. W zasadzie, nie można podać prostego, 
ogólnego wyrażenia opisującego energię elektronową 
cząsteczki (-> Chemia kwantowa), takiego jak w przy¬ 
padku energii rotacyjnej i oscylacyjnej. Ale również 
i energia elektronowa cząsteczki jest skwantowana 
i może przybierać tylko pewne dyskretne wartości. 
Zmiana rozkładu ładunku elektronowego w cząstecz¬ 
ce, a więc zmiana stanu elektronowego cząsteczki, mo¬ 
że pociągać za sobą również zmiany (czasem bardzo 
znaczne) momentu bezwładności i częstości oscylacji. 
Tym samym ze zmianą stanu elektronowego cząsteczki 
wiąże się na ogół zmiana energii Erot i Eosc- 

Te cztery źródła energii są najważniejszymi, ale 
nie jedynymi źródłami energii cząsteczki. I tak np. 
jeżeli jądra atomowe cząsteczki mają spin jądrowy, 
to z różną orientacją jąder wiąże się różna energia. 
Podobnie dodatkowa energia pochodzić może od 
orientacji spinów elektronowych i ruchów orbitalnych. 
Są to jednak na ogół już tylko efekty dodatkowe (i czę¬ 
sto bez większej wagi) w stosunku do wymienionych 
poprzednio rodzajów energii cząsteczki. 

Mówiąc o różnych rodzajach energii cząsteczki, 
.nie mówiliśmy nic o tym, jak duże są te energie i czy 
są one jednakowo istotne z punktu widzenia spek¬ 
troskopii molekularnej. Aby móc o tym nieco więcej 
powiedzieć, musimy przede wszystkim sprecyzować 
skalę, a więc i zero tej skali, oraz jednostki, w ja¬ 
kich będziemy mierzyli energię cząsteczki. W spektro¬ 
skopii molekularnej definiujemy zazwyczaj zero ener¬ 
gii jako tzw. stan podstawowy cząsteczki. Jest to 
umowna definicja i przez stan podstawowy należy rozu¬ 
mieć taki stan, do osiągnięcia którego zmierzać będzie 
coraz więcej cząsteczek układu, wtedy gdy (w warun¬ 
kach równowagi termicznej) temperatura układu zmie¬ 
rza do temperatury zera bezwzględnego. Taki stan jest 


najniższym możliwym stanem energetycznym cząs¬ 
teczki, albo mówiąc inaczej, jest to najniższa możliwa 
energia, jaką może osiągać cząsteczka zachowując 
swoje cechy indywidualne, każde dalsze obniżenie jej 
energii związane będzie z reakcją chemiczną, a więc 
i ze zmianą samej cząsteczki. 

W spektroskopii molekularnej nie posługujemy się 
jednolitą skalą energii. Ze względu na dość znaczne 
różnice energii pochodzących z różnych źródeł, a tak¬ 
że ze względu na różny często charakter problemów, 
w których rozwiązaniu pomaga spektroskopia, sto- jednostki 
suje się różne jednostki do określania energii samych energii 
cząsteczek i energii procesów, w których one uczest¬ 
niczą. Podstawową jednostką mógłby być oczywiście 
J/cząsteczkę, jest ona jednak bardzo niewygodna 
i dlatego podajemy inne jednostki, częściej używane 
w spektroskopii molekularnej, jak również związki 
między nimi: 

1 eV/cząsteczkę = 1,6021 TO” 1 * 

J/cząsteczkę = 9,6481 • 10* J/mol 
1 cm" 1 = 1,9862 10- 23 
J/cząsteczkę = 11,9612 
J/mol = 1,2398 TO" 4 eV/cząsteczkę. 

Operując tymi jednostkami możemy teraz porównać 
różne energie cząsteczki. I tak średnia energia trans- 
lacyjna, w temperaturze pokojowej, jest rzędu 4 kJ/ 

/mol. Jednak tylko w nielicznych procesach, które ba¬ 
da spektroskopia, w grę wchodzi zmiana energii 
translacyjnej. Dlatega też w dalszych naszych roz¬ 
ważaniach nie będziemy brali pod uwagę energii 
translacyjnej. 

Typowa wielkość zmiany energii rotacyjnej cząs¬ 
teczki (energia przejścia rotacyjnego — odstęp ener¬ 
getyczny między sąsiednimi poziomami rotacyjnymi 
cząsteczki) jest rzędu 10~ 2 -10“ 3 kJ/mol. Typowe 
zmiany energii oscylacyjnej są rzędu 4-40 kJ/mol. 

Natomiast odstępy energetyczne pomiędzy stanami 
elektronowymi są rzędu 400 kJ/mol. 

Widać więc, że poszczególne rodzaje energii skła- poziomy 
dające się na całkowitą energię cząsteczki są bardzo energetycz- 
różne. Gdybyśmy chcieli zobrazować ten wniosek ne cząsteczki 
graficznie, mogłoby to wyglądać tak jak na rys. 1. 2-atomowej 
Taki schemat poziomów odpowiada zasadniczo 
cząsteczce dwuatomowej. Dla cząsteczek wieloato- 
mowych liczba możliwych oscylacji, jakie mogą wy¬ 
konywać atomy cząsteczki, jest tym większa im więcej 
atomów w cząsteczce (nie jest to zupełnie ścisłe i bę¬ 
dziemy o tym jeszcze dalej mówili) i nasz rysunek 
musielibyśmy uzupełnić o wiele innych poziomów 
oscylacyjnych (z innym odstępem niż ten na rysunku) 
i każdemu z tych poziomów przyporządkować od¬ 
powiednie poziomy rotacyjne. Nietrudno sobie wyo¬ 
brazić, że im większa byłaby cząsteczka, tym mniej 
czytelny byłby nasz rysunek. 

Stany energetyczne cząsteczki charakteryzują pewne 
określone, chociaż czasami (jak np. dla stanów ___ 
elektronowych) bardzo różne wartości energii. Ale /' r 

to stwierdzenie nie mówi nam wcale, jakie warunki 
muszą być spełnione, ażeby cząsteczka przebywała mm F c 

w tym czy innym stanie energetycznym. Czy można 
w ogóle przewidywać, znając energię poszczególnych 
stanów, jaka część cząsteczek tworzących układ (np. 
gaz) będzie w określonych warunkach znajdowała się 
w tym czy innym stanie energetycznym? Otóż takie v i 

przewidywania są w pewnych warunkach możliwe. 

Przypuśćmy, że mamy pewien zbiór cząsteczek w rów- ^ 

nowadze termicznej (tzn., że temperatura jest jednako¬ 
wa w całym układzie). Intuicja podpowie nam zapew- v s 

ne, że na to, by jakaś cząsteczka takiego układu mogła _ v 

zmienić swój stan energetyczny, np. przejść ze stanu ■ 

o niższej energii do stanu o wyższej energii, musi 
istnieć jakiś czynnik zewnętrzny, który dostarczy 


Rys. 1. Schemat poziomów energetycznych cząsteczki: E 0t E' 
stany elektronowe — podstawowy i wzbudzony, r i v’ stany oscy¬ 
lacyjne, } i y stany rotacyjne (dla tych ostatnich skala energii na 
rysunku została zwiększona). Na rysunku brak jest wyższych 
wzbudzonych stanów elektronowych 
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jej energii potrzebnej do takiego przejścia. Czyn¬ 
niki takie mogą być różnej natury i o niektórych 
z nich będziemy jeszcze dalej mówili. Na razie niech 
nasz układ będzie odizolowany od wszelkich zewnę¬ 
trznych czynników doprowadzających do niego 
energię. Czy w takich warunkach cząsteczki mogą 
czerpać skądś energię potrzebną do przejścia do wyż¬ 
szego stanu energetycznego? Tak, takim źródłem 
energii może być energia ruchu translacyjnego, którą 
cząsteczki mogą wymieniać między sobą wtedy, gdy się 
zderzają. Średnia energia ruchów translacyjnych za¬ 
leży od temperatury układu i jest przez ten układ 
zachowana, jeżeli niemożliwa jest wymiana energii 
z otoczeniem układu. Oznacza to, że jeżeli w jakimś 
zderzeniu jedna cząsteczka uzyskuje energię i przecho¬ 
dzi do wyższego stanu energetycznego, to druga musi 
tę energię tracić, a w następnym zderzeniu może być 
odwrotnie. W sumie jednak w układzie takim musi 
istnieć równowaga (dynamiczna), tzn. w każdym 
określonym stanie energetycznym musi znajdować 
rozkład się stale, średnio rzecz biorąc, tyle samo cząsteczek, 
obsadzeń I trzeba tylko umieć określić — ile cząsteczek w jakim 
stanie? Albo inaczej, jakie jest obsadzenie (populacja) 
danego stanu? Ilościowej odpowiedzi na to pytanie 
dostarcza wyrażenie znane pod nazwą rozkładu 
Boltzmanna: 

— = e -(Ei-E 0 )lkT 

*0 

Tutaj m jest liczbą cząsteczek w stanie i o energii 
Eu albo inaczej obsadzeniem /-tego stanu, — obsa¬ 
dzeniem najniższego stanu (stanu o najniższej możli¬ 
wej energii). Sens tego wyrażenia jest prosty. Im 
większa jest różnica energii Ei—E 0 , tzn. im wyższy 
jest dany stan energetyczny /, tym mniej cząsteczek 
może w nim w danej temperaturze przebywać, tzn. 
tym słabiej jest on obsadzony. Na przykład dla stanów 
elektronowych, dla których Ei—E 0 jest rzędu 10 2 
kJ/mol i więcej, stosunek m/n 0 jest w temperaturze 
pokojowej rzędu 10 -10 i w praktyce poza stanem pod¬ 
stawowym żadne wyższe stany elektronowe nie są 
w takich warunkach w ogóle obsadzone. Natomiast 
wyższe stany oscylacyjne i wyższe stany rotacyjne 
podstawowego stanu elektronowego mogą być w tej 
temperaturze w pewnym stopniu obsadzone, szcze¬ 
gólnie te ostatnie, dla których różnica energii jest 
rzędu zaledwie 10 ” 2 - 10~ 3 kJ/mol. Znajomość obsa¬ 
dzenia poszczególnych stanów energetycznych cząs¬ 
teczki jest ważnym elementem, gdyż, jak przekonamy 
sięjeszcze niejednokrotnie, obsadzenie stanów decydu¬ 
je o rozkładzie natężeń w widmach cząsteczek. 

Przejścia do wyższych stanów energetycznych wy¬ 
magają doprowadzenia do cząsteczki energii z zew¬ 
nątrz. Taką energię niesie ze sobą promieniowanie 
elektromagnetyczne. Oddziaływanie promieniowania 
elektromagnetycznego z cząsteczką może zatem zmie¬ 
nić energię cząsteczki. I to właśnie, jak powiedzieliśmy 
na samym początku, stanowi fundament spektrosko¬ 
pii. Zanim jednak przejdziemy do omawiania tego 
oddziaływania i obserwacji jego konsekwencji, przy¬ 
pomnimy krótko pewne podstawowe wiadomości 
dotyczące promieniowania elektromagnetycznego. 


Promieniowanie elektromagnetyczne 

Zacznijmy od przypomnienia, że promieniowanie 
elektromagnetyczne można opisywać dwojako: jako 
falę i jako strumień fotonów. Fala elektromagnetycz¬ 
nato rozchodząca się w przestrzeni i w czasie 
własności spójna zmiana pola elektrycznego i magnetycznego, 
falowe Fali takiej, jak każdej fali, można przyporządkować 
długość X i częstość v; obie te wielkości są ze sobą zwią¬ 
zane zależnością: 

X = c/y, 

gdzie c jest prędkością rozchodzenia się fali. 

Widmo promieniowania elektromagnetycznego, 
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tzn. zakres długości fal obejmujący promieniowanie 
elektromagnetyczne jest olbrzymi. Jednak z punktu wi¬ 
dzenia spektroskopii molekularnej zakres ten jest sto¬ 
sunkowo wąski, bo obejmuje fale o długościach od 
ok. 10“' m do ok. 10” 3 m. W tym obszarze mieści się 
tzw. nadfiolet i promieniowanie widzialne (światło) 
oraz podczerwień i daleka podczerwień (granicząca 
z mikrofalami). Zamiast długością fali można się po¬ 
sługiwać jej odwrotnością l/ż = y, nazywaną-liczbą 
falową; jednostką liczby falowej jest cm -1 . 


Obszar widma 

Długość fali A 
nm 

Liczba falowa v 
cm -1 

Nadfiolet (bliski) 

200-380 

50000-26300 

Widzialny 

380-780 

26300-12800 

Podczerwień 

780-3 -10* 

12800-333 

Podczerwień (daleka) 

3-10«-3 -10 5 

333-33,3 


Inny sposób opisu promieniowania elektromagne- fotony 
tycznego polega na traktowaniu go jako strumienia 
cząstek — fotonów, pozbawionych wprawdzie masy 
spoczynkowej, ale niosących ze sobą ściśle określoną 
energię, 

E = hv\ 

gdzie v jest wspomnianą wyżej częstością, a h — stałą 
Plancka. 

Promieniowaniu o danej długości fali można przy¬ 
porządkować ściśle określoną energię. Energię tę 
można obliczyć korzystając z przytoczonych do tej 
pory zw-iązków (np. promieniowaniu o długości fali 
/. = 400 nm, odpowiada energia 293,2 kJ/mol). 


Cząsteczka, promieniowanie, widma 

Kiedy kwant promieniowania elektromagnetycz- warunek 
nego — foton, pada na cząsteczkę, może być przez Bohra 
nią pochłonięty. Warunek, który muszą spełniać 
cząsteczka i foton jest prosty: 

AEnm = En—Em = hv, 

tzn. energia jaką niesie ze sobą foton musi pasować 
do różnicy energii AE 1im pomiędzy stanami energe¬ 
tycznymi m i n cząsteczki. Warunek ten nosi nazwę 
w-arunku Bohra. 

Jeżeli warunek Bohra jest spełniony, to promie- absorpcja 
niowanie może zostać pochłonięte — mamy do czynie- i emisja 
nia z procesem absorpcji promieniowania. Cząsteczka 
przechodzi wtedy do stanu o wyższej energii, lub jak 
mówimy — zostaje wzbudzona. Możliwy jest również 
proces odwrotny. Wzbudzona cząsteczka może po¬ 
wrócić do stanu niższego, a nadmiar energii zostaje 
wysłany przez nią w postaci kwantu promieniowania, 
o częstości (i długości fali) określonej warunkiem 
Bohra.Taki proces nazywa się emisją. 

Warunek Bohra określa, jakie promieniowanie 
(o jakiej energii, długości fali) może być absorbowane 
lub emitowane przez cząsteczkę, nie jest to jednak 
jedyny warunek określający prawdopodobieństwo 
zachodzenia aktów absorpcji i emisji. Istnieją jeszcze 
inne warunki, które musi spełniać cząsteczka i pro¬ 
mieniowanie i o nich będziemy dokładniej mówili 
w następnych rozdziałach. 

(Z tego, co powiedziano wyżej, wynika, że jeżeli 
padające na cząsteczkę promieniowanie nie spełnia 
warunku Bohra, to nie może zostać przez nią zaabsor¬ 
bowane. Nie jest to zupełnie prawdziwe, gdyż znane są 
procesy, w których takie promieniowanie może być 
absorbowane. Należy do nich dwu- i wielofotonow-a 
absorpcja promieniowania; -> Optyka nieliniowa). 

Jeżeli na układ cząsteczek pada promieniowanie 
o różnych długościach fal, to może się zdarzyć, że 
dla niektórych z tych długości będzie spełniony wa¬ 
runek Bohra (i inne dodatkowe warunki). Promie¬ 
niowanie o takich długościach fali będzie przez 
cząsteczki układu absorbowane, przy czym z reguły 
absorpcja ma różne natężenie dla promieniowania 








widmo o różnych długościach fali (np. dlatego, że obsadzenie 
absorpcyjne różnych stanów jest różne). Jeżeli potrafimy prześle¬ 
dzić i zarejestrować zmiany natężenia absorpcji 
w funkcji długości fali absorbowanego promieniowa¬ 
nia, to uzyskany przez nas w ten sposób obraz jest tzw. 
widmem absorpcyjnym badanych cząsteczek. Podob¬ 
nie, jeżeli padające promieniowanie wzbudza cząstecz¬ 
ki i wzbudza je do różnych stanów, to cząsteczki po¬ 
zbywając się ‘energii wzbudzenia mogą ją emitować 
w postaci promieniowania, przy czym natężenie tej 
widmo emisji może być dla różnych długości fal różne (o tym, 
emisyjne co decyduje o natężeniu emitowanego, promienio¬ 
wania, będziemy jeszcze szczegółowo mówili). Jeżeli 
teraz potrafimy zmierzyć natężenie emitowanego 
promieniowania w funkcji długości fali, to otrzymamy 
widmo emisyjne. 

Widma mogą być obserwowane dlatego, że energia 
promieniowania jest pochłaniana (bądź wysyłana) 
przez cząsteczkę. Absorpcja promieniowania wywołu¬ 
je przejścia pomiędzy odpowiednimi stanami cząstecz¬ 
ki. Jeżeli z absorpcją taką wiążą się przejścia po¬ 
między różnymi stanami rotacyjnymi cząsteczki, to 
odpowiednie widmo absorpcyjne nazywa się widmem 
rotacyjnym. Jeżeli są to przejścia pomiędzy stanami 
oscylacyjnymi, to odpowiednie widmo nosi nazwę wid¬ 
ma oscylacyjnego. I wreszcie w wypadku przejść po¬ 
między stanami elektronowymi — obserwujemy wid¬ 
mo elektronowe. 

Warunek Bohra łączy ze sobą energię promienio¬ 
wania i energię stanów cząsteczki, a ściślej różnicę 
energii pomiędzy różnymi stanami — zwaną często 
energią przejścia. Wiemy już, jakiego rzędu są różnice 
energii dla różnych rodzajów stanów energetycznych 
cząsteczki, a więc jakiego rzędu jest odpowiednia 
energia przejść, a tym samym, jaka musi być energia 
promieniowania, żeby mogło ono spowodować przej¬ 
ścia pomiędzy odpowiednimi stanami (znaleźć ją mo¬ 
żemy korzystając z danych przytoczonej poprzednio 
tabeli i pamiętając, że E = hv = hej)). Jeżeli porów¬ 
namy energię przejść z energią promieniowania elek¬ 
tromagnetycznego, to stwierdzimy, że: widma rota¬ 
cyjne leżą w dalekiej podczerwieni, widma oscyla¬ 
cyjne — w obszarze podczerwieni, a widma elektro¬ 
nowe— w obszarze widzialnym i nadfiolecie, 
prawo Jak w praktyce przebiega określanie natężenia 
Beera absorpcji, a więc i badanie widma absorpcyjnego? 
Pochłanianie promieniowania przez układ cząsteczek 
(nazywa się taki układ po prostu próbką badaną) 
opisuje prawo Beera. Z prawa tego wynika, że pa¬ 
dające na próbkę promieniowanie, określonej długo- 



Rys. 2. Osłabienie wiązki światła przechodzącej przez ośrodek 
pochłaniający światło 


ści fali A, ulega w miarę wnikania w głąb próbki (np. 
na odległość d) stopniowemu osłabieniu (rys. 2), 
zgodnie z równaniem 

i = r 0 c~ tlCiCi , 

gdzie I jest natężeniem promieniowania po przejściu 
przez próbkę o grubości d , J 0 — natężeniem promie¬ 
niowania padającego na próbkę, c — stężeniem czą¬ 
steczek pochłaniających promieniowanie w próbce, 
a kx — tzw. współczynnikiem absorpcji, charaktery¬ 
stycznym dla badanych cząsteczek. Logarytmując 
obie strony tego równania można je przedstawić w do¬ 
godniejszej postaci: 

D = log A = k' x cd, k\ = 0,4343 k x ; 

D nosi nazwę gęstości optycznej. Jak widać, jest to 


wielkość proporcjonalna do stężenia cząsteczek 
i grubości próbki. Jeżeli stężenie próbki podawane 
jest w molach na litr, a grubość w centymetrach, to 
wówczas prawo Beera można zapisać następująco: 

D — ex-cd. 

Nowy współczynnik absorpcji ex nazywa się teraz 
molowym współczynnikiem absorpcji, albo współ¬ 
czynnikiem ekstynkcji (lut) po prostu ekstynkcją). 

W praktyce więc badanie widma absorpcyjnego po¬ 
lega na wyznaczaniu gęstości optycznej lub współ¬ 
czynnika ekstynkcji s w funkcji długości fali (lub 
liczby falowej v = 1/A). 

Sama idea takiego pomiaru jest prosta — ilustruje metody 
ją rys. 3. Podstawowe elementy układu pomiarowego pomiaru 
to źródło promieniowania, układ dyspersyjny (mo- widm 
nochromator) i detektor promieniowania. Źródło pro¬ 
mieniowania wytwarza promieniowanie o różnych 



rejestrujących 
i pomiarowych 

Rys. 3. Schemat układu do badania widm absorpcyjnych: Z 
źródło promieniowania, Af element dyspersyjny (pryzmat, siat¬ 
ka), P — badana próbka D detektor (fotopowielacz, fotoopór, 
klisza fotograficzna, itp.), S pomocnicze elementy optyczne (so¬ 
czewki, lustra itp.). Promieniowanie przetworzone na sygnał (np. 
elektryczny, zaczernienie kliszy fotograficznej itp.) przekazywany 
jest z detektora do dalszej obróbki, której celem jest jego pomiar 
i ewentualnie rejestracja 

długościach fal (na ogół tylko z pewnego obszaru wid¬ 
ma). Z promieniowania tego układ dyspersyjny wy¬ 
dziela promieniowanie o odpowiedniej długości fali. 

Promieniowanie to przechodzi przez badaną próbkę 
i jest w niej pochłaniane, w mniejszym lub większym 
stopniu, bądź też przechodzi przez nią bez pochła¬ 
niania. Trafia ono następnie do detektora promienio¬ 
wania, którego zadaniem jest wykryć je i przetworzyć 
w taki sposób, żeby można było określić jego natęże¬ 
nie, a tym samym wyznaczyć, jaka ilość promienio¬ 
wania została w próbce zaabsorbowana. 

Idea układu pomiarowego jest prosta, ale przy jego 
praktycznej realizacji występują pewne komplikacje. 

Wiążą się one z tym, że różnym rodzajom widm (rota¬ 
cyjnym, oscylacyjnym i elektronowym) odpowiada 
inny obszar widma (daleka podczerwień, podczer¬ 
wień, obszar widzialny i nadfiolet). A każdy z tych 
obszarów wymaga stosowania innych źródeł, elemen¬ 
tów dyspersyjnych i detektorów. Nie ma np. takich 
źródeł, które dawałyby promieniowanie o dostatecz¬ 
nie dużym natężeniu dla celów praktycznych w całym 
zakresie widma. Trzeba wobec tego stosować różne ^ 
źródła przy badaniu różnych obszarów widmowych. c> 1 1 e " 

Do badań w nadfiolecie używa się np. lamp wodoro- tek tory pro- 
wych, w obszarze widzialnym — lamp żarowych, miemowama 
a w podczerwieni — źródeł cieplnych (globarów). 

Podobnie elementy dyspersyjne — przede wszystkim 
pryzmaty, właściwe dla różnych obszarów widma, 
muszą być wykonywane z różnych materiałów, np. z 
kwarcu do badań w nadfiolecie, z soli kamiennej do 
badań w podczerwieni. Wreszcie detektory promienio¬ 
wania, dobre do odbioru promieniowania z jednego 
obszaru widma, mają z reguły zbyt małą czułość do 
odbioru promieniowania z innego obszaru, np. dla 
nadfioletu i obszaru widzialnego stosuje się jako dete¬ 
ktory fotopowielacze, a do badań w podczerwieni 
— termoelementy. 
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Różnice w stosowanych materiałach optycznych 
i metodach wytwarzania i detekcji promieniowania 
sprawiają, że układy pomiarowe do badania widm 
absorpcyjnych (tzw. spektrometry i spektrofotome¬ 
try) są w zasadzie budowane z przeznaczeniem do 
pracy w określonym obszarze widma, np. w podczer¬ 
wieni. Tym samym nadają się one przede wszystkim 
do badania jednego, określonego typu widm, np. 
widm oscylacyjnych. Nie będziemy głębiej wnikali 
w różnego rodzaju rozwiązania konstrukcyjne, wła¬ 
ściwe dla spektrofotometrów przeznaczonych do pra¬ 
cy w określonych obszarach widmowych. Czytelnika 
zainteresowanego problemami aparaturowymi od¬ 
syłamy do podręczników spektroskopii i monografii. 


Widma oscylacyjne t rotacyjne 
cząsteczek 

Krystyna Szczepaniak 

Oscylacje atomów wchodzących w skład cząsteczek 
oraz rotacja całej cząsteczki powodują absorpcję, 
emisję i rozproszenie promieniowania elektromagne¬ 
tycznego, a więc pojawienie się widm absorpcji, 
emisji i rozproszenia. W praktyce spektroskopowej 
badane są zwykle oscylacyjne i rotacyjne widma ab¬ 
sorpcji i widma rozproszenia ramanowskiego. 


Widma rotacyjne 


Badania widm rotacyjnych przyczyniają się skutecznie 
do wyznaczania rozmiarów i kształtu cząsteczek 
w fazie gazowej. Podstawowym warunkiem powstania 
widma rotacyjnego absorpcyjnego (inaczej mówiąc 
główną regułą wyboru) jest posiadanie przez cząstecz¬ 
kę trwałego dipolowego momentu elektrycznego, tj. 
takiego rozkładu ładunków, przy którym środki cięż¬ 
kości ładunków dodatnich i ujemnych nie pokrywają 
się. Miarą momentu dipolowego pi jest iloczyn ładun¬ 
ku q i odległości r między środkami ciężkości ładun¬ 
ków dodatnich i ujemnych: p = q-r. Trwały moment 
dipolowy mają dwuatomowe cząsteczki złożone z róż¬ 
nych atomów, np. HC1, CO, NO, oraz wiele cząste¬ 
czek wieloatomowych, jak np. HCN, H 2 0, HCC1 3 . 
Cząsteczki nie mające trwałego momentu dipolowego, 
takie jak np. H 2 , N 2 , Cl 2 , C0 2 , CH 4 , rotując nie po¬ 
chłaniają promieniowania elektromagnetycznego, 
a więc nie dają one absorpcyjnego widma rotacyjnego. 
Cząsteczki takie mogą natomiast rozpraszać promie¬ 
niowanie elektromagnetyczne dając rotacyjne widmo 
rozpraszania ramanowskiego. Powstawanie tego wid¬ 
ma związane jest z nietrwałym momentem dipolo¬ 
wym indukowanym w cząsteczce przez fale elektroma¬ 
gnetyczne. 

Omawianie ruchów rotacyjnych cząsteczek roz¬ 
poczniemy od najprostszych cząsteczek — cząsteczek 
dwuatomowych. Pozwoli nam to zrozumieć podsta¬ 
wowe cechy widma rotacyjnego bez wprowadzania 
dodatkowych komplikujących elementów, które po¬ 
jawiają się przy omawianiu bardziej złożonych czą¬ 
steczek. Początkowo zajmiemy się rotacją, nie uwzglę¬ 
dniając faktu, że atomy w cząsteczce jednocześnie 




Rys. 4. Model cząste¬ 
czki dwuatomowej/4 i? 
obracającej się wokół 
osi prostopadłej do 
wiązania 


Najprostszym modelem, który pomaga w zrozumie¬ 
niu i wyjaśnieniu podstawowych cech widma rotacyj¬ 
nego, jest cząsteczka złożona z dwóch atomów A 
i B o masach mA i ms znajdujących się w stałej odle¬ 
głości r 0 od siebie (rys. 4). Model taki nosi nazwę 
sztywnego rotatora. Gdy cząsteczka obraca się wokół 
osi prostopadłej do linii łączącej oba atomy i prze¬ 
chodzącej przez środek ciężkości O, jej energia kine¬ 
tyczna określona jest przez moment bezwładności / 
i prędkość kątową co : 


cząsteczka 
jako sztywny 
rotator 


£kin = \l<O z . 


Moment bezwładności 

/ = mA(r 0 -x) 2 -{-mBX 2 , 


gdzie x jest odległością atomu B od środka ciężkości. 
Położenie środka ciężkości można wyznaczyć z rów¬ 
nania mA(r 0 —x) = mBX y skąd x = mAr 0 l(mA+m B ). 
Podstawiając wartość * do wyrażenia określającego 
moment bezwładności I otrzymuje się, po prostych 
przekształceniach. 


/ = 


mATTtB 

niA+mB 


rl = Mrl 


Wyrażenie M = mA mBUmA+ms) nazywamy masą 
zredukowaną. Omawiany ruch rotacyjny jest zagad¬ 
nieniem dobrze znanym w mechanice. Potrafimy rów¬ 
nież rozwiązać równanie falowe Schródingera dla ta¬ 
kiego ruchu (-► Chemia kwantowa). Otrzymane w ten 
sposób wartości energii układu wyraża się wzorem 

gdzie J jest kwantową liczbą rotacyjną, która może kwantowa 
przyjmować tylko całkowite wartości lub 0 (/ = 0, liczba 
1,2,3,...). rotacyjna 

Wyrażenie h 2 l$n 2 Mrg zwane jest stałą rotacyjną 
i oznaczone literą B. Przejściami między poziomami 
rotacyjnymi rządzi reguła wyboru, która mówi, że 
przy absorpcji dozwolone są tylko te przejścia, w wy¬ 
niku których kwantowa liczba rotacyjna zmienia się 
o ± 1 (AJ = ± 1). Zgodnie z tą regułą zmiana energii 
cząsteczki przy absorpcji wynosi 

AE t ot = Ej+i — Ej = 2B(JĄ-X). 

Jak wynika z tego wzoru w miarę wzrostu J odle¬ 
głości między poziomami są coraz większe. Schemat 
poziomów energii rotacyjnej cząsteczki dwuatomowej 


5-- 

f 1 

4£=10£ 

3 

AE=8B 


1 J£= 6B 

„ \ae=ab 

0 -- 



Rys. 5. Schemat poziomów energetycznych i widmo rotacyjne 
cząsteczki dwuatomowej (rotatora sztywnego) 


wykonują ruch oscylacyjny. Jak się okaże, pominięcie 
oscylacji nie wpływa istotnie na większość cech wid¬ 
ma rotacyjnego. 


przedstawia rys. 5. W dolnej części rysunku pokazane 
są linie rotacyjne odpowiadające przejściom między 
kolejnymi poziomami rotacyjnymi. Liczby falowe ko- 
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lejnych linii są v 0 i = v 12 = 4 B, = 6B itd., a od¬ 

ległość między liniami Av jes stała i równa 2 B. 
Mierząc tę odległość możemy wyznaczyć stałą B , 
a następnie moment bezwładności i odległość r 0 . 

Z tak prostym sposobem ustalania rozmiarów czą¬ 
steczek na podstawie pomiarów spektroskopowych 
mamy do czynienia tylko w przypadku cząsteczek 
cząstka jako dwuatomowych. I dla nich zresztą przyjęliśmy niezu- 
rotstcr pełnie prawidłowy model sztywnego rotatcra. 
mesztywny Dokładne badania linii widma rotacyjnego wyka¬ 

zują, że odległości między liniami maleją dla więk¬ 
szych wartości /. Przyczyną tego jest fakt, że czą¬ 
steczka pobudzona do wyższych stanów rotacyjnych 
obraca się prędzej i wiązanie nieco się rozciąga pod 
wpływem siły odśrodkowej. Wskutek tego moment 
bezwładności wzrasta, a odległości między liniami ma¬ 
leją. Konieczne jest zatem wprowadzenie pewnej po¬ 
prawki do wyrażenia na energię: 

Erot = 

Stałą D = 4B 3 /<» 2 nazywa się stałą odkształcenia od¬ 
środkowego. Jest ona około dziesięciu tysięcy razy 
mniejsza niż B; dla małych wartości J możemy więc 
pominąć drugi składnik wyrażenia, 
cząsteczki Podane wyżej wzory określające stany energii ro- 
wieloatomo- tacyjnej cząsteczek dwuatomowych stosują się rów- 
we liniowe nież do liniowych cząsteczek wieloatomowych. Od 
razu jednak napotykamy pewne trudności, które ilu¬ 
struje przykład cząsteczki trójatomowej 0=C=S. 
Cząsteczka ta ma dwa wiązania, lecz tylko jeden mo¬ 
ment bezwładności. Problem możemy rozwiązać ba¬ 
dając dwie cząsteczki, w skład których wchodzą różne 
izotopy siarki: 1C 0 12 C 32 S oraz 16 O la C 34 S. Zakłada 
się, że dla obu odmian cząsteczki długości wiązań są 
takie same. Każdej z odmian cząsteczki odpowiada 
nieco inne widmo rotacyjne, możemy więc wyznaczyć 
dwa momenty bezwładności i znaleźć długości obu 
wiązań cząsteczki. 

cząsteczki Sytuacja jest bardziej złożona, gdy mamy do czy- 
wieloato- nienia z cząsteczkami wieloatomowymi nieliniowymi. 

mowę Rozróżniamy wówczas trzy typy ruchu rotacyjnego 
nieliniowe w zależności od stosunków trzech głównych momen¬ 
tów bezwładności Ia, Ib , Ic względem trzech wzajem¬ 
nie prostopadłych osi związanych z cząsteczką: 

a) Do pierwszego typu należą cząsteczki o nejwyż- 
szej symetrii, np. cząsteczki o tetraedrycznym lub 
oktaedrycznym rozkładzie atomów, takie jak np.: 




bąk sferyczny W cząsteczkach takich wszystkie trzy momenty bez¬ 
władności są sobie równe Ia — Ib = Ic . Ten typ 
cząsteczki nazywa się bąkiem sferycznym. Cząsteczki 
tego typu nie mają trwałego momentu dipolowego, 
fji = 0, zatem model ten jest nieinteresujący dla ab¬ 
sorpcyjnej spektroskopii rotacyjnej. 

b) Do drugiej grupy należą cząsteczki, dla których 
dwa spośród trzech momentów bezwładności są sobie 
równe Ia = Ic * Ib. Przykładem takich cząsteczek 
mogą być NH 3 i CHG 3 : 


N 

H 

Cl 




Rozwiązując równanie falowe dla sztywnego bąka 
symetrycznego otrzymuje się 

Erot = AJ{J+\)-(A-B)K\ 


A W!a ’ B 8jt 2 Ib ’ 

Trzeba było wprowadzić dwie liczby kwantowe / i K, 
ponieważ dla symetrycznego bąka występują dwa ro¬ 
dzaje obrotów. Liczba kwantowa / opisuje obrót 
wokół osi prostopadłej do jedynej osi symetrii, a licz¬ 
ba kwantowa K —obrót cząsteczki wokół osi symetrii. 
Obrót cząsteczki typu bąka symetrycznego wokół osi 
symetrii nie powoduje zmiany momentu dipolowego, 
a tym samym pojawienia się widma absorpcyjnego. 
Nic więc dziwnego, że reguła wyboru dla liczby kwan¬ 
towej K brzmi AK = 0. Reguła wyboru dla liczby 
kwantowej / jest taka sama, jak dla cząsteczek dwu¬ 
atomowych i liniowych AJ — ± 1. Ze względu na te 
reguły wyboru różnica energii między dwoma kolej¬ 
nymi poziomami rotacyjnymi cząsteczki tego typu 
wyrażona jest wzorem: 

AErot = 22?(/+l). 

Wyrażenie to jest identyczne z wyrażeniem dla czą¬ 
steczek liniowych. Podobnie jak w wypadku cząste¬ 
czek liniowych, stosując podstawienie izotopowe wy¬ 
znacza się na podstawie widma momenty bezwładno¬ 
ści, a następnie parametry określające strukturę czą¬ 
steczki. W tabeli na następnej stronie podane są dłu¬ 
gości wiązań i kąty między wiązaniami dla kilku czą¬ 
steczek typu bąka symetrycznego wyznaczone za po¬ 
mocą widm rotacyjnych. 

c) Cząsteczki, które mają trzy różne momenty bez¬ 
władności I A * Ib * Ic , należą do trzeciej grupy, 
zwanej bąkiem niesymetrycznym. Do grupy tej należą 
cząsteczki o najniższej symetrii lub całkowicie niesy¬ 
metryczne np. H 2 0, CH a OH, CH 2 BrCl: 



Poziomy energii rotacji takich cząsteczek nie mogą 
być wyrażone za pomocą jednego ogólnego równania, 
tak jak poziomy energii cząsteczek opisanych wyżej. 
Każdą cząsteczkę należy traktować oddzielnie. Utrud¬ 
nia to bardzo obliczenia, mimo tego zrobiono duże 
postępy w interpretacji wielu złożonych widm rota¬ 
cyjnych. niektórych prostych cząsteczek typu bąka 
niesymetrycznego, szczególnie tych, dla których dwa 
momenty bezwładności mają zbliżone wartości. Dla 
niektórych płaskich cząsteczek, jak np. H 2 0, wyzna¬ 
czono z widm trzy momenty bezwładności. Tabela 
przedstawia wyniki analizy widma rotacyjnego kilku 
małych cząsteczek typu bąka niesymetrycznego. 

Wszystko co dotychczas powiedzieliśmy o rotacji, 
dotyczyło cząsteczek swobodnych, z jakimi mamy do 
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Struktura cząsteczek typu bąka symetrycznego wyznaczona metodami spektroskopii rotacyjnej 



Struktura cząsteczek typu bąka niesymetrycznego wyznaczona metodami spektroskopii rotacyjnej 


Cząsteczka Struktura (długości wiązań. A) 


Cząsteczka 


Struktura (długości wązań. A) 


HNCO 


HNCS 


HCHO 


H 


128 ° 5 ' 

N=±=C= 


1,207 1,171 


H 


' 0 \ 130 ° 15 ' 

Ni ——I , c= 


1,216 1,561 


H 


118 ' 

H 




1,21 

C ... =Q 


CH.OH 


CH»SH 



c,h 4 o 


^ W2 ^ 
-C- : -C 


\ 


H 

/Aiie^i' 

;■-*-h 

1,082 


O 


czynienia w gazie przy niezbyt wysokich ciśnieniach. 
Pizy wysokich ciśnieniach w gazach, a zwłaszcza 
rotacja w fazach skondensowanych (cieczach i ciałach sta- 
w fazach łych), rotacja cząsteczek jest prawie zawsze mniej lub 
skorcdon- bardziej hamowana w wyniku oddziaływań między- 
scwanych cząsteczkowych. Energia większości oddziaływań mię- 


dzycząsteczkowych jest bowiem tego rzędu wielkości 
(4-40 kJ/mol) co energia rotacji. Z tego powodu 
ciecze i ciała stałe nie mają widma rotacyjnego. Wy¬ 
jątek stanowią cząsteczki zamrożone lub rozpuszczo¬ 
ne w gazach szlachetnych, takich jak argon, krypton 
czy ksenon. W gazach szlachetnych bowiem oddzia- 
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ły wania międzycząsteczkowe są tak słabe, że cząstecz¬ 
ki znajdujące się w stałym i ciekłym roztworze gazu 
szlachetnego w temperaturze 4 K i 20 K mogą wyko¬ 
nywać prawie swobodną rotację. Badaniami tego typu 
zamrożonych roztworów zajmuje się na świecie wiele 
laboratoriów naukowych. 


Widma oscylacyjne 


wiązując równania ruchu takiego układu w przybli¬ 
żeniu klasycznym: 


d dT dU 
dl dq dq 


= 0, 


gdzie T jest energią kinetyczną 1 UMq Ł J q = dąjdt , 
XJ — energią potencjalną {U = kq 2 ), otrzymuje się 
częstość drgań oscylatora harmonicznego 


warunek 
zmiany mo¬ 
mentu dipo¬ 
lowego 


cząsteczka 

dwuatomowa 


Zajmiemy się teraz oddziaływaniem cząsteczek z pro¬ 
mieniowaniem elektromagnetycznym o większej ener¬ 
gii, a mianowicie promieniowaniem podczerwonym, 
wzbudzającym oscylacje atomów w cząsteczce. Aby 
cząsteczka mogła mieć absorpcyjne widmo oscylacyj¬ 
ne, konieczne jest by drganie wywoływało zmianę jej 
momentu dipolowego. W przypadku dwuatomowych 
cząsteczek, od których zaczniemy nasze rozważania, 
wymaganie to sprowadza się do tego, by cząsteczka 
składała się z dwu różnych atomów. Gdybyśmy chcieli 
się zająć, tak jak w przypadku rotacji, cząsteczkami 
w fazie gazowej, to napotykalibyśmy dodatkowe 
trudności. Otóż wzbudzając oscylacje promieniowa¬ 
niem podczerwonym powoduje się zmiany nie tylko 
energii oscylacyjnej, ale również mniejszej od niej 
energii rotacyjnej cząsteczki. Tej kombinacji równo¬ 
czesnego wzbudzenia oscylacji i rotacji można unik¬ 
nąć badając cząsteczki w cieczach lub roztworach, 
w których jak już mówiliśmy, oddziaływania między- 
cząsteczkowe hamują rotację. Oczywiście oddziały¬ 
wania te zmieniają również oscylacje, ale zmiany te 
nie są duże, gdyż energia większości oddziaływań 
międzycząsteczkowych jest znacznie mniejsza od ener¬ 
gii oscylacji. 

Omawianie ruchu oscylacyjnego zaczniemy od naj¬ 
prostszej cząsteczki dwuatomowej, którą można trak¬ 
tować, jak dwie masy połączone sprężyną (rys. 6). 


rrtA 


a) 


m A m B 

b) "*T 


m A m B 





Rys. 6. Model cząsteczki dwu¬ 
atomowej 



gdzie M jest znaną nam już masą zredukowaną oscy¬ 
latora, zaś k — stałą siłową. 

Harmoniczny charakter ruchu atomów w cząstecz¬ 
ce wynika również z dokładniejszych rozważań kwan- 
towomechanicznych (-> Chemia kwantowa). Energia energia po- 
potencjalna cząsteczki, w najprostszym przypadku tencjalna 
cząsteczki dwuatomowej, zależy od sił przyciągania 



Rys. 7. Krzywa energii potencjalnej cząsteczki dwuatomowej. 
Grubą linią niebieską oznaczono przybliżenie paraboliczne w po¬ 
bliżu minimum. De energia dysocjacji względem minimum krzy¬ 
wej energii potencjalnej; r e odległość w stanie równowagi 


ładunków o różnych znakach i od sił odpychania 
ładunków o jednakowych znakach. Przyjmuje ona 
postać taką, jak na rys. 7. Krzywą taką można naj¬ 
ogólniej opisać za pomocą szeregu potęgowego 


U= U 0 +U 1 q+U 2 g*+ ... 


Gdy sprężyna nie jest rozciągnięta ani ściśnięta, jej 
długość wynosi r e (rys. 6a). Przy tej odległości układ 
jest w równowadze. Podczas rozciągania sprężyny 
pojawia się siła sprężysta F działająca w kierunku 
przeciwnym do rozciągania (rys. 6b), która kieruje 
masy mA i wjb z powrotem do stanu równowagi. 
Atomy mijają jednak stan równowagi i przekraczają 
odległość r e , powodując ściśnięcie sprężyny i pojawie¬ 
nie się siły F skierowanej przeciwnie do kierunku 
ruchu (rys. 6c). Pod wpływem tej siły następuje po¬ 
nownie powrót do stanu równowagi. Ruch taki po¬ 
wtarza się tak długo, aż energia włożona w pierwsze 
rozciągnięcie sprężyny zamieni się na skutek tarcia 
w energię cieplną. Zgodnie z prawem Hooke’a siła F 
jest proporcjonalna do wychylenia mas z położenia 
równowagi: 

F = —k(r—r e ); 

r jest odległością drgających mas w danej chwili, a r e 
ich odległością w stanie równowagi. Współczynnik" 
proporcjonalności k nazywa się stałą siłową oscyla¬ 
tora. Znak minus pochodzi stąd, że siła Fjest skiero¬ 
wana przeciwnie do wychylenia r — r e . Ruch pod 
cząsteczka wpływem siły proporcjonalnej do wychylenia jest 
jako ruchem harmonicznym, a potencjał dla takiego ruchu 
oscylator ma kształt paraboliczny: U = kq* y gdzie jest wy- 
harmoniczny chyleniem z położenia równowagi {q = r—/>). Roz- 


gdzie Ui = (1 jn\) (d n Ujdq n ) Q _ 0 są zależne od kolejnych 
pochodnych funkcji energii potencjalnej w punkcie 
q = 0. Gdy wychylenia atomów z ich położeń rów¬ 
nowagi są małe, tzn. gdy znajdujemy się w pobliżu 
minimum krzywej energii potencjalnej, możemy 
w przybliżeniu przyjąć, że krzywa potencjalna ma po¬ 
stać U — Uq+ U l q J r U 2 q 2 . Przyjmując U 0 z a zero ukła¬ 
du oraz biorąc pod uwagę fakt, że ( dU/dq) q . 0 = 0 
w punkcie odpowiadającym minimum, otrzymamy na 
energię potencjalną wyrażenie U = i(d 2 Ujdq z ) Qr0 q 2 . 

W tym przybliżeniu krzywa energii potencjalnej jest 
więc parabolą. 

Rozwiązanie równania falowego Schródingera dla 
oscylatora harmonicznego daje energię skwantowa- 
nych poziomów 

E = hv 0 (v-H), 

gdzie v 0 jest tą samą częstością, jaką o trzym uje się oscylacyjna 
z -rozwiązań klasycznych, v 0 = (1/2 ti) j/ k/M , v jest liczba 
oscylacyjną liczbą kwantową, która może przybierać kwantowa 
wartości 0,1, 2,... Jak wynika ze wzoru, energia oscy¬ 
lacji na poziomie v = 0 jest różna od zera i wynosi 
\hv 0 . Oznacza, to, że w żadnych warunkach, nawet 
w temperaturze zera bezwzględnego, oscylacje ato¬ 
mów nie ustają. Ten zasób energii oscylacyjnej, której 
cząsteczka nie może się pozbyć, nazywamy zerowa 
energią oscylacji. 
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anharmo- 
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Porównując wyniki przeprowadzonych poprzednio 
rozważań klasycznych dotyczących sił działających 
na atomy w cząsteczce z wynikami rozważań kwant o- 
womechanicznych widzimy, że wprowadzona po¬ 
przednio stała siłowa k wiąże się z drugą pochodną 
przybliżonej funkcji opisującej energię potencjalną, 



Jak wiadomo, energia ruchu elektronów i jąder 
w cząsteczce jest skwantowana. Przejściami między 
różnymi stanami energii oscylacyjnej rządzi reguła 
wyboru Av — ±1. Odległość między sąsiednimi po¬ 
ziomami, określająca częstość linii w widmie oscyla¬ 
cyjnym, wyraża się wzorem 

AE = Ev+i—E v = hv 0 . 

Rys. 8 przedstawia schemat poziomów oscylacyjnych 
cząsteczki HC1 w przybliżeniu harmonicznym. Wy¬ 
znaczając częstość oscylacji, możemy więc wyznaczyć 
stałą siłową. W tabeli zestawiono dane charakteryzu¬ 
jące niektóre cząsteczki dwuatomowe. 



Rys. 8. Krzywa energii potencjalnej i schemat poziomów ener¬ 
getycznych cząsteczki dwuatomowej w przybliżeniu- oscylatora 
harmonicznego (linia niebieska). Linią czarną zaznaczono krzywą 
energii bez uwzględnienia przybliżenia oscylatora harmonicz¬ 
nego; D 0 spektroskopowa energia dysocjacji 


Dane charakteryzujące oscylacje cząsteczek 
dwuatomowych 


Cząsteczka 


Częstość 
oscylacji cm' 


Stała siłowa 
N/cm 


HF 

3958 

HC1 

2886 

HBr 

255*8 

HJ 

2233 

CO 

2155 

NO 

1 877 

NaCl 

378 


8,8 

4,84 

3,78 

2,89 

18,6 

15,4 

1,2 


Przybliżenie oscylatora harmonicznego stosuje się 
dla niższych poziomów energetycznych. Gdy wzbu¬ 
dzone są wyższe poziomy oscylacyjne (patrz rys. 8), 
pojawia się czynnik nieharmoniczny w potencjale 
w postaci U = U^q 2j rU z q z . Taka zmodyfikowana po¬ 
stać funkcji energii potencjalnej prowadzi do nastę¬ 
pującego wyrażenia na energię stanów oscylacyjnych: 

E = ńv 0 (v+£) — xhv Q (v+\y% 

gdzie x jest stałą anharmoniczności. 

Anharmoniczność pociąga za sobą pewne ważne 
następstwa. Po pierwsze odległości między poziomami 
oscylacyjnymi stają się coraz mniejsze, w miarę jak 
rośnie oscylacyjna liczba kwantowa. Mierząc stop¬ 
niowe zmniejszanie się tych odległości, możemy zna¬ 
leźć wartość x , a stąd wartość spektroskopowej energii 
dysocjacji D 0 = iv 0 (l—£ jc) (rys. 8.) Po drugie nie 


obowiązuje już reguła wyboru Av = ±1, lecz dozwo¬ 
lone są również przejścia, dla których Av = ± 2, 

±3,... Widmo składa się więc nie z jednego pasma 
podstawowego, jak to ma miejsce w przypadku oscy¬ 
latora harmonicznego, lecz z pasma podstawowego 
i z szeregu pasm harmonicznych, tzw. nadtonów. 

Natężenie nadtonów jest jednak o kilka rzędów wiel¬ 
kości mniejsze od natężenia pasma podstawowego. 

Dwuatomowa cząsteczka ma tylko jedną możli¬ 
wość oscylacji lub—jak to się często mówi — ma 
jeden stopień swobody. Stanowi ona jeden oscylator, 
którego widmo jest, jak widzieliśmy, bardzo proste cząsteczka 
i łatwe do interpretacji. Znacznie bardziej skompli- wietoato- 
kowana jest sytuacja w cząsteczce zawierającej więcej mowa 
atomów. Cząsteczkę wieloatomową możemy trakto¬ 
wać jako pewną liczbę punktów materialnych połą¬ 
czonych ze sobą sprężynami. W tym przypadku nie 
można już traktować oscylacji jako zmian długości 
pojedynczych wiązań, lecz jako równoczesny ruch 
wszystkich atomów w cząsteczce. Kiedy w cząsteczce 
wzbudzone zostaną drgania jednego wiązania, ich 
energia jest przekazywana do drugiego za pośred¬ 
nictwem wspólnego atomu: 



Rozciągnięcie wiązania AB powoduje ściśnięcie wią¬ 
zania BC. Energia potencjalna cząsteczki będzie zale¬ 
żała od wychyleń wszystkich atomów z ich położeń 
równowagi. Gdy cząsteczka składa się z AT atomów, 
to istnieje 3 N współrzędnych w trzech kierunkach 
prostopadłych x , y, z opisujących te wychylenia. We 
współrzędnych kartezjańskich xyz> opis ruchu, jaki 
wykonują wszystkie atomy w cząsteczce, jest bardzo 
skomplikowany. Niewiele upraszcza sprawę wprowa¬ 
dzenie tzw. współrzędnych naturalnych, tj. zmian 
długości wiązań i zmian kątów między wiązaniami. 

Okazuje się jednak, że można znaleźć takie współrzęd¬ 
ne, zwane współrzędnymi normalnymi, których za¬ 
stosowanie uprości bardzo opis ruchu cząsteczki, 
utożsamiając go z opisem ruchu atomów w cząsteczce 
dwuatomowej. Te niezwykle ułatwiające obliczenia 
współrzędne normalne są po prostu kombinacjami 
liniowymi współrzędnych naturalnych. 

Złożony ruch cząsteczki wieloatomowej można rozkład na 
rozłożyć na szereg ruchów harmonicznych, tzw. drgań drgania 
normalnych, opisywanych tak, jak ruch cząsteczki normalne 
dwuatomowej. Każdemu drganiu normalnemu o ener¬ 
gii Et = odpowiada częstość normalna = 

= Energia stanu podstawowego równa 

n 

Eo = ih2 v% może być bardzo duża, gdy cząsteczka 
i - 1 

zawiera wiele atomów. Do każdego drgania nor¬ 
malnego można zastosować regułę wyboru Av = ± 1 , 
obowiązującą dla oscylatora harmonicznego. 

Wiemy, że w cząsteczkach dwuatomowych drganie 
może być wzbudzone tylko wówczas, gdy moment 
dipolowy cząsteczki zmienia się przy drganiu. Uogól¬ 
niając ten wynik na przypadek drgań normalnych, 
możemy powiedzieć, że wzbudzone będą tylko te 
drgania normalne, które prowadzą do zmian momen¬ 
tu dipolowego cząsteczki. 

Zastanówmy się teraz, ile drgań normalnych może 
mieć cząsteczka wieloatomowa. Gdyby atomy two¬ 
rzące cząsteczkę były zupełnie swobodne, każdy z nich 
miałby 3 stopnie swobody ruchu postępowego w kie¬ 
runkach x , y, z, czyli N atomów miałoby 3 N stopni 
swobody. Ponieważ atomy w cząsteczce są związane, 
ruch postępowy w przestrzeni wykonuje cała cząstecz¬ 
ka. Na ten ruch przypadają 3 stopnie swobody. Po¬ 
nadto cząsteczka wykonuje rotację, na którą przypa¬ 
dają 3 stopnie swobody w cząsteczkach nieliniowych 
względem trzech prostopadłych osi i dwa stopnie swo¬ 
body w cząsteczkach liniowych (gdzie trzecia oś jest 
osią cząsteczki). Reszta stopni swobody, tj. 3 N—6 
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dla cząsteczek nieliniowych oraz 3 A—5 dla cząste¬ 
czek liniowych przypada na oscylacje. Cząsteczkę N- 
atomową możemy rozpatrywać jako 3N—6 (albo 
liczba drgań 3A— 5) oscylatorów wykonujących 3 N—6 (albo 
normalnych 3 N—5) drgań normalnych. Energia drgań każdego 
z oscylatorów jest skwantowana. Do każdego z oscy¬ 
latorów stosuje się reguły wyboru opisane poprzednio 
dla oscylatorów dwuatomowych. Nie są to jednak oscy¬ 
latory dwuatomowe, gdyż każdy atom w cząsteczce 
oddziałuje ze wszystkimi pozostałymi atomami. W os¬ 
cylatorze dwuatomowym o energii i częstości oscylacji 
decyduje siła jednego istniejącego wiązania chemicz¬ 
nego. Miarą tej siły jest stała siłowa oscylatora. 



100r 



Rys. 10. Widmo oscylacyjne H a O w roztworze w CCI 4 


W cząsteczce wieloatomowej występuje wiele takich 
sił różnie skierowanych. Prowadzą one do skompliko¬ 
wanych ruchów oscylacyjnych atomów. Rysunek 9 
pokazuje drgania normalne, a rys. 10 widmo oscyla¬ 
cyjne cząsteczki wody. Jak widać, liczba drgań nor¬ 
malnych zgodna jest z liczbą wewnętrznych stopni 
swobody 3N—6 (dla H 2 0 3 *3—6 = 3). Można by 
zapytać, na jakiej podstawie zostały wprowadzone 
na rys. 9 strzałki oznaczające kierunek ruchu atomów. 
Przy dobieraniu strzałek kierujemy się następującą 
zasadą: równoczesne wychylenie atomów z położe¬ 
nia równowagi nie może powodować przemieszczenia 
środka ciężkości cząsteczki ani jej obrotu wokół 
jakiejś osi. 

Współrzędne normalne są przeważnie złożonymi 
funkcjami wychyleń poszczególnych atomów z poło- 

O c O 



t c ♦ 


O c O 

+ - + 

o K < c o 


V 2 

Rys. 11. Drgania normalne 
cząsteczki CO s . Strzałki oz¬ 
naczają kierunki wychyleń 
atomów w płaszczyźnie ry¬ 
sunku; znaki + i — ozna¬ 
czają wychylenia atomów 
. v prostopadłe do płaszczyzny 
J rysunku 


żenią równowagi. Sytuacja jednak bardzo się uprasz- 
rola symetrii cza, gdy cząsteczka ma element symetrii. Rolę sy¬ 


metrii w układach cząsteczkowych zilustrujemy na 
podstawie współrzędnych normalnych liniowej czą¬ 
steczki COj (rys. 11). Cząsteczka CO a ma płaszczyznę 
symetrii prostopadłą do jej osi. Oznacza to, że w sta¬ 
nie równowagi C0 2 ma identyczną konfigurację po 
obydwu stronach płaszczyzny symetrii. Innym ele¬ 
mentem symetrii cząsteczki CO a jest jej oś. Obrót wokół 
tej osi o dowolny kąt nie zmienia konfiguracji układu. 
Typ symetrii z dwoma wymienionymi elementami 
symetrii oznaczamy symbolicznie gdzie D& 

odnosi się do osi symetrii nieskończonego rzędu, 
a wskaźnik h dotyczy płaszczyzny prostopadłej do tej 
osi symetrii. 

Liniowa cząsteczka CO* o symetrii D^h ma 4 
drgania normalne (3*3—5 = 4) przedstawione na 
rys. 11. Symetryczne drganie rozciągające v x nie wy¬ 
wołuje zmiany momentu dipolowego cząsteczki, po¬ 
nieważ równa się zeru, zarówno gdy cząsteczka jest 
rozciągnięta, jak też gdy jest ona ściśnięta. Drganie 
tego typu, symetryczne względem każdego elementu 
symetrii, nazywamy drganiem pełnosymetrycznym. 
Nie jest ono nigdy czynne w podczerwieni. Drganie v* 
jest drganiem deformacyjnym (cząsteczka ulega wy¬ 
gięciu — pojawia się moment dipolowy). Atomy czą¬ 
steczki CO a mogą wykonywać pełne drgania w dwóch 
prostopadłych do siebie kierunkach, przy czym czę¬ 
stość obu tych drgań jest identyczna. Takie drgania 
o identycznej częstotliwości nazywa się drganiami 
podwójnie zdegenerowanymi. Moment dipolowy wy¬ 
giętej cząsteczki CO a zmienia się podczas drgań defor- 
macyjnych od pewnej skończonej wartości dodatniej 
poprzez zero do pewnej skończonej wartości ujemnej. 
Dzięki temu cząsteczka może oddziaływać z promie- 
niowanem elektromagnetycznym, a więc drganie v* 
j est czynne w podczerwieni. Drganie v 3 jest antysyme- 
trycznym drganiem rozciągającym. Cząsteczka w koń¬ 
cowych fazach ruchu ma momenty dipolowe o prze¬ 
ciwnych znakach. Drganie v* będzie więc również 
czynne w podczerwieni. Podczas drgania v* zmieniają¬ 
cy się moment dipolowy jest zawsze równoległy do 
osi cząsteczki. 

Nieliniowa cząsteczka H*0 należy do grupy syme¬ 
trii C 2y . Oznacza to, że ma ona oś symetrii drugiego 
rzędu, tzn. obrót wokół tej osi o kąt 180° (360°: 2) nie 
zmienia konfiguracji cząsteczki, oraz dwie płaszczyz¬ 
ny symetrii (płaszczyznę cząsteczki i płaszczyznę do 
niej prostopadłą przechodzącą przez atom tlenu). 
Cząsteczka H a O ma trzy drgania normalne (3 • 3—6 = 
= 3) pokazane na rys. 9. Zmieniają one moment di¬ 
polowy cząsteczki i w związku z tym są czynne 
w podczerwieni. 

Widma oscylacyjne cząsteczek wieloatomowych są 
przeważnie bardziej złożone aniżeli omówione przez 
nas dwa przykłady C0 2 i H 2 0. Aby znaleźć postać 
drgań normalnych, należy wziąć pod uwagę symetrię 
cząsteczki i zastosować metodę teorii grup. Przypi¬ 
sanie odpowiednim drganiom normalnym linii obser¬ 
wowanych w widmie jest olbrzymią pracą, prowadzo¬ 
ną dzisiaj za pomocą najnowocześniejszych elektro¬ 
nicznych maszyn cyfrowych. Dokonano już analizy 
drgań normalnych wielu cząsteczek, ale jeszcze wielka 
liczba, zwłaszcza cząsteczek o niższej symetrii, pozo¬ 
staje ciągle nie rozszyfrowana. 

Chociaż oscylacje w cząsteczkach wieloatomowych 
są oscylacjami wszystkich atomów cząsteczki, zdarza 
się często, że drgania zlokalizowane są w pewnych 
grupach atomów wchodzących w skład cząsteczki. 
Gdy taka grupa atomów znajduje się w różnych czą¬ 
steczkach, w widmach występować będą pasma o tych 
samych prawie częstościach i natężeniach. Jest 
to efekt tak pewny i sprawdzony w tak wielu przykła¬ 
dach, że obecność lub nieobecność w widmie badanej 
cząsteczki pasma w danym zakresie częstości może 
być poważnym argumentem świadczącym o obe¬ 
cności lub braku odpowiedniego zgrupowania ato¬ 
mów w badanej cząsteczce. Częstości związane z da¬ 
nym ugrupowaniem atomów zwane są częstościami 
charakterystycznymi grup atomowych. Rys. 12 przed- 
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stawia najbardziej rozpowszechnione i najlepiej zba¬ 
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Rys. 12. Częstości charakterystyczne kilku grup atomowych. 
Strzałkami zaznaczono kierunek przesunięć atomów 


Aby znaleźć najbardziej prawdopodobną strukturę 
i skład, badamy zakresy widma, w których występują 

charakterystyczne częstości grup OH i ^>CH 2 . Brak 

silnego pasma w obszarze 3500-3600 cm -1 świadczy 
o niewystępowaniu grup OH, a więc przeciw struktu¬ 
rze I, III, V (bardzo słabe pasmo przy 3520 cm -1 jest 
najprawdopodobniej spowodowane przez zanieczysz¬ 
czenia). Brak silniejszej absorpcji przy 2850 cm -1 
pozwala odrzucić struktury n, III i V z kilkoma gru¬ 


pami ^>CH 2 , którym ta absorpcja odpowiada. Wy¬ 
stępowanie słabego pasma przy 2940 cm” 1 świadczy 
o obecności pojedynczej grupy ^>CH 2 dołączonej do 

grupy ^>C—O. Najbardziej prawdopodobna wydaje 
się więc struktura IV. 


Widma oscylacyjno-rotacyjne 

Dotychczas rozpatrywaliśmy oscylacje cząsteczek nie 
uwzględniając faktu, że wykonują one równocześnie 
ruch oscylacyjny i rotacyjny. Pominięcie rotacji jest, 
jak mówiliśmy, uzasadnione w odniesieniu do cząste¬ 
czek w cieczach, roztworach i ciałach stałych, gdzie 
siły międzycząsteczkowe powodują prawie całkowite oscylacje 
zahamowanie obrotów. W fazie gazowej należy ko- i rotacje 
niecznie uwzględnić równoczesne występowanie oscy- w gazach 



Rys. 13. Widmo oscylacyjne nieznanej próbki. Krzywa czarna przedstawia widmo zarejestrowane przy większej grubości warstwy 
absorbującej, krzywa niebieska — przy grubości mniejszej 


Aby zilustrować zastosowanie częstości charakte¬ 
rystycznych grup do analizy widma oscylacyjnego 
cząsteczki o nieznanym składzie i strukturze, rozpa¬ 
trzymy następujący przykład. Weźmy pod uwagę 
widmo absorpcyjne w podczerwieni, takie jak np. 
na rys. 13. Ze sposobu otrzymywania związku, któ¬ 
rego strukturę i skład mamy ustalić, wynika, że 
możliwe są następujące formy: 
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Rys. 14. Schemat pozio¬ 
mów oscylacyjno-rotacyj- 
nych 



i u r~n 


lacji i rotacji. Korzystając z naszych dotychczasowych 

wiadomości możemy zapisać, że dla najprostszego 

przypadku dwuatomowych cząsteczek, energia rów- cząsteczka 

noczesnej rotacji i oscylacji cząsteczki w przybliżeniu dwuatomowa 

rotatora sztywnego i oscylatora harmonicznego 

wynosi 

£osc rot = hv Q (v +i) +J BJ(J 4-1). 
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transmisja 


Gdy zachodzi przejście pomiędzy dwoma poziomami, 
z których wyższy oznaczamy pojedynczą kreseczką 
a niższy podwójną (rys. 14), otrzymujemy następujące 
wyrażenie na różnicę energii poziomów: 

^scrot-^scrot = hv 0 (v' D~ 

-B"J"(J"+ 1), 


gdzie B' i B " są stałymi rotacyjnymi odpowiadają¬ 
cymi dwu stanom oscylacyjnym, a = 0, 1,2, 3,... 
/" = 0, 1, 2, 3,.... Przejściami między poziomami 
rządzą reguły wyboru dla liczb kwantowych v i /, 
które mówią że Av = v'—v" = 1, a AJ — J'—J" = 
— ± 1 - 

Musimy teraz rozważyć dwa możliwe sposoby 
zmian rotacyjnej liczby kwantowej J. Gdy J'—J” = 
= +1 otrzymujemy 

AEosc rot = hv 0 +(B'+B")J'+(B'-B")J'\ 

J' = 1,2, 3, zaś dla = -1 

AEosc rot = /' = 

= 1,2, 3. 

Rysunek 15 przedstawia typowe pasmo oscylacyjno- 
-rotacyjne cząsteczki dwuatomowej. Składa się ono 
z wielu prawie równoległych linii. Układ linii po stro- 



liczba falowa v Rys. 15. Struktura rotacyjna pasma oscylacyjnego HBr 


gałęzie nie niższych częstości AJ ^ — 1 nazywa się zwykle 
P i R gałęzią P 9 a układ linii po stronie wyższych częstości 
AJ — +1—gałęzią R. W środku pasma przy czę¬ 
stości v 0 występuje przeważnie luka odpowiadająca 
niedozwolonemu przejściu z AJ = 0. Wartości B' 
i B" można bezpośrednio wyznaczyć z widma oscy- 
lacyjno-rotacyjnego. Dla składowych gałęzi P i R, 
w których zachodzi absorpcja z tego samego poziomu 
rotacyjnego J\ otrzymuje się (rys. 14): 

v«(/')-vp(/0 = 2P"(2y'+l). 

Z zależności tej można wyznaczyć B'' a następnie mo¬ 
ment bezwładności Dla składowych gałęzi P i R, 
w których zachodzi wzbudzenie do tego samego po¬ 
ziomu rotacyjnego J" (rys. 14), 

vr(J')-vp(J'+ 2) = 22T(2/'-f 3). 

Z tej różnicy można wyznaczyć B' oraz moment bez¬ 
władności /'. 

Rozważania nasze prowadzą do wniosku, że struk¬ 
tura widm oscylacyjno-rotacyjnych zależy od mo¬ 
mentu bezwładności, a więc od odległości międzyato- 
mowych. Widma oscylacyjno-rotacyjne dają więc 
jeszcze jedną możliwość wyznaczania rozmiarów 
i kształtu cząsteczek. 

względne Omawiając widma oscylacyjno-rotacyjne cząste- 
natężenia czek dwuatomowych warto zwrócić uwagę na natę- 
skSadowych żenią składowych pasma pokazanego na rys. 15. 
w widmie Względne natężenia tych składowych są w przybliże¬ 
niu proporcjonalne do obsadzania poziomów rota¬ 


cyjnych będących poziomami wyjściowymi dla przejść 
kwantowych. Obsadzenie poziomu rotacyjnego, czyli 
liczba cząsteczek znajdujących się w stanie energe¬ 
tycznym opisanym przez liczbę kwantową /, wynosi: 

Nj = (2J+l)N 0 e- J{J+1)BlkT 
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Rys. 16. Wpływ temperatury na rozkład natężenia pasma oscyla- 
cyjno-rotacyjnego HC1 
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Natężenia składowych odpowiadających przejściom 
z poziomów o różnym J będą się więc zmieniać wraz 
ze zmianą temperatury próbki (rys. 16). 

Energia równoczesnych oscylacji i rotacji wielo- 
atomowych cząsteczek liniowych jest w przybliżeniu 
sumą Eosc+jErot. Dla takich cząsteczek występują 
dwa podstawowe typy pasm oscylacyjno-rotacyjnych. 
Gdy momenty dipolowe związane z drganiami czą¬ 
steczki są równoległe do jej osi, otrzymuje się pasmo 
rotacyjno-oscylacyjne równoległe (rys. 17). Jeżeli na- 



Rys. 17. Pasmo równoległe cząsteczki CO a 


tomiast oscylacyjne momenty dipolowe są prostopa¬ 
dłe do osi cząsteczki, otrzymuje się pasmo nazywane 
pasmem prostopadłym (rys. 18). Dla pasm równo¬ 
ległych ważne są reguły wyboru takie same, jak dla 
cząsteczek dwuatomowych, tj. Av — ±1, AJ = ±1. 
Podobnie jak dla cząsteczek dwuatomowych, w wid¬ 
mie wystąpią tylko gałęzie P i R. Do tych pasm można 
zastosować rozważania dotyczące cząsteczek dwuato- 
mowych i wyznaczyć z odległości między liniami ro¬ 
tacyjnymi pasma oscylacyjnego równoległego war¬ 
tości B' i B ". 

Przy drganiach prostopadłych do osi cząsteczki waż¬ 
ne są inne reguły wyboru, a mianowicie: Av = ±1, 
AJ = 0, ± 1. W związku z tym pasma prostopadłe 
cząsteczek liniowych mają oprócz gałęzi P i R także 
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gałąź Q gałąź centralną Q odpowiadającą przejściu AJ = 0 nych na równoległe i prostopadłe. Zależnie od tego 
(rys. 18). Jedną z głównych cech gałęzi Q jest to, że czy zmiana momentu dipolowego odbywa się w kie- 
wszystkie przejścia J'-+J" tej gałęzi mają prawie taką runku najmniejszego, pośredniego lub największego 
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Rys. 18. Pasmo prosto¬ 
padłe cząsteczki NO a od¬ 
powiadające drganiom 
zginającym cząsteczkę. 
Dwa satelity gałęzi Q 
należy przypisać cząste¬ 
czkom NO. we wzbu¬ 
dzonym stanie oscyla¬ 
cyjnym 


samą częstość v 0 . Ze względu na nieznacznie mniejszą 
wielkość B" w porównaniu do B\ gałąź Q jest nieco 
asymetryczna od strony większych J. 

Drgania cząsteczek typu bąka symetrycznego dają¬ 
ce pasma oscylacyjno-rotacyjne są związane z wibra¬ 
cyjnym momentem dipolowym, ustawionym równo- 
czasteozki prostopadle do osi cząsteczki. Podobnie 

J: - “j* jak dla cząsteczek liniowych, obydwu typom drgań 
svmetrvoz- opowiadają różne rotacyjno-oscylacyjne reguły wy- 
1 boru i stąd różny kształt pasm. Drgania dające pasmo 
równoległe przedstawia rys. 19. Wszystkie pokazane 
na rysunku drgania mają wibracyjny moment dipo- 



Rys. 19. Drgania cząsteczek będących rotatorami symetryczny¬ 
mi, prowadzące do pasm absorpcyjnych równoległych 


Iowy skierowany wzdłuż osi cząsteczki. Dla drgań 
tego typu regułami wyboru są: 

Av=± 1, AK=0, AJ = 0, ±1 jeżeli K # 0; 

Av = ± 1, AK= 0, AJ=± 1, jeżeli K = 0, 

gdzie liczby kwantowe K i J znane nam już są z roz¬ 
ważań widm czysto rotacyjnych. Przykład równoleg¬ 
łego pasma oscylacyjno-rotacyjnego cząsteczki CH s Br 
przedstawia rys. 20. Pasmo składa się z trzech gałęzi 
P, Q i R. Jak widać na rysunku tylko dla gałęzi P 
widoczne są rozdzielone linie rotacyjne. Dla gałęzi 
R i Q występują pasma bez zaznaczonej struktury ro¬ 
tacyjnej. 

Drgania, przy których powstaje moment dipolowy 
prostopadły do osi cząsteczki, przedstawia schema¬ 
tycznie rys. 21. Do drgań tego typu stosują się nastę¬ 
pujące reguły wyboru dla liczb kwantowych oscyla¬ 
cyjnych i rotacyjnych Av — ±1, AK — ±1, AJ = 
cząsteczki =0,±1. Typowe pasmo oscylacyjno-rotacyjne pro- 
typu bąka stopadłe przedstawia rys. 22. 
niesyme- W przypadku cząsteczek typu bąka niesymetrycz- 
trycznego nego nie możemy dzielić pasm oscylacyjno-rotacyj- 
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Rys. 20. Pasmo równoległe cząsteczki CH,Br (rotator syme¬ 
tryczny) 
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Rys. 21. Drgania cząsteczek będących 
rotatorami symetrycznymi prowadzące 
do pasm prostopadłych 
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Rys. 22. Pasmo prostopadłe cząsteczki CH a Cl (rotator syme¬ 
tryczny) 

momentu bezwładności mówimy o pasmach typu A, pasma typu 
B lub C. Każde z tych trzech pasm ma zwykle pewien A. Bi C 
charakterystyczny kształt, co pozwala je odróżnić od 
siebie. 


Widma rozproszenia Hamana 

Widma rozproszenia Ramana są jednym z wielu przy¬ 
kładów zjawisk przewidywanych przez teoretyków 
wcześniej, zanim zostały odkryte doświadczalnie. 
W 1923 r. A.G. Smekal zwrócił uwagę, że w promie¬ 
niowaniu rozproszonym powinny się pojawić obok 
fotonów o częstości promieniowania padającego v 0 , 
fotony o częstościach v„±v. Teoretycy z niecierpliwo- 
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ścią oczekiwali doświadczalnego potwierdzenia swych 
przewidywań, które mogło ugruntować lub obalić 
podstawy mechaniki kwantowej. I oto w 1928 r. po¬ 
jawiają się pierwsze prace doświadczalne fizyka hin¬ 
duskiego Ch.V. Rama na dotyczące rozproszenia 
w cieczy (benzenie) oraz prace fizyków radzieckich 
G. S. Landsberga i L.I. Mandelsztama dotyczące roz- 
mechanizrn proszenia w kryształach kwarcu, 
rozproszenia Mechanizm rozproszenia ramanowskiego jest na- 
ramanow- stępujący: padające promieniowanie elektromagne- 
skiego tyczne indukuje w cząsteczce moment dipolowy 

t*i = <*E, 

polaryzo- gdzie a jest polaryzowalnością cząsteczki, czyli miarą 
walność zdolności do deformacji rozkładu jej ładunków w polu 
cząsteczki elektromagnetycznym lub elektrycznym. Polaryzo- 
walność jest tym większa, im słabiej związane są 
elektrony zewnętrznych powłok z jądrami atomów. 
W czasie drgania cząsteczki, powodującego perio¬ 
dyczne zmiany jej struktury, zmienia się również po- 
laryzowalność. Jest więc ona funkcją współrzędnych 
ą opisujących drganie cząsteczki: 

a = oc(q). 

Periodycznym zmianom współrzędnych ą odpowia¬ 
dają zmiany periodyczne <x(q). W przybliżeniu har¬ 
monicznym 

a (q) = cc 0 cos2nvt, 

gdzie v jest częstością drgania, np. drgania normal¬ 
nego w przypadku cząsteczek wieloatomowych. Pro¬ 
mieniowanie elektromagnetyczne E też zmienia się 
periodycznie: E — /^cosżiuy, a więc indukowany 
w cząsteczce przez falę elektromagnetyczną moment 
dipolowy ih wynosi 

/ii = a^o cos 2 tt v/ cos 2kv 0 1 . 

Stosując znany wzór trygonometryczny na iloczyn 
cosinusów otrzymamy 

!H = v 2 <*<&> [cos 2jt(v 0 —w)/-f- cos 2jt(v 0 -f-v)f]. 

Drgający indukowany moment dipolowy ma więc 
składowe v 0 -v i v 0 +v. Częstościami v mogą być czę¬ 
stości oscylacji lub rotacji opisywane wzorami poda¬ 
nymi poprzednio przy omawianiu widm oscylacyj¬ 
nych i rotacyjnych. 

Przedstawiony mechanizm rozproszenia ramanow¬ 
skiego jest bardzo uproszczony. Pełny opis teoretycz¬ 
ny tego zjawiska daje, jak już mówiliśmy, mechanika 



Rys. 23. Schemat po¬ 
ziomów energetycznych 
i widmo Ramana czą¬ 
steczki dwuatomowej; 
linią przerywaną zazna¬ 
czono poziom niestacjo¬ 
narny 


kwantowa. Schemat poziomów energetycznych wyni¬ 
kających z rozważań mechaniki kwantowej przedsta¬ 
wia rys. 23. Fotony padającego promieniowania 
o częstości v 0 ulegają rozproszeniu na cząsteczkach. 
Gdy po rozproszeniu promieniowania cząsteczka po¬ 
zostaje w tym samym stanie energii —mamy do czy¬ 
nienia z rozproszeniem bez zmiany długości fali, któ¬ 
remu odpowiada środkowa linia v 0 w dolnej części 
rys. 23. Zdarza się jednak, że cząsteczka po rozpro¬ 
szeniu znajdzie się na wyższym poziomie rotacyjnym 


lub oscylacyjnym i rozproszony foton ma częstość 
zmniejszoną o różnicę energii rotacyjnych lub oscyla¬ 
cyjnych poziomów energetycznych. Takiemu rozpro¬ 
szeniu odpowiada linia v 0 —v w dolnej części rys. 23, 
zwana linią stokesowską. Jeżeli przed rozproszeniem 
cząsteczka znajdowała się we wzbudzonym stanie ro¬ 
tacyjnym lub oscylacyjnym, to możliwe jest, że po 
rozproszeniu znajdzie się w stanie podstawowym. 
Rozproszony foton zwiększy swą częstość o różnicę 
energii hv rotacyjnych lub oscylacyjnych poziomów 
energetycznych. Odpowiada mu linia v 0 -f-v pokazana 
w dolnej części rys. 23, zwana linią antystokesowską. 
Ponieważ we wzbudzonym stanie rotacyjnym, a zwła¬ 
szcza oscylacyjnym, jest znacznie mniej cząsteczek niż 
w stanie podstawowym, przejścia antystokesowskie 
są znacznie rzadsze, a linie im odpowiadające mają 
mniejsze natężenie. Częstości linii ramanowskich ro¬ 
tacyjnych i oscylacyjnych otrzymać można na pod¬ 
stawie rozważań przeprowadzonych poprzednio dla 
odpowiednich widm rotacyjnych i oscylacyjnych. 
W odniesieniu do tych częstości słuszne będzie to 
wszystko, co mówiliśmy o rotacji i oscylacji cząste¬ 
czek dwuatomowych i wieloatomowych, rozpatrywa¬ 
nych jako rotatory sztywne i niesztywne oraz oscyla¬ 
tory harmoniczne i anharmoniczne, drgania normal¬ 
ne itp. 

Na zakończenie warto jeszcze kilka słów powie¬ 
dzieć na temat warunków pojawienia się linii czy pa¬ 
sma widma ramanowskiego. Podczas gdy warunkiem 
pojawienia się linii czy pasma w widmie absorpcji 
jest zmiana momentu dipolowego cząsteczki, warun¬ 
kiem pojawienia się linii i pasma w w-idmie ramanow- 
skim jest zmiana polaryzowałności *(<?). To zróżni¬ 
cowanie ogólnej reguły wyboru widma absorpcji 
i widma Ramana powoduje, że rotacja i niektóre drga¬ 
nia nieaktywne w absorpcji mogą być aktywne w wid¬ 
mie Ramana i na odwrót. Na przykład drganie i ro¬ 
tacja dwuatomowej cząsteczki homopolarnej jest nie¬ 
aktywne w absorpcji, natomiast pojawia się w wid¬ 
mie Ramana, ponieważ rotacji i drganiu towarzyszy 
zmiana polaryzowalności. W szczególnym przypadku 
cząsteczek mających środek symetrii (np. C0 2 ) obo- 
wiązuje tzw. zakaz alternatywny, który mówi, że 
drgania nieaktywne w absorpcji w podczerwieni są 
aktywne w rozpraszaniu Ramana. 


Wpływ oddziaływań między cząsteczkowych 
na widma oscylacyjne i rotacyjne 

Mówiliśmy już, że oddziaływania międzycząsteczko- 
we mają wpływ na obserwowane widma molekularne- 
W przypadku widm rotacyjnych, dla których energia 
oddziaływania z promieniowaniem elektromagne¬ 
tycznym jest tego samego rzędu co energia oddziały¬ 
wań międzycząsteczkowych, decydują one o istnieniu 
widma. Wpływ oddziaływań międzycząsteczkowych 
na widmo oscylacyjno-rotacyjne związany jest z tym, 
że oddziaływania te mogą w większym lub mniejszym 
stopniu zmieniać siły wiązań między atomami w czą¬ 
steczce, a więc zmieniać stałe siłowe, a tym samym 
częstości oscylacji. Z drugiej strony mogą one powo¬ 
dować zmiany rozkładu ładunków w cząsteczce, 
a więc. zmiany momentu dipolowego, co znajduje wy¬ 
raz w zmianach natężeń pasm. Oddziaływania mię- 
dzycząsteczkowe wywołują często pojawienie się mo¬ 
mentu dipolowego i wystąpienie w widmie odpo¬ 
wiednich pasm, które odpowiadają zmianom tego mo¬ 
mentu podczas drgania. Występuje to w cząsteczkach 
takich, jak CJ 2 , J 2 , Br 2 . Ze względu na zerowy moment 
dipolowy, cząsteczki te w fazie gazowej nie absorbują 
promieniowania podczerwonego i nie mają absorp¬ 
cyjnego widma oscylacyjnego i rotacyjnego. Sytuacja 
zmienia się radykalnie w roztworach, gdy jako roz¬ 
puszczalnika użyjemy np. benzenu, acetonu czy pi¬ 
rydyny. W roztworach takich występują bowiem silne 
oddziaływania pomiędzy cząsteczkami chlorowców 
i rozpuszczalnikiem, prowadzące do powstania kom- 
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pieksów międzycząsteczkowych takich, jak np. CJ 2 — 
benzen czy Cl 2 — aceton: 


Cl-Cl || 

,/ c V\ 






nienia część wiązań się rozrywa i to jest przyczyną 
wzrostu gęstości w temperaturze topnienia. 

Szczególne znaczenie ma wiązanie wodorowe w 
układach biologicznych, takich jak białka i kwasy 
nukleinowe. W białkach wiązania wodorowe typu 
N—H—0=C utrwalają skręty łańcuchów polipep- 
tydowych (rys. 25). W kwasach nukleinowych, mają¬ 
cych również helikalną budowę, łańcuchy tzw. kom¬ 
plementarne są do siebie „dopasowane” dzięki istnie- 


ukiady bio¬ 
logiczne 


Powstanie tych kompleksów, zwanych kompleksami 
z przeniesieniem ładunku {charge-transfer ) powoduje, 
że w cząsteczkach chlorowców następują zmiany roz¬ 
kładu ładunku prowadzące do powstania momentu 
dipolowego. O strukturze i własnościach kompleksów 
z przeniesieniem ładunku będzie jeszcze mowa ob¬ 
szerniej w rozdziale omawiającym widma elektro¬ 
nowe. 

wiązanie Innym typem oddziaływań międzycząsteczkowych 
wodorowe badanych metodami spektroskopii oscylacyjnej są 
oddziaływania zwane wiązaniami wodorowymi. Nie 
jest przesadą stwierdzenie, że wiązanie wodorowe sta¬ 
nowi główny czynnik wzajemnego powiązania czą¬ 
steczek, w tym również cząsteczek układów biolo¬ 
gicznych, oraz że decyduje ono w znacznym stopniu 
o strukturze materii ożywionej. Międzycząsteczkowe 
wiązanie wodorowe występuje pomiędzy dwiema 
cząsteczkami, z których jedna zawiera grupę proto- 
nodonorową X —H, druga zaś atom lub grupę ato¬ 
mów protonoakceptorowych. Symbolicznym ozna¬ 
czeniem wiązania wodorowego jest zwykle zapis 
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Rys. 25. Fragment heJiksu łańcucha polipeptydowego 



w granicach od kilku do kilkunastu, a nawet w nie¬ 
których przypadkach kilkudziesięciu kJ/mol. Wła¬ 
sności wielu układów molekularnych określone są 
przez wiązania wodorowe. Np. w lodzie istnieje regu¬ 
larna sieć wiązań wodorowych (rys. 24). Podczas top- 
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ni u wiązań wodorowych między parami zasad ade¬ 
niną i tyminą oraz guaniną i cytozyną. Fragment 
kwasu dezoksyrybonukleinowego pokazany jest na 
rys. 26. Rola wiązań wodorowych łączących pary za¬ 
sad jest jak widać bardzo duża. 











absorpcja Istnienie wiązania wodorowego przejawia się bar- 
w podcier- dzo wyraźnie w widmie absorpcji w podczerwieni, 
wieni Widmo to dostarcza następujących ważnych infor¬ 
macji: 

1. Wskazuje na obecność wiązania wodorowego — 
nawet bardzo słabego. 

2. Informuje, jaki protonodonor X —H bierze udział 
w wiązaniu i z jakim protonoakceptorem Y oddzia¬ 
łuje X —H. 

3. Mówi o roli środowiska otaczającego cząsteczki 
związane. 

4. Pozwala wyznaczyć energię wiązania wodoro¬ 
wego. 



Drgania układu związanego wiązaniem wodoro¬ 
wym w przybliżeniu trójatomowym X—H‘Y przed¬ 
stawia rys. 27. Powstaniu wiązania wodorowego to¬ 
warzyszy pojawienie się nowych częstości w widmie, 
a mianowicie częstości odpowiadających drganiom 
międzycząsteczkowego wiązania, przedstawionym na 
rys. 27 (4) oraz (5). Są to drgania o niskich często¬ 
ściach w zakresie tzw. dalekiej podczerwieni (ok. 
50-250 cm -1 ). Oprócz pojawienia się tych nowych czę¬ 
stości, zmianom pod wpływem powstania wiązania 
wodorowego ulega również widmo donora i akcep¬ 
tora protonu. Największe zmiany zachodzą w obsza¬ 
rze częstości drgania rozciągającego donora protonu 
X —H (drganie 1 na rys. 27). Częstość tego drgania 
może obniżyć się od kilku do kilkuset cm -1 (niekiedy 
nawet więcej). Pasmo odpowiadające temu drganiu 
ulega też znacznemu poszerzeniu — nawet do setek 
cm -1 . Zwiększa się również bardzo, często o rząd lub 
dwa rzędy wielkości, natężenie pasma odpowiadają¬ 
cego temu drganiu. Wiązanie wodorowe powoduje 
również zauważalne zmiany w widmie akceptora pro¬ 
tonu. Np. wiązanie C=0 uczestniczące w oddziały¬ 
waniu obniża swą częstość. Ilustracją zmian w widmie 
pod wpływem powstania wiązania wodorowego jest 
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Rys. 28. Widmo absorpcji w podczerwieni 4-keto, 6-mctylopi* 
rymidyny w roztworze CDC! 3 ; a) małe stężenie badanych czą¬ 
steczek, b) większe stężenie badanych cząsteczek 


rys. 28. Pokazuje on widmo absorpcji w podczerwieni 
w zakresie drgań rozciągających wiązanie N—H w 
cząsteczce znajdującej się w różnych roztworach, 
a mianowicie w roztworze, w którym nie tworzą się 
wiązania wodorowe typu N—H“0=C (rys. 28a), 
oraz w roztworze, w którym powstają te wiązania 
(rys. 28b). Szerokie pasmo o bogatej strukturze od¬ 
powiada cząsteczkom związanym wodorowo, wąskie 
pasmo odpowiada cząsteczkom nie oddziałującym ze 
sobą. Mierząc natężenie obu tych pasm w roztworach 
oraz badając wpływ temperatury na ich natężenia 
można wyznaczyć energię wiązań wodorowych. 


Widma elektronowe cząsteczek 

Jerzy Prochorow 

O przejściach elektronowych mówimy wtedy, gdy 
w trakcie pochłaniania (absorpcji) lub wysyłania (emi¬ 
sji) kwantu promieniowania elektromagnetycznego 
przez cząsteczkę zmienia się energia elektronów czą¬ 
steczki. Odpowiednie widma absorpcji bądź emisji, 
związane z tymi przejściami, nazywamy widmami 
elektronowymi cząsteczki. Obszar, w którym wystę¬ 
pować mogą takie widma, rozciąga się od około 
120 nm do 1000 nm, a więc obejmuje nadfiolet, ob¬ 
szar widzialny i bliską podczerwień. 


Stany elektronowe cząsteczki 

Stany energetyczne cząsteczki, a więc i elektronów 
w cząsteczce, są stanami dyskretnymi. Reguły, które 
rządzą przejściami między takimi stanami, można 
zrozumieć i wytłumaczyć tylko na podstawie mecha¬ 
niki kwantowej. Dlatego w tym miejscu odsyłamy 
Czytelnika do działu „Chemia kwantowa”, ażeby 
zapoznał się (o ile do tej pory jeszcze tego nie zrobił) 
z kwantowym opisem cząsteczki i podstawowymi po¬ 
jęciami tego opisu, z których będziemy w dalszej czę¬ 
ści korzystali. Na razie spróbujemy tylko krótko upo¬ 
rządkować te pojęcia w taki sposób, abyśmy mogli 
zrozumieć istotę i prawidłowości rządzące przejściami 
i widmami elektronowymi — innymi słowy, zapo¬ 
znamy się na razie z teorią przejść i widm elektro¬ 
nowych. 

Stany energetyczne cząsteczki opisują molekularne molekularna 
funkcje falowe y n , które są ścisłymi rozwiązaniami funkcja 
równania Schródingcra. Dla cząsteczek wieloelek- falowa 
tronowych takie rozwiązania nie są w ogóle możliwe 
i do otrzymania i obliczenia energii stanów stacjo¬ 
narnych cząsteczek wieloclektronowych korzysta się 
z przybliżonych metod. Jedną z nich jest metoda 
orbitali molekularnych. 

Molekularna funkcja falowa y> określa orbitę 
i własności elektronu w cząsteczce. Gęstość rozkładu 
ładunku elektronowego w każdym punkcie? prze¬ 
strzeni jest proporcjonalna do |y| 2 . Wobec małych 
rozmiarów elektronu w stosunku do rozmiarów czą¬ 
steczki (a nawet w stosunku do rozmiarów atomu), 
chmura ładunku elektronu skupiona jest w pewnej 
ograniczonej przestrzeni. Dla każdego więc elektronu 
można wydzielić pewną powierzchnię graniczną, we- orbita! 
wnątrz której zawarta jest większość ładunku elek¬ 
tronu, np. 95%. I to jest właśnie wyobrażenie orbi- 
tala elektronu. W chemii kwantowej mówi się po pro¬ 
stu o funkcji falowej elektronu jako o orbitalu — 
wszak jej związek z położeniem elektronu w prze¬ 
strzeni jest oczywisty! 

Złożone wieloatomowe cząsteczki mają dużą licz¬ 
bę takich orbitali, z których każdy opisany jest od¬ 
powiednią funkcją falową y>. Orbital y może być 
np. zlokalizowany w znacznym stopniu na jednym 
z jąder cząsteczki i jest to wtedy orbital atomowy, 
może też obejmować dwa lub kilka jąder jednocze¬ 
śnie i wtedy jest to orbital molekularny. Każdy orbi- 
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tal w cząsteczce może być, zgodnie z zakazem Pau- 
liego, obsadzony co najwyżej przez dwa elektrony 
(a w takim przypadku muszą się one różnić funkcją 
spinową — ich spiny muszą być sparowane, porównaj 
rys. 41). 


Oddziaływanie cząsteczka z promieniowaniem 
elektromagnetycznym 


dipolowy 
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Tak jak w przypadku widm oscylacyjnych czy rota¬ 
cyjnych, również i przy przejściach elektronowych 
cząsteczka znajdująca się w stanie y n może, absor¬ 
bując kwant promieniowania, przejść do stanu y > m , 
jeżeli spełniony jest warunek Bohra: E n —Em=hv, 
tzn. jeżeli różnica energii obu stanów elektronowych 
jest równa energii kwantu promieniowania oddziału¬ 
jącego z cząsteczką. Musi być również spełniony pe¬ 
wien dodatkowy warunek. W pierwszym przybliże¬ 
niu oddziaływanie pola elektrycznego promieniowa¬ 
nia z elektronami cząsteczki jest oddziaływaniem wek¬ 
tora elektrycznego z elektrycznym momentem dipo¬ 
lowym cząsteczki. I stąd dodatkowy warunek, który 
mówi, że aby możliwe było przejście elektronowe ze 
stanu yt n do stanu y> m , wielkość zwana dipolowym 
momentem przejścia musi być różna od zera. Wiel¬ 
kość ta obrazująca przesunięcia ładunku, lub ina¬ 
czej zmiany momentu dipolowego, wyraża się nastę¬ 
pująco : 

Rnm = J y>nRy>m dr , 

gdzie R = e^n jest tzw. operatorem elektrycznego 

i 

momentu dipolowego; r< jest współrzędną /-tego 
elektronu, a sumowanie obejmuje wszystkie elektro¬ 
ny; e jest ładunkiem elektronu. Jeżeli warunek ten 
jest spełniony, to może nastąpić przejście elektrono¬ 
we, które nazywamy przejściem dipolowym elektrycz¬ 
nym, a prawdopodobieństwo takiego przejścia jest 
proporcjonalne do j jR«łn| 2 . 

Oddziaływanie promieniowania z układem cząste¬ 
czek może prowadzić do trzech zasadniczych typów 
przejść dipolowych elektrycznych. Cząsteczka może 
absorbować promieniowanie i jej energia zostaje pod¬ 
wyższona, mówimy wówczas, że cząsteczka została 
wzbudzona (albo że jest w stanie wzbudzonym). Czą¬ 
steczka w stanie wzbudzonym może tracić swoją 
energię wysyłając kwant promieniowania, który unosi 
ze sobą traconą przez cząsteczkę energię. Prawdopo¬ 
dobieństwo pierwszego procesu — absorpcji—jest 
wprost proporcjonalne do gęstości energii g(v) pro¬ 
mieniowania o częstości v i do liczby cząsteczek m 
w stanie o niższej energii, z którego następuje ab¬ 
sorpcja. 

Prawdopodobieństwo drugiego procesu — emisji 
spontanicznej—jest proporcjonalne do liczby czą¬ 
steczek nj w stanie o wyższej energii, tzn. do liczby 
cząsteczek wzbudzonych. Trzeci wspomniany proces 
to emisja wymuszona, której prawdopodobieństwo 
jest proporcjonalne zarówno do rij, jak i do g(v). Ten 
ostatni proces jest mało istotny w przypadku roz¬ 
ważanych przez nas widm elektronowych, ma nato¬ 
miast kapitalne znaczenie dla pracy lasera (->• La¬ 
sery — podstawy działania). 

Nie będziemy próbowali wyprowadzać związków 
pomiędzy wspomnianymi tutaj prawdopodobień¬ 
stwami. Podamy je tylko za Einsteinem, który pierw¬ 
szy je wyprowadził (nazywane są czasem dlatego 
współczynnikami Einsteina). Jeżeli przez Bij , Bji i Aji 
oznaczymy odpowiednio prawdopodobieństwo ab¬ 
sorpcji, emisji wymuszonej i emisji spontanicznej, przez 
v—częstość promieniowania, przez c — prędkość 
światła, a przez h — stałą Plancka, to wielkości te 
wiążą się ze sobą następująco: 

Ba = Bji — ((^ISnh^Aji. 

Prawdopodobieństwo przejścia absorpcyjnego, jak 

316 


już wspominaliśmy poprzednio, wiąże się z dipolo¬ 
wym momentem przejścia, tak że 

Bij = (2n/3&) \Rtj\ 2 (h = A/2ic), 

a z tych dwóch równań wynika, że prawdopodobień¬ 
stwo emisji spontanicznej 

Aji = (64n*l3hc z )v z \Rji\*. 

Te dwa równania pokazują, że zarówno absorpcja, 
jak i emisja zależą od momentu przejścia. Niekiedy, 
chociaż rzadko, można ocenić moment przejścia bez 
konieczności wykonywania szczegółowych rachun¬ 
ków. Czasem funkcje falowe stanów uczestniczących 
w przejściu elektronowym są takie, że moment przej¬ 
ścia jest równy zeru. Wtedy mówimy, że przejście jest 
przejściem wzbronionym i nie powinno być obserwo¬ 
wane. Jeżeli natomiast moment przejścia jest różny 
od zera, to przejście jest dozwolone i w zasadzie po¬ 
winniśmy mocje obserwować. O tym czy jakieś przej¬ 
ście jest wzbronione, czy też nie, mówią reguły wy¬ 
boru Określają one warunki, w których dipolowy 
moment przejścia Rij = ftpiRyjdr = 0. 

Można podać szereg reguł wyboru, mniej lub bar- reguły 
dziej ogólnych. Dla przykładu przytoczymy dwie wyboru 
z nich: 1) wzbronione są przejścia, podczas których 
następuje zmiana spinu elektronu; 2) wzbronione są 
przejścia pomiędzy takimi stanami elektronowymi, 
których funkcje falowe nie spełniają pewnych okre¬ 
ślonych warunków symetrii (dokładne rozważenie 
tych warunków symetrii wymaga znajomości spec¬ 
jalnej teorii, zwanej teorią grup, i dlatego, niestety, 
nie będziemy mogli tego tutaj zrobić). 

Można podać inne reguły wyboru, narzucające wa¬ 
runki np. na nakrywanie się orbitali, czy na zmiany 
momentu pędu cząsteczki. Należy jednak pamiętać 
o tym, że wyprowadzenie ścisłych reguł wyboru wy¬ 
maga znajomości ścisłych funkcji falowych (będą¬ 
cych ścisłymi rozwiązaniami równania Schrodingera), 
a tymi na ogół nie dysponujemy. Dlatego też wspom¬ 
niane reguły wyboru wyprowadzane są przy pewnych 
założeniach upraszczających i nie mają wcale sensu 
absolutnie ścisłych nakazów, tzn. przejścia, które są 
wzbronione przez te reguły, nie są naprawdę ściśle 
wzbronione i mogą być w odpowiednich warunkach 
obserwowane. Po prostu ich prawdopodobieństwo, 
a tym samym i ich natężenie jest z reguły bardzo małe. 

I tak np. reguła wyboru ze względu na spin ma cha¬ 
rakter reguły ścisłej tylko wtedy, gdy w cząsteczce 
nie występuje sprzężenie spin-orbita (będziemy jeszcze 
o tym sprzężeniu mówili szerzej), tymczasem sprzę¬ 
żenie takie jest w praktyce zawsze obecne w cząstecz¬ 
kach i wobec tego przejścia elektronowe zakazane 
ze względu na spin są jednak w widmach obserwo¬ 
wane (przede wszystkim jako widma emisyjne). Po¬ 
dobnie ma się rzecz z przejściami zakazanymi ze 
względu na symetrię. Tę ostatnią regułę wyprowadza 
się nie uwzględniając faktu, że wraz z przejściami 
elektronowymi wzbudzane są również przejścia oscy¬ 
lacyjne, a te ostatnie mogą zmieniać symetrię. Mó¬ 
wiąc inaczej, nawet jeśli reguła ta jest spełniana w od¬ 
niesieniu do prostych stanów elektronowych, to nie 
musi być ona spełniana dla stanów elektronowo-oscy- 
lacyjnych (nazywamy je stanami wibronowymi). Tak 
więc reguły wyboru mają ograniczony charakter 
i wskazują raczej na to, czy dla danego przejścia 
można oczekiwać dużego czy małego natężenia. Na 
ogół, jeśli spróbujemy porównać natężenie przejść 
wzbronionych z natężeniem przejść dozwolonych i je¬ 
śli przyjmiemy natężenie tego ostatniego jako równe 1, 
to natężenie przejść wzbronionych ze względu na sy¬ 
metrię jest około 10 do 100 razy słabsze, a natężenie 
przejść wzbronionych ze względu na spin o około 
10 000 do 1 000 000 razy słabsze. struktura 

Wspomnieliśmy przed chwilą, że przejściu elek- oscylacyjna 
tronowemu towarzyszy zmiana energii oscylacyjnej, widm 
a więc i przejście oscylacyjne. Jeżeli wrócimy jeszcze elektrono- 
raz do rys. 1 ze str. 301, który ilustrował różne po- wych 
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ziomy energetyczne cząsteczki, to dojdziemy do 
wniosku, że w trakcie przejścia elektronowego zmie¬ 
niać się na pewno może i energia rotacyjna cząsteczki. 
Stąd wniosek, że widmo elektronowe jest z reguły 
widmem złożonym: elektronowo-oscylacyjno-rota- 
cyjnym. Bez trudu chyba też uzmysłowimy sobie fakt, 
jak skomplikowane musi być takie widmo, w którym 
na przejście elektronowe nałożone są dodatkowo 
wszystkie sytuacje, które poznaliśmy omawiając wid¬ 
ma oscylacyjne i rotacyjne, i jak skomplikowana musi 
być analiza takich widm. Zdamy sobie jeszcze lepiej 
z tego sprawę, kiedy spojrzymy na zdjęcie (tzw. spek- 
struktura trofotogram, ii. 132, tabl. 33) bardzo niewielkiego, 
rotacyjna bo obejmującego zaledwie 3 nm wycinka widma 
widma elek- elektronowo-oscylacyjnego cząsteczki NCO z uwidocz- 
tronowego nioną strukturą rotacyjną. 

W praktyce tak skomplikowane widmo elektrono¬ 
we z widoczną strukturą rotacyjną jest obserwowane 
bardzo rzadko i tylko dla małych (głównie dwuato- 
mowych) cząsteczek. Gdy cząsteczka wieloatomowa 
znajduje się w fazie gazowej i pod bardzo niskim ci¬ 
śnieniem, to przy bardzo dużych zdolnościach roz¬ 
dzielczych aparatury, można niekiedy obserwować 
widmo z wyraźną strukturą rotacyjną. Ponieważ w 
przeważającej większości wypadków • widma dużych 
cząsteczek badane są w roztworze (lub w fazie stałej)- 
wobec tego widma absorpcyjne mają charakter sze¬ 
rokich pasm, bez śladów struktury rotacyjnej, z za¬ 
znaczoną czasem strukturą oscylacyjną. Rys. 29 ilu- 



liczba falowa v 

Rys. 29. Widma absorpcyjne cząsteczki CO(CN) 2 ; a) w fazie 
gazowej, b) w roztworze 



Rys. 30. Długofalowe elektronowe pasmo absorpcyjne cząsteczki 
naftacenu 


struje zmiany w wyglądzie widma cząsteczki obserwo¬ 
wanej wpierw w fazie gazowej a następnie w roztwo¬ 
rze. Widać od razu, że przejście od gazu do roztworu 
spowodowało zamazanie się większości szczegółów 
struktury. W większości bardzo dużych cząsteczek, 
nawet tak stosunkowo dobrze rozdzielona, jak na 
rys. 29, struktura oscylacyjna nie jest obserwowana 
w roztworze. 

Przyjrzyjmy się jeszcze raz rys. 29b. Widać, że 
w obrębie obserwowanego pasma elektronowego, 
poszczególne przejścia oscylacyjne mają różne na¬ 
tężenie, jedne są bardzo słabe, inne mają większe na¬ 
tężenie, a największe natężenie mają przejścia oscy¬ 
lacyjne zgrupowane w środkowej części widma. Czy 
tak zawsze wyglądają widma elektronowe? Otóż nie. 
Na rys. 30 pokazane jest jedno z pasm elektronowych 
cząsteczki naftacenu. Widzimy, że w tym wypadku 
największe natężenie mają pasma oscylacyjne z lewej 
strony rysunku, są one silniejsze niż pasma znajdu¬ 
jące się w części centralnej pasma elektronowego. 

Czy taka informacja o różnym rozkładzie natężeń 
przejść oscylacyjnych w obrębie pasma elektrono¬ 
wego ma dla nas jakieś praktyczne znaczenie, czy mo¬ 
żemy ją wykorzystać do określenia jakichś własności 
podstawowych cząsteczki, takich jak jej struktura 
czy geometria? Żeby odpowiedzieć na to pytanie, za¬ 
stanówmy się, jak w ogóle powstają takie widma, 
i spróbujmy ustalić związki między obserwowanymi 
widmami a najprostszymi parametrami cząsteczki (np. 
długością wiązań). Zrooimy to na przykładzie naj¬ 
prostszym, a mianowicie dwuatomowej cząsteczki AB. 

Z rozważań nad oscylacjami cząsteczek wiemy już, 
że taka cząsteczka ma 3-2—5 = 1 drganie normalne, 
przejawiające się jako zmiana długości wiązania A — B , 
Wiemy również, jaka może być częstość takiego drga¬ 
nia i jaka jest odległość równowagi r e w stanie pod¬ 
stawowym. Wiemy, że drgania cząsteczki są skwanto- 
wane i że energię potencjalną cząsteczki w podstawo¬ 
wym stanie elektronowym możemy przybliżyć pewną 
krzywą, zwaną krzywą energii potencjalnej (rys. 31). 



odległość r 

Rys. 31. Schematyczny przebieg rzeczywistej krzywej energii po¬ 
tencjalnej cząsteczki dwuatomowej. Poziomy oscylacyjne zagęsz¬ 
czają się wraz ze wzrostem kwantowej liczby oscylacyjnej v 


Krzywa taka ma minimum przy odległości równowa¬ 
gi r e . Jest to odległość, przy której energia potencjalna 
drgań jest równa zeru, maksymalna jest natomiast 
energia kinetyczna. Odwrotnie, w punktach na krzy¬ 
wej (dla danego poziomu oscylacyjnego) energia po¬ 
tencjalna drgań jest maksymalna, a energia kinetyczna 
jest równa zeru. Te punkty są punktami zwrotnymi 
oscylacji — po maksymalnym ściśnięciu wiązania 
A—B (punkt po lewej stronie r e ) następuje jego rozcią¬ 
ganie, aż do wartości maksymalnej (po prawej stro¬ 
nie r e ), a następnie cały cykl oscylacji powtarza się. 

Co się dzieje, kiedy cząsteczka zostaje wzbudzona 
do innego, wyższego stanu elektronowego? Zmienia 

317 


widmo czą¬ 
steczki w fa¬ 
zie gazowej 
i w roztworze 


krzywa 
energii po¬ 
tencjalnej 




















wpływ się rozkład ładunku elektronowego w cząsteczce, a to 
wzbudzenia oznacza, że zmieniają się określone siły utrzymujące 
częsteczki razem A i B; mogą się one osłabiać lub wzmacniać, 
a to z kolei oznacza, że długość wiązania, a więc i od¬ 
ległość równowagi we wzbudzonym stanie elektro¬ 
nowym może ulegać zmianie — skróceniu lub wy¬ 
dłużeniu. Mogą również zmieniać się i inne cechy 
krzywej energii potencjalnej — może mieć ona inny 
kształt i inną głębokość. To oczywiście prowadzić 
może do zmiany częstości drgań w stanie wzbudzo¬ 
nym i do innego rozkładu poziomów oscylacyjnych 
w tym stanie, w stosunku do stanu podstawowego. 
A zatem krzywe energii potencjalnej w różnych sta¬ 
nach elektronowych są różne i mogą mieć różne po¬ 
łożenie minimum (różne odległości równowagi), 
a bywa i tak, że w ogóle nie mają minimum. Jak się te 
różnice odbijają na widmach, zobaczymy zaraz na 
przykładach. Przedtem jednak podamy pewną za¬ 
sadę o podstawowym znaczeniu dla teorii widm. Za¬ 
sada ta, zwana zasadą Francka-Condona, bierze swój 
początek z prostego porównania czasów, w jakich 
mogą przebiegać pewne określone procesy w czą¬ 
steczce. I tak proces przejścia elektronowego, a więc 
proces przeskoku elektronu w obrębie cząsteczki, jest 
procesem bardzo szybkim i można oszacować, iż 
trwa on około 10“ 15 s. Natomiast średni czas trwania 
oscylacji, tzn. czas w jakim zmieniają swe położenia 
atomy cząsteczki, jest rzędu 10" 12 s, a więc jest średnio 
tysiąc razy dłuższy niż czas przeskoku elektronowego, 
zasada Uwzględniając ten fakt zasada Francka-Condona 
Francka- stwierdza, że w trakcie przejścia elektronowego jądra 
Condona atomowe w cząsteczce nie zmieniają w praktyce ani 
swych położeń ani swoich prędkości. Oznacza to, 
że spośród wszystkich możliwych przejść elektrono- 
wo-oscylacyjnych pomiędzy dwoma stanami elek¬ 
tronowymi najbardziej prawdopodobne są te przej¬ 
ścia, w wyniku których nie zmienia się położenie lub, 
jak czasem mówimy, konfiguracja jąder, ani ich mo¬ 
ment pędu. 

Wrócimy teraz do zapowiedzianych przykładów. 
Rozpatrzymy trzy przypadki: a) kiedy odległość 
równowagi w stanie wzbudzonym r' jest taka sama, 
jak odległość równowagi w stanie podstawowym r", 
b) kiedy odległość równowagi w stanie wzbudzonym 
r' jest większa niż odległość równowagi w stanie 
podstawowym r' i c) kiedy r' e jest mniejsza od r". 

Przypadek a) ilustruje rys. 32. Wiemy, że obsa¬ 
dzenie poszczególnych poziomów oscylacyjnych w sta¬ 
nie podstawowym zależy od temperatury i że w tem¬ 
peraturach niezbyt wysokich w stosunku do tempera¬ 
tury pokojowej rozkład obsadzeń jest taki, iż pra¬ 
ktycznie wszystkie cząsteczki są w najniższym stanie 
oscylacyjnym (o kwantowej liczbie oscylacyjnej 
v" = 0). W tej sytuacji prawie wszystkie przejścia 
elektronowo-oscylacyjne ze stanu podstawowego 
do wzbudzonego stanu elektronowego biorą począ¬ 
tek ze stanu oscylacyjnego v" — 0. Ponieważ, w myśl 
zasady Francka-Condona, przy przejściu elektrono¬ 
wym do wyższego stanu zarówno odległość między- 
jądrowa, jak też i prędkość ruchu jąder nie powinna 
ulegać wyraźnym zmianom, wobec tego możliwe są 
przejścia, które zaznaczono na rys. 32 linią pionową 
(lub tylko nieznacznie odchyloną od pionu). Tak 
więc będzie to przede wszystkim przejście do stanu 
oscylacyjnego v = 0 górnego stanu elektronowego. 
Jest to najbardziej prawdopodobne przejście. Inne 
kolejne przejścia do stanów oscylacyjnych v' = 
= 1, 2, 3, ... są coraz mniej prawdopodobne, gdyż 
wymagają albo coraz większej zmiany konfiguracji 
jąder w trakcie przejścia (coraz większe odchylenie 
strzałek, wskazujących przejście, od kierunku pio¬ 
nowego), albo dużej zmiany pędu jąder przy tej samej 
konfiguracji, a na możliwość poważniejszyh zmian 
którejkolwiek z tych wielkości narzuca ograniczenia 
zasada Francka-Condona. Nie oznacza to, że przej¬ 
ścia ze stanu podstawowego (z poziomu oscylacyj¬ 
nego v" = 0) do wyższych poziomów oscylacyjnych 
(v' = 1, 2, 3, ...) stanu wzbudzonego są absolutnie 

318 


niemożliwe. Przejścia takie mogą zachodzić, ale ich 
prawdopodobieństwo w stosunku do prawdopodo¬ 
bieństwa przejścia z v" = 0 do v' = 0 jest bardzo 
małe i coraz mniejsze w miarę wzrostu kwantowej 
liczby oscylacyjnej w stanie wzbudzonym v'. W re¬ 
zultacie widmo, które powinniśmy zaobserwować 
w rozpatrywanym przypadku, powinno wyglądać tak, 
jak to pokazano u dołu rys. 32. Największe natęże¬ 
nie ma przejście oscylacyjne z poziomu v " == 0 dol¬ 
nego stanu do poziomu v f — 0 stanu górnego albo, 
jak po prostu często mówimy, przejście 0-0 (przejście 
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Rys. 32. Ilustracja zasady Francka- 
Condona: r' = r" 



odległość r 





Rys. 33. Ilustracja zasady Francka- 
Condona: r' e > r" 




Rys. 34. Ilustracja zasady Francka- 

Condona : r' < r" 
e e 


Rys. 35. Ilustracja zasady Francka- 
Condona; powstawanie widma ciągłego 
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zero-zero). Natomiast natężenia przejść 0-1, 0-2, 
0-3, ... bardzo szybko maleją. 

W podobny sposób możemy rozpatrzyć przypadek 

b) , kiedy odległość równowagi w stanie wzbudzo¬ 
nym jest większa niż w stanie podstawowym (rys. 33). 
Również teraz przejścia biorą swój początek przede 
wszystkim ze stanu oscylacyjnego v" = 0, stanu pod¬ 
stawowego. Tym razem jednak, zgodnie z zasadą 
Francka-Condona, największe natężenie ma przejście 
0-4, a nie przejście 0-0 i wobec tego widmo wygląda 
inaczej niż poprzednio, jak to widać u dołu rysunku. 
Nie będziemy / analizować szczegółowo przypadku 

c) , gdy r' e < r' 7 , i uzasadniać wyglądu obserwowane¬ 
go wówczas widma — rys. 34. (Czytelnik sam już 
doskonale potrafi to w tej chwili zrobić.) Zajmiemy się 
innym przykładem, który jest często obserwowany 
w widmach cząsteczek. Ilustruje go rys. 35. Tym ra¬ 
zem wzajemne położenie krzywych energii potencjal¬ 
nych dwóch stanów, pomiędzy którymi zachodzi 
przejście elektronowe, jest takie, że z dużym praw¬ 
dopodobieństwem mogą zachodzić przejścia prowa¬ 
dzące do obszaru energii leżącej powyżej granicy 
dysocjacji w stanie wzbudzonym. Amplituda oscy¬ 
lacji cząsteczki wzbudzonej do takiego obszaru energii 
jest nieskończenie duża albo, mówiąc inaczej, wiąza¬ 
nie ulega rozerwaniu i cząsteczka rozdziela się na 
atomy A i B. Energia oscylacji zamienia się na energię 
kinetyczną obu fragmentów A i B i nie ma już mowy 
o skwantowanych, dyskretnych poziomach energii 
takiego układu. Takie przejścia prowadzą w konse¬ 
kwencji do widma ciągłego, a ich rezultatem jest 
dysocjacja (fotodysocjacja) cząsteczki. Obraz widma, 
jakiego wówczas możemy się spodziewać, pokazany 
jest na rys. 35 u dołu. 

Nasze rozważania nad zasadą Francka-Condona 
i jej wykorzystaniem do interpretacji widm prowa¬ 
dziliśmy na przykładzie cząsteczki dwuatomowęj. 
Jeśli chodzi o cząsteczki wieloatomowe sytuacja jest 
bardziej skomplikowana, a to dlatego, że liczba moż¬ 
liwych rodzajów oscylacji (liczba drgań normalnych) 
wzrasta ze wzrostem liczby atomów w cząsteczce. 
Do opisu takich złożonych sytuacji nie nadaje się 
dwuwymiarowa krzywa energii potencjalnej, spo¬ 
rządzana w funkcji długości jednego wiązania. Krzy¬ 
wą taką należałoby zastąpić wielowymiarowymi po¬ 
wierzchniami energii potencjalnej i taki prosty, gra¬ 
ficzny sposób analizy, jaki powyżej przeprowadziliś¬ 
my, przestaje być w ogóle możliwy. W cząsteczkach 
wieloatomowych na strukturę oscylacyjną pasma 
elektronowego składać się mogą przejścia oscylacyjne 
ze wzbudzeniem różnych rodzajów oscylacji (różnych 
drgań normalnych, jak mówiliśmy przy omawianiu 
oscylacji cząsteczek), o bardzo różnych częstościach. 
Taka właśnie sytuacja występuje w widmie, które 
pokazano na rys. 29, gdzie w obrębie pasma elektro¬ 
nowego można zidentyfikować dwie częstości oscy¬ 
lacyjne: ok. 1250 cm” 1 , związaną z drganiami roz¬ 
ciągającymi w grupie karbonylowej C=0 (w stanie 
wzbudzonym), i ok. 125 cm -1 , związaną prawdopo¬ 
dobnie ze zmianą kąta, jaki tworzą ze sobą w cząstecz¬ 
ce dwa wiązania —C=N. 

Mimo licznych trudności, zasadę Francka-Condona 
po przyjęciu różnych uproszczeń można zastosować 
także do analizy widm elektronowych cząsteczek wie¬ 
loatomowych. Dodajmy jeszcze dla uzupełnienia, że 
zasada Francka-Condona, którą podaliśmy i oma¬ 
wialiśmy w jej klasycznym sformułowaniu, ma rów¬ 
nież swoje sformułowanie w ramach mechaniki kwan¬ 
towej. Z przybliżenia Borna-Oppenheimera (—►Che¬ 
mia kwantowa) wiemy, że funkcje falowe stanów czą¬ 
steczki można przedstawić jako iloczyn odpowied¬ 
nich funkcji elektronowych <p e (zależnych od współ¬ 
rzędnych elektronów i jąder) i funkcji oscylacyjnych 
Xv (zależnych tylko od współrzędnych jąder), tzn. 
V — WeZt- Jeżeli przypomnimy sobie, że natężenie 
przejść jest proporcjonalne do kwadratu dipolowego 
momentu przejścia, to korzystając z tego faktu mo¬ 
żemy napisać, iż natężenie / przejścia absorpcyjnego 


ze stanu oscylacyjnego % e „ elektronowego stanu <p e , r 
do stanu oscylacyjnego x v , elektronowego stanu <p e , 
jest proporcjonalne do \{<P e ,R<P e " drf- \fx v 'X v "d*\ 2 y 
gdzie R jest znanym już nam operatorem momentu 
dipolowego. Druga całka zawiera tylko funkcje falowe 
stanów oscylacyjnych (jest, jak mówimy, całką na¬ 
krywania się tych funkcji falowych) i jest tym większa, 
im większe jest nakrywanie obu funkcji, co ma z re¬ 
guły miejsce właśnie w punktach zwrotnych oscylacji 
(gdzie amplituda oscylacyjnych funkcji falowych jest 
największa, z wyłączeniem stanu v = 0; oscylacyjne 
funkcje falowe pokazane były na rys. 16 w artykule 
„Chemia kwantowa”). Sformułowanie to potwierdza 
wniosek, że najbardziej prawdopodobne będą te 
przejścia, które zaznaczyliśmy na rys. 32-35 pionowo. 

Zasada Francka-Condona ma nie tylko duże zna¬ 
czenie dla zrozumienia postaci obserwowanego wid¬ 
ma i powiązania tej postaci ze zmianami podstawo¬ 
wych parametrów cząsteczki, ale jest również ważna 
dla zrozumienia wielu innych procesów (o niektórych 
z nich będziemy jeszcze dalej mówili), w których 
udział biorą wzbudzone stany elektronowo-oscyla- 
cyjne (nazywane czasem stanami wibronowymi). 

Przedstawiliśmy tylko niezbędne teoretyczne pod¬ 
stawy interpretacji absorpcyjnych widm elektrono¬ 
wych cząsteczek. Teraz zajmiemy się omówieniem 
niektórych, często spotykanych w praktyce widm. 


Widma absorpcyjne 


Pierwszym i naturalnym podziałem, z którego zresztą 
korzystaliśmy już poprzednio, jest podział cząsteczek 
na małe (przede wszystkim dwuatomowe) i duże. 
Może to brzmieć nieco paradoksalnie, ale badanie 
i interpretacja widm prostych, dwuatomowych czą¬ 
steczek bywa znacznie bardziej złożonym zagadnie¬ 
niem niż badanie widm cząsteczek wieloatomowych. 
Znacznie mniejsza liczba dozwolonych poziomów 
oscylacyjnych i rotacyjnych, ze stosunkowo dużą od¬ 
ległością między tymi poziomami powoduje, że przy 
odpowiednich warunkach obserwacji (w fazie gazo¬ 
wej i przy dużej zdolności rozdzielczej) widmo elek¬ 
tronowe małej cząsteczki ujawnia ogromne bogactwo 
struktury, tak jak to mogliśmy oglądać na ii. 132 
(tabl. 33). Interpretacja takiego widma, a więc przy¬ 
pisanie poszczególnych przejść oscylacyjnych i rota¬ 
cyjnych, jest z reguły bardzo żmudnym przedsięwzię¬ 
ciem, chociaż wykonalnym i dostarczającym bardzo 
istotnych informacji o stałych siłowych i rotacyjnych 
stanów wzbudzonych i charakterze sprzężeń momen¬ 
tów pędu w cząsteczce. Nie będziemy się jednak zaj¬ 
mować omawianiem i interpretacją takich widm, 
można to bez trudu znaleźć w każdej książce traktu¬ 
jącej o spektroskopii molekularnej. 

Mówiliśmy już o tym, że dla cząsteczek wieloato¬ 
mowych konstruowanie krzywych energii potencjal¬ 
nej w różnych stanach elektronowych jest w praktyce 
niewykonalne. Energia potencjalna odnosząca się do 
danego stanu elektronowego cząsteczki wieloatomo- 
wej jest zależna od długości wszystkich wiązań i ką¬ 
tów między wiązaniami i do zilustrowania takich 
przypadków są potrzebne nie krzywe lecz wielowy¬ 
miarowe powierzchnie energii potencjalnej. Niemoż¬ 
liwa jest zatem analiza widm, taka jaką można prze¬ 
prowadzić dla cząsteczek dwuatomowych, ze szcze¬ 
gółowym przypisaniem struktury oscylacyjnej i ro¬ 
tacyjnej, tym bardziej, że struktura taka nie jest na 
ogół obserwowana. Widma elektronowe są szerokimi, 
prawie pozbawionymi szczegółów pasmami. W tej 
sytuacji można tylko próbować połączyć obserwo¬ 
wane pasma absorpcyjne z pewnymi zmianami roz¬ 
kładu ładunku elektrycznego w cząsteczce, a okre¬ 
ślenie rzeczywistej struktury stanu wzbudzonego by¬ 
łoby już wielkim osiągnięciem. 

Nasze rozważania o widmach elektronowych zacz¬ 
niemy od widm cząsteczek organicznych. W czą¬ 
steczkach tych przejścia elektronowe są przejściami 
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elektronów walencyjnych wiązań pojedynczych lub 
wielokrotnych, bądź też elektronów wolnych par 
elektronowych, a więc elektronów o, n lub n (tzn. 
elektronów znajdujących się na orbitalach wiążących 
o i n lub na niewiążącym orbitalu «). W przejściu 
elektronowym elektrony te mogą być wzbudzone do 
antywiążących orbitali a* i n*. W cząsteczkach zatem 
mogą być obserwowane pasma absorpcyjne związane 
z przejściami typu <r -+ a*, % -► 7r*, n -> o* i n -> n* 
(odczytujemy je jako sigma-sigma z gwiazdką, pi-pi 
z gwiazdką itd.), w zależności od tego, jakiego typu 
elektrony posiada cząsteczka: a , n czy n. 

Niekiedy poważnym ułatwieniem przy interpretacji 
widm elektronowych cząsteczek organicznych może 
być występowanie w cząsteczce grup chromoforo- 
wych. Grupy chromoforowe (są to zespoły atomów 
i wiązań) mają swoją charakterystyczną absorpcję, 
która w małym stopniu zależy od pozostałych elemen¬ 
tów cząsteczki i przez to ten sam chromofor wystę¬ 
pujący w różnych cząsteczkach może być stosunkowo 
łatwo zidentyfikowany. Zajmijmy się teraz nieco bli¬ 
żej omówieniem charakteru widm pewnych klas 
związków i grup chromoforowych, próbując powią¬ 
zać je z odpowiednimi przejściami elektronowymi, 
ze zmianami struktury elektronowej cząsteczki i z 
efektami uwarunkowanymi budową różnych cząste¬ 
czek. 

Charakterystyczną cechą pewnych związków or¬ 
ganicznych jest to, że wszystkie wiązania w cząsteczce 
są wiązaniami pojedynczymi. Do tej klasy związków 
należą nasycone węglowodory — alkany i cykloal- 
kany. Jedynymi możliwymi przejściami elektrono¬ 
wymi w cząsteczkach takich związków są przejścia 
elektronowe z wiążących orbitali a na antywiążące 
orbitale <r*, tzn. przejścia o a*. Z przejściami c^o* 
związana jest stosunkowo duża zmiana energii elek¬ 
tronowej cząsteczki i wobec tego widma elektronowe 
takich cząsteczek leżą daleko w nadfiolecie (w tzw. 
nadfiolecie próżniowym). Cząsteczki związków nasy¬ 
conych nie są specjalnie interesujące ze spektrosko¬ 
powego punktu widzenia, a badanie ich widm jest 
bardzo trudne, ze względu na obszar, w którym te 
widma występują. Jeżeli do cząsteczki nasyconej 
wprowadzony zostanie jakiś atom lub grupa z wol¬ 
nymi parami elektronowymi (elektrony h), to wów¬ 
czas możliwe jest przejście elektronu wolnej pary 
(niewiążącego) na antywiążący orbital o* t tzn. przej¬ 
ście n -* a*. Przejścia n -* o* mają niższą energię niż 
przejścia a i w widmie cząsteczki możemy wów¬ 
czas zaobserwować bardziej długofalową absorpcję. 
Węglowodory nasycone, chociaż niezbyt interesujące 
dla badacza, są bardzo ważne w badaniach spektro¬ 
skopowych, gdyż używa się ich jako rozpuszczal¬ 
ników, w których badane są widma innych związków. 

Znacznie bardziej interesujące są cząsteczki za¬ 
wierające nie tylko elektrony <r, ale również elektro¬ 
ny n lub n y bądź też jedne i drugie jednocześnie. Czą¬ 
steczki takie, to węglowodory nienasycone (np. alkeny 
i polieny) i aromatyczne (oraz ich pochodne), a więc 
cząsteczki, w których występują wiązania podwójne. 

Najprostszą cząsteczką z wiązaniem podwójnym 


jest etylen: 


H \ X H 

>c=c< . 

KK NHL 


W cząsteczce tej każdy 


z dwóch atomów węgla tworzy wiązanie z dwoma ato¬ 
mami wodoru i z drugim atomem węgla. Kąty po¬ 
między tymi wiązaniami wynoszą około 120° i wszy¬ 
stkie atomy leżą w jednej płaszczyźnie (cząsteczka 
jest w stanie podstawowym płaska). Oprócz elektro¬ 
nów uczestniczących w wiązaniu a (a tym samym sil¬ 
nie związanych) na każdym z atomów węgla znajduje 
się po jednym elektronie zajmującym orbital atomo¬ 
wy p> tak jak to zaznaczono na rys. 36. Orbitale 
p są prostopadłe do płaszczyzny cząsteczki i oddzia¬ 
łując ze sobą mogą tworzyć orbital molekularny (po¬ 
równaj opis tworzenia orbitali molekularnych z or¬ 
bitali atomowych w artykule „Chemia kwantowa” 


str,269). Jest to orbital molekularny typu jz, a z jego 
powstawaniem wiąże się zmniejszenie odległości mię¬ 
dzy atomami węgla; odległość ta jest mniejsza niż 




b) 



Rys. 36. Kształt orbitali w cząsteczce etylenu: a) orbitale ato¬ 
mowe p x oraz molekularne: b) orbital wiążący n, c) orbital anty¬ 
wiążący 7T* 

wtedy, gdy atomy węgla związane są ze sobą tylko 
pojedynczym wiązaniem typu o. Powstały orbitał 
molekularny n ma kształt zobrazowany na rys. 36b 
i jest orbitalem wiążącym, chociaż jego energia wią¬ 
zania jest mniejsza niż energia wiązania wiązań a. 

Orbita łowi wiążącemu towarzyszyć musi jak zawsze 
orbita! antywiążący a kształt tego orbitala ilu¬ 
struje rys. 36c. Obydwa elektrony n cząsteczki obsa¬ 
dzają niższy energetycznie orbital wiążący. Najniższe przejście 
energetycznie przejście elektronowe w cząsteczce n -> n* 
etylenu związane jest ze wzbudzeniem elektronu z 
orbitala wiążącego tz do orbitala antywiążącego n*. 

Jest to więc przejście typu n -> n*. 

Zwróćmy uwagę na to, że przejście elektronowe 
TT —*• 7 t* w etylenie prowadzi do zasadniczej zmiany 
rozkładu ładunku elektronowego w cząsteczce. W sta¬ 
nie wzbudzonym ładunek zostaje usunięty z obrębu 
wiązania w-ęgiel-węgiel. Wiązanie ulega zatem osła¬ 
bieniu i nie ma już charakteru wiązania podwójnego, 
jakim było w stanie podstawowym. Przejściu elektro¬ 
nowemu 7 ? —► 7 i* w cząsteczce etylenu odpowiada pa¬ 
smo absorpcyjne z maksimum przy ok. 165 nm i jest 
to absorpcja wywołana ugrupowaniem C=C w czą¬ 
steczce. 

Ciekawie przedstawia się sytuacja w cząsteczkach, układ 
w których wiązania podwójne C=C tworzą tzw. sprzężony 
układ sprzężony. W układzie takim kolejne wiązania 
podwójne rozdzielone są wiązaniami pojedynczymi 
(cząsteczki takie nazywamy polienami). Najprostszym 
przykładem jest cząsteczka butadienu, pokazana na 
rys. 37a, w której dwa wiązania podwójne rozdzielo¬ 
ne są przez wiązanie pojedyncze. Rozumując w ten 
sam sposób, jak w przypadku etylenu, dochodzimy 
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Rys. 37. Cząsteczka butadienu 
i kształt jednego z jej orbitali 
wiążących 


do wniosku, że w cząsteczce butadienu na orbitalach 
atomowych p (atomów węgla) znajdują się cztery 
elektrony. Orbitale molekularne typu n, które mogą 
powstać z kombinacji orbitali atomowych, rozcią¬ 
gają się na całą cząsteczkę, tak jak to np. pokazano 
na rys. 37b. W rezultacie, elektrony n są zdelokalizo- 
wanc w całym układzie wiązań sprzężonych. Okazuje 
się, że konsekwencją delokalizacji elektronów n jest 
obniżenie energii przejść a więc i przesuwanie 

się widma elektronowego w stronę dłuższych fal. 
Przesunięcie jest tym większe, im większy jest obszar 
delokalizacji, tzn. im dłuższy jest układ sprzężony. 
Na przykład pasmo absorpcyjne etylenu ma 

maksimum przy około 165 nm, a w widmie butadienu 
maksimum tego pasma leży przy około 217 nm. 
W miarę jak wydłuża się łańcuch wiązań sprzężo¬ 
nych, widmo przesuwa się coraz dalej w stronę wi¬ 
dzialną. W heksatrienie (trzy wiązania- podwójne 
C=C w układzie sprzężonym) maksimum pasma 
7 T-+ 7 t* leży przy 256 nm, a w dekatetraenie (cztery ta¬ 
kie wiązania) przy 310 nm. Wreszcie cząsteczka związ¬ 
ku zwanego likopenem, która wygląda tak: 


a w której można się doliczyć aż jedenastu wiązań 
w układzie sprzężonym, ma widmo z maksimum pa¬ 
sma długofalowego przy około 470 nm. Położenie 
pasma w samym środku obszaru widzialnego sprawia, 
że to właśnie likopen nadaje czerwone zabarwienie 
pomidorom i niektórym owocom (ii. 18, tabl. 6). 

Bardzo ważną w chemii klasą związków, dla któ¬ 
rych charakterystyczna jest absorpcja wywołana 
przejściami 7 r-> 7 r*, są węglowodory aromatyczne. 

Widma tych związków poznamy na przykładzie naj¬ 
ważniejszego przedstawiciela tej klasy, a mianowicie 
cząsteczki benzenu. 

Benzen ma sześć elektronów n i sześć orbitali 7t — cząsteczka 
trzy wiążące i trzy antywiążące. Cząsteczkę tę do- benzenu 
kładnie omówiono w artykule „Chemia kwantowa” 

(str. 280). W stanie podstawowym sześć elektronów 




Rys. 39. Widmo elektronowe cząsteczki benzenu i schemat jej 
elektronowych poziomów energetycznych 
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obsadza trzy wiążące orbitale 7r, których kształt 
z grubsza ilustruje rys. 38. Rozważania zmierzające 
do określenia liczby przejść elektronowych i ich wła¬ 
ściwego przypisania są w przypadku cząsteczki ben¬ 
zenu znacznie trudniejsze niż w przypadku etylenu 
czy butadienu. Nie będziemy tutaj próbowali ich 
przeprowadzać, powiemy tylko, że rozważenie róż¬ 
nych możliwych konfiguracji elektronowych, z wy¬ 
korzystaniem elementów symetrii cząsteczki, prowa¬ 
dzi do wniosku, że w benzenie powinny występować 
trzy przejścia typu 7 i widmo absorpcyjne po¬ 
winno zawierać trzy pasma. Obserwowane widmo 
benzenu i diagram stanów przewidywany przez teorię 
pokazuje rys. 39. Widmo benzenu jest bardzo cha¬ 
rakterystyczne i cząsteczka ta łatwo może być ziden¬ 
tyfikowana metodami spektroskopowymi. Inne wę¬ 
glowodory aromatyczne mają również charaktery¬ 
styczne widma, czasem o wysokim stopniu indywi¬ 
dualności. 

Zarówno omawiane przez nas wiązanie podwójne 
C=C w etylenie, jak i pierścień aromatyczny (pier¬ 
ścień taki jak w cząsteczce benzenu) należą do wspo¬ 
mnianych poprzednio grup chromoforowych, tzn. 
grup posiadających bardzo charakterystyczne widmo 
absorpcyjne pozwalające na stosunkowo łatwą ich 
identyfikację nawet wtedy, gdy wchodzą w skład bar¬ 
dziej złożonych cząsteczek. W obu tych grupach 
charakterystyczna absorpcja związana jest z przej¬ 
ściami Jednak nie zawsze charakterystyczna 

absorpcja chromoforów musi być związana ze wzbu¬ 
dzeniem elektronów n. Na przykład bardzo często 
spotykaną w różnych związkach grupą chromoforo- 

wą jest grupa karbonylowa ^)C=0, której charakte¬ 
rystyczna absorpcja wiąże się z przejściem elektro- 
przejście nowym typu n-*n*, tzn. ze wzbudzeniem niewiążą- 
n —> 71 cych elektronów wolnej pary elektronowej, zlokali¬ 
zowanych przy atomie tlenu O. Charakterystyczne 
pasmo absorpcji n-+ n* grupy karbonylowej ma mak¬ 
simum przy ok. 280 nm. 

Charakterystyczna absorpcja, umożliwiająca łatwą 
identyfikację grup chromoforowych i stwierdzenie ich 
obecności w cząsteczce, może ulegać zmianom, cza¬ 
sem nawet bardzo znacznym, jeżeli grupa chromo- 
forowa silnie oddziałuje z innymi częściami cząsteczki 
lub z inną grupą chromoforową obecną w cząsteczce. 

Widma cząsteczek, które dotychczas omówiliśmy, 
w celu uświadomienia sobie faktu, że widma elek¬ 
tronowa wiążą się z określonymi zmianami w układ- 
dzie elektronowym cząsteczki, tylko w niewielkim 
stopniu ukazały niezwykłą złożoność i różnorodność 
sytuacji, z jakimi można się zetknąć badając elektro¬ 
nowe widma absorpcyjne cząsteczek. Na przykład 
wpływ roz- poważne zmiany w widmie absorpcyjnym grup chro- 
puszczałnika moforowych i cząsteczek może spowodować roż¬ 
na widma puszczalnik, w którym znajduje się badana cząstecz¬ 
ka. Są one wynikiem oddziaływania rozpuszczonej 
cząsteczki z otaczającymi ją cząsteczkami rozpusz¬ 
czalnika i jeżeli oddziaływania te ulegają zmianom 
w wyniku wzbudzenia cząsteczki, to widmo ulega 
przesunięciu. Widmo może przesuwać się zarówno 
w stronę dłuższych, jak i w stronę krótszych fal. 
Zależy to od polamości rozpuszczalnika i cząsteczki 
rozpuszczonej i od tego, jak zmienia się moment di¬ 
polowy cząsteczki po wzbudzeniu — rośnie czy też 
maleje. Są teorie, na podstawie których można prze¬ 
widywać kierunki przesunięć widm związanych z róż¬ 
nego typu przejściami elektronowymi w cząsteczce. 
Obserwacja przesunięć widma cząsteczki w różnych 
rozpuszczalnikach dostarczyć może informacji o cha¬ 
rakterze oddziaływań międzycząsteczkowych i o tym, 
jak zmieniają się w wyniku wzbudzenia różne wiel¬ 
kości charakteryzujące stany elektronowe cząsteczki, 
np. moment dipolowy. 

Oddziaływania międzycząsteczkowe wywołują 
zmiany widma, o czym była już mowa przy okazji 
rozważań nad widmami w podczerwieni kompleksów 
z wiązaniem wodorowym. I odwrotnie, badając zmia- 

322 


ny widm możemy stwierdzać obecność takich od¬ 
działywań i próbować ustalić ich mechanizm, tzn. 
ustalić co z czym oddziałuje (np. czy cała cząsteczka, 
czy też pewien jej fragment) i jakiego rodzaju siły są 
zaangażowane w oddziaływaniu. 

Zajmiemy się teraz pewnym przykładem, który zi- widmo a od 
lustruje nam, jak można dojść do ustalenia charakte- dziaiywania 
ru oddziaływania międzycząsteczkowego, badając międzyczą- 
widma. Od bardzo dawna chemicy znali zjawisko po- steczkowe 
legające na tym, że jeżeli cząsteczki pewnych róż¬ 
nych związków zmiesza się razem, to mieszanina taka 
może nabierać zabarwienia niebieskiego, zielonego, 
czerwonego itp., chociaż roztwory obu substancji 
przed zmieszaniem były zupełnie bezbarwne. Wiemy 
jakie są związki pomiędzy barwą roztworu, a jego 
widmem. Jeśli wyjściowe roztwory były bezbarwne 
to znaczy, że widma rozpuszczonych cząsteczek leżą 
w nadfiolecie. Jeżeli po zmieszaniu powstała miesza¬ 
nina uzyskała pewną barwę to znaczy, że absorbuje 
ona teraz w obszarze widzialnym. Moglibyśmy przy¬ 
puszczać, że w wyniku zmieszania widma cząsteczek 
rozpuszczonych przesunęły się po prostu w stronę 
dłuższych fal. Jednakże zbadanie widma mieszaniny 



Rys. 40. Widma absorpcyjne układu: cztcrocyjanoetyien (akcep¬ 
tor) i sześciometylobenzen (donor) w roztworze (temperatura 
— 180°Q: 1 widmo absorpcyjne sześciometylobcnzenu, 2 widmo 
absorpcyjne czterocyjanoctylenu, 3 widmo absorpcyjne roztworu 
czterocyjanoetylen -r sześciometylobenzen. Pasmo mające 
maksimum przy ok. 19 000 cm' 1 jest pasmem absorpcyjnym 
kompleksu charge-transfer 

zaprzecza temu. Widma cząsteczek przed zmiesza¬ 
niem i po zmieszaniu są prawie niezmienione. Sytu¬ 
ację tę ilustruje rys. 40. Ale w mieszaninie pojawia się 
nowe pasmo absorpcyjne, które tak, jak się tego spo¬ 
dziewaliśmy, leży w obszarze widzialnym, daleko 
od widm składników mieszaniny. Pasmo to jest cha¬ 
rakterystyczne dla zmieszanego układu, tzn. dla obu 
rodzajów cząsteczek występujących w mieszaninie, 
np. zamiana jednej z nich na inną spowoduje poja¬ 
wienie się pasma w całkiem innym obszarze. Mówi¬ 
my, że pasmo to jest pasmem absorpcyjnym charakte¬ 
rystycznym dla oddziałującego układu. Dokładne 
badania pokazały, że pewna liczba cząsteczek obu 
związków tworzy w mieszaninie układy, w których 
obie cząsteczki znajdują się bardzo blisko siebie, two¬ 
rząc układ luźno związany. Wzbudzenie elektronowe 
w takim układzie wiąże się ze wzbudzeniem elektronu 
jednej z cząsteczek, ale elektron ten nie przechodzi 
do wyższego stanu wzbudzonego tej cząsteczki, lecz 
do wyższego stanu wzbudzonego drugiej cząsteczki 
(mówiąc inaczej jest przenoszony z orbitala mole- kompleksy 
kularnego pierwszej cząsteczki na nieobsadzony or- z przeniesie- 
bital molekularny zlokalizowany na drugiej cząstecz- osem ładunku 
ce). Tak więc proces wzbudzenia prowadzi do prze¬ 
niesienia ładunku elektronu z jednej cząsteczki (zwa¬ 
nej donorem elektronu) do drugiej cząsteczki (zwanej 
akceptorem elektronu). Takie oddziałujące układy 
nazywa się w chemii kompleksami z przeniesieniem 
ładunku (lub czasem kompleksami charge-transfer , 





pasma ab- od angielskiej nazwy procesu przeniesienia ładun- 
sorpcyjne ku). Pasma absorpcyjne charakterystyczne dla tych 
charge-transfer kompleksów nazywamy pasmami absorpcyjnymi 
charge-transfer. Proces przenoszenia ładunku jest 
procesem dosyć powszechnie spotykanym wśród 
układów molekularnych, a kompleksy z przeniesie¬ 
niem ładunku odgrywają zapewne bardzo poważną 
rolę m.in. w procesach biologicznych. Właśnie ba¬ 
danie widm tych układów pozwoliło zrozumieć na¬ 
turę zjawiska i własności takich kompleksów. 

Możliwość poznawania oddziaływań międzyczą- 
steczkowych na podstawie badania widm sprawia, że 
spektroskopia molekularna jest potężnym instru¬ 
mentem poznawania otaczającego nas świata, gdzie 
większość zjawisk, z którymi stale się spotykamy, jest 
właśnie wynikiem oddziaływań między różnymi ele¬ 
mentami, z których zbudowani jesteśmy my sami i to 
co nas otacza. 


Stany wzbudzone cząsteczek 

Mówiliśmy do tej pory o widmach absorpcyjnych, 
a więc widmach wywołanych przejściami elektrono¬ 
wymi ze stanu podstawowego do stanu wzbudzonego. 
Zastanawialiśmy się, jakie zmiany w strukturze ele¬ 
ktronowej pociąga za sobą przejście, jak zmienia się 
rozkład gęstości ładunku elektronowego w wyniku 
przejścia i jak zmiany takie można odczytać z obser¬ 
wacji widma. Nie obchodziły nas dotychczas dalsze 
losy cząsteczki w stanie wzbudzonym. Będzie to te¬ 
matem naszych dalszych rozważań. 

Ze wzbudzeniem elektronowym związana jest sto¬ 
sunkowo duża energia, np. absorpcja promieniowa¬ 
nia z zakresu 300-400 nm — wzbogaca cząsteczkę o 
ok. 400 do 300 kJ/mol lub ok. 4 do 3 eV. Elektro¬ 
nowe stany wzbudzone są więc stanami o znacznym, 
w stosunku do stanu podstawowego, nadmiarze energii 
i należy się spodziewać, że cząsteczka nie będzie w ta¬ 
kim stanie przebywała zbyt długo. Istotnie doświad¬ 
czenie pokazuje, że średni czas w jakim cząsteczka 
przebywa w stanie wzbudzonym — nazywany cza¬ 
sem życia stanu wzbudzonego — jest bardzo krótki, 
zazwyczaj rzędu 10 _7 -10“* s. 

Cząsteczka wzbudzona może w różny sposób po¬ 
zbyć się nadmiaru energii i powrócić do stanu podsta- 
przejście wowego. Skoncentrujemy się na sposobie powrotu 
promieniste cząsteczki do stanu podstawowego, z którym wiąże 
— emisja się wysłanie nadmiaru energii w postaci promienio¬ 
wania elektromagnetycznego (uprzednio pochłonię¬ 
tego). Taki powrót nazywa się przejściem promieni¬ 
stym (lub dezaktywacją promienistą), a jego rezulta¬ 
tem jest emisja promieniowania zwanego najogólniej 
luminescencją. Końcowym efektem takiego procesu, 
którego badaniem może zająć się spektroskopia, jest 
lumines- widmo emisyjne — widmo luminescencji. Zanim jed- 
cencja nak zajmiemy się nieco szczegółowiej widmami emi¬ 
syjnymi i tym co może przynieść ich badanie, musimy 
uzupełnić nasze wiadomości o naturze stanów wzbu¬ 
dzonych i procesach promienistych, a także bezpro- 
mienistych. 

Do badań stanów wzbudzonych cząsteczki i pro¬ 
cesów dezaktywacji (sposobów i dróg jakimi cząstecz¬ 
ka pozbywa się energii wzbudzenia) tych stanów 
potrzebna jest znajomość schematu stanów energetycz¬ 
nych cząsteczki. Ustalenie takiego schematu jest 
zresztą jednym z pierwszych zadań i celów spektro¬ 
skopii. Schemat taki, szczególnie gdy chodzi o wie- 
loatomowe cząsteczki, może być bardzo złożony i na 
ogół nigdy nie jest w pełni znany, ponieważ nasza 
wiedza w tym przedmiocie ogranicza się do kilku naj¬ 
niżej położonych (o najniższej energii) stanów wzbu¬ 
dzonych. Już z artykułu „Chemia kwantowa” wie¬ 
my, że dodatkową komplikacją schematu energetycz¬ 
nego cząsteczki jest występowanie układów stanów 
o różnych multipletowościach. Przypomnijmy to so¬ 
bie raz jeszcze na prostym przykładzie zilustrowanym 
rys. 41. Na rysunku tym zaznaczono schematycznie 


cztery orbitale molekularne (w skali energii) hipo¬ 
tetycznej cząsteczki — dwa o niższej energii, obsadzo¬ 
ne przez cztery elektrony, i dwa nie zapełnione (tak 
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Rys. 41. Schemat energetyczny orbitali molekularnych i możliwe 
konfiguracje elektronowe w stanie podstawowym i wzbudzonym 

właśnie mógłby wyglądać schemat orbitali cząsteczki imiltipłeto- 
butadienu). Strzałki na rysunku symbolizują orien- wość stanów 
tację spinów elektronów. Zgodnie z zasadą Pauliego 
w stanie podstawowym oba elektrony muszą mieć 
przeciwne spiny, co zaznaczono przeciwnymi zwro¬ 
tami strzałek (rys. 4la) i wobec tego wypadkowy spin 
5 — 0, a muitipletowość stanu jest 25+1 = 1 i stan 
podstawowy jest stanem singletowym. 

Wzbudzenie elektronowe jest równoważne przej¬ 
ściu jednego z elektronów na wyższy nie obsadzony 
orbital. Mamy teraz do czynienia z inną konfiguracją 
elektronową; jest to konfiguracja stanu wzbudzone¬ 
go. Teraz jednak zakaz Pauliego już nie obowiązuje, 
gdyż oba elektrony znajdują się na różnych prze¬ 
strzennie orbitalach i wobec tego możliwe są dwie 
sytuacje. Albo elektrony będą miały spiny przeciwnie 
(rys. 41b), albo też jednakowo skierowane (rys. 41c). 

Przy pierwszej ewentualności wypadkowy spin bę¬ 
dzie, tak jak w stanie podstawowym, równy zeru. 

Natomiast druga ewentualność prowadzi do wypad¬ 
kowego spinu 5 = 1 i multipletowości stanu 25+1 = 

= 3. Tej samej więc konfiguracji elektronowej od¬ 
powiadają dwa stany o różnych multipletowościach 
— jeden jest singletem, drugi natomiast trypletem. 

Z taką sytuacją mamy do czynienia w cząsteczkach. 

Z naszego rysunku wynika, że oba stany mają tę sa¬ 
mą energię, jednak naprawdę ich energia nie jest je¬ 
dnakowa. To, że elektrony w stanie trypletowym 
znajdują się na różnych przestrzennie orbitalach spra¬ 
wia, iż energia tego stanu jest z reguły niższa niż stanu 
singletowego tej samej konfiguracji elektronowej (do¬ 
kładnie wyjaśniono ten efekt w artykule „Chemia 
kwantowa”. 

Spróbujmy teraz podać ogólny schemat energe- schemat 
tyczny cząsteczki i zobrazować na nim drogi powrotu Jabłońskiego 
ze stanów wzbudzonych do stanu podstawowego. 

Taki schemat nosi w spektroskopii nazwę diagramu 
(lub schematu) Jabłońskiego (od nazwiska wybitnego 
współczesnego fizyka polskiego A. Jabłońskiego, któ¬ 
ry pierwszy taki schemat zastosował do wyjaśnienia 
różnych obserwowanych widm emisyjnych). 

Na diagramie (rys. 42) zaznaczono kilka pierw¬ 
szych stanów z sekwencji stanów singletowych S u 
5 2 , 5 3 oraz dwa pierwsze stany T u T 2 z sekwencji sta¬ 
nów trypletowych. Dla każdego z tych stanów za¬ 
znaczono również kilka pierwszych stanów oscylacyj¬ 
nych. 5 0 jest stanem podstawowym cząsteczki. Ab¬ 
sorpcja promieniowania o odpowiedniej długości fali 
prowadzi ze stanu 5 0 do stanów wzbudzonych S l9 S z 
lub wyższych. Absorpcja prowadząca ze stanu 5 0 do 
stanów T ly T Zy ... jest, o czym już wiemy, procesem 
wzbronionym, gdyż wiąże się ona ze zmianą spinu. 

Zakaz ten jak wiemy, nie jest zakazem ścisłym i w pe- 
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wnych warunkach absorpcja taka może być obserwo¬ 
wana. Jednak w normalnych warunkach nie można 
jej na ogół zaobserwować. 

singlety tryplety 



Rys. 42. Diagram Jabłońskiego stanów energetycznych cząsteczki. 
Linie ciągłe łączące różne stany odpowiadają procesom promie¬ 
nistym, linie faliste - procesom bczpromienistyni 

absorpcja Absorpcja promieniowania może prowadzić do 
i emisja każdego ze stanów wzbudzonych Ą, S 2 , S 3 , ..., S n , 
na diagramie ale emisja w praktyce zawsze bierze swój początek 
Jabłońskiego z najniższego stanu wzbudzonego S u a do tego rów¬ 
nież z najniższego, zerowego stanu oscylacyjnego 
(v — 0) tego stanu elektronowego. Dlaczego właści¬ 
wie nie obserwujemy fluorescencji z wyższych stanów 
wzbudzonych? Nasz diagram energetyczny jest wpra¬ 
wdzie przejrzysty, ale daleko odbiega od rzeczywistej 
sytuacji w wieloatomowej cząsteczce. Wiemy, że ze 
wzbudzeniem elektronowym związane jest również 
wzbudzenie oscylacji. Przypuśćmy, że wzbudziliśmy 
naszą cząsteczkę, tę, której odpowiada diagram na 
rys. 42, do drugiego wzbudzonego stanu singletowego 
S 2 i że to wzbudzenie sięga do poziomu oscylacyjnego 
np. v = 3. Nasz diagram tego nie pokazuje, bo cały 
rysunek stałby się nieczytelny, ale gdybyśmy chcieli 
uzupełnić go dalszymi poziomami oscylacyjnymi sta¬ 
nu Ś 2 , to okazałoby się, że w okolicy poziomu oscyla¬ 
cyjnego v = 3 w stanie S 2 znalazłoby się wiele pozio¬ 
mów oscylacyjnych stanu S 1 (poziomów o bardzo 
wysokich liczbach oscylacyjnych). Byłoby ich tym 
więcej im większa jest cząsteczka (pamiętamy, że 
liczba drgań normalnych rośnie z liczbą atomów w 
cząsteczce). Gęstość stanów oscylacyjnych stanu S x 
(ich liczba przypadająca na jednostkę odstępu ener¬ 
getycznego, np. na 1 cm” 1 ) w okolicy poziomu v = 3, 
stanu S 2 , jest bardzo duża — czasem tak duża, że od¬ 
stępy między poszczególnymi poziomami oscylacyj¬ 
nymi są nierozróżnialne i poziomy te tworzą pewien 
kwaziciągły obszar energii. Ta duża gęstość stanów 
oscylacyjnych niższego stanu elektronowego w ob¬ 
szarach energii odpowiadających wyższym stanom 
elektronowym stanowi właśnie w cząsteczce „kanał”, 
przez który energia wysokiego wzbudzenia elektro¬ 
nowego (w naszym przykładzie wzbudzenia do S z 
i v = 3) może zostać odprowadzona z wyższeg owzbu- 
dzonego stanu elektronowego do niższego stanu wzbu¬ 
dzonego (W i w ten sposób „rozdzielona” miedzy 
różne oscylacje tego stanu. W ten sposób energia 
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wzbudzenia elektronowego w wyższym stanie zostaje 
szybko zamieniona na energię oscylacji w niższym 
stanie. 

W podobny sposób przebiegać może powrót czą¬ 
steczki nie tylko ze stanu S 2 do Ą, ale również ze sta¬ 
nów wyższych S n do S ± (przy pośrednictwie stanów 
znajdujących się pomiędzy S n i 5i). Ogólnie rzecz 
biorąc, każde wzbudzenie do wyższych stanów wzbu¬ 
dzonych kończy się w efekcie tym, że cząsteczka bar¬ 
dzo szybko wraca do najniższego poziomu oscylacyj¬ 
nego pierwszego wzbudzonego stanu elektronowego 
S x . Doświadczenie pokazuje, że prawdopodobieństwo 
takiego powrotu z wyższych stanów wzbudzonych 
do pierwszego stanu wzbudzonego jest bardzo duże. 
Dodajmy jeszcze do tego, że również bardzo prawdo¬ 
podobnym procesem jest strata części energii wzbu¬ 
dzenia podczas zderzeń wzbudzonej cząsteczki z in¬ 
nymi cząsteczkami w ośrodku. Nie potrafimy jednak 
jeszcze określić, jaka część energii wzbudzenia tra¬ 
cona jest na tej drodze. 

Trochę inaczej wygląda sprawa przejścia cząsteczki 
ze stanu S x do stanu podstawowego S 0 - Oczywiście 
i w tym wypadku gęstość stanów oscylacyjnych stanu 
S 0 w obszarze zerowego stanu oscylacyjnego stanu S x 
jest ogromna i moglibyśmy spodziewać się również, 
że opisany poprzednio mechanizm będzie i teraz wy¬ 
dajny. Rzecz w tym jednak, że obraz, który podaliśmy, 
jest zbyt uproszczony. Gęstość stanów oscylacyjnych, 
to tylko jeden z czynników warunkujących omawiany 
mechanizm. Innym ważnym czynnikiem, o którym 
nie wspominaliśmy do tej pory, jest odstęp energii 
między poszczególnymi stanami elektronowymi. Otóż 
jeśli odstęp ten jest duży, to nawet wielka gęstość sta¬ 
nów oscylacyjnych nie wystarcza, aby zapewnić wy¬ 
dajną zamianę energii wzbudzenia elektronowego 
(do jednego z wyższych stanów) na energię oscylacji 
w stanie niższym. W cząsteczkach sytuacja jest na 
ogół taka, że odstęp energetyczny między stanem pod¬ 
stawowym S 0 a pierwszym wzbudzonym stanem sin- 
gletowym Si jest znacznie większy niż pomiędzy Si 
i S 2 i kolejnymi wyższymi stanami wzbudzonymi. To 
właśnie sprawia, że omówiony mechanizm jest znacz¬ 
nie mniej wydajny i ważny dla przejścia S ± S 0 niż 
dla przejść S 2 S l9 S 3 ^> S 2 , itp. Proces powrotu czą¬ 
steczki z wyższych stanów singletowych do niższych 
jest procesem bardzo szybkim i zachodzi w czasie, 
który średnio zawarty jest w przedziale 10” n -10“ 14 s. 
W porównaniu z nim proces S x S 0 jest procesem bar¬ 
dzo wolnym, gdyż charakterystyczny dla niego czas 
jest rzędu 10“ 5 -10” 7 s. 

Przejścia S n S n -i, ..., S Z ^S 1 , S x vw>S 0 są przejś¬ 
ciami, w których energia wzbudzenia tracona przez 
cząsteczkę nie jest zamieniana na energię kwantów 
promieniowania elektromagnetycznego. Takie przej¬ 
ścia noszą ogólną nazwę przejść bezpromienistych 
(oznacza się je czasem i my będziemy się takiego ozna¬ 
czenia trzymali, liniami falistymi). Przejścia bezpro- 
mieniste zachodzące między stanami o tej samej multi- 
pletowości, jak w omawianym przez nas wypadku, 
nazywają się konwersją wewnętrzną. 

Jakie mogą być dalsze losy cząsteczki, która po 
wzbudzeniu znalazła się, w wyniku szybkich przejść 
bezpromienistych, w stanie wzbudzonym Ą? Wiemy 
już, że może ona powrócić bezpromieniście do stanu 
podstawowego óo, chociaż proces takiego powrotu 
nie należy do zbyt wydajnj'ch. Drugą możliwością, 
którą teraz szerzej się zajmiemy, jest powrót promie¬ 
nisty. Jego rezultatem jest emisja promieniowania 
i takie właśnie procesy prowadzą do obserwacji widm 
emisyjnych. Emisja ta nazywa się fluorescencją. Sta¬ 
ranne badania wykazały, że charakterystyczny czas 
przejść promienistych, w większości badanych czą¬ 
steczek, zawiera się w granicach 10 -7 -10~ 3 s. A zatem 
fluorescencją może z powodzeniem konkurować z we¬ 
wnętrzną konwersją S 1 ~*S 0 w cząsteczce. Staje się 
jednocześnie zrozumiałym fakt, dlaczego w praktyce 
obserwowana fluorescencją bierze swój początek za¬ 
wsze ze stanu Ą. 
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przejścia Wewnętrzna konwersja i emisja S x S 0 nie 

między- są jedynymi możliwymi procesami, w wyniku których 
systemowe opróżniany jest wzbudzony stan singletowy Ą. Na 
rys. 42 zaznaczony jest jeszcze jeden proces polegający 
na bezpromienistym przejściu ze stanu Si do stanu 
trypletowego Ti. Przejście takie, zwane przejściem 
międzysystemowym, przeprowadza cząsteczkę do 
stanu o innej multipletowości niż stan wyjściowy 
i chociaż wiemy, że przejścia ze zmianą multipleto¬ 
wości są na ogół bardzo mało prawdopodobne, to 
wbrew naszym przypuszczeniom przejścia takie są 
w cząsteczkach zjawiskiem dosyć powszechnym. Czyn¬ 
nikiem umożliwiającym występowanie przejść mię- 
dzysystemowych jest obecność tzw. sprzężenia spin- 
-orbita. Jest ono rezultatem oddziaływania pomiędzy 
momentami magnetycznymi, orbitalnymi i spinowy¬ 
mi elektronów w cząsteczce. 

Zanim zajmiemy się bardziej szczegółowym omó¬ 
wieniem widm fluorescencji cząsteczek, zapoznamy 
się pokrótce z najważniejszymi wielkościami charak¬ 
teryzującymi emisję i widma emisyjne cząsteczek. 
Wielkości te są zazwyczaj wyznaczane w pomiarach 
luminescencyjnych i stanowią podstawową informację 
widmo o widmie fluorescencyjnym, a tym samym o stanie 
fluorescencji wzbudzonym, z którego bierze początek fluorescencja. 

Pozwalają one również na ocenę prawdopodobień¬ 
stwa zachodzenia innych (na ogół bezpromienistych) 
procesów w tych stanach. Najważniejszymi wielko¬ 
ściami charakteryzującymi fluorescencję są: energia, 
czas zaniku i wydajność kwantowa. 

Spośród tych trzech wielkości energia jest tą, którą 
wyznacza się najłatwiej, bo z bezpośredniej obserwacji 
widma fluorescencji. Podobnie jak i przy przejściach 
absorpcyjnych, również i dla przejść emisyjnych słusz- 


fluorescencji odpowiada oscylacjom w stanie podsta¬ 
wowym, gdyż przejścia ze stanu wzbudzonego pro¬ 
wadzą do różnych stanów oscylacyjnych stanu pod¬ 
stawowego. Zwróćmy również uwagę na to, że przej¬ 
ście emisyjne 0-0 jest przejściem o najwyższej energii 
w widmie fluorescencji, a więc przejściem najbardziej 
krótkofalowym. Z drugiej strony przejście 0-0 w wid¬ 
mie absorpcyjnym jest przejściem najniższej energii 
(porównaj rys. 32, 33, 34), tzn. najbardziej długofalo¬ 
wym w widmie absorpcyjnym. W obu wypadkach 
energia przejścia 0-0 jest przynajmniej teoretycznie 
jednakowa i wobec tego jest to jedyne przejście wspól¬ 
ne dla obu widm. A zatem możemy oczekiwać, że 
widmo fluorescencji będzie zawsze leżało w obszarze 
bardziej długofalowym niż widmo absorpcji (to spo- reguła 
strzeżenie nazywa się czasem regułą Stokesa, a prze- Stokesa 
sunięcie między widmem absorpcji i fluorescencji — 
przesunięciem Stokesa lub stokesowskim). Możemy 
również spodziewać się, że między widmem absorpcji 
i fluorescencji występować będzie zwierciadlana sy¬ 
metria, szczególnie wyraźna wtedy, gdy oscylacje 
cząsteczki w stanie podstawowym i w stanie wzbudzo¬ 
nym nie będą się różniły. Długość fali wspólna dla 
obu widm (albo inaczej punkt przecięcia widm absor¬ 
pcji i emisji) wyznacza w takich wypadkach energię 
przejścia 0-0, a więc i odstęp energetyczny między 
stanem podstawowym i wzbudzonym. 

Oczywiście nasze oczekiwania, jak zresztą zawsze, 
dotyczą przypadków idealnych, z którymi w praktyce 
prawie nigdy się nie stykamy. Wspomniana, symetria 
zwierciadlana jest tylko symetrią przybliżoną, a nigdy 
dokładną, co widać na rys. 44. Podobnie w widmie 
cząsteczki znajdującej się w roztworze przejścia 0-0 
w absorpcji i emisji mają z reguły inną energię. 
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Rys. 43. Ilustracja zasa¬ 
dy Francka-Condona i 
rozkład natężeń w wid¬ 
mie emisyjnym 


na i obowiązująca jest zasada Francka-Condona. 
Bez trudu zatem potrafimy sobie wyobrazić, jak 
może wyglądać widmo, jeżeli tylko wiemy jak wy¬ 
glądają odpowiednie krzywe energii potencjalnej sta¬ 
nu wzbudzonego i podstawowego. Znaną już nam 
ilustrację zasady Francka-Condona przedstawia rys. 
43, tym razem jednak w zastosowaniu do procesu 
emisji. Nietrudno jest zrozumieć, że sytuacja taka jak 
na rys. 43 prowadzi do widma fluorescencji, w którym 
największe natężenie winno mieć pasmo oscylacyjne 
0-2, a rozkład natężeń w obrębie całego pasma elek¬ 
tronowego taki jak pokazany u dołu rysunku. Zwróć¬ 
my uwagę na fakt, że struktura oscylacyjna widma 



Rys. 44. Widmo absorpcji i fluorescencji cząsteczki antracenu. 
Strzałki pokazują położenie przejścia 0-0 w emisji (/) i absorpcji (2) 


Zajmiemy się teraz czasem życia stanu wzbudzo¬ 
nego i czasem zaniku fluorescencji. Jeżeli cząsteczka 
znajduje się w stanie wzbudzonym, a jedyną drogą jej 
powrotu do stanu podstawowego jest przejście pro¬ 
mieniste (nieobecne lub nieaktywne są wszelkie pro¬ 
cesy bezpromienistej dezaktywacji), to szybkość, 
z jaką zachodzi proces promienisty, określa znany 
już nam współczynnik Einsteina emisji spontanicznej 
Aa (przejście j->i). Mówiąc inaczej współczynnik ten 
jest stałą szybkości zaniku stanu wzbudzonego na 
drodze promienistej, gdy nieobecne są wszystkie inne 
konkurencyjne procesy dezaktywacyjne (bezpromie- 
niste). Odwrotność stałej szybkości jest naturalnym promienisty 
czasem życia r 0 stanu wzbudzonego ze względu na czas życia 
emisję, albo jak często mówimy — promienistym 
czasem życia; r 0 = l/Aju Wiemy, że Au jest pro¬ 
porcjonalne do Ba — współczynnika absorpcji. Wo¬ 
bec tego bez trudu domyślimy się, iż możliwe jest 
ustalenie związków między naturalnym czasem życia 
stanu wzbudzonego i wielkościami charakteryzują¬ 
cymi przejście absorpcyjne do tego stanu. Mamy 
wszelkie podstawy, aby spodziewać się, że własności 
stanu wzbudzonego warunkujące absorpcję i emisję 
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nie są wielkościami od siebie niezależnymi, lecz że są 
współzależne i że znając jedne potrafimy określić 
czy przewidzieć drugie. Tak jest w istocie. Można po¬ 
dać szereg związków łączących naturalny czas życia 
z wyznaczonymi doświadczalnie wielkościami cha¬ 
rakteryzującymi widma absorpcyjne. Na przykład 
jednym z takich związków jest poniższa zależność: 

t 0 * 3,5-10 8 (? 2 -Jv 1/2 £ max )-i; 

tutaj v 2 jest średnią częstością pasma absorpcyjnego, 
Av m — szerokością połówkową pasma, .Ema* — 
współczynnikiem ekstynkcji w maksimum pasma. 
Korzystając z tej zależności spróbujemy oszacować, 
jakiego rzędu jest naturalny czas życia wzbudzonego 
stanu singletowego typowej cząsteczki. W przypadku 
cząsteczek organicznych (np. węgiowodorów aroma¬ 
tycznych) ekstynkcja pasm dozwolonych, leżących 
w obszarze około 30 000 cm -1 , jest rzędu ok. 10 4 -10 5 , 
co przy typowych szerokościach połówkowych rzędu 
kilku tysięcy cm -1 prowadzi do wniosku, że naturalny 
czas życia jest rzędu 10~ 8 -10 _ ® s. 

Podana wyżej zależność wykazuje, że im bardziej 
jest prawdopodobne jakieś absorpcyjne przejście 
elektronowe (tzn. im większe jest jego natężenie), tym 
krótszy jest naturalny czas życia stanu wzbudzonego 
osiąganego w wyniku takiego przejścia. Oznacza to 
z kolei, że tym większa jest możliwość, że przejście 
odwrotne ze stanu wzbudzonego do podstawowego 
będzie przejściem promienistym, a więc odbywają¬ 
cym się z emisją promieniowania. 

Mówiliśmy w swoim czasie o przejściach wzbronio¬ 
nych, wskazując na to, iż są one mało prawdopo¬ 
dobne, a więc mają bardzo niskie natężenie w porów¬ 
naniu z natężeniem przejść dozwolonych. Podaliśmy 
liczbę 10® jako czynnik wskazujący, ile razy średnio 
niższe natężenie mają przejścia zakazane ze względu 
na zmianę multipletowości, a więc np. przejścia 
S q ^T x . Istotnie przejścia absorpcyjne S 0 ^T lt które 
w pewnych szczególnych warunkach można czasem 
obserwować, mają bardzo małe natężenie — współ¬ 
czynniki ekstynkcji są rzędu KkMO" 3 . Nietrudno jest 
stany wobec tego ustalić, że promienisty czas życia stanu 
metatrwałe trypletowego T u musi być rzędu 10 -3 s lub dłuższy. 

Stany o tak długim promienistym czasie życia nazy¬ 
wane są stanami metatrwałymi. Zrozumiałe jest też, 
że emisja z tych stanów jest w normalnych warunkach 
bardzo mało prawdopodobna, a o konsekwencjach 
takiego stanu rzeczy będziemy jeszcze mówić. 

Podkreślmy raz jeszcze, że promieniste czasy życia 
określają średni czas życia stanu wzbudzonego tylko 
i wyłącznie ze względu na promienisty powrót czą¬ 
steczki z tych stanów. Promienisty czas życia może 
być traktowany jako średni czas życia cząsteczki w 
danym stanie wzbudzonym tylko wtedy, gdy niemoż¬ 
liwe są żadne inne drogi powrotu cząsteczki do stanu 
podstawowego. Obserwowane wtedy natężenie fluo- 
rescencji, po przerwaniu wzbudzenia, maleje zgodnie 
z prawem wykładniczego zaniku: I — / 0 e“* /T °, gdzie 
/o jest początkowym natężeniem fluorescencji, /— 
natężeniem po czasie t , a r 0 — promienistym (natu¬ 
ralnym) czasem życia stanu. Po czasie t = t 0 natę- 
czas zaniku żenie wynosi I — / 0 /e, czyli zmniejsza się e razy. 
fluorescencji Taki czas, po którym natężenie fluorescencji zmniejsza 
się e razy, nazywa się czasem zaniku fluorescencji. 
Wtedy gdy emisja jest jedyną drogą dezaktywacji 
stanu wzbudzonego, czas zaniku fluorescencji jest 
równy promienistemu czasowi życia stanu. 

Obserwowany czas zaniku fluorescencji jest zawsze 
inny niż czas promienisty, gdyż całkowita szybkość 
opróżniania stanu wzbudzonego jest sumą szybkości 
wszystkich procesów, zarówno promienistych jak 
i bezpromienistych, i wobec tego czas zaniku fluo¬ 
rescencj i t = 1 /(ke+ki). Przez k e oznaczyliśmy tutaj 
stałą szybkości przejścia promienistego, a przez ki 
sumaryczną stałą szybkości wszystkich procesów bez¬ 
promienistych (konwersji wewnętrznej, bezpromieni- 
stego przejścia międzysystemowego itp.). Ponieważ 
naturalny czas życia jest równy r 0 = l/k e , wobec tego 
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czas zaniku fluorescencji jest zawsze krótszy niż na¬ 
turalny, promienisty czas życia. Procesy bezpromie- 
niste skracają czasy zaniku fluorescencji, a zatem ba¬ 
danie czasów zaniku fluorescencji w funkcji różnych 
czynników zewnętrznych lub wewnętrznych może być 
źródłem informacji o procesach dezaktywacyjnych. 

Poświęćmy teraz trochę uwagi trzeciej wielkości wydajność 
charakteryzującej fluorescencj ę. Jest nią wydajność kwantowa 
kwantowa fluorescencji, którą definiuje się jako: fluorescencji 

wydajność kwantowa _ liczba kwantów wyemitowanych 
fluorescencji liczba kwantów zaabsorbowanych 

Jeżeli jedyną możliwą drogą opróżniania stanu wzbu¬ 
dzonego byłyby przejścia promieniste, to oczywiście 
każdemu kwantowi zaabsorbowanemu w układzie 
odpowiadałby kwant wyemitowany i wydajność kwan¬ 
towa byłaby równa 1. Ponieważ jednak w praktyce 
z taką sytuacją nigdy nie mamy do czynienia, wobec 
tego i wydajność kwantowa fluorescencji jest zawsze 
mniejsza od jedności. Można pokazać, że wydajność 
kwantowa 

ke+kt ’ 

gdzie ke , tak jak poprzednio, jest stałą szybkości 
przejścia promienistego, a ki — sumaryczną stałą 
szybkości wszystkich procesów bezpromienistych. 

Możemy teraz ustalić związki pomiędzy wydajno¬ 
ścią kwantową, a czasem zaniku fluorescencji r i pro¬ 
mienistym czasem życia. Jeśli wykorzystamy podane 
poprzednio zależności, to znajdziemy, że 

0 = k e r lub = t/t 0 . 

Zauważyliśmy już na pewno, że pomiar czasu za¬ 
niku i wydajności kwantowej fluorescencji pozwala 
na wyznaczenie stałych szybkości k e i ku Niestety, 
ani pomiary czasu zaniku, ani pomiary wydajności 
kwantowych nie są doświadczalnie łatwe i wymagają 
stosowania specjalnych, czasem bardzo precyzyjnych 
technik pomiarowych. Dlatego też, chociaż obserwacja 
i badanie widm fluorescencyjnych jest na ogół zada¬ 
niem niezbyt skomplikowanym (ale niekoniecznie 
łatwym), to uzyskanie pełnego obrazu mechaniz¬ 
mów i procesów zachodzących w stanach wzbudzo¬ 
nych cząsteczek jest zadaniem bardzo trudnym i nie 
zawsze do końca wykonalnym. 

Jak wynika z rys. 42, stan $i może dezaktywować się 
nie tylko na skutek przejścia promienistego (fluore¬ 
scencji) oraz wewnętrznej konwersji, ale również 
w wyniku przejścia bezpromienistego do stanu try- 
pletowego T x . Wspominaliśmy już, że z przejściem 
tym, zwanym przejściem międzysy stemowy m, zwią¬ 
zana jest zmiana multipletowości (spinu). I chociaż 
przejścia ze zmianą multipletowości są przejściami 
o bardzo małym prawdopodobieństwie, to jednak 
w wyniku sprzężenia spin-orbita są one silnie wzmac¬ 
niane. Okazuje się, że w wieloatomowych cząstecz¬ 
kach przejścia Si T x mogą nawet konkurować 
z fluorescencją i przewyższać swoją szybkością proces 
konwersji wewnętrznej S x ^ S 0 . Typowe stałe szyb¬ 
kości kisc przejść S x T x są rzędu 10M0 7 s” 1 . 

A więc istotnie jest to jeszcze jeden ważny sposób 
dezaktywacji bezpromienistej stanu singletowego S x . 

Fakt ten ma bardzo ważne i interesujące konsek¬ 
wencje i te za chwilę poznamy. 

W wyniku przejścia bezpromienistego S x T x 
cząsteczka przechodzi do wzbudzonego stanu tryple- 
towego. Innym sposobem osiągnięcia stanu T x byłaby 
bezpośrednia absorpcja promieniowania przez czą¬ 
steczkę w stanie podstawowym S 0 z przejściem So-^T^ 

Wyjaśniliśmy już poprzednio, że przejście takie ma 
znikomo małe natężenie w porównaniu z przejściami 
dozwolonymi, a nawet w porównaniu z przejściami 
wzbronionymi, np. ze względu na symetrię. Oczywi¬ 
ście jeśli istnieje sprzężenie spin-orbita w cząsteczce 
przejście So->T t będzie wzmacniane i moglibyśmy 
oczekiwać, że będzie ono wzmacniane w takim samym 






stopniu, jak przejście T x . Tak jednak nie jest, 
gdyż i w tym wypadku istotną rolę w wielkości wzmoc¬ 
nienia przejścia odgrywa wspomniany już przez nas 
czynnik odstępu energetycznego pomiędzy oddziału¬ 
jącymi stanami. Odległość między S 0 i 7\ jest z reguły 
dużo większa niż odległość między Ą i Ti i to wła¬ 
śnie sprawia, że oba przejścia nie są jednakowo praw¬ 
dopodobne. 

Moglibyśmy zapytać się, czy ta różnica ma jakieś 
istotne następstwa? Otóż tak, różnica ta ma konsek¬ 
wencje natury praktycznej. Bardzo małe prawdopo¬ 
dobieństwo absorpcji 5 0 -*7\ sprawia, że w ten spo¬ 
sób właściwie nie można osiągnąć stanu trypletowego; 
oczywiście w zbiorze cząsteczek stan trypletowy jest 
osiągalny w wyniku absorpcji Ą-*7i, ale procent 
ogólnej liczby cząsteczek wzbudzonych w ten sposób 
do stanu T\ jest znikomo mały — nie do wykrycia 
zwykłymi metodami. Mówimy, że obsadzenie (po¬ 
pulacja) stanu Ti osiągane w ten sposób jest niemie¬ 
rzalnie małe. Skoro tak, to pozostaje nam ewentual¬ 
nie próba osiągnięcia stanu trypletowego w bardziej 
skomplikowany sposób, a więc przez wzbudzenie 
cząsteczek do stanu singletowego Si (lub wyższego) 
w nadziei, że przejście bezpromieniste S 2 ^ 7i bę¬ 
dzie procesem na tyle wydajnym, ażeby liczba czą¬ 
steczek przechodzących do stanu 7\ stanowiła znaczny 
procent ogólnej liczby cząsteczek wzbudzonych. Tak 
też jest w istocie. Zaproponowany przez nas sposób 
osiągania znacznego obsadzenia stanu trypletowego 
jest realizowany w cząsteczkach i stanowi właściwie 
jedyny sposób obsadzania stanu trypletowego. 

Cząsteczka, która znalazła się w stanie trypleto- 
wym 7\, ma teraz do wyboru zasadniczo dwa sposoby 
opuszczenia tego stanu. Może tego dokonać albo przez 
przejście promieniste T^So albo przejście bezpro¬ 
mieniste 7\ ^ S 0 . Przejściu promienistemu towarzyszy 
oczywiście emisja. Jest to jednak emisja różna od 
znanej nam już fluorescencji i dla odróżnienia od niej 
fosfores- nazywana fosforescencją. Po pierwsze jest ona, jak 
cencja wynika ze schematu energetycznego cząsteczki (rys. 
42), bardziej długofalowa niż fluorescencja. Po drugie, 
mówiąc o czasach życia stanów wzbudzonych doszli¬ 
śmy do wniosku, że dla stanu trypletowego czas ten 
jest znacznie dłuższy niż dla stanu singletowego. 
Oczywiście i czas zaniku fosforescencji będzie wobec 
tego znacznie dłuższy od czasu zaniku fluorescencji. 
Czas ten, przez analogię do czasu zaniku fluorescencji, 
możemy wyrazić jako r p = l/(k p +kd), gdzie tym razem 
k p jest stałą szybkości przejścia promienistego T^S 0> 
a ka — stałą szybkości przejścia bezpromienistego 
Ti S 0 . Dosyć trudno jest podać typowe czasy za¬ 
niku fosforescencji, a to dlatego, że są one bardzo za¬ 
leżne od warunków zewnętrznych. Na przykład czas 
zaniku fosforescencji cząsteczki naftalenu może zmie¬ 
niać się blisko milion razy w zależności od tego, w ja¬ 
kim ośrodku fosforescencją jest obserwowana. W 
ośrodku ciekłym, w temperaturze pokojowej, może 
on być rzędu 10“ 5 s, a w ośrodku usztywnionym (w tak 
zwanym szkliwie niskotemperaturowym, które uzy¬ 
skuje się przez ochłodzenie mieszaniny pewnych wę¬ 
glowodorów do temperatury ciekłego azotu, tj. do 
77 K) może sięgać 2 s. Te ogromne zmiany czasu za¬ 
niku wynikają głównie z tego, że promienisty czas 
życia stanu trypletowego jest długi i wobec tego stan 
ten może ulegać dezaktywacjom bezpromienistym 
w wyniku zderzeń z cząsteczkami ośrodka i taka deza¬ 
ktywacja— bardzo wydajna w ośrodku ciekłym — 
może być w znacznym stopniu zahamowana w ośrod¬ 
ku usztywnionym, gdzie cząsteczki nie mają swobody 
ruchu. Konsekwencją takiego stanu rzeczy jest fakt, 
że fosforescencji — w odróżnieniu od fluorescencji — 
nie można w praktyce zaobserwować w ośrodkach 
ciekłych, można ją dopiero zaobserwować w ośrod¬ 
kach usztywnionych. Na rys. 45 dla ilustracji naszych 
wywodów pokazano schematy energetyczne dwóch 
różnych cząsteczek, podano wartości stałych szyb¬ 
kości różnych procesów promienistych i bezpromie- 
nistych, a także widma fluorescencji i fosforescencji. 


Patrząc na ten rysunek, można zadać pytanie, w ja¬ 
ki sposób wyznaczono te wszystkie stałe szybkości. 
Sprawa niestety nie jest prosta i uzyskanie pełnego 
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Rys. 45. Schemat poziomów i widmo emisji: a) cząsteczki chlo- 
ronaftalenu; stała szybkość przejścia bezpromienistego 
jest tylko nieco większa od stałej szybkości przejścia promieni¬ 
stego S t —► S 0 i w widmie emisji można obserwować zarówno 
fluorescencję jak i fosforescencję — pasmo ok. 20000 cm -1 ; 
b) cząsteczki benzofenonu; stała szybkości przejścia bezpromie¬ 
nistego SjW- Tj jest blisko 10 000 razy większa niż stała szybkości 
przejścia promienistego S x -+ S 0 i dla tej cząsteczki w ogóle nic 
obserwuje się fluorescencji, jej emisja — to wyłącznie fosfore- 
sccncja 


obrazu procesów zachodzących w stanach wzbudzo¬ 
nych jest rzeczą raczej dosyć trudną, a czasem wręcz 
niemożliwą. Podstawowe informacje uzyskuje się 
oczywiście z pomiarów czasów zaniku fluorescencji 
i fosforescencji oraz z pomiarów ich wydajności kwan¬ 
towych. Dla fosforescencji, tak jak i dla fluorescencji, wydajność 
można zdefiniować wydajność kwantową, chociaż kwantowa 
tym razem odpowiednie wyrażenie będzie bardziej fosforescen- 
złożone i będzie musiało zawierać również stałą szyb- cji 
kości przejścia bezpromienistego S x Ti, w wyniku 
którego obsadzone są tryplety. Oczywiście uzyskane 
z pomiarów czasów zaniku i wydajności informacje 
są na ogół niewystarczające i trzeba się uciekać do 
innych pomiarów pomocniczych, bądź też czynić róż¬ 
ne założenia upraszczające problem. Dodatkowe kom¬ 
plikacje wynikają z faktu, że nasze schematy obrazują 
cząsteczkę izolowaną. W rzeczywistości cząsteczka 
występuje zawsze w pewnym otoczeniu, z którym 
w mniejszym lub większym stopniu oddziałuje. Te 
oddziaływania wywołują różne procesy (o niektórych 
z nich będziemy jeszcze mówili), które znakomicie 
komplikują podany schemat dezaktywacji. Chcąc 
uwzględnić te dodatkowe procesy musimy wprowa¬ 
dzić do naszego schematu opisujące je dodatkowe 
stałe szybkości (oczywiście musimy sobie przedtem 
zdawać sprawę z tego, jaki jest mechanizm tych pro¬ 
cesów—jak one przebiegają). Nakreślony obraz jest 
zapewne zniechęcający, ale naprawdę nie jest aż tak 
źle i w wielu wypadkach potrafimy poradzić sobie 
z rozwikłaniem tych problemów, jeśli nawet niezu¬ 
pełnie ściśle, to na ogół z dokładnością wystarczającą 
do wyrobienia sobie poglądu na to, co się dzieje i co 
może się dziać ze wzbudzoną cząsteczką. Niestety, nie 
będziemy tutaj mogli przedstawić różnych metod 
eksperymentalnych i sposobów postępowania, za po¬ 
mocą których rozwiązuje się tego typu problemy; 
wszystkich, którzy pragną osiągnąć wyższy stopień 
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wtajemniczenia odsyłamy do literatury tego przed¬ 
miotu, podanej na końcu tego rozdziału. 

Fluorescencja biorąca swój początek ze stanu sing- 
letowego Si i fosforescencja biorąca początek ze 
stanu trypletowego T x nie wyczerpują problemu pro- 
fluorescencja cesów emisyjnych, z jakimi można się spotkać w czą- 
opóźniona steczce. Czasem można zaobserwować emisję, któ¬ 
rej mechanizm jest bardziej złożony niż poznane do¬ 
tychczas. Opisując różne przejścia promieniste i bez- 
promieniste pominęliśmy bowiem jeszcze jedną moż¬ 
liwość, polegającą na przejściu odwrotnym T x S x . 
Ponieważ stan T x ma niższą energię niż stan S u przej¬ 
ście takie wymaga dodatkowej energii, która musi 
być dostarczona cząsteczce z zewnątrz, np. w wyniku 
zderzenia z cząsteczkami ośrodka. Przejście takie wy¬ 
maga, jak mówimy, pewnej energii aktywacji. Jeżeli 
odstęp pomiędzy stanami S t i T x nie jest zbyt duży, 
to energia ruchów cieplnych w ośrodku może okazać 
się wystarczająca do zaktywizowania przejścia 7\vw> s x . 
W ten sposób cząsteczka znajdzie się z powrotem 
w stanie S u a stąd może powrócić do stanu podsta¬ 
wowego, np. w wyniku przejścia promienistego, emi¬ 
tując oczywiście promieniowanie. Ciąg procesów pro¬ 
wadzących do takiej emisji jest następujący: absorpcja 
S 0 -*■ S u bezpromieniste przejście Ą T u przej¬ 
ście aktywowane termicznie S x i wreszcie emi¬ 
sja S x -> S 0 . Widmo takiej emisji pokrywa się z wid¬ 
mem fluorescencji, ale między tymi dwoma rodzajami 
emisji jest istotna różnica. Cząsteczka, która przeby¬ 
wała w stanie trypletowym i powróciła do stanu sing- 
letowego, przebywała w stanie wzbudzonym (a ści¬ 
ślej w dwóch stanach wzbudzonych) znacznie dłużej 
niż cząsteczka, która powróciła do stanu podstawo¬ 
wego bezpośrednio ze wzbudzonego stanu singleto- 
wego. A zatem czasy zaniku obu fluorescencji są inne. 
Dlatego też emisja, o której mówimy, nazywa się 
fluorescencją opóźnioną, a jej czas zaniku jest okre¬ 
ślony przez czas życia stanu trypletowego. 

Poznaliśmy różne typy emisji prowadzące do róż¬ 
nych widm emisyjnych w cząsteczkach. Poznaliśmy 
również różne procesy bezpromieniste konkurujące 
z emisją, bądź też czasem umożliwiające jej obser¬ 
wację (jak to się dzieje z obserwacją fosforescencji 
i przejściem bezpromienistym S x ^ T t ). Oczywiście, 
to czy dla danej cząsteczki można obserwować fluo- 
rescencję czy fosforescencję, czy też obie jednocze¬ 
śnie, a także czy nie można ich w ogóle obserwować, 
zależy przede wszystkim od budowy, struktury elek¬ 
tronowej cząsteczki i innych naturalnych czynników, 
takich jak np. sprzężenie spin-orbita, które możemy 
określić ogólnym mianem — własności cząsteczki. 
Zdajemy sobie również sprawę, że bardzo /ażną rolę 
w obserwacji widm emisji cząsteczek o 'grywają wła¬ 
sności ośrodka, które mogą zarówno wzmacniać, jak 
i osłabiać emisję. Znając naturalne własności cząstecz¬ 
ki i ośrodka, w którym się znajduje, możemy przewi¬ 
dywać, jak wygląda emisja i jej podstawowe para¬ 
metry, takie jak czas zaniku i wydajność. I odwrotnie, 
badając widma emisyjne i ich parametry możemy 
wnioskować o budowie i własnościach cząsteczki 
(a także i ośrodka, w którym cząsteczka się znajduje) 
oraz o ewentualnych oddziaływaniach międzycząstecz- 
kowych. Dlatego też na zakończenie naszych roz¬ 
ważań podamy przykład takich oddziaływań, o któ¬ 
rych można wnioskować na podstawie badania widm 
emisji. 

fłuores- Zacznijmy od przykładu, który ilustruje rys. 46. 
cencja Rysunek ten przedstawia zmiany, jakim ulega widmo 
pyrenu fluorescencji pyrenu, wtedy gdy zmieniane jest stęże¬ 
nie pyrenu w roztworze. Gdy stężenie pyrenu jest 
stosunkowo niskie, wówczas jego widmo fluorescencji 
jest takie, jak widmo 4 na rys. 46. Kiedy stężenie py¬ 
renu w roztworze wzrasta (kolejne widma 3, 2 i V) 
natężenie tego pasma fluorescencji maleje, a jednocze¬ 
śnie pojawia się nowe pasmo fluorescencji, bardziej 
długofalowe i pozbawione struktury oscylacyjnej. Na¬ 
tężenie tego drugiego pasma wzrasta w miarę wzrostu 
stężenia, a natężenie pierwotnego pasma maleje. Mó- 
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wimy, że fluorescencja ta jest wygaszona, co możemy 
dokładnie prześledzić na przykładzie widm 5, 2 y 1 
na rysunku. Dodajmy jednocześnie, że w widmie 



Rys. 46. Widmo pyrenu w roztworze w różnym stężeniu: 4 ni¬ 
skie stężenie pyrenu, 3, 2, 1 stężenie coraz większe. Pozbawione 
struktury pasmo o maksimum przy ok. 470 nm jest pasmem 
fluorescencji ekscimerów 


absorpcji nie obserwuje się żadnych zmian przy zmia¬ 
nach stężenia. Co jest przyczyną obserwowanych 
zmian widma fluorescencji? Może i tutaj, tak jak 
w przypadku kompleksów z przeniesieniem ładunku, 
mamy do czynienia z powstawaniem kompleksów. 

Otóż tak jest w istocie, ale są to innego rodzaju kom¬ 
pleksy. Brak zmian widma absorpcji świadczy o tym, 
że kompleksy te nie mogą być tworzone w stanie pod¬ 
stawowym, innymi słowy, cząsteczki pyrenu w stanie 
podstawowym nie oddziałują ze sobą wzajemnie, 
a ściślej mówiąc siły, z jakimi na siebie oddziałują, 
są tak słabe, że nie prowadzą do wytworzenia kom¬ 
pleksu w stanie podstawowym. Kompleksy takie po¬ 
wstają jednak w stanie wzbudzonym, o czym właśnie 
świadczą obserwowane zmiany w widmie fluorescencji. 

Dokładne badania ujawniły, że kompleksy te, zwane 
ekscimerami, powstają w rezultacie oddziaływania 
dwóch cząsteczek pyrenu—jednej wzbudzonej, dru¬ 
giej niewzbudzonej. Nie będziemy tutaj dociekali cha¬ 
rakteru takich oddziaływań i bez ich znajomości po¬ 
trafimy zrozumieć, dlaczego do utworzenia ekscimeru 
i zaobserwowania zmian w widmie potrzebne jest 
duże stężenie cząsteczek w roztworze. Aby mógł po¬ 
wstać ekscimer z dwóch cząsteczek, z których jedna ekscimery 
jest wzbudzona, a druga znajduje się w stanie pod¬ 
stawowym, obie cząsteczki muszą znaleźć się do¬ 
statecznie blisko jedna od drugiej. Przy tym spotkanie 
takie musi nastąpić w czasie krótszym niż czas życia 
wzbudzonej cząsteczki (a jest on w tym wypadku rzę¬ 
du 3 • 10“ 7 s). Jest rzeczą zrozumiałą, że im więcej jest 
cząsteczek w roztworze, tym większa jest szansa, że 
w tak krótkim czasie cząsteczką wzbudzona natrafi 
na cząsteczkę niewzbudzoną, bądź odwrotnie, i po¬ 
wstanie wzbudzony kompleks — ekscimer, którego 
jedną z własności jest to, że najniższy stan, z które¬ 
go zachodzi emisja, ma niższą energię niż wzbu¬ 
dzony stan singletowy swobodnej cząsteczki pyre¬ 
nu. Stąd też fluorescencja ekscimeru jest zawsze 
bardziej długofalowa niż fluorescencja cząsteczki 
pyrenu (ta ostatnia, w kontekście omawianych 
kompleksów, nazywana jest czasem fluorescencją 
monomerową). 

Znamy wiele cząsteczek, które mogą tworzyć kom¬ 
pleksy w stanie wzbudzonym. Okazuje się ponadto, 
że kompleksy takie mogą być również tworzone po- 
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między różnymi cząsteczkami, z których jedne są 
wzbudzone, a drugie w stanie podstawowym. Takie 
kompleksy nazywane są heteroekscimerami lub eks- 
cipleksami. I w takich przypadkach obserwujemy wy¬ 
gaszanie widma fluorescencj i jednej z cząsteczek, przy 
wzroście stężenia drugiej cząsteczki (niewzbudzonej) 
w roztworze, z jednoczesnym pojawieniem się nowego 
pasma fluorescencj i — fluorescencji kompleksu. 

Na zakończenie wspomnimy jeszcze o pewnej nie¬ 
zwykle ważnej kategorii zjawisk, które są przedmio¬ 
tem badań spektroskopii molekularnej i które ujaw¬ 
niają się przez zmiany widm fluorescencji bądź fos- 
forescencji. Zjawiska te określamy ogólną nazwą mię- 
dzycząsteczkowego przenoszenia energii wzbudzenia. 
Procesy przenoszenia energii polegają na bezpromie- 
nistym przenoszeniu energii wzbudzenia elektrono¬ 
wego od wzbudzonej cząsteczki zwanej donorem do 
niewzbudzonej cząsteczki zwanej akceptorem. Re¬ 
zultatem przenoszenia energii jest powrót wzbudzo¬ 
nego donora do stanu podstawowego i przejście nie- 
wzbudzonego akceptora do stanu wzbudzonego. 
Schematycznie proces taki możemy zapisać nastę¬ 
pująco : 

D+hv -> D*+A A*+D , 

gdzie D i A oznaczają cząsteczki donora i akceptora 
w ich stanach podstawowych, a A * i D* — ich stany 
wzbudzone. 


Mechanizmy fizyczne przenoszenia energii są róż¬ 
ne i zależą między innymi od tego, z jakich stanów 
donora (singletowego czy trypletowego) do jakich 
stanę w akceptora jest ona przeznoszona. Aby proces 
przenoszenia energii był efektywny, wymagany jest 
w niektórych wypadkach bezpośredni kontakt czą¬ 
steczki donora i akceptora — tak jest wtedy, gdy 
energia przenoszona jest między stanami trypletowy- 
mi donora i akceptora. W innych wypadkach taki 
bezpośredni kontakt nie jest w ogóle potrzebny i ener¬ 
gia wzbudzenia może być przenoszona na bardzo 
znaczną odległość nawet rzędu kilku nanometrów. 

Jeżeli proces przenoszenia energii jest efektywny, to 

wówczas emisja donora — fluorescencja bądź fosfo- 

rescencja —jest w obecności cząsteczek akceptora 

silnie wygaszona, pojawia się natomiast odpowiednia 

emisja — fluorescencja bądź fosforescencja akceptora. f| UO rescencja 

Taką emisję akceptora, która nie jest bezpośrednio se nsybelizo- 

wzbudzana, lecz jest wynikiem procesu przenoszenia wana 

energii nazywa się czasem sensy bil izowaną (uczuloną) 

fluorescencją. 
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Spektroskopia mikrofalowego rezonansu 
rotacyjnego 


Jan Stankowski 

Spektroskopia mikrofalowego rezonansu rotacyjnego 
(obejmująca badania substancji w stanie gazowym) 
jest jednym z działów radiospektroskopii, czyli spek¬ 
troskopii długofalowej części widma promieniowania 
elektromagnetycznego o długościach fal większych 
od 0,1 cm. Innymi ważnymi metodami radiospek¬ 
troskopii są metody rezonansów magnetycznych (-> 
Spektroskopia rezonansów magnetycznych). 

Mikrofalowy rezonans rotacyjny (MRR — ang. 
Microwaye Rotational Resonance) obserwuje się 
w cząsteczkach obdarzonych elektrycznym momen¬ 
tem dipolowym; wartość momentu zmienia się w pro¬ 
cesie absorpcji lub emisji fotonu. Typowymi cząstecz¬ 
kami tego rodzaju są: HCN, NH*, H 2 Ó. 

W rozwoju mikrofalowej spektroskopii gazów do¬ 
niosłą rolę odegrała cząsteczka amoniaku. Cząstecz¬ 
ka amoniaku NH s jest spłaszczonym bąkiem syme¬ 
trycznym. Poziomy oscylacyjne (-* Spektroskopia 
molekularna, rozdz. Widma oscylacyjne i rotacyjne) 
cząsteczki NH 3 ulegają rozszczepieniu wskutek in- 
wersyjnego przemieszczania atomu azotu, polegają¬ 
cego na jego przenikaniu przez barierę potencjału od¬ 
dzielającą dwa położenia równowagi leżące po obu 
stronach płaszczyzny wyznaczonej przez atomy wo¬ 
doru (rys. 1). (Zjawisko przenikania cząstki o energii 
mniejszej od wysokości bariery nazywa się efektem 
tunelowym, gdyż zachodzi ono jakby dzięki tunelowi 
w barierze potencjału; proces ten można zrozumieć 
przyjmując falowy obraz cząstki, bowiem tylko w ta¬ 
kim przedstawieniu istnieje skończone, różne od zera, 
prawdopodobieństwo znajdowania się cząstki poza 
barierą potencjału). Wartość rozszczepienia inwer- 
syjnego NH 3 wynosi 0,8 cm” 1 (leży więc w obszarze 
mikrofal) dla oscylacyjnego poziomu podstawowego 
(v = 0) oraz 36,5 cm -1 dla poziomu wzbudzonego 
(v = 1). Rozszczepienie oscylacyjnego poziomu pod¬ 
stawowego (0,8 cm -1 ) jest wykrywane metodą 
MRR — odkryli je C. E. Cleeton i N. H. Williams 
(1933 r.). 


Spektroskopia polega na badaniu rezonansowego 
oddziaływania fotonów z układem molekularnym. 
Rezonans zachodzi wtedy, gdy energia fotonu hf r 
(rys. 2) odpowiada różnicy energii dwóch dyskret¬ 
nych poziomów energetycznych układu molekular¬ 
nego. W rezonansie atomy (cząsteczki) silnie absor¬ 
bują lub emitują promieniowanie co prowadzi do wy¬ 
stąpienia linii rezonansowej (rys. 3). 

Badanie absorpcji w paśmie mikrofal polega na 
obserwowaniu zmian dobroci rezonatora mikrofalo¬ 
wego (-* Generacja mikrofal), gdy w sposób liniowy 
zmienia się częstość źródła fal elektromagnetycznych. 
Mikrofalowe widmo amoniaku uzyskane dla róż- 
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Rys. 1. Zależność energii potencjalnej atomu azotu w cząsteczce 
NH, od wychylenia S od położenia równowagi; S t i <5 ? składowe 
dubletu deformacyjnego, uwarunkowane inwersyjnymi rozszcze¬ 
pieniami poziomu v = 1 
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nych ciśnień gazu w rezonatorze przedstawia rys. 4. 
Pod normalnym ciśnieniem obserwuje się silną ab¬ 
sorpcję w szerokim zakresie częstości, a obserwowana 
całkowita szerokość widma amoniaku jest odwrotnie 
proporcjonalna do czasu między kolejnymi wzajem¬ 
nymi zderzeniami cząsteczek. W miarę obniżania ciś¬ 
nienia zderzenia stają się coraz rzadsze i szerokie pa¬ 
smo absorpcyjne zwęża się; ukazuje się nam wielo¬ 
składnikowe widmo inwersyjne NH a (rys. 4b). 

Ze względu na to, że widmo amoniaku związane 
jest z elektrycznymi przejściami dipolowymi, czę- 
zjawisko stość rezonansowa poszczególnych linii silnie zależy 
Starka od zewnętrznego pola elektrycznego (zjawisko Starka). 



Rys. 3. Linia rezonansowa; szerokością połówkową 4/i/s linii 
rezonansowej jest różnica częstości w połowie wysokości linii 


widmo 

mikrofalowe 

amoniaku 



Rys. 4. Widmo mikrofalowe amoniaku przy różnym ciśnieniu; 
przy ciśnieniu 1 Pa ujawnia się struktura inwersyjna. Cyfry przy 
składowych oznaczają liczby kwantowe J t K charakteryzujące 
rotacyjny ruch cząsteczki 
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Położenie linii rezonansowej można zmieniać za po¬ 
mocą sygnału prostokątnego o częstości f m uzysku¬ 
jąc periodyczną modulację linii rezonansowej. Mo- 


generator 


komora 


dopływ gazu 



dulację za pomocą pola elektrycznego, zwaną modu¬ 
lacją starkowską, wykorzystuje się do zwiększenia 
czułości spektrometrów MRR. Najczęściej spotykane 
rozwiązanie spektrometru MRR jest pokazane na 
rys. 5. Główną częścią spektrometru jest falowód za- modulacja 
wierający badany gaz. Do elektrody przykłada się starkowska 
prostokątne impulsy wysokiego napięcia wytwarza¬ 
jące pole elektryczne między elektrodą i ścianką fa¬ 
lowodu. Modulacja starkowska powoduje periodyczną 
zmianę położenia linii rezonansowej, co pociąga za 
sobą periodyczną, z częstością modulacji, zmianę 
mocy na detektorze. Umieszczony za detektorem 
wzmacniacz nastrojony na częstość modulacji star- 
kowskiej f m , rejestruje linię rezonansową podczas li¬ 
niowej zmiany częstości źródła mikrofal. 


Maser i wzorce częstości 

W cząsteczce NH 3 występuje kwadratowy efekt Star¬ 
ka, tzn. przesunięcie linii rezonansowej w polu elek¬ 
trycznym jest proporcjonalne do kwadratu przyło¬ 
żonego pola elektrycznego. Dla określonego stanu 
rotacyjnego cząsteczki przesunięcie częstości rezo¬ 
nansowej Af = f E —fr w polu E opisuje wyrażenie: 

Af= AE 2 , 

gdzie A jest wielkością zależną od momentu dipolo¬ 
wego badanej cząsteczki oraz od wartości rzutu kwadratowy 
całkowitego momentu pędu J na kierunek pola E t efekt Starka 
który oznaczamy przez Mj. Dla stanów inwersyj- 
nych cząsteczek amoniaku kwadratowy efekt Starka 
przedstawiono na rys. 6. Pole o natężeniu 1 kV/cm 
przesuwa linię inwersyjną / = 3, K — 3 (dla Mj = 1) 



Rys. 6. Kwadratowy efekt Starka w widmie inwersyjnym amo¬ 
niaku 


od częstości fr ~ 23 870 MHz do wartości /e — 23 879 
MHz. Widać stąd, że silnie niejednorodne pole elek¬ 
tryczne będzie separować obydwa stany inwersyjne. 








































Takie oddziaływanie niejednorodnego pola elektrycz¬ 
nego na cząsteczki amoniaku wykorzystano w części 
separująco-ogniskującej (rys. 7) urządzenia zwanego 
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Rys. 7. Separator cząsteczek wzbudzonych: a) kwadrupolowy, 
b) kółkowy 
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Rys. 8. Schemat masera z wiązką molekularną amoniaku 


maserem (z ang. microwave amplification by stimu - 
lated emission of radiatioń). Z wiązki molekularnej 
biegnącej wzdłuż osi separatora cząsteczki niewzbu¬ 
dzone (—) będą do pola wciągane, podczas gdy 
cząsteczki wzbudzone (+) będą z niego wypychane, 
maser Schemat masera amoniakalnego przedstawiony jest 
amoniakalny na rys. 8 . Ze źródła, w którym amoniak znajduje się 
pod ciśnieniem ok. 10 Pa cząsteczki NH 3 wpadają do 
obszaru wielkiej próżni (10 ” 4 Pa). Tutaj na całej swo¬ 
jej drodze od źródła do rezonatora cząsteczki nie 
zderzają się wzajemnie. W obrębie separatora wiązka 
molekularna pozbawiona jest cząsteczek niewzbu- 
dzonych i do rezonatora mikrofalowego, nastrojo¬ 
nego na linię inwersyjną wpadają tylko cząsteczki 
wzbudzone. Ponieważ w zakresie mikrofal cząsteczki 
wzbudzone przechodzą do stanu podstawowego tylko 
w wyniku wymuszonej emisji promieniowania, tylko 
zderzenie między cząsteczkami lub kwant o częstości 
rezonansowej może spowodować akt emisji. W wy¬ 
niku przypadkowego aktu emisji cząsteczki wzbu¬ 
dzają elektromagnetyczne drgania w rezonatorze. 
Dla małego strumienia cząsteczek drgania te gasną 
wskutek strat energii pola elektromagnetycznego 
w ściankach rezonatora. Zwiększając strumień czą¬ 
steczek ze źródła możemy spowodować, że energia 
wnoszona do rezonatora przez wzbudzone cząsteczki 
stanie się większa od strat rezonatora i pole elektro¬ 
magnetyczne będzie podtrzymywane przez emisję 


cząsteczek NH 3 . Tak powstające pole w.cz. będzie 
wymuszało dalsze przejścia w cząsteczkach wpada¬ 
jących do rezontatora i to spowoduje trwałe wzajem¬ 
ne sprzężenie rezonatora mikrofalowego z wiązką 
molekularną. 

Maser jest źródłem drgań pola w.cz. o nadzwyczaj¬ 
nie dużej stabilności, gdyż drgania te są utrzymywane 
przez promieniowanie cząsteczek o określonej bu¬ 
dowie, których częstość mało się zmienia pod działa¬ 
niem czynników zewnętrznych. Za pomocą masera 
zostały określone najsubtelniejsze oddziaływania w 
molekule NH 3 (rys. 9). 

Promieniowanie o najwyższej stabilności częstości 
można uzyskać za pomocą masera wodorowego. Ma¬ 
ser ten pracuje przy częstości 1420 MHz równej roz¬ 
szczepieniu poziomów: singletowego F — 0 i tiyple- 
towego F = 1 wodoru. W maserze wodorowym wy¬ 
korzystuje się magnetyczne przejścia dipolowe i dla¬ 
tego wiązkę atomów wzbudzonych uzyskuje się 
w separatorze magnetycznym o silnej niejednorod¬ 
ności pola magnetycznego. Graniczną stabilność tego 
masera określa się na 10~ 14 co stanowi światowy re¬ 
kord stabilności częstości. Maser wodorowy jest 

b) 



Rys. 9. Nadsubtelna struktura linii / = 3, K — 3 amoniaku 
łl NH*:,a) A,B i C struktura kwadrupolowa, b) struktura magne¬ 
tyczna linii A 


urządzeniem kontrolnym dla wzorca cezowego, speł¬ 
niającego obecnie rolę światowego wzorca częstości. 

Wzorzec cezowy jest spektrometrem absorpcyjnym 
z wiązką atomów cezu, w którym zastosowano sprzę¬ 
żenie zwrotne tak, że częstość źródła mikrofal ustala 
się za pomocą wybranej linii rezonansowej. Wybra¬ 
na umownie linia cezowego wzorca ma częstość 
/ Cs = 9 192 631 770 Hz. Widmo cezu jest dzisiaj pod¬ 
stawą atomowej skali czasu przewyższającej swoją 
precyzją skale astronomiczne związane z periodycz¬ 
nym ruchem ciał niebieskich. Ruch planet i wszelkie 
zjawiska astronomiczne opisuje się właśnie w ato¬ 
mowej skali czasu, wyznaczonej przez laboratoria 
czasu posługujące się zegarami cezowymi i maserami 
wodorowymi. 

Masery zapoczątkowały elektronikę kwantową 
i wskazały na możliwość realizacji laserów, które spo¬ 
wodowały wspaniały rozwój optyki nieliniowej i za- 
decydowały o dalszych sukcesach elektroniki kwanto¬ 
wej (-> Optyka nieliniowa. Lasery — podstawy dzia¬ 
łania). 

Masery i lasery spowodowały wzrost zainteresowania stanem 
układów znajdujących się w ujemnej temperaturze bezwzględnej. 
Termin ten zrazu szokuje, gdyż wiemy, że zero bezwzględne jest 
nieosiągalne. Nie jest on użyty tutaj w dotychczasowym sensie, 
gdyż bezwzględną temperaturę ujemną nie określa energia kine¬ 
tyczna chaotycznego ruchu cząsteczek, lecz energia ich dyskret¬ 
nych stanów. Temperatury nie mierzy się termometrem lecz za 
pomocą obsadzenia dyskretnych stanów: ujemnej temperaturze 
odpowiada antyboltzmannowskie obsadzenie stanów — w wyż¬ 
szym stanie znajduje się więcej cząsteczek niż w niższym. Nie ma 
również sprzeczności z naszą wiedzą o zerze bezwzględnym, gdyż 
ze strony ujemnych temperatur bezwzględnych zero bezwzględne 
również jest nieosiągalne. 

W warunkach zwykłej równowagi termodynamicznej, energia 
poszczególnych atomów i cząsteczek opisana jest za pomocą 
tzw. rozkładu boltzmaimowskiego (rys. 10). Zgodnie z tym roz¬ 
kładem w zbiorze cząsteczek najliczniejsze są cząsteczki o naj¬ 
mniejszej energii. Rozkład boltzmannowski opisuje również 
obsadzenie stanów o skwantowanej energii: liczbę cząsteczek 
jV x i N x znajdujących się w dwu dowolnych stanach 1 i 2 określa 
funkcja wykładnicza (rys. 10). Gdy E x < E t stosunek 

NJNi « ć-WkT, ( 1 ) 

gdzie JE = En-Eu zaś k jest stałą Boltzmanna. Jeżeli przyj- 
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mierny to wyrażenie za wzór definiujący temperaturę, za pomocą 
obsadzenia poziomów energetycznych możemy określić tempera¬ 
turę dowolnego przejścia rezonansowego. „Termometrem” jest 
wówczas absorpcja /W mocy mikrofalowej, która jest wprost 
proporcjonalna do różnicy obsadzeń dwu rozważanych pozio¬ 
mów energetycznych cząsteczki: iYb* ~ A r 1 —A r ,. W gazie, 




liczba cząsteczek 
k rozkład 




liczba cząsteczek 


Rys. 10. Obsadzenie poziomów określa temperaturę układu: 
a) T > 0, b) T < 0 


w którym cząsteczki we wszystkich stanach energetycznych znaj¬ 
dują się w równowadze z otoczeniem, moc absorbowana jest do¬ 
datnia: iP»bs > 0, a więc mamy do czynienia z dodatnią tempera¬ 
turą bezwzględną dla dowolnie wybranego dwupoziomowego 
układu. Zupełnie inną sytuację mamy wówczas, gdy dla dwóch 
wyizolowanych poziomów N t > N lt tzn., że górny stan jest 
silniej obsadzony niż dolny. Zgodnie z tym co wyżej powiedziano 
wystąpi ujemna absorpcja równoważna emisji, a układ rozwa¬ 
żany możemy opisać za pomocą ujemnej temperatury bezwzględ¬ 
nej. Widać stąd natychmiast, że układy o temperaturze dodat¬ 
niej (T>0) absorbują energię, gdyż P»bi>0, a układy o ujemnej 
temperaturze (r<0) ją emitują, bowiem dla nich współczynnik 
absorpcji jest mniejszy od zera (oc<0). Dzięki maserom rozwi¬ 
nięto termodynamikę układów o ujemnej temperaturze bez¬ 
względnej, w której określono warunki jakie musi spełniać taki 


układ: 1) W układzie dwupoziomowym musi istnieć równowaga 
w sensie termodynamicznym, co w doświadczeniach mikrofalo 
wych zapewnia szybko ustalające się oddziaływanie spin-spin. 
2) Rozważany układ dwupoziomowy jest adiabatycznie odizo¬ 
lowany od układów o T> 0 (duża różnica czasów relaksacji spin- 
-sieć i spin-spin). 3) Energia układu musi być ograniczona od 
góry, co jest spełnione w układzie o skwantowanych poziomach 
energetycznych, gdyż jest to po prostu energia górnego poziomu. 

Zasadnicza różnica układów o dodatniej i ujemnej temperatu¬ 
rze bezwzględnej polega na tym, że w układach z temperaturą 
r>0 rozkład obsadzeń jest wynikiem chaotycznego ruchu ciepl¬ 
nego cząsteczek (ich kinetycznej energii), zaś ujemna temperatura 
bezwzględna jest związana z energią potencjalną poszczególnych 
cząsteczek tworzących układ. Osobliwością układów o ujemnej 
temperaturze bezwzględnej jest to, że układy o 7’<0 są „go¬ 
rętsze” od układów o T>0, bowiem zawierają one energię zma¬ 
gazynowaną we wzbudzonych stanach cząsteczek, którą na dro¬ 
dze wymuszonej emisji promieniowania poszczególne cząsteczki 
oddają polu elektromagnetycznemu. 

Innymi ważnymi metodami mikrofalowej spektro¬ 
skopii gazów jest rezonans podwójny i molekularny 
rezonans rotacyjny. Rezonans podwójny stosowany 
jest do detekcji przejść, gdy współczynnik pochłania¬ 
nia dla danego przejścia leży poniżej czułości spektro¬ 
metru MRR. W metodzie tej stosuje się równocze¬ 
śnie dwa sygnały mikrofalowe: sygnał o dużej mocy 
powodujący zmianę obsadzeń poziomów energetycz¬ 
nych (przejście R, rys. 11) i słaby sygnał wykrywa¬ 
jący przejście Q . W układzie trzech poziomów, mię¬ 
dzy którymi zachodzą dwa przejścia R i Q , pompo¬ 
wanie silnym sygnałem R opróżnia w istotny sposób 
poziom i, a tym samym staje się możliwa obserwacja 
słabego przejścia Q. Metodą podwójnego rezonansu 
zbadano cząsteczkę HDCO: przejście R (35 GHz) 
naświetlane silnym sygnałem mikrofalowym umoż¬ 
liwiło obserwację przejścia Q (13 GHz). 


Ł>= 1 


pompowanie 


v =0 (-) 



Rys. 12. Molekularny rezonans rotacyjny 


Molekularny rezonans rotacyjny (rys. 12) polega 
na przekazywaniu energii rotacyjnej podczas zderzeń 
cząsteczek, w wyniku czego zmienia się obsadzenie 
inwersyjnych poziomów energetycznych. Jest to waż¬ 
na metoda badania energii zderzeń cząsteczek. 

G. M. Bar r o w Wstęp do spektroskopii molekularnej. Warsza¬ 
wa 1968: J. Stankowski, A. Graja Wstęp do elektroniki ciała 
stałego , Warszawa 1972. 


Spektroskopia rezonansów 
magnetycznych 

Marek Gutowski 


Wyobraźmy sobie pewną substancję umieszczoną 
w stałym polu magnetycznym. Jeżeli się okaże, że ta 
substancja pod wpływem przyłożonego pola magne¬ 
tycznego zaczyna pochłaniać fale elektromagnetyczne 
rezonans pewnych długości, zjawisko nazwiemy zjawiskiem re- 
magnetyczny zonansu magnetycznego. Badanie zależności pochła¬ 
niania od wielkości indukcji pola magnetycznego B 
i od energii padających fal elektromagnetycznych jest 
właśnie istotą spektroskopii rezonansów magnetycz¬ 
nych. Mówimy „rezonansów”, a nic „rezonansu”, 
bo znamy kilka rodzajów tycfr zjawisk: rezonans 
jądrowy, rezonans elektronowy, rezonans ferromag¬ 
netyczny i in. Istnieje jeszcze jeden rodzaj rezonanso¬ 
wego pochłaniania energii w obecności stałego pola 
magnetycznego, a mianowicie tzw. rezonans cyklo- 
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tronowy. Nie będziemy go tu omawiać, ponieważ 
jest to z mikroskopowego punktu widzenia zupełnie 
inne zjawisko. 

Badania rezonansów magnetycznych zostały zapo¬ 
czątkowane w 1945 r. przez radzieckiego fizyka 
E. Zawojskiego. Do rozwoju badań eksperymental¬ 
nych przyczynili się również E. M. Purcell, H. C. Tor- 
rey, R. V. Pound, C. Kittel, F. Bloch, C. Gorter i in. 
Dzisiaj metody badawcze wykorzystujące rozmaite 
rezonanse magnetyczne stały się silnym narzędziem 
eksperymentatorów i badaczy nie tylko w dziedzinie 
fizyki, ale również chemii, biologii i medycyny. Skon¬ 
struowano przyrządy pozwalające określać parame¬ 
try materiałów używanych w różnych gałęziach prze¬ 
mysłu. 
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Rys. 11. Rezonans 
podwójny 
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Do sprawy zastosowań rezonansów magnetycznych 
jeszcze powrócimy. Teraz omówimy samo zjawisko. 
Najpierw podamy krótki słowniczek objaśniający 
często używane skróty: 

NMR (JRM) —jądrowy rezonans magnetyczny (ang. 

nuclear magnetic resonance ), 

EPR (ERP, ESR) — elektronowy rezonans paramag¬ 
netyczny (ang. electron paramagnetic resonance ), 
zwany też rezonansem spinowym, 

FMR (RFM) — rezonans ferromagnetyczny (ang. 
ferromagnetic resonance ). 

Spotyka się niekiedy jeszcze inne skróty, jak np. 
AFMR, NQR, EQR, ENDOR, które oznaczają ko¬ 
lejno: rezonans antyferromagnetyczny, jądrowy re¬ 
zonans kwadrupolowy, elektronowy rezonans kwa- 
drupolowy i podwójny rezonans elektronowo-jądro- 
wy. Nie będziemy się tu nimi zajmować. 


Zjawisko rezonansu 
magnetycznego 


Zjawisko rezonansu magnetycznego można ściśle 
opisać tylko na gruncie mechaniki kwantowej. Spró¬ 
bujemy tu mimo to podać pewne analogie klasyczne, 
przemawiające do wyobraźni i ułatwiające zrozumie¬ 
nie istoty procesu. Za rezonansowe pochłanianie 
energii odpowiedzialne są cząstki obdarzone mo¬ 
mentem magnetycznym. Mogą to być jądra atomowe, 
jony lub inne mikroobiekty. Skąd się bierze moment 
moment magnetyczny jakiejś cząstki? Wyobraźmy sobie na- 
magnetyczny ładowaną cząstkę krążącą po zamkniętym torze. 

Ruch tej cząstki jest równoważny z przepływem prądu 
elektrycznego w zamkniętej pętli. Jak wiemy, jednym 
ze skutków przepływu prądu elektrycznego jest wy¬ 
tworzenie pola magnetycznego. Cząstka krążąca po 
zamkniętej orbicie jest więc czymś w rodzaju elemen¬ 
tarnego magnesu. W mechanice kwantowej nie wy¬ 
obrażamy sobie, że cząstki krążą po ustalonych orbi¬ 
tach lub że wirują wokół jakiejś osi, lecz mówimy, 
że są obdarzone pewnym momentem pędu. Teraz już 
możemy odpowiedzieć na postawione pytanie. Mo¬ 
ment -magnetyczny jest związany z ładunkiem elek¬ 
trycznym cząstki i z jej momentem pędu. Oznaczmy 
wektor momentu magnetycznego naszej cząstki 


przez /x. 

precesja W zewnętrznym, stałym polu magnetycznym wek- 

wektora tor [x wykonuje precesję wokół wektora B — indukcji 
momentu p 0 j a magnetycznego. Jest to zjawisko analogiczne do 
magne- krążenia (precesji) osi bąka-zabawki w polu grawita- 
tycznego C yjnym (rys. 1). Istotna różnica pomiędzy tymi zja¬ 
wiskami polega na tym, że oś bąka może być dowol- 



wektor 
momentu 
pędu j 


Rys. 1. Porównanie precesji wektora momentu magnetycznego 
w jednorodnym polu magnetycznym i precesji bąka-zabawki 
w ziemskim polu grawitacyjnym 


nie nachylona w stosunku do pionu, a położenie wek¬ 
tora ix nie może być dowolne. Wektor p musi wyko¬ 


nywać precesję w taki sposób, aby rzut momentu 

pędu na kierunek wektora B przybierał jedną z 
2 /-fl wartości: 

Jh , (-/+l) 6 ...(/-l)tf, Jh ; 

J jest tu tzw. liczbą kwantową momentu pędu, 
a h — stałą Plancka dzieloną przez 2 j z. Liczba / 
może być całkowita lub połówkowa ( 0 , x j 2y 1 > 
2...). Na przykład, jeśli cząstka ma moment pędu 
równy z / 2 h t J = s / 2 (nie jest to ścisłe powiedzenie. 



Rys. 2. Możliwe ustawienia wektora momentu magnetycznego 
scharakteryzowanego liczbą kwantową momentu pędu J = */* 
w polu magnetycznym i odpowiadające im energie 


gdyż całkowity moment pędu cząstki opisanej liczbą 
kwantową / jest równy h]/7(J+\)), to możliwe są 
cztery ustawienia wektora w polu magnetycznym 
(rys. 2). Każdemu ustawieniu odpowiada inna ener¬ 
gia. Jak wiadomo, energia momentu magnetycznego 
w polu magnetycznym wyraża się wzorem 

E = —juB = —/xB cos 0 ; 

6 oznacza tu kąt pomiędzy wektorami fi i B , czyli 
połowę kąta rozwarcia stożka, po którym się poru¬ 
sza wektor momentu magnetycznego fi. W mecha¬ 
nice kwantowej oblicza się, że moment magnetyczny 
opisany liczbą kwantową / ma w polu magnetycznym 
energię 

Ej = yJhB . (1) 

Współczynnik y (tzw. stosunek magnetomechaniczny 
lub giromagnetyczny) ma różne wartości — w zależ¬ 
ności od tego, jaką cząstkę rozpatrujemy. Jeśli np. 
elektron walencyjny, to y — y« = gfiB y jeśli zaś jądro 
atomowe, to y — yx = gnfiN. Magneton Bohra 
Pb i magneton jądrowy ps są elementarnymi jedno¬ 
stkami momentu magnetycznego odpowiednio dla 
elektronu i jądra atomowego. Bezwymiarowy współ¬ 
czynnik g nazywa się współczynnikiem rozszczepie¬ 
nia spektroskopowego, czynnikiem Landego lub po 
prostu czynnikiem g. Jego wartość możemy obliczać 
teoretycznie lub otrzymywać z eksperymentu. Z re¬ 
latywistycznej teorii Diraca wynika, że g swobod¬ 
nego elektronu w próżni równa się 2,0023. 

Z równania (1) widać, że różnica energii dwóch 

położeń wektora fi (czyli dwóch stanów energetycz¬ 
nych), różniących się liczbą kwantową / o jedność, 
wynosi: 

dEj t j-i = Ej—Ej-i = yhB. 

Jeśli energia padającego fotonu E = hv = ho* jest 
równa AE, to jest spełniony warunek Bohra i foton 
może być pochłonięty. Jest to podstawowy warunek 
rezonansu. Zapiszemy go krótko jeszcze raz: 

AE — fłco 0 = yhB , czyli a> 0 = yB. (2) 
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Podkreślmy przy tym, że B oznacza indukcję pola 
magnetycznego, które działa na nasz moment mag¬ 
netyczny. Nie zawsze jest to takie pole, jakie przy¬ 
kładamy do próbki z zewnątrz. Może się przecież 
zdarzyć, że w naszej próbce istnieją poza polem 
zewnętrznym jakieś wewnętrzne pola magnetyczne. 
Musimy pamiętać, że B w naszym podstawowym 
wzorze (2) oznacza wypadkową wszystkich tych 
pól. 

Jest jeszcze drugi warunek rezonansu, łatwo zro¬ 
zumiały z klasycznego punktu widzenia: składowa 

magnetyczna b padającej fali elektromagnetycznej 
powinna być prostopadła do wektora B. Jeśli kie¬ 
runek wirowania wektora b będzie taki sam jak kie¬ 
runek precesji wektora fi (rys. 3), to można będzie 

przyspieszyć precesję wektora //, układ pochłonie 
energię. Jest więc rzeczą konieczną, aby padająca fala 
elektromagnetyczna miała składową magnetyczną 
prostopadłą do pola stałego. 

O tym, jak się zachowuje wektor momentu magne¬ 
tycznego w zewnętrznym polu magnetycznym, może¬ 
my się dowiedzieć rozwiązując jego równania ruchu. 
Nie będziemy tu tego robić, napiszemy tylko te rów- 
nania: ^ ^ 

—p=yrxB. ( 3) 


Są to właściwie trzy równania, ponieważ niewiado¬ 
mymi są tu trzy składowe wektora fi jako funkcje 
czasu. Zapisaliśmy je dla skrócenia w formie wekto¬ 
rowej. Jest to dobrze znane równanie mechaniki 
klasycznej (pochodna momentu pędu układu jest 
równa momentowi sił zewnętrznych działających na 
układ), z tą jedynie różnicą, że obie strony równania 
pomnożono przez y i otrzymano z lewej strony mo¬ 
ment magnetyczny zamiast momentu pędu. Można 
się przekonać, że równanie (3) opisuje precesję wekto¬ 
ra fi wokół wektora B. Pamiętamy jednak, że każdy 
rzeczywisty układ fizyczny dąży do takiego stanu, 
w którym jego energia byłaby możliwie mała. W da¬ 
nym wypadku oznaczałoby to, że wektor fi powinien 

się w końcu ustawić równolegle do wektora B. Za¬ 
chowanie jego winno być mniej więcej takie jak na 
rys. 4, tzn. powinien on krążyć po okręgu o coraz 
mniejszym promieniu. Przebieg czasowy zjawiska jest 
więc następujący: 1) moment magnetyczny jest usta¬ 
wiony równolegle do pola magnetycznego, 2) po 
pochłonięciu porcji energii występuje precesja, 3) ener¬ 
gia jest wytracana (mówimy, że następuje relaksacja) 
w pewnym charakterystycznym czasie, zwanym cza¬ 
sem relaksacji. W obrazie kwantowym możemy to 



Rys. 3. Wzajemne ustawienie 
wektora pola magnetycznego, 
składowej magnetycznej pada¬ 
jącej fali elektromagnetycznej 
wywołującej rezonans i wek¬ 
tora momentu magnet, cząstki 



Rys. 4. Klasyczny obraz pre¬ 
cesji wektora momentu mag¬ 
netycznego cząstki, która stop¬ 
niowo traci energię 
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sobie wyobrazić jako przeskoki wektora fi z jednego 
stożka precesji na drugi. Klasyczne równania ruchu, 
takie jak równania (3), ale zawierające człony opisują¬ 
ce relaksację, nazywają się równaniami ruchu Blo¬ 
cha. Podobne równania ruchu podali niezależnie F. 
Gilbert i L.D. Landau. Jeśli na podstawie równań ru¬ 
chu Blocha obliczymy szybkość pochłaniania energii 
przez układ, otrzymamy następujące wyrażenie zale¬ 
żne od częstości padającej fali elektromagnetycznej: 




coy/irb 2 

l-Kco— co 0 ) 2 t 2 3 


(4) 


gdzie b jest wielkością składowej magnetycznej pada¬ 
jącej fali elektromagnetycznej, która wywołuje rezo- 



Rys. 5. Krzywa absorpcyjna rezonansu magnetycznego 



Rys. 6. Schemat aparatury do obserwacji rezonansu magnetycz¬ 
nego 


nans. Jeśli wykreślimy tę krzywą, otrzymamy obraz 
taki jak na rys. 5. Jest to dobrze znana w fizyce krzy¬ 
wa Lorentza. Jej szerokość na połowie wysokości 
równa się 1/t' co 0 jest określone przez warunek re¬ 
zonansu (2). 

Schemat typowego układu do eksperymentalnego 
badania rezonansów magnetycznych przedstawiony 
jest na rys. 6. Próbka znajduje się w polu magnetycz¬ 
nym wytwarzanym przez elektromagnes lub magnes 
nadprzewodnikowy. Fale elektromagnetyczne wysyła¬ 
ne z nadajnika docierają do próbki z lewej strony, na¬ 
stępnie są pochłaniane, a ta część energii, która nie 
została zaabsorbowana przez próbkę, dociera do od¬ 
biornika. Z odbiornikiem połączony jest oscyloskop 
lub rejestrator, który pozwala na zapis otrzymywa¬ 
nych krzywych rezonansowych. Zwykle w ekspery¬ 
mencie łatwiej jest zmieniać stałe pole magnetyczne 
niż częstość padających fal elektromagnetycznych. 
Otrzymujemy wtedy na rejestratorze zapis krzywej 
pochłaniania w funkcji pola magnetycznego przy usta¬ 
lonej częstości fal elektromagnetycznych. Często się 
zdarza, że próbka zawiera niewiele momentów mag¬ 
netycznych mogących absorbować energię — stosu¬ 
jemy wówczas skomplikowane metody nadawania 
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i odbioru fal elektromagnetycznych, dzięki którym 
możemy rejestrować nawet bardzo słabe sygnały od 
próbki. Powszechnie stosowane są takie metody 
spektroskopii rezonansów magnetycznych, które 
pozwalają obserwować sygnały 100 tysięcy razy słab¬ 
sze od szumów. Nasza aparatura, zwana spektro¬ 
metrem, daje wtedy na wyjściu zapis nie krzywej re¬ 
zonansowej, lecz jej pochodnej. Idea pomiaru po¬ 
zostaje jednak taka sama. 

W pierwszych pracach nad rezonansami magnetycz¬ 
nymi używano jako odbiornika kalorymetru (C. Gor- 
ter 1948). Pomiar trwał długo i był obarczony dużymi 
błędami. Trzeba było przy rozmaitych częstościach 
fal elektromagnetycznych (lub wartościach pól) mie¬ 
rzyć temperaturę i w ten sposób punkt po punkcie 
określać kształt krzywej absorpcyjnej. Współczesne 
spektrometry pozwalają na prawie automatyczne za¬ 
pisywanie całej krzywej absorpcyjnej, a sam pomiar 
trwa średnio kilka minut. Obecnie wobec postępu 
w metodach fizyki niskich temperatur powraca się do 
obserwacji rezonansów magnetycznych przez pomiar 
temperatury próbki. Jest to jednak możliwe tylko 
w bardzo niskich temperaturach, poniżej 4 K. 


Rezonans jądrowy 

Wszystkie nasze dotychczasowe rozważania pozostaną 
w mocy, jeżeli zamiast liczby kwantowej J wpiszemy 
do wzoru (1) liczbę I —spin obserwowanego jądra 
atomowego. Częstość fal elektromagnetycznych po¬ 
trzebnych do wywołania rezonansu zależy oczywiście 
od przyłożonego pola magnetycznego (wzór 2). Czę¬ 
stości rezonansowe niektórych jąder w polu magne¬ 
tycznym 1 T podane są w tabeli. 


Częstości rezonansu jądrowego w polu magnetycznym 1T i 
wartość spinu jądrowego wybranych jąder 


Jądro 

Częstość 
rezonansowa 
w MHz 

Spin 

(proton) 

42,576 

1/2 

2 H (deuter) 

6,536 

1 

7 Li 

16,55 

3/2 

“C 

10,71 

1/2 

J9p 

40,06 

1/2 

23 Na 

11,26 

3/2 

mj 

8,52 

512 


Podane częstości pokrywają zakres UKF i fal krót¬ 
kich stosowanych w radiofonii. Dotyczy to oczywiście 
jąder swobodnych. Jeśli badane jądra znajdują się 
w cząsteczkach, efekt może być na przykład taki jak 
na rys. 7. Jest to widmo rezonansu jądrowego (NMR) 
jąder wodoru, czyli protonów, w cząsteczce alkoholu 


H H 



etylowego. Zmianę częstości rezonansowej wywołaną przesunięcie 
ekranującym działaniem chmury elektronowej nazy- chemiczne 
wamy przesunięciem chemicznym. Na rys. 7 widać 
wyraźnie, że atomy wodoru zawarte w cząsteczce eta¬ 
nolu można podzielić na trzy grupy. Porównanie 
wzoru strukturalnego etanolu i widma pozwala w tym 
wypadku łatwo określić, które jądra wodoru w czą¬ 
steczce alkoholu są odpowiedzialne za kolejne maksi¬ 
ma pochłaniania. Różne częstości rezonansowe tłu¬ 
maczą się oczywiście tym, że lokalne pole magnetycz¬ 
ne działające na protony jest inne w każdej grupie 
i nieco inne niż przyłożone pole zewnętrzne. Takimi 
metodami rozszyfrowuje się strukturę wielu związków 
organicznych. 


Zastosowanie zjawiska NMR 

Badanie rezonansu magnetycznego protonów jest 
szczególnie ważne w chemii organicznej, ponieważ 
wiele związków organicznych zawiera w swym skła¬ 
dzie wodór. W ostatnich latach rozwinęła się również 
spektroskopia rezonansu jądrowego izotopu węgla 
13 C, pierwiastka zawartego w związkach organicz¬ 
nych. Badania tego rezonansu są znacznie trudniejsze 
niż spektroskopia protonów, gdyż izotop 13 C stanowi 
tylko ok. 1,1% wszystkich atomów węgla w przyro¬ 
dzie. Z kolei spektroskopia rezonansu jądrowego izo¬ 
topu fluoru 19 F, który stanowi prawie 100% fluoru 
w przyrodzie, jest utrudniona z powodu dosyć wyso¬ 
kiej częstości rezonansowej i toksyczności jego 
związków. W fizyce ciała stałego bada się NMR wielu 
innych izotopów, np. glinu 27 Al, żelaza 57 Fe i kobaltu 
59 Co. 

Zjawisko NMR protonów zawartych w wodzie NMR proto 
zostało wykorzystane do precyzyjnego pomiaru pola nów 
magnetycznego. Czynnik y protonów w wodzie jest w wodzie 
znany z bardzo wysoką dokładnością. Pozwala to 
określić wartość indukcji pola magnetycznego z czę¬ 
stości rezonansowej NMR. Pomiar pola tą metodą 
jest łatwy w zakresie pól 0,1-1,5 T. Do pomiaru więk¬ 
szych pól używa się jąder litu 7 Li. 

Zjawisko NMR protonów w wodzie wykorzystano miernik wi!- 
także w mierniku wilgotności materiałów sypkich, gotnośca 
Miernik taki pozwala szybko i nie niszcząc materiału 
określić z dokładnością ok. 2% zawartość wody w tro¬ 
cinach, piasku, ziarnie i innych materiałach. Pomiar 
może być prowadzony w sposób ciągły, np. na przesu¬ 
wającej się taśmie w magazynie, zakładzie produkcyj¬ 
nym, w porcie. 



Rys. 8. Rozkład gęstości protonów w przekroju strąka rośliny 
afrykańskiej okra otrzymany metodą NMR. Średnica strąka 
ok. 15 mm 

Metodą NMR protonów w wodzie można przepro¬ 
wadzać ciekawe badania w obiektach biologicznych. 
Jeżeli obszar pola magnetycznego o takim rozkładzie 
przestrzennym indukcji, przy którym warunki rezo- 
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Rys. 7. Widmo NMR protonów w cząsteczce alkoholu etylowego 
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Rys. 9. Rozkład protonów w płaszczyźnie przechodzącej przez 
żołądek szczura otrzymany metodą NMR 


nansowe będą^ spełnione tylko w małym fragmencie 
próbki, będziemy przesuwać, to w rezultacie można 
będzie otrzymać obrazy podobne do rys. 8 i 9. Zare¬ 
jestrowano oczywiście wielkość absorpcji, podczas 
gdy pole i częstość rezonansowa były ustalone. Tą 
metodą uzyskano już obrazy tkanek różnych roślin, 
pierwsze obrazy żywych małży w muszlach i obrazy 
dłoni ludzkiej. 

Metodą NMR badano też zanieczyszczoną wodę 
morską. Wynikiem tych badań jest wiedza na temat 
procesów prowadzących do samooczyszczenia wody 
morskiej z rozlanych olejów i ropy naftowej oraz 
wpływu na te procesy takich czynników jak nasło¬ 
necznienie i falowanie morza. 

W pewnych wypadkach można obserwować NMR 
bez przykładania zewnętrznego pola magnetycznego. 
Dzieje się tak w ferromagnetykach, a to dzięki temu, 
że wewnątrz nich istnieje już pole magnetyczne. 
Szczególnie interesujące są badania NMR jąder znaj¬ 
dujących się w ściankach domenowych, tj. obszarach 
rozdzielających leżące blisko siebie obszary ferro- 
magnetyka, tzw. domeny magnetyczne, o różnych 
kierunkach spontanicznego namagnesowania (-► 
Struktura domenowa i procesy magnesowania). Są to 
badania bardzo trudne do interpretacji, ponieważ 
w ściance domenowej wewnętrzne pole magnetyczne 
zmienia swój kierunek od jądra do jądra. 


Rezonans elektronowy 


Rezonans elektronowy (EPR) obserwowano w gazach, 
cieczach, szkłach, półprzewodnikach i metalach. 
Ważną klasą obiektów badanych metodą rezonansu 
elektronowego są wolne rodniki. 

Istota zjawiska jest taka sama jak rezonansu jądro¬ 
wego. Podstawową różnicę stanowi pochodzenie 
wektora momentu magnetycznego. W EPR obserwu¬ 
jemy rezonansowe pochłanianie" energii przez układ 
elektronów, a nie jąder atomowych. Poza tym całko¬ 
wity moment pędu elektronu składa się z momentu 
orbitalnego, wynikającego z ruchu elektronu wokół 
jądra, oraz z momentu spinowego. Do opisu rezonan¬ 
su elektronowego używamy innej liczby kwantowej, 
tzw. spinu efektywnego 5, co oczywiście powoduje 
pewne komplikacje. Ponieważ magneton Bohra jest 


ok. 2000 razy większy niż magneton jądrowy, to i sto- częstość 
sowane częstości fal elektromagnetycznych muszą być promienio- 
o trzy rzędy większe niż przy rezonansie jądrowym, wania 
Zwykle w eksperymentach EPR częstość promienio- w EPR 
wania jest ustalona i wynosi ok. 10 GHz (10 10 Hz), 
a typowy zakres pól magnetycznych wynosi 0-1 T. 

Stosowane częstości mikrofalowe zmuszają do używa¬ 
nia podzespołów elektronicznych typowych dla tego 
zakresu fal: falowodów, cyrkulatorów, rezonatorów, 
tłumików i specjalnych mikrofalowych diod detekcyj¬ 
nych oraz generatorów mikrofal. Do generacji mi¬ 
krofal używa się lamp zwanych klistronami lub (w naj¬ 
nowszych konstrukcjach) generatorów półprzewodni¬ 
kowych— diod Gunna (-►Generacja mikrofal). 

Czułość obecnie używanych spektrometrów EPR 
jest bardzo wysoka, pozwala wykryć w temperaturze 
pokojowej 5-10 10 cząstek paramagnetycznych w 
próbce. 


Struktura subtelna i nadsubtelna widm EPR 

Jeśli liczba kwantowa S > ł / 2 , to poziomy energetyczne 
elektronu nie są równoodległe. Widmo rezonansu 
paramagnetycznego nie składa się wówczas z jednej 
linii, lecz z kilku. Zjawisko polegające na występo¬ 
waniu kilku linii rezonansowych zamiast jednej nazy¬ 
wamy strukturą subtelną widma EPR. Powinno być struktura 
25 obserwowanych linii, ponieważ przejścia pomiędzy subtelna 
poziomami, które nie są kolejne, są bardzo mało 
prawdopodobne. Przykład widma ze strukturą sub¬ 
telną pokazany jest na rys. 10. 

W monokryształach wygląd widma zależy ponadto 
od orientacji pola magnetycznego względem osi kry¬ 
stalograficznych. To zjawisko nosi nazwę anizotropii 
widma. 




Rys. 10. Powstawanie widma EPR: a) bez struktury subtelnej, 
b) z rozdzielonymi pikami struktury subtelnej’ 


Często się zdarza, że jądro atomowe, wokół które¬ 
go krąży badany elektron, ma różny od zera spin 
jądrowy. Energia elektronu zależy wtedy od tego, w ja¬ 
kim stanie energetycznym znajduje się aktualnie mo¬ 
ment magnetyczny jądra atomowego. Jest to zupełnie struktura 
zrozumiałe, bo momenty magnetyczne jądra i elek- nadsubtelna 
tronu mogą oddziaływać ze sobą zupełnie tak samo 
jak małe magnesy. W takim wypadku liczba dozwolo¬ 
nych poziomów energetycznych elektronu wynosi 
(25-ł-l)’(2/-fl), co oczywiście wpływa na wygląd 
widma; obserwujemy większą liczbę linii rezonanso¬ 
wych. Taką strukturę widma nazywamy nadsubtelną. 

Przykład widma z dobrze widoczną strukturą nadsub¬ 
telną (i jednocześnie subtelną) pokazany jest na rys. 11. 
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Rysunek 12 wyjaśnia sposób powstawania takiego 
widma. Z wzajemnej odległości linii, które są skład¬ 
nikami struktury nadsubtelnej, można wnioskować 



Rys. 11. Widmo EPR jonów Mn* + w apatycie. Widoczne są linie 
należące do struktury nadsubtelnej. Wąska linia w środku ry¬ 
sunku pochodzi od substancji wzorcowej (znacznika pola mag¬ 
netycznego) 

rzut momentu pędu 
na kierunek pola 
magnetycznego (w jedn.fr) 
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Rys. 12. Sposób powstawania widma ze strukturą nadsubtelną 

o sile oddziaływań pomiędzy momentem magnetycz¬ 
nym jądra i elektronu. Jeśli oddziaływanie będzie 
słabe, to ruch elektronu będzie tylko nieznacznie za¬ 
burzony i składowe struktury nadsubtelnej widma 
będą leżeć blisko siebie. Może się zatem zdarzyć, że 
obserwacja pojedynczych linii rezonansowych bę¬ 
dzie niemożliwa, a o istnieniu oddziaływań nadsub- 
telnych będzie świadczyć tylko zniekształcona forma 
linii. 


poszerzone, które są sumą wielu linii rezonansowych 
jeżących blisko siebie. Ilustruje to rys. 13. Ten typ 
poszerzenia krzywych absorpcyjnych nazywa się po- 



Rys. 13. Linia rezonansowa poszerzona niejednorodnie 

szerzeniem niejednorodnym (niehomogenicznym). poszerzenie 
Identyczny efekt może się pojawić przy niewłaściwym linia absorp- 
działaniu spektrometru. Zarejestrujemy linie posze- cyjnej 
rzone, jeśli pole magnetyczne w obszarze próbki bę¬ 
dzie niejednorodne lub gdy nadajnik będzie wytwarzał 
jednocześnie fale o różnych częstościach. Kształt linii 
poszerzonej niejednorodnie nie jest lorentzowski, lecz 
np. gaussowski lub zupełnie nieregularny, jak w wy¬ 
padku proszków otrzymanych z monokryształów. 

Szerokość naturalna linii absorpcyjnych rezonan¬ 
su jądrowego jest na ogół bardzo mała, rzędu ułamka 
Hz. Zwykle jednak obserwowana szerokość linii, 
zwłaszcza w ciałach stałych, jest dużo większa. Odpo¬ 
wiedzialne są za to przede wszystkim długozasięgowe 
oddziaływania dipol-dipol. Inne rodzaje oddziały¬ 
wań, np. elektrostatyczne lub z drganiami sieci kry¬ 
stalicznej, są silnie wytłumione (ekranowane) przez 
elektrony danego jonu. 

Z inną sytuacją spotykamy się w badaniach EPR. 

Tu szerokość linii, a więc i czas relaksacji są określone 
głównie przez oddziaływania z otoczeniem. W krysz¬ 
tałach relaksacja zachodzi przy udziale drgań sieci — 
fononów. Znamy trzy podstawowe mechanizmy re- relaksacja 
laksacji spin-sieć. Są to: relaksacja Orbacha, relaksa- spin-sieć 
cja Ramana i proces prosty. Schematyczny przebieg 
tych trzech procesów relaksacyjnych ukazuje rys. 14. 

Jeśli w procesie relaksacji prostej (rys. 14a) zamiast 
fononu wyemitowany zostanie foton, który z kolei 
może być pochłonięty przez inny jon, wówczas powie¬ 
my o relaksacji spin-spin. W eksperymencie można 


Kształt i szerokość linii NMR i EPR 

Szerokość linii absorpcyjnej dla pojedynczego mo¬ 
mentu magnetycznego zależy przede wszystkim od 
procesów relaksacji. Obserwowany czas relaksacji 
w różnych materiałach waha się od kilku mikrosekund 
do kilku minut — w zależności od temperatury i roi 
dzaju próbki. Pamiętajmy jednak, że w rzeczywistej 
próbce znajduje się bardzo wiele momentów magne¬ 
tycznych, których rezonans obserwujemy równocześ¬ 
nie. Może się zdarzyć, że w próbce będzie kilka ro¬ 
dzajów momentów magnetycznych, rozmaicie zorien¬ 
towanych, oddziałujących ze sobą i z otoczeniem.. 

Szczególnie skomplikowana sytuacja występuje 
w kryształach. Najczęściej współczynnik ^ zależy od 
orientacji pola magnetycznego względem osi krystalo¬ 
graficznych; mówimy, że w kryształach g jest wiel¬ 
kością tensorową. Centra magnetyczne w krysztale 
mogą mieć rozmaite otoczenia, czyli mogą się znaj¬ 
dować w nieco różnych warunkach, np. wskutek 
istnienia defektów sieci krystalicznej, lokalnych na¬ 
prężeń. Z tego powodu każdy moment magnetyepy 
ma nieco inną częstość rezonansową. Wtedy zamiast 
„czystych” linii rezonansowych obserwujemy linie 

22 - Encyklopedia fizyki współczesnej 
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Rys. 14. Schematyczny przegląd podstawowych mechanizmów 
relaksacji spin-sieó: a) relaksacja prosta, b) relaksacja Orbacha, 
c) relaksacja Ramana 

dość łatwo odróżnić wpływ różnych procesów re¬ 
laksacyjnych na szerokości linii. Czas relaksacji 
spin-spin praktycznie nie zależy od temperatury, na¬ 
tomiast prawdopodobieństwo relaksacji prostej jest 
proporcjonalne do temperatury próbki. Prawdopodo¬ 
bieństwo relaksacji typu orbachowskiego zależy od 
temperatury jak e“ J£:/fc2 \ a relaksacji typu ramanow- 
skiego — jak T 7 lub T 9 . Szerokość linii jest proporcjo¬ 
nalna do prawdopodobieństwa relaksacji; wynika to 
z relacji nieokreśloności: AE-r x h, czyli h-Aco-T ~ 

W tym wzorze r oznacza średni czas relaksacji, 
uwzględniający wszystkie możliwe mechanizmy re¬ 
laksacji. Obliczamy go ze wzoru: 
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czas 1 /t = l/r + 1 /r + 1 /r + 1 /t + 

relaksacja relaksacja relaksacja relaksacja relaksacja 

prosta Orbacha Ramana spia-spin 

czyli 

Aco = A co + A co -f- A co -f- A co -f- 

procesy relaksacja relaksacja relaksacja inne 
proste Orbacha Ramana spin-spin mechanizmy 


1/T, 

inne 


Aco . 



Wróćmy jeszcze na chwilę do wzoru (4) określają¬ 
cego kształt linii pochłaniania. Jest on słuszny, gdy 
moc padającej fali elektromagnetycznej nie jest zbyt 
duża. Przy dużej mocy padającego promieniowania 
obserwuje się tzw. nasycenie rezonansu. Jest to jeszcze 
jeden z przejawów kwantowego charakteru zjawiska, 
który krótko opiszemy. 

Początkowo wiele fotonów zostaje zaabsorbowa¬ 
nych i prawie wszystkie momenty magnetyczne próbki 
są przeniesione na wyższy poziom energetyczny, z któ¬ 
rego nie zdążają powrócić do stanu podstawowego. 
Podstawowy poziom energetyczny jest więc prawie 
pusty i nie ma momentów magnetycznych, które by 
mogły absorbować następne padające fotony. Rów¬ 
nież elektrony, jony, kompleksy jonów i inne mikro- 
obiekty, które są na wyższym poziomie energetycznym 
nie mogą pochłaniać energii, gdyż następne dozwolo¬ 
ne poziomy energii leżą zbyt wysoko. Zjawisko nasy¬ 
cania absorpcji rezonansowej utrudnia w pewnym 
stopniu badania, gdyż nie pozwala na użycie fal 
elektromagnetycznych o zbyt dużej intensywności; 
stad konieczność używania spektrometrów o bardzo 
wysokiej czułości. 

_ Wspomnimy jeszcze o dającym podobne efekty 
zjawisku „zakorkowania fononowego” (ang. phonon 
bottle neck) lub „wąskiego gardła fononowego”, 
obserwowanym w EPR. W bardzo niskiej temperatu¬ 
rze (poniżej 4 K) relaksacja może zachodzić jedynie 
przez emisję fononu lub fotonu. Wszystkie emitowane 
fonony mają tę samą energię równą h<o G . Oznacza to. 



<9=54,7® (Bil[001)) 




0 0.2 0,4 

pole magnetyczne 

rezonansowe jonu chromu Cr 3+ w sieci krystalicznej rubinu. Z prawej strony rysunku — płaszczyzna krystalograficzna 
w której przemieszczano stałe pole magnetyczne. Na dole — zależność dozwolonych wartości energii od orientacji zewnętrznego pola 
magnetycznego dla trzech różnych orientacji. Liczby 1-2 itd. oznaczają numery poziomów energetycznych, między którymi zachodzi 
przejście rezonansowe 


nasycenie 
absorpcji re¬ 
zonansowej 


zakorkowa¬ 
nie fononowe 
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że wzbudzany jest tylko jeden rodzaj drgań sieci kry¬ 
stalicznej. Zamiana takiego uporządkowanego drga¬ 
nia sieci na drgania chaotyczne (cieplne) trwa dość 
długo, niekiedy czas relaksacji jest rzędu kilku minut. 
W niskiej temperaturze kryształ jest „spokojny”, jego 
sieć krystaliczna praktycznie nie drga. Istnieje tylko 
jedna możliwość odprowadzenia nagromadzonego 
ciepła: przez powierzchnię kryształu (rozpad drgań 
uporządkowanych na drgania termiczne może też za¬ 
chodzić na defektach sieci). Ilość drgań określonego 
rodzaju jest jednak ograniczona, dlatego obserwujemy 
taki sam efekt jak przy nasycaniu rezonansu zbyt dużą 
mocą padającego promieniowania. 


Zastosowania EPR 

Wiele zastosowań EPR wiąże się z fizyką kryształów. 
Przypuśćmy, że dysponujemy niemagnetycznym kry¬ 
ształem, który jest domieszkowany jonami magnetycz¬ 
nymi. Mogą to być jony tytanu, wanadu, chromu, 
manganu, żelaza, kobaltu, niklu, miedzi lub ziem 
rzadkich. Jony takie zachowują się jak sondy, które 
pozwalają określać parametry elektrostatycznego pola 
krystalicznego w tym miejscu sieci krystalicznej, 
w którym się znajduje jon, oraz badać możliwe drga¬ 
nia sieci. Wyjaśnimy to na przykładzie jonów Cr 3 * 
v/ sieci krystalicznej rubinu. 

Energia momentu magnetycznego jonu chromu 
jest określona nie tylko przez zewnętrzne pole magne¬ 
tyczne, ale i przez pole krystaliczne. W konsekwencji 
dozwolone wartości energii jonu Cr 3+ zależą od wiel¬ 
kości pola magnetycznego i od orientacji tego pola 
określenie względem osi krystalograficznych. Wyjaśnia to bliżej 
położeń rys. 15; przedstawiono na nim widmo jonu Cr 3+ 
jonów w A1 2 O s (rubinie) we współrzędnych biegunowych, 
domieszko- Aby otrzymać taki rysunek, należy wielokrotnie 
wych powtórzyć eksperyment badając widmo EPR w róż¬ 
nych kierunkach w krysztale. Rysunek ten ukazuje, 
w jakiej płaszczyźnie krystalograficznej przemieszcza¬ 
ne było pole magnetyczne podczas eksperymentu. 
Z rys. 15 widać ponadto, jakie elementy symetrii ma 
w sieci krystalicznej to miejsce, które zajmuje jon 
chromu. Analizując tego typu wyniki eksperymental¬ 
ne, można określać położenia wbudowanych w sieć 
krystaliczną jonów domieszkowych. Jeśli jony do¬ 
mieszkowe wbudowują się w różne położenia w krysz¬ 
tale, to na podstawie kilku nałożonych widm EPR 
określanie można próbować określić symetrię kryształu jako 
symetria całości. Jest to więc metoda uzupełniająca w stosunku 
kryształu do rentgenowskich badań strukturalnych. 

Spektroskopia EPR znalazła jeszcze wiele innych za¬ 
stosowań. Podjęto np. udane próby określania za¬ 
wartości miedzi w rudach. Dokładność pomiaru wy¬ 
nosi ok. 5%. Jonami, których rezonans badano, były 
jony Cu ++ . 

Badając widmo EPR w różnych warunkach, można 
wyciągać wnioski o defektach struktury krystalicznej 
badanie (dyslokacje, luki, atomy w pozycjach międzywęzło- 
defektów wych, struktura mozaikowa, uszkodzenia radiacyjne 
struktury i in.), których rozmiary są zbyt małe, aby mogły być 
wykryte defektoskopem ultradźwiękowym. Na wy¬ 
gląd widma mają również wpływ naprężenia we¬ 
wnątrz kryształu. Można więc śmiało powiedzieć, że 
spektroskopia EPR bywa pożytecznym narzędziem 
do badania jakości monokryształów. 


Wygląd widma EPR jonów jakiegoś pierwiastka za¬ 
leży od wartościowości tego jonu. Fakt ten jest często 
wykorzystywany przez technologów materiałów mo- 
nokrystalicznych do weryfikacji hipotez o rozmiesz¬ 
czeniu jonów domieszki. 

W ostatnich latach coraz większą karierę robi spek¬ 
troskopia EPR w badaniach biologicznych i bioche¬ 
micznych. Chodzi tu głównie o badania krwi (hemo¬ 
globina zawiera w swym składzie jony żelaza) oraz 
rozmaitych reakcji biochemicznych. Te ostatnie ba¬ 
dania stawiają szczególnie wysokie wymagania co do 
stosowanej aparatury. Przy badaniach reakcji bio¬ 
chemicznych, zwłaszcza z udziałem wolnych rodni¬ 
ków, zachodzi potrzeba otrzymywania do tysiąca 
widm w ciągu, sekundy. Tylko w ten sposób można 
prześledzić przebieg reakcji i jej kinetykę. Wydaje się, 
że badania tego typu mogą być pomocne w zwalcza¬ 
niu raka, a także niektórych chorób psychicznych. 

Praktyczną dziedziną zastosowania badań EPR jest 
burzliwie rozwijająca się elektronika kwantowa. Wy¬ 
niki badań rezonansu paramagnetycznego posłużyły 
konstruktorom laserów i maserów oraz wzmacniaczy 
o niskim poziomie szumów, używanych w radio¬ 
astronomii i telekomunikacji satelitarnej. 


Rezonans ferromagnetyczny 


Jest to pochłanianie energii pola elektromagnetycz¬ 
nego przez próbkę ferromagnetyczną. Istotną różnicą 
w stosunku do poprzednio opisanych rezonansów jest 
to, że w rezonansie ferromagnetycznym (FMR) pre¬ 
cesję w polu zewnętrznym wykonuje moment magne¬ 
tyczny całej próbki. Momenty magnetyczne poszcze¬ 
gólnych cząstek, z których się składa próbka, oddzia¬ 
łują ze sobą wzajemnie, a skutkiem tego oddziaływa¬ 
nia jest równoległe ustawienie wszystkich momentów 
magnetycznych w próbce. Oddziaływania te nazywa¬ 
my wymiennymi. Ich natura jest czysto kwantowa, 
nie mają one odpowiednika klasycznego. Oddziały¬ 
wania wymienne sprawiają, że próbka jest namagne¬ 
sowana nawet w nieobecności zewnętrznego pola 
magnetycznego. Nasz fundamentalny wzór (2) po¬ 
zostaje słuszny, ale należy w nim jakoś uwzględnić 
pole magnetyczne istniejące w próbce. Okazuje się, 
że warunki rezonansu zależą nie tylko od właściwości 
materiału próbki, ale i od jej kształtu. Dokładne roz¬ 
wiązanie można uzyskać tylko w odniesieniu do pró¬ 
bek o kształcie elipsoidy, w szczególności kuli. 
Szczegółowe obliczenia dotyczące tego problemu 
były wykonane po raz pierwszy przez C. Kittela. 

Badanie tego rezonansu ma duże znaczenie w tech¬ 
nice: pozwala wyznaczać parametry materiałów uży¬ 
wanych do budowy transformatorów i rdzeni do ce¬ 
wek, materiałów służących do produkcji pamięci 
maszyn cyfrowych oraz materiałów przeznaczonych 
na trwałe magnesy. Metodami FMR bada się rów¬ 
nież materiały przeznaczone do pracy w podzespołach 
elektroniki mikrofalowej i telewizji oraz w projektowa¬ 
nych układach pamięci holograficznej. 

L. A. Kazicyna, N. B. Kupletska Metody spektroskopowe 
wyznaczania struktury związków organicznych, Warszawa 1974; 
C. Kittel Wstęp do fizyki ciała stałego, Warszawa 1976; M. Suff- 
czyński Prześwietlanie NMR, Post. Fiz. 29,245 (1978); R. Wadas 
Biomagnetyzm, Warszawa 1978; Encyklopedia fizyki, t. 3, War¬ 
szawa 1974. 


Zjawisko Mossbauera 

Andrzej Hrynkiewicz 

Odkrycie w 1957 r. przez R. Mossbauera zjawiska badawczej, zwanej spektroskopią móssbauerowską lub 
bczodrzutowej emisji i absorpcji promieniowania y rezonansową spektroskopią promieniowania y. Dzięki 
dostarczyło nauce nowej, niezwykle owocnej metody bardzo wysokiej energetycznej zdolności rozdzielczej 
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rezonansowa spektroskopia promieniowania y po¬ 
zwoliła wykonać wiele precyzyjnych pomiarów fizycz¬ 
nych o podstawowym znaczeniu poznawczym oraz 
stała się powszechnie stosowaną metodą w badaniach 
z dziedziny fizyki ciała stałego, chemii, fizyki jądrowej 
i biologii. Coraz szersze jest również zastosowanie 
techniczne zjawiska Móssbauera, czego przykładem 
może być jego wykorzystanie do kontroli względnej 
prędkości i regulacji procesu zbliżania się dwóch po¬ 
jazdów kosmicznych. 

wpływ Pogląd, że wiązanie krystalochemiczne nie ma wpły- 
wiązań wu na przebieg procesów jądrowych, już dawno oka- 
krystalo- zał się niesłuszny. Co prawda w większości wypadków, 
chemicznych badając procesy jądrowe, można atom wchodzący 
na procesy w skład związku chemicznego traktować jako swo- 
jądrowe bodny, gdyż energia wiązania chemicznego jest na ogół 
zaniedbywalnie mała w porównaniu z energią nawet 
niskoenergetycznych przejść jądrowych. Jednak wpływ 
wiązań chemicznych i struktury krystalicznej na nie¬ 
które procesy jądrowe dobrze znano przed odkryciem 
zjawiska Móssbauera. Przykładami mogą być: za¬ 
burzenia korelacji kierunkowych promieniowania y 
przez wewnątrzkrystaliczne pola magnetyczne lub 
elektryczne, wpływ struktury ciał stałych na anihilację 
pozytonów lub wpływ wiązania chemicznego na 
prawdopodobieństwo wychwytu elektronu przez 
jądro atomowe. Dopiero jednak odkrycie zjawiska 
Móssbauera pozwoliło na badanie bezpośredniego 
s wpływu wiązań chemicznych i struktury krystalicznej 

na energię promieniowania emitowanego w przejś¬ 
ciach jądrowych. Typowa zdolność rozdzielcza osiąga¬ 
na w spektroskopii móssbauerowskiej jest rzędu 10 -12 , 
co znaczy, że w przypadku fotonów promieniowania 
y o energii 100 keV mogą być obserwowane zmiany 
energetyczne rzędu 10 - 7 cV. Tę wielkość należy po¬ 
równać z charakterystycznymi energiami drgań sieci 
krystalicznej wynoszącymi 0,01-0,1 eV. 

Aby wyjaśnić, na czym polega zjawisko Móssbaue¬ 
ra, należy zacząć od omówienia zjawiska emisji i re¬ 
zonansowej absorpcji fotonów. 


Rezonansowa absorpcja i rozpraszanie 
promieniowania 

Zjawisko rezonansu występuje wówczas, gdy pewne¬ 
mu układowi dostarczymy dokładnie takiej ilości 
energii, jaka jest potrzebna, aby ten układ przeszedł 
z niższego na wyższy poziom energetyczny. Najczęś¬ 
ciej mamy do czynienia z przejściem układu z poziomu 
podstawowego na któryś z jego poziomów wzbudzo¬ 
nych. Gdy dany układ będziemy naświetlać wiązką 
promieniowania o takiej długości fali, że energia 
kwantów promieniowania będzie odpowiadać różnicy 
energii między stanem wzbudzonym i podstawowym, 
to zaobserwujemy absorpcję promieniowania, której 
towarzyszy przechodzenie układu do stanu wzbudzo¬ 
nego. Zjawisko to nosi nazwę absorpcji rezonansowej. 
Wzbudzony układ, wracając do stanu podstawowego 
emituje promieniowanie o tej samej długości fali, lecz 
na ogół w innym kierunku niż kierunek padającej 
wiązki promieniowania, czyli następuje zjawisko roz¬ 
praszania, które w tym wypadku nazywamy rozpra¬ 
szaniem rezonansowym. 

Przedstawiony opis zjawisk jest ścisły tylko wów¬ 
czas, gdy masa rozpatrywanego układu jest nieskoń¬ 
czenie wielka w porównaniu z masą odpowiadającą 
energii absorbowanych i rozproszonych kwantów, 
absorpcja Jeśli chodzi o atomy, to warunek ten jest spełniony 
i rozproszenie w wystarczająco dobrym przybliżeniu, toteż w optyce 
rezonansowe atomowej absorpcja i rozproszenie rezonansowe mogą 
w optyce być zaobserwowane bez trudności. Łatwo jest wyko- 
atomowej nać następujące doświadczenie. Z lampy sodowej, 
w której świeci rozgrzana para sodu, rzucamy wiązkę 
charakterystycznego dla sodu żółtego światła na 
szklane naczynie wypełnione również parą sodu w niż¬ 
szej temperaturze. Ponieważ kwanty światła emitowa¬ 
ne z lampy przez pobudzane w niej do świecenia ato- 
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my posiadają energię właśnie taką, jaka jest potrzebna 
do wzbudzenia, znajdujących się w stanie podstawo¬ 
wym, atomów sodu w naczyniu, następuje absorpcja 
rezonansowa podającego światła. Wiązka światła zo¬ 
staje w zasadzie całkowicie pochłonięta w cienkiej 
warstwie pary. Pobudzane atomy tej warstwy, wra¬ 
cając do stanu podstawowego, rozpraszają rezonan- 
sowo światło, tak że warstwa pochłaniająca pierwotną 
wiązkę sama staje się źródłem intensywnego żółtego 
promieniowania. 

Analogicznego zjawiska można by się spodziewać absorpcja 
w fizyce jądrowej. Można by przypuszczać, że np. i rozprosze- 
promieniowanie y o energii 411 keV emitowane przez nie rezonan- 
rtęć 19B Hg będzie silnie absorbowane rezonansowo sowę w fizy- 
w cienkiej warstwie rtęci umieszczonej na drodze ce jądrowej 
wiązki promieni y. Tak jednak zaprojektowane do¬ 
świadczenie nie daje oczekiwanego wyniku. Aby wy¬ 
tłumaczyć, dlaczego absorpcję rezonansową można 
z łatwością obserwować w optyce, a analogiczne do¬ 
świadczenie w fizyce jądrowej nie daje rezultatu, trzeba 
rozważyć dokładniej procesy emisji i absorpcji pro¬ 
mieniowania a w' szczególności rozpatrzeć konsek¬ 
wencje faktu, że energia kwantu promieniowania y 
nie może być pominięta w porównaniu z masą emitu¬ 
jącego go jądra atomowego. 


Naturalna szerokość linii widmowej 

Fotony promieniowania emitowanego przez zbiór 
tego samego rodzaju atomów lub jąder nie mają jed¬ 
nakowej, ściśle określonej energii. Jest to konsekwen¬ 
cją zasady nieoznaczoności Heisenberga, która wiąże 
nieoznaczoność energii AE i czasu At wzorem: 

AE-At = h, 

gdzie h = 6,6 T0 “ 16 eV • s jest stałą Plancka podzieloną rozmycie 
przez 2;r. Z zasady nieoznaczoności wynika, że roz- energetyczne 
mycie energetyczne atomowego lub jądrowego poziomu 


Rys. 1. Naturalny kształt 
linii widmowej 



poziomu jest odwrotnie proporcjonalne do jego śred¬ 
niego czasu życia r. Rozmyciu energetycznemu po¬ 
ziomu odpowiada rozmycie linii widmowej emitowa¬ 
nego promieniowania. Na wykresie przedstawiającym 
zależność liczby emitowanych fotonów od ich energii 
(rys. 1) linia widmowa ma kształt krzywej Lorentza 

N(E) = const {E _ Ei} Y +(r i 2 f ’ 

gdzie E 0 jest najbardziej prawdopodobną energią 
fotonów emitowanych w danym przejściu. Szerokość 
krzywej r w połowie wysokości, charakteryzująca 
rozmycie linii widmowej, jest zgodnie z zasadą nie¬ 
oznaczoności związana ze średnim czasem życia po¬ 
ziomu t za pomocą wzoru: 

r = fi/r ( 1 ) 

i nosi nazwę naturalnej szerokości linii widmowej. 

W przypadku atomów sodu emitujących linię żół¬ 
tego światła o długości fali 589 nm średni czas życia 
t=1,5*10~ 8 s, a więc naturalna szerokość linii 
wynosi r = 4,4-10 “ 8 eV. W przypadku promienio¬ 
wania y rtęci 189 Hg średni czas życia jądra w stanie 
wzbudzonym 411 keV r = 2 • 10 ” 11 s i obliczona z wzo¬ 
ru (1) naturalna szerokość linii-T = 3,3-10 ~ 5 eV. In- 








teresujące jest porównanie w obu wypadkach względ¬ 
nych szerokości linii widmowych, to jest stosunków 
szerokości linii do odpowiednich energii przejść. Dla 
atomowego przejścia w sodzie energia fotonów pro¬ 
mieniowania jest równa 2,1 eV czyli JT/E = 2-10" 8 , 
a dla jądrowego przejścia w rtęci r/E — 8- 10“ n . 
Względna szerokość linii jest miarą dokładności, 
z jaką można by wyznaczyć energię przejść, gdyby 
doświadczenie pozwoliło na obserwację naturalnej 
szerokości linii. Na ogół linia widmowa ulega dodat¬ 
kowemu, znacznemu poszerzeniu wskutek wielu zja¬ 
wisk zachodzących w badanych substancjach. Naj¬ 
bardziej istotne dla dalszych rozważań jest tak zwane 
poszerzenie dopplerowskie, wywołane ruchem ciepl¬ 
nym atomów emitujących promieniowanie. 

Dopplerowskie poszerzenie linii 
widmowych 

Jeżeli promieniujący atom porusza się z prędkością v 
w kierunku obserwatora, to występuje efekt Dopplera 
polegający na tym, że obserwowana energia fotonu 
ulega zmianie o 

AE — Evjc y 

gdzie E jest energią fotonu w układzie związanym 
z poruszającym się atomem, a c prędkością światła 
= 3-10 8 m/s. 

W ruchu cieplnym atomów reprezentowane są 
różne prędkości i różne kierunki ruchu, co prowadzi 
do poszerzenia (rozmycia) linii widmowej. Ze wzros¬ 
tem temperatury średnia prędkość ruchu cieplnego 
rośnie i wywołane przez efekt Dopplera poszerzenie 
linii staje się coraz większe. Poszerzenie to, zwane 
temperaturowym, dla źródła gazowego w temperatu¬ 
rze bezwzględnej T może być w przybliżeniu obliczone 
z wzoru 



poszerzenie gdzie k = 8,62-10”* eV/K jest stałą Boltzmanna, 
temperatu- a M —masą emitującego atomu. W temperaturze 
rowe pokojowej T 300 K dla przejść optycznych w so¬ 
dzie D = 3,7-10”® cV, a dla przejść y w rtęci D = 
= 0,27 eV. W obu wypadkach poszerzenie tempera¬ 
turowe wielokrotnie przewyższa naturalną szerokość 
linii. 

Odrzut spowodowany emisją lub absorpcją 
promieniowania 

Atom lub jądro emitujące foton promieniowania 
doznaje odrzutu, którego energia może być obliczona 
z zasady zachowania pędu. Pęd odrzutu p musi być 
równy pędowi EJc emitowanego fotonu. Ponieważ 
energia odrzutu E r — p 2 /2M, więc 



Rys. 2. Efekt odrzutu przy emisji i absorpcji fotonu 


Zgodnie z zasadą zachowania energii emitowany 
foton ma energię E' niższą od energii wzbudzenia E 0 , 
gdyż część energii przejścia zostaje zużyta na odrzut 
E' = Eo—Er. Podobnie, w procesie absorpcji, atom 
lub jądro pochłaniające foton również doznaje od¬ 
rzutu, a więc energia fotonu, który mógłby być re- 
zonansowo zaabsorbowany, musi mieć energię E" 
wyższą o Er od energii wzbudzenia E 0 . Jak stąd widać, niedopaso- 
występuje niedopasowanie energetyczne fotonów emi- wani© ener- 
towanych i absorbowanych o wartość 2 E r . Tę sytuację getyczne 
przedstawiono na rys. 2. fotonów 


Warunki obserwacji absorpcji rezonansowej 

Jeżeli przesunięcie energetyczne 2 E r linii emisji i ab¬ 
sorpcji jest mniejsze od szerokości naturalnej linii, to 
absorpcja rezonansowa może być łatwo zaobserwo¬ 
wana. Zachodzi to w przypadku przejść optycznych. 
Dla sodu r = 4,4-10” 8 eV a 2 E r = 2- 10" 10 eV czyli 
r > 2 E r , co tłumaczy pozytywny rezultat opisanego 
poprzednio prostego doświadczenia z absorpcją i rozp- 
praszaniem rezonansowym żółtej linii w parze sodu. 

Dla przejść y odrzut jądra jest tak duży, że niedo¬ 
pasowanie energetyczne 2 E r znacznie przekracza 
szerokość naturalną linii. Wystarczy dla przejścia y 
w rtęci porównać 2 E r = 0,92 eV i JT = 3,3*10"® eV. 
Przesunięcie energetyczne wskutek odrzutu jest 30 000 
razy większe od szerokości naturalnej linii. Nic więc 
dziwnego, że doświadczenia z promieniowaniem y, 
przeprowadzone w sposób analogiczny do doświad¬ 
czeń z dziedziny optyki, nie mogą się udać. 

Od 1950 r. wykonano wiele pomysłowych ekspery¬ 
mentów w celu zaobserwowania absorpcji i rozpra¬ 
szania rezonansowego promieniowania y. We wszyst- 



Rys. 3. Poszerzenie temperaturowe linii widmowych umożliwia 
obserwację absorpcji rezonansowej 

kich tych doświadczeniach starano się różnymi meto- sposoby 
darni skompensować przesunięcia energetyczne 2 E r . kompensacji 
Jedna z metod polegała na wykorzystaniu dopple- przesunięcia 
rowskiego, temperaturowego poszerzenia linii. W wy- energetycz- 
sokich temperaturach poszerzenie temperaturowe nego 
staje się tak duże, że skrzydła linii emisji i absorpcji 
pokrywają się w pewnym stopniu i obserwacja absorp¬ 
cji rezonansowej staje się możliwa. Prawdopodobień¬ 
stwo absorpcji rezonansowej jest dane przez stosunek 
powierzchni zakreskowanej na rys. 3 do całkowitej 
powierzchni linii widmowej. 

Inna metoda skompensowania przesunięcia energe¬ 
tycznego polega na nadaniu źródłu w aparaturze po¬ 
miarowej dużej prędkości w kierunku absorbenta. 

Przy dostatecznej prędkości tego ruchu, przesunięcie 
linii emisji powstające wskutek efektu Dopplera, 
powoduje jej pokrycie się z linią absorpcji i zjawisko 
rezonansu może być zaobserwowane. Całkowite 
skompensowanie niedopasowania energetycznego wy¬ 
maga stosowania bardzo dużych prędkości. W przy¬ 
padku 198 Hg jest to prędkość ok. 700 m/s. Prędkości 
tego rzędu realizuje się za pomocą rotora o bardzo 
wysokiej częstości obrotów, na którego ramionach 
znajdują się źródła, a skolimowana przez układ prze¬ 
słon ołowianych wiązka promieni y wylatuje stycznie 
do obwodu koła, po którym źródła się poruszają. 
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Można również do skompensowania rozsunięcia 
linii emisji i absorpcji wykorzystać ruch jąder wywo¬ 
łany przez odrzut w jakimś procesie jądrowym bez¬ 
pośrednio poprzedzającym emisję promieniowania y. 
Takimi procesami mogą być rozpad wychwyt 
elektronu lub jakaś reakcja jądrowa. 

Odkrycie zjawiska bezodrzutowej emisji i absorpcji 
promieniowania y przez jądra w kryształach stwo¬ 
rzyło zupełnie nowe możliwości badania absorpcji re¬ 
zonansowej promieniowania y, wywołało lawinę prac 
naukowych o podstawowym znaczeniu w różnych 
dziedzinach fizyki, a R. Mdssbauerowi przyniosło 
nagrodę Nobla w 1961 r. 


Zjawisko bezodrzutowej emisji i absorpcji 
promieniowania 

W 1957 r. R. Mossbauer rozpoczął w Heidelbergu 
doświadczenie nad rezonansową absorpcją promienio¬ 
wania y. Badał rozpraszanie rezonansowe linii 129 keV 
191 Ir. Ponieważ przesunięcie energetyczne 2 E r jest 
w tym wypadku w preybliżeniu równe poszerzeniu 
temperaturowemu linii y w temperaturze pokojowej, 
linie emisji i absorpcji pokrywały się w znacznym 
stopniu i efekt rezonansowy był obserwowany. 

Mossbauer obniżył temperaturę źródła i absorben- 
ta, spodziewając się zmniejszenia efektu. Tymczasem 
rozproszenie rezonansowe wzrosło! Mossbauer wy¬ 
tłumaczył ten zaskakujący efekt na podstawie znanej 
od 20 lat teorii Lamba wpływu wiązania atomów 
w sieci krystalicznej na przekrój czynny chwytania 
powolnych neutronów i wykazał w pięknym ekspery¬ 
mencie, że dość znaczny ułamek promieniowania y 
irydu nie wykazuje przesunięcia energetycznego, wy¬ 
wołanego przez odrzut jąder, ani też dopplerowskiego 
poszerzenia temperaturowego. Obserwowana linia y 
ma szerokość naturalną. Brak przesunięcia energe¬ 
tycznego tłumaczy się tym, że w pewnej części przy¬ 
padków pęd odrzutu atomu związanego w sieci kry¬ 
stalicznej, towarzyszący emisji lub absorpcji fotonu y, 
zostaje przejęty przez cały kryształ. Wówczas we 
wzorze (2) na energię odrzutu zamiast masy atomu M 
wystąpi masa całego kryształu. Nawet w bardzo 
drobnym proszku krystalicznym poszczególne ziarna 
zawierają tak wielką liczbę atomów, że energia odrzutu 
staje się zanied by walnie mała, o wiele mniejsza od 
naturalnej szerokości linii widmowej. Zjawisko emisji 
i absorpcji można wtedy traktować jako procesy 
bezodrzutowe. Dopasowanie energii fotonów emito¬ 
wanych i absorbowanych jest idealne, a więc spełnione 
są warunki obserwacji absorpcji rezonansowej. 

Zniknięcie poszerzenia dopplerowskiego wywoła¬ 
nego ruchami termicznymi atomów jest spowodowane 
dużą częstością drgań atomów w sieci krystalicznej 
(co x 10 13 s -1 ). W ciągu czasu życia wzbudzonego 
stanu jądrowego średnia wartość składowej prędkości 
atomu w kierunku emisji fotonu jest równa zeru 
i efekt Dopplera pierwszego rzędu nie występuje. 

Wielkość zjawiska Móssbauera zależy od prawdo¬ 
podobieństwa, że pęd odrzutu zostanie przejęty przez 
cały kryształ. Prawdopodobieństwo to może być obli¬ 
czone na podstawie określonego modelu sieci krysta¬ 
licznej. Ponieważ na energię kryształu składa się 
energia ruchów drgających atomów wokół położeń 
równowagi, możemy kryształ traktować jako zbiór 
oscylatorów, których częstości drgań co zawarte są w 
pewnym przedziale. Zmiana energii kryształu polega 
na tworzeniu lub niszczeniu kwantów hco zwanych 
fononami, czemu towarzyszy odpowiednia zmiana 
liczb kwantowych oscylatorów. Bezodrzutowa emisja 
lub absorpcja fotonu y zachodzi wówczas, gdy odrzut 
atomu nie prowadzi do wzbudzenia sieci krystalicz¬ 
nej czyli do kreacji fononów, a pęd odrzutu jest prze¬ 
jęty przez cały kryształ. 

Prawdopodobieństwo zjawiska Móssbauera można 
określić przez podanie stosunku liczby fotonów y 
emitowanych bezodrzutowo do całkowitej liczby fo¬ 
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tonów y. Ułamek ten zwany czynnikiem Debye’a- 
Wallera, obliczony na gruncie debye’owskiego modelu 
sieci krystalicznej, wyraża się wzorem 

eiT 

/—HSMt)7 -£Ą\ ® 

o 

gdzie 6 jest temperaturą Debye’a danego kryształu 
związaną z maksymalną częstością drgań atomów 
camax zależnością 0 = co m ^!k. Czynnik /, jak widać 
ze wzoru (3), jest tym większy, im mniejsza jest ener¬ 
gia odrzutu jądra, im wyższa temperatura Debye ł a 



Rys. 4. Zależność czynnika Debye’a-Wallera od temperatury dla 
przejść 14,4 kcV w jądrach żelaza 67 Fe i 134 keV w jądrach 
renu * 87 Re 

i w im niższej temperaturze T przeprowadzany jest 
eksperyment. Na rys. 4 pokazana jest zależność czyn¬ 
nika Debye’a-Wallera od temperatury dla przejść 
14,4 keV w G7 Fe i 131 keV w 187 Re. Gdy wartości / 
są małe, doświadczenie należy przeprowadzać w tem¬ 
peraturze ciekłego azotu lub nawet ciekłego helu. 

Technska pomiarów w rezonansowej 
spektroskopii promieniowania y 

W celu zbadania kształtu linii promieniowania y ko¬ 
rzystamy z efektu Dopplera. Typowa aparatura 
móssbauerowska jest przedstawiona na rys. 5. Składa 

źródto absorbent detektor 



się ona ze źródła, absorbenta i detektora promieni y, 
którym najczęściej jest licznik scyntylacyjny. Źródło 
umieszczone w ruchomym uchwycie można wprawiać 
w ruch względem absorbenta za pomocą odpowied¬ 
niego mechanizmu. Ruch źródła musi być jednostaj¬ 
ny, przy czym powinna być zapewniona możliwość 
nadawania różnych prędkości. Gdy źródło i absorbent 
mają identyczną strukturę chemiczną i pozostają 
względem sobie w spoczynku, energie linii emisji 
i absorpcji są do siebie dopasowane, absorpcja rezo- 


czynnik 

Debye'a-WaN 

lora 



















Rys. 7. Nuklidy, dla których obserwowano przejścia mossbaucrowskie, na tle układu okresowego 
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gazy 

szlachetne 


nansowa jest maksymalna i detektor rejestruje naj¬ 
mniejszą liczbę fotonów. Gdy nadamy źródłu pewną 
prędkość v, efekt Dopplera psuje dopasowanie energii 


-1/ o +v 

prędkość względna 

Rys. 6. Zależność liczby transmitowanych fotonów od względnej 
prędkości ruchu źródła i absorbenta 


o AE = Ev/c. Absorpcja rezonansowa maleje i de¬ 
tektor rejestruje więcej fotonów przechodzących 
przez absorbent. W ten sposób wyznaczając szybkość 
zliczeń w zależności od prędkości źródła N(v) otrzy¬ 
mujemy kształt linii promieniowania y (rys. 6), z tym 
że ma ona podwójną szerokość naturalną 2 F w wy¬ 
niku nakładania się linii emisji i absorpcji — każdej 
o szerokości naturalnej r. 

Prędkości z jakimi mamy do czynienia w spektro¬ 
skopii móssbauerowskiej są na ogół małe. Przy energii 
przejścia y 50 keV przesunięcie energii o naturalną 
szerokość linii /"dla stanu jądrowego o średnim czasie 
życia 10“ 10 s odpowiada prędkości względnego ruchu 
źródła i absorbenta 4 cm/s; w przypadku średniego 
czasu życia 10“ 6 s będzie to prędkość 4 pm/s. 

Należy podkreślić, że oprócz jądrowej absorpcji 
rezonansowej, promieniowanie y jest pochłaniane 
i rozpraszane w absorbencie wskutek oddziaływania 
z elektronami. Efekt Mossbauera występuje więc tym 
silniej, im większa jest koncentracja nuklidu móssbau- 
erowskiego. W celu zwiększenia efektu stosuje się 
często absorbenty wzbogacone w badany izotop. 


Nuklidy móssbauerowskie 

Zjawisko Mossbauera zostało dotychczas zaobserwo¬ 
wane dla 100 przejść y w 80-ciu izotopach 44 pier¬ 
wiastków chemicznych. Liczba ta jest ograniczona 
z następujących względów: 

— Energia przejścia y nie może przekraczać ok. 
150 keV, gdyż dla wyższych energii emitowanych fo¬ 
tonów prawdopodobieństwo procesu bezodrzutowe- 
go staje się zbyt małe, by efekt Mossbauera mógł być 
obserwowany. 

— Przejście y musi prowadzić do stanu podstawo¬ 
wego stabilnego nuklidu lub nuklidu o tak długim 
czasie życia, aby móc rozporządzać dostateczną ilo¬ 
ścią materiału dla zrobienia absorbenta. 

— Mossbauerowski stan jądrowy musi być osią¬ 
gany w rozpadzie promieniotwórczym macierzystego 
nuklidu o dostatecznie długim czasie życia w porów¬ 
naniu z czasem trwania eksnervmentu. żeby źródło 
promieniowania y nie wyczerpało się zbyt szybko. 

— Czas życia stanu móssbauerowskiego nie może 
być zbyt długi ponieważ związana z tym bardzo mała 
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transmisja 


szerokość linii móssbauerowskiej wymaga stosowa¬ 
nia specjalnych środków ostrożności, aby występu¬ 
jące w laboratorium drgania nie zniszczyły warunków 
rezonansu. To ogranicza zbiór potencjalnych kandy¬ 
datów dla spektroskopii móssbauerowskiej do jąder, 
w których średni czas życia stanu wzbudzonego jest 
krótszy od 10“ 5 s. Najdłużej żyjącym stanem, dla któ¬ 
rego został dotychczas przeprowadzony eksperyment 
móssbauerowski, jest stan w 67 Zn o średnim czasie 
życia 9,3 ps i o energii wzbudzenia dziewięćdziesiąt 
trzy keV. 

Rysunek 7 przedstawia układ periodyczny pierwia¬ 
stków z oznaczeniem przypadków obserwacji zjawi¬ 
ska Móssbauera. Na ryś. 8 podane są schematy po¬ 
ziomów 57 Fe i Uft Sn, których związki chemiczne są 
najczęstszymi obiektami badań spektroskopii móss¬ 
bauerowskiej. Oba te nuklidy bardzo dobrze speł¬ 
niają przytoczone wyżej cztery warunki. 


Przesunięcie i rozszczepienia linii 
w widmach mossbauerowskich 

Spektroskopia móssbauerowska jest jedyną metodą 
badawczą pozwalającą na bezpośrednią obserwację 
przesunięć izomerycznych i nadsubtelnej struktury 
linii promieniowania y. Pozwala na to wyjątkowa 
energetyczna zdolność rozdzielcza. Miarą jej jest sto¬ 
sunek obserwowanej szerokości linii do energii przej¬ 
ścia. W przypadku 57 Fe stosunek ten jest równy 
3,2 T0~ 13 . Uwzględniając fakt, że precyzyjna apara- 
doktadność tura móssbauerowska pozwala stwierdzić przesunięcie 
metody linii z górą sto razy mniejsze od jej szerokości natu- 
mdssbauero- ralnej, otrzymujemy dokładność pomiaru rzędu 
wskiej 10 - 15 , z czym nie może rywalizować żaden inny po¬ 
miar w fizyce. Dobrze to zilustruje następujący przy¬ 
kład. Gdyby udało się zmierzyć odległość od Ziemi 
do Słońca (150 min km) z dokładnością do 1 mm, to ta 
dokładność byłaby jeszcze kilkakrotnie mniejsza niż 
zdolność rozdzielcza osiągana w spektroskopii 
móssbauerowskiej związków Fe. Zastosowanie nu¬ 
klidu móssbauerowskiego o krótszym czasie życia 
stanu wzbudzonego (np. « 7 Zn) pozwoliłoby na zwięk¬ 
szenie zdolności rozdzielczej jeszcze o kilka rzędów 
wielkości. 

Oddziaływanie jąder z otoczeniem w sieci krysta¬ 
licznej prowadzi na ogół do przesunięć, poszerzeń 
lub rozszczepień linii promieniowania y. Przykła¬ 



dowe, skomplikowane widmo móssbauerowskie po¬ 
kazane jest na rys. 9. Równocześnie występowanie 
tych efektów w źródle i absorbencie bardzo kompli¬ 
kuje analizę widm. Dla uproszczenia interpretacji zło¬ 
żonego widma stosujemy standardowe źródła dające 
pojedynczą, możliwie wąską linię emisji. Obserwo¬ 
wane wówczas poszerzenia i rozszczepienia linii mo¬ 
żemy przypisać wyłącznie absorbentowi i wniosko¬ 
wać z nich o sytuacji, w jakiej się tam znajdują badane 
jądra. 
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Przesunięcie izomeryczne (chemiczne) 
linii promieniowania y 

Maksimum absorpcji rezonansowej można obserwo¬ 
wać przy prędkości v = 0 względnego ruchu źródła 
i absorbenta tylko wówczas, gdy źródło i absorbent 
mają identyczną strukturę chemiczną i krystaliczną 
i gdy znajdują się w tej samej temperaturze. 

Różne otoczenia chemiczne badanych jąder powo¬ 
dują wzajemne przesunięcie linii emisji i absorpcji, 
zw. przesunięciem izomerycznym. W tym wypadku 
maksimum absorpcji rezonansowej można obserwo¬ 
wać przy prędkości różnej od zera. Przesunięcie izo¬ 
meryczne wywołane jest różnicą energii oddziaływa¬ 
nia elektrostatycznego elektronów z ładunkiem jądra 
w atomach źródła i absorbenta. Składają się na "nie 
dwa czynniki: różnica gęstości ładunku elektrycznego 
elektronów w obszarze jądra w źródle i w absorben¬ 
cie oraz różnica rozmiarów jądra w stanie wzbudzo¬ 
nym i podstawowym. 

Rolę obu tych czynników widać we wzorze na war¬ 
tość przesunięcia izomerycznego: 

6 = -Ze\Rl-Rl) [|>MO)| 2 -MO)| 2 ], 

gdzie R w i R p są średnimi promieniami jądra w sta¬ 
nach wzbudzonym i podstawowym, a kwadraty 
funkcji falowych elektronów |^a(0)| 2 i |^(0)| 2 
opisują gęstości elektronów w miejscu jądra (czyli 
w „zerze” układu współrzędnych) odpowiednio dla 
absorbenta i źródła. Z jest liczbą atomową danego 
pierwiastka a e — ładunkiem elementarnym. 


Nadsubtelna struktura linii 
promieniowania y 

Nadsubtelna struktura, czyli rozszczepienie na składowe linii 
promieniowania y jest spowodowane oddziaływaniem dipolo¬ 
wego momentu magnetycznego jądra z polem magnetycznym lub 
oddziaływaniem elektrycznego momentu kwadrupolowego jądra 
z gradientem pola elektrycznego. Pomiary rozszczepienia linii 
wywołanych tymi oddziaływaniami pozwalają wyciągnąć wnioski 
o polach elektromagnetycznych działających na badane jądra 
w atomach danej próbki krystalicznej. Jądro spełnia w tym wy¬ 
padku rolę miniaturowej sondy umieszczonej w centrum atomu. 

W wyniku oddziaływania momentu magnetycznego jądra n Oddziaływa* 
z polem magnetycznym H poziomy energetyczne jądra ulegają n j e 
rozszczepieniu na składowe o energiach danych przez wzór 

magnetyczne 


gdzie E a jest energią nierozszczepionego poziomu, a = /, 
są magnetycznymi liczbami kwantowymi jądra o spi¬ 
nie /. 

W ogó Inym wypadku oba poziomy, między którymi zachodzi 
przejście y, są rozszczepione, co z kolei powoduje rozszczepienie 
linii promieniowania y na szereg składowych. Liczba składowych 
zależy od spinów jądra w obu stanach i jest ograniczona przez 
reguły wyboru dla danego typu promieniowania. 

Oddziaływanie elektrycznego momentu kwadrupolowego ją- oddz£ałvwa* 
dra eQ z gradientem pola elektrycznego eq również prowadzi do 
rozszczepienia poziomów jądrowych. Energie poszczególnych 
składowych, w przypadku gradientu pola elektrycznego o sy- elektryczne 
metrii osiowej, wyrażają się wzorem 

r _ c’gQ[3m)-IU~V>] 

Ea = £ 0 +_-_ . 

4/(2/-1) 

Liczba składowych jest w tym wypadku mniejsza niż przy od¬ 
działywaniu magnetycznym, gdyż podstany o magnetycznych 
liczbach kwantowych —mi i +mi mają tę samą energię. 

Rysunek 10 przedstawia schematycznie przesunięcie i roz¬ 
szczepienie poziomów jądrowych ł7 Fe wywołane oddziaływaniem 
jądra z powłoką elektronową atomu. W przypadku 67 Fe spiny 
stanu podstawowego i wzbudzonego wynoszą odpowiednio I = 

= l !t * / = */»» moment magnetyczny w stanie podstawowym 
jest dodatni, a w stanie wzbudzonym ujemny. Liczba przejść 
jest ograniczona regułą wyboru Jmi = 0, ±1. W dolnej części 
rysunku pokazane są widma móssbauerowskie odpowiadające 
różnym przypadkom oddziaływania. 


Analiza widma móssbauerowskiego 

Analizę widma móssbauerowskiego prowadzi się 
przeważnie przy użyciu elektronowej maszyny cyfro¬ 
wej, stosując program, za pomocą którego można 
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Rys. 10. Przesunięcia i rozszczepienia poziomów jądrowych 67 Fe wywołane oddziaływaniem jądra z powłoką elektronową i otoczeniem 
w sieci krystalicznej 


określić położenia poszczególnych linii, ich szero¬ 
kości oraz powierzchnie opisane przez ich kontury. 
Dostarczone przez EMC dane są wykorzystane do 
obliczania wielkości przesunięć izomerycznych, roz¬ 
szczepień linii na składowe w wyniku ewentualnych 
oddziaływań nadsubtelnych, a także do wyznaczania 
stosunków natężeń poszczególnych składowych wid¬ 
ma. Wszystkie te dane pozwalają następnie wyciągać 
wnioski o oddziaływaniu badanych jąder z powłoką 
elektronową atomów i z ich otoczeniem w sieci kry¬ 
stalicznej. Dla uzyskania dodatkowych informacji 
o tych oddziaływaniach, a także dla ułatwiania inter¬ 
pretacji widma bardzo często pomiary wykonuje się 
w różnych temperaturach, co pozwala prześledzić 
temperaturową zależność parametrów wyznaczonych 
z widm móssbauerowskich. 


Zastosowanie spektroskopii 
móssbauerowskiej 


pomiar 
zmiany 
energia 
fotonu w po¬ 
lu grawita¬ 
cyjnym 
Ziemi 


Wkrótce po odkryciu zjawiska Móssbauera wyko¬ 
nano szereg pomiarów o fundamentalnym znaczeniu 
w fizyce. Przeprowadzenie ich stało się możliwe dzięki 
wyjątkowej zdolności rozdzielczej spektroskopii móss¬ 
bauerowskiej. Do pomiarów o podstawowym zna¬ 
czeniu można zaliczyć pomiar poprzecznego efektu 
Dopplera oraz prędkości hipotetycznego „wiatru 
eteru”. Najbardziej znanym z nich jest przeprowa¬ 
dzony przez Pounda i Rebkę pomiar zmiany energii 
fotonu w polu grawitacyjnym Ziemi. Kwant promie¬ 
niowania, przelatując między punktami o różnych 
wartościach potencjału grawitacyjnego, zmienia swą 
energię. Jest to tzw. przesunięcie ku czerwieni obserwo¬ 
wane w astronomii. Gdy foton spada w polu grawi¬ 
tacyjnym Ziemi, względny przyrost energii jest dany 
przez wzór: 

AE __ gH 
E c 2 ’ 


gdzie H jest różnicą wysokości przelatywaną przez 
foton, a g — wartością przyspieszenia ziemskiego. 
Wzór ten jest konsekwencją przypisania fotonowi 
E 

masy — 5 -#. Przy powierzchni Ziemi na wysokości 

Cr 

AE 

jednego metra —=1,1 -10~ 16 . Doświadczenia 
E 

Pounda i Rebki, a następnie Pounda i Snidera, zo¬ 
stały wykonane w Uniwersytecie Harvard w Stanach 
Zjednoczonych. Wykorzystali oni wieżę, w której 


między źródłem i absorbentem można było uzyskać 
różnicę poziomów dwadzieścia dwa metry. Mierzone 
było przesunięcie energetyczne linii promieniowania 
y 57 Fe dla fotonów lecących w górę i w dół. Pomiary 
wymagały bardzo wielkiej precyzji, gdyż oczekiwane 
przesunięcie stanowiło zaledwie ok. 1/500 obserwo¬ 
wanej szerokości linii. Wynik serii pomiarów, trwają¬ 
cych łącznie kilka miesięcy,pozwolił stwierdzić wys¬ 
tępowanie efektu, którego wielkość, w granicach błędu 
około jednego procentu, zgadza się z przewidywaniami 
teorii. 

W fizyce jądrowej efekt Móssbauera pozwolił 
w kilku przypadkach wyznaczyć różnicę rozmiarów 
jądra w stanie wzbudzonym i podstawowym, a także 
zmierzyć dipolowe momenty magnetyczne, elektrycz¬ 
ne momenty kwadrupolowe oraz średnie czasy życia 
wielu stanów jądrowych. 

Spektroskopia móssbauerowska stała się rutynową 
metodą badawczą i pomiarową w fizyce ciała stałego 
i chemii. Trudno jest podać pełną listę problemów, 
w których ma ona zastosowanie. Dla przykładu moż¬ 
na wymienić następujące problemy: 

— struktura wiązań chemicznych i charakter wią¬ 
zań chemicznych, 

— przebieg reakcji chemicznych i rola katalizato¬ 
rów, 

— materiały amorficzne i zestalone roztwory, 

— zjawiska relaksacyjne, 

— przejścia fazowe i zjawiska krytyczne, 

— stopy, zanieczyszczenia i defekty sieci krysta¬ 
licznej, uszkodzenia radiacyjne, 

— rozkłady ładunków i momentów magnetycz¬ 
nych w ciałach stałych, 

— struktura magnetyczna i przekazywane oddzia¬ 
ływania nadsubtelne, 

— struktura i dynamika cząsteczek biologicznie 
czynnych, 

— analiza minerałów. 

O tym, jak szeroki zakres ma spektroskopia móss¬ 
bauerowska, najlepiej świadczy fakt, że w naukowej 
literaturze światowej pojawia się rocznie około tysiąca 
publikacji poświęconych zastosowaniom tej metody. 

D. C. Champeney i in. Phys.Rev.Lctt. 7,241 (1963); W. I.Gol- 
danski Efekt Móssbauera i jego zastosowania w chemii , War* 
szawa 1966; U. Gonser Móssbauer Spectroscopy, Springer-Ver- 
lag 1975; H. J. HAYi in. Phys. Rev.Lett. 4,165 (1960); A. Hryn¬ 
kiewicz Efekt Móssbauera i jego zastosowania w fizyce ciała ster 
lego w: Cząstki elementarne, jądra atomowe, promieniotwórczość* 

Warszawa 1967; A. Hrynkiewicz, D. Kulgawczuk Spektro¬ 
skopia móssbauerowska, Metody badań minerałów i skał, War¬ 
szawa 1979; R. L. Móssbauer Z. Physik 151,124(1958); R. Y. Po- 
und, G.A. Rjebka Phys.Rev.Lett. 4, 274, 337 (1960); A. Wźrtes 
i in. Móssbauer Spectroscopy, Budapcst 1979. 
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KIERUNKI ROZWOJU OPTYKI 
Optyka współczesna 


Adam Kujawski 

Optyka jest bardzo obszerną dziedziną nauk fizycz¬ 
nych, a niektóre jej zagadnienia zalicza się-- ze 
względu na ich odrębność — również do techniki lub 
medycyny. W ostatnim ćwierćwieczu zakres badań 
i zastosowań optyki uległ istotnym przemianom. 
W rezultacie do optyki współczesnej weszły zupełnie 
nowe zjawiska i zastosowania, a opis większości zna¬ 
nych zjawisk optycznych uzyskał znacznie głębszą 
interpretację fizyczną. Wydarzeniem przełomowym — 
zarówno ze względu na zastosowanie, jak i poszerze¬ 
nie naszej wiedzy o naturze światła — stało się zbu¬ 
dowanie lasera, źródła światła o bardzo wysokim 
stopniu spójności. Ten fakt zapoczątkował też roz¬ 
wój kierunku badań, który przyjęto nazywać elektro¬ 
niką kwantową. 

Dwa artykuły w tym dziale są poświęcone podsta¬ 
wowym zjawiskom fizycznym zachodzącym w lase¬ 
rach i zasadzie działania laserów oraz właściwościom 
światła spójnego. Osobny artykuł omawia wybrane 
spośród bardzo licznych zastosowań laserów. 

Moc promieniowania laserowego może o wiele rzę¬ 
dów wielkości przewyższać moc źródeł konwencjo¬ 
nalnych. Fakt ten umożliwił odkrycie nowych zja¬ 
wisk — nieliniowych — oraz znalazł liczne zastoso¬ 
wania. Jednak w tym dziale przede wszystkim pod¬ 
kreśla się inną podstawową cechę światła laserowego 
(zarówno jego części widzialnej, jak również bliskiego 
nadfioletu i bliskiej podczerwieni) — jego spójność — 
i omówieniem tego zagadnienia rozpoczyna się cały 
dział optyki. Niewątpliwie możliwość uzyskania nie¬ 
mal doskonałej spójności należy do fundamentalnych 
osiągnięć zarówno przy poszukiwaniu odpowiedzi, 
jaka jest natura światła, jak i ze względu na zastoso¬ 
wania. Chociaż pojęcie spójności jest tak stare jak 
zjawisko interferencji, jego istotnie nowe znaczenie 
zarówno w klasycznym (falowym) jak i kwantowym 
(korpuskulamym) opisie światła pojawiło się dopiero 
po zbudowaniu laserów. To, że można otrzymywać 
światło spójne oraz to, że można wykorzystywać jego 
różne właściwości statystyczne odgrywa zasadniczą 
rolę we wszystkich zjawiskach optycznych od fizyki 
atomowej począwszy, a na optycznym przetwarzaniu 
danych skończywszy. Należy podkreślić, że obecnie 
zagadnienie spójności obejmuje nie tylko zjawiska 
interferencyjne, lecz przede wszystkim problemy 
właściwości statystycznych światła. Przykładem jest 
zagadnienie opisu wiązek światła, z których każda 
może dać ostre prążki w doświadczeniach interferen¬ 
cyjnych, a które —na podstawie doświadczeń ze 
zliczaniem fotonów —- mogą istotnie różnić się od 
siebie, rozkład statystyczny fotonów może być w nich 
zupełnie różny. 

Wybranym kierunkom badań, z pewnością mają¬ 
cym duże znaczenie dla dalszego rozwoju nauki i tech¬ 
niki, poświęcono cztery artykuły. Dwa z nich „Optyka 
nieliniowa” oraz „Ultrakrótkie impulsy światła”, 
informują o nowych zjawiskach optycznych i nowych 
technikach badawczych. Hasła „Holografia” oraz 
„Optyka fourierowska” są poświęcone dziedzinom, 
które w oryginalny sposób wykorzystują spójność 
światła laserowego. 

Łatwiej zrozumiemy dlaczego takie kierunki roz¬ 
woju obrała optyka współczesna, jeśli sobie uświa¬ 
domimy, że całe widmo fal elektromagnetycznych, od 
fal najkrótszych począwszy (promieniowanie y, czę¬ 
stości rzędu 10 2a Hz) aż do fal najdłuższych (fale 
radiowe, częstości do kilku Hz), opisuje teoria Max- 
wella, która mówi o właściwościach falowych, oraz 
teoria kwantowa, relacjonująca właściwości korpu- 


skularne. W wypadku fal radiowych energia fotonu hv 
jest bardzo mała i teoria Maxwella odgrywa bardzo 
dużą rolę, w wypadku fal najkrótszych większa jest 
rola teorii kwantowej. Jeśli chodzi o zakres optyczny 
(częstości rzędu HP-10 18 Hz; część widzialna sta¬ 
nowi wąskie pasmo wokół wartości 10 15 Hz), to 
można powiedzieć, że znajduje się on w środku wid¬ 
ma elektromagnetycznego i obydwa opisy teoretyczne 
są równie przydatne. Dla współczesnej optyki charak¬ 
terystyczne jest to, że z jednej strony znaczna część 
technik dotyczących fal długich, takich jakimi się 
posługuje radiotechnika czy telekomunikacja, stosuje 
się obecnie w części optycznej widma, z drugiej strony, 
kwantowa natura promieniowania optycznego uwi¬ 
dacznia się w zupełnie nowy sposób w takich np. 
zjawiskach, jak fluorescencja rezonansowa i procesy 
Ramana i Briliouina wymuszonego rozpraszania. 
W rezultacie, dzięki odkryciu nowych zjawisk i zna¬ 
lezieniu nowych metod eksperymentalnych, zarówno 
właściwości falowe jak i korpuskulame, odgrywające 
równorzędną rolę w optycznej części widma elektro¬ 
magnetycznego, są jeszcze wyraźniej zaakcentowane 
i udokumentowane. 

Charakterystyczne cechy rozwoju współczesnej op¬ 
tyki można podkreślić w trochę inny sposób dwoma 
następującymi spostrzeżeniami: Po pierwsze — daje 
się zauważyć tendencja do tego, by większość osiąg¬ 
nięć elektroniki współczesnej, wykorzystującej mikro¬ 
fale i fale radiowe, przenieść na zakres optyczny. 
Nazwy nowo powstałych dziedzin, takich jak opto¬ 
elektronika czy optyka zintegrowana, najlepiej o tym 
świadczą. Postęp i rozwój obydwu wymienionych 
dziedzin jest zresztą ściśle związany z opanowaniem 
nowych technologii wytwarzania materiałów, szcze¬ 
gólnie materiałów półprzewodnikowych. Na specjalną 
uwagę zasługuje tutaj dalsze wykorzystanie wyjątko¬ 
wych własności fizycznych złącza p-n. Oprócz dotych¬ 
czas znanych przyrządów elektronicznych, wykorzys¬ 
tujących złącze p-n —jak np. diody, fotoogniwa, 
tranzystory — pojawił się laser półprzewodnikowy, 
który dzięki opanowaniu technologii otrzymywania 
heterozłącz stał się jednym z najważniejszych elemen¬ 
tów optycznych współczesnej elektroniki. 

Drugie spostrzeżenie dotyczy jeszcze bliższego po¬ 
wiązania optyki z fizyką atomową. Ilustracją tego 
faktu jest pojawienie się zupełnie nowych metod 
spektroskopii optycznej oraz powstanie dziedziny 
zwanej optyką kwantową. Ta ostatnia obejmuje m.in. 
problemy statystyki fotonów i roli właściwości sta¬ 
tystycznych światła w procesach nieliniowych. Do no¬ 
wych kwantowych zjawisk optycznych należą zja¬ 
wiska koherentnego oddziaływania światła z układami 
atomowymi, jak np. echo fotonowe i wymuszona 
przezroczystość ośrodka. Na zakończenie zwróćmy 
uwagę, że o tym, jak dalece metody klasycznej elek¬ 
troniki i kwantowego opisu promieniowania elektro¬ 
magnetycznego połączyły się i przeniknęły wzajemnie 
w zakresie optycznym widma elektromagnetycznego, 
świadczy również nazwa elektronika kwantowa. Jest 
ona często używana dla określania zjawisk i technik 
laserowych, które w większości można także zaliczyć 
do optyki współczesnej. 

Wyborem tematów w tym rozdziale można było 
objąć tylko niektóre z obecnych kierunków rozwoju. 
Tematy te ilustrują fakt, że optyka współczesna stała 
się dziedziną wzajemnie powiązaną zarówno z innymi 
działami fizyki (szczególnie z fizyką atomową i fizyką 
ciała stałego), jak i z różnymi kierunkami techniki 
(zwłaszcza z elektroniką i telekomunikacją). 


nawiązanie 
do elektro¬ 
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Spójność światła 

Adam Kujawski 

Rozwój nauk fizycznych pierwszego ćwierćwiecza 
XX w. przyczynił się między innymi istotnie do lep¬ 
szego rozumienia, jaka jest natura światła i jaki jest 
mechanizm świecenia atomów, z których zbudowane 
są źródła promieniowania świetlnego. Odnosi się to, 
rzecz jasna, do źródeł konwencjonalnych, a więc 
takich, jak płomień, żarówka, gaz pobudzony do 
świecenia itp. Źródła te obecnie przyjęto nazywać, 
i tak je dalej nazywać będziemy, źródłami termicz¬ 
nymi, w odróżnieniu od źródeł laserowych, lub 
krótko — laserów, które od 1961 r. znalazły się 
w centrum zainteresowań naukowych i technicznych. 
Jedną z najważniejszych cech charakterystycznych dla 
światła laserowego, istotnie różniących je od światła 
termicznego, jest wysoki stopień spójności. Fakt ten, 
obok innych specyficznych właściwości wiązki lasero¬ 
wej, jest zawsze podkreślany przy omawianiu zasady 
działania lasera i właściwości światła przezeń wytwa¬ 
rzanego. światło spójne lasera znalazło też liczne za¬ 
stosowania w praktyce, np. w holografii. 

Problem czy dwie wiązki światła są spójne (kohe¬ 
rentne), czy nie, jest problemem tak starym, jak 
badanie zjawisk interferencji światła. W ciągu osta¬ 
tnich dwudziestu lat uzyskał on zupełnie nowe zna¬ 
czenie i stał się ważnym rozdziałem badań w optyce. 
W okresie przed zbudowaniem lasera, to znaczy 
w latach pięćdziesiątych, a następnie w okresie badań 
nowych zjawisk optycznych charakterystycznych dla 
światła laserowego, ukształtowała się teoria spójności 
światła. Teoria ta, posługując się odpowiednim apa¬ 
ratem matematycznym, ściśle opisuje interferencję, 
zjawiska w których gra rolę spójność wyższych rzę¬ 
dów, oraz statystyki zliczeń fotonów dla światła ter¬ 
micznego i laserowego. Omówimy tutaj te teoretyczne 
i doświadczalne aspekty statystycznych właściwości 
światła, które zalicza się do współcześnie rozumiane¬ 
go pojęcia spójności światła. 

Interferencja jest zjawiskiem charakterystycznym 
dla wszystkich ruchów falowych. Właśnie przy obser¬ 
wacji tego zjawiska wprowadza się pojęcie spójności 
(koherencji) ruchów falowych biorących udział w na¬ 
kładaniu się lub, mówiąc inaczej, interferowaniu ze 
sobą. Najprostszym przykładem, łatwym do zaobser¬ 
wowania jest nakładanie się dwu fal rozchodzących 
się na powierzchni wody, źródłami fal mogą być na 
przykład końce drgających prętów. Gdy drgają one ze 
stałą częstością, obserwuje się, że w wyniku nałożenia 
powstaje regularna struktura miejsc, w których drga¬ 
nia się wygaszają i wzmacniają, jak nail. 135, tabl. 33. 
Gdy jednak wytwarzane drgania mają różne częstości 
lub gdy wytwarzane są w sposób zupełnie przypad¬ 
kowy, powstały ruch falowy nie wykazuje cech regu¬ 
larności. O falach omówionych wyżej mówimy odpo¬ 
wiednio, że są spójne lub niespójne. Jest to klasyfi¬ 
kacja uproszczona. Łatwo bowiem można sobie wy¬ 
obrazić przypadki pośrednie, w których fala wypad¬ 
kowa powstająca na powierzchni wody ma pewne 
cechy regularności niezbyt łatwe do obserwacji. 
Zwróćmy jeszcze uwagę, iż stwierdzenie, czy fale są 
spójne czy niespójne nie wiązało się dotąd z żadną 
wielkością mierzalną i oparte jest tylko na opisowym 
porównaniu obrazów interferencyjnych. 


Spójność pierwszego rzędu 


Doświadczenie interferencyjne, w którym nakładają 
się dwie fale świetlne i którego idea jest taka sama, 
jak doświadczenia z dwiema falami na wodzie, nosi 
nazwę doświadczenia Younga. Odegrało ono bardzo 
ważną rolę w rozwoju poglądów na naturę światła. 


gdyż w istocie jest dowodem na falową naturę świa¬ 
tła. Przypomnijmy krótko warunki realizacji doświad¬ 
czenia Younga. Światło jednobarwne ze źródła Z 
pada na dostatecznie mały otwór lub szczelinę S 9 
a następnie na dwie szczeliny S x i S 2 w przesłonie. 


Rys. 1. Światło wy¬ 
chodzące ze szczeliny 
S pada na szczeliny S t 
i S t i na ekranie E 
powstaje obraz inter¬ 
ferencyjny 



Si 




S2 


tak jak ilustruje to rys. 1. Światło wychodzące z S 1 
i S 2 intereferuje i daje na ekranie E obraz interferen¬ 
cyjny, który obserwujemy bezpośrednio lub rejestru¬ 
jemy na kliszy. Aby obraz ten był ostry, to znaczy, 
aby składał się z wyraźnych jasnych i ciemnych 
prążków, rozmiary szczeliny S muszą być dostatecz¬ 
nie małe. Powstanie miejsca jasnego lub ciemnego 
w danym punkcie P ekranu E zależy od różnicy dróg 
S , S 1 P i S'S 2 P y gdzie przez S' oznaczyliśmy jakiś 
wybrany punkt szczeliny S (rys. 2). Gdy różnica ta 



jest równa parzystej wielokrotności połowy długości 
fali, mamy miejsce wzmocnienia interferujących fal 
świetlnych, a gdy nieparzystej wielokrotności — miej¬ 
sce wygaszenia. Powiększanie rozmiarów szczeliny Ś, 
przy ustalonej odległości od przesłony, prowadzi do 
znikania prążków. Wówczas bowiem do danego 
punktu P docierają promienie po drogach S"S X P 
i S"S 2 P, dając w ogólności inny wynik interferencji 
niż dla promieni z punktu S'. Można jednak źródło 
o dowolnie dużych wymiarach (w istocie w danym 
wypadku jest nim szczelina S ) odsunąć dostatecznie 
daleko od przesłony, tak że otrzyma się ostry obraz 
interferencyjny. Wówczas drogi S'S^P i $"S*P będą 
z bardzo dobrym przybliżeniem sobie równe. 

Przy ustalonych wymiarach szczeliny S i jej od¬ 
ległości od przesłony stwierdza się, że dla pewnej 
odległości szczelin Si i S 2 i. odległości większych obraz 
interferencyjny znika. Odległość ta określa wymiary 
obszaru spójności pola świetlnego wychodzącego ze 
źródła S i dochodzącego do przesłony. Gdy Ą i Ą 
leżą w obszarze spójności, obserwuje się prążki ciem¬ 
ne i jasne, a gdy S x i S 2 leżą za tym obszarem — 
prążków nie ma. Wielkość obszaru spójności zależy 
zatem od odległości i wymiarów źródła, jakim w da¬ 
nym wypadku jest szczelina S. Aby lepiej zilustrować 
powyższe zależności podajemy wybrane dane licz¬ 
bowe, które uzyskujemy posługując się ścisłą teorią 
koherencji, a które potwierdzają pomiary. Dla źródła 
światła jednobarwnego o długości fali X — 600 nm, 
którego średnica równa jest 1 mm, w odległości 20 m 
w płaszczyźnie równoległej do płaszczyzny źródła 
średnica obszaru spójności wynosi 3,8 mm. Oznacza 
to oczywiście, że aby otrzymać dobry obraz interfe¬ 
rencyjny, szczeliny S x i S 2 powinny być w odległości 
mniejszej niż 3,8 mm. Wprowadzone tutaj pojęcie 
obszaru spójności wiąże się z pojęciem spójności 
przestrzennej. Chodzi o to, że wyznaczając kolejno 
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tego rodzaju powierzchnie, możemy określić w prze¬ 
strzeni obszar o znanych powierzchniach, na których 
faza optycznej fali elektromagnetycznej jest taka sama. 

Przejdźmy teraz do innego ważnego eksperymentu 
interferencyjnego, który przeprowadził Michelson. 
Przyrząd, którym się posługiwał, nosi obecnie nazwę 
interferometru Michelsona. Za jego pomocą można 
zilustrować pojęcie spójności czasowej. Schemat za¬ 
sadniczy doświadczenia podany jest na rys. 3. Za¬ 




znaczono na nim źródło światła jednobarwnego S , 
wiązkę światła dzielącą się na dwie na zwierciadle 
półprzepuszczającym Z, a następnie powstałe wiązki 
odbite od zwierciadeł Z x i Z 2 , które nakładają się 
na siebie i na ekranie mogą dawać ostry obraz inter¬ 
ferencyjny. Gdy odległości ZZ X i ZZ 2 są równe, 
powstałe wiązki nakładają się z takimi samymi faza¬ 
mi. Gdy jednak droga przebywana przez światło w 
jednym z ramion interferometru jest większa niż w 
drugim, wiązki są przesunięte w fazie względem 
długość siebie. Okazuje się, że istnieje graniczna wartość róż- 
i czas nicy dróg optycznych w ramionach interferometru, 
spójności dla której obraz interferencyjny znika. Oznaczymy 
tę wartość przez l c . Nazywa się ją długością spójności. 
Wprowadza się również czas spójności zdefinio¬ 
wany przez r = Ic/Cy gdzie c oznacza prędkość 
światła. Z dobrym przybliżeniem można przyjąć, że 
t określa przedział czasu, w jakim pola elektromagne¬ 
tyczne wiązek świetlnych mają tę samą fazę. Jeśli 
więc doprowadzamy do interferencji dwu wiązek po¬ 
wstałych z jednej, jak np. w interferometrze Michel¬ 
sona, i w miejscu nakładania się pola wiązek są 
przesunięte w czasie o mniej niż r, to obserwuje się 
dobry obraz interferencyjny. Dla światła pochodzą¬ 
cego ze źródeł termicznych najdłuższy osiągalny czas 
koherencji jest rzędu 10“ 8 s, co odpowiada długości 
koherencji 3 m. 

W obydwu powyższych doświadczeniach interfe¬ 
rencyjnych odnoszących się odpowiednio do spójności 
przestrzennej i czasowej, mieliśmy do czynienia z na¬ 
kładaniem się dwu wiązek światła. Oznaczmy przez 

E x i Z 2 wektory natężenia pól elektrycznych wiązek 
nakładających się i przyjmijmy dla uproszczenia, że 
kierunki wektorów pól są tak samo skierowane. War¬ 
tość natężenia pola wiązki powstałej w wyniku nało¬ 
żenia wynosi więc w tym wypadku E = Ei+Zj. 
Można wykazać, że zaczernienie obrazu na kliszy za¬ 
leży od odpowiednio uśrednionej gęstości energii pola 
elektrycznego wiązki. Istnieją dwa zasadnicze powody 
uśredniania: 1) częstość fali elektromagnetycznej w 
zakresie optycznym jest rzędu 10 15 s" 1 i klisza nie re¬ 
jestruje zmian pola o tak dużej częstości; 2) fazy pola 
E mogą się bardzo szybko zmieniać w sposób przy¬ 
padkowy. Drugi z wymienionych punktów wiąże się 
w istotny sposób z mechanizmem świecenia atomów 
źródła i powrócimy do niego dalej. 
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Ponieważ gęstość energii jest wprost proporcjonal¬ 
na do wielkości E 2 , zaczernienie zależy od wielkości 
7 — <E*>, gdzie ostre nawiasy oznaczają uśrednia¬ 
nie. Mamy więc 

7= (E 2 ) = <E 2 >+<El> + 2<^£ 2 >. 

Ponieważ I x = <Ef>, h = <Zf>, więc 

7 — I i +I 2 +2( K E 1 E 2 y. (1) 

Ostatni człon we wzorze (1) nosi nazwę członu inter¬ 
ferencyjnego. Przeprowadzenie uśrednienia, które 
tutaj wprowadziliśmy, wymaga znajomości odpo¬ 
wiednich rozkładów prawdopodobieństwa. Można 
też, przy odpowiednich założeniach, rozumieć je jako 
uśrednienie po czasie. Problem równoważności obu 
sposobów uśredniania oraz kwestia kwantowego opisu 
zjawiska interferencji należą do współczesnej teorii 
koherencji światła. Dokładniejsza analiza wykazuje, 
że dla światła prawie monochromatycznego człon in- stop j e ^ 
terferencyjny we wzorze (1) jest proporcjonalny do S p6j no §ci 
wielkości zwanej stopniem spójności interferujących 
wiązek. Gdy wiązki są niespójne, stopień spójności 
równa się zeru i człon interferencyjny znika, dla 
maksymalnej koherencji równy jest on jedności. War¬ 
tość stopnia spójności zawiera się w granicach od 0 
do 1 i możliwe są sytuacje, w których wiązki światła 
są częściowo spójne. Stopień spójności można wyzna¬ 
czyć, mierząc tak zwaną widzialność prążków, tj. 

StOSUnek (7max — /min) : (7max4"7min ), gdzie 7max 
i /min są maksymalnymi i minimalnymi natężeniami 
prążków ciemnych i jasnych rejestrowanych na kliszy 
fotograficznej. 

W ten sposób na podstawie fotografii obrazu in¬ 
terferencyjnego określa się, w jakim stopniu wiązki 
interferujące są spójne. Chociaż poruszone tutaj pro¬ 
blemy spójności są przedstawione pod wieloma wzglę¬ 
dami w bardzo uproszczony sposób, pozwalają jednak 
uświadomić sobie, że spójność wiązek świetlnych nie 
jest tylko opisowym pojęciem, lecz wiąże się ściśle 
z wielkościami mierzalnymi w eksperymencie. 

Aby powstał dobry obraz interferencyjny muszą 
być spełnione warunki dotyczące obszaru i czasu 
spójności. Warunki te otrzymujemy z rozważań teo¬ 
retycznych i bezpośrednio z pomiaru. Wyjaśnimy . 
teraz, jak wiążą się one z mechanizmem świecenia światło 
atomów źródła. Zacznijmy od źródeł termicznych, terr o2ne 
które ogólnie mówiąc, można scharakteryzować tak, 
że atomy lub cząsteczki pobudzane są do świecenia 
w sposób przypadkowy i od siebie zupełnie niezależny. 

Dotyczy to zarówno świecenia ciał pod wpływem pod¬ 
wyższonej temperatury, jak i wskutek działania pola 
elektrycznego. Są oczywiście istotne różnice w mecha¬ 
nizmie świecenia atomów gazów i atomów ciał sta¬ 
łych, ale w jednym i w drugim wypadku emisja 
spontaniczna (-> Lasery — podstawy działania) od¬ 
grywa najważniejszą i prawie jedyną rolę. Czas trwa¬ 
nia impulsów wysyłanych przez pojedyncze atomy ciąg 
świecącego gazu wynosi około t' 1O” 0 s. Kształt falowy 
takiego impulsu, który będziemy nazywać ciągiem 
falowym, ilustruje schematycznie rys. 4. Ciąg falowy 
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Rys. 4. Ciąg falowy o skończonym czasie trwania t 


nie jest ściśle monochromatyczny. Można go złożyć 
z wielu drgań sinusoidalnych, których częstości leżą 
w pewnym przedziale częstości Av nazywanym szero¬ 
kością spektralną. Można udowodnić, że pomiędzy 
t' i Av zachodzi związek Jv « 1/t'. Ze związku tego 
wynika oczywiście, że idealnie monochromatyczna 


















fala, dla której Av — O miałaby czas trwania t' nie¬ 
skończenie długi. Dla światła ze źródeł termicznych 
można osiągnąć r' £: 10~ 8 s, stąd Av z 10 8 s” 1 , a po¬ 
nieważ w zakresie optycznym v x lO^s*" 1 , więc 
Avjv X 10“ 7 . Jak się przekonamy dalej, stosunek ten 
może być znacznie mniejszy dla światła laserowego. 
Wiedząc, że światło źródła termicznego powstaje w 
wyniku wysyłania ciągów falowych przez pojedyncze 
atomy, można zrozumieć warunki obserwacji obra¬ 
zów interferencyjnych. W doświadczeniach Younga 
faza drgań pola elektrycznego, powstałego w wyniku 
nałożenia się pól ciągów falowych wysyłanych przez 
olbrzymią liczbę atomów źródła, jest przypadkowa. 
Oznacza to, że zmienia się ona nieregularnie i chao¬ 
tycznie. Warunki doświadczenia są jednak tak dobra¬ 
ne, że zawsze na szczelinach S i i S 2 pola są takie same 
i ich fazy drgań sobie równe. W rezultacie na ekranie 
miejsca pełnego wygaszania i wzmocnienia są stałe 
w czasie, jeśli tylko, jak już dyskutowaliśmy rozpa¬ 
trując punkty S' i S" na rys. 2, rozmiary źródła są 
odpowiednio małe. W doświadczeniu Michelsona 
każdy ciąg falowy dzieli się na zwierciadle półprze- 
puszczalnym. Powstałe nowe dwa ciągi będą ze sobą 
interferować, jeśli różnica dróg optycznych w ramio¬ 
nach interferometru nie będzie większa niż er. Za¬ 
chodzi to dla wszystkich wysyłanych ciągów falowych 
i miejsca wygaszenia i wzmocnienia są stałe w czasie. 
Gdy powyższy warunek nie jest spełniony, interferen¬ 
cja pomiędzy ciągami z obydwu ramion interferome¬ 
tru ma charakter zupełnie przypadkowy i nie ma sta¬ 
łych miejsc wygaszenia i wzmocnienia. Z naszych roz¬ 
ważań wynika również, że wielkość czasu koherencji 
jest rzędu czasu trwania ciągu falowego r £ t', 
a stąd zachodzi r ^ 1 JAv. Mamy więc taką sytuację, 
że im mniejsza szerokość spektralna Av, tym większy 
czas spójności r. Oznacza to oczywiście, że fala ściśle 
monochromatyczna, dla której Av = 0, miałaby czas 
spójności nieskończenie długi. Możemy więc teraz 
wyciągnąć ważny wniosek, że światło idealnie mono¬ 
chromatyczne jest całkowicie spójne. Znając mecha¬ 
nizm świecenia atomów w źródle termicznym, nie 
możemy oczekiwać, że uda się nam wytwarzać do¬ 
wolnie długo trwające ciągi falowe, gdyż czas świece¬ 
nia atomów ma zaWsZe pewną skończoną wartość. 
Ponadto dla tego rodzaju źródeł brak jest nam ja¬ 
kiejkolwiek kontroli aktów świecenia atomów, tak że 
faza drgań pola świetlnego zmienia się zupełnie przy¬ 
padkowo. Zupełnie inna sytuacja jest w przypadku 
fal radiowych, których źródła kontrolujemy w taki 
sposób, że wytwarzają one drgania o dokładnie okre¬ 
ślonych przebiegach czasowych. Zbudowanie lasera, 
w którym atomy promieniują nie tylko w aktach emi¬ 
sji spontanicznej, jak dzieje się to w źródle termicz¬ 
nym, lecz głównie w aktach emisji wymuszonej, dało 
światło źródło światła o dużej spójności czasowej i przestrzen- 
laserowe nej. Dla światła laserowego jest możliwe przeprowa¬ 
dzenie eksperymentu Younga w sposób bezpośredni, 
przysuwając obydwie szczeliny do lasera, jak ilustruje 
to rys. 5, ponieważ powierzchnia spójności jest znacz- 


monochromatyczne niż światło ze źródeł termicznych. 
Stosunek szerokości spektralnej do częstości linii lase¬ 
rowej może osiągać Av/v z, 10“ u . W otrzymywaniu 
tych wyjątkowych właściwości światła laserowego 
istotną rolę odgrywa rezonator optyczny, wewnątrz 
którego znajdują się atomy promieniujące. 


Spójność wyższego rzędu 


Na przykładzie doświadczenia Younga i interfero¬ 
metru Michelsona zilustrowaliśmy istotne różnice w 
spójności światła termicznego i laserowego. Różnice 
te, polegające na tym, że czas i obszar spójności są 
różne dla obydwu rodzajów źródeł, dotyczą spójności 
pierwszego rzędu, a więc takich zjawisk, których opis 
wymaga uśrednienia kwadratów natężenia pola elek¬ 
trycznego lub wyrażenia <£ , 1 £‘ 2 >, które występuje 
we wzorze (1). W tym miejscu nasuwają się dwa py¬ 
tania : po pierwsze, czy istnieją inne różnice między 
światłem termicznym i laserowym, po drugie, w jakich 
doświadczeniach moglibyśmy te różnice wykryć? 
Pierwsze doświadczenia nie związane bezpośrednio ze 
zjawiskiem interferencji, w których można by stwier¬ 
dzić różnice inne od tych, które omawialiśmy, prze¬ 
prowadzono jeszcze przed zbudowaniem lasera. Za¬ 
nim je krótko omówimy, przypomnijmy zasadę po¬ 
miarów średnic kątowych gwiazd, które po raz pierw¬ 
szy przeprowadzał Michelson już w końcu ubiegłego 


Rys. 6. Schemat in¬ 
terferometru Michel¬ 
sona do pomiaru śre¬ 
dnic kątowych gwiazd. 
Zwierciadła Z x i Z 4 
można przesuwać 



stulecia. Ideę zasadniczą ilustruje rys. 6, na którym 
zaznaczono, w jaki sposób światło gwiazdy pada na 
układ zwierciadeł i następnie interferuje. Rozsuwając 
zwierciadła i Z 2 można stwierdzić, że dla pewnej 
odległości między nimi obraz interferencyjny znika. 
Odległość ta określa wymiary obszaru spójności świa¬ 
tła gwiazdy. Na podstawie znajomości średniej dłu¬ 
gości fali światła padającego i wymiarów obszaru ko¬ 
herencji ścisła teoria pozwala określić kąt, pod jakim 
widać odległe źródło, a więc określić kątową średnicę 
gwiazdy. W 1956 r. Hanbury-Brown i Twiss zmody¬ 
fikowali powyższe doświadczenie interferencyjne, tak 
jak pokazuje to schematycznie rys. 7. Światło gwiazdy 
pada na dwa fotodetektory umieszczone w ogniskach 
zwierciadeł parabolicznych. Posługując się odpowied- 



Rys. 5. Doświadcze¬ 
nie Younga wykazuje 
duży obszar spójności 
światła laserowego 


nie większa niż dla źródeł konwencjonalnych. Jest to 
konsekwencją tego, że fala świetlna wychodząca z la¬ 
sera ma bardzo mały kąt rozbieżności i w pewnych 
warunkach może mieć tę samą fazę drgań na całym 
przekroju wiązki. Podobnie w interferometrze Michel¬ 
sona, gdy źródłem światła jest odpowiedni laser, róż¬ 
nica dróg optycznych w obydwu ramionach może się¬ 
gać nawet kilku kilometrów, a otrzymywany obraz 
interferencyjny jest dobry. Ten ostatni fakt oznacza 
oczywiście, że światło lasera jest znacznie bardziej 



Rys. 7. Światło gwiazdy pada na zwierciadła paraboliczne Z x 
i Z 2 , w których ogniskach znajdują się fotodetektory F x i F z . 
Prądy fotoelektryczne są wzmacniane w układach W x i W z . 
Korelator K mierzy uśrednioną wartość iloczynu I X I 2 
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nim układem elektronicznym, bada się korelacje sta¬ 
tystyczne natężeń fotoprądów, tzn. wielkość <fif 2 >* 
w zależności od odległości. Ponieważ natężenia prą¬ 
dów *! oraz i 2 są odpowiednio proporcjonalne do na¬ 
tężeń światła padającego l[ = E\ oraz I 2 = E\, w isto¬ 
cie w doświadczeniu można wyznaczyć <% lży. 
Przyjęto mówić, że eksperyment Hanbury-Browna 
i Twissa dotyczy koherencji drugiego rzędu. Wynika 
to stąd, że dla spójności pierwszego rzędu w doświad¬ 
czeniach Younga i Michelsona badaliśmy wyrażenia 
typu <£*>, <£^>, a teraz badamy wyrażenia 
typu (ElE\y. Na podstawie zależności </£l£> od 
odległości między fotodetektorami Hanbury-Brown 
i Twiss zmierzyli średnicę gwiazd o małych wymiarach 
kątowych rzędu 0,006" (i dostatecznie dużej jasności), 
co nie byłoby możliwe przy wykorzystaniu tradycyj¬ 
nego interferometru Michelsona. W ten sposób po¬ 
wstały badania zwane interferometrią natężeniową. 

Lata późniejsze przyniosły liczne modyfikacje po¬ 
wyższego eksperymentu, którego celem było udziele¬ 
nie odpowiedzi czy korelacje wyższych rzędów, a więc 
średnie wartości wyrażeń na przykład typu (EZEŻ), 
są różne dla światła termicznego i laserowego. Aby 
obliczyć wartość średnią, <7^/*> = <£?£?>, trzeba 
znać odpowiednie rozkłady prawdopodobieństwa. 
W niektórych przypadkach ten sam wynik otrzymuje 
się dokonując uśrednienia po czasie, gdy znane są 
zależności E 1 i E 2 od czasu. Wyniki badań teoretycz¬ 
nych i doświadczalnych wykazują, że wiązki światła 
laserowego i termicznego spójne w sensie koherencji 
pierwszego rzędu (tzn. dla każdej z nich możemy 
obserwować ostre obrazy interferencyjne) charaktery¬ 
zują się różnymi wartościami wyrażeń typu <£?£!>. 
Oznacza to, między innymi, że rozkłady prawdopo¬ 
dobieństwa są różne dla światła termicznego i lasero¬ 
wego. Tak więc istota różnic między światłem ter¬ 
micznym i laserowym leży nie tyle w różnych warto¬ 
ściach czasu i obszaru koherencji, lecz w ich właści¬ 
wościach statystycznych. Spośród wszystkich ekspe¬ 
rymentów potwierdzających te różnice zbadanie sta¬ 
tystyki fotonów optycznych należy do najbardziej 
oryginalnych i interesujących. Omówimy teraz zasad¬ 
niczą ideę tego rodzaju doświadczeń. 


Statystyczne własności światła 

Załóżmy, że na fotokatodę pada światło prawie mo¬ 
nochromatyczne o szerokości spektralnej Av y tak jak 
schematycznie pokazuje to rys. 8. Z praw zjawiska 


Rys. 8. Światło pada 
na katodę. Odpo¬ 
wiedni układ elektro¬ 
niczny zlicza wybite 
elektrony 


fotoelektrycznego wiemy, że fotoprąd (liczba elektro¬ 
nów wybijanych z katody w ciągu jednostki czasu) 
jest proporcjonalny do natężenia światła padającego, 
a więc do liczby fotonów, które w ciągu jednostki 
czasu padają na katodę. Cały proces ma charakter 
probabilistyczny, bowiem zjawiskiem wybicia elek¬ 
tronu z atomu rządzą prawa mechaniki kwantowej, 
które pozwalają obliczać jedynie prawdopodobień¬ 
stwo wybicia elektronu. Ponadto światło padające 
może mieć różne właściwości statystyczne, to znaczy 
fluktuacje (statystyczne odchylenia od wartości śred¬ 
niej) natężenia światła mogą podlegać różnym roz¬ 
kładom prawdopodobieństwa, co może w różny spo¬ 
sób wpływać na statystykę wybijanych elektronów. 
Oznacza to, że natężenie prądu płynącego w obwodzie 
z fotodetektorem zmienia się w sposób przypadkowy, 
istotnie jednak zależy od zmian natężenia światła. 

Rozwój elektroniki przyniósł odpowiednio szybkie 
i czułe fotomnożniki oraz specjalne układy, które po- 
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zwalają zliczać fotoelektrony w ciągu dostatecznie 
krótkiego czasu T. Jeśli w odpowiednio dużej liczbie 
prób N y powiedzmy kilkunastu tysiącach, stwierdzi¬ 
my, że zarejestrowano l x razy n x fotoelektronów, to 
prawdopodobieństwo tego wydarzenia/?(/*!, T ) = IJN. 

Przez p(n u T) oznaczyliśmy tutaj prawdopodobień¬ 
stwo zarejestrowania n x fotoelektronów w czasie T. 

Podobnie prawdopodobieństwo zarejestrowania n 2 
fotoelektronów p{n 2 ,T) = !JN, gdzie l 2 oznacza ile 
razy spośród N pomiarów zliczono n 2 fotoelektronów. 

W ten sposób można wyznaczyć funkcję p(n , T) dla 
różnych n. W ścisłej teorii dowodzi się, że jeśli czas T 
jest mniejszy niż czas spójności r l/zfv, to liczba 
zarejestrowanych fotoelektronów n jest proporcjonal¬ 
na do liczby padających fotonów. Tak więc istnieje 
możliwość bezpośredniego zliczania fotonów i bada- zliczanie 
nia ich statystyki. Przeprowadzanie eksperymentów fotonów 
przy T < t jest niemożliwe dla światła termicznego, 
dla którego t « 10 " 8 s; nie jest to jednak trudne dla 
światła z lasera gazowego pracującego w sposób ciągły, 
dla którego na przykład można osiągnąć czas spójności 
t & 10“ 2 s. . 

Można jednak otrzymać światło termiczne o dosta¬ 
tecznie długim czasie koherencji metodą „psucia spój¬ 
ności” światła laserowego. Również światło z lasera, 
który świeci przed progiem wzbudzenia właściwej 
akcji laserowej, ma właściwości światła termicznego 
o dostatecznie długim czasie spójności. 

Eksperymenty, w których zlicza się fotony, prze¬ 
prowadzane w latach sześćdziesiątych w wielu ośrod¬ 
kach badań optycznych, należą do najważniejszych 
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światło lasera I . . w 

czas t 

Rys. 9. Rozkłady gęstości fotonów w świetJc termicznym i la¬ 
serowym, zliczone w czasie krótszym niżr, są różne 


osiągnięć optyki kwantowej. Wykazały one, że p{n y T ) 
dla T < r jest różne dla światła termicznego i lase¬ 
rowego. Pomiary ściśle potwierdziły wyniki teorii, 
z której wynika, iż p(n y T) dane jest dla światła ter- statystyki 
micznego wzorem zwanym w fizyce statystycznej fotonów 
wzorem Bosego-Einsteina, a p(n, T) dla światła z la- światła 
sera gazowego jednomodowego określa wzór Pois- termicznego 
sona. Nie podajemy tutaj tych wzorów, ale różnicę j laserowego 
między nimi w uproszczony sposób ilustruje rys. 9. 

Różne statystyki fotonów zilustrowane są przykła¬ 
dem losowego rozrzucenia punktów na osi czasu. 

W świetle laserowym fotony są rozłożone całkowicie 
przypadkowo i w sensie statystycznym równomiernie. 

Dla światła termicznego rozkład nie jest równomierny, 
bowiem w sensie statystycznym pojawiają się miejsca 
zgęszczeń i rozrzedzeń. Pełna teoria opisuje również 
przypadki pośrednie, w których mamy do czynienia 
z nałożeniem się światła termicznego i laserowego. 

Ten fakt został również potwierdzony wynikami po¬ 
miarów. 

Omówione tutaj doświadczenia doczekały się wielu 
bardzo różnych modyfikacji. Badano na przykład 
problem, jakie jest prawdopodobieństwo warunkowe 
zarejestrowania fotonu, jeśli wcześniej o czas At rów¬ 
nież zarejestrowano foton. Zależność tego prawdo¬ 
podobieństwa od czasu At pozwala wykazać istnienie 
różnych właściwości światła termicznego i laserowego. 

Eksperymenty, w których zlicza się fotony są też 
sprawdzeniem teorii działania lasera gazowego, 
a w szczególności progu akcji laserowej, przy którym 
właśnie następuje zmiana właściwości statystycznych 
światła. 

Do aktualnych problemów badawczych należy wy¬ 
jaśnienie, dlaczego zjawiska optyczne nieliniowe, np. 
wytwarzanie drugiej harmonicznej, przejścia wielofo- 













tonowe (-* Optyka nieliniowa) zależą od właściwości 
statystycznych światła, dla którego zjawiska te obser¬ 
wujemy. Doświadczenia wykazały, że przebieg zja¬ 
wisk nieliniowych może być różny dla światła lase¬ 
rowego i światła termicznego. Trzeba tutaj przypo¬ 
mnieć, że obserwacja zjawiska nieliniowego wymaga 
dużego natężenia światła padającego i z tego powodu 
jest nim prawie zawsze światło lasera. 

Można jednak zmienić statystyczne cechy światła 
laserowego na cechy światła termicznego poprzez 
„psucie spójności’* wskutek rozpraszania na szorst¬ 
kich poruszających się powierzchniach lub poprzez 
wzbudzenie lasera do świecenia w warunkach pracy 
z nałożeniem się dużej liczby niezsynchronizowanych 
modów (-> Ultrakrótkie impulsy światła). Tak otrzy¬ 
mana wiązka świetlna ma dostatecznie duże natęże¬ 
nie do wywołania zjawisk nieliniowych, a jednocześnie 
światło J est podobna pod względem właściwości statystycz- 
kwazś- d° światła termicznego. Czasami nazywa się ta- 
termiczfie kie światło kwazitermicznym. Okazuje się, że przy 
obserwacji zjawisk nieliniowych skuteczność światła 
termicznego jest większa niż światła laserowego, np. 
wiązka światła laserowego wytwarza drugą harmo¬ 
niczną słabiej niż wiązka światła termicznego o takim 
samym natężeniu. W bardzo uproszczony i jakościo¬ 
wy sposób można tłumaczyć to faktem, że fluktuacje 
gęstości fotonów, a więc i fluktuacje gęstości mocy 
(mierzonej w W/cm 2 ), są większe dla światła termicz¬ 
nego, jak to schematycznie ilustruje rys. 9. Ponieważ 
zjawiska nieliniowe silnie zależą od gęstości mocy, 
światło termiczne o większych zgęszczeniach okazuje 
się bardziej skuteczne. 

Na zakończenie zwróćmy uwagę na ważny fakt, że 
badania zliczeń fotonów optycznych dotyczą statys¬ 
tycznych właściwości światła z uwzględnieniem jego 


natury kwantowej. Doświadczenia, w których liczono natura 
fotony wykazały bowiem, iż dwie prawie zupełnie kwantowa 
monochromatyczne wiązki światła, np. światła łase- światła 
rowego i termicznego, identyczne pod względem moż¬ 
liwości tworzenia ostrych obrazów interferencyjnych, 
wciąż istotnie różnią się między sobą „strukturą fo¬ 
tonową”. We współczesnym opisie wyraża się to 
stwierdzeniem, że stany kwantowe pola tych wiązek 
są różne. Wytwarzanie światła o różnych właściwo¬ 
ściach statystycznych lub, mówiąc dokładniej, o róż¬ 
nych cechach kwantowych zależy oczywiście od tego, 
jak zbudowane jest źródło, a ściślej—jaki jest me¬ 
chanizm świecenia jego atomów. 

W pierwszej części tego artykułu przy omawianiu 
zagadnień spójności posługiwaliśmy się jedynie falo¬ 
wymi cechami światła, które z bardzo dobrym przy¬ 
bliżeniem można opisać w ramach klasycznej teorii 
fal elektromagnetycznych bez wprowadzania pojęcia 
fotonu. Kwantowy opis zjawisk, w którym spójność — 
lub ogólniej właściwości statystyczne — gra istotną 
rolę, wymaga odpowiedniego aparatu matematyczne¬ 
go, jakim posługuje się elektrodynamika kwantowa. 

Nie poruszono tutaj zupełnie kwestii matematycznego 
formalizmu kwantowej teorii koherencji. Scharakte¬ 
ryzowano jedynie te najważniejsze wyniki ekspery¬ 
mentalne, które wzbogaciły naszą wiedzę o falowo- 
-korpuskularnej naturze światła, a w szczególności 
istotnie rozszerzyły tradycyjne pojęcie spójności wią¬ 
zek świetlnych stosowane przy opisie zjawisk inter¬ 
ferencyjnych oraz stały się podstawą wielu kierunków 
badań współczesnej optyki. 

H. Klejman Lasery , Warszawa 1974; J. L. Klimontowicz 
Lasery i optyka nieliniowa , Warszawa 1969; A. Kujawskt, 

J. Mostowski Promieniowanie elektromagnetyczne , Warszawa 
1977; A. Piekara Nowe oblicze optyki , Warszawa 1976; Światło 
(zbiór artykułów). Warszawa 1973. 
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Tadeusz Ska liński 


W 1960 r., po wieloletnich próbach, w kilku labora¬ 
toriach świata uruchomiono źródła promieniowania 
optycznego zupełnie nowego typu — lasery. Promie¬ 
niowanie wysyłane przez te źródła charakteryzuje da¬ 
leko posunięta monochromatyczność, kierunkowość 
rozchodzenia się, spójność i znaczna gęstość mocy 



RyS. 1. Porównanie charakterystyki promieniowania: a) żarówka 
o temperaturze włókna 2500 K, b) spektralna lampa rtęciowa, 
c) laser He-Ne małej mocy działający na długości fali X — 632,8 nm. 
W przypadkach (a) i (b) wiązka jest wysyłana w pełnym kącie 
bryłowym, w (c) rozbieżność wiązki wynosi ułamek minuty 
kątowej 


w porównaniu z promieniowaniem otrzymywanym ze 
źródeł klasycznych (rys. 1 i tabela str. 357). 

Spójność promieniowania z lasera (-> Spójność własności 
światła) jest tak wielka, że przy jego użyciu można światła 
wykonać doświadczenie Younga, otrzymując bez flaserowego 
wstępnej szczeliny piękny obraz interferencyjny. Do¬ 
świadczenie z interferometrem MichęIsona wskazuje 
na czasy spójności rzędu 1 ps (długość spójności, czyli 
różnica dróg optycznych interferujących wiązek wy¬ 
nosi kilkaset metrów). W laserach gazowych specjal¬ 
nej konstrukcji jest możliwe uzyskanie szerokości linii 
widmowej około 2 Hz; odpowiada to spójności przy 
różnicy dróg optycznych 150 000 kmf Czynnikami 
ograniczającymi spójność promieniowania są: nie¬ 
jednorodność ośrodka, w którym się rozchodzi 
promieniowanie, i drgania mechaniczne, na które 
narażone są poszczególne elementy układu lasero¬ 
wego. 

Perspektywa praktycznych i badawczych zasto¬ 
sowań laserów sprawiła, że prace w tej dziedzinie 
podjęły setki laboratoriów, a minione lata przy¬ 
niosły olbrzymi postęp zarówno w konstruowaniu 
tych urządzeń, jak i w zrozumieniu podstawowych 
procesów związanych z ich działaniem i wykorzysta¬ 
niem. Prowadzone są prace nad objęciem przez pro¬ 
mieniowanie z laserów coraz szerszych obszarów wid 
mowych (aż do obszaru rentgenowskiego włącznie), 
nad uzyskaniem coraz większych gęstości mocy pro¬ 
mieniowania, coraz krótszych impulsów itp. Należy 
tu jednak podkreślić, że wiele z tych wymienionych 
właściwości ma charakter przeciwstawny (np. bardzo 
silnemu zwężeniu spektralnemu linii widmowej towa¬ 
rzyszy silny spadek mocy promieniowania, krańco¬ 
wym zaś skróceniom czasu impulsu — duże rozsze¬ 
rzenie obszaru widmowego). 
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Najprostszy układ kwantowy — mikroukład (atom 
lub cząsteczka), w którym mogą zachodzić procesy 
absorpcji i emisji .promieniowania, ma dwa dyskretne 
stany energetyczne: stan podstawowy 1 o energii W x 
i stan wzbudzony 2 o energii W 2 , przy tym W 2 > W x . 
Przyjmujemy, że przejścia promieniste między tymi 
stanami są dozwolone przez reguły wyboru, a czę¬ 
stość promieniowania z nimi związana wynosi v 0 — 
= A Wjh = (W 2 — WJIh (-+ Spektroskopia atomowa). 
Takie uproszczenie można przyjąć z dobrym przybli¬ 
żeniem dla każdego układu kw-antowego o większej 
liczbie poziomów, jeśli oddziaływanie wybranych 
dwóch poziomów z wszystkimi pozostałymi jest tak 
niewielkie, że można je pominąć. W ośrodku złożo¬ 
nym z bardzo wielkiej liczby N (w 1 cm 3 ) identycznych 
mikroukładów rozkład obsadzeń w warunkach rów¬ 
nowagi termodynamicznej między stan 1 (A^) i 2 (A/ 2 ) 
jest opisany zależnością NJN 1 = q~ aWI t (prawo 
Boltzmanna); k — 1,38-10~ 23 J/K oraz N x > N 2 . 
Zgodnie z tym prawem w parze sodu w temperaturze 
400 K rozkład obsadzeń między stan podstawowy 
atomów (35) i rezonansowy (3 P) o energii 2,09 eV 
jest określony stosunkiem NJN X » 10~ 27 , w tempera¬ 
turze zaś 2100 K stosunek ten jest równy 10y 5 . 
Widać że w stanie równowagi termodynamicznej w nie¬ 
zbyt wysokiej temperaturze obsadzenie wzbudzonych 
stanów atomowych jest znikome. 

W 1917 r. Einstein, analizując wyrażenie na roz¬ 
kład natężeń w widmie ciała doskonale czarnego, do¬ 
szedł do wniosku, że aby uzyskać zgodność opisu teo¬ 
retycznego z doświadczeniem, należy oprócz absorpcji 
i emisji samorzutnej promieniowania wprowadzić po¬ 
jęcie emisji wymuszonej — procesu symetrycznego 
w stosunku do absorpcji i zależnego-od natężenia pro¬ 
mieniowania znajdującego się w obszarze, w którym 
się znajduje atom wzbudzony; częstość promieniowa¬ 
nia wymuszającego musi być równa możliwej częstości 
przejścia atomu. Bilans obsadzeń stanów w przypadku 
równowagi można zapisać następująco: 

B 12 N X «Wv.v 0 = B 21 N 2 u(v) v _ Vo +A 21 N 2 . 

B lt = B 21 są to współczynniki Einsteina absorpcji 
i emisji wymuszonej, A 21 jest współczynnkiem emisji 
samorzutnej, h(v) v _v 0 jest gęstością promieniowania 
o częstości v 0 . Lewa strona równości przedstawia 
więc (odniesioną do 1 cm 3 ) liczbę procesów absorpcji 
kwantów o energii hv 0 , prawa — liczbę procesów emisji 
wymuszonej i samorzutnej łącznie (rys. 2). 

Z analizy przeprowadzonej przez Einsteina wynika, 
że promieniowanie wymuszone winno być zgodne 
w fazie i kierunku rozchodzenia się z promieniowa¬ 
niem wymuszającym (powinno być z nim spójne). 
Tej własności nie ma promieniowanie samorzutne 
o izotropowym rozkładzie przestrzennym i chaotycz¬ 
nie rozłożonych fazach drgania. W zwykłych warun¬ 
kach — wobec N 2 i bardzo niewielkich gęstości 
mocy promieniowania u(y) w wąskim przedziale czę¬ 
stości obejmującym v 0 — udział emisji wymuszonej 
jest znikomy i może być pominięty. 

Gdy promieniowanie (monochromatyczne i two¬ 
rzące równoległą wiązkę) przechodzi przez ośrodek 
pochłaniający, jego natężenie maleje w miarę przeni¬ 
kania promieniowania w głąb ośrodka. Tę zmianę na¬ 
tężenia opisuje prawo Lamberta I = IqQ~ xx \ Io jest 
natężeniem początkowym, I —natężeniem po ppe- 
byciu warstwy grubości x, x jest współczynnikiem 
absorpcji promieniowania w ośrodku (w ogólności 
* = «(v) — zależy on od częstości fali). W zwykłych 
warunkach « ~ N x . Gdy jednak uwzględnimy istnie¬ 
nie emisji wymuszonej (a emisję samorzutną pominie¬ 
my, bo przy jej izotropowym rozkładzie jej udział 
w określonym kierunku jest znikomy), to wówczas 

.(^^(l-w. 


Jeśli więc będziemy powiększali obsadzenie stanu 
o większej energii, udział emisji wymuszonej będzie 
wzrastał, a x(y) będzie malało. Gdyby się nam udało 
uzyskać tak znaczne obsadzenie stanu 2, by N 2 jN 1 > 1 
wówczas x(y) stałoby się mniejsze od zera i zamiast 
osłabienia wiązki nastąpiłoby jej wzmocnienie. Wiąz¬ 
ka miałaby przy tym właściwości, jakie Einstein prze¬ 
widział dla promieniowania wymuszonego. Oczywiś- stan 
cie nie ma tu sprzeczności z zasadą zachowania ener- odwrócenia 
gii, bo uzyskanie stanu odwrócenia obsadzeń (tak obsadzeń 
nazywamy stan, w którym obsadzenie poziomu 
o wyższej energii jest większe od obsadzenia poziomu 
o niższej energii) wymaga dostarczenia energii na 
przepompowanie atomów z 1 do 2. Łatwo zauważyć 
(w równaniu bilansu w stanie równowagi B l2 = B 1X 
i A 2 i > 0), że pompowanie w układzie dwupoziomo¬ 
wym nie może doprowadzić do odwrócenia obsadzeń. 

Jest to możliwe w układach bardziej złożonych, któ¬ 
rych rozważenie zaproponowali Ch. H. Townes 
i A. L. Schawlow w 1958 r. 

Zatem warunki, jakie winny być spełnione, by uzy¬ 
skać możliwość wytwarzania promieniowania spój¬ 
nego w ośrodku czynnym, są następujące: wytworzenie 
w ośrodku czynnym stanu odwrócenia obsadzeń (wy¬ 
starczającego na to, by wzmocnienie wiązki przewyż¬ 
szyło możliwe straty jej natężenia) oraz wstępne na¬ 
świetlenie ośrodka czynnego promieniowaniem wy¬ 
muszającym o gęstości mocy dostatecznej na to, by 
efektywnie spowodować emisję wymuszoną w okre¬ 
ślonym, celowo wybranym kierunku. Pierwszy wa¬ 
runek realizuje się przez pompowanie ośrodka czyn¬ 
nego, drugi — przez zastosowanie komory rezonanso¬ 
wej (rezonatora). 

Metoda, którą się uzyskuje stan odwrócenia obsa¬ 
dzeń, nawiązuje do technik stosowanych i sprawdzo¬ 
nych w mikrofalowych generatorach kwantowych — 
maserach (-> Spektroskopia mikrofalowego rezonan¬ 
su rotacyjnego). Niezbędne jest w tym celu użycie 
układu mającego co najmniej 3 dyskretne poziomy 
energetyczne (rys. 3), co jest typowe dla znacznej licz¬ 
by substancji fluoryzujących (są to albo substancje 
zawierające centra utworzone przez domieszki jonów 
metali w osnowach krystalicznych i szkliwach, albo 
roztwory barwników organicznych). Błysk lampy wy¬ 
ładowczej przenosi przeważającą część centrów pompowanie 
czynnych ze stanu 1 do 3 (absorpcja promieniowania), optyczne 
z którego oprócz powrotu promienistego do stanu 1 
możliwe jest bardzo szybkie — w porównaniu z przej¬ 
ściem 3 1 — przejście bezpromieniste do stanu 2, 

do którego zostaje przeniesiona przeważająca część 
atomów wzbudzonych (energia uwolniona w przejś¬ 
ciach bezpromienistych zamienia się w energię ciepl- 



Rys. 2. Przejścia w układzie 
dwupoziomowym 




Rys. 3. Przejścia w układzie 
trójpoziomowym 



Rys. 4. Przejścia w układzie 

czteropoziomowym Rys. 5. Schemat lasera 
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ną). Ze stanu 2 następuje przejście 2 l (fiuore- 
scencja) z niewielką szybkością, zależną od natury 
centrów, np. w różowym rubinie (domieszka 0,05% 
Cr 3 * w osnowie kryształu Ai 2 0 3 ), który jest typowym 
materiałem laserowym, czas życia poziomu 2 wynosi 
3 ms. W ten sposób, przy dostatecznej mocy błysku, 
możliwe jest uzyskanie odwrócenia obsadzeń między 
stanami 2 i 1. Tego typu układy działają w sposób 
impulsowy. Efektywność działania można zwiększyć 
przez zastosowanie substancji o układzie 4 poziomów 
(np. jony uranu lub samaru w osnowie kryształu 
fluorytu), gdyż w takim wypadku fluorescencja jest 
wywołana przejściem między stanami 3 i 2, a z dol¬ 
nego stanu 2 następuje szybkie bezpromieniste przejś¬ 
cie do stanu podstawowego (rys. 4). W takim układzie 
można uzyskać stacjonarne odwrócenie stanów o i 2. 

Ośrodek czynny lasera w postaci walca umieszcza 
się w rezonatorze, którego zasadniczą częścią jest 
układ dwóch zwierciadeł (płaskich lub sferycznych). 
Zwierciadła zmuszają promieniowanie zapoczątko¬ 
wane w pompowanym ośrodku czynnym do roz¬ 
chodzenia się w nim wzdłuż osi walca wielokrotnie 
tam i z powrotem. Promieniowanie to wymusza 
przejścia promieniste wzbudzonych centrów i w ten 
sposób się wzmacnia (rys. 5). Jedno ze zwierciadeł 
maksymalnie odbija padaiące na nie promieniowanie 
(współczynnik odbicia Rx 100%), drugie — ma 
zdolność odbijającą nieco mniejszą (R ~ 95%) 
i niewielką transmisję (T « 5%), co pozwala na 
wyprowadzenie części promieniowania na zewnątrz. 
W rzeczywistości przy każdym odbiciu zachodzą 
pewne straty i wzmocnienie przez napompowany 
ośrodek czynny winno być wystarczająco duże, by 
pokryło zarówno straty przy odbiciu, jak i odpływ 
energii promieniowania na zewnątrz rezonatora. 

Aby działanie wymuszające promieniowanie było 
jak największe, rezonator winien być dostrojony 
do wzmacnianej długości fali (oprócz wyjustowania 
zwierciadeł ściśle prostopadle do osi rezonatora). 
Dostrojenie do rezonansu jest wtedy, gdy w obszarze 
między zwierciadłami rezonatora zawiera się całko¬ 
wita liczba połówek długości fali światła: 2L/A = n. 
Długość rezonatora £ jest rzędu kilkudziesięciu cm, 
a X jest ułamkiem jim, a więc liczba całkowita n jest 
ogromna (ok. 10 s ) i w szerokości linii fluorescencji 
(wynoszącej np. w rubinie ok. 0,2 nm, tj. ok. 100 
GHz, a w laserze gazowym He-Ne ok. 0,0015 nm, 
tj. 0,8 GHz) znajdzie się przy określonym £ kilka, 
a czasem kilkanaście możliwych długości fali spe*- 
niających warunek rezonansu (rys. 6), można też dla 
nich wzbudzić kilka lub kilkanaście rodzajów drgań, 
czyli modów (łac. modus 'rodzaj, sposób’; -> Ultra¬ 
krótkie impulsy światła). Najsilniej wzbudzają się 
drgania w pobliżu maksimum rozkładu linii absorp¬ 
cyjnej (najsilniejsze wzmocnienie). Ten obraz drgań 
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Rys. 6. a) Linia emisyjna Ne (A = 632,8 nm), szerokość dopple- 
rowska linii 800 MHz, szerokość naturalna linii 10 MHz; b) roz¬ 
kład częstości rezonansowych komory (przyjęto L — 1 m); sze¬ 
rokości instrumentalne rezonansów (ok. 3 MHz) zależne są od 
współczynników odbicia zwierciadeł komory i dokładności wy¬ 
kończenia ich powierzchni; c) oscylacje wzbudzają się tam, gdzie 
przypada obszar maksimum fluorescencji, i mogą zachodzić na 
kilku częstościach rezonansowych 
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w rezonatorze jest bardzo uproszczony z powodu 
uwzględnienia tylko osiowych modów drgania. Po¬ 
nieważ w rzeczywistości drgania zachodzą w trójwy¬ 
miarowym rezonatorze o symetrii cylindrycznej, 
obraz jest o wiele bardziej złożony. 

Przejście od fluorescencji do wymuszonej generacji 
promieniowania przejawia się w skokowej zmianie 
rozbieżności wiązki wysłanej z ośrodka czynnego: od 
rozkładu izotropowego (równomiernego we wszy¬ 
stkich kierunkach) do postaci niemal doskonale 
równoległego promienia. Przejściu temu towarzyszy 
bardzo silne zwężenie linii widmowej (rys. 6c). 

Przy pompowaniu metodą impulsową oscylacje 
ośrodka czynnego rozpoczynają się z chwilą, gdy 
zostaje przekroczony próg generacji (wzmocnienie 
większe niż straty), a trwają one tak długo, jak długo 
pompowanie utrzymuje niezbędne do tego odwróce¬ 
nia obsadzeń. Natomiast w układzie o pompowaniu 
ciągłym ustala się stan równowagi, w którym wzmoc¬ 
nienie uzyskane w ośrodku pompowanym kompensuje 
straty (w które wliczamy energię wyprowadzonej na 
zewnątrz wiązki promieniowania). 


Działanie wybranych typów 
Saserów 

Mimo że od uruchomienia pierwszych laserów nie 
upłynęło jeszcze 20 lat, technika laserowa poczyniła 
w tym czasie olbrzymie postępy. Skonstruowano 
dziesiątki typów różnych laserów, uzyskano efekt 
laserowy w setkach różnych ośrodków czynnych (ga¬ 
zowych, ciekłych i stałych), a liczba zidentyfikowa¬ 
nych przejść laserowych wynosi zapewne kilkanaście 
tysięcy. W dalszym ciągu artykułu omówimy najbar¬ 
dziej powszechne typy laserów, a mianowicie lasery 
krystaliczne — rubinowy i neodymowy, laser gazowy 
He-Ne i lasery barwnikowe, wspomnimy także o lase¬ 
rach chemicznych. Lasery półprzewodnikowe omó¬ 
wione są w artykule „Optoelektronika półprzewod¬ 
nikowa”, natomiast otrzymywanie impulsów gigan¬ 
tycznych oraz bardzo krótkich opisane jest w artykule 
„Ultrakrótkie impulsy światła”. 


Laser rubinowy i neodymowy 

Ośrodek czynny lasera krystalicznego ma postać 
cylindrycznego pręta o średnicy ok. 1 cm i długości 
do kilkunastu cm ustawionego między zwierciadłami. 

W laserze rubinowym (rys. 7) osnową jest kryształ 
szafiru (A1 2 0 3 ) domieszkowany jonami Cr 3+ , w neo¬ 
dymowym — szkło lub kryształy CaF 2 , CaW0 4 , 
YAG (granat itrowo-glinowy) i inne domieszkowane 
jonami Nd 3 -. Monokryształy stanowiące osnowę 
muszą wykazywać wielką doskonałość struktury. 
Pręty wycina się tak, że oś walca tworzy z osią optycz¬ 
ną kryształu określony kąt, zadany warunkami do¬ 
świadczenia. Ścianki czołowe pręta są oszlifowane 
z dokładnością co najmniej 2/20, a nierzadko pokryte 


elektrody 



Rys. 7. Schemat lasera rubinowego; strzałki oznaczają obieg gazu 
chłodzącego 
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są warstwą odbijającą tworzącą rezonator (w pew¬ 
nych typach doświadczeń konieczne jest jednak uży¬ 
wanie zwierciadeł zewnętrznych). 

Pompowanie ośrodka czynnego prowadzi się za 
pomocą wyładowczych lamp błyskowych wypełnio¬ 
nych ksenonem. Błysk uzyskuje się rozładowując 
przez lampę baterię kondensatorów o pojemności od 
kilkuset do kilku tysięcy jxF przy napięciu kilku kV. 
W celu jak najlepszego wykorzystania strumienia 
świetlnego lampie nadaje się kształt linii śrubowej 
owijającej pręt i dodatkowo otacza się ją osłoną po¬ 
krytą chromem odbijającym promieniowanie. W in¬ 
nych układach stosuje się oświetlacze skupiające na 
pręcie promieniowanie wysyłane przez podłużną 
lampę wyładowczą. Mimo tych zabiegów zaledwie 
drobna część energii elektrycznej dostarczonej do 
lampy zostaje efektywnie przemieniona w energię 
wypromieniowaną przez laser (mniej niż 0,1%); 
przeważająca część energii zamienia się w ciepło, co 
narzuca konieczność silnego chłodzenia układu. 

Układ poziomów energetycznych jonu Cr 3+ w ru¬ 
binie odpowiada schematowi z rys. 3. Korzystną sy¬ 
tuację stwarza okoliczność, że absorpcja promienio¬ 
wania pompującego zachodzi w stosunkowo szero¬ 
kim obszarze widmowym (poziom 3 należy zastąpić 
szerokim ciągłym pasmem). Mimo to, obszar widmo¬ 
wy absorpcji pokrywa zaledwie drobną część widma 
wysyłanego przez lampę. Po przekroczeniu progu ge¬ 
neracji zostaje wypromieniowany w błysku krótszym 
niż 1 ms impuls laserowy odpowiadający fluorescencji 

rubinu (A — 694,3 nm). Przebieg czasowy wzbudzo¬ 
nej akcji laserowej jest na ogół bardzo złożony, składa 
się z szeregu kolejnych rozbłysków odpowiadających 
różnym modom drgań rezonatora (w miarę dopom- 
powywania ośrodka czynnego przez lampę). 

Pompowanie lasera neodymowego zachodzi w wa¬ 
runkach dogodniejszych — wg schematu na rys. 4. 
Wobec tego, że różnica energii między poziomami 2 i 1 
równa 2000 cm -1 (tj. 4 10“*J) w temperaturze poko¬ 
jowej (300 K) jest rzędu kT , uzyskanie odwrócenia 
obsadzeń między poziomami 3 i 2 jest znacznie łat¬ 
wiejsze niż w rubinie, a ochłodzenie ośrodka czynne¬ 
go do temperatury ciekłego azotu (77 K) pozwala na 
uzyskanie pracy ciągłej tego lasera na długości fali 
1,05 jim przy niezbyt wysokiej mocy (ok. 1 mW) 
Laser Nd 3 + w YAG pozwala na uzyskanie w impulsie 
olbrzymich mocy. W podobny sposób jak laser neo¬ 
dymowy działają lasery, w których w różnych osno¬ 
wach krystalicznych centrami są jony metali ziem 
rzadkich i uranu. 


Lasery gazowe 

Odwrócenie obsadzeń poziomów jako przygotowanie 
do akcji laserowej w gazach może być uzyskane przez 
wyładowanie elektryczne. Ogromne znaczenie mają 
wówczas atomy w stanach metatrwałych (-> Spek¬ 
troskopia atomowa), ich energia może być przekazana 
w zderzeniach atomom lub cząsteczkom właści¬ 
wego ośrodka laserującego. Tak jest właśnie w lase¬ 
rze He-Ne, w którym ciałem roboczym jest miesza¬ 
nina helu i neonu o ciśnieniu cząstkowym helu ok. 
130 Pa i neonu ok. 13 Pa. 

Wyładowanie elektryczne prowadzone w tej mie¬ 
szaninie wzbudza atomy helu i neonu do różnych sta¬ 
nów. Najważniejsze jednak dla uzyskania akcji lase¬ 
rowych jest wzbudzenie atomów helu do stanów 
metatrwałych 2 1 S 0 (o energii 20,61 eV) oraz 2 3 5 x 
(o energii 19,82 eV). Energia pierwszego z wymienio¬ 
nych stanów niemal dokładnie odpowiada energii 
wzbudzenia stanu 3s 2 neonu, drugiego — energii 
stanu 2s 2 (rys. 8). Wobec tego wzbudzenie może być 
bardzo efektywne w zderzeniach przebiegających 
według symbolicznych równań: 

He (2 l S 0 )+Ne (1 1 S 0 ) - He(l 1 5 0 )+Ne(3j 2 ) 

He(2 3 5' 1 )H-Ne(l 1 5 0 ) -> He(l 1 Ą)+Ne(2^). 
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Ten rodzaj pompowania prowadzi do bardzo skutecz¬ 
nego wytworzenia nadwyżki obsadzenia stanu 3 s 2 nad 
3p 4 i 2p* oraz stanu 2.y 2 nad 2/? 4 i do możliwości uzys¬ 
kania między nimi akcji laserowej. 


He 


Ne 


eV 

20.6 

19,8 



Rys. 8. Schemat wzbudzenia w laserze He-Ne (stosuje się skró¬ 
towe oznaczenia poziomów neonu) 



Budowę lasera He-Ne przedstawia schematycznie 
rys. 9. Rura laserowa (szklana lub kwarcowa) zam¬ 
knięta jest doskonale płasko-równoległymi okienkami 
nachylonymi do osi rury pod kątem Brewstera (w celu 
minimalizacji strat przy odbiciu); jej typowe wymia¬ 
ry: długość — kilkanaście cm do kilku m, średnica 
wewnętrzna — kilka do kilkunastu mm. Do rury wlu- 
towane są elektrody, do których przykłada się napię¬ 
cie powodujące wyładowanie. Rezonator tworzą 
zewnętrzne zwierciadła (płaskie lub sferyczne w usta¬ 
wieniu współogniskowym), z których jedno ma pew¬ 
ną, niewielką przepuszczalność, co umożliwia wypro¬ 
wadzenie wiązki laserowej na zewnątrz. 

Zastosowanie zwierciadeł dielektrycznych o dużej 
zdolności odbijającej w wąskim paśmie widmowym 
umożliwia wybór jednej z licznych możliwych akcji 
laserowych. Inna metoda selekcji polega na zamknię¬ 
ciu rury pryzmatem i takim ustawieniu zwierciadła 
rezonatora, by wracało do rury tylko promieniowanie 
o wybranej długości fali. W tych warunkach łatwo 
można otrzymać jedną z trzech bardzo silnych akcji 
laserowych o długościach fali /. x = 3,39 jim, A 2 = 

= 1,15 pm i = 0,6328 jim. Liczba zidentyfikowa¬ 
nych przejść w laserze He-Ne przekracza już 70. 

Obejmują one obszar od 0,63 jim do pośredniej pod¬ 
czerwieni. 

W czasie trwania akcji laserowej wyładowanie stale laser 
podtrzymuje różnicę obsadzeń, otrzymuje się zatem o pracy 
akcję laserową o działaniu ciągłym. Moc laserów tego ciągłej 
typu wynosi, zależnie od konstrukcji i wymiarów, 
od kilkunastu do stu mW. 

Laser He-Ne pracuje na ogół w układzie, w którym 



























jest wzbudzonych jednocześnie wiele modów. Często 
jednak w pracach badawczych, zwłaszcza wówczas, 
gdy istotne jest uzyskanie wysokiego stopnia spójno¬ 
ści promieniowania, należy doprowadzić laser do 
pracy jednomodowej. Można to uzyskać m.in. przez 
odpowiednie skrócenie lasera. Rysunek 6 obrazuje 
rozkład modów w laserze metrowym. Odległość między 
modami wynosi 150 MHz. Można obliczyć, że przy 
skróceniu lasera do 10 cm odległość sąsiadujących 
modów wzrośnie do 1,5 GHz i w praktyce można 
oczekiwać wówczas wzbudzenia tylko jednego modu. 
Równocześnie jednak skrócenie ośrodka czynnego 
wywołuje znaczne zmniejszenie wzmocnienia i moc 
lasera maleje (poniżej 100 jiW). 

Jaser Oprócz laserów gazowych, w których ciałem robo- 
jonowy czym jest gaz szlachetny (lub mieszanina gazów szla¬ 
chetnych), zbudowano wiele typów laserów jonowych. 
Lasery na jonach gazu szlachetnego (wśród nich jest 
szczególnie ważny ze względu na zastosowanie laser 
na jonach argonu Ar + ) pokrywają swym promienio¬ 
waniem obszar widmowy od nadfioletu do bliskiej 
podczerwieni. W każdym gazie szlachetnym (prze¬ 
ważnie przy jednokrotnej jonizacji) zidentyfikowano 
po kilkadziesiąt przejść laserowych. Warto wymienić 
również lasery na jonach metali ziem alkalicznych 
(Mg + , Ca + , Ba + , Sr+), na jonach grupy kadmu (Cd + , 
Hg + i Zn + ), ważne wreszcie znaczenie mają lasery 
gazowe, w których ciałem roboczym są jony chlorow¬ 
ców (Ft, Clt, Brt, Jt). 

Na zakończenie przeglądu laserów gazowych 
wspomnimy jeszcze o dwóch, ważnych ze względu 
lasery na zastosowanie, laserach molekularnych: azotowym 
molekularne i na C0 2 . Pierwszy, wzbudzany wyładowaniem elek¬ 
trycznym, pracuje w bliskim nadfiolecie i w obszarze 
promieniowania widzialnego (przejścia zachodzą 
między wzbudzonym stanem ełektronowo-oscylacyjno- 
rotacyjnym i jednym ze stanów oscylacyjno-rotacyj- 
nych stanu elektronowo nie wzbudzonego); drugi — 
pracuje zarówno w sposób ciągły, jak i impulsowy, 
a emituje promieniowanie w pośredniej (9,6-10,6 pm) 
podczerwieni (przejścia zachodzą między wzbudzony¬ 
mi stanami oscylacyjno-rotacyjnymi elektronowo nie 
wzbudzonymi). Dzięki dużemu zagęszczeniu pozio¬ 
mów molekularnych sprawność pompowania jest 
większa w laserach molekularnych niż w atomowych 
i jonowych, a dodatek azotu (N 2 ) do dwutlenku węgla 
powiększa efektywność pompowania lasera na C0 2 
przez przekazywanie energii wzbudzenia oscylacyjne¬ 
go od cząsteczek N 2 do C0 2 w trakcie ich zderzeń. 

Laser azotowy służy do pompowania laserów barw¬ 
nikowych, a laser C0 2 jest źródłem promieniowania 
podczerwonego wielkiej mocy (w pracy impulsowej 
moc szczytowa wynosi do 50 kW w impulsach trwa¬ 
jących ok. 150 rrs przy częstości powtórzeń 400 Hz, 
a w pracy ciągłej — 500 W). 


Lasery barwnikowe 

Opisane dotąd lasery obejmują wprawdzie szeroki 
obszar widmowy, jednakże możliwości ich przestraja- 
nia w sposób ciągły są bardzo ograniczone. Tymcza¬ 
sem takie przestrajanie jest warunkiem licznych za¬ 
stosowań laserów w spektroskopii. Właściwość tę 
można uzyskać w laserach barwnikowych, tj. takich, 
w których ośrodek czynny stanowi roztwór silnie 
fluoryzującego barwnika (np. fluoresceiny, rodaminy, 
zob. il. 12 i 13, tabl. 4). 

Typowy układ poziomów barwnika w roztworze 
przedstawia rys. 10. Ciągłe pasma energetyczne 
S 0 i Si powstały z układów poziomów oscylacyjno- 
rotacyjnych barwnika w wyniku oddziaływań z czą¬ 
steczkami rozpuszczalnika. W zwykłych warunkach 
obsadzone są najniższe poziomy pasma S Qi a pasmo 
S t (fluorescencyjne) jest próżne. Po wzbudzeniu (za¬ 
leżnie od energii kwantu pochłoniętego) do jednego 
z wyższych poziomów pasma wzbudzonego Ą na¬ 
stępuje najpierw szybkie (w czasie 10~ 12 s) bezpromie- 


niste przejście do dna pasma S l9 a następnie, po 
czasie rzędu 10~ 9 s, emisja kwantu fluorescencji i przej¬ 
ście do jednego z poziomów oscylacyjno-rotacyjnych 


Rys. 10. Układ poziomów barw¬ 
nika w roztworze; S 0 i Si pasmo 
podstawowe i fluorescencyjne, 
T 0 metatrwały poziom trypleto- 
wy 




Rys. 11. Symetria zwierciadlana widm absorpcji i fluorescencji 
cząsteczek barwnika 


So. Z niego następuje szybki powrót na dno pasma 
S 0 . W ten sposób widmo absorpcji (przy wzbudzeniu 
źródłem o widmie ciągłym) wykazuje zwierciadlaną 
symetrię w stosunku do widma fluorescencji (rys. 

11). Widać również, że przy silnym wzbudzeniu 
cząsteczek barwnika można uzyskać znaczne odwró¬ 
cenie obsadzenia dna pasma względem górnego 
obszaru pasma S 0 . 

Uzyskanie akcji laserowej w takim układzie wyma¬ 
ga nie tylko umieszczenia kuwety z roztworem barw- warunki 
nika w rezonatorze i intensywnego pompowania op- a fc c jj 
tycznego, lecz również wyposażenia rezonatora w ele- laserowej 
ment rozszczepiający, który umożliwia wybranie od¬ 
powiednio wąskiego pasma widma do zainicjowania 
i podtrzymania akcji laserowej na określonej długości 
fali. Stosuje się tu różne układy (rys. 12), od pryzmatu 
począwszy, a na kombinacji siatki dyfrakcyjnej 
schodkowej z interferometrem Fabry’ego-Pćrota 
skończywszy. Ten ostatni układ pozwala na otrzyma¬ 
nie wiązki promieniowania o szerokości widmowej 
kilku MHz. Przestrajanie następuje albo przez powol- 


wiązka wyjściowa światła 



Rys. 12. Układ optyczny lasera barwnikowego strojonego siatką 
dyfrakcyjną i interferometrem Fabry’ego-Pćrota 
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przestrajanie ną zmianę drogi optycznej w interferometrze (prze- 
lasera strajanie precyzyjne), albo przez niewielkie zmiany 
nachylenia siatki (przestrajanie zgrubne). Obszar 
przestrajania wynosi kilkadziesiąt nanometrów, a uży¬ 
cie zestawu kilku barwników pozwala na otrzymanie 
szerokiego obszaru widmowego. Z rys. 11 widać 
również, że warunki uzyskania promieniowania la¬ 
serowego w obszarze nakrywania się widm absorpcji 
i fluorescencji są niekorzystne, absorpcja powiększa 
bowiem straty w układzie. 

Lasery barwnikowe pompuje się bądź lampą błysko¬ 
wą (podobnie jak laser rubinowy), bądź też odpowied¬ 
nio dostrojonym laserem argonowym lub azotowym. 


Lasery chemiczne 

Uzyskanie efektu laserowego jest możliwe w ukła¬ 
dach molekularnych, w których reakcje chemiczne 
prowadzą bezpośrednio do powstania znacznej liczby 



do pompy 

(usuwanie produktów reakcji) 


Rys. 13. Schemat lasera chemicznego 


swobodnych wzbudzonych atomów lub cząsteczek. 

Tego typu mechanizm wzbudzenia daje duże szanse 
uzyskania stanu odwrócenia obsadzeń między po¬ 
ziomami atomowymi lub molekularnymi. 

Do chwili obecnej jedną z najlepiej zbadanych kom¬ 
binacji składników lasera chemicznego jest fluor 
z wodorem lub z deuterem. Schemat tego typu lasera reakcje w 
o działaniu ciągłym pokazany jest na rys. 13. W łase- laserze 
rze takim zachodzą reakcje (Q — energia): chemicznym 

F 2 H-Q = 2F (dysocjacja cząsteczki Iduoru), 

F+D 2 = DF*-rD (reakcja z deuterem dająca wzbu¬ 
dzoną cząsteczkę DF*), 

DF*+/ 2 ^-> DF+(/*-ł-l)Av (emisja wymuszona czą¬ 
steczki DF*). 

Często do fluoru i deuteru dodaje się jeszcze C0 2 (jako 
składnik, który przejmuje wzbudzenie od fluoru) 
oraz gazy szlachetne. Wówczas (doświadczenie pro¬ 
wadzono przy stosunku ciśnień cząstkowych Pd 2 : 

PF 2 :Fco 2 :FHe = 1:1:4:5 i ciśnieniu całkowitym p — 

= około 1000 hPa) wzbudzenie przekazane zostaje 
w zderzeniach cząsteczkom C0 2 , które w akcji lasero¬ 
wej wysyłają promieniowanie o długości fali ok. 10 pm. 

Lasery chemiczne nasuwają jak dotąd wiele trud¬ 
nych do rozwiązania problemów technologicznych. 

Podczas reakcji w obszarze reaktora wydziela się 
bardzo wiele ciepła, które należy szybko odprowa¬ 
dzić, a poza tym dynamika takiego układu bardzo 
się komplikuje. Innymi zagadnieniami czekającymi na 
rozwiązanie są: proste i skuteczne przeprowadzenie 
dysocjacji składników reakcji na atomy; uzyskiwanie 
wzbudzenia molekularnego do określonych grup 
poziomów oscylacyjno-rotacyjnych cząsteczki (naj¬ 
lepsze by było wprowadzenie układu laserującego 
w wysokoenergetyczne stany oscylacyjne); objęcie 
akcją laserową obszaru widzialnego widma. Próby 
prowadzi się w dwóch kierunkach: jednym jest użycie 
jako cząsteczek laserujących wzbudzonych tlenków 
metali z mieszaniny Me 2 +0 2 , drugim — poszuki¬ 
wanie przejść ze zmianą liczby kwantowej stanu 
oscylacyjnego większą niż o jeden; jak dotąd próby 
te nie dały pozytywnego wyniku. 

Bibliografia -♦ Lasery — zastosowanie. 


Lasery- zastosowanie 

Jacek Chrostowski 


Po okresie pionierskim lasery pod koniec lat sześć¬ 
dziesiątych weszły w etap dojrzałych technologicznie 
konstrukcji i stały się niezastąpionymi narzędziami 
w pracach badawczych oraz w technice. W stosunku 
jednak do ogromnych możliwości pod tym względem 
lasery są wprowadzane do techniki opornie. Poza 
badaniami naukowymi, w których się stały normal¬ 
nym narzędziem pracy, główne zastosowanie znalazły 
one w obróbce termicznej materiałów, w pomiarze 
odległości oraz wytyczaniu kierunków. Wykorzystanie 
bardziej subtelnych cech promieniowania laserowego 
(jak w telekomunikacji laserowej) nie wyszło poza 
dziedzinę wojskowości lub kosmonautyki. (Tabela: 
Porównanie podstawowych typów laserów.) 

W artykule tym omówimy tylko ważniejsze lub 
ciekawsze zastosowania laserów, nie omówione w in¬ 
nym miejscu. Zastosowanie laserów w holografii, 
która się rozwinęła w samodzielną dziedzinę, oraz 
laserów półprzewodnikowych omówione jest w artyku¬ 
łach „Holografia” i „Optoelektronika półprzewod¬ 
nikowa”. Duże znaczenie, m.in. ze względu na prace 
nad uzyskaniem kontrolowanej reakcji termojądrowej, 
ma wytwarzanie impulsów gigantycznych, omówione 
w artykule „Ultrakrótkie impulsy światła”. Nato¬ 
miast ogólna zasada działania laserów' i podstawowe 
ich typy przedstawione są w artykule „Lasery — 
podstawy działania”. 
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Telekomunikacja optyczna 

Współczesne systemy łączności wykorzystują fale 
elektromagnetyczne z zakresu częstości radiowych 
i mikrofalowych. Przez modulację jednego z para¬ 
metrów fali nośnej można przekazywać wiele nieza¬ 
leżnych sygnałów; im większa jest częstość fali nośnej, 
tym więcej niezależnych sygnałów, zwanych kanałami, 
można przekazać (tabela) w jednym łączu. (Łą- kanał 
czem nazywa się zestaw urządzeń rozmieszczonych informacji 
w przestrzeni od miejsca, w którym informacja została 
wprowadzona i zakodowana w fali nośnej, do miejsca, 
gdzie została ona przekazana odbiorcy.) 

Idea zastosowania promieniowania optycznego do 
przenoszenia informacji nie jest nowa, sięga zamierz¬ 
chłych czasów (najprostszym urządzeniem wykorzys¬ 
tującym światło do przenoszenia informacji jest 
lustro, odbijające promieniowanie słoneczne; taki 
słoneczny „zajączek” to tylko jeden kanał informacji). 

Można przypuszczać, że sprzężenie elektroniki 
z optyką spowoduje przeobrażenia telekomunikacji 
w niedalekiej przyszłości w większym stopniu, niż 
kiedyś zastosowanie techniki mikrofalowej (—► Opty¬ 
ka fourierowska). 

Podstawowe elementy łącza optycznego przedsta¬ 
wiono na rys. 1. Poniżej omówimy poszczególne jego 
elementy. 


















Porównanie podstawowych typów laserów 


Typ lasera 

Długość 
fali, nm 

Rodzaj pracy, 
długość impulsu 

Energia 

J 

Moc 

W 

Gęstość 
strumienia 
w ognisku 
W/cm 2 

v Zastosowanie 

Laser rubinowy 

694,3 

impulsowa 
(30-3-10 1 ns) 

1-10- 

10 3 -10 9 

I0*-10 13 

technologiczne, spawanie, 
topienie, wiercenie, dentys- 
tyka, biologia 

Laser neodymowy 

1 060 

ciągła lub impulsowa 
(15 ns) 

lO-^-lO* 

io-io 3 

10 7 -10 15 

telekomunikacja i laserowe 
układy śledzące, kontrolo¬ 
wane reakcje jądrowe 

Laser półprzewod¬ 
nikowy GaAs 

800-900 

ciągła lub impulsowa 
(10- ns) 

10-M0- 3 

10~ 3 -10 


telekomunikacja 

Laser barwnikowy 

przestraja- 
ny w za¬ 
kresie 
200-800 

ciągła lub impulsowa 
(2 — 2-10 3 ns), pompo¬ 
wany laserem argono¬ 
wym lub azotowym 

zależna 
od lasera 
pompują¬ 
cego 

i (ciągła), 
zależna 
od lasera 
pompują¬ 
cego 


spektroskopia, rozdzielanie 
izotopów, biologia 

Laser gazowy He-Ne 

632,8 

ciągła 

— 

10 

10M0* 

metrologia, interferometria, 
holografia, geodezja 

Laser argonowy 
jonowy 

488-514,5 

ciągła lub impulsowa 
(10 3 ns) 


I-IO 3 W 

10M0" 

chirurgia, spektroskopia 

Laser azotowy 

337,1 

impulsowa (10 ns) 

0,01 

10* W 

10 11 

spektroskopia, reakcje 
fotochemiczne 

Laser CO s 

10 600 

ciągła lub impulsowa 
(10 Ł — 5 -10* ns) 

1-10 3 

10-10* 

10«-10 ,s 

laserowe układy śledzące, 
chirurgia, dentystyka, ob¬ 
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Rys. 1. Schemat blokowy łącza optycznego 


laser jako Idealne źródło światła do celów telekomunikacyj- 
źródło nych powinno mieć dużą moc wyjściową, dużą spraw- 
światla ność przetwarzania energii, długą żywotność, wysoką 
stabilność częstości, dużą spójność przestrzenną 
i czasową, łatwość modulacji i wzbudzenia oraz małe 
wymiary. Różne typy laserów w różny sposób reali¬ 
zują te cechy idealnego źródła. Lasery półprzewod¬ 
nikowe mają małe moce i niską spójność, za to są 
wielkości łebka od szpilki, a przy tym łatwo modulo¬ 
wać je sygnałami o częstościach aż do 10 10 Hz (np. 
przez modulację stałego prądu zasilania). Lasery 


gazowe mają dużą spójność emitowanego światła, 
wysoką stabilność częstości (względna zmiana czę¬ 
stości Avjv jest rzędu 10~ 8 ) i możliwa jest modulacja 
światła wewnątrz lasera, ale wymagają delikatnej 
obsługi, są mało sprawne w przetwarzaniu energii 
elektrycznej na światło i stosunkowo szybko się psują 
(laser He-Ne ma czas życia rzędu 10 000 h, a laser 
argonowy — 1000 h). Moce wyjściowe laserów argo¬ 
nowych są rzędu dziesiątków watów, a laserów C0 2 — 
kilowatów (przy pracy ciągłej). Lasery stałe (m.in. 
neodymowe) mogą pracować w sposób ciągły ze sto¬ 
sunkowo dużą mocą wyjściową, lecz mają niską spój¬ 
ność emitowanego światła i nie mogą być modulowane 
wewnętrznie. Ich czas życia zależy od trwałości lampy 
pompującej (żywotność lamp nie przekracza obecnie 
1000 godzin). 

Bardzo dobre własności, zbliżone do idealnych, 
zwłaszcza z uwagi na zastosowanie w telekomunikacji 
dalekiego zasięgu i w kosmosie, ma laser neodymowy 
z kryształem YAG pracujący w układzie zsynchronizo¬ 
wanych modów, dający ciąg impulsów pikosekundo- 
wych w odstępach rzędu 1 ns. Lasery argonowe emi¬ 
tujące światło zielone, słabo pochłaniane przez wodę 
morską, mogą być zastosowane w łączności podwod¬ 
nej. Do łączności naziemnej, jak też i kosmicznej, la¬ 
ser gazowy na C0 2 konkuruje z laserem YAG, gdyż 
emitowana przez niego fala długości 10,6 jum jest 
słabo pochłaniana w powietrzu. Natomiast wydaje się, 
że ze względu na małe wymiary i niskie koszty pro¬ 
dukcji — do łączności naziemnej bliskiego zasięgu 
najlepsze będą lasery półprzewodnikowa w układzie 
ze światłowodami. 

Wektor natężenia pola elektrycznego promienio- modulacja 
wania wychodzącego z lasera można przedstawić w fali ciągłej 
postaci: 

E — eE 0 sin (2nv t-*-y) y 

gdzie E 0 jest amplitudą fali, v — częstością, (p — fazą, 

e — wektorem polaryzacji, t — czasem. Zmieniając 
w takt przekazywanego sygnału amplitudę £o, czę¬ 
stość lub fazę, otrzymuje się odpowiednio zmodulo¬ 
waną falę elektromagnetyczną. Promieniowanie la¬ 
serowa umożliwia jeszcze inny sposób modulacji — modulacja 
modulację polaryzacji. Polega ona na tym, że w takt polaryzacji 
sygnału modulującego zmienia się kierunek wektora 

e przy nie zmienionych innych parametrach. Do mo¬ 
dulacji wykorzystuje się zmianę parametrów ośrod¬ 
ka, przez który przechodzi światło (np. zmianę współ¬ 
czynnika pochłaniania ośrodka, grubości środką czy 
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współczynnika załamania), wywołaną zmianą ze¬ 
wnętrznego pola elektrycznego lub magnetycznego. 
Najczęściej wykorzystuje się zjawiska elektrooptycz- 
ne (rys. 2). W niektórych kryształach (np. w krysztale 
KH 2 P0 4 , zw. KDP) pod wpływem pola elektrycznego 
pojawia się wymuszona dwójłomność (zjawisko Ker- 
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zmodulowane 
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ćwierćfalowa / 


Rys. 2. Schemat elektrooptycznego modulatora światła 


ra): w krysztale rozchodzą się dwie fale świetlne 
o różnych prędkościach i o polaryzacji liniowej wza¬ 
jemnie prostopadłej. Różnica faz obu fal po opuszcze¬ 
niu kryształu zależy od przyłożonego napięcia. Pro¬ 
porcjonalność w pewnym zakresie różnicy faz do na¬ 
tężenia pola elektrycznego pozwala zrealizować mo¬ 
dulację polaryzacji lub amplitudy wiązki światła. Gdy 
różnica faz między obiema falami (przy ich równym 
natężeniu) F = tc/2, fala na wyjściu modulatora jest 
kołow-o spolaryzowana, gdy F = występuje pola¬ 
ryzacja liniowa. Ustawienie za modulatorem pola- 
roidu (analizatora) powoduje zamianę modulacji 
polaryzacyjnej w amplitudową, polaroid przepuszcza 
bowiem światło zgodnie ze wzorem I = / 0 sin 2 (r/2), 
jeśli płaszczyzny polaryzacji światła padającego i po- 
laroidu są wzajemnie prostopadłe (/ = natężenie fali 
opuszczającej modulator, I 0 — natężenie fali pada¬ 
jącej). Właściwości kryształów elektrooptycznych 
pozwalają na modulację światła laserowego sygnała¬ 
mi, których szerokość pasma wynosi nawet kilka ty¬ 
sięcy MHz. 

Omówiona wyżej metoda polegająca na modulacji 
ciągłej fali laserowej ma kilka wad. Mianowicie, do 
przekazania informacji z reguły nie jest potrzebna 
praca ciągła lasera, a urządzenie impulsowe jest bar¬ 
dziej sprawne energetycznie. Sygnały ciągłe przekazy¬ 
wane na duże odległości ulegają znacznym zniekształ¬ 
ceniom, zmieniającym się w czasie i powodującym 
przekłamania w przekazywaniu informacji. Dochodzi 
do tego jeszcze fakt, że coraz powszechniej informacja 
jest transmitowana w postaci binarnej (dane kompu¬ 
terowe, a nawet rozmowy telefoniczne). Dlatego w 
modulacja systemach telekomunikacji optycznej stosuje się mo- 
impulsowo- dulacje impulsow-o-kodowe. W systemach tych można 
-kodowa rozróżnić dwa etapy: wytwarzanie ciągu impulsów 
(laser pracujący w specjalnych warunkach) i kodo¬ 
wanie (modulację). Wytw-arzanie impulsów w stałych 
odstępach czasu najczęściej realizuje się przez syn¬ 
chronizację modów w laserach YAG czy helowo-neo- 
nowych. W laserach półprzewodnikowych ciąg im¬ 
pulsów można uzyskać przez periodyczną zmianę 
dobroci rezonatora, również przez synchronizację 
modów lub zmiany natężenia prądu zasilania (rys. 3). 
Gdy przez laser przepływa prąd o natężeniu trochę 
mniejszym od wartości progowej, laser nie promie¬ 
niuje spójnie. Jeśli w pewnych chwilach spowodujemy 
wzrost tego prądu do wartości większej niż progowa, 
laser zacznie świecić. Periodyczna zmiana prądu po¬ 
woduje więc powstanie impulsów światła spójnego. 
Częstość powtarzania impulsów zależy od częstości 
prądu modulującego. Zakreskowane pola na rysunku 
odpowiadają impulsom światła wychodzącego z la¬ 
sera. 

Drugi etap — kodowanie informacji — polega na 
modyfikowaniu ciągu impulsów z lasera za pomocą 
zwykłych modulatorów elektrooptycznych. Modulacja 
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impulsowo-kodowa jest z natury binarna, gdyż rola 
detektora polega wyłącznie na określeniu, czy dany 
impuls dotarł, czy nie dotarł do odbiornika. Infor¬ 
macja o amplitudzie nie jest istotna, co ma ogromne 
znaczenie przy nie najlepszych warunkach propagacji 
fali świetlnej na Ziemi. 



czas t 

Rys. 3. Zasada wytwarzania impulsów światła w laserze GaAs 
przez modulację prądu zasilania 


Podobnie jak w modulacji fali ciągłej, w tej meto- modulacje 
dzie modulacji również istnieje kilka sposobów zmia- PCM-IM, 
ny parametrów impulsów świetlnych. Najczęściej pCM-PM 
stosuje się trzy z nich: modulację natężenia, modulację j ppgw 
polaryzacji i modulację położenia impulsu (rys. 4a, 
b, c). Zasadę modulacji impulsowo-kodowej z mo¬ 
dulacją natężenia (tzw. PCM-IM) wyjaśnia rys. 4a. 

Modulator zatrzymuje dany impuls lub go prze¬ 
puszcza i daje w odbiorniku informację 1, co ozna¬ 
cza, że jest impuls, lub 0, świadcząc, że go nie ma. 

Przy modulacji impulsowo-kodowej z modulacją 
polaryzacji (tzw. PCM-PM) modulator przepuszcza 
impuls bez zmiany polaryzacji, albo też zmienia jego 
polaryzację o 180°. Może to być również zmiana na 
polaryzację lewoskrętną (1) i prawoskrętną (0). Mo¬ 
dulacja położenia impulsu (PPM) przesuwa impuls 
względem położenia początkowego. Możliwe jest 
rozwiązanie w postaci analogowej (położenie impulsu 
zmienia się w sposób ciągły) lub rozwiązanie, w któ¬ 
rym odstęp między impulsami podzielony jest na 




Rys. 4. Zasada modulacji: a) impulsowo-kodowej z modulacją 
natężenia (PCM-IM); b) impulsowo-kodowej z modulacją pola¬ 
ryzacji (PCM-PM); c) położenia impulsu (PPM) 






























szereg dyskretnych przedziałów czasu. Jeśli rozwią¬ 
zanie jest takie, jak przedstawiono na tyś. 3, możliwa 
jest prosta modulacja PPM przez modulację czę¬ 
stości sinusoidalnego prądu (co odpowiada przesu¬ 
nięciu impulsów światła na osi czasu względem sie- 
bie). 

Zasadę przesyłania informacji w ciągu impulsów 
przedstawia rys. 5. Dwie niezależne informacje — 
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Rys. 5. Zasada zwielokrotniania informacji przesyłanej w jednym 
łączu optycznym z wykorzystaniem modulacji impulsowo-kodo- 
wej 


słowa 1101 oraz 1011 — przekazywane są razem jako 
jedno słowo 11011011. Sygnał czasowy w odbiorniku 
pozwala określić, czy dany impuls pochodzi z pierw¬ 
szego słowa (rejestracja danego impulsu odpowiada 
ujemnej części sinusoidy na rysunku) czy z drugiego 
(dodatniej części sinusoidy). 

przesyłanie Wydaje się, że największym problemem w obecnej 
sygnałów chwili jest przenoszenie informacji z nadajnika do 
odbiornika. Transmisja w w-olnej przestrzeni na dal¬ 
sze odległości jest praktycznie możliwa tylko w prze¬ 
strzeni kosmicznej (systemy łączności satelitarnej lub 
międzyplanetarnej). Atmosfera ziemska powoduje 
zniekształcenia czoła fali i duże straty mocy; wyno¬ 
szą one — w zależności od warunków atmosferycz¬ 
nych — ok. 3-8 dB/km (2-6,31 razy) przy deszczu, 
3-10 dB/km (2-10 razy) przy mgle i 3-20 dB/km 
(2-100 razy) przy padającym śniegu. Z tego względu 
nie stosuje się swobodnej propagacji fali na odległość 
ponad 20 km; moce laserów konieczne do zapewnienia 
trwałej łączności musiałyby być olbrzymie. Przy 
transmisji na większe odległości stosuje się światło¬ 


wody, które zachowują stałość parametrów przez długi 
czas. 

Światłowody mogą być dwóch rodzajów. Jeden światłowody 
z nich zawiera prowadnicę oraz ustawione w niej 
soczewki. Soczewki szklane lub gazowe ustawia się 
tak, że odległości między nimi są równe podwojonej 
ogniskowej, dzięki czemu wiązka światła jest pro¬ 
wadzona wzdłuż osi światłowodu. Gdy soczewki są 
oddalone od siebie o kilkadziesiąt metrów, straty 
wynoszą ok. 1 dB/km (1,26 razy). Światłowody tego 
typu są jednak drogie (ze względu na precyzję usta¬ 
wienia soczewek) i mimo bardzo dobrych własności 
ich zastosowanie ograniczone jest do małych odle¬ 
głości i do systemów teletransmisji o dużych pojem¬ 
nościach informacyjnych. Znacznie prostsze i tańsze 
w produkcji są światłowody zbudowane z włókien 
szklanych grubości kilku mikrometrów i o małym 
współczynniku załamania. Światło się odbija wielo¬ 
krotnie od ścianek włókien (całkowite wewnętrzne 
odbicie) i rozchodzi ze stosunkowo małymi stratami. 

Splecione z wielu takich cienkich włókien giętkie 
przewody grubości cienkich kabli elektrycznych mają 
straty rzędu kilkunastu dB/km (kilkadziesiąt razy). 

Dla porównania podamy, że w litym szkle straty mocy 
wynoszą 100 dB/km (10 10 razy). 

Jak widać, straty w światłowodach są znaczne wzmacnianie 
i porównywalne ze stratami w wolnej przestrzeni, sygnafoc 
Konieczne jest więc wzmacnianie sygnału na drodze 
do odbiornika. Najczęstszą metodą jest wstawienie 
na drodze zmodulowanej wiązki światła materiału 
laserującego o odwróconych obsadzeniach poziomów 
energetycznych. Foton, który się dostanie w obszar 
wypełniony atomami wzbudzonymi, spowoduje emi¬ 
sję wymuszoną określonej liczby fotonów dokładnie 
takich samych jak padający. W rezultacie sygnał 
opuszczający materiał laserujący zostanie wzmocnio- 


Po dotarciu do odbiornika zmodulowany sygnał 
świetlny przechodzi przez układ soczewek zbierają¬ 
cych oraz przez filtr pasmowy (dla zmniejszenia szu¬ 
mów), dostrojony do częstości fali nośnej, i skupia się 
na detektorze. Rolą detektora jest oddzielenie sygna¬ 
łu informacyjnego od fali nośnej. W paśmie optycz¬ 
nym stosowane są dwa rodzaje detekcji. 

Detekcję niekoherentną (bezpośrednią) stosuje się 
wówczas, gdy stosunek mocy sygnału do mocy szu¬ 
mów jest większy od jedności. Polega ona na prze¬ 
tworzeniu obwiedni natężenia wiązki świetlnej na 
prąd elektryczny w fotopowielaczu (prąd fotoelek- 
tronów jest proporcjonalny do natężenia padającego 
światła) lub w fotodiodzie półprzewodnikowej (prąd 
w kierunku zaporowym jest modulowany padającym 
światłem). Skończony czas przejścia elektronów 
między elektrodami umożliwia detekcję sygnałów 
zmiennych tylko do częstości 10 8 Hz. 

Detekcja koherentna (heterodynowa lub homody- 
nowa) polega na mieszaniu wiązki zmodulowanej 
z inną, niezmodulowaną wiązką spójną; jest stoso¬ 
wana przy sygnałach bardzo słabych, na poziomie 
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niższym od poziomów szumów. W wyniku złożenia 
obu wiązek — zmodulowanej, niosącej sygnał, i nie 
zmodulowanej — odtwarzamy samą obwiednię wiąz¬ 
ki sygnałowej. Dalszy proces rozdzielenia wielu sy¬ 
gnałów niesionych razem odbywa się metodami elek¬ 
tronicznymi. 

Przy modulacji impulsowo-kodowej detektor daje 
tylko informację o dotarciu danego impulsu do od¬ 
biornika, a więc mniejsza jest tu możliwość przekła¬ 
mania informacji w wyniku zakłóceń. Inna jest w ta¬ 
kim wypadku technika rozdzielania informacji z wielu 
kanałów. Rysunek 6 przedstawia schemat układu 
stosowanie rozdzielającego poszczególne kanały przez sortowa- 
impulsów nie impulsów przychodzących w danych odstępach 
czasu od odbiornika. Deflektorem (układem odchy¬ 
lającym wiązkę światła) jest kryształ, w którym pod 
wpływem fali akustycznej lub napięcia elektrycznego 
wiązka światła zmienia kierunek rozchodzenia się. 


Zastosowania technologiczne 

Z punktu w-idzenia zastosowań technologicznych bar¬ 
dzo ważną własnością w-iązki laserowej jest możli¬ 
wość uzyskiwania olbrzymiej ilości energii w sposób 
kontrolowany; ponadto wiązka laserowa może być 
skupiona do rozmiarów poprzecznych porównywal¬ 
nych z długością fali świetlnej, tj. rzędu 1 pm. Obie 
te własności sprawiają, że działanie wiązki laserowej 
ogranicza się do małego obszaru, miejsca dalej poło¬ 
żone nie doznają wpływ'u promieniowania, 
spawanie Spawanie polega na stopieniu brzegów oddziel- 
zgrzewanie nych części materiału (lub różnych materiałów) i po¬ 
łączeniu ich w jedną całość, a następnie — ostudze¬ 
niu. Palnik acetylenowy dostarcza do spawanego 
miejsca 1000 W/cm 2 , laser — co najmniej kilkaset ra¬ 
zy więcej. Pewną trudność przy spawaniu laserem 
sprawia fakt, że stopiony metal ma mniejszy współ¬ 
czynnik odbicia światła, tak że w chwili, gdy się ma¬ 
teriał topi, następuje wprost energii kumulowanej 
w spoinie; aby przy topieniu uniknąć odparowania 
materiału, trzeba w tym momencie zmniejszyć moc 
lasera, co jest zabiegiem dość trudnym. 

Do spawania najlepiej się nadają impulsowe lasery 
neodymow-e i rubinowe. Szczególnie wygodne i celo¬ 
we jest użycie lasera do zgrzewania elementów przy 
produkcji układów scalonych i innych urządzeń o ma¬ 
łych wymiarach (ii. 136, tabl. 34). Odpowiedni dobór 
czasu trwania impulsów i skupienie wiązki na repe¬ 
rowanym fragmencie umożliwiło dostarczenie dużej 
energii na małym obszarze bez zbytniego nagrzania 
szkła. Jest to praktycznie jedyny sposób usuwania 
uszkodzeń w drogich urządzeniach, 
wiercenie Lasery neodymowe i rubinowe dostarczają energii 
otworów tak dużej i dobrze skupionej, że możliwe jest wykony¬ 
wanie otworów w materiałach bardzo twardych (jak 
diament, różne ceramiki, tantal, wolfram, molibden), 
których nie można obrabiać metodami tradycyjnymi. 
Do wiercenia używa się takich samych układów la¬ 
serowych jak do spawania, jedyna różnica polega na 
zwiększeniu mocy lasera. Wiercenie za pomocą lasera 
jest szczególnie efektywne przy wykonywaniu otwo¬ 
rów bardzo małych, trudnych do wykonania inną 
techniką. Można w ten sposób uzyskiwać otwory 
o średnicy rzędu 1 Jim, przy czym stosunek głębo¬ 
kości otworu do jego średnicy w pewnych materia¬ 
łach wynosi 20:1. 

cięcie Duże szybkości cięcia, niewytwarzanie kurzu czy 
laserem opiłków metalu, a jednocześnie względna cisza przy 
cięciu — to podstawowe zalety cięcia laserem. Naj¬ 
lepiej do tego celu nadaje się laser C0 2 (il. 15, 17, 
tabl. 4). Schemat noża laserowego przedstawia rys. 7. 
Przez odpowiedni dobór mocy lasera (kilkaset watów) 
i prędkości przesuwu wiązki względem materiału 
uzyskuje się tylko lokalne odparowanie materiału. 
Cięcie może się odbywać w atmosferze obojętnego 
azotu lub tlenu. Tlen w wyniku egzotermicznej reakcji 
z materiałem przyspiesza obróbkę. W trakcie spawa- 
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nia gaz wydmuchuje stopiony materiał i zostawia 
ostrą krawędź o tak doskonałych właściwościach, 
że nie ma potrzeby wygładzania jej. 


wiązka z lasera C0 2 



zwierciadło 
całkowicie odbijające 
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wlot 
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Rys. 7. Schemat noża laserowego 


Noże laserowe stosowane są głów-nie w przemyśle 
lotniczym i kosmonautycznym, ale używa się ich 
również w innych przemysłach (cięcie materiałów na 
ubrania lub tektury na pudełka). 

Lasery impulsowe sprzężone z układem sterującym 
i pomiarowym stosuje się do kontroli i wzorcowania 
oporników; skupiona wiązka laserów odparowuje lo¬ 
kalne obszary materiału oporowego, zmieniając jego 
opór. Urządzenie takie może wykonać w zautoma¬ 
tyzowany sposób nawet 10 000 kalibracji na godzinę 
przy dokładności dopasowania oporu do nominalnej 
w-artości nawet do 0,01%. 

W przemyśle półprzewodnikowym lasery stosuje 
się do trasowania. W jednej płytce materiału półprze¬ 
wodnikowego wytwarza się naraz bardzo wiele ukła¬ 
dów scalonych, które po wykonaniu należy rozdzielić 
i zamknąć w obudowach. Rozdzielanie metodą tra¬ 
dycyjną przebiega w ten sposób, że się nacina linie 
diamentem i łamie płytkę na małe fragmenty. Laser 
od razu tnie płytkę na części. Trasowanie linii lase¬ 
rem jest bardzo szybkie, typowa prędkość przesuwu 
wynosi 15 cm/s, a przy tym krawędzie poszczegól¬ 
nych układów scalonych są ostrzejsze. 


Żyroskop laserowy 

Żyroskop jest to szybko obracające się ciało sztywne, 
którego oś obrotu może zmieniać sw r oją orientację 
względem obudowy dzięki odpowiedniemu zawie¬ 
szeniu (np. Cardana). Przyłożenie do osi żyroskopu 
momentu sił powoduje jego precesję, której prędkość 
kątowa jest tym mniejsza, im większy jest moment 
pędu żyroskopu J = /o>, gdzie / — moment bezwład¬ 
ności wirującej z prędkością kątowy co masy. Oś 
szybko obracającego się żyroskopu niemal nie zmienia 
swej orientacji pod wpływem krótkotrwałych sił ze¬ 
wnętrznych i dzięki temu może służyć za czujnik 
zmiany kierunku w przestrzeni poruszającego się 
urządzenia, zmiany prędkości kątowych lub postępo¬ 
wych. Żyroskopy używane są do automatycznego 
sterowania ruchem rakiet i samolotów, do stabilizacji 
statków na morzu oraz w nawigacji samolotów, stat¬ 
ków i pojazdów kosmicznych (wskaźniki kursu, 
sztuczny horyzont, określanie stron świata). 

Żyroskop laserowy różni się od tradycyjnych tym, 
że nie ma wirującej masy ani żadnej części ruchomej. 
Zasadę działania żyroskopu laserowego najlepiej się 
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zrozumie po zapoznaniu się z działaniem interfero¬ 
metru pierścieniowego Sagnaca (1913 r.). 
interferometr W interferometrze pierścieniowym biernym światło 
pierścieniom wchodzi w punkcie A i przechodzi przez płytkę dzie¬ 
wy bierny lącą, by następnie w postaci dwóch wiązek obiec ob¬ 
wód zamknięty w przeciwnych kierunkach (dla upro¬ 
szczenia obwód jest przedstawiony w postaci koła, 
rys. 8). Wiązki łączą się ze sobą na płytce dzielącej. 
Kiedy interferometr jest nieruchomy, czas obiegu 
obwodu przez oba promienie jest taki sam i wynosi 
t — 2nR/c, gdzie c jest prędkością światła. Jeżeli in¬ 
terferometr obraca się wokół osi prostopadłej do jego 
powierzchni ze stałą prędkością kątową £?, czas obie¬ 
gu obwodu koła przez oba promienie ulegnie zmianie. 



Rys. 8. Interferometr pierścieniowy Sagnaca 


gdyż po pewnym czasie płytka dzieląca znajdzie się 
w punkcie B i wobec tego promień biegnący zgodnie 
z kierunkiem obrotu przemierzy dłuższą drogę niż ten, 
który biegnie w przeciwną stronę. Prędkość światła 
jest oczywiście stała. Wobec tego 

2kR^zX± — ct±> 

gdzie droga dodatkowa przebyta przez każdy z pro¬ 
mieni wynosi X ± = RQt ± . Czas przejścia obu fal 
przez interferometr wynosi więc 

2nR 

Znak ,,-r" dotyczy fali biegnącej w kierunku obrotu, 
a znak „ — ” — fali biegnącej w kierunku przeciw¬ 
nym. Różnica czasów w pierwszym przybliżeniu wy¬ 
nosi: 


a różnica dróg optycznych : 


AL = c-At 


4 kR 2 Q 
c 


4 AQ 
c 


interferometr 

pierścienio- 


gdzie A = jc R 2 jest powierzchnią zakreśloną przez 
promienie. Wzór na AL można stosować w wypadku 
dowolnej powierzchni oraz ośrodka o współczynniku 
załamania różnym od jedności. Za pomocą interfero¬ 
metru pierścieniowego A. H. Michelson i H. G. Gale 
zmierzyli (1925) szybkość obrotu Ziemi. Interfero¬ 
metr miał kształt prostokąta o wymiarach 610 x 335 m, 
a mierzona różnica dróg optycznych wynosiła 
130 nm, czyli bardzo mało w porównaniu z wymia¬ 
rami interferometru i długością fali. 

Trudność użycia interferometru pierścieniowego 
jako praktycznego urządzenia wynika z jego bardzo 
małej czułości. Użycie lasera jako źródła zewnętrz¬ 
nego nic nie pomaga. Sytuacja ulega natomiast ra¬ 
dykalnej zmianie, gdy się użyje aktywnego interfero¬ 


metru pierścieniowego. Warunek wzbudzenia drgań 
odpowiadających najniższemu modowi poprzecz¬ 
nemu zarówno w laserze liniowym, jak i pierścienio¬ 
wym (rys. 9) jest taki sam: „na długości rezonatora L 
powinna się zmieścić całkowita liczba połówek fali'*. 
W laserze liniowym poszczególne rodzaje drgań (mo¬ 
dy) odpowiadają dwdm przeciwnie biegnącym falom, 
które w sumie dają falę stojącą. Amplitudy i częstości 
fal biegnących muszą być jednakowe. Natomiast 
w laserze pierścieniowym każdy mod poprzeczny od¬ 
powiada falom biegnącym w przeciwnych kierunkach, 
są one niezależne w tym sensie, iż mogą mieć różne 
częstości i amplitudy. 

Warunek wzbudzenia drgań można zapisać na¬ 
stępująco: 


m 

"2 






lub v 


mc 

~2L 


gdzie m oznacza liczbę modów (typowe wartości m 
wynoszą 10M0 6 ). Małe zmiany drogi optycznej L 
powodują różnicę częstości między falami Av, przy 
czym 

- v_ Av _ AL 
v L 


Gdy różnica długości AL wywołana jest’ obrotem, 
wówczas otrzymujemy: 


Ar = 


4 A Q 
LA 


W wypadku lasera w kształcie trójkąta o boku 
13,2 cm, wysyłającego falę długości A = 0,633 pm 
i przy prędkości obrotu 10° na godzinę różnica czę¬ 
stości wynosi 5,9 Hz. Częstość taką przy zastosowa¬ 
niu techniki heterodynowej można dość łatwo zmie¬ 
rzyć. 

Rysunek 10 przedstawia zasadę wyprowadzania wyprowa- 
informacji z lasera pierścieniowego. Niewielki pro- dzanie 
cent (przeważnie mniej niż 0,1 %) energii obu fal jest informacji 
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Rys. 9. Konfiguracja laserów: a) liniowego, b) pierścieniowego 


transmitowany przez jedno ze zwierciadeł dielek¬ 
trycznych na zewnątrz. Dzięki pryzmatowi dopro¬ 
wadza się obie wiązki do interferencji. Prążki inter¬ 
ferencyjne są miarą chwilowej różnicy faz między 
biegnącymi w przeciwnych kierunkach falami. Gdy 
natężenia obu fal są jednakowe, a wiązki wychodzące 
z pryzmatu prawie równoległe (o rozbieżności kąto¬ 
wej e), rozkład prążków dany jest wzorem: 

I = 7 0 [l-f os(2tcjs -X/A+Aoj */-t-<p), 

gdzie Ao> = 2kAv jest częstością różnicową, A — 
długością fali, <p — stałą fazą. Gdy laser się nie obra- Rys. 10. 
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ca, wtedy Aco = O i rozkład prążków jest nieruchomy. 
Podczas obrotowego ruchu lasera prążki przesuwają 
się z prędkością zależną od Aco. Odstęp między prąż¬ 
kami wynosi /Je, gdzie e = 2 nO, n — współczynnik 
załamania światła w pryzmacie, a kąt 0 — to odchy¬ 
lenie kąta łamiącego pryzmatu od 90°. Kiedy np. 
0 = 15" i X = 0,633 jim, odstęp między prążkami 
wynosi ok. 3 mm. Jeśli więc w miejscu pojawiania się 
prążków ustawi się detektor o wymiarach znacznie 
mniejszych od szerokości prążka (np. fotodiodę pół¬ 
przewodnikową), otrzyma się bezpośrednio infor¬ 
mację o częstości różnicowej. 

Kierunek ruchu prążków określa jednocześnie kie¬ 
runek obrotu lasera, tak więc ustawiając drugi detek¬ 
tor w odległości 1/4 prążka od pierwszego i łącząc 
oba detektory z układem logicznym, otrzymamy tak 
dodatnie, jak i ujemne zliczenia impulsów. W ten 
sposób żyroskop laserowy daje scałkowaną informa¬ 
cję cyfrową w postaci: 


gdzie liczba zliczeń N = j Av dr, a kąt odchylenia 

o 

; 

od położenia początkowego y = J Q dr. W poda- 

o 

nym przykładzie liczbowym odnoszącym się do lasera 
He-Ne jedno zliczenie odpowiada obrotowi o 1,7 
sekundy kątowej, tak więc pełny obrót o 360° daje 
0,76 -10 6 zliczeń. 

żyroskop Żyroskop laserowy obejmuje trzy inteferometry 
laserowy pierścieniowe, ustawione w 3 płaszczyznach prosto¬ 
padłych do siebie (il. 137, tabl. 35). Urządzenia takie 
w chwili obecnej rywalizują jeszcze z rozwiązaniami 
tradycyjnymi. Podstawowe niedogodności żyroskopu 
laserowego to: dość duża wielkość (10x 5 cm) w po¬ 
równaniu z wymiarami żyroskopu zwykłego (8x 
X 4 cm), zmiany parametrów w czasie (dryfy—nie 
pozwalające na razie na zastosowanie żyroskopów 
laserowych przy precyzyjnych pomiarach kosmicz¬ 
nych), stosunkowo krótki czas życia rzędu 5000 h 
pracy. 

Główne zalety to: niski koszt produkcji, duża szyb¬ 
kość reakcji, stabilność i wytrzymałość na duże przy¬ 
spieszenia i bardzo szybkie obroty, niezawodność 
(brak części ruchomych) Ze względu na te zalety 
omówiona technika pomiaru obrotów będzie naj¬ 
prawdopodobniej stosowana w nawigacji i w urzą¬ 
dzeniach kontrolnych. 


Zastosowanie w metrologii i geodezji 

Najprostszym zastosowaniem lasera w geodezji jest 
użycie go jako doskonałej linijki. Mała rozbieżność 
wytyczanie wiązki umożliwia wytyczanie kierunku w przestrzeni 
kierunków na bardzo dużej odległości. Wiązka lasera może np. 

służyć za oś toru wodnego w porcie, ułatwiającą pro¬ 
wadzenie statków’ o dużej wyporności w wąskich ka¬ 
nałach; wiązki używanych do tego celu laserów 
He-Ne mają średnicę kilku centymetrów' po prze¬ 
byciu jednego kilometra. Na lądzie promień lasera 
prowadzi koparkę lub maszynę górniczą w kopalni. 


zwierciadła 

półprzepuszczalne 



Zainstalowany w postaci układu fotodiod czujnik, 
na który pada promieniowanie laserowe pozwala zdal¬ 
nie sterować maszyną lub rejestrować odchylenia od 
linii prostej szybko i z dużą dokładnością. 

Przy pomiarze odległości wykorzystuje się trady¬ 
cyjne interferometry wielowiązkowe z laserem jako 
źródłem światła. Najprostsze są interferometry Mi- 
chelsona (rys. 11). Po opuszczfeniu lasera wiązka 
światła pada na zwierciadło półprzepuszczalne M ly 
gdzie ulega podziałowi. Jedna z wiązek, po odbiciu 
od A/i, dochodzi bezpośrednio do punktu P na ekra¬ 
nie, druga odbywa dłuższą drogę do zwierciadła M 2 
i po odbiciu dociera też do punktu P. Zwierciadło 
M 2 jest przymocowane do ruchomego przedmiotu 
albo jest po prostu jego powierzchnią. W płaszczy¬ 
źnie ekranu obserwuje się prążki interferencyjne 
światła o natężeniu 



Jeśli w płaszczyźnie ekranu ustawimy mały detektor — 
fotodiodę, to prąd płynący przez fotodiodę będzie się 
zmieniał wraz ze zmianą odległości b zgodnie z po¬ 
wyższym wzorem. Maksimum natężenia przypadnie 
na punkty określone zależnością 

2\b-a\ = NX, 

gdzie N jest liczbą naturalną. Ze w-zoru tego można 
wyznaczyć wartość b, znając rząd interferencji N. Me¬ 
toda powyższa jest szczególnie wygodna do pomiaru 
różnicy odległości, np. jest wykorzystywana w techno¬ 
logii elektronicznej do pomiaru grubości cienkich 
warstw, równej różnicy dróg optycznych światła odbi¬ 
tego od podłoża i od powierzchni warstwy. Podstawo¬ 
wa dokładność pomiaru odległości w interferometrze 
dwu wiązkowym wynosi ż/2, a w rozbudowanych in¬ 
terferometrach, tzw. kalibratorach laserowych,, moż¬ 
na — przy użyciu lasera helowo-neonowego — uzy¬ 
skać pomiar z dokładnością ź/300, czyli ok. 2 nm. 
Stosowanie tej metody ogranicza trudność związana 
ze zliczaniem dużej liczby N prążków (zależnej od 
b — a), które się przesuwają w trakcie pomiaru na ekra¬ 
nie, np. pomiarowi grubości 1 cm odpowiada zlicze¬ 
nie 30 000 prążków. Stąd też kalibratory laserowe wy¬ 
posażone są w małe komputery liczące i analizujące 
ruch prążków. 

Interferometryczne kalibratory laserowa znajdują 
zastosowanie np. w kontroli jakości dużych elemen¬ 
tów optycznych, w pomiarach weryfikacyjnych wzor¬ 
ców długości i grubości, pomiarach w trakcie produk¬ 
cji elementów mikroelektronicznych, w bardzo do¬ 
kładnym ustawieniu obrabiarek (np. stół obrabiarki 
można ustawać lub przesunąć o kilka metrów z do¬ 
kładnością do 1 jim). 

Precyzyjne pomiary dużych odległości (rzędu 1 km 
i w-iększych) polegają na pomiarze czasu przejścia 
impulsu laserowego do elementu odbijającego i z po¬ 
wrotem do detektora (il. 138, tabl. 35). Czas ten po¬ 
mnożony przez prędkość światła w powietrzu daje 
podwojoną odległość od obiektu. Można także mierzyć 
różnicę faz światła wychodzącego i powracającego do 
detektora. 

Omówimy tylko jedną z metod, która stanowi roz¬ 
winięcie metody Fizeau, użytej niegdyś do pomiaru 
prędkości światła. Światło, które przeszło przez mo¬ 
dulator (rys. 12) i zostało odbite od badanego obiek¬ 
tu, dotrze do detektora, jeżeli akurat modulator elek- 
trooptyczny będzie otwarty (w doświadczeniu Fizeau 
była to przesłona mechaniczna). Przez zmianę często¬ 
ści napięcia modulującego w modulatorze można tak 
dobrać czas r między kolejnymi zasłonięciami modu¬ 
latora, by światło wróciło do odbiornika, zatem 

2Ljv — A r r, 

gdzie v — prędkość światła w powietrzu, liczba N 
mówi, ile razy modulator otw-orzył się do momentu po¬ 
wrotu impulsu świetlnego do przyrządu. Mierząc 
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Nr — całkowity czas między pierwszym a drugim 
przejściem impulsu świetlnego przez modulator (po¬ 
miar elektroniczny) — łatwo jest obliczyć odległość 


zwierciadło 

półprzepuszczalne 



L dalmierza od przedmiotu. Dokładność pomiaru od¬ 
ległości tą metodą na odcinkach rzędu 1 km wynosi 
ALjL = 10 7 —10~ 8 , czyli bezwzględny błąd pomiaru 
jest rzędu 1 pm. 

Jeśli jedno ze zwierciadeł interferometru Michel- 
pomiar sona (rys. 11) porusza się wzdłuż osi optycznej z pręd- 
prędkości kością v, to natężenie światła w płaszczyźnie ekranu 
zmienia się z częstością v = Icfk. Gdy długość fali 
JL = 630 nm, częstość 1000 prążków/s odpowiada 
prędkości zwierciadła 0,3 mm/s. Ruch prążków na 
ekranie oczywiście oznacza, że światło odbite od 
zwierciadła zmienia wskutek efektu Dopplera czę¬ 
stość o wartość 2vjL Poruszające się zwierciadło moż¬ 
na zastąpić przy odpowiedniej mocy lasera chropowa¬ 
tą powierzchnią, a nawet poruszającym się płynem. 
W taki to sposób mierzy się od niedawna prędkość 
wiatru w czasie huraganów. 


Laserowe układy śledzące 

Celem działania układów śledzących jest określenie 
odległości, prędkości i kątów', tj. podanie zupełnej in¬ 
formacji o obiektach ruchomych. Pojęcie „układ śle¬ 
dzący” jest jednak wieloznaczne, gdyż wymagania do¬ 
tyczące skali odległości i czasu mogą się różnić w zasa¬ 
dniczy sposób. Może być np. potrzebna bieżąca infor¬ 
macja o locie rakiety czy samolotu, a także wieloletnie 
pomiary odchyleń położenia Księżyca od orbity wokół 
Ziemi. Przy śledzeniu startującej rakiety mierzona 
odległość jest rzędu 10 4 m, a prędkość kątowa—10 5 se¬ 
kund kątowych na sekundę. Natomiast pomiary orbi¬ 
ty Księżyca z Ziemi wymagają określenia odległości 
3,8 -10 8 m i prędkości kątowej 14,5 sekundy kątowej 
na sekundę. Również żądana dokładność jest różna: 
w systemach obrony powietrznej wystarczy informa¬ 
cja, czy dany obiekt jest w pewnej objętości przestrzeni 
powietrznej, przy kontroli zaś lotu niektórych sateli¬ 
tów czy statków kosmicznych odległość 10 6 m musi 
być określona z dokładnością do 1 cm. W wielu sytua¬ 
cjach wystarczy dany obiekt uznać za punkt w prze¬ 
strzeni, gdy w innych wymagana jest znajomość kształ¬ 
tu lecącego ciała. Z racji tak różnych wymagań istnieje 
wiele odmian układów śledzących, a wszystkie stano¬ 
wią bardzo rozbudowane urządzenia, wyposażone 
w wyspecjalizowane komputery. 

Ogólna zasada pracy układów laserowych jest taka 
układy sama jak układów radarowych mikrofalowych: po- 
laserowe a miaru odległości dokonuje się przeważnie przez po- 
radarowe miar czasu powrotu odbitego od obiektu impulsu 
światła; informacje o prędkości uzyskuje się przez 
pomiar zmian częstości fali świetlnej (efekt Dopplera). 
Z reguły układy te pracują w podczerwieni ze względu 
na mniejsze zakłócenia atmosferyczne i niewidziainość 
wiązki laserowej. Zaletą użycia laserów jest zmniej¬ 
szenie wymiarów urządzeń, obniżenie kosztów, więk¬ 
sza dokładność pomiarów oraz utrudnienie w zakłó¬ 
caniu pracy urządzenia (ważne przy zastosowaniu mi¬ 
litarnym). Korekta wyników pomiarów, której ko¬ 
nieczność narzuca wpływ warunków atmosferycz¬ 


nych na prędkość światła w powietrzu, jest łatwiejsza 
niż w paśmie mikrofalowym. Wadę użycia laserów 
stanowią trudności w pracy podczas padającego śnie¬ 
gu lub deszczu czy mgły, gdyż wiązka laserowa jest 
silnie-tłumiona w takich warunkach atmosferycznych. 

Trudność sprawia szybkie nakierowanie wąskiej 
wiązki laserowej na cel, co wymaga stosowania skom¬ 
plikowanych układów mechanicznych „przemiatają- 
cych” przestrzeń powietrzną. 

Z tych to powodów zastosowania laserowych ukła- zastosowanie 
dów śledzących dotyczą dziś głównie przestrzeni ko- w Kosmosie 
smicznej; są to pomiary ruchu satelitów, systemy do i na Ziemi 
lądowania na Księżycu i łączenia pojazdów kosmicz¬ 
nych, pomiary odległości Księżyca od Ziemi. Z ukła¬ 
dów bliższych Ziemi wymienić można układ ostrze¬ 
gawczy przed przeszkodami dla helikopterów oraz ra¬ 
dar laserowy używany przez milicję do pomiaru pręd¬ 
kości samochodów. 

Do pomiarów dalekiego zasięgu używane są przede 
wszystkim lasery neodymowe i CO». W układach bliż¬ 
szego zasięgu, jak w układzie NASA (posługiwano się 
nim w- początkach lat siedemdziesiątych przy łączeniu 
pojazdów kosmicznych), źródłem światła jest zbiór 
diod laserowych GaAs, których światło jest skolimo- 
wane przez układ optyczny. Możliwości tych układów 
ilustruje tabela. 


Podstawowe parametry układów NASA 



Zasięg 

Wielkość 

daleki (3-120 km) j 

bliski (0-3 km) 

Dokładność pomiaru 
odległości 

0,5%, 

OJ m 

Pomiar prędkości 
obiektu 

50-120 m/s 

0,3-50 m/s 

Dokładność pomiaru 
prędkości 

0,2% 

0,03%, 

Dokładność pomiaru 
położenia kitowego 

0,1° 

OJ" 

Dokładność pomiaru 
prędkości kątowej 

0,5 mrad/s 

0,05 mrad/s 


Przy pomiarach bardzo dużych odległości koniecz¬ 
ne jest — w celu zwiększenia natężenia światła wraca- retroreflek- 
jącego do odbiornika — instalowanie na badanych tory 
obiektach specjalnych zwierciadeł, tzw. retroreflekto- 
rów, do odbijania światła w kierunku, z którego padła 
wiązka. Wiązka laserowa jest mało rozbieżna (kąt roz¬ 
warcia jest nawet mniejszy od 1 prąd), mimo to po 
przebyciu setek tysięcy czy milionów kilometrów ma 
znikome natężenie i trudno jest wyodrębnić sygnał 
z szumów (świecenie gwiazd). 

Takie właśnie zwierciadła zainstalowali kosmonauci 
amerykańscy na Księżycu podczas wypraw „Apolla”. 

Umożliwiły one przeprowadzenie w Lick Laboratory 
w Kalifornii pomiaru odległości między Ziemią i Księ¬ 
życem. Źródłem światła był laser rubinowy dający 
impulsy o energii 8 J i o czasie trwania 10 ns. Aby 
maksymalnie skupić wiązkę, kierowano ją na Księżyc 
przez 120-calowy teleskop — na Księżycu miała śred¬ 
nicę ok. 1600 m. Każdy z wysłanych impulsów zawie¬ 
rał 10 20 fotonów, z których przeciętnie tylko 25 wra¬ 
cało do odbiornika na Ziemi. Odległość Ziemia-Księ- 
życ zmierzono tą metodą z dokładnością do ± 15 cm. 


Zastosowanie w medycynie i biologii 

W tych dziedzinach używa się lasera głównie dlate¬ 
go, że jego promieniowanie ma dużą gęstość energii 
skupioną w małej objętości. Najbardziej przydatne 
do cięcia tkanek (miękkich i twardych) są lasery C0 2 cięcie 
i neodymowe. Połączenie lasera z chirurgicznym mi- tkanek 
kroskopem pozwala dokonywać precyzyjnych zabie¬ 
gów, m.in. na tkance mózgowej (np. odparowywanie 
•nowotworów mózgu). Wiązka laserowa daje ostro za¬ 
rysowane cięcie z delikatnym obrzeżem, głębokość 
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cięcia można regulować przez zmianę mocy lub energii 
lasera, krwawienie jest blokowane mikroskrzepami, 
a rany po zabiegu goją się szybko. 

koagulator Jednym z pierwszych urządzeń medycznych, w któ- 
laserowy rym zastosowano laser (rubinowy) jest koagulator la¬ 
serowy (-> Fizyka medyczna). Laser rubinowy do¬ 
skonale nadaje się do „przyklejania” siatkówki do na¬ 
czyniówki (odklejenie siatkówki jest dość częstym 
uszkodzeniem oka), gdyż wiązka laserowa rozchodzi 
się bez dużych strat w elementach przezroczystych 
oka, a jest silnie pochłaniana przez nabłonek siatków¬ 
ki; impuls lasera, odpowiednio skupiony, wywołuje 
w siatkówce odczyn zapalny, w wyniku czego powstaje 
zrost (il. 16, tabl. 4). Laserem rubinowym można 
usuwać tatuaż lub zabarwienia skóry w miejscach 


różniących się współczynnikiem absorpcji od miejsc 
sąsiednich. 

W badaniach medycznych i biologicznych lasery 
służą m.in. do mikropunkcji komórek i organelli. 
Głowica laserowa sprzężona z mikroskopem pozwala 
precyzyjnie zniszczyć, a nawet odparować dany frag¬ 
ment komórki. Wobec krótkiego czasu ekspozycji — 
rzędu 0,1 ms — można naświetlać nawet poruszające 
się elementy. Takim zabiegom na żywych komórkach 
nie towarzyszy upośledzenie procesów życiowych, co 
jest bardzo ważne przy tego typu badaniach. 

J. Martin Przyszłość telekomunikacji, Warszawa 1975; E. R. 
Mustiel, W. N. Parygin Metody modulacji światła. Warszawa 
1974; H. Kaczmarek Wstęp do fizyki laserów , Warszawa 1978; 
H. Klejman Lasery Warszawa 1979; A. Piekara Nowe oblicze 
0 />tyA'/,Warszawa 1976; Światło {zbiór artykułów). Warszawa 1973 


Optyka nieliniowa 

Andrzej Graja 

W początkach lat pięćdziesiątych wydawało się, że 
podstawowe problemy optyki fizycznej zostały już 
dostrzeżone i rozwiązane, a sama dziedzina stanowi 
przykład nauki pięknej, zwartej i bliskiej doskonało¬ 
ści. W tej idealnej konstrukcji pojawiły się jednak rysy, 
gdy w II poł. lat pięćdziesiątych teoretycznie wykazano, 
że niektóre własności.materii mogą zależeć od natęże¬ 
nia padającego na nią światła. Okazało się mianowi¬ 
cie, że polaryzacja ośrodka dielektrycznego, wywoła- 



Rys. 1. Zależność polaryzacji P od natężenia przyłożonego pola 
elektrycznego E: a) dielektryk liniowy, b) dielektryk nieliniowy. 
Współczynniki a, P i y oznaczają odpowiednio: makroskopową 
polary zowalność liniową, pola ryzo walność drugiego rzędu oraz 
pola ryzo walność trzeciego rzędu 


na polem elektrycznym fali świetlnej, może wzrastać 
szybciej aniżeli proporcjonalnie (liniowo) do natężenia 
zależność pola; może być kwadratową lub wyższego rzędu funk- 
poiaryzacji cją tego natężenia (rys. 1), czyli może wyrastać nieli- 
od natężania niowo wraz z natężeniem poła. To na pozór proste 
pola zjawisko pociągnęło za sobą całkowitą przebudowę 
podstaw optyki fizycznej; trzeba było bowiem znaleźć 
miejsce na zjawiska optyczne, których przebieg zależy 
od natężenia promieniowania, i które zachodzą bez 
spełnienia zasady superpozycji fal. W ten sposób na 
początku lat sześćdziesiątych pojawiła się nowa dzie¬ 
dzina optyki — optyka nieliniowa, obejmująca obec¬ 
nie wszystkie zjawiska z zakresu częstości optycznych 
związane z nieliniowością materii, czyli zależnością jej 
własności od natężenia przyłożonego pola elektromag¬ 
netycznego. Początki optyki nieliniowej przypadają 
nieprzypadkowo na okres, w którym pojawiły się 
źródła światła zdolne do ujawnienia nieliniowości ma¬ 
terii, a więc do weryfikacji wcześniejszych prac. Źród¬ 
łami tymi były generatory kwantowe światła czyli 
lasery. 

Aby zrozumieć, dlaczego dopiero lasery umożliwiły 
zaobserwowanie pierwszych zjawisk optyki nielinio¬ 
wej, porównajmy wkład wnoszony do całkowitej po¬ 
laryzacji ośrodka przez pierwsze dwa wyrazy <xE 
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i pE~ występujące w wyrażeniu wiążącym polaryzację 
dielektryka (-> Dielektryki) z natężeniem przyłożo¬ 
nego pola elektrycznego fali świetlnej (rys. 2). 


Rys. 2. Zależność 
składowej liniowej P l 
i nieliniowej P nl pola¬ 
ryzacji typowego nie¬ 
liniowego ośrodka 
dielektrycznego od na¬ 
tężenia pola elektrycz¬ 
nego fali świetlnej 
(uwaga: skala loga¬ 
rytmiczna) 



Wyraz a E opisuje polaryzację liniową P l ośrodka, 
natomiast pE* jest pierwszym przybliżeniem polary¬ 
zacji nieliniowej P 711 . W polach elektrycznych o natę¬ 
żeniu rzędu 10 2 V/m polaryzacja nieliniowa ośrodka 
jest o kilkanaście rzędów wielkości mniejsza od jego 
polaryzacji liniowej (mała wartość współczynnika p). 
W silnych polach elektrycznych fali świetlnej o natę¬ 
żeniu rzędu 10 12 V/m polaryzacja nieliniowa zaczyna 
odgrywać pewną rolę, pozostając jednak nadal mniej¬ 
szą od polaryzacji liniowej. Nikła rola polaryzacji nie¬ 
liniowej w szerokim zakresie natężeń przyłożonych 
pól elektrycznych jest związana z małą wartością 
współczynnika P w omawianych materiałach. Współ¬ 
czynniki stojące przy wyrazach, w których natężenie 
pola elektrycznego fali świetlnej występuje w jeszcze 
wyższych potęgach, są znacznie mniejsze niż P i dla¬ 
tego nieliniowość wyższego niż drugiego rzędu ujaw¬ 
nia się tylko w polach najsilniejszych. 

Teoretyczne rozważania dotyczące ośrodków ani¬ 
zotropowych, czyli takich, których własności fizyczne 
uzależnione są od kierunku obserwacji, ukazują 
ogromną różnorodność zjawisk nieliniowych wywo¬ 
łanych falą świetlną. Najprostsze z tych zjawisk 
przedstawia tabela. 

W przeciwieństwie do ośrodka izotropowego, po- 


mi kropu nkcje 


polaryzacja 

nieliniowa 










Wybrane zjawiska nieliniowe wywołane polem elektro¬ 
magnetycznym fali świetlnej o częstości co 



Opis zjawiska 

Schemat 

stała polaryzacja dielek¬ 
tryka wywołana nielinio- 
wym oddziaływaniem 

z falą świetlną 


4-4 + 4- 


3> 



wytwarzanie drugiej har¬ 
monicznej światła w kry¬ 
ształach bez środka syme¬ 
trii 



2(0 

E> 



wytwarzanie drugiej har¬ 
monicznej światła wymu¬ 
szonej stałym polem elek¬ 
trycznym E w kryształach 
ze środkiem symetrii 
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wytwarzanie trzeciej har¬ 
moniczne! światła 
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polaryzacja 

ośrodka 

anizotropo¬ 

wego 


Przegląd kryształów stosowanych do wytwarzania drugiej 
harmonicznej światła 


Rys. 3. Polaryzacja 
vr polu elektrycz¬ 
nym o natężeniu 
E : a) ośrodek izo¬ 
tropowy, b) ośro¬ 
dek anizotropowy 



Długość fali, nm 

Średnia 

wartość 

Kąt do¬ 
pasowa¬ 
nia fa¬ 
zowego 

Kryształ 

podsta¬ 

wowej 

drugiej 

1 harmo¬ 
nicznej 

elementów 
tensora 
bijk , 

długość 
spójno- 
■ ści, pm 

Kwaśny fos¬ 
foran potasu 

694,3 

347,1 

1,00 

9,25 

50°,4 

Kwaśny arse- 
nian rubidu 

694,3 

347,1 

0,64 

158 

80° 

Kwaśny fos¬ 
foran amonu 

694,3 

347,1 

1,02 

8,8 

51°,9 

Siarczan trój- 
glicyny 

694,3 

347,1 

0,004 

4 

48° 

Tytanian baru 

1 058,2 

529,1 

30 

2,0 

— 

Niobian litu 
Tellur 

1 058,2 
10 600 

529,1 

5 300 

29 

12700 

40 

14°,8 

Arsenek indu 

10 600 

5 300 

780 

53 



Wartości elementów tensora nieliniowej polaryzo- 
walności optycznej decydują o efektywności zjawisk 
nieliniowych zachodzących w rozpatrywanych ośrod¬ 
kach. Tensor polaryzowalności kwadratowej bak 
określa np. wydajność wytwarzania drugiej harmo¬ 
nicznej światła w kryształach. Kryształy bardzo się 
między sobą różnią wartościami elementów tego ten¬ 
sora, a więc ich przydatność do podwajania częstości 
optycznych jest zróżnicowana (tabela). 


Wytwarzanie drugiej 
harmonicznej światła 

Wytwarzanie drugiej harmonicznej światła, czyli po¬ 
dwajanie częstości optycznych jest najprostszym 
i najwcześniej zaobserwowanym efektem nieliniowym 
(1961). Zjawisko to może występować w kryształach 
pozbawionych środka symetrii; kryształy takie w nor¬ 
malnych warunkach są dwójłomne. Jeżeli pole elek¬ 
tryczne fali świetlnej padającej na nieliniowy ośrodek 
zmienia się periodycznie z częstością co (co opisuje 
funkcja sino?/), to periodycznie zmienia się również 
składowa polaryzacji nieliniowej ośrodka zależna od 
kwadratu natężenia pola elektrycznego padającej fali. 
Składową tę (rys. 4) można przedstawić jako sumę 
dwóch funkcji: stałej P 0 i zależnej od czasu P^. 
Taka prosta analiza graficzna funkcji opisującej 


druga 

harmoniczna 

światła 


laryzującego się w kierunku przyłożonego pola elek- 
rycznego (rys. 3a), ośrodek anizotropowy polaryzuje 
się w innym kierunku (wektor polaryzacji nie jest rów¬ 
noległy do wektora natężenia pola elektrycznego), co 
można traktować jako polaryzację w trzech wzajem¬ 
nie prostopadłych kierunkach (rys. 3b). Ogólnie, każ¬ 
da ze składowych pola elektrycznego wywołuje pola¬ 
ryzację ośrodka anizotropowego we wszystkich trzech 
kierunkach układu współrzędnych i dla scharaktery¬ 
zowania ośrodka trzeba podać dziewięć liczb. Taki 
zespół liczb tworzy tensor. Inaczej mówiąc, współ¬ 
czynnik proporcjonalności między wektorem polary¬ 
zacji i wektorem natężenia pola nie jest liczbą, lecz 
wielkością tensorową, zwaną tensorem polaryzowal¬ 
ności liniowej. Podobnie polaryzacja nieliniowa ośrod¬ 
ka związana jest z natężeniem pola elektrycznego 
przez współczynniki tensorowe, zwane tensorami po- 
laryzowalności kwadratowej, sześciennej lub wyższego 



■ 2 ? 


AA/W 1 


tensory po- rzędu. Tensory polaryzowalności liniowej i sześciennej 
laryzowal- mają elementy różne od zera nawet dla ciał izotro- 
ności powych, podczas gdy tensor polaryzowalności kwad¬ 
ratowej staje się zerem dla ośrodków mających środek 
symetrii. 


^E 0 2 -^E 0 2 cos2o>f=P^P^ 

Rys. 4. Analiza graficzna funkcji opisującej polaryzację zależną 
od kwadratu natężenia pola elektrycznego. Polaryzację tę można 
rozłożyć na składowe o częstościach 2a i 0 

polaryzację zależną od kwadratu natężenia pola 
elektrycznego padającej fali o częstości a> pokazuje 
więc, że w ośrodku nieliniowym pojawia się składowa 
zmienna, reprezentująca polaryzację o częstości 2co, 
oraz składowa stała, opisująca polaryzację niezmien¬ 
ną. Pojawienie się stałej polaryzacji jest optycznym 
prostowaniem. 

Zarówno powielanie częstości jak i prostowanie fal analogia 
świetlnych w krysztale nieliniowym jest pełnym analo- z diodami 
giem dobrze znanych zjawisk występujących w dio- krystalicz- 
dach krystalicznych pod wpływem mikrofal i fal nymi 
radiowych. Dzięki charakterystyce nieliniowej detek¬ 
tora krystalicznego można używać go nie tylko do pro¬ 
stowania fal elektromagnetycznych, ale również do 
mieszania oraz powielania ich częstości. 

Powróćmy jednak do optyki i do składowej pola¬ 
ryzacji zmieniającej się periodycznie z częstością 2w. 

Takie zmiany polaryzacji ośrodka to nic innego jak 
periodyczne zmiany makroskopowego momentu di¬ 
polowego, a co za tym idzie — emisja promieniowania 
elektromagnetycznego. Ośrodek nieliniowy może 
więc — pod wpływem fali świetlnej o częstości co — 
stać się źródłem fali świetlnej o częstości 2 co. Innymi 
słowy, ośrodek nieliniowy może emitować promienio¬ 
wanie o częstości dwukrotnie większej niż częstość 
fali padającej, czyli może wytwarzać drugą harmo¬ 
niczną światła. Zjawisko takie nie mieści się w kate¬ 
goriach optyki liniowej, można je tłumaczyć jedynie 
oddziaływaniem nieliniowym promieniowania elek¬ 
tromagnetycznego z ośrodkiem. 

Uproszczony układ doświadczalny służący do wy¬ 
twarzania drugiej harmonicznej światła (rys. 5) składa 
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się z silnego źródła spójnego światła monochroma¬ 
tycznego jakim jest laser (zwykle impulsowy), zestawu 
filtrów oraz kryształu nieliniowego, spełniającego 


filtr przepuszczający <o 



Rys. 5. Schemat układu doświadczalnego służącego do generacji 
drugiej harmonicznej światła 


funkcję generatora fali świetlnej o podwojonej czę¬ 
stości. Dla przykładu, jeśli na kryształ nieliniowy 
skierować czerwoną wiązkę świetlną z lasera rubino¬ 
wego (długość fali źi = 694,3 nm), to otrzymuje się 
drugą harmoniczną niewidzialną gołym okiem, leżącą 
w ultrafioletowej części widma (J* = 347,1 nm). Na¬ 
tomiast druga harmoniczna światła emitowanego 
przez laser neodymowy (ź x = 1058 nm, czyli w zakre¬ 
sie podczerwieni) ma barwę zieloną = 529 nm), 
a więc można ją obserwować wzrokowo. 

W krysztale nieliniowym naświetlonym wiązką pro¬ 
mieniowania o częstości co pojawia się fala polaryzacji 
o częstości 2co , która jest źródłem promieniowania 
świetlnego o częstości 2co. Początkowo, polaryzacja 
i wywołana przez nią fala elektromagnetyczna są 
w fazach zgodnych. Później jednak powstaje między 
nimi różnica faz będąca wynikiem różnych prędkości 
rozchodzenia się tych fal. Oznacza to, że psują się wa¬ 
runki do „przepompowywania” energii z fali polary¬ 
zacji do fali drugiej harmonicznej. Droga optyczna 
w krysztale, potrzebna do tego, by fazy fal harmo¬ 
nicznej o częstości 2co i polaryzacji o częstości 2 co róż¬ 
niły się o 180° nazywa się długością spójności. Długość 
długość spójności jest więc wielkością charakteryzującą dłu- 
spój rości £°ść drogi optycznej, na której następuje efektywne 
„przepompowywanie” energii z fali polaryzacji do 
fali drugiej harmonicznej. Jak widać z podanego wy¬ 
żej przeglądu kryształów nieliniowych, długość spój¬ 
ności jest zwykle niewielka, więc i „przepompowywa¬ 
nie” energii w dowolnym kierunku kryształu jest 
małe. Optymalna sytuacja powstałaby wtedy, gdyby 
podczas całej drogi optycznej w krysztale następowało 
„przepompowywanie” energii, tak jak to dzieje się 
w wypadku przepuszczalności promieniowania przez 
ośrodek bez zmiany jego częstości. Okazuje się, że po¬ 
dobną sytuację można urzeczywistnić w krysztale nie¬ 
liniowym w kierunku, w którym wektory falowe k x 
(dla promieniowania o częstości co) i k 2 (dla promie¬ 
niowania o częstości 2 co) spełniają równanie k x +k x = 

= k z , W kierunku tym prędkości rozchodzenia się fal 
o częstościach co i 2 co, a co za tym idzie i współczynniki 
załamania światła dla tych częstości, muszą być jedna- 
kierunek k° we > czyli dopasowane. Z tego też względu kierunek 
dopasowania najefektywniejszego „przepompowywania” energii 
fazowego nazywa się kierunkiem dopasowania fazowego. 

W krysztale anizotropowym kierunek wyznaczony 
przez przecięcie się powierzchni współczynnika zała¬ 
mania promienia zwyczajnego dla częstości podstawo¬ 
wej i promienia nadzwyczajnego (elipsoidy obrotowe) 
oraz dla drugiej harmonicznej (indeks 2) czyli kieru¬ 
nek, w którym odpowiednie współczynniki załamania 
są jednakowe, wyznacza położenie kierunku dopaso¬ 
wania fazowego. Przekrój przecinających się po¬ 
wierzchni współczynników załamania typowego krysz¬ 
tału nieliniowego, a mianowicie kwaśnego fosforanu 
amonu (ADP), przedstawia rys. 6. Widać z niego, że 
kierunek dopasowania fazowego do wytwarzania dru¬ 
giej harmonicznej światła o długości fali X x = 694,3 nm 
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tworzy z osią optyczną kryształu kąt 0 bliski 52°. 
Kierunek dopasowania do wytwarzania harmonicznej 
promieniowania podczerwonego z lasera neodymowe- 



Rys. 6. Przekrój przez powierzchnie współczynników załamania 
promienia zwyczajnego (kule, indeks o) i nadzwyczajnego (elip¬ 
soidy obrotowe, indeks e) dla częstości podstawowej (indeks /) 
i drugiej harmonicznej (indeks 2) kryształu ADP. Kierunek do¬ 
pasowania fazowego tworzy z kierunkiem osi optycznej krysz¬ 
tału, czyli z osią z t kąt# =* 52® 
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Rys. 7. Zależnośó mocy drugiej harmonicznej światła (w jedno¬ 
stkach względnych) od kąta odchylenia osi wiązki laserowej od 
kierunku dopasowania fazowego 


go tworzy z osią kryształu kąt 0 zbliżony do 42°. Zna¬ 
jąc wartości kąta dopasowania fazowego, można wy¬ 
ciąć z badanego kryształu próbkę w ten sposób, by oś 
optyczna kryształu tworzyła kąt 0 z prostą prostopad¬ 
łą do powierzchni próbki. 

Jak już powiedziano, wytwarzanie drugiej harmo¬ 
nicznej światła jest w zasadzie możliwe w dowolnym 
kierunku krystalograficznym, ale wydajność przetwa¬ 
rzania częstości jest wtedy przeciętnie tysiąc razy 
mniejsza niż w kierunku dopasowania fazowego 
(rys. 7). W pobliżu dopasowania fazowego zależność 
ta jest tym bardziej krytyczna, im mniejsza jest roz¬ 
bieżność wiązki promieniowania podstawowego i im 
większa jest grubość kryształu nieliniowego; zależy 
ona również od jego jakości optycznej. Występowanie 
defektów sieci krystalicznej powoduje bowiem powsta¬ 
wanie w krysztale naprężeń i związanych z nimi lokal¬ 
nych zmian współczynnika załamania. Efektem tego 
jest poszerzenie głównego maksimum na krzywej opi¬ 
sującej zależność mocy drugiej harmonicznej od 


























orientacji kryształu. Tak więc, do wytwarzania dru¬ 
giej harmonicznej światła winno używać się kryszta¬ 
łów możliwie najwyższej jakości optycznej. 

Moc drugiej harmonicznej światła wytwarzanej 
w krysztale nieliniowym silnie zależy od mocy promie¬ 
niowania podstawowego. Ponieważ moc promienio¬ 
wania elektromagnetycznego jest proporcjonalna do 
kwadratu natężenia pola elektrycznego odpowiedniej 
fali elektromagnetycznej w wypadku efektu kwadra¬ 
towego, jakim jest wytwarzanie drugiej harmonicznej 
światła, przeto moc promieniowania o częstości 2 a> 
winna zależeć od kwadratu mocy promieniowania 



podstawowego P" binowego 


podstawowego o częstości co. Zależność ta jest dobrze 
spełniana w szerokim zakresie wartości mocy promie¬ 
niowania (rys. 8.). 

metoda Do badania doświadczalnego zjawiska wytwarzania 
proszkowa drugiej harmonicznej w monokryształach próbki 
muszą być bardzo dokładnie wycięte z badanego 
monokryształu i obrobione z najwyższą dokładnością 
optyczną. Niekiedy jednak trudności z otrzymaniem 
odpowiedniej jakości i dużych monokryształów unie¬ 
możliwiają pomiary metodą tradycyjną. Stosuje się 
wówczas próbkę z proszku krystalicznego o przypad¬ 
kowo zorientowanych ziarnach, których rozmiary są 
porównywalne z długością spójności dla badanego 
materiału. W niektórych ziarnach wytwarza się druga 
harmoniczna w kierunku dopasowania, w innych na¬ 
tomiast warunek dopasowania nie jest spełniony. Wy¬ 
dajność przetwarzania częstości metodą proszkową 
nie jest duża, ale za to taki sposób badania nielinio¬ 
wych materiałów pozwala uniknąć trudności techno¬ 
logicznych z hodowlą, orientacją i obróbką mono¬ 
kryształów. Badanie drugiej harmonicznej w sprosz¬ 
kowanych kryształach umożliwia oszacowanie naj¬ 
ważniejszych parametrów charakteryzujących materiał 
nieliniowy, a więc pozwala określić jego przydatność 
w optyce nieliniowej. Wygląd aparatury służącej do 
takich badań przedstawiono na il. 139, tabl. 35). 
zastosowanie Duże zainteresowanie zjawiskiem wytwarzania 
do badania drugiej harmonicznej światła jest spowodowane dwie- 
kryształów ma przyczynami: po pierwsze, jest to metoda badania 
materii dostarczająca nowych informacji o niej; po 
drugie, jest to źródło spójnego krótkofalowego pro¬ 
mieniowania świetlnego. Badanie zjawiska powielania 
częstości optycznych dostarcza informacji o zmianach 
struktury krystalicznej i mechanizmie przejść fazo¬ 
wych w kryształach nieliniowych, a także informacji 
o ilości defektów sieci krystalicznej, o ich symetrii 
oraz rozkładzie. Jest to metoda szczególnie cenna 
w badaniach kryształów ferroelektrycznych, zwłaszcza 
w obszarze ich przejścia fazowego. Wytwarzanie dru- 
wytwarzanie giej harmonicznej światła stanowi niekiedy najwy- 
spójnego godniejszy sposób otrzymywania spójnego promienio- 
promienio- wania krótkofalowego, a w tym również promienio¬ 
wania wania ultrafioletowego o bardzo dużej mocy, potrzeb¬ 
nych do badania optycznych własności ośrodków. 


Stwierdzono poprzednio, że elementy tensora pola- polaryzacja 
ryzowalności kwadratowej, opisującego wytwarzanie kwadrupo- 
drugiej harmonicznej światła, są równe zeru dla krysz- Iowa 
tałów mających środek symetrii. Jest to słuszne w pier¬ 
wszym przybliżeniu, tzn. wtedy, gdy uwzględniamy 
jedynie polaryzację dipolową dielektryka. Ogólnie, do 
polaryzacji dielektryka dochodzi jeszcze przyczynek 
związany z przestrzennymi zmianami pola elektrycz¬ 
nego (przyczynek kwadrupolowy), który odgrywa 
rolę w kryształach mających środek symetrii oraz 
w ośrodkach izotropowych. Ponieważ polaryzacja 
kwadrupolowa jest ok. tysiąc razy słabsza od polary¬ 
zacji dipolowej, wytwarzanie drugiej harmonicznej 
dzięki mechanizmowi kwadrupolowemu jest niezwy¬ 
kle mało skuteczne i można je zaobserwować tylko 
w niektórych materiałach (np. w kalcycie) i w szcze¬ 
gólnych warunkach doświadczalnych. 

Przyłożenie dostatecznie silnego stałego pola elek- wymuszone 
trycznego do ośrodka izotropowego powoduje od- wytwarzanie 
kształcenie jego sieci krystalicznej, a co za tym idzie —■ drugiej ^ 
utratę symetrii. Wymuszona w ten sposób anizotropia harmonicznej 
ośrodka umożliwia wytwarzanie w nim drugiej harmo¬ 
nicznej światła. Zjawisko wymuszonego wytwarzania 
drugiej harmonicznej obserwowano w niektórych 
kryształach centrosymetrycznych, w cieczach orga¬ 
nicznych, w roztworach wielkocząsteczkowych związ¬ 
ków organicznych; obserwowano je także w niektó¬ 
rych gazach. 

Na zjawisko wytwarzania drugiej harmonicznej, po¬ 
dobnie jak i na naturę światła, można również spoj¬ 
rzeć nieco inaczej. W opisie kwantowym zjawisko pod¬ 
wajania częstości jest najprostszym przykładem proce- procesy wie- 
su wielofotonowego. W elementarnym akcie wytwa- lofotonow© 
rzania drugiej harmonicznej biorą bowiem udział trzy 
fotony: dwa fotony o jednakowych energiach rów¬ 
nych ftco oraz foton drugiej harmonicznej o energii 
2ho). Ogólnie, wynikiem oddziaływania dwóch fal 
świetlnych o częstościach co x (energia fotonów fico i) 
i w 2 (energia fi(v 2 ) w ośrodku nieliniowym jest fala 
o częstości co 3 (energia fia> 3 ) spełniająca zasadę zacho¬ 
wania energii co 3 — gdzie m x i m 2 są licz¬ 

bami całkowitymi. Suma tych liczb równa się wykład¬ 
nikowi najwyższej potęgi pola elektrycznego w rów¬ 
naniu opisującym polaryzację nieliniową (rys. Ib). 

Jeśli ograniczymy się do polaryzacji kwadratowej, 
a więc do wypadku, gdy m x +m 2 = 2, uzyskamy czte¬ 
ry nieliniowe zjawiska optyczne drugiego rzędu: 

— wytwarzanie drugiej harmonicznej wiązki pierw¬ 
szej o częstości 2^ (w tym wypadku m 1 == 2, m z = 0). 

— wytwarzanie drugiej harmonicznej wiązki dru¬ 
giej o częstości 2ft> 2 ( m 1 = 0, w 2 “2). 

— wytwarzanie wiązki o częstości sumacyjnej 

0 * 1 + cd 2 (Wi = =1). . 

— wytwarzanie wiązki o częstości różnicowej 
(o 1 — w 2 (m i = — nu = 1). 


Mieszanie wiązek świetlnych 

Mieszanie dwóch wiązek światła monochromatyczne- układy doś- 
go można przeprowadzić w układzie doświadczał- wiadczalne 
nym, którego uproszczony schemat przedstawia rys. 

9. Wiązki promieniowania spójnego emitowane przez 
dwa lasery są kierowane na kryształ nieliniowy po¬ 
przez odpowiednio ustawione zwierciadło półprze- 
puszczalne. Zapewnia się w ten sposób współbieżność 
promieni ulegających zmieszaniu w krysztale nielinio¬ 
wym. Pierwsze doświadczenia nad mieszaniem czę¬ 
stości optycznych przeprowadzono w 1962 r. z wiąz¬ 
kami świetlnymi pochodzącymi od dwóch laserów ru¬ 
binowych pracujących w różnych temperaturach, 
a więc nieznacznie się różniących długością emitowa¬ 
nej fali. Później podobne doświadczenia powtarzano 
w innych warunkach i z rozmaitymi materiałami nie¬ 
liniowymi. Mieszano np. wiązki promieniowania spój¬ 
nego lasera rubinowego (A = 694,3 nm) i lasera kry- 
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sta licznego emitującego światfo o długości fali X = 
= 1058,2 nm. Zdołano zmieszać wiązki promienio¬ 
wania dwóch różnych laserów gazowych pracujących 



Rys. 9. Schemat układu do otrzymywania i rejestracji optycznych 
częstości sumacyjnych i różnicowych 


w odległych zakresach widmowych, np. wiązkę pod¬ 
czerwoną z wiązką widzialną, przeprowadzono rów¬ 
nież badania nad mieszaniem fal podczerwonych 
i mikrofal. Pomyślnym wynikiem zakończyły się rów¬ 
nież próby mieszania spójnego promieniowania lase¬ 
rowego z promieniowaniem niespójnym emitowanym 
przez klasyczne źródło światła. 

Podobnie jak w zjawisku wytwarzania drugiej har¬ 
monicznej światła, dużą wydajność sumowania czę¬ 
stości optycznych otrzymuje się jedynie w kryształach 
nieliniowych dwójłomnych zorientowanych w kie¬ 
runku dopasowania fazowego. Wydajność przemiany 
częstości jest bardzo czuła na niewielkie nawet odchy¬ 
lenie od kierunku dopasowania fazowego. Znalazło to 
praktyczne zastosowanie w spektrografach i mono- 
chromatorach nieliniowych (rys. 10). W obydwu wy¬ 
padkach, współbieżność promieniowania laserowego 
o częstości gol i badanego światła o częstościach oo x 
spektrograf i co 2 osiąga się dzięki zastosowaniu zwierciadła prze- 
nieliniowy puszczalnego dla promieniowania laserowego i silnie 
odbijającego promieniowanie analizowane. W spe¬ 
ktrografach nieliniowych (rys. lOa) wiązkę światła 
ogniskuje się na krysztale nieliniowym. Dzięki temu 
promieniowanie o częstościach gol, co x i co 2 rozchodzi 
się w krysztale we wszystkich kierunkach wewnątrz 
kąta bryłowego a. Jeśli kierunki dopasowania fazo¬ 
wego mieszczą się w rozbieżności wiązki, to w kierun- 
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kach tych zachodzi efektywna generacja częstości 
sumacyjnych col+co^ i wi+w 2 . W ten sposób uzysku¬ 
je się kątowe rozdzielenie wiązek o różnych często¬ 
ściach. 

W monochromatorach nieliniowych (rys. lOb) rów¬ 
noległą wiązkę światła, zawierającą promieniowanie 
o częstościach co Li co x i go 2 , kieruje się wprost na krysz¬ 
tał. Przy określonej orientacji kryształu mogą być monochro- I 
spełnione warunki dopasowania fazowego dla proce- mator 
su sumowania tylko dwóch częstości, np. a> L +oo 2 , nieliniowy 
a więc promieniowanie o takiej częstości może przejść 
przez kryształ nieliniowy. Dostrojenie do warunków 
dopasowania dla innych częstości można otrzymać 
przez obrót kryształu. 

Ze względu na trudności w otrzymywaniu spójnego 
promieniowania ultrafioletowego, duże znaczenie 
praktyczne mają metody otrzymywania wyższych 
harmonicznych światła. Otrzymywanie trzeciej har¬ 
monicznej światła można zrealizować dwiema meto¬ 
dami. Pierwsza — to wykorzystanie sześciennej pola- 
ryzowalności nieliniowych ośrodków (polaryzacja jest 
proporcjonalna wówczas do £ 3 ). Druga metoda — to 
podwajanie częstości, a następnie sumowanie jej z pro- trzecia 
mieniowaniem o częstości co. Analiza skuteczności harmoniczna 
potrajania częstości tymi dwoma sposobami wskazuje światła 
na przewagę ostatniego. W taki też sposób, zwany 
kaskadowym, otrzymuje się nie tylko trzecią ale 
i czwartą oraz piątą harmoniczną światła. Schemat 
powielania kaskadowego częstości optycznych przed- wyższe 
stawia rys. 11. Trzeba podkreślić, że wszystkie meto- harmoniczne 
dy prowadzące do otrzymania harmonicznych zapew- światła 
niają wystarczająco dużą wydajność przemiany czę¬ 
stości jedynie w kierunku dopasowania fazowego 
właściwym dla danego procesu. Niestety, realizacja 
dopasowania dla promieniowania o długości fali 
krótszej od ok. 200 nm jest niemożliwa ze względu na 
brak kryształów nieliniowych, mających odpowiednią 
dwójłomność w tym zakresie widmowym. 
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Rys. 11. Metody kaskadowego powielania częstości optycznych 
przy użyciu odpowiednio zorientowanych płytek płaskorówno- 
leglych wyciętych z kwaśnego fosforanu amonu (KDP) 


Równoległe z mieszaniem i wydzielaniem częstości częstości 
sumacyjnych, zainteresowanie badaczy jest skierowa- różnicowe 
ne na otrzymywanie częstości różnicowych (go x — <o 2 ). 

Metody wydzielania częstości różnicowych są szcze¬ 
gólnie ważne dla spektrofotometrii w podczerwieni. 

Ppez niewielkie przestrojenie częstości promieniowa¬ 
nia widzialnego czy też bliskiej podczerwieni można 
otrzymać promieniowanie spójne z pogranicza dale¬ 
kiej podczerwieni, oraz mikrofal. Zmieszanie dwóch 
składowych wiązki lasera neodymowego daie no. pro¬ 
mieniowanie o długości fali ok. 0,1 mm, natomiast 
zmieszanie składowych emitowanych przez laser rubi¬ 
nowy pozwala otrzymać impulsy promieniowania mi¬ 
krofalowego o długości fali 0,34 mm. W wyniku 
zmieszania wiązek stabilizowanych laserów gazo¬ 
wych można natomiast otrzymać promieniowanie 
elektromagnetyczne o długości fali ok. 30 m, a więc 
należące , do pasma częstości radiowych. Tak więc, 
przez mieszanie wiązek laserowych rozszerza się 
znacznie zakres widmowy obejmowany przez źródła 
promieniowania spójnego. 




































































































Generatory parametryczne 

Omówione wyżej metody przemiany częstości światła 
spójnego umożliwiają otrzymanie tylko pewnych, 
ściśle określonych wartości częstości, które są zdeter¬ 
minowane mechanizmami zachodzących procesów. 
Natomiast w przezroczystych, optycznie nielinio¬ 
wych ośrodkach może zachodzić tzw. parametryczne 
oddziaływanie fal świetlnych, umożliwiające płynne 
przestrajanie częstości źródeł spójnych światła. W ślad 
za pracami teoretycznymi, wskazującymi na możli- 
generacja pa- wość zbudowania parametrycznych generatorów 
rametryczna światła, przeprowadzono w 1965 r. doświadczenia 
realizujące ten pomysł. 

Okazuje się, że w ośrodku nieliniowym, w którym 
polaryzacja jest kwadratową funkcją natężenia pola 
elektrycznego fali świetlnej ( P — cc energia 

fali, zwanej pompującą, o częstości co P może być prze¬ 
kazana słabym drganiom o częstościach i co 2 wy¬ 
stępującym w układzie jako składowe „szumu” op¬ 
tycznego. Częstości te, zwane sygnałowymi muszą 
spełniać zasadę zachowania energii, którą można w 
tym wypadku zapisać w postaci w p — coi+coz (waru¬ 
nek synchronizacji czasowej). Silna fala pompująca 
o częstości co P zmienia stan ośrodka, w którym się 
rozchodzi. W krysztale nieliniowym zmiany te polega¬ 
ją na modulacji przenikalności elektrycznej; mamy 
więc do czynienia ze zmianą parametru układu. Ozna¬ 
cza to równocześnie, że w takim ośrodku nieliniowym 
o zmiennym parametrze fale o częstości co x i o) 2 nie 
rozchodzą się niezależnie od siebie, tak jak to byłoby 
w ośrodku liniowym o stałych parametrach, ale od¬ 
działują wzajemnie. Oddziaływanie to jest maksymal¬ 
ne wtedy, gdy trzy rozchodzące się w ośrodku Jale 

dopasowanie spełniają warunek dopasowania fazowego k p = k x + 
fazowe ( war unek synchronizacji przestrzennej), gdzie 

kp, k x i ~k 2 oznaczają wektory falowe promieniowania 
o częstościach odpowiednio co p , co x i co 2 . Przy spełnie¬ 
niu tego warunku amplitudy fał o częstościach co x i co 2 
parastają wykładniczo w polu fali pompującej a> p , 
czyli ośrodek o zmiennym parametrze staje się wzmac¬ 
niaczem fal o)! i w 2 . Jeśli fale sygnałowe rozchodzą się 
w rezonatorze nastrojonym na częstości co x i a> 2 , to 
może dojść do wzbudzenia drgań o tych właśnie czę¬ 
stościach. W ten sposób promieniowanie spójne po¬ 
jawia się jako wynik selektywnego wzmocnienia nie¬ 
spójnego spontanicznego promieniowania o poda¬ 
nych wyżej częstościach, które może występować 
w układzie jako „szum” optyczny. 

Emisja promieniowania spójnego o częstościach 
(o x i a> 2 może zachodzić jedynie wtedy, gdy moc wiązki 
pompującej przekroczy wartość progową (zależną 
przede wszystkim od dobroci rezonatora dla częstości 
sygnałowych). W typowych układach parametrycz¬ 
nych gęstość progowa mocy jest rzędu 1 MW/cm**, 
a więc można ją łatwo osiągnąć używając laserów im¬ 
pulsowych. 

Przy ustalonej częstości o> P promieniowania pompu¬ 
jącego, częstości fal sygnałowych co x i a> 2 — wzmacnia¬ 
ne bądź wytwarzane w układzie parametrycznym 
mogą być zasadniczo dowolne. Oczywiście muszą one 
spełniać podane wcześniej warunki synchronizacji 

czasowej (<op = co^co^) i przestrzennej (k p = k^k^), 
Teri 1 ostatni warunek dopasowania przy ustalonych 
częstościach a> P , a> x i co 2 spełniony jest w krysztale ani¬ 
zotropowym tylko w ściśle określonym kierunku. 
Oznacza to, że orientację kryształu można wykorzy¬ 
stać do przestrajania generatora parametrycznego, 
przestrajanie Widać to znakomicie, jeśli warunek dopasowania fa- 
generatora zowego jest zapisany w postaci zależności między 
parametrycz- współczynnikami załamania dla odpowiednich czę- 
nego stości w kierunku tworzącym kąt S z osią optyczną 
przez obrót kryształu: n P (6) — Va [»i(0)"t"*2(0)]- w praktyce, 
kryształu przy zadanej częstości pompującej oj p , wybór kąta 0 
determinuje częstości <o x i a> 2 . Na przykład generator 
parametryczny (rys. 12) zbudowany na monokrysztale 


niobianu litu i pompowany promieniowaniem o dłu¬ 
gości fali 528 nm (druga harmoniczna promieniowania 
lasera neodymowego) można przestrajać od ok. 680 
do 2350 nm przez niewielki obrót kryształu nielinio¬ 
wego. Przy optymalnym wyborze struktury czasowo- 
-przestrzennej wiązki promieniowania pompującego 
oraz przy dużej dobroci rezonatora, moc wiązek emi¬ 
towanych przez optyczne układy parametryczne wy¬ 
nosi ok. kilkuset kW. 



Rys. 12. Układ do przestrajania i charakterystyka generatora 
parametrycznego pracującego na krysztale, niobianu litu. Prze¬ 
strajanie można zrealizować przez obrót nieliniowego kryształu 
umieszczonego w rezonatorze optycznym o dużej dobroci dla 
częstoci i co 2 

W innej metodzie przestrajania generatora parame- przestrajame 
trycznego wykorzystuje się temperaturową zależność przez zmianę 
współczynnika załamania kryształu. Wynikiem zmia- temperatury 
ny temperatury jest przesuwanie się położenia kierun¬ 
ku dopasowania dla danej pary częstości sygnałowych. 

Innymi słowy, zmiany temperatury nieruchomego 
kryształu powodują, że warunek dopasowania w usta¬ 
lonym kierunku krystalograficznym spełniają coraz to 
inne pary częstości co x i co*. W generatorze parame¬ 
trycznym pracującym na krysztale niobianu litu i pom¬ 
powanym promieniowaniem o długości fali 528 nm 
uzyskuje się — przy zmianie temperatury kryształu 
od 50°C do 60°C — przestrajanie generatora w zakre¬ 
sie od ok. 970 nm do ok. 1150 nm. 

Generator parametryczny można również płynnie elektro - 
przestrajać, wykorzystując zależność współczynnika optyczna 
załamania kryształu od natężenia stałego pola elek- metoda _ ^ 

trycznego (metoda elektrooptyczna). Zależność ta jest przestrajania 
szczególnie duża w pobliżu ferroelektrycznego przej¬ 
ścia fazowego i dlatego w temperaturze zbliżonej do 
temperatury przejścia uzyskuje się tą metodą naj¬ 
większe przestrajanie częstości. 

Generatory parametryczne emitujące promieniowa¬ 
nie spójne można przestrajać w bardzo szerokim za¬ 
kresie widmowym od dalekiej podczerwieni (powyżej 
25 jim) do fioletu (ok. 300 nm). Krótkofalową granicę 
można oczywiście obniżyć, powielając częstość fali 
świetlnej wytwarzanej przez układ parametryczny. 

Tak więc, generatory parametryczne mogą być stoso¬ 
wane jako źródła spójnego promieniowania świetlne¬ 
go o częstości, którą można dokładnie dostosować do 
potrzeb doświadczenia. Ma to szczególne znaczenie 
w badaniach optycznych zjawisk rezonansowych. 

Samoogniskowamie 
i autokorelacja 

Omawiając nieliniowe oddziaływanie światła z ma¬ 
terią, w którego wyniku następuje zmiana częstości 
promieniowania, zakładaliśmy milcząco, że mamy do 
czynienia z falami płaskimi, przestrzennie nieograni¬ 
czonymi. Założenie to przestaje być jednak słuszne, 
gdy wiązka świetlna o ograniczonej średnicy rozcho¬ 
dzi się w ośrodku nieliniowym. W takim wypadku na¬ 
tężenie pola elektrycznego fali świetlnej zmienia się 
w płaszczyźnie prostopadłej do kierunku rozchodzenia 
się, a płaszczyzna ta przestaje być powierzchnią stałej 
fazy. 


24 - Encyklopedia fizyki współczesnej 
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Ponieważ wartość współczynnika załamania n(E) 
ośrodka nieliniowego zależy od natężenia pola elek¬ 
trycznego fali świetlnej: n(B) = n 0 +n 2 E 2 +... f zatem 



Rys. 13. Samoogniskowanie i autokoJimacja silnej wiązki świetl¬ 
nej w ośrodku nieliniowym. Widać stopniową deformację po¬ 
wierzchni fazowych w ośrodku 

wiązka intensywnego światła rozchodzi się w obsza¬ 
rze o zmienionym współczynniku załamania, więk¬ 
szym od współczynnika n 0 mierzonego dla światła 
o niewielkim natężeniu. Ośrodek nieliniowy działa 
więc podobnie do soczewki skupiającej, koncentrując 
strumień energii świetlnej w pobliżu osi wiązki. Ilu¬ 
struje to rys. 13, na którym schematycznie przedsta¬ 
wiono ten mechanizm ogniskowania światła. 

Wobec tego, że promień odchyla się w kierunku 
ośrodka o większym współczynniku załamania, obser¬ 
wuje się dodatkowy wzrost natężenia pola elektryczne¬ 
go wzdłuż osi wiązki, a co za tym idzie — wzrost 
samo- współczynnika załamania. W związku z tym zjawisko 
ogniskowa- ogniskowania samo się potęguje, przyjęto więc okre- 
nie ślaćje jako samoogniskowanie światła. 

Geometryczna analogia między ogniskowaniem 
światła za pomocą soczewki i samoogniskowaniem 
w ośrodku nieliniowym kończy się po skupieniu wiąz¬ 
ki. Za ogniskiem soczewki skupiającej wiązka świetlna 
staje się rozbieżna, podczas gdy światło, które uległo 
samoogniskowaniu rozchodzi się dalej w postaci 
bardzo cienkiej, skolimowanej nici. Zjawisko takie, 
auto- zwane autokolimacją, może wystąpić w ośrodku nieli- 
kolimacja niowym przy dostatecznie dużych mocach wiązki 
świetlnej. Elementarną analizę zjawiska autokolima- 
cji światła można przeprowadzić, korzystając z praw 
optyki geometrycznej oraz wspomnianej wyżej zależ¬ 
ności nieliniowej współczynnika załamania od natęże¬ 
nia pola elektrycznego fali świetlnej. Wiązka świetlna. 
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Rys. 14. Przechodzenie wiązki laserowej przez ośrodek liniowy 
i nieliniowy 


nawet idealnie skolimowana, po przejściu przez prze¬ 
słonę wykazuje słabą rozbieżność spowodowaną ugię¬ 
ciem. Tak więc, światło za przesłoną (rys. 14) wypełnia 
stożek o rozwartości Od. Rozbieżność dyfrakcyjna 
da jest bardzo mała, czyli stożek świetlny praktycznie 
nie różni się od walca. Promienie padające od strony 
ośrodka optycznie gęstszego, przechodząc do optycz¬ 
nie rzadszego, mogą — przy dostatecznie dużych ką¬ 
tach padania — ulegać całkowitemu wewnętrznemu 
odbiciu (rys. 15). Jeśli rozbieżność dyfrakcyjna Od jest 
większa od kąta krytycznego 0 O , to promienie wycho¬ 
dzą z wiązki, natomiast promienie o rozbieżności 
mniejszej od kąta krytycznego wracają do środka 
wiązki. Porównując rozbieżność dyfrakcyjną Oa z war¬ 
tością kąta 0 O , można ocenić wpływ nieliniowej re¬ 
frakcji i dyfrakcji na rozchodzenie się wiązki świetlnej 
w ośrodku. Jeśli Od > 0 O > to wiązka jest rozbieżna 
(rys. 14b), przy tym rozwartość jej stożka świetlnego 
jest mniejsza niż w ośrodku liniowym (rys. 14a). Jeśli 
Od = 0 O , to nieliniowa refrakcja kompensuje dyfrak¬ 
cję; wiązka rozchodzi się jakby w optycznym, cylin¬ 
drycznym falowodzie utworzonym przez siebie (rys. 
14c). To zjawisko nazwano autokolimacją światła, 
a warunek Od = 0o wykorzystano do określenia kry- 



Rys. 15. Powstawanie kanału autokolimacyjnego w nieliniowym 
ośrodku. W obszarze rozchodzenia się wiązki świetlnej współ¬ 
czynnik załamania wzrasta do wartości n(E) = n+n^E 1 (kąt 
krytyczny 6 0 jest kątem dopełniającym do kąta całkowitego we¬ 
wnętrznego odbicia) 


tycznej mocy wiązki laserowej niezbędnej do jego wy- warunek 
wołania. Okazuje się, że moc ta — w wypadku auto- 
powszechnie używanych rozpuszczalników organicz- kolimacji 
nych — nie jest zbyt wysoka i wynosi od kilkunastu 
do kilkudziesięciu kilowatów. Sytuacja przedstawiona 
na rys. 14d występuje, gdy Od < 0 O oraz gdy moc 
wiązki przewyższa moc krytyczną. Promieniowanie 
załamuje się w kierunku osi wiązki, powodując naj¬ 
pierw samoogniskowanie światła, a po osiągnięciu 
dostatecznie małej średnicy wiązki rozpoczyna się 
autokolimacja. Trzeba podkreślić, że skolimowana 
w ten sposób wiązka ma średnicę ok. 50 pm i nie jest 
jednorodna. Składa się ona bowiem z wielu bardzo 
cienkich nici świetlnych. Energia świetlna zawarta w 
takiej nici może zostać po pewnym czasie zużyta na 
zjonizowanie molekuł ośrodka, w którym zjawisko 
autokolimacji zachodzi. Nić więc przestaje istnieć, 
a na jej miejsce może się pojawić nowa. 

Z makroskopowego punktu widzenia samoogni- molekularny 
skowanie i autokolimacja są możliwe dzięki wzrostowi mechanizm 
współczynnika załamania światła ośrodka nieliniowe- auto- 
go pod wpływem pola elektrycznego fali świetlnej, kolimacji 
Zastanówmy się, jaki jest molekularny mechanizm po¬ 
wodujący wzrost tego współczynnika. Trzeba sobie 
zdać sprawę, że podstawowy mechanizm będący pod¬ 
stawą omawianych zjawisk musi być niezwykle szyb¬ 
ki, jego czas relaksacji powinien być rzędu najwyżej 
10 -12 s. Wynika to z doświadczenia — stwierdzono 
bowiem, że pikosekundowe impulsy świetlne, a więc 
impulsy o czasie trwania ok. 10~ 12 s, wy wołu ją również 
samoogniskowanie i autokolimację światła. Ponieważ 
omawiane zjawiska zachodzą zarówno w cieczach jak 
i ciałach stałych, podstawowy mechanizm winien się 
stosować do obydwu stanów skupienia. 

Stwierdzono, że zasadniczą przyczyną samoogni- 
skowania i autokolimacji światła jest wzrost polary- 
zowalności molekuł ośrodka nieliniowego w polu 
elektrycznym fali świetlnej. Oprócz tego podstawowe- 
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go mechanizmu pewną rolę odgrywają również inne 
procesy molekularne, a wśród nich reorientacja mo¬ 
lekuł w polu fali świetlnej i ich hiperpolaryzowalność. 


Wymuszone rozpraszanie światła 

Od ponad stu lat wiadomo, że światło przechodząc 
przez ośrodki mętne, czyli niejednorodne optycznie, 
ulega bardzo silnemu rozpraszaniu. Z dokładnych ob¬ 
serwacji wynika, że również ośrodki przezroczyste, 
makroskopowo jednorodne, mogą rozpraszać światło. 
Rozpraszanie zachodzi wówczas np. na statystycz¬ 
nych fluktuacjach gęstości. Światło rozproszone przez 
układ atomów lub molekuł nie pochłaniających zacho¬ 
wuje niezmienioną długość fali, a zjawisko nazywa 
rozpraszanie się rozpraszaniem Rayleigha. Oprócz takiego elastycz- 
HaySeigha nego rozpraszania występuje często nieelastyczne roz¬ 
praszanie światła, czyli zachodzące ze zmianą dłu¬ 
gości fali. W świetle rozproszonym, oprócz częstości 
podstawowej a>, obserwuje się wtedy częstości o>-f nQ 
zw. częstościami antystokesowskimi i częstości <o—nQ 
zwane stokesowskimi, przy czym O jest równe częs¬ 
tości drgań oscylacyjnych lub rotacyjnych molekuł 
rozpraszających. Wiązka światła rozproszonego w 
układzie molekularnym niesie więc informacje o tym 
układzie. Takie nieelastyczne rozpraszanie światła 
rozpraszanie nazywamy rozpraszaniem Ramana (-> Spektroskopia 
Ramana molekularna). Trzeba podkreślić, że zarówno rozpra¬ 
szanie Ramana jak i Rayleigha są zjawiskami spon¬ 
tanicznymi, a więc rozproszone promieniowanie jest 
niespójne, a samo zjawisko nie ma progu energe¬ 
tycznego. 

Sytuacja ulagła radykalnej zmianie po zastosowaniu 
spójnego promieniowania laserowego w badaniach 
rozpraszania światła. Uproszczony układ doświad¬ 
czalny umożliwiający takie badania przedstawia sche¬ 
matycznie rys. 16. W rezonatorze laserowym, utwo¬ 
rzonym przez selektywne zwierciadła dielektryczne, 
oprócz kryształu aktywnego i komórki modulującej 
dobroć rezonatora jest umieszczone naczynie wypeł- 

zwierciadło 
selektywne 


kryształ 


Rys. 16. Schemat układu służącego do badania rozpraszania 
światła laserowego 

nione cieczą, w której zachodzi zjawisko Ramana. 
Natężenie pola elektrycznego fali świetlnej w rezona¬ 
torze takiego lasera osiąga wartości rzędu 10M0 10 
V/m, a więc zbliżone do natężeń pól wewnątrzato- 
mowych. W tak silnych polach ujawnia się już wpływ 
ruchu elektronów na drgania całych molekuł. 

Pojawienie się w rezonatorze laserowym promienio¬ 
wania rozproszonego o częstościach coas i będą¬ 
cego wynikiem spontanicznego rozpraszania Ramana, 
wpływa decydująco na przebieg zjawisk w rezonato¬ 
rze. Promieniowanie to staje się bowiem czynnikiem 
wymuszającym dalszą emisję promieniowania rozpro¬ 
szonego. Fazy drgań poszczególnych molekuł roz¬ 
praszających światło stają się jednakowe, a promie¬ 
niowanie rozproszone na tak drgających molekułach 
jest promieniowaniem spójnym. Oznacza to, że spon¬ 
taniczne, niespójne początkowo, rozpraszanie staje 
się rozpraszaniem spójnym. Tak przebiegające zjawi- 
wymuszone sko nazywa się wymuszonym rozpraszaniem Rama- 
rozpraszartie na. Warunkiem wymuszonego rozpraszania światła 
Ramana jest duża dobroć optyczna rezonatora, w którym to 
rozpraszanie zachodzi. Obecność zwierciadeł dielek¬ 
trycznych w układzie doświadczalnym przedstawio¬ 
nym na rys. 16 zapewnia spełnienie tego warunku. 
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Prawa rządzące rozpraszaniem światła wynikają 
z rozważań nad zależnością polaryzacji ośrodka od 
natężenia E pola elektrycznego fali świetlnej. Jeśli 
wziąć pod uwagę ośrodek złożony z molekuł polaryzo¬ 
wanych, tzn. takich, w których rozkład ładunku 
elektrycznego zależy od natężenia zewnętrznego pola 
elektrycznego, to w polach o natężeniach rzędu 
10®—10 10 V/m polaryzację opisują trzy wyrazy zależne 
od natężenia pola E. Dwa z nich są liniowymi funk¬ 
cjami E i, jak można wykazać, opisują rozpraszanie 
Rayleigha i Ramana, trzeci natomiast jest członem 
nieliniowym, zależnym od trzeciej potęgi pola E. 
Człon ten opisuje zjawisko wymuszonego rozprasza¬ 
nia Ramana. Faza nieliniowej składowej polaryzacji 
jest określona jednoznacznie przez pole fali laserowej. 
Ponieważ spójne pole fali świetlnej emitowanej przez 
laser działa na wszystkie molekuły, to i fazy drgań ich 
momentów dipolowych, a co za tym idzie i polaryza¬ 
cji, będą równe fazie promieniowania laserowego. 




Rys. 17. Próg wymuszonego rozpraszania ramanowskiego: 
a) energetyczny, b) optyczny. Natężenie promieniowania sto- 
kesowskiego /(co*) rośnie wykładniczo wraz ze wzrostem natę¬ 
żenia promieniowania padającego /(co). Wykładniczy charakter 
ma również zależność /(co,) od długości kuwety / (do pewnej 
długości maksymalnej) 


Wymuszone rozpraszanie Ramana różni się pod różnice mię- 
wieloma względami od zwykłego, spontanicznego roz- dzy wymu- 
praszania światła. Powyżej progu zjawiska natężenie szonym i 
wymuszonego promieniowania rozproszonego I(a) S ) spontanicz- 
rośnie bardzo szybko (wykładniczo) ze wzrostem na- nym rozpra- 
tężenia światła padającego /(co) (rys. 17a). Obecność szaniem 
progu energetycznego i odmienny przebieg zjawiska Ramana 
po jego przekroczeniu są charakterystyczne dla efek¬ 
tów wymuszonych. Należy podkreślić, że próg wymu¬ 
szonego rozpraszania Ramana jest często zniekształ¬ 
cony innym progowym zjawiskiem nieliniowym, 
a mianowicie samoogniskowaniem światła. Istnieje 
również progowa wartość drogi optycznej promienio¬ 
wania (rys. 17b) niezbędna do wystąpienia wymuszo¬ 
nego rozpraszania światła. Stopień spójności wymu¬ 
szonego promieniowania ramanowskiego zbliżony 
jest do stopnia spójności promieniowania laserowego 
rozpraszanego na badanym układzie molekularnym. 

O spójności promieniowania rozproszonego świadczą 
nie tylko odpowiednie doświadczenia interferencyjne, 
ale również charakterystyczne dla emisji wymuszonej 
zwężenie linii widmowych. Szerokości linii stokesow- 
skich w spontanicznym zjawisku Ramana wynoszą 
ok. 10 cm -1 , podczas gdy w zjawisku wymuszonym 
ulegają one zwężeniu do ok. 0,5 cm -1 ; jeszcze węższe 
są linie antystokesowskie, których szerokość widmo¬ 
wa wynosi ok. 0,05 cm’ 1 - 

W spontanicznym rozpraszaniu Ramana obserwuje 
się głównie przejścia, dla których oscylacyjna liczba 
kwantowa v zmienia się o jedność, tzn. Av — ±1; 
mało prawdopodobne są natomiast przejścia z więk¬ 
szą zmianą liczby kwantowej. Dlatego też natężenie 
spontanicznego promieniowania rozproszonego silnie 
maleje ze wzrostem Av. Ze względu na anharmo- 
niczność drgań molekularnych poziomy oscylacyjne 
nie są równoległe (rys. 18a), a pasma ramanowskie 
odpowiadające Av ^ 1 mają częstości różniące się od 
dokładnych wiartości nadtonów (rys. 18b). W zjawisku 
wymuszonym natomiast natężenia linii stokesowskich, 
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dla których Av > 1, mogą być bardzo duże i niekiedy 
mogą osiągać wartości zbliżone do natężenia światła 




Rys. 18. Schemat poziomów energetycznych oscylatora anhar- 
monicznego (a) oraz odpowiadające mu widma rozpraszania 
Ramana spontanicznego (b) i wymuszonego (c) 


stokesowskie występuje również w najniższych tempe¬ 
raturach, a jego natężenie rośnie niekiedy w miarę 
oziębiania układu molekularnego. Sugeruje to, że wy¬ 
muszone promieniowanie antystokesowskie związane 
jest z molekułami w podstawowym stanie energetycz¬ 
nym, a nie w stanie wzbudzonym. W przeciwień¬ 
stwie do zjawiska spontanicznego, położenia pasm 
wymuszonego rozpraszania Ramana odpowiadają 
dokładnym wartościom częstości harmonicznych 
(rys. 18c). 

Bardzo istotna różnica w obydwu zjawiskach Ra- 
rozkład <ąto- mana ujawnia się w rozkładzie kątowym promienio¬ 
wy promie- wania rozproszonego. W zjawisku spontanicznym 
niowania roz- natężenie promieniowania rozproszonego jest funkcją 
proszonego ciągłą, słabo zależną od kąta obserwacji. W zjawisku 
wymuszonym natężenie składowej stokesowskiej jest 
również funkcją ciągłą kąta obserwacji, ale silnie za¬ 
leżną od geometrii układu doświadczalnego, a prze¬ 
ważająca część promieniowania jest emitowana w kie¬ 
runku osi wiązki laserowej w stożku o niewielkiej 
rozwartości. Składowa antystokesowska zaś rozchodzi 
się jedynie w dokładnie określonym kierunku tworzą¬ 
cym kąt 0 as z osią wiązki laserowej. Pojawieniu się 
składowej antystokesowskiej towarzyszy spadek na¬ 
tężenia składowej stokesowskiej emitowanej pod ką¬ 
tem Os związanym z 0 as prostą relacją trygonome¬ 
tryczną wynikającą z rys. 19. 


I stopień 




Rys. 19. Wymuszone rozpraszanie Ramana jako proces cztero- 
fotonowy. Górna część ilustruje dwustopniowy charakter roz- , 
praszania 


proces Zjawisko wymuszonego rozpraszania Ramana jest 
czlerofoto- procesem czterofotonowym, w którym na miejsce 
sio wy dwóch fotonów światła laserowego pojawiają się dwa 
nowe fotony: stokesowski i antystokesowski. To, że 
charakterystyki kątowe promieniowania rozproszo¬ 
nego o częstościach co s i <u as istotnie różne, sugeruje 
odmienny mechanizm powstawania tych dwóch pasm. 
Przyjęto więc hipotezę, że rozpraszanie wymuszone 
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jest procesem dwustopniowym. Pierwszy stopień to 
przemiana jednego z fotonów laserowych opisywa¬ 
nych wektorem falowym k w foton stokesowski opi¬ 
sywany wektorem k s . Częstość promieniowania la¬ 
serowego jest większa od częstości stokesowskiej 
i dlatego nie całą energię tego promieniowania odnaj¬ 
dziemy w promieniowaniu rozproszonym. Różnica 
energii zostaje przekazana sieci jako energia fononu, 

któremu przypisujemy wektor falowy k v (-> Dynami¬ 
ka sieci krystalicznej). Energia ta wydziela się w końcu 
w postaci ciepła. Pierwszy proces nie nakłada żadnych 
ograniczeń na kierunek emisji fotonu stokesowskiego, 
a więc prowadzi on do emisji dowolnie skierowanych 
fotonów stokesowskich i odpowiadających im fono¬ 
nów. Drugi stopień to wytwarzanie fotonu antysto- 
kesowskiego z drugiego fotonu laserowego oraz od¬ 
powiedniego fononu. Proces ten przebiega zgodnie 
z zasadą zachowania pędu, którą można zapisać w po¬ 
staci równania wektorowego k+k p = k*s. 

Z powyższego wywodu widać, że emisja fotonu obserwacja 
antystokesowskiego może zachodzić jedynie pod ką- składowej 
tern 0as, wynikającym z powyższej zależności wekto- antystoke- 
rowej. Promieniowanie antystokesowskie, rozproszo- sowskiej 
ne pod kątem 0 as względem osi wiązki laserowej, nie 
może się pojawić w układzie przedstawionym na rys. 

16 ze względu na obecność zwierciadeł eliminujących 

ekran 



Rys. 20. Schemat układu doświadczalnego umożliwiającego 
obserwację składowej antystokesowskiej wymuszonego rozpra¬ 
szania Ramana 


fotony nieosiowe. Aby więc zaobserwować składowe 
antystokesowskie, trzeba komórkę z cieczą umieścić 
poza rezonatorem laserowym w nierównoległej wiązce 
świetlnej. Prosty układ doświadczalny umożliwiający 
takie badania przedstawia rys. 20. (Promieniowanie 
jest rozpraszane wzdłuż pobocznie stożków, których 
osiowe przekroje zaznaczono na rysunku.) Kolejnym 
składowym antystokesowskim cu as = co-f -nQ odpo¬ 
wiadają stożki o coraz to większej rozwartości. Tak 
więc na ekranie ustawionym prostopadle do osi ukła¬ 
du doświadczalnego obserwuje się współosiowe barw¬ 
ne pierścienie odpowiadające poszczególnym wiązkom 
światła rozproszonego (il. 2, tabl. 1). Wynikiem roz¬ 
praszania światła w innych ośrodkach są podobne 
obrazy współśrodkowych barwnych pierścieni o prze¬ 
sunięciach częstości charakteryzujących rozpraszający 
ośrodek. 

W wymuszonym rozpraszaniu Ramana występują 
zarówno charakterystyczne cechy zwyczajnego roz¬ 
praszania Ramana jak również i cechy promieniowa¬ 
nia spójnego, emitowanego przez lasery. Emisja wy¬ 
muszona w generatorach kwantowych możliwa jest 
dzięki inwersji obsadzeń odpowiednich poziomów 
energetycznych. W przypadku wymuszonego rozpra¬ 
szania światła spójne wzmacnianie pola o częstości 
stokesowskiej co$ zachodzi kosztem osłabienia pola 
pompującego. Układ umożliwiający takie wzmacnia¬ 
nie promieniowania nie wymaga więc wystąpienia in¬ 
wersji obsadzeń poziomów energetycznych; jest to za¬ 
sadnicza różnica między laserem a laserem ramanow- laser 
skim. Laser ramanowski jest przykładem praktyczne- ^amanowski 
go zastosowania zjawiska wymuszonego rozpraszania 
światła. Jego znaczenie polega przede wszystkim na 
tym, że częstość promieniowania emitowanego przez 
urządzenie można zmienić łatwo i w szerokich grani¬ 
cach przez dobór właściwej cieczy rozpraszającej. Wy¬ 
muszone rozpraszanie Ramana znalazło zastosowanie 

































w laboratoriach fizykochemicznych jako narzędzie 
badań oddziaływań wewnątrz- i międzymolekular- 
nych, czyli jako metoda spektroskopowa znacznie 
czulsza od stosowanej szeroko klasycznej spektro¬ 
skopii ramanowskiej. 


Rozpraszanie światła na fali 
akustycznej 


Wymuszone rozpraszanie Ramana jest wynikiem od¬ 
działywania fal elektromagnetycznych z poszczegól¬ 
nymi molekułami ośrodka. Innymi słowy, rozprasza¬ 
nie Ramana odzwierciedla własności pojedynczych 
molekuł. Jeśli molekuły ośrodka rozpraszającego 
światło są uporządkowane i tworzą sieć krystaliczną, 
to padające promieniowanie świetlne oddziałuje nie 
tylko z poszczególnymi molekułami, ale może wzbu¬ 
dzić drgania tejże sieci, czyli falę akustyczną. Częstość 
tzw. gałęzi optycznej drgań sieci jest równa różnicy 
częstości światła wzbudzającego i rozpraszanego, 
rozpraszanie Rozpraszanie światła na fali akustycznej (ultra- 
Brillouina dźwiękowej) rozchodzącej się w ośrodku skondenso¬ 
wanym nazywa się rozpraszaniem Brillouina. Zjawi¬ 
sko staje się efektem wymuszonym, jeśli fala aku¬ 
styczna, na której rozprasza się światło, wzbudzona 
jest przez to samo promieniowanie. 

Zastanówmy się, jaki jest fizyczny mechanizm roz¬ 
praszania światła na fali akustycznej. Rozchodzenie 
się fali ultradźwiękowej o częstości w p w ośrodku moż¬ 
na sobie wyobrazić jako rozprzestrzenianie się zagęsz¬ 
czeń i rozrzedzeń tego ośrodka z prędkością v p . Od¬ 
powiada to periodycznym zmianom przenikalności 
elektrycznej i współczynnika załamania światła. Zmia¬ 
ny współczynnika załamania powodują częściowo od¬ 
bicie padającej wiązki o częstości w 2 (wektor falowy 

k 2 ) w kierunku k 1 (rys. 21). Tak więc fala akustyczna 



fala 





fala akustyczna 

Rys. 21. Odbicie światła o częstości na periodycznych zagęsz¬ 
czeniach i rozrzedzeniach ośrodka spowodowanych propagacją 
fali akustycznej o częstości o> P 

rozchodząca się w ośrodku działa podobnie do siatki 
dyfrakcyjnej o stałej ). p równej długości fali ultra¬ 
dźwiękowej. Istotna różnica między tymi dwoma ele¬ 
mentami rozpraszającymi polega na tym, że „siatka 
akustyczna” przemieszcza się. Oznacza to, że promień 
odbity doznaje dopplerowskiego przesunięcia często¬ 
ści prowadzącego w tym wypadku do obniżenia czę¬ 
stości fali odbitej (cuj. < <o 2 ). Okazuje się, że różnica 
częstości promieniowania padającego i odbitego jest 
równa częstości fali akustycznej (a> 2 —u) X =o> p ). Fala 
świetlna oddziałując z falą mechaniczną (akustyczną) 
przekazuje jej energię za pośrednictwem efektu elek- 
trostrykcyjnego. Obecność w ośrodku fali o częstości 
a >2 może doprowadzić więc do wzmocnienia fal w x i co P . 
Jeśli to wzmocnienie wystarcza na skompensowanie 
strat i jeśli w układzie występuje dodatnie sprzężenie 
zwrotne, to wzbudzają się drgania elektromagnetycz¬ 


ne o częstości co x i akustyczne o częstości co p . Taka ge- wymuszone 
neracja fal co x i a> p nazywa się wymuszonym rozpra- rozpraszanie 
szaniem Brillouina. Brillouina 

Rozchodząca się w ośrodku nieliniowym fala ultra¬ 
dźwiękowa ma bardzo dużą częstość, zazwyczaj w gra¬ 
nicach 10®—10 10 sr 1 . Zważywszy, że prędkość jej roz¬ 
chodzenia się w ośrodku skondensowanym jest rzędu 
10 3 m/s, oznacza to, że jej długość wynosi ok. 10~ 6 m. 

Jest to więc wielkość o trzy rzędy wielkości większa 
od typowych odległości międzyatomowych. Trzeba 
podkreślić, że częstość fali ultradźwiękowej jest jednak 
dużo mniejsza od częstości fal świetlnych (o x i eo 2 wyno¬ 
szących w typowych doświadczeniach z laserem rubi¬ 
nowym ok. 5 -10— 14 s~ l . 

Rozpraszanie Brillouina można opisać kwantowo 
jako pojawienie się fotonu o częstości co x i fononu 
o częstości aj P zamiast fotonu o częstości a> 2 . W opisie 
korpuskularnym równanie a> 2 —co x = co p wyraża za¬ 
sadę zachowania energii, a obowiązująca równocześ¬ 


nie zasada zachowania pędu wymaga, by k 2 = k x +k v . 
Ten warunek wektorowy mówi, że emisja tak fali 
akustycznej, jak i optycznej rozproszonej zachodzi 
w ściśle określonych kierunkach. Ponieważ prędkość 
propagacji fali akustycznej v p jest znacznie mniejsza 

od prędkości rozchodzenia się światła, wektory k 2 i k x 
mają bardzo zbliżone długości, a częstość w 2 bardzo 
nieznacznie różni się od co x . W doświadczeniu rozpra¬ 
szanie Brillouina objawia się jako nadsubtelna struk¬ 
tura rozpraszania Rayleigha. Obserwowane doświad¬ 
czalnie przesunięcia częstości dla w’ielu cieczy, jak np. 
anilina, benzen, toluen i woda, są rzędu 10“ 1 cm -1 , 
a dla kryształów są jeszcze mniejsze. Natomiast pas¬ 
ma w widmie ramanowskim doznają zmian częstości 
rzędu kilkuset cm -1 . Rozpraszanie Brillouina trzeba 
więc badać bardzo precyzyjnymi metodami — stosuje 
się np. spektrograf z interferometrem Fabry’ego-Pe- 
rota. 

Schemat aparatury umożliwiającej rejestrację wy¬ 
muszonego rozpraszania Brillouina przedstawia rys. 
22. Wiązka spójnego światła laserowego dużej mocy 
jest ogniskowana w badanej próbce. Promieniowanie 
rozproszone w kierunku wstecznym kieruje się do in¬ 
terferometru Fabry’ego-Perota za pomocą zwierciadła 
półprzepuszczalnego ustawionego w wiązce pod ką¬ 
tem 45°. Obraz pierścieni interferencyjnych otrzymuje 
się na płycie fotograficznej ustawionej za długoogni¬ 
skową soczewką. Okazuje się, że po przekroczeniu 
progowej wartości mocy wiązki laserowej na inter- 
ferogramie pojawiają się dodatkowe pierścienie odpo¬ 
wiadające promieniowaniu rozproszonemu ze zmie¬ 
nioną częstością. Są one przesunięte w stosunku do 
pierścieni interferencyjnych odpowiadających wiązce 


obserwaoja 
wymuszone¬ 
go rozpra¬ 
szania 
Brillouina 


zwierciadło 



Rys. 22. Schemat aparatury interferometrycznej do rejestracji 
wymuszonego rozpraszania Brillouina 
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laserowej o dziesiąte części cm" 1 w skali liczb falo¬ 
wych. 

Progowa gęstość mocy promieniowania laserowe¬ 
go niezbędna do wystąpienia wymuszonego rozpra¬ 
szania Brillouina zależy przede wszystkim od własno¬ 
ści sprężystych ośrodka rozpraszającego. W ciałach 
stałych typowa wartość progowej gęstości mocy świa¬ 
tła wynosi ok. 10 11 W/m 2 . Taki poziom mocy zapew¬ 
niają lasery pracujące z modulacją dobroci rezonato¬ 
ra, czyli wytwarzające impulsy „gigantyczne”. W cie¬ 
czach, dzięki występującemu w nich zjawisku samo- 
ogniskowania światła, gęstość mocy w kanale auto¬ 
kolimacyjnym znacznie przewyższa progową wartość 
mocy wymaganą, by wystąpiło wymuszone rozprasza¬ 
nie Brillouina. Dlatego też doświadczalnie wyznaczo¬ 
ny próg rozpraszania Brillouina pokrywa się z pro¬ 
giem samoogniskowania. 

Naszkicowany mechanizm wymuszonego rozpra¬ 
szania Brillouina prowadzi do prostego związku mię¬ 
dzy względnym przesunięciem linii widmowych 
(cni—kątem rozproszenia i prędkością fali ultra¬ 
dźwiękowej generowanej w ośrodku rozpraszającym 
światło. Prędkość dźwięku, wyznaczona z pomiarów 
rozpraszania Brillouina, pozostaje w znakomitej 
zgodności z wartością wyznaczoną metodami bezpo¬ 
średnimi. Jest to dodatkowym argumentem przema¬ 
wiającym za słusznością modelu Brillouina. 

Z analizy warunków wzmocnienia fali akustycznej 
w ośrodku rozpraszającym światło wynika, że w nie¬ 


których układach molekularnych, przy dostatecznie zwierciadło 
dużej mocy padającej wiązki świetlnej o częstości eo 2f molekularne 
natężenie światła przechodzącego może spaść do zera 
na końcu próbki. Oznacza to, że w wyniku rozprasza¬ 
nia Bruillouina ośrodek działa wówczas jak całkowi¬ 
cie odbijające zwierciadło, przy czym odbite promie¬ 
niowanie ma częstość a> x przesuniętą o eo p względem 
częstości o >2 wiązki padającej. Zdolność odbijająca 
takiego zwierciadła wzrasta wraz ze wzrostem natęże¬ 
nia światła padającego od 0 do 1. Zjawisko to bywa 
niekiedy wykorzystywane w układach modulujących 
dobroć rezonatorów laserowych. 

Optyka nieliniowa jest młodą, dynamicznie się roz¬ 
wijającą i bardzo już obszerną dziedziną optyki fi¬ 
zycznej. W tym krótkim omówieniu mogliśmy zwró¬ 
cić uwagę tylko na niektóre zjawiska związane z wy¬ 
mianą energii między polami promieniowania o róż¬ 
nych częstościach. Dokładniejsze omówienie tych 
pasjonujących problemów można znaleźć w licznych 
monografiach poświęconych elektronice kwantowej 
i optyce nieliniowej. 
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winter, F. Zernike Applied Nonlinear Optics , New York 1973; 

A.H. Piekar a Nowe oblicze optyki , Warszawa 1976; J. Stan- 
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1972; A. Yariv Quantum Electronics , New York 1975. 


Ultrakrótkie impulsy światła 


Adam Kujawski 

Od chwili zbudowania w 1960 r. pierwszego lasera 
nastąpił ogromny rozwój technik laserowych, które 
od tego czasu stale ulegają istotnym przeobrażeniom 
i ulepszeniom. Przykładem tego jest wynalezienie me¬ 
tody wytwarzania ultrakrótkich impulsów światła, 
zbudowanie laserów barwnikowych i innych o łatwo 
zmiennych długościach fali oraz zbudowanie laserów 
o dużej mocy. Omówimy tutaj technikę wytwarzania 
bardzo krótkich impulsów światła oraz sposoby po¬ 
miarów czasów ich trwania. Wspomnimy też o waż¬ 
niejszych realizowanych obecnie zastosowaniach jak 
i o poszukiwaniu zupełnie nowych możliwości zasto¬ 
sowań. 

Czasy trwania impulsów, wytwarzanych przez 
pierwsze lasery rubinowe, były rzędu 10~* s; obecnie 
dobrze opanowana jest technika wytwarzania impul¬ 
sów o czasach trwania rzędu 10~ 12 s. Fakt skrócenia 
czasu o sześć rzędów wielkości świadczy najlepiej 
o postępie w osiąganiu możliwie najkrótszych impul¬ 
sów. Podobnie, gęstość mocy ultrakrótkich impulsów 
obecnie wytwarzanych — mierzona zwykle w W/cm 2 
—jest o wiele rzędów wielkości większa niż pierwszych 
impulsów laserowych. 

Opanowano już metody otrzymywania impulsów, 
które po zogniskowaniu mają gęstość mocy docho¬ 
dzącą do 10 l * W/cm 2 . Warto sobie uświadomić, jaka 
jest długość impulsu pikosekundowego, to znaczy 
impulsu o czasie trwania r = 10~ 12 s. Ponieważ pręd¬ 
kość rozchodzenia się impulsu jest równa prędkości 
światła, którą przyjmujemy c — 3* 10 10 cm/s, to dłu¬ 
gość impulsu l = cr = 0,3 mm. Tak więc impulsy 
pikosekundowe są „pociskami” świetlnymi o bardzo 
dużej gęstości mocy promieniowania elektromagne¬ 
tycznego. Oddziaływanie światła z atomami i czą¬ 
steczkami ośrodka, na który pada tego rodzaju „po¬ 
cisk” świetlny różni się pod wieloma względami 
istotnie od oddziaływania wiązki świetlnej padającej 
w sposób ciągły. Jest ono obecnie przedmiotem inten¬ 
sywnych badań w wielu laboratoriach optycznych. 

Przypomnijmy, że częstości fal świetlnych, a więc 
częstości zakresu widzialnego widma elektromagnę- 
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tycznego są rzędu 10 15 s“ ł . Jeśli fala elektromagne- fala świetlna 
tyczna byłaby falą ściśle monochromatyczną opisaną 
funkcją sinus lub cosinus, to w ustalonym punkcie 
przestrzeni wykres zależności natężenia pola elek¬ 
trycznego od czasu miałby postać taką, jak na rys. 
la. Taka fala trwałaby nieskończenie długo. W rze¬ 
czywistości fale, które wytwarzamy, mają skończony 
czas trwania i nie są ściśle monochromatyczne. Rys. 

Ib ilustruje zależność natężenia pola elektrycznego 
od czasu dla impulsu świetlnego o skończonym czasie 
trwania. W impulsie takim pole zmienia się regular¬ 
nie z częstością z dobrym przybliżeniem równą 






t 


Rys. 1. Zależność wartości natężenia pola elektrycznego od czasu; 
a) nieskończenie długo trwająca sinusoida, b) impuls o strukturze 
regularnej, c) impuls o strukturze nieregularnej 











impulsy częstości fal świetlnych. Jeżeli częstość tę przyjmiemy 
gigantyczne za równą 10 15 s“\ a czas trwania impulsu za 10“ 12 s, 
to łatwo wywnioskujemy, że impuls zawiera 10 3 drgań. 
Na rys. Ib, rzecz jasna, zaznaczono znacznie mniejszą 
liczbę drgań. Należy podkreślić, że nie można do¬ 
kładnie stwierdzić, czy obecnie wytwarzane impulsy 
pikosekundowe mają strukturę regularną, taką jak na 
rys. Ib, czy też drgania są nieuporządkowane i przy¬ 
padkowe, tak jak schematycznie pokazuje to rys. lc. 

Aby zrozumieć zasadę wytwarzania ultrakrótkich 
impulsów, musimy zacząć od krótkiego wyjaśnienia 
zasady działania laserów dających impulsy gigantycz¬ 
ne. Nazwę tę nadano impulsom, których moc była 
o kilka rzędów wielkości większa od mocy promie¬ 
niowania zwykłych laserów. Urządzenia takie powsta¬ 
ły wkrótce po zbudowaniu pierwszego lasera i fakt 
ten stanowił istotny postęp w rozwoju elektroniki 
kwantowej. W laserze, który ma dawać impulsy gi¬ 
gantyczne, akcja laserowa nie może się rozwinąć, 
gdyż ośrodek czynny lasera jest pompowany (-> La¬ 
sery— podstawy działania) przy jednoczesnym po¬ 
psuciu własności rezonatora optycznego. Jest to tak 
zwane przełączanie dobroci („dobroć” — wielkość 
określająca właściwości rezonansowe układu). Po¬ 
psucie własności rezonatora można uzyskać np. przez 
umieszczenie komórki Kerra wewnątrz, między 
zwierciadłami. Najczęściej jest to naczynie z odpo¬ 
wiednią cieczą, którą może być np. bardzo czysty ni¬ 
trobenzen—jego zdolność przepuszczania światła 
zależy od pola elektrycznego zewnętrznego, w którym 
ciecz się znajduje. Gdy komórka nie przepuszcza 
światła, to oczywiście układ dwu zwierciadeł nie mo¬ 
że działać jako rezonator optyczny i ośrodek aktywny 
może być pompowany bez wywoływania akcji lase¬ 
rowej. Gdy energia zgromadzona w ośrodku czyn¬ 
nym jest dostatecznie duża, działanie rezonatora op¬ 
tycznego przez odpowiednie włączenie komórki zo¬ 
staje przywrócone do normalnego stanu i następuje 
szybki rozwój akcji laserowej. Prowadzi to do skró¬ 
cenia impulsu i powiększenia jego mocy. Metoda ta 
w różnych wersjach i ulepszeniach jest szeroko wyko¬ 
rzystywana do uzyskiwania impulsów nanosekundo- 
wych o mocach rzędu kilkudziesięciu megawatów. 


Synchronizacja modów 


częstości 

własne 



Rys. 1 Falc stoją¬ 
ce elektromagne¬ 
tyczne w rezonato¬ 
rze utworzonym 
przez dwa nieskoń¬ 
czone zwierciadła 


Do istotnego skrócenia czasu trwania impulsów i po¬ 
większenia ich mocy przyczyniła się technika zwana 
synchronizacją modów (ang. mode-iocking). Ze 
względu na ważność i oryginalność tej metody omó¬ 
wimy dokładniej jej podstawy fizyczne. Każde z drgań 
własnych pola elektromagnetycznego w rezonatorze 
optycznym odznacza się określoną częstością. Aby 
łatwiej zrozumieć, jakie drgania własne można wy¬ 
twarzać w rezonatorze, rozważmy układ dwóch płas¬ 
kich, równoległych i idealnie odbijających zwierciadeł, 
odległość między którymi wynosi /. Zakładamy, że 
wymiary zwierciadeł są nieskończenie duże. W obsza¬ 
rze między zwierciadłami może istnieć fala stojący 
o takiej długości X m , że na odcinku o długości / mieścić 
się będzie całkowita liczba połowy długości fali X m J 2, 
tzn. rnAm/2 = /, gdzie m — liczba naturalna, tak jak 
schematycznie ilustruje to rys. 2. Ten właśnie związek 
określa drgania własne pola elektromagnetycznego 
w rezonatorze jednowymiarowym płaskim. Powstanie 
fali stojącej można oczywiście interpretować jako wy¬ 
nik interferencji dwu fal płaskich poruszających się 
w kierunkach przeciwnych i odbijających się od zwier¬ 
ciadeł rezonatora. Warto tutaj przypomnieć, że zwią¬ 
zek mXml2 = /jest ogólny i stosuje się również do wielu 
innych drgań własnych jednowymiarowych o zupełnie 
różnej naturze fizycznej, np. do drgań powietrza zam¬ 
kniętego między dwiema ścianami. Ponieważ związek 
między długością fali X i częstością v dla fal elektro¬ 
magnetycznych w próżni ma postać c = Av, więc 


równanie określające częstości drgań własnych przy¬ 
biera postać 

\'m = nic/21. (1) 


Gdy rezonator jest wypełniony ośrodkiem material¬ 
nym o współczynniku załamania n , wówczas c we 
wzorze (1) winno być zastąpione przez cjn. Rezonator rezonator 
płaski nieskończony, który tutaj omawiamy, jest bezstratny 
bezstratny, to znaczy nie występują straty energii fal 
odbijających się od ścian rezonatora. Tego rodzaju 
idealizacja oznacza, że pola elektryczne i magnetyczne 
fali stojącej wytworzonej wewnątrz rezonatora istnieją 
tylko w obszarze między zwierciadłami i energia pola 
nie wydostaje się poza ten obszar. Rezonatory wy¬ 
korzystywane w praktyce mają zwierciadła o wymia¬ 
rach skończonych; przykłady różnych konfiguracji 
pokazuje rys. 3. Rezonatory takie nazywa się rezona¬ 
torami otwartymi. Drgania pola elektromagnetyczne¬ 
go, które można wytwarzać wewnątrz rezonatorów ot¬ 
wartych, są drganiami tłumionymi. Jest to wynikiem 
tego, że energia pola elektromagnetycznego opuszcza 
obszar centralny układu dwu zwierciadeł na skutek 
takich przyczyn, jak dyfrakcja na krawędzi zwiercia¬ 
deł, nieidealnie odbijające powierzchnie itd. O tym, 
jak szybko są tłumione drgania w rezonatorze, decy¬ 
dują: kształt (układ zwierciadeł wklęsłych jest mniej 
stratny) oraz odległość między zwierciadłami. Nie 
omawiamy tutaj zupełnie problemu rozkładu linii sił 
pola elektrycznego i magnetycznego drgań własnych 
rezonatora optycznego. Ścisła teoria pozwala na ich 
wyznaczenie oraz wykazuje, że wzór (1), który uza¬ 
sadniliśmy dla rezonatora nieskończonego, z bardzo 
dobrym przybliżeniem stosuje się do wielu rezonato¬ 
rów otwartych używanych w praktyce. Z każdą 
częstością drgań wyznaczoną przez równanie (1) wią¬ 
że się pewien charakterystyczny rozkład przestrzen¬ 
ny linii sił pola elektromagnetycznego w rezonatorze 
otwartym. Rozkłady te noszą nazwę modów (rodza¬ 
jów) promieniowania. Mody, które tutaj omawia¬ 
liśmy (por. rys. 2) i dla których określiliśmy charakte¬ 
rystyczne częstości własne wzorem (1), nazywają się 
modami podłużnymi. Dotyczą one bowiem drgań 
i rozkładów pola wzdłuż osi rezonatora. Dla innych 
kierunków rozkłady pola i charakterystyczne czę¬ 
stości określone są w bardziej złożony sposób. Oma¬ 
wiamy tutaj jedynie mody podłużne, gdyż dokładne mody 
zrozumienie, czym one są, jest niezbędne do zrozu- podłużne 
mienia zasady wytwarzania impulsów pikosekundo- 
wych. 

Ze wzoru (1) wynika, że częstość modu sąsiedniego 
wynosi Vm +1 = (m + l)c/2l i różnica częstości Av — 

— vm+i — vm dana jest przez 

Av = ci2L (2) 


Rys. 3. Przykłady 
rezonatorów otwar¬ 
tych : a) zwierciadła 
płaskie, b) zwier¬ 
ciadła kuliste, c) 
układ zwierciadło 
kuliste - zwierciadło 
płaskie 


mody pro¬ 
mieniowania 


Ponieważ 2l/c jest czasem przejścia sygnału świetlnego 
wewnątrz rezonatora od jednego zwierciadła do dru¬ 
giego i z powrotem, różnica częstości modów sąsied¬ 
nich równa jest odwrotności tego czasu. Dla rezona¬ 
tora o długości /—lm, przyjmując c = 3 TO 8 m/s, 
otrzymujemy ze wzoru (2) Av = 150 MHz. Ośrodek 
czynny wypełniający rezonator, pobudzany do świe¬ 
cenia przez odpowiednie „pompowanie” optyczne 
(-► Spektroskopia atomowa), wysyła światło, które 
odbija się od zwierciadeł rezonatora, co w wyniku in¬ 
terferencji prowadzi do powstania fali stojącej lub, wzbudzanie 
mówiąc inaczej, drgań własnych o częstościach da- modów 


c 

Q> 



Rys. 4. W zakresie szerokości widmowej 5v linii fluorescencyjnej 
mieści się skończona liczba częstości drgań własnych rezonatora 
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nych wzorem (1). Linia widmowa fluorescencji ośrod¬ 
ka czynnego ma pewną skończoną szerokość <2v, tak 
że wzbudzane są tylko te mody rezonatora, których 
częstości mieszczą się w szerokości linii. Ilustruje to 
rys. 4. Dla rubinu szerokość <5v 2 ; 330 GHz i stąd 
wynika, że w rezonatorze o długości / = 10 cm — 
po uwzględnieniu wartości prędkości światła w ru¬ 
binie — można wzbudzić około 380 modów. Wspom¬ 
nijmy od razu, że dla lasera ze szkła neodymowego 
i dla laserów barwnikowych szerokość linii fluore- 
scencji óv jest znacznie większa niż dla lasera rubino¬ 
wego. Oznacza to, że liczba modów wzbudzanych 
w rezonatorze o takich samych wymiarach jest rów¬ 
nież odpowiednio większa. Ten fakt ma, jak zaraz 
zobaczymy, bardzo ważne znaczenie dla charaktery¬ 
styki światła powstającego w laserze. 

Mody podłużne wzbudzane przez świecenie ośrod¬ 
ka czynnego są w ogólności wzbudzane niezależnie 
od siebie. Oznacza to, że ich fazy drgań nie pozostają 
w żadnei zależności między sobą i w praktyce przyj¬ 
mują wartości przypadkowe. Oznaczmy wartości na¬ 
tężenia pola elektrycznego m -tego modu w jakimś 
określonym punkcie przez E m . Mamy wówczas E m = 
— E 0 m sin (2 j iv m t-+-<p m ), gdzie E 0 m jest amplitudą 
drgań, a <p m — fazą. Zakładając dla uproszczenia, że 
wektory pól elektrycznych wszystkich modów wzbu¬ 
dzanych w rozpatrywanym punkcie są tak samo skie¬ 
rowane, otrzymujemy dla wypadkowego natężenia 
E wyrażenie 

E — ^ E 0 m sin (2k v m t+<łm). (3) 

m 

We wzorze (3) sumowanie rozciąga się po wszystkich 
wartościach m, które odpowiadają częstościom v m 
spełniającym równanie (1) i leżącym w zakresie czę¬ 
stości linii fluorescencyjnej. Nie możemy tutaj szcze¬ 
gółowo wyjaśnić sposobów obliczania E na podsta¬ 
wie wzoru (3) i zależności E od wyboru faz <p m . Dwa 
najważniejsze wypadki są następujące: 1) gdy fazy 
(fm są różne i mają wartości w ogólności wybrane 
przypadkowo (mówimy wówczas, że mody nakładają 
się niespójnie), to wypadkowe pole ma strukturę nie¬ 
regularną, 2) gdy wszystkie fazy q> m są sobie równe 
(spójne nałożenie się modów), wówczas powstałe pole 
tworzy regularny ciąg miniimpulsów. Zależność od 
czasu natężenia /, które jest wprost proporcjonalne 
do E 2 , ilustrują odpowiednio rys. 5a i 5b. W pierw¬ 
szym wypadku powstały impuls ma strukturę chao¬ 
tyczną, w drugim tworzy się grzebień zawierający 
impulsy o znacznie krótszym czasie trwania. Dokład¬ 
na analiza wykazuje, że czas trwania r pojedynczego 
impulsu w grzebieniu dany jest przez r ^ l/<5v, gdzie 
<5v jest szerokością linii fluorescencyjnej .Tak więc, aby 
otrzymać krótkie impulsy, należy posługiwać się la¬ 
serami, dla których <5v jest możliwie duże. Z tego 
punktu widzenia laser neodymowy jest lepszy niż ru¬ 
binowy, gdyż jego linia fluorescencyjna jest szersza, 
a jeszcze lepsze możliwości dają lasery barwnikowe, 
dla których óv zz 10 13 Hz. Energia niesiona przez 
każdy z miniimpulsów regularnego grzebienia, jak 
na rys. 5b, jest w ogólności większa niż energia poje¬ 
dynczego miniimpulsu tworzącego się, gdy mody na¬ 
kładają się niespójnie tak, jak na rys. 5a. W ten spo¬ 
sób nie tylko powstają pojedyncze miniimpulsy, lecz 
także w sposób kontrolowany uzyskują one dostatecz¬ 
nie dużą energię. Warunek równości faz modów po¬ 
dłużnych, który prowadzi do utworzenia ciągu mini¬ 
impulsów, nazywa się warunkiem synchronizacji 
modów. 

Jak praktycznie zrealizować synchronizację mo¬ 
dów? Pierwszy sposób polega na umieszczeniu we¬ 
wnątrz rezonatora modulatora, który moduluje na¬ 
tężenie światła z częstością równą Av , określoną wzo¬ 
rem (2). Prowadzi to do ustalania się faz drgań mo¬ 
dów w taki sposób, że ich wartości stają się prawie 
sobie równe i w rezultacie drgania własne nakładają 
się spójnie. Teoria tego rodzaju modulacji jest dość 
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złożona i jedynie dla pełności opisu wspomnieliśmy 
o tej metodzie. Drugi sposób, szeroko stosowany 
w praktyce, polega na wstawieniu do komory rezo- 

struktura 



Rys. 5. Struktura impulsu zależy od wyboru wartości faz modów 
promieniowania: a) struktura chaotyczna, b) regularna 


natora odpowiedniego materiału o nieliniowej cha¬ 
rakterystyce pochłaniania — rys. 6a. Jest to zwykle 
barwnik organiczny, którego przepuszczalność (trans¬ 
misja) zależy od natężenia światła padającego tak, 
jak ilustruje to rys. 6b. Zakładamy tutaj, że świecenie 
własne barwnika, to znaczy jego fluorescencja, jak 
i inne procesy molekularne są bardzo krótkotrwałe. 

Oznacza to, że ciecz po wzbudzeniu światłem powraca 
do stanu równowagi niemal natychmiast. Warunek 
ten jest dobrze spełniony w większości używanych 
układów wytwarzających impulsy pikosekundowe. 

Niemniej jednak, stanowi on jedno z ograniczeń w 
usiłowaniach osiągnięcia jeszcze krótszych, tzn. sub- 
pikosekundowych impulsów za pomocą techniki 
synchronizacji modów. Należy podkreślić, że element 
nieliniowy nie tylko zmniejsza natężenie, lecz jedno¬ 
cześnie skraca czas trwania impulsu. 

Jak przebiega akcja laserowa w obecności elementu działanie 
nieliniowego wewnątrz rezonatora? Rozpatrzmy laser elementu 
pracujący impulsowo. Na początku wzbudzania nieliniowego 
świecenia lasera impulsem lampy błyskowej wzbudza¬ 
ne mody podłużne mają nieduże natężenia i nakładają 
się przypadkowo tak, że wytwarzane pole elektro¬ 
magnetyczne charakteryzuje zależność od czasu zilu¬ 
strowania na rys. 5a. Promieniowanie wewnątrz re¬ 
zonatora odbija się wielokrotnie od jego zwierciadeł 
i przechodząc przez naczynie z barwnikiem ulega 




Rys. 6. Transmisja nieliniowa: a) zależność transmisji T (stosu¬ 
nek natężeń światła padającego i przechodzącego) od natężenia 
światła; b) kształt, jak również wysokość impulsu po przejściu 
przez ciecz o nieliniowej transmisji są zmienione 
























częściowemu pochłanianiu. Jednocześnie część pro¬ 
mieniowania wychodzi z lasera przez jedno z pół- 
przepuszczających zwierciadeł. W miarę wzrostu na¬ 
tężenia światła impulsu wzbudzającego wytwarzane 
chaotycznie, miniimpulsy mają większe natężenie 
i nieliniowy element układu zaczyna pełnić swoją 
dyskrymina- właściwą rolę. Miniimpulsy o małych natężeniach są 
oja mini- silniej pochłaniane niż inne o natężeniach więk- 
impulsów szych, a te o dostatecznie dużych natężeniach prze¬ 
chodzą z małymi stratami z jednoczesnym zmniejsze¬ 
niem czasu trwania (zob. rys. 6b). Tego rodzaju dy¬ 
skryminacja prowadzi do tego, że tylko impuls naj¬ 
silniejszy (czasem mogą być dwa o takim samym na¬ 
tężeniu) ulega wzmocnieniu. Promieniowanie we¬ 
wnątrz lasera jest teraz właściwie pojedynczym im¬ 
pulsem odbijającym się między zwierciadłami i jedno¬ 
cześnie pompowanym. Częściowo opuszcza on rezo¬ 
nator przy odbiciu od zwierciadła półprzepuszczają- 
cego i dzieje się to oczywiście z częstością równą od¬ 
wrotności czasu przejścia od jednego do drugiego 
zwierciadła i z powrotem. W rezulatacie cały duży im¬ 
puls wychodzący z lasera nie ma chaotycznej struk¬ 
tury, lecz składa się z ciągu miniimpulsów biegną¬ 
cych jeden za drugim w odstępach czasu linie. W taki 
sam sposób działa element nieliniowy w przypadku 
lasera pracującego w sposób ciągły. Dokładniejsze 
rozważania wykazują, że działanie elementu nielinio¬ 
wego opisane powyżej jest równoważne warunkowi 
równości faz modów nakładających się, który wcześ¬ 
niej omawialiśmy. 

Rysunek 7 jest zdjęciem oscylogramu impulsu z la¬ 
sera neodymowego, którego czas trwania wynosi ok. 
500 ns. Dzięki synchronizacji modów składa się on 



Rys. 7. Oscylogram impulsu wytworzonego w warunkach syn¬ 
chronizacji modów (jeden miniimpuls wycięto) 


kiej jak na rys. 7, lecz kształt charakterystyczny dla 
struktury chaotycznej pokazany na rys. 8. 

Wyjaśniając zasady i sposób realizacji synchroni¬ 
zacji modów, nie poruszyliśmy wielu trudnych pro¬ 
blemów eksperymentalnych. Mimo ich złożoności 
uzyskiwanie impulsów pikosekundowych z dobrą 
powtarzalnością stało się osiągnięciem wielu labora¬ 
toriów optycznych na świecie. 


Pomiar czasu trwania impulsu 


Problemy pomiarów czasów trwania impulsów piko¬ 
sekundowych pod wieloma względami nie zostały 
jeszcze całkowicie rozwiązane. Posługiwanie się naj¬ 
szybszymi fotodetektorami i oscylografami pozwala 
na bezpośrednie pomiary czasów dłuższych niż 100 ps. 
W ostatnich latach skonstruowano specjalne kamery 
optyczno-elektroniczne (tzw. streak cameras) pozwa¬ 
lające na bezpośredni pomiar czasów rzędu 1 ps. Są 
to złożone układy, które w dalszym ciągu są przedmio¬ 
tem licznych badań. Rysunek 9 ilustruje schemat 
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Rys. 9. Schemat ilustrujący zasadę działania ultraszybkiej kamery 
optyczno-elektroniczncj 


otrzymanie 

impulsu 

pikosekun- 

dowego 


z ciągu miniimpulsów, każdy o czasie trwania kilku¬ 
nastu pikosekund, biegnących jeden za drugim w od¬ 
stępach 10 ns, co zgadza się z wartością obliczoną na 
podstawie wyrażenia llnjc przy / = 150 cm. Poje¬ 
dynczy miniimpuls może być wycięty z grzebienia 
odpowiednio szybką migawką. Dalej można go prze¬ 
puszczać przez ciecz o nieliniowej transmisji (zob. 
rys. 6), co powoduje dalsze jego skrócenie, ale 
i zmniejszenie natężenia. Natężenie zwiększa się 
z kolei wskutek przepuszczenia impulsu przez układ 
wzmacniający, którym jest napompowany ośrodek 




Rys. 8. Oscylogram impulsu (z wieloma rozbłyskami) wytworzo¬ 
nego bez synchronizacji modów 

czynny, taki sam jak w laserze. Jeśliby w laserze neo¬ 
dymowym nie było komórki z barwnikiem nielinio¬ 
wym, to impuls nie miałby regularnej struktury, ta- 



działania tego rodzaju kamery. Impuls dzieli się na 
dwa, z których pierwszy po przejściu przez szczelinę 
i soczewkę pada na specjalną fotokatodę, a drugi — 
po zogniskowaniu — służy do włączenia na elektro¬ 
dach napięcia, które po włączeniu rośnie w zadany 
sposób. Elektrony wyrzucone z fotokatody są od¬ 
chylane proporcjonalnie do wielkości napięcia, tak że 
wybite w różnych czasach padają w różnych miej¬ 
scach ekranu fosforyzującego. Fotografia ekranu 
pozwala określić przebieg czasowy impulsu padające¬ 
go na fotokatodę. 


impuls zwierciadło 



Rys. 10. Schemat ilustrujący zasadę pomiaru czasu trwania 
ultrakrótkich impulsów 


Omówimy oryginalny, obecnie najbardziej po¬ 
wszechny sposób pomiaru, w którym wykorzystuje się 
nieliniowe zjawisko fluorescencji dwufotonowej. Na 
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natężenie 


wykorzy- rys. 10 pokazano schemat typowego układu doświad- 
stanie czalnego. Ultrakrótki impuls dzieli się na dwa o jedna- 
fluorescencji kowych natężeniach, które następnie interferują prze- 
dwu- chodząc przez naczynie zawierające odpowiednią 
fotonowej, ciecz fluorescencyjną. Najniższy stan wzbudzony mo¬ 
lekuł cieczy odpowiada energii wzbudzenia równej 
energii dwu kwantów światła. Wzbudzenie cieczy do 
świecenia może więc nastąpić wówczas, gdy natężenie 
światła jest dostatecznie duże (przejścia wielofotono- 
we, Optyka nieliniowa). W obszarze, gdzie się 
spotykają dwa impulsy, wypadkowe natężenie jest 
większe i ciecz świeci znacznie silniej. Świecącą ciecz 
fotografuje się kamerą o dużej zdolności rozdzielcze 
i na podstawie otrzymanego rozkładu natężenia 
określa się szerokość impulsu. Dokładne wyznaczenie 
szerokości nie jest rzeczą łatwą (rys. 11); ocena szero- 


ł 
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Rys. 11. Rozkład natężenia światła fluorescencji wzbudzanej 
światłem o różnym natężeniu / w funkcji położenia z 


kości wiąże się istotnie z pomiarami kontrastu (tzn. 
stosunku różnicy maksymalnego i minimalnego natę¬ 
żenia świecenia fluorescencji do natężenia minimalne¬ 
go). Najmniejsza wartość natężenia świecenia zależy 
od tła (szumu), na jaki nałożony jest impuls, którego 
szerokość chcemy mierzyć. We wszystkich wypadkach 
zachodzi t = yt 1/2 , tzn. czas trwania impulsu jest 
wprost proporcjonalny do połówkowej szerokości 
(mierzonej na połowie wysokości maksymalnego natę¬ 
żenia) linii fluorescencyjnej zarejestrowanej na kliszy 
fotograficznej. Współczynnik proporcjonalności za¬ 
leży od kształtu impulsu (zwykle y == 1,5) i nie może 
być wyznaczony przy użyciu omawianej techniki. 


warunków fizycznych, w jakich się znajdują. W przy¬ 
padku gazów i cieczy zderzenia atomów i cząsteczek 
mogą prowadzić do takich odkształceń ich powłok 
elektronowych, że te atomy i cząsteczki pozostają 
we wzbudzonych stanach o wyższej energii i mogą 
z kolei przekazywać innym energię wzbudzenia. 
W ciałach stałych ruch drgający atomów lub cząste¬ 
czek tworzących sieć krystaliczną może być bardzo 
złożony i niezwykle szybki. Śledzenie i badanie tego 
rodzaju zjawisk wymaga odpowiedniego zegara, któ¬ 
rego skala pozwoli mierzyć odstępy czasu rzędu piko- 
sekund. Ultrakrótkie impulsy o czasach trwania rzędu 
nanosekund pozwoliły zbadać przebieg wielu zjawisk 
o takich właśnie czasach trwania. Teraz jednak w cen¬ 
trum zainteresowań są przebiegi zjawisk o pikosekun- 
dowych skalach czasu. Przykładem jest świecenie 
fluorescencyjne o bardzo krótkim czasie trwania, np. 
materiał pobudzony do świecenia może świecić przez 
okres 10 -8 s i krócej. Dotychczasowe, istniejące od 
wielu lat odpowiednio szybkie migawki i układy elek¬ 
troniczne pozwalały na badanie świecenia o czasach 
trwania nie krótszych niż 10~* s. 

Pole elektryczne impulsu laserowego rozchodzą¬ 
cego się w cieczy może tworzyć w cieczy krótkotrwałą 
dwójłomność. Mówiąc inaczej, ciecz nie mająca wła¬ 
sności kryształu anizotropowego staje się dwójłomna 
w obszarze, przez który przechodzi fala świetlna, 
i może polaryzować światło podobnie jak kryształ. 
Na rys. 12 schematycznie pokazano, jak molekuły 
cieczy reorientują się w polu fali świetlnej, co zwykle 
prowadzi do wzrostu współczynnika załamania w ob¬ 
szarze fali. Ponieważ czas powrotu do stanu równowa¬ 
gi (czas relaksacji) dla wielu cieczy jest rzędu kilku 
pikosekund, okres istnienia obszaru dwójłomnego, wy- 


zjawiska 

piko- 

sekundowe 


dwójłomność 
wymuszona 
przez falę 
świetlną 



Rys. 12. Pole elektryczne impulsu orientuje molekuły tak, że 
wytwarza się krótkotrwała dwójłomność 


optyczna komórka Kerra 


Zastosowanie ultrakrótkich 
impulsów 


Tak jak zmienia się sposoby wytwarzania i detekcji, 
tak też stale rozszerza się zakres stosowania ultra¬ 
krótkich impulsów. Omówimy tutaj jedynie te zasto¬ 
sowania, które mają lub mogą mieć szczególne zna¬ 
czenie dla badań fizycznych. Przede wszystkim 
zwrócimy uwagę Czytelnika na fakt, że w ośrodkach 
materialnych każdego rodzaju, a więc w gazach, cie¬ 
czach i ciałach stałych zachodzą procesy, których 
czas trwania lub częstotliwości ich występowania są 
rzędu kilku do kilkudziesięciu pikosekund. Atomy 
i cząsteczki pozostają bowiem w ciągłym ruchu, któ¬ 
rego charakter i rodzaj zależy od ich budowy oraz 



podczerwonego 

Rys. 13. Schemat wykorzystania ultrakrótkiej migawki do ba¬ 
dania świecenia fluorescencji 
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tworzonego impulsem pikosekundowym, mierzy się 
czasem kilku pikosekund. Naczynie z cieczą, w której 
dwójłomność jest wymuszona przez silnie pole 
elektryczne impulsu świetlnego, nazywa się optycz¬ 
ną komórką Kerra. Została ona wykorzystana przy 
konstrukcji ultraszybkiej migawki, której czas prze¬ 
puszczania światła wynosi około 8 ps. Tak szybkie 
zadziałanie nie byłoby możliwe przy użyciu zwykłej 
komórki Kerra. 

Ultraszybkie migawki wykorzystuje się np. do ba¬ 
dań krótkich czasów świecenia fluorescencyjnego. W 
tym doświadczeniu (rys. 13) ultrakrótki impuls światła 
podczerwonego o długości fali 10,6 jim, pochodzący 
z lasera neodymowego, pada na kryształ nieliniowy 
(np. KDP), który daje drugą harmoniczną, tzn. po 
przejściu impulsu przez kryształ pojawia się dodatko¬ 
wo impuls światła zielonego o długości fali 5,3 jim. 
Odpowiednie zwierciadło z filtrem (opuszczone na 
rysunku) przepuszcza impuls światła podczerwonego, 
który padając na naczynie z dwusiarczkiem węgla 
(optyczna komórka Kerra) wymusza dwójłomność 
cieczy na czas 8 ps. Impuls światła zielonego wzbudza 
światło fluorescencyjne, które pada na układ — pola- 
ryzator, optyczna komórka Kerra, analizator. Pola- 
ryzator i analizator są ustawione prostopadle, tak że 
gdy ciecz nie jest dwójłomna, światło nie przechodzi 
do fotodetektora. Gdy impuls promieniowania pod¬ 
czerwonego wymusi na krótki czas dwójłomność, kie¬ 
runek liniowej polaryzacji świecenia fluorescencyjne¬ 
go ulega zmianie i światło przechodzi przez analiza¬ 
tor do fotodetektora. Zmieniając drogę optyczną im¬ 
pulsu podczerwonego (przez przesuwanie pryzmatu) 
można otwierać migawkę na 8 ps wcześniej lub póź¬ 
niej, co pozwala badać różne odcinki czasów świece¬ 
nia fłuorescencji trwających kilkadziesiąt pikosekund 
i określać krzywą spadku natężenia. W ten sposób 
zbadano przebieg świecenia różnych związków orga¬ 
nicznych i dzięki temu określono podstawowe właści¬ 
wości ruchów oscylacyjno-rotacyjnych cząsteczek. 

Tego rodzaju badania mają duże znaczenie dla wie¬ 
lu zjawisk fotochemicznych i biofizycznych, w których 
światło inicjuje bardzo szybkie procesy. Z podobnych 
względów stosuje się także wzbudzenia pikosekun- 
dowedo badania drgań atomów sieci krystalicznej cia¬ 
ła stałego. We wszystkich tego rodzaju eksperymen¬ 
tach nowe możliwości przyniosły lasery barwnikowe, 
które działając w odpowiednim układzie z synchro¬ 
nizowanymi modami mogą być źródłem impulsów 
pikosekundowych o różnych długościach fali. Przy 
tym mogą one być przestrajane na różne długości fal 
w sposób ciągły. Taka technika jest znacznie efek¬ 
tywniejsza (a nawet czasami niezastąpiona) od otrzy¬ 
mywania fa! o różnych długościach za pośrednictwem 
zjawisk nieliniowych, jak to już omawialiśmy na 
przykładzie wytwarzania światła o barwie zielonej. 
W rezultacie wzbudzanie impulsami pikosekundo- 
wymi (również laserem pracującym w sposób ciągły) 
może być bardzo selektywne. Oznacza to, że w ukła¬ 
dach atomowych i cząsteczkowych można badać 
przejścia między jakimiś dwoma dowolnie wybranymi 
poziomami energetycznymi naświetlając światłem, 
którego fotony mają energię dokładnie równą róż¬ 
nicy energii tych poziomów. Stwarza to zupełnie nowe 
możliwości i wytycza kierunek rozwoju współczesnej 
spektroskopii optycznej. 

Ultraszybką migawkę, wyżej omówioną, zastoso¬ 
wano również w oryginalnym doświadczeniu, w któ¬ 
rym sfotografowano impuls światła. Rysunek 14 u- 
kazuje schemat doświadczenia. Rysunek 15 ilustruje 
wersję eksperymentu, w której w naczyniu z cieczą 
fluorescencyjną poruszają się prostopadłe do linii 
celowania obiektywu dwa impulsy pikosekundowe, 
jeden obok drugiego. Gdyby migawka została otwar¬ 
ta na okres dłuższy niż 8 ps, zdjęcie pokazałoby ciągłą 
linię świecenia cieczy. Otwarcie na krótki czas po¬ 
zwala jednak uchwycić impuls w locie. Aby stało się 
to w odpowiednim momencie, zarówno impulsy fo¬ 
tografowane, jak i impuls otwierający migawkę po¬ 


chodzący z tego samego lasera, są przez odpowiedni 
układ optyczny przesuwane w czasie względem siebie. 
W pierwszej chwili oglądania zdjęcia zadziwia fakt. 



Rys. 14. Schemat układu do fotografowania ultrakrótkiego 
impulsu 



Rys. 15. Dwa ultrakrótkie impulsy tworzą obiekt relatywistyczny; 
a) oba impulsy znajdują się na osi optycznej układu; b) otrzymane 
zdjęcie 


że klisza rejestruje dwa impulsy, mimo że wzdłuż linii 
celowania „widoczny” powinien być tylko jeden, 
a drugi — zasłonięty. Związane to jest z tym, że pręd¬ 
kość światła jest skończona i do obiektywu oraz na 
kliszę fotograficzną dochodzi jednocześnie światło 
rozproszone w cieczy przez impuls pierwszy i drugi. 

Mówiąc inaczej, krótkotrwałe otwarcie migawki 
wpuszcza fotony pochodzące od impulsu pierwszego 
(w tym momencie nie jest już on na osi optycznej 
obiektywu!) oraz fotony pochodzące od impulsu 
drugiego wysłane wcześniej, gdy nie był on jeszcze 
na osi optycznej. Rejestrowane na kliszy fotony po¬ 
chodzące od pierwszego i drugiego impulsu docierają 
do niej jednocześnie i określają różne położenia źró¬ 
deł, z których zostały wysłane. Jest to prosty i znako¬ 
micie ilustrujący przykład, że obserwacja (fotografia) 
obiektów poruszających się z prędkościami relaty¬ 
wistycznymi, tzn. z prędkościami bliskimi lub równy¬ 
mi prędkości światła, daje obrazy, których kształt 
można wyjaśnić tylko z uwzględnieniem skończonej 
prędkości światła. W omawianym przykładzie obiek¬ 
tem takim jest układ dwóch impulsów. Poruszony 
tutaj problem został opracowany i wyjaśniony z teo¬ 
retycznego punktu widzenia dużo wcześniej. 

Innym ważnym zjawiskiem, obok dwójłomności 
cieczy, które może być wywołane silnym polem elek¬ 
trycznym impulsu Jest jego samoogniskowanie. Zmia¬ 
na współczynnika załamania w obszarze impulsu po¬ 
woduje, że impuls rozchodzi się w ośrodku niejedno- samoognis 
rodnym, co zmienia jego kształt tak, jak uczyniłaby kowanie 
to soczewka skupiająca. Jest to w ogólności złożony impulsu 
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problem, dotyczący również poprzecznego kształtu 
impulsu, którego tutaj zupełnie nie poruszamy. 

Powiemy^ teraz krótko o możliwości zastosowa¬ 
nia ultrakrótkich impulsów do celów mikrosyntezy 
jądrowej (-* Energia termojądrowa). Badania te pod¬ 
jęte w wielu krajach — również i w Polsce — mają 
mikrosynteza na celu wykorzystanie dużej gęstości energii impulsu 
jądrowa lasęrowego do wytworzenia stanu materii o bardzo 
wysokiej gęstości i temperaturze, w której możliwa 
jest reakcja syntezy jąder lekkich. Fakt, że pojawiło 
się tego rodzaju nowe podejście do problemu reakcji 
termojądrowych i że jest ono przedmiotem badań 
jako jedno z możliwych praktycznych rozwiązań, 
wynika z postępu w wytwarzaniu i pomiarach ultra¬ 
krótkich impulsów laserowych. Zasadnicza idea jed¬ 
nego z takich rozwiązań polega na tym, że kropla 
mieszaniny deuteru i trytu zostaje z wielu stron rów¬ 
nomiernie oświetlona wysokoenergetycznymi impul¬ 
sami laserowymi. Odrzucenie zewnętrznej części kulki 
(szybkie wyparowanie) prowadzi do ściśnięcia reszty 
i wytw-orzenia dużej gęstości, co powinno istotnie po¬ 
prawić wydajność reakcji termojądrowej. Z punktu 
widzenia techniki ultrakrótkich impulsów nie jest 
najważniejszą sprawą ich bardzo krótki C2as trwania, 
lecz odpowiedni profil, tzn. specjalny dobór krzywej 
wzrostu i zaniku natężenia w czasie. Również nie¬ 
zbędna jest duża energia impulsu. Pierwsze impulsy 
nanosekundowe niosły energię rzędu 0,1 J, obecnie 
takie impulsy mogą nieść energię 10000 J, a prowadzi 
się prace nad dalszym jej powiększeniem. W gorącej 
plazmie, w której zachodzą reakcje termojądrowe, 
ma się do czynienia z wieloma bardzo złożonymi pro¬ 
cesami. Informacje o nich można otrzymać śledząc 
szybko ich przebieg. Tu również znajdują zastoso¬ 
wanie techniki, w których wykorzystuje się impulsy 
pikosekundowe. 

Kończąc oma wdanie zastosowania ultrakrótkich 


Holografia 

Romuald Paw fu czy k 

Oko ludzkie oraz wszystkie przyrządy służące do za¬ 
pisu obrazów świetlnych mogą rejestrować tylko 
przedmioty składające się z takich ośrodków mate¬ 
rialnych, które zaburzają padające na nie fale świetlne 
(lub same je emitują) w sposób wyróżniający je z oto¬ 
czenia. Zaburzone lub wysyłane przez przedmiot pro¬ 
mieniowanie rozchodzi się w określonych kierun¬ 
kach, ma określony skład widmowy, a składowe fale 
mają określoną polaryzację, amplitudę i fazę. Ogól¬ 
nie mówiąc — stan fizyczny światła pochodzącego 
od poszczególnych fragmentów przedmiotu jest róż¬ 
ny, wskutek czego w' przestrzeni powstają różnice 
w rozkładzie natężenia i składu widmowego (barwy) 
światła. 

przedmiot Jeżeli ten rozkład zostanie odwzorowany za pomo- 
i jego obraz ^ układu optycznego, to otrzymany obraz może być 
utrwalony na powierzchni odpowiedniego materiału 
światłoczułego (fotografia) lub odebrany przez od¬ 
powiedni układ odbiorczy (nerw oczny w oku, układ 
elektroniczny w kamerze telewizyjnej itp.). W każdym 
wypadku odbiornik uzyskuje jednak tylko tę infor¬ 
mację o przedmiocie, która się przejawia w rozkładzie 
natężenia (odbiorniki typu czarno-białego lub jasno- 
ciemnego) oraz barwy (odbiorniki do odbioru barw¬ 
nego), natomiast zostaje zatracona informacja zwią¬ 
zana z zaburzeniem fazy oraz stanu polaryzacji fali 
świetlnej. Utrata informacji o fazie ma szczególnie 
istotne znaczenie, gdyż z tym wiąże się utrata infor¬ 
macji o sposobie zaburzenia fazy fali świetlnej przez 
przedmiot, a co za tym idzie — zatraceniu ulega trój¬ 
wymiarowość ze wszystkimi jej atrybutami: głębią, 
perspektywą i paralaksą. Zapisany w ten sposób 
obraz nie jest pod względem optycznym równoważny 
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impulsów, wspomnijmy jeszcze o możliwości wyko- pompowanie! 
rzystania ich do pompowania układów atomowych, vv zakrssie i 
które byłyby źródłem promieniowania spójnego w za- nadfioletu i I 
kresie dalekiego nadfioletu i rentgenowskim. Problem rerctgeno- 
ten jest przedmiotem bardzo intensywnych badań wskim 
w wielu ośrodkach naukowych. Innym przykładem 
poszukiwania zastosowań jest możliwość wykorzy¬ 
stania impulsu pikosekundowego w przełączniku 
optoelektrycznym. Urządzenie to może włączyć 
układ elektroniczny na czas kilku pikosekund, jak też 
służyć tylko do ultraszybkiego włączania lub wyłą¬ 
czania. 

Liczne i różnorodne zastosowania laserów bardzo 
często wykorzystują impulsową pracę lasera, a więc 
krótkie impulsy światła. Ograniczyliśmy się do tych 
aktualnych problemów i osiągnięć dotyczących im¬ 
pulsów światła, których dalszy rozwój z pewnością 
odegra ważną rolę w fizyce molekularnej, fizyce plaz¬ 
my i fizyce ciała stałego. Szczególną uwagę poświęci¬ 
liśmy impulsom pikosekundowym. Wiadomo już, że 
techniką synchronizacji modo w uzyskano impulsy 
o czasach trwania krótszych niż 1 ps. Ten zakres nie 
jest jednak w pełni opanowany. Z uwagą więc śledzi 
się prace teoretyczne i doświadczalne przewidujące 
uzyskiwanie impulsów o czasach krótszych niż 1 ps, 
z wykorzystaniem wymuszonych zjawisk rozpraszania 
światła. Technika ta jest dopiero w początkowym 
stadium badań. Bez wątpienia opanowanie i wykorzy¬ 
stanie światła w formie krótkich i ultrakrótkich im¬ 
pulsów należy do jednej z najciekawszych i aktualnie 
rozwijanych technik laserowych i ma duże znaczenie 
dla różnych badań naukowych. 

R. R. Alfano, S. L. Shapiro Ultrafast Phenomcna in Liąuids 
and Solids, Scientific Amer.,228, No. 6, 42 (1973); M.A. Duguay 
Light Photographed inflight, Am. Scientist 59, 551 (1971); A. Pie- 
kara Nowe oblicze optyki , Warszawa 1976; S. Kaliski Laserowa 
kompresja i synteza termojądrowa plazmy , Delta nr 3, 1975; H. 

Klejman Lasery , Warszawa 1979. 


z przedmiotem, gdyż fale świetlne ukształtowane 
przez obraz na ogół całkowicie różnią się pod wzglę¬ 
dem rozkładu fazy od fal świetlnych ukształtowanych 
przez przedmiot (wynika to ściśle z dyfrakcyjnej 
teorii odwzorowania optycznego). 

Aby więc odtworzony obraz był optycznie równo¬ 
ważny z rejestrowanym przedmiotem, oprócz rozkła¬ 
du amplitudy (natężenia) i barwy powinien być zareje¬ 
strowany, a następnie odtworzony rozkład fazy ukształ¬ 
towanych przez przedmiot fal świetlnych. Warunek 
ten spełniają metody holograficzne (grecki wyraz holographćd 
holographeó znaczy pisać w całości, nie skracając). 


Fizyczne podstawy holografii 


Dyfrakcyjna teoria odwzorowania optycznego 

Powstanie holografii jest konsekwencją rozwoju dy¬ 
frakcyjnej teorii odwzorowania optycznego, stwo¬ 
rzonej w zeszłym stuleciu przez E. Abbego w celu 
wyjaśnienia zasad działania mikroskopu. Teoria ta 
okazała się bardziej uniwersalna i tłumaczy również 
działanie wszystkich innych układów, w których na¬ 
stępuje odwzorowanie przedmiotu za pomocą pól 
falowych (np. fal dźwiękowych, radiowych, rentge¬ 
nowskich czy fal przedstawiających rozchodzenie się 
cząsteczek materii — elektronów, protonów itp.). 

Rozpatrzmy z punktu widzenia tej teorii najpro¬ 
stszy przypadek odwzorowania optycznego — od¬ 
wzorowanie płaskiego przedmiotu zaburzającego 




tylko amplitudę. Światło oświetlające przedmiot (rys. 
1) zachowuje się tak, jak gdyby przedmiot składał się 
z dużej liczby nałożonych na siebie siatek dyfrakcyj- 


ugięcie 

światła 



nych amplitudowych. Dla każdego przedmiotu liczba 
składowych siatek, kierunek prążków w danej siatce, 
stała siatki oraz maksymalny i minimalny stopień za¬ 
burzenia amplitudy padającej fali (głębokość modu¬ 
lacji) są w jednoznaczny sposób ustalone. 

Na każdej siatce część padającej fali świetlnej ulega 
ugięciu w dwóch kierunkach, położonych symetrycz¬ 
nie względem padającej fali (uwzględniamy tylko 
ugięcie I rzędu). Kierunki i kąty ugięcia ściśle zależą 
od orientacji prążków i stałej siatki, a amplituda fal 
ugiętych — od głębokości modulacji. Tak więc każda 
siatka składowa przedmiotu jest reprezentowana 
przez parę fal o określonej amplitudzie, ugiętych 
w określonych kierunkach. W miarę oddalania się od 
przedmiotu rozkład natężenia światła wytwarzany 
przez te fale coraz bardziej się różni od rozkładu na¬ 
tężenia na powierzchni przedmiotu. W płaszczyźnie 
obserwacji (leżącej w pewnej odległości od przedmio¬ 
tu) rozkład natężenia może być tak różny od rozkładu 
natężenia na powierzchni przedmiotu, że na jego pod¬ 
stawie nie można rozpoznać przedmiotu (można się 
o tym przekonać, wstawiając bezpośrednio w to miej¬ 
sce płytę fotograficzną, która po naświetleniu nie da 
obrazu). Niemniej jednak, pole świetlne w dalszym 
ciągu zawiera całkowitą informację o przedmiocie. 



Rys. 2. Otrzymywanie obrazu w układach optycznych. Po przej¬ 
ściu przez optyczny układ skupiający (soczewkę) ugięte na przed¬ 
miocie fale świetlne ponownie nakładają się na siebie w płasz¬ 
czyźnie obrazowej i intcrferując odtwarzają obrazy siatek skła¬ 
dowych przedmiotu czyli dają jego obraz 


która jest zakodowana w postaci par fal o określo¬ 
nych amplitudach, padających na płaszczyznę ob¬ 
serwacji z określonych kierunków pod określonymi 
kątami. Informacja o kierunkach i kątach padania 
poszczególnych fal zostanie odwzorowana na tej 
płaszczyźnie jako odpowiedni rozkład fazy (znaczy 
to, że utrata informacji o rozkładzie fazy w świetle 
ugiętym jest równoważna z utratą informacji o okre¬ 
sach i kierunkach siatek tworzących przedmiot). 

Aby ze światła zaburzonego przez przedmiot można 
było odzyskać informację o tym przedmiocie (np. 
obraz przedmiotu), rozkład amplitudy i fazy należy 
przetransformować na rozkład natężenia światła 
taki, jak w płaszczyźnie przedmiotu. Zadanie to speł¬ 
niają różnorodne układy optyczne (soczewki aparatu 
fotograficznego, soczewka w oku, a w optyce elektro¬ 
nowej — układy wytwarzające odpowiednią konfigu¬ 
rację pól elektrycznych i magnetycznych — soczewki 
magnetyczne; rys. 2). Układy takie odtwarzają wier¬ 
nie tylko obrazy przedmiotów płaskich, natomiast 
deformują przestrzennie obrazy przedmiotów trój¬ 
wymiarowych. Dostępne fotodetektory (np. płyty 
fotograficzne, siatkówka oka itp.) nie mogą wiernie 
zarejestrować nawet tych zdeformowanych obrazów. 
Wiernie rejestrują one tylko te fragmenty obrazu, 
które leżą dokładnie na powierzchni fotodetektorów, 
pozostałe zaś fragmenty są rejestrowane z tym większą 
utratą informacji, im dalej się znajdują od powierzchni 
fotodetektora. 

Z powyższych rozważań wynika, że obrazy powsta¬ 
ją w dwóch etapach: najpierw światło dokonuje ana¬ 
lizy przedmiotu i koduje informację o jego własno¬ 
ściach optycznych w postaci amplitudy i fazy zabu¬ 
rzonego przez przedmiot pola świetlnego, tzw. pola 
dyfrakcyjnego (matematycznie zjawisko to opisuje się 
za pomocą tzw-. transformacji Fouriera), a następnie 
układ optyczny transformuje to pole w rozkład natę¬ 
żenia (dokonuje syntezy — matematycznie odpowiada 
to odwrotnej transformacji Fouriera), który może już 
być zarejestrowany przez dostępne fotodetektory 
(-> Optyka fourierowska). 

Gdyby istniały sposoby zapisu oraz odtwarzania 
rozkładu amplitudy i fazy pola dyfrakcyjnego, czyli 
gdyby można było oddzielić proces syntezy obrazu od 
procesu analizy, to przy zachowaniu pewnych wa¬ 
runków stosowane w obu tych procesach promienio¬ 
wanie mogłoby się różnić swymi własnościami. Po raz 
pierwszy ideę tę wysunął w 1920 r. polski fizyk Mie¬ 
czysław Wolfke, który pragnął ją wykorzystać w mi¬ 
kroskopii rentgenowskiej i zaproponował stosowanie 
promieniowania rentgenowskiego w procesie analizy, 
a światła widzialnego w procesie syntezy. Idea ta była 
później jeszcze kilkakrotnie podejmowana, jednakże 
nie znalazła urzeczywistnienia, ponieważ nie było 
metody zapisu rozkładu fazy i amplitudy pola dy¬ 
frakcyjnego. Problem udało się rozwiązać dopiero 
twórcy holografii, D. Gaborowi, w 1948 r.; do zapisu 
rozkładu fazy i amplitudy zaproponował on zastoso¬ 
wanie metody interferencyjnej. 

Istota metody interferencyjnej polega na tym, że fala 
o nieznanym rozkładzie fazowym jest nakładana na 
spójną z nią falę wzorcową (rys. 3 —►Spójność światła). 
W wyniku interferencji obu fal tworzy się przestrzen¬ 
ny układ maksimów i minimów natężenia światła (pole 
interferencyjne). Na płaszczyźnie przecinającej pole 
interferencyjne te minima i maksima tworzą określoną 
strukturę. W w-ypadku światła monochromatycznego 
w cienkiej płycie fotograficznej jest ona rejestrowana 
jako układ naprzemiennych jasnych i ciemnych prąż¬ 
ków interferencyjnych, a w grubym ośrodku światło¬ 
czułym — jako układ jasnych i ciemnych powierzchni. 
Dwa sąsiednie prążki (powierzchnie) o tym samym na¬ 
tężeniu są zbiorami punktów, w których różnica faz 
interferującyh promieni różni się o 2 n (co w swobod¬ 
nej przestrzeni odpowiada zmianom różnicy dróg 
optycznych interferujących promieni o jedną długość 
fali użytego światła). Jeżeli kształt powierzchni falo¬ 
wej jednej z tych fal (fali odniesienia) jest znany, to 
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na podstawie obrazu prążków (powierzchni) można 
wyznaczyć kształt powierzchni falowej drugiej fali — 
fali badanej. 



Rys. 3. Przekrój powierzchni interferencyjnych tworzących się 
w wyniku interferencji światła spójnego emitowanego przez dwa 
źródła punktowe 


D. Gabor udowodnił, że jeżeli do pola interferen¬ 
cyjnego wprowadzi się płaską płytę fotograficzną i za¬ 
rejestruje na niej prążki interferencyjne, a taki obraz 
hologram interferencyjny (hologram) oświetli się taką samą falą 
jak fala odniesienia, to w wyniku ugięcia na tym obra¬ 
zie powstanie fala będąca jak gdyby dalszym ciągiem 
fali badanej. Odkrycie tego zjawiska dało początek 
holografii. 


Obrazy holograficzne 

fala Dalsze badania wykazały, że do wiernego odtworze- 
przed- nia fali badanej (w holografii nazywanej falą przed¬ 
miotowa miotową, gdyż zazwyczaj jest ona w jakiś sposób 
ukształtowana przez przedmiot) fala wzorcowa, zwa¬ 
na w holografii falą odniesienia, nie musi mieć po¬ 
wierzchni falowej o znanym kształcie, jak również 
obojętny jest kąt pomiędzy kierunkami padania in- 
terferujących fal (rys. 4a). Obie fale (przedmiotowa 
i odniesienia) interierują między sobą, tworząc prze¬ 
strzenny układ maksimów i minimów pola interferen¬ 
cyjnego, zarejestrowanych w hologramie w postaci 
prążków (w cienkim ośrodku światłoczułym) lub po¬ 
wierzchni (w grubym). 

fala Aby z hologramu uzyskać wierne odtworzenie za- 
odtwarzająca rejestrowanej fali przedmiotowej, fala odtwarzająca 
musi być wierną „kopią” fali odniesienia, a więc 
musi padać na hologram z tej samej strony, z tego 
samego kierunku i pod tym samym kątem co fala 
odniesienia w czasie zapisu (rys. 4b). Światło fali od¬ 
twarzającej ulega częściowemu ugięciu na siatce two¬ 
rzącej hologram. (Jeżeli grubość materiału światło¬ 
czułego jest odpowiednio mała, porównywalna z od¬ 
stępem między prążkami, to jej wpływ na ugięcie 
światła można pominąć). Ugięcie następuje w dwóch 
różnych kierunkach i za hologramem oprócz wiązki 
nieugiętej powstają dwie fale ugięte. Jedna z nich jest 
jak gdyby dalszym ciągiem fali przedmiotowej i ob¬ 
serwator ma wrażenie, że ogląda rzeczywisty przed¬ 
miot przez okienko o wymiarach hologramu. Roz¬ 
cinając hologram na mniejsze części, nie ogranicza się 
obraz wielkości obrazu zwanego pierwotnym, lecz tylko 
pierwotny zmniejsza się możliwość zmian punktu obserwacji 
(podobnie jak przy zmniejszaniu wymiarów okienka). 
Zmniejszanie wymiarów hologramu dopóty nie wpły¬ 
wa na jakość obrazu, dopóki są one większe od wymia¬ 
rów źrenicy oka. Przy dalszym zmniejszaniu jakość 
obrazu zaczyna ulegać pogorszeniu, następuje roz¬ 
mycie konturów, a przy wymiarach porównywalnych 
z długością fali światła użytego w procesie analizy — 
obraz całkowicie znika. 


Druga fala ugięta też zawiera informację o przed¬ 
miocie, jednakże w bardzo złożonej postaci i, na ogół 
biorąc, informacji tej nie można wykorzystać. Sytuacja 




Rys. 4. Zapisywanie hologramu (a) i odtwarzanie w świetle mo¬ 
nochromatycznym (b). Na hologramie zapisuje się obraz inter¬ 
ferencyjny utworzony w wyniku interferencji fali przedmiotowej 
z falą odniesienia. Do odtwarzania stosuje się falę identyczną 
z falą odniesienia. Jedna z fal ugiętych na hologramie jest „prze¬ 
dłużeniem” fali przedmiotowej, dzięki czemu odtwarza obraz 
przedmiotu. Wtórna fala ugięta na ogół nie daje wiernego obra¬ 
zu (nieoświetlona ściana a sześcianu nie jest rejestrowana na 
hologramie) 

się zmienia, gdy fale odniesienia i odtwarzająca są 
falami płaskimi lub sferycznymi. Jeżeli fala odniesie¬ 
nia i fala odtwarzająca są falami płaskimi, padającymi 
prostopadle na powierzchnię hologramu, to druga 
fala ugięta tworzy również wiemy obraz przedmiotu, obraz 
zwany wtórnym. Fala ta (w odróżnieniu od fali wtórny 
pierwszej, która się zachowuje tak, jak gdyby się roz¬ 
chodziła od obrazu) zbiega się do obrazu, a jej kieru¬ 
nek ugięcia jest przeciwny do kierunku ugięcia fali 
pierwotnej, przy czym w tym wypadku oba te obrazy 
są zwierciadlanym odbiciem jeden drugiego względem 
płaszczyzny hologramu. Obserwator oglądający wtór¬ 
ny obraz widzi go zawieszonym w przestrzeni przed 
hologramem, przy czym ten obraz ma odwróconą 
głębię, jest więc obrazem pseudoskopowym. Źródłem 
światła tworzącym oba obrazy jest hologram, do oka 
obserwatora mogą więc docierać tylko promienie 
rozchodzące się w nieskończonym ostrosłupie, które¬ 
go jeden z przekrojów stanowi hologram, a wierz¬ 
chołek— oko. Z tego względu obserwator będzie 
widział tylko te fragmenty odtworzonych obrazów, 
które się mieszczą w objętości tak wyznaczonego 
ostrosłupa. Do obejrzenia innych fragmentów obrazu 
zarejestrowanego na hologramie należy zmienić 
punkt obserwacji. 

Jeżeli po wykonaniu hologramu nie został on po¬ 
większony lub pomniejszony, a fala odtwarzająca jest 
identyczna z falą odniesienia, to pierwotny obraz jest 
wierną kopią przedmiotu, natomiast obraz wtórny 
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na ogół jest zniekształcony. Po przeskalowaniu holo¬ 
gramu (powiększeniu lub pomniejszeniu), po zmia¬ 
nach kształtu powierzchni falowej lub też długości fali 
odtwarzającej zniekształceniu ulegają oba obrazy. 
Odtworzone obrazy mogą być powiększone lub po¬ 
mniejszone, również położenie odtworzonych obra¬ 
zów w przestrzeni może być inne niż przedmiotu, 
powiększenie Technicznie najprostszym sposobem uzyskania po¬ 
lub większonych (pomniejszonych) obrazów jest zmiana 
pomniejsze- krzywizny powierzchni falowej fali odtwarzającej 
nie obrazu w stosunku do fali odniesienia lub zmiana odległości 
źródła fali odtwarzającej od hologramu. Jeżeli po 
wykonaniu hologram został powiększony (dla holo¬ 
gramu pomniejszonego m jest ułamkiem), długość 
fali odtwarzającej jest X c , a długość fali odniesienia 
i przedmiotowej — Xo (wiązki odniesienia i odtwa¬ 
rzania są falami kulistymi), to słuszne są następujące 
relacje między współrzędnymi obrazów (wskaźniki /) 
i przedmiotu (wskaźniki p) (rys. 5): 




Zp_ _ 

kX c 

(— i) 

Zc 

mV. 0 

U® / 


( kX c x p k)^x 0 x c 
mX 0 z p mX 0 z 0 z c 


Dla współrzędnej y wzór jest taki sam jak dla współ¬ 
rzędnej x , należy tylko w miejsce x wstawić y. 

Gdy x z i y <ś z powiększenie obrazów Mi wyno¬ 
si: 


Ml ~ zg [ m 2 X 0 z p ; 

Zo kXc Zo 

x 0t >’o, Zo — współrzędne źródła fali odniesienia, 
y c , z c — współrzędne źródła fali odtwarzającej. 
Wskaźnik / i współczynnik k przybierają wartość 1 dla 
obrazu pierwotnego oraz —1 dla obrazu wtórnego. 



Rys. 5. Wybór układa współrzędnych do opisu współzależności 
między położeniem poszczególnych elementów układu hologra¬ 
ficznego; przy odtwarzaniu położenie środka układu współrzęd¬ 
nych oraz orientacja układu nie ulegają zmianom 


Obrazy holograficzne otrzymywane 
w świetle niemonochromatycznym 

Z przedstawionych wyżej wzorów wynika, że położe¬ 
nie odtworzonych obrazów oraz ich powiększenie 
zależą od długości fali światła użytego do odtwarza¬ 
nia. Bardziej szczegółowe rozważania prowadzą do 
wniosku, że obrazy odpowiadające różnym długoś¬ 
ciom fal będą poprzesuwane względem siebie, wsku¬ 
tek czego przy odtwarzaniu hologramów światłem 
niemonochromatycznym nastąpi tęczowe rozmycie 
odtworzonych obrazów. Rozpoznanie takich obra¬ 
zów jest trudne, a przeważnie wręcz niemożliwe. Jeżeli 
natomiast grubość stosowanego materiału światło¬ 
czułego będzie dużo większa od odstępu między prąż¬ 


kami rejestrowanymi na płaskim hologramie, to prze- grubość 
strzenny układ maksimów i minimów pola interfe- materiału 
rencyjnego zostanie zapisany w postaci przestrzeń- światło- 
nych naprzemianległych jasnych i ciemnych po- czułego 
wierzchni interferencyjnych. Wskutek właściwości 
takiej przestrzennej struktury interferencyjnej holo¬ 
gram jest w stanie odtworzyć obraz tylko w świetle 
o takiej długości fali, jaka była użyta przy zapisie, i to 
pod warunkiem, że fala odtwarzająca rozchodzi się 
z tego samego kierunku co fala odniesienia. Przy 
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Rys. 6. Wykonywanie i odtwarzanie hologramów rekonstruowa¬ 
nych w świetle niemonochromatycznym: a) hologram wykonuje 
się przy użyciu wysokospójnego światła laserowego, b) odtwo¬ 
rzenie następuje w świetle niemonochromatycznym 


oświetleniu falą niemonochromatyczną taki holo- obrazy 
gram sam wybiera z wiązki świetlnej światło o właści- w świetle 
wej barwie, dzięki temu można uzyskać dobrej jakości białym 
obrazy w białym świetle punktowej żarówki lub nawet 
w świetle słonecznym. 

Barwa i ostrość odtworzonego obrazu tym bliższe 
są oryginalnym, im grubszy ośrodek jest stosowany 
do zapisu hologramu. Sposób wykonywania takich 
hologramów został zaproponowany po raz pierwszy 
w 1962 r. przez J. Denisiuka. 

W celu zapisania możliwie dużej liczby powierzchni 
falowych w metodzie tej fala przedmiotowa i fala 
odniesienia padają na ośrodek światłoczuły z prze¬ 
ciwnych stron (rys. 6a). Przy odtwarzaniu obrazów 
(rys. 6b) na zarejestrowanych powierzchniach inter¬ 
ferencyjnych następuje wsteczne ugięcie światła, a fale 
ugięte na poszczególnych powierzchniach interferu- 
ją między sobą, tworząc jednobarwny obraz. 


Otrzymywanie hologramów 

Na hologramach rejestrowanych w cienkich ośrod¬ 
kach światłoczułych odległość między sąsiednimi 
prążkami zależy od kąta zawartego między kierun¬ 
kami padania interferujących fal. W trójwymiaro¬ 
wych hologramach nieprzezroczystych przedmiotów 
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ta odległość waha się od ułamka do pojedynczych 
mikrometrów, a w hologramach przedmiotów prze¬ 
zroczystych może być nieco większa (kilka mikro¬ 
metrów). Aby taki obraz interferencyjny można było 
zarejestrować, materiały światłoczułe muszą mieć 
wysoką zdolność rozdzielczą — minimum 2000 linii 
na mm (zwykłe materiały fotograficzne mają ok. 100 
linii na mm). Po naświetleniu i wywołaniu materiału 
światłoczułego obraz interferencyjny zapisany w po¬ 
staci złożonej siatki prążków interferencyjnych można 
zobaczyć w dużym powiększeniu (il. 143, tabl. 37). 
holografia Przy wykonywaniu hologramów obraz interferen- 
w świetle cyjny musi być stabilny przez cały czas naświetlania, 
laserowym Kontrast obrazu zależy od spójności stosowanego 
promieniowania (-* Spójność światła) oraz od stanu 
polaryzacji interferujących fal. Uzyskanie dostatecz¬ 
nie spójnego światła o odpowiedniej intensywności 
z termicznych źródeł praktycznie jest niemożliwe, 
dlatego to obecny rozwój holografii nastąpił dopiero 
po wynalezieniu laserów (-*■ Lasery — podstawy dzia¬ 
łania); za prawdziwą datę narodzin holografii można 
uznać lata 1962-1964, kiedy to E. N. Leith oraz J. 
Upatnieks wspólnie opublikowali serię prac dotyczą¬ 
cych holografii w świetle laserowym. 

Nawet z zastosowaniem laserów stabilny obraz 
interferencyjny można otrzymać tylko wtedy, gdy 
obie interferujące wiązki pochodzą z jednego źródła, 
migawka 



Rys. 7. Schemat układu do holografowania przedmiotów prze¬ 
zroczystych 



Rys. 8. Schemat układu do holografowania przedmiotów nie¬ 
przezroczystych 
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a różnica dróg optycznych interferujących promieni 
(mierzona od miejsca, gdzie wiązka, została podzie¬ 
lona, do miejsca ich interferencji na powierzchni ma¬ 
teriału światłoczułego) nie przekracza, długości spój¬ 
ności. Warunki te spełniają układy, których schematy 
pokazano na rys. 7 i 8. 

Ze względu na dobre parametry użytkowe i sto- lasery sto¬ 
sunkowo niską cenę w laboratoriach holograficznych sowane w 
najczęściej są używane lasery helowo-neonowe holografii 
(He-Ne). Ponadto stosuje się lasery argonowe, a także 
impulsowe lasery rubinowe lub z kryształami YAG 
w układzie zwiększającym spójność wytwarzanego 
przez nie promieniowania (w wypadku lasera YAG 
promieniowanie podczerwone jest zmieniane, metodą 
podwajania częstości na promieniowanie widzialne; 

—> Optyka nieliniowa). Dla uzyskania dobrej jakości 
hologramów układ holograficzny należy zabezpieczyć 
przed drganiami oraz przed wpływem czynników 
zewnętrznych (zmiany temperatury, ciśnienia i wil¬ 
gotności powietrza). Toteż badania holograficzne 
często prowadzi się w przystosowanych do tego celu 
pomieszczeniach. Elementy układu holograficznego 
umieszcza się na masywnych stołach w sposób za¬ 
pewniający dostateczną sztywność całego układu (il. 

140, tabl. 36). Jeśli przedmiot holografowany jest ze 
swej natury niestabilny (np. obiekty żywe), stosuje się 
lasery inpulsowe o odpowiednio krótkim impulsie 
i dużej energii. 


Zastosowanie holografii 

Rejestrując pełną informację amplitudowo-fazową 
pola świetlnego, holografia znacznie wierniej od¬ 
zwierciedla rzeczywistość niż dotychczasowe metody 
zapisu obrazów. Wskutek tego możliwości jej zastoso¬ 
wań są również szersze niż metod tradycyjnych, co 
już obecnie można zauważyć w nauce i technice. Od¬ 
twarzanie trójwymiarowości jest tak ważną cechą 
holografii, że niewątpliwie otworzy jej drogę do za¬ 
stosowania również w życiu codziennym. 


Interferometria holograficzna 

Holograficzna metoda utrw-alania fazy fali świetlnej 
nie tylko spowodowała rozwój dotychczasowych me¬ 
tod badań interferencyjnych, ale i przyczyniła się do 
powstania nowych. 

Zjawisko interferencji znajdowało praktyczne za¬ 
stosowanie już przed wynalezieniem holografii, słu¬ 
żyło do precyzyjnych pomiarów odległości, kształtu 
powierzchni płaskich lub sferycznych, jednorodności interfero- 
materiałów optycznych i wielu innych. Istota trądy- metria , 
cyjnych pomiarów interferencyjnych polega na tym, tradycyjna 
że w odpowiednim układzie optycznym światło emi¬ 
towane przez spójne źródło dzieli się na dwie fale 
o dokładnie znanym, zazwyczaj jednakowym kształ¬ 
cie powierzchni falowej. Jedna z tych fal, zwana falą 
przedmiotową, oddziałuje z badanym obiektem, np. 
niejednorodną płytą szklaną (której jakość należy 
sprawdzić), wskutek czego ulega zaburzeniom. Fala 
ta nakłada się następnie z powrotem na drugą (nie- 
zaburzoną) falę — falę wzorcową (rys. 9), obie inter- 
ferują, a w płaszczyźnie obserwacji tworzą obraz inter¬ 
ferencyjny, na podstawie którego można wyciągnąć 
wnioski o badanym obiekcie. 

Ponieważ w zwykłych interferometrach każdą z fal 
kształtują inne elementy układu optycznego, to — aby 
uzyskać łatwe w interpretacji obrazy interferencyj¬ 
ne—stosowane elementy optyczne muszą być 
wykonane z bardzo wysoką precyzją, co znacznie 
podnosi koszty budowy interferometrów. 

Przed wynalezieniem holografii można było pro¬ 
wadzić badania interferometryczne tylko przedmio¬ 
tów umieszczonych w układzie optycznym, co było 



















szczególnie niedogodne przy zjawiskach zmiennych 
i krótkotrwałych. Holograficzne utrwalenie takich 
zjawisk pozwala na prowadzenie badań interfero- 
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Rys. 9. Schemat działania dwuwiązkowego holograficznego in¬ 
terferometru do badania jednorodności przezroczystych płyt 




Rys. 10. Holograficzne badania interferencyjne: a) wykonanie 
hologramu obiektu badanego, b) uzyskanie interferogramu ho¬ 
lograficznego — odtworzona z hologramu fala badana nakłada 
się na niezaburzoną przez obiekt falę przedmiotową 

metrycznych w warunkach i w czasie dogodnym dla 
eksperymentatora, przy czym do badań można wyko¬ 
rzystać dowolny układ holograficzny, umożliwiający 
holografowanie badanego obiektu. Aby przeprowa¬ 
dzić badanie interferometryczne, należy po wykonaniu 
hologramu (rys. 10a) usunąć z układu badany obiekt 
i ustawić gotowy hologram dokładnie w miejscu, w 
którym został wykonany. Po oświetleniu hologramu 
falą wzorcową (wolną od przedmiotu falą przedmio- 
fala tową) i falą odniesienia za hologramem w kierunku 
wzorcowa rozchodzenia się fali wzorcowej będą się jednocześnie 
i fala rozchodziły dwie fale świetlne: fala wzorcowa oraz 
badana odtworzona z hologramu fala zawierająca informację 


o badanym obiekcie — fala badana (rys. lOb). Inter- 
ferując między sobą, wytworzą one obraz interferen¬ 
cyjny jak w normalnym interferometrze. Ponieważ 
obie interferujące fale kształtuje ten sam układ optycz¬ 
ny, to z obrazu interferencyjnego można wnioskować 
o własnościach przedmiotu (obraz ten nie zależy od 
kształtu powierzchni falowej fali wzorcowej). Dzięki 
temu w interferometrach holograficznych można 
znacznie obniżyć wymagania co do jakości używanych 
elementów optycznych, a jedynym istotnym warun¬ 
kiem jest dokładne ustawienie hologramu w miejscu 
jego wykonania. 

Przy badaniu obiektów o własnościach optycznych 
stałych lub zmieniających się powoli wygodniej jest obiekty o 
zapisać na hologramie falę wzorcową, a przedmiot własnościach 
wprowadzać do układu na okres badań. Taki układ stałych 
jest ścisłym analogiem zwykłego interferometru dwu¬ 
wiązkowego. 

Ponieważ w omówionych holograficznych układach 
interferencyjnych kształt fali wzorcowej nie odgrywa 
istotnej roli, zatem na drodze tej fali może się znajdo¬ 
wać dowolny element optyczny z matówką włącz¬ 
nie — ważne jest jedynie to, aby się znajdował w tym 
samym miejscu zarówno w czasie zapisu hologramu, 
jak i w czasie badań interferencyjnych. Dzięki temu 
możliwe jest prowadzenie badań różnych procesów 
zachodzących w obszarach ograniczonych przezro¬ 
czystymi nieregularnymi ściankami lub ściankami 
o optycznie niskiej jakości (np. procesów cieplnych 
w żarówkacn czy w wysokociśnieniowych palnikach 
rtęciowych, procesów spalania paliwa w specjalnie 
przygotowanych komorach). 

Badanie obiektów o zmieniających się własno¬ 
ściach polega na porównywaniu zapisanego na holo- obiekty o 
gramie obrazu obiektu w początkowym stanie fizycz- własnościach 
nym z jego obrazem w stanie zmienionym przez przy- zmiennych 
łożenie określonego układu sił, zmianę ciśnienia 
wewnątrz lub na zewnątrz badanego obiektu, zmianę 
jego temperatury, wprowadzenie odkształceń relaksa¬ 
cyjnych, zmianę wilgotności itp. 

Istnieją dwie metody takich badań. W pierwszej, 
tzw. interferometrii w czasie rzeczywistym, hologram jnler- 
badanego obiektu, znajdującego się w określonym sta- f erometria 
nie fizycznym, umieszcza się w miejscu, w którym zos- w czasie 
tał wykonany, i przedmiot pozostawia się w miejscu, rzeczywistym 
w którym był holografowany. Między falą odtworzo¬ 
ną z hologramu i falą ukształtowaną przez przedmiot 
występuje interferencja i na podstawie uzyskanego 
obrazu interferencyjnego można uzyskać informację 
o zmianach własności optycznych wewnątrz obiektu 
(w badaniach w świetle przechodzącym) lub zmianach 
jego powierzchni (zob. il. 146, tabl. 39). 

Dwa stany tego samego obiektu w dwóch różnych 
chwilach można także porównać dokonując dwukrot- interfero- 
nego naświetlania płyty światłoczułej w tym samym metria dwu- 
układzie (interferometria dwuekspozycyjna). Jeżeli ekspozycyjna 
się taki hologram oświetli falą odtwarzającą, zo¬ 
staną odtworzone dwie fale świetlne, odpowiadające 
dwóm różnym stanom obiektu. Fale te utworzą obraz 
interferencyjny umożliwiający wykrycie powstałych 
w obiekcie zmian. Gdy mamy do czynienia z szybko- 
zmiennymi zjawiskami, do uzyskania dwuekspozy- 
cyjnego interferogramu stosuje się lasery impulsowe 
dużej mocy, umożliwiające uzyskanie dwóch silnych 
błysków laserowych w krótkim odstępie czasu. 

Obie metody sfużą do porównania dwóch stanów 
tego samego obiektu, przy czym za ich pomocą można 
wykryć zmiany zachodzące nawet w wiązkach ukształ¬ 
towanych przez silnie rozpraszający obiekt, czego nie 
można byłoby w ogóle dokonać metodami zwykłej 
interferometrii. Metody te, jako metody nie niszczące 
i umożliwiające wykrycie minimalnych zmian poło¬ 
żenia lub kształtu obiektów rozpraszających znalazły 
zastosowanie w różnorodnych badaniach własności badanie 
mechanicznych materiałów i elementów. Metoda materiałów 
dwuekspozycyjna, szczególnie z zastosowaniem lase¬ 
rów dwuimpulsowych,jest użyteczna również w wa¬ 
runkach przemysłowych. Metody interferometrii ho- 
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lograficznej są szeroko stosowane w przemyśle rakie¬ 
towym, lotniczym, samochodowym, energetyce itd. 
Jako przykład można podać zastosowanie holografii 
do wykrywania wad w oponach. W tym celu oponę, 
układ holograficzny i hologram umieszcza się wew¬ 
nątrz komory podciśnieniowej (il. 141, tabl. 37). Na 
hologramie są rejestrowane dwa stany powierzchni 
opony przy dwóch różnych ciśnieniach otaczającego 
powietrza. Miejsca wadliwe przejawiają się w postaci 
zaburzenia struktury powstających prążków interfe- 
badanie rencyjnych. Ponadto interferometria dwuekspozycyj- 
drgań na z zastosowaniem laserów dwuimpulsowych (il. 142, 
tabl. 37) służy do badań deformacji i drgań elementów 
maszyn i urządzeń w czasie ich pracy (badania drgań 
poszycia samolotów i śmigłowców, karoserii i silników 
samochodowych, części obrabiarek itd.). 

Do badania stacjonarnych drgań o niewielkiej am¬ 
plitudzie stosuje się metodę badań z uśrednianiem 
obrazu w czasie rejestracji, zwaną metodą uśrednia¬ 
nia czasowego. Polega ona na tym, że naświetlanie 
hologramu trwa dłużej niż okres drgań. Wówczas na 
hologramie rejestrują się kolejne obrazy przedmiotu 
w każdej fazie ruchu. Przy odtwarzaniu interferujące 
fale tworzą obraz uśredniony, na którym węzły drgań 
przejawiają się w postaci jasnych obszarów otoczo¬ 
nych prążkami o kontraście zanikającym w miarę 
wzrostu aplitudy drgań (il. 144, tabl. 38). Do badania 
drgań o większej amplitudzie (powyżej kilku mikro¬ 
metrów) stosuje się impulsową metodę dwuekspozy- 
cyjną lub holograficzną metodę stroboskopową. Ta 
druga polega na tym, że przedmiot i hologram są 
oświetlane za pomocą krótkotrwałych błysków świetl¬ 
nych padających w chwilach, gdy się obiekt znajduje 
w dwóch ściśle określonych fazach drgań, 
zastosowanie Interferometria holograficzna znajduje również 
w r.ikro- zastosowanie w mikroskopii, służy także do wyzna- 
skopii czania kształtu przedmiotów oraz do zwiększania 
czułości metod interferencyjnych (il. 145, tabl. 38). 


Optyczne przetwarzanie i przechowywanie 
informacji 

Różnica pomiędzy układami elektronicznymi i op¬ 
tycznymi sprowadza się do tego, że w układach elek¬ 
tronicznych informacja jest przekazywana i prze¬ 
twarzana w postaci sekwencji impulsów, natomiast 
w układach optycznych jest ona przedstawiana w po¬ 
staci dwuwymiarowego rozkładu natężenia światła. 



Rys. 11. Schemat układu optycznego do analizy fourierowskiej 
i filtracji częstości przestrzennych. Soczewka / dokonuje trans¬ 
formacji fourierowskiej przezrocza i w płaszczyźnie fourierowskiej 
tworzy jego transformatę, którą soczewka II przetwarza na obraz 
obiektu. Wstawiając w płaszczyźnie fourierowskiej odpowiednie 
filtry amplitudowo-fazowe można modyfikować obraz przed¬ 
miotu tworzony przez soczewkę II 
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Dzięki tej właśnie różnicy układ optyczny może jed¬ 
nocześnie przekazywać i przetwarzać dużą ilość in¬ 
formacji, co gwarantuje dużą szybkość działania. 

Specyfika pracy układów optycznych czyni je 
szczególnie przydatnymi do realizacji działań typu 
mnożenia funkcji przez siebie oraz niektórych prze¬ 
kształceń całkowych. Jako przykład można podać, że 
zwykła soczewka skupiająca wykonuje w sposób na- przefcształ* 
tychmiastowy dość złożoną operację z dziedziny wyż- cenie Foti- 
szej matematyki, a mianowicie przekształcenie Fou- riera w 
riera dowolnej funkcji dwóch zmiennych, reprezento- układzie 
wanej jako przepuszczalność przezrocza (przezrocze optycznym 
osłabia amplitudę padającej fali świetlnej w sposób 
proporcjonalny do wartości analizowanej funkcji 
w danym punkcie). Jeżeli się takie przezrocze ustawi 
w przedniej płaszczyźnie ogniskowej soczewki sku¬ 
piającej, to rozkład amplitudy i fazy światła w tylnej 
płaszczyźnie ogniskowej tej soczewki będzie przedsta¬ 
wiał transformatę Fouriera analizowanej funkcji. 

Ustawiając za tą płaszczyzną drugą soczewkę tak, aby 
jej przednia płaszczyzna ogniskowa pokrywała się 
z tylną płaszczyzną ogniskową pierwszej soczewki, 
w tylnej płaszczyźnie ogniskowej drugiej soczewki 
uzyska się obraz przezrocza (rys. 11). 

Przez wstawienie między soczewkami w ich wspól¬ 
nej płaszczyźnie ogniskowej elementu optycznego 
zaburzającego amplitudę i fazę przechodzącego świat¬ 
ła można w różny sposób wpływać na obraz przedmio- 
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Rys. 12. Holograficzny układ do szyfrowania i przetwarzania 
informacji: a) zapis hologramu przedmiotu (litera B) z rozciągłym 
źródłem wiązki odniesienia (litera A), b) odtwarzanie hologramu 
z użyciem również rozciągłego źródła wiązki odtwarzającej. 
Źródło wiązki odniesienia służącej do kodowania obrazu po¬ 
winno mieć możliwie duże wymiary i możliwie złożoną strukturę 
amplitudowo-fazową; natomiast do rozpoznawania obrazów 
używa się jako przedmiotu—punktowego źródła światła, a wów¬ 
czas w miejscu prostego obrazu tworzy się obraz będący funkcją 
korelacji między rozciągłymi źródłami wiązki odniesienia i wiązki 
odtwarzającej 















































tu (np. polepszyć jego ostrość, usunąć fragment obra¬ 
zu; rys. 11). Elementy służące do tego celu nazywają 
się filtrami częstości przestrzennych. Wykonanie 



filtry częs- amplitudowo-fazowego filtru zwykłymi metodami 
tości prze- jest bardzo pracochłonne. W niektórych wypadkach 
strzennych takie filtry można łatwo wykonać metodami hologra¬ 
ficznymi. Taką metodę zastosowano np. do wyostrza¬ 
nia zdjęcia wirusa fd, uzyskanego za pomocą mikro¬ 
skopu elektronowego; dzięki temu po raz pierwszy 
wyraźnie uwidoczniono strukturę heliksu tego wiru¬ 
sa, podobną do heliksu cząsteczki białka DNA (il. 147, 
tabl. 39). 

Jeżeli do zapisu i odtwarzania hologramu zastosu¬ 
jemy układy optyczne, w których źródło fali odniesie¬ 
nia i źródło fali przedmiotowej mają złożoną roz¬ 
ciągłą strukturę, to obraz holograficzny otrzymany 
przy odtwarzaniu falą świetlną różniącą się od fali 
odniesienia będzie miał również złożoną strukturę, 
szyfrowanie Obraz ten będzie czytelny, jeżeli fala odtwarzająca 
informacji będzie identyczna z falą odniesienia. Jeżeli fala od¬ 
niesienia będzie miała odpowiednio złożoną strukturę 
(np. źródłem fali odniesienia będzie oświetlona raa- 
tówka o zupełnie przypadkowej strukturze), to od¬ 
tworzenie obrazu będzie możliwe tylko w wypadku 
zastosowania przy odtwarzaniu tej samej matówki. 
Z teoretycznego punktu widzenia jest to idealny spo¬ 
sób szyfrowania informacji (rys. 12). 

Ten sam układ może być wykorzystany do optycz¬ 
nego porównywania dwóch obrazów mających okre¬ 
ślone rozkłady amplitudy i fazy. Jako przedmiot sto¬ 
suje się wówczas punktowe źródło światła, a porów¬ 
nywane przedmioty odgrywają rolę odpowiednio roz¬ 
ciągłego źródła fali odniesienia i fali odtwarzającej. 
Przy otwarzaniu punktowy obraz otrzymuje się tylko 
wtedy, gdy oba przedmioty mają identyczną strukturę 
amplitudowo-fazową. W przeciwnym razie odtworzo- 
psmięć ny obraz ma kształt rozmytej plamki, a stopień jej 
holograficzna rozmycia może być miarą różnic w porównywanych 
przedmiotach. Najbardziej znane przykłady zastoso¬ 
wania holografii do tego celu — to identyfikacja od¬ 
cisków palców czy analiza grafologiczna rękopisów. 
Metoda ta może też służyć do automatycznego po¬ 
szukiwania określonych danych z dużego zbioru (np. 


wyszukiwanie prac o określonej tematyce, zawierają¬ 
cych określone słowa-hasła, jak holografia, lasery itp.). 

Obecnie produkowane materiały fotograficzne o 
wysokiej zdolności rozdzielczej umożliwiają groma¬ 
dzenie dużej ilości informacji na małych powierz¬ 
chniach (duża gęstość zapisu informacji, przewyższa¬ 
jąca wszelkie inne znane sposoby zapisu — magne¬ 
tyczne, elektroniczne itp.). 

W odróżnieniu od innych metod, w których zapis 
informacji ma lokalny charakter, na hologramie in¬ 
formacja o poszczególnych fragmentach obrazu może 
być zapisana na całej jego powierzchni; wskutek tego 
lokalne uszkodzenia hologramu nie powodują straty 
odpowiedniego fragmentu obrazu, lecz jedynie spa¬ 
dek jego jasności, proporcjonalny do wielkości usz¬ 
kodzonej części, oraz zmniejszenie kontrastu. 

Teoretyczna analiza wykazuje, że holograficznymi gęstość 
metodami na płaskich hologramach można rejestro- zapisu 
wać informację z gęstością ok. 8-10* bitów/cm 2 , a z informacji 
użyciem hologramów objętościowych z gęstością 
10 12 -10 13 bitów/cm 3 . W praktyce na cienkich emul¬ 
sjach fotograficznych uzyskuje się gęstość zapisu 
10 4 -10 5 bitów/ mm 2 — przy zapisie informacji w 
układzie binarnym (w postaci ciemnych lub jasnych 
kwadratów) lub 2000 liter alfabetu — przy hologra¬ 
ficznej rejestracji tekstu drukowanego 

Już obecnie zbudowano kilka urządzeń do magazy¬ 
nowania informacji w postaci mikrohologramów 
z zarejestrowanymi stronami tekstu, obrazami gra¬ 
ficznymi lub stronami zawierającymi informację w 
postaci binarnej (rys. 13). Umożliwiają one przedsta¬ 
wienie zarejestrowanej informacji w postaci wizual¬ 
nej, a niektóre z nich mogą być również podłączone 
do komputerów jako zewnętrzna pamięć stała. 


Holografia w technice audiowizualnej 

W przyszłości holografia znajdzie niewątpliwie za- holografia 
stosowanie w dziedzinie dydaktyki; trójwymiarowe w dydaktyce 
obrazy holograficzne zastąpią z czasem inne pomoce 
naukowe we wszystkich wypadkach, w których ważne 
będzie zachowanie trójwymiarowości, a demonstracja 
naturalnych obiektów nie będzie możliwa, jak również 
niemożliwe będzie zastąpienie ich modelami (np. 
rzadkie lub chronione okazy fauny i flory, jedyne 
w swoim rodzaju okazy geologiczne lub wykopali¬ 
skowe, niepowtarzalne dzieła sztuki, przedmioty 
historyczne itp.). 

Zarejestrowane na cienkim materiale światłoczu¬ 
łym obrazy holograficzne muszą być odtwarzane w 
świetle monochromatycznym, toteż odtworzone obra¬ 
zy mają barwę światła odtwarzającego i nie odzwier¬ 
ciedlają barwy przedmiotu. Tego typu hologramy 
mogą więc znaleźć zastosowanie wówczas, gdy barwa 
obrazu nie odgrjwa istotnej roli, natomiast ważne jest 
zachowanie trójwymiarowości. 

Dalsze rozpowszechnienie holografii do celów de- hologramy 
monstracyjnych będzie zależało od możliwości od- barwne 
tworzenia naturalnej barwy przedmiotu. Sposoby 
uzyskiwania hologramów barwnych przedmiotów 
niesamoświecących są już znane i sprowadzają się do 
wykonywania hologramu z użyciem trójbarwnego 
promienia laserowego, natomiast nie można na razie 
uzyskać w sposób bezpośredni hologramów przedmio¬ 
tów samoświecących. W obu wypadkach zagadnienie 
to jest bardzo złożone i wciąż pozostaje do rozwiąza¬ 
nia wiele problemów technicznych i technologicz¬ 
nych. 

Po rozwiązaniu wszystkich tych trudności, a zwłasz¬ 
cza po opanowaniu techniki holografowania żywych 
obiektów oraz technologii odtwarzania hologramów 
w świetle nielaserowym, można spodziewać się po¬ 
wstania atelier holograficznych, w których można bę¬ 
dzie zamawiać portrety holograficzne. 

Ponieważ metodami holograficznymi uzyskuje się 
z płaskiego interferencyjnego obrazu obraz trójwy¬ 
miarowy, zdawałoby się rzeczą naturalną wykorzy- 



















kina stanie holografii w kinie i telewizji. W tym jednak 
holograficzne spadku dochodzi dodatkowy problem — utrwale¬ 
nia ruchu. Ze względów technicznych wydaje się mało 
prawdopodobne, aby kiedykolwiek zrealizowano kino 
lub telewizję trójwymiarową w postaci szybko wy¬ 
mienianych hologramów wielkości ekranu. W kinie 
holograficznym badania zmierzają obecnie w dwóch 
kierunkach. Jeden ze sposobów rozwiązania tego 
zagadnienia polega na tym, że za pomocą lasera im¬ 
pulsowego o odpowiednio wysokiej mocy i odpowied¬ 
niej częstości powtarzania błysków na błonie filmo¬ 
wej jest rejestrowana sekwencja hologramów po¬ 
mniejszonych trójwymiarowych obrazów przedmiotu, 
które przy odtwarzaniu są ponownie powiększane 
i za pomocą specjalnych ekranów (wykonanych rów¬ 
nież metodami holograficznymi) są odwzorowywane 
w przestrzeni przed widownią. 

Innym rozwiązaniem są kina stereoskopowe. Są w 
nich wyświetlane dwa obrazy — jeden odpowiada le¬ 
wemu, drugi prawemu oku — kierowane niezależnie 
do każdego oka za pomocą ekranów holograficznych. 
Ekrany te, wykonane w postaci grubego hologramu, 
mają tę właściwość, że rzutowane na nie obrazy z pro¬ 
jektora ustawionego w określonym punkcie prze¬ 
strzeni są odbijane na widownię w taki sposób, że 
można je obserwować tylko wówczas, gdy oko widza 
trafi w jedną z dużej liczby stref, na które podzielona 
jest widownia. Naprzemianległe strefy różnią się tym, 
że do jednej trafia obraz wyświetlany z jednego pro¬ 
jektora, do drugiej — z drugiego. Odległość między 
strefami jest dobrana tak, że zawsze jedno oko znaj¬ 
duje się w jednej strefie, drugie — w drugiej (rys. 14). 
Jeżeli więc projektory jednocześnie wyświetlają dwa 
obrazy odpowiadające punktom widzenia poszczegól¬ 
nych oczu, to u widza powstaje wrażenie głębi. Ekrany 
te muszą być wykonane z bardzo wysoką dokładno¬ 
ścią, co przy dużych ich wymiarach jest poważną 
przeszkodą; jednak z czasem na pewno można ją 
będzie przezwyciężyć. 

telewizja Bezpośrednie zastosowanie holografii do celów 
holograficzna telewizyjnych nie jest w chwili obecnej możliwe ze 
względu na ograniczoną przepustowość kanału te¬ 
lewizyjnego; nie może on w standardowym czasie 
0,04 s przekazać ilości informacji niezbędnej do uzy¬ 
skania hologramu. 1 mm 2 dobrego hologramu zawiera 
mniej więcej tyle informacji, co pełny obraz telewi¬ 
zyjny. Aby tę informację można było odczytać, układ 
analizujący kamery powinien mieć zdolność rozdziel¬ 
czą 10-20 razy wyższą od obecnie stosowanej, przy 
czym analizowana powierzchnia powinna być równa 
powierzchni ekranu telewizyjnego. Aby zaś cały ten 
obraz można było przekazać przez układ telewizyjny 
w odpowiednim czasie, jego przepustowość powinna 
być ok. 10 5 razy większa niż kanałów stosowanych 
obecnie. Następnym problemem jest wytworzenie 

projektor obrazu 

ekran dla prawego oka 



Rys. 14. Zasada kina stereoskopowego z ekranem holograficz¬ 
nym kierującym do odpowiedniego oka obrazy wyświetlane przez 
oddzielnie projektory 
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hologramu w odbiorniku telewizyjnym z taką samą 
zdolnością rozdzielczą jak na wejściu, a także odtwo¬ 
rzenie obrazu z przekazanego hologramu. Na razie 
zagadnienia te nie zostały w zadowalający sposób 
rozwiązane. Wydaje się, że jedynym wyjściem byłoby 
znalezienie sposobu redukcji przekazywanej infor¬ 
macji, tym bardziej, że jak wykazują badania — do 
wywołania pełnego wrażenia głębi wystarczy ilość 
informacji najwyżej 10-15 razy większa niż w zwykłym 
obrazie telewizyjnym. 


Inne zastosowania 

Znając matematyczny opis kształtu przedmiotu, jego 
położenie w przestrzeni oraz położenie źródła oświe¬ 
tlającego przedmiot i źródła fali odniesienia, można 
obliczyć rozkład natężenia światła w płaszczyźnie 
hologramu, a tym samym i jego -zaczernienia. Taki 
sam rozkład zaczernień płyty holograficznej można 
uzyskać naświetlając ją odpowiednio punkt po punk¬ 
cie. W ten sposób można uzyskać hologram obiektu 
realnie nie istniejącego, co wykorzystuje się do mo¬ 
delowania kształtu nowych wyrobów z pominięciem 
procesu wykonywania modelu plastycznego. Zaletą 
holograficznego modelu jest możliwość przekształceń 
obrazu przez zmianę geometrii układu odtwarzają- modelowani 
cego. Ta właściwość znajduje praktyczne zastosowa- holograficzn 
nie do modelowania w polu widzenia pilota trójwy¬ 
miarowego obrazu lądowiska przy ślepym lądowaniu 
samolotu. 

Metody holograficzne można także stosować do pomiar 
pomiaru kształtu lub rozkładów przestrzennych. Sto- kształtu 
sując lasery impulsowe, tą metodą można badać za¬ 
chowanie się różnych obiektów w ruchu. 

Kiedy oświetlimy hologram falą' sprzężoną do fali 
odniesienia, to w miejscu, w którym się znajdował 
przedmiot, powstanie jego wierny obraz. Dokładność 
odwzorowania i zdolność rozdzielcza w tym obrazie 
będą tym większe, im dokładniej fala odtwarzająca 
będzie oddawała kształt fali odniesienia oraz im więk¬ 
sza będzie powierzchnia hologramu. Odtworzony 
w ten sposób obraz można obserwować bezpośrednio 
na matówce lub fotografować bez stosowania żad¬ 
nych elementów optycznych (zazwyczaj obniżających 
jakość obrazu), wstawiając płytę fotograficzną w 
miejscu tworzenia się obrazu. Następnie na pod¬ 
stawie tego obrazu można dokładnie wyznaczyć 
kształt obiektu. 

Holograficznie można także z wysoką zdolnością 
rozdzielczą rzutować obrazy. Zarejestrowany na ho¬ 
logramie obraz o złożonej drobnej strukturze może 
być rzutowany na dowolną powierzchnię przez oświe¬ 
tlenie hologramu falą odtwarzającą we wspomniany 
wyżej sposób. Ponieważ zdolność rozdzielcza układu 
optycznego zależy od jego apertury, czyli od stosunku 
wymiarów poprzecznych hologramu do jego odleg¬ 
łości od obiektu, to można zapewnić odwzorowanie zastosowanie 
z dużą zdolnością rozdzielczą. Z tego względu metoda w mikro- 
ta może być przydatna w mikroelektronice — do na- elektronice 
noszenia odpowiednich obrazów w trakcie produkcji 
układów scalonych. Dodatkowe zalety holografii po¬ 
legają na tym, że rzutowanie odbywa się w sposób 
bezdotykowy i że małe uszkodzenia powierzchni ho¬ 
logramu nie mają istotnego wpływu na jakość rzuto¬ 
wanego obrazu. 

Przytoczone tu przykłady zastosowań holografii 
obejmują zaledwie niewielką ich część. Na wymie¬ 
nienie zasługują jej zastosowania w technologii ele¬ 
mentów optycznych (do wykonywania siatek dyfrak¬ 
cyjnych, elementów ogniskujących, elementów optyki 
zintegrowanej, odchylaczy wiązek świetlnych itd.), 
w mikroskopii rentgenowskiej i elektronowej (meto¬ 
dami holograficznymi udało się po raz pierwszy 
uzyskać obraz powłoki L atomów neonu i argonu), w 
radiolokacji (wykorzystanie holografii umożliwia 
uzyskanie na lecącym samolocie obrazów radiolo¬ 
kacyjnych o zdolności rozdzielczej porównywanej 






























z uzyskiwaną w zdjęciach lotniczych), w geofizyce 
(holografia służy do obróbki sejsmogramów), w to¬ 
mografii rentgenowskiej (do uzyskania trójwymiaro¬ 
wych obrazów) i w wielu innych dziedzinach. 

Przedstawiony, niezupełny zresztą, przegląd zasto¬ 
sowań holografii dobitnie ukazuje, jak stosunkowo 
prosta idea wywodząca się z podstawowych teorii 
fizycznych może doprowadzić do ujawnienia wielkich 
możliwości technicznych, inspiruje do szukania moż¬ 


liwości praktycznego jej zastosowania. Jednocześnie 
na przykładzie holografii widać, że wielu takich moż¬ 
liwości jeszcze nie wykorzystano, że kryją je w sobie 
teorie fizyczne na pozór całkowicie poznane i że do 
ujawnienia ich trzeba nieco odmiennego niż powszech¬ 
nie przyjęte — spojrzenia. 

A. Piekara Nowe oblicze optyki, Warszawa 1976; H. Royer, P. 
Śmigielski, J.CH. Vienot Holografia optyczna. Warszawa 1975, 
Holografia, podstawy fizyczne, teoria i zastosowanie, pr. zbioro¬ 
wa, Warszawa 1979. 


Optyka fourierowska 

Andrzej G. Kalestyński 



Wykorzystanie światła jako nośnika informacji, a 
układów optycznych jako urządzeń służących do jej 
przetwarzania charakteryzowało optykę od samych 
jej początków. Postęp w optyce, który nastąpił w osta¬ 
tnich latach, jest związany z jednej strony z pojawie¬ 
niem się źródeł światła spójnego — laserów, z drugiej 
— z nową metodą opisu zjawisk zachodzących w op¬ 
tycznym torze przesyłania informacji, polegającą na 
zastosowaniu języka zaczerpniętego z telekomunikacji. 
Należy jednak pamiętać, że owo wykorzystanie pojęć 
i opisu typowego dla kanałów łączności nieoptycznej 
stało się możliwe dzięki poprzednim pracom i odkry¬ 
ciom optyków: E. Abbego, J. Rayleigha, A. Michel- 
sona, M. Wolfkego (profesora Politechniki War¬ 
szawskiej), F. Zernikego, A. Mareshala, N. Francona, 
D. Gabora i in. 

Dopóki wierność odwzorowań optycznych oce¬ 
niano okiem, nie było większej potrzeby uściślania 
kryteriów j akości obrazów optycznych. Dopiero roz¬ 
wój telewizji, radiolokacji oraz radioastronomii skło¬ 
nił do spojrzenia na proces tworzenia obrazów z pun¬ 
ktu widzenia teorii informacji, która się początkowo 
rozwijała na gruncie badania kanałów łączności nie¬ 
optycznej. Pojawienie się i doskonalenie laserów, 
wydajnych źródeł światła spójnego, tych swoistych 
anten świetlnych, otworzyło wielkie możliwości przed 
optycznym przenoszeniem i przetwarzaniem danych 
i ich zbiorów (czyli wiadomości) przy użyciu światła 
jako nośnika informacji; podkreślić trzeba, że w pro- 
światło jako cesie tym ważne jest nie tylko otrzymanie wiernego 
nośnik obrazu (ewentualnie powiększonego lub pomniejszo- 
informacji nego), lecz również jego odpowiednie przekształce¬ 
nie. W optyce wiadomość to po prostu obraz. Prze¬ 
noszenie i przetwarzanie wiadomości w kanałach 
optycznych można opisać za pomocą pojęcia transfor¬ 
macji optycznej. Przejście od rozkładu pola świetlnego 
przedmiotu do rozkładu pola świetlnego w obrazie 
dyfrakcyjnym, wytworzonym przez ten przedmiot, 
jest przykładem transformacji optycznej pola świetl¬ 
nego, zachodzącej dzięki zjawiskom ugięcia i inter- 
opfyczne ferencji światła. Transformacjom optycznym, ulega 
przetwarza- światło przechodzące przez rozmaite ośrodki patural- 
nie informacji ne lub elementy optyczne. Transformacje Fouriera 
i Fresnela, odpowiadające dwóm typom zjawisk dy¬ 
frakcyjnych — dyfrakcji Fraunhofera i dyfrakcji 
Fresnela, są podstawą opisu większości procesów 
wytwarzania obrazów w przyrządach optycznych 
zarówno tradycyjnych, jak i całkiem nowych, np. 
w komputerach optycznych czy układach hologra¬ 
ficznych. Optyka fourierowska opisuje procesy prze¬ 
twarzania sygnałów optycznych z punktu widzenia 
transformacji Fouriera. 


Transformacja Fouriera w optyce 


prostopadłej do kierunku rozchodzenia się światła, 
można uważać za falę płaską. Obserwator dysponu¬ 
jący metodą pomiaru natężenia światła (wielkości 
związanej z jego energią) i fazy (wielkości związanej 
z drogą, którą przebywa fala świetlna) stwierdzi, że 
obie te wielkości są jednakowe wzdłuż całego odcinka 
AB. Załóżmy następnie, że źródło światła leży w punk- 
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cie S , tak że odcinek AB leży pod kątem V do kierunku 
rozchodzenia się światła. Obserwator i tym razem 
stwierdzi, iż natężenie światła na prostej AB jest je¬ 
dnakowe. Okaże się jednak, iż fazy wyznaczone np. 
w punktach O i O ' będą różne z powodu różnicy dróg 
optycznych CO'. Wzdłuż odcinka AB faza zmienia się 
periodycznie z okresem zależnym od kąta #. 

Rozważaną sytuację można odwrócić i potraktować 
odcinek AB jako źródło światła o jednakowym natę¬ 
żeniu i jednakowych fazach wzdłuż całej długości od¬ 
cinka AB. Można się spodziewać, że wtedy światło 
o jednakowej fazie będzie się rozchodziło w kierunku 
S. Natomiast jeśli faza będzie się zmieniała wzdłuż 
AB w określony wyżej sposób, to światło o jednako¬ 
wej fazie będzie się rozchodziło w kierunku S\ a nie S. 
Zatem istnieje związek między przestrzennym roz¬ 
kładem pola wzdłuż odcinka (współrzędna x) a roz¬ 
kładem kątowym (współrzędna #). Jeden rozkład pola 
świetlnego może być przekształcony w drugi rozkład 
pola świetlnego za pomocą przekształcenia Fouriera 
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co oznacza, że funkcja F($) jest transformatą Fouriera 
f{x) i odwrotnie — funkcja f{x) jest transformatą funk¬ 
cji F{&), a 7{} jest operatorem przekształcenia 
Fouriera. 

Podobne rozumowanie można przeprowadzić w 
przypadku dwóch zmiennych, rozpatrując zamiast 
odcinka AB płaszczyznę prostopadłą do kierunku 
S. Dochodzi się wówczas do przekształceń: 



Istotę transformacji Fouriera można wytłumaczyć na 
następującym przykładzie. Wyobraźmy sobie, że 
punktowe źródło światła monochromatycznego S 
(rys. 1) znajduje się tak daleko („w nieskończoności”), 
że falę świetlną, która dociera do odcinka AB prostej 
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Wyobraźmy sobie, że znamy pewne pole świetlne 
na płaszczyźnie x 0 , y 0 , czyli znamy rozkład natężenia 
pola i rozkład jego fazy we wszystkich punktach tej 
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płaszczyzny. Pytamy, jakie będzie pole świetlne 
w płaszczyźnie*, podległej od z od płaszczyzny x 0 , Jo? 
Otóż J. W. Rayleigh zaważył, że aby otrzymać od¬ 
powiedź na to pytanie, najlepiej rozłożyć wyjściowe 
pole świetlne na nieskończony zbiór fal płaskich roz- 
biegających się pod różnymi kątami # i 9 ? (-+ Ho¬ 
lografia). Oznacza to dokonanie transformacji Fou¬ 
riera i przejście w opisie od współrzędnych x 0 ,y 0 do 
współrzędnych kątowych # , <p. Otrzymuje się w ten 

kątowe -?oia sposób tzw. widmo kątowe P($, <p) pola świetlnego 
świetlnego danego w płaszczyźnie * 0 > Jo, czyli rozkład amplitud 
‘ i faz płaskich fal składowych w zależności od kierun¬ 
ków ich rozchodzenia się określonych kątami #, <p. 
Rozkład pola świetlnego (natężenia i fazy) w płasz¬ 
czyźnie *, y odległej o z od płaszczyzny wejściowej 
otrzymuje się przez całkowanie widma kątowego wej¬ 
ściowego pola świetlnego po współrzędnych kąto¬ 
wych. Rozkład pola świetlnego na zbiór elementar¬ 
nych fal płaskich przypomina rozkład drgań struny 
o unieruchomionych końcach na drgania składowe 
o częstościach równych wielokrotnościom częstości 
podstawowej (częstości harmoniczne). Funkcję opi¬ 
sującą kształt struny w danej chwili można przedsta¬ 
wić w postaci sumy drgań sinusoidalnych, zwanej 
szeregiem Fouriera. W optyce zwykle nie ma wyróż¬ 
nionego dyskretnego zbioru fal składowych, dlatego 
posługujemy się całkami, a nie szeregami Fouriera. 

Zamiast współrzędnych kątowych #, <p można 
wprowadzić zmienne co x = cos #/A,ct> y = In cos <p/X t 

gdzie A— długość fali świetlnej. Zmienne co x , co y 
częstości naZ y Wa ją s ię częstościami (częstotliwościami) prze- 

przestrzenne s t rzenn y m i i odgrywają rolę analogiczną do częstości 
czasowej cot y występującej m.in. w radiotechnice. Wid¬ 
mo kątowe wyrażone w zmiennych co Xf (Dy, czyli 
P(cóx, (Dy) nazywa się widmem częstościowym prze¬ 
strzennym pola świetlnego. Do opisu barwy fali 
świetlnej wystarcza częstość czasowa, natomiast do 
pełnego opisu rozchodzenia się w przestrzeni trój¬ 
wymiarowej sygnałów optycznych trzeba się jeszcze 
posłużyć częstościami przestrzennymi. Z tego już 
widać, że układy optyczne są sposobniejsze do prze¬ 
twarzania informacji niż układy elektroniczne. Nie¬ 
wielka bowiem zmiana barwy w optyce odpowiada 
modulacji częstości (czasowych) w elektronice, ale 
tor modulacja częstości przestrzennych w optyce nie ma 
żadnego odpowiednika w telekomunikacji nieoptycz- 
nej. Tor optyczny jest układem optycznym składają¬ 
cym się z filtrów częstości przestrzennych i modula¬ 
torów, którymi są np.: przestrzeń swobodna, soczewki 
sferyczne, cylindryczne czy stożkowe, siatki dyfrak¬ 
cyjne różnych typów oraz najrozmaitsze przesłony 
umieszczane w różnych płaszczyznach optycznych. 
W torze (układzie) optycznym można zawsze rozróż¬ 
nić wejście i wyjście, tzn. miejsce, gdzie się wprowadza 
dane (sygnały optyczne), oraz miejsce, gdzie się je wy¬ 
prowadza (w postaci np. obrazów optycznych). 
W wypadku płaskich sygnałów optycznych mówi się 
o płaszczyźnie wejściowej i wyjściowej. 

Zdolność rozdzielcza układu optycznego, który 
funkcia dokona ^ przetworzenia wejściowego sygnału optycz- 
^ ne §° w obraz przedmiotu, wiąże się ściśle z tzw. 
funkcją rozmycia. Wyjaśnimy to pojęcie na przykła¬ 
dzie soczewki wytwarzającej obraz świecącego punktu. 
Obraz punktowego przedmiotu nigdy w praktyce nie 
jest punktem. Dyfrakcja na skończonej źrenicy so¬ 
czewki, aberracje, a także i rozproszenia powodują, 
iż obraz punktu jest rozmyty. Nawet jeśli się posłu¬ 
żymy np. soczewką sferyczną o dobrze skorygowa¬ 
nych aberracjach (bezaberracyjną) i całkowicie usu¬ 
niemy rozproszenie w układzie optycznym, obraz 
przedmiotu punktowego będzie rozmyty. Ogólnie 
biorąc, pole świetlne obrazu przedmiotu punktowego 
w płaszczyźnie obrazowej soczewki można opisać za 
pomocą zespolonej funkcji rozmycia R(x,y) = 
= R(*, j)e ł *<**io. Kwadrat modułu tej funkcji 

|R(*,y )| 2 jest równy rozkładowi natężenia światła 
obrazu i można go wyznaczyć doświadczalnie (rys. 2 ). 
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Funkcja <p(x,y) określa przesunięcie fazy między 
przedmiotem i obrazem. Jeśli to jest układ bezaber- 
racyjny, funkcja rozmycia wszystkich punktów x 0 , 

punkt 


Rys. 2. Rozmycie obrazu 
punktowego źródła światła. 

Otworek jest źrenicą foto¬ 
detektora służącego do po¬ 
miaru rozkładu natężenia 
rozmycia 

y 0 przedmiotu jest symetryczna, a funkcja y równa 
jest zeru. W rzeczywistych układach optycznych, gdy 
występują np. aberracje poprzeczne, <p ^ 0 . 

Obraz przedmiotu złożonego, składającego się 
z wielu punktów, można opisać sumując funkcje roz¬ 
mycia wszystkich punktów. Zdolność rozdzielcza 
układu optycznego jest tym większa, im ostrzejsze 
maksimum ma funkcja rozmycia tego układu dla 
przedmiotu punktowego. Funkcję rozmycia często 
nazywa się odpowiedzią impulsową układu optycz- 
nego. 

W procesie tworzenia obrazu ważne jest także, 
w jakim stopniu kontrast z przedmiotu może być prze¬ 
niesiony do obrazu. Dwie linie szare przedmiotu 
łatwo się zlewają w obrazie w jedną, podczas gdy 
linię czarną sąsiadującą z białą ten sam układ optycz¬ 
ny może rozdzielić. Miarą kontrastu jest współczyn¬ 
nik y — (/max — /min)/(/max+/min), gdzie W i /min “ 
natężenie światła w najjaśniejszych i najciemniej¬ 
szych miejscach przedmiotu. Współczynnik przeno¬ 
szenia kontrastu przez układ optyczny można okre¬ 
ślić jako stosunek kontrastu obrazu yobrazu do kon¬ 
trastu przedmiotu ^przedmiotu: 

H = yobrazu/yprzedmiotu* 

Okazuje się, że współczynnik H zależy od częstości 
przestrzennych co x , co y ; nosi on nazwę funkcji prze¬ 
noszenia kontrastu lub funkcji przenoszenia modu¬ 
lacji H(CO X ,COy). 

Przedmiot oświetlony, czyli sygnał optyczny na 
wejściu układu optycznego charakteryzuje się także 
rozkładem fazy. Zatem oprócz przenoszenia kontrastu 
trzeba także brać pod uwagę funkcję przenoszenia 
fazy, IZ 7 = ^(c 0 z,c 0 y). Tak więc funkcja H(co x , <o y ) = 
= H(co x ,coy)e i ' ł ' i “ > * t<0 v> jest pełną optyczną funkcją 
przenoszenia danego układu optycznego. Działanie 
układu optycznego można przeto opisać albo za po¬ 
mocą funkcji przenoszenia H{co Xy co y ) y albo funkcji 
rozmycia R(x, y) y przy czym jedna z tych funkcji jest 
transformatą fourierowską drugiej. 

Funkcję przenoszenia układu optycznego można 
wyznaczyć z porównania rozkładu natężenia światła 
przedmiotu i obrazu (w wypadku oświetlenia niespój¬ 
nego) lub rozkładu amplitud i fazy pola świetlnego 
przedmiotu i obrazu (w wypadku oświetlenia spój¬ 
nego). 

Znajomość funkcji przenoszenia układu optycznego 
spójnego lub niespójnego umożliwia wyznaczenie 
sygnału (obrazu) na wyjściu układu przy danym syg¬ 
nale na wejściu. 

Układy optyczne różnią się nieco swym działa¬ 
niem— zależnie od tego, czy użyto źródła światła 
spójnego czy też niespójnego (koherentnego czy nie¬ 
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koherentnego). Chodzi tu nie tylko o spójność cza¬ 
sową, lecz także spójność przestrzenną, czyli wystę¬ 
powanie stałej różnicy faz w całym przekroju wiązki 


dziwne, jednak przestrzeń swobodna jest także filtrem 
częstości przestrzennych i jej funkcja przenoszenia nie 
jest tożsamościowo równa jedności, jak można by 



przy > * 2 - 


wy)] coraz bardziej 



Rys. 3. Rozkład natężenia w obrazie dwóch źródeł punktowych, 
leżących w minimalnej odległości rozróżnialnej (wg kryterium 
Rayleigha): źródła niespójne (a) i źródła spójne o różnicy faz q> (b) 


Fresnela, funkcję przenoszenia przestrzeni swobodnej swobodnej 
można przedstawić wzorem: 

H(cdx,co v ) = exp[(-iz/2£)(G>*+fc> 2 )]. 


oświetlającej przedmiot na wejściu układu optycz¬ 
nego (-> Spójność światła). Dla uproszczenia mówi 
się o koherentnych i niekoherentnych układach op¬ 
tycznych. Różnica między obu typami układów ujaw¬ 
nia się wyraźnie w ich zdolności rozdzielczej. Rysu¬ 
nek 3a przedstawia rozkład natężenia w obrazie dwóch 
punktów oświetlanych światłem niespójnym, znaj¬ 
dujących się w odległości minimalnej wg kryterium 
Rayleigha (zgodnie z tym kryterium odwrotność 
zdolności rozdzielczej, czyli minimalna odległość 
między dwoma rozróżnia Inymi punktami Ae — 
= 1,22 dX/ł, gdzie d— odległość obrazu od płasz¬ 
czyzny soczewki wyjściowej, / — średnica źrenicy 
wyjściowej układu optycznego, zwykle jest to śred¬ 
nica najmniejszej soczewki użytej w układzie, A-— 
długość fali). Na rys. 3b pokazano rozkład natężenia 
obrazu owych dwóch punktów, z których każdy 
oświetlony jest światłem spójnym. Rozkład ten za¬ 
leży od różnicy fazy światła w tych punktach. Jeśli 
różnica faz <p = 90°, to rozkład jest taki jak przy 
oświetleniu niespójnym; jeśli <p = 0°, zdolność roz¬ 
dzielcza jest mniejsza niż w przypadku oświetlenia 
niespójnego, jeśli zaś y = 180°, zdolność rozdziel¬ 
cza jest większa. Ale sama zdolność rozdzielcza nie 
decyduje o tym, który typ oświetlenia jest lepszy. Za¬ 
lety oświetlenia spójnego ujawniają się przy zapisy¬ 
waniu pełnej informacji o sygnale świetlnym (ampli¬ 
tudy i fazy), przy filtracji częstości przestrzennych itd. 

Omówimy dalej w ujęciu optyki fourierowskiej 
dwa podstawowe elementy optyczne: przestrzeń swo¬ 
bodną i soczewkę skupiającą. 


Przestrzeń swobodna 

Elementem optycznym jest nawet sama przestrzeń 
zawarta między płaszczyznami wejściową x 0 , y Q 
i wyjściową x t y odległymi o z. Choć się to wydaje 


Soczewka skupiająca 

Aby lepiej zrozumieć właściwości soczewki jako swoi¬ 
stego modulatora realizującego przekształcenie Fou¬ 
riera, rozpatrzmy doświadczenie, w którym wiązka 
światła spójnego oświetla przeźrocze leżące przed 
soczewką w odległości równej np. jej odległości ogni¬ 
skowej (rys. 5). W płaszczyźnie ogniskowej soczewki 
powstanie pewien charakterystyczny rozciągły obraz 
(światło skupiłoby się w jednym punkcie, gdyby samą 
soczewkę oświetlić bezpośrednio falą płaską i gdyby 
soczewka ta miała wymiary poprzeczne nieskończo¬ 
ne). Ów rozciągły obraz jest obrazem Fouriera przed¬ 
miotu umieszczonego na wejściu układu (jest on 
także zwany widmem Wienera optycznego sygnału widmo 
przedmiotu wejściowego). Soczewka dokonuje zatem Wienera 
przekształcenia Fouriera. Gdy światło trafia na swej 
drodze na przeszkodę (przeźrocze), ulega ugięciu, nie 
rozchodzi się dalej w tym samym kierunku, lecz roz¬ 
biega się na boki i interferuje, tworzy obrazy inter- 



■F -H 

Rys. 5. Schemat działania soczewki sferycznej jako operatora 
przekształcenia Fouriera 
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Rys. 6. Obraz Fouriera pola świetlnego przedmio¬ 
towego (tzw. widmo Wienera) powstałego przez 
oświetlenie światłem spójnym przezrocza przed¬ 
stawiającego czarny kwadrat z białym trójkątem 
w środku (obok) 

ferencyjne, które na pozór mało mają wspólnego 
z przedmiotem. Obrazy są tym bardziej kontrastowe, 
wyraźniejsze, im światło ma większą zdolność inter- 
ferowania, czyli im bardziej jest spójne czasowo i prze¬ 
strzennie. Fale świetlne ugięte na przeźroczu skupiają 
się po przejściu przez źrenicę soczewki i nadal inter- 
ferują, tworząc w płaszczyźnie ogniskowej soczewki 
ów charakterystyczny obraz Fouriera przedmiotu. 
Przyjrzyjmy się temu obrazowi (rys. 6). Widzimy, że 
najwięcej światła rozchodzi się w kierunkach bliskich 
osi układu optycznego, a najmniej — w dużym odda¬ 
leniu od osi. Punkty o różnej jasności w obrazie 
Fouriera przedstawiają skupione fale płaskie, na 
które można rozłożyć pole świetlne sygnału wejścio¬ 
wego, czyli w tym wypadku — pole świetlne ugięte 
na przeźroczu. Odpowiadają one kierunkom roz¬ 
chodzenia się tych fal płaskich, czyli odpowiednim 
częstościom przestrzennym. Przebieg zjawiska mo¬ 
żemy ująć krótko w następujący sposób: w wyniku 
ugięcia światła na przeźroczu powstaje pole świetlne, 
którego energia dzięki działaniu soczewki skupia się 
głównie w zakresie niskich częstości przestrzennych, 
a tylko niewielka jej część — w zakresie wysokich 
częstości przestrzennych; oznacza to, że w pewnych 
kierunkach przedmiot ugina więcej światła, w innych 
mniej. Obserwow-anie lub fotografowanie ogniska so- 
funkcja czewki jest utrwaleniem tego rozkładu natężenia 
rzenoszenia światła w funkcji częstości przestrzennych. Soczewka 
soczewki odgrywa rolę realizatora przekształcenia Fouriera. 

Funkcja przenoszenia soczewki skupiającej ma postać: 



H(o>x, co y ) = A exp [i(f/2k) (co* -f co*)], 

gdzie /— ogniskowa soczewki, A = const. 

Soczewka o wymiarach poprzecznych nieskończo¬ 
nych działa podobnie jak gruba warstwa przestrzeni 
swobodnej, taka że grubość warstwy z sięga do da¬ 
lekiej strefy dyfrakcji, zwanej strefą dyfrakcji Fraun- 
hofera. W obu wypadkach sygnał optyczny wejścio¬ 
wy j est na wyjściu przekształcony w swoją transfor¬ 
matę Fouriera (z doldadnością do stałych czynników 
teoria fazowych). 

Abbego Doniosłe znaczenie transformacji Fouriera w pro- 
mikroskopu cesie tworzenia obrazu zostało po raz pierwszy stwier¬ 
dzone przez E. Abbego już w ubiegłym stuleciu. Zau- 
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ważył on, że proces powstawania obrazu w mikro¬ 
skopie jest dwustopniowy. Najpierw soczewka obiek¬ 
tywowa wytwarza pierwotny obraz Fouriera w swojej 
płaszczyźnie ogniskowej; w drugim etapie — pier¬ 
wotny obraz Fouriera przedmiotu zostaje przekształ¬ 
cony w obraz optyczny (odwrotne przekształcenie 
Fouriera), który oglądamy przez okular (rys. 7). 



Rys. 7. Dwustopniowy schemat powstawania obrazu w mikro¬ 
skopie w świetle spójnym podany przez E. Abbego (wg J. R. Meyer- 
Arendt Wstęp do optyki , Warszawa 1977) 


Filtrowanie częstości przestrzennych 

Płaszczyzny w układzie optycznym, w których się po¬ 
jawia obraz Fouriera pola świetlnego przedmiotu, 
umieszczonego na wejściu układu, nazywa się płasz¬ 
czyznami widmowymi częstości przestrzennych. Uzy¬ 
skany w płaszczyźnie widmowej obraz Fouriera syg¬ 
nału optycznego można częściowo zasłaniać; taka 
operacja nosi nazwę filtracji częstości przestrzennych. 
Problemem filtracji częstości przestrzennych zajmo¬ 
wali się fizycy już od dziesięcioleci. Jako przykład 
można przytoczyć osiągnięcia N. Mareshała i współ¬ 
pracowników, którzy za pomocą filtracji częstości 
przestrzennych polepszali obrazy przekazywane przez 
fototelegrafię kopiową (il. 149,150, tabl. 40). Przesła¬ 
nianie częściowe obrazu Fouriera wpływa na cały 
obraz przedmiotu, każdy bowiem punkt obrazu Fou¬ 
riera odpowiada całemu polu świetlnemu przedmiotu. 
Jak wpływa? Zależy to od sposobu filtrowania. 

Powróćmy jeszcze do rys. 7, ilustrującego etapy 
powstawania obrazu w mikroskopie. Obraz przed¬ 
miotu składającego się z pasków na przemian czar¬ 
nych i przezroczystych jest nieostry, rozmyty. Dla¬ 
czego? Rzeczywista soczewka ma skończone wymia¬ 
ry poprzeczne i odgrywa dwojaką rolę: modulatora 
(realizatora przekształcenia Fouriera) i ekranu czar- 














































nego z otworem w środku, czyli jest także dolno- 
przepustowym, dość wąskopasmowym filtrem czę¬ 
stości przestrzennych. Okazuje się, że natężenie świa¬ 
tła odpowiadające niższym częstościom przestrzen¬ 
nym w obrazie Fouriera przedmiotu świecącego lub 
oświetlonego wiąże się z zarysami jego rysunku czy 
rzeźby, a natężenie odpowiadające najwyższym czę¬ 
stościom przestrzennym — z ostrością krawędzi ry¬ 
sunku. Obcięcie wyższych częstości prowadzi w obra¬ 
zie do rozmycia krawędzi, do zmniejszenia zdol¬ 
ności rozdzielczej. 

filtr Przesłony umieszczane celowo w płaszczyźnie wid- 
częstości mowej danego układu optycznego nazywamy filtrami 
przestrzeń- częstości przestrzennych lub ich maskami. Mogą one 
nych być rozmaite — zależnie od celu, jakiemu służą. Do¬ 
skonałym przykładem jest doświadczenie Abbego- 
Portera, które miało duże znaczenie dla omawianej 
dziedziny fizyk i. Przedmiot w postaci siatki z kwa¬ 
dratowymi oczkami oświetlano światłem spójnym 
(il. 148, tabl. 40) W płaszczyźnie ogniskowej układu 
optycznego wstawiano maskę filtrującą obraz Fou¬ 
riera — szczelinę poziomą lub pionową, dzięki czemu 
otrzymywano obrazy składające się z pionowych lub 
poziomych pasków czarnych i białych. 


Modulacja 0 



Jedną z metod filtrowania częstości przestrzennych 
jest tzw. metoda modulacji 0, dzięki której uzyskuje 
się zamierzoną zmianę odcienia szarości fragmentów 
obrazu. Zasadę tej modulacji wyjaśnimy na prostym 
przykładzie (rys. 8). Weźmy pod uwagę widok za¬ 
wierający różne elementy, np. niebo, dom, trawnik 
(na fotografii czarno-białej elementy te są przedsta¬ 
wione różnymi odcieniami szarości). Każdy element 


| trawnik 



b) 1 c) 


Rys. 8. Modulacja theta: a) widok wymodelowany z siatek dy¬ 
frakcyjnych zorientowanych pod różnymi kątami 9, b) obraz 
Fouriera tego modelu, c) obraz wyjściowy o różnych odcieniach 
szarości otrzymanych dzięki odpowiedniej filtracji częstości 
przestrzennych 


widoku wykonuje się z kawałków plastykowej siatki 
dyfrakcyjnej o prążkach zorientowanych pod róż¬ 
nymi kątami 0 (stąd nazwa metody). Przez odpo¬ 
wiednie przesłanianie różnych fragmentów obrazu 
Fouriera tak wymodelowanego widoku zmienia się 
odcień szarości elementów. Jeśli np. w końcowym 
obrazie dom ma być czarny, to trzeba przesłonić od¬ 
powiednie maksima widma częstości przestrzen¬ 
nych domu, jeśli zaś niebo ma być jasne — trzeba 
przepuścić cały jego obraz Fouriera. Ponieważ mak¬ 
simum jasności obrazu Fouriera, odpowiadające 
częstościom przestrzennym bliskim 0, czyli ugięciu 
rzędu zerowego, nie zależy od kąta 0, trzeba je w tej 
metodzie filtrowania zasłaniać całkowicie. Modulację 
0 można stosować nie tylko w przytoczonej tu wersji 
czarno-białej, lecz także w barwnej. 


Komputery optyczne 

Łatwość dokonywania przekształcenia Fouriera za 
pomocą układów optycznych wykorzystuje się w ko¬ 
herentnych układach optycznych do przeprowadza¬ 
nia operacji matematycznych, czyli w komputerach 


optycznych. Schemat budowy komputera optycznego 
przedstawia rys. 9. Właściwą maszyną matematyczną 
jest układ optyczny dokonujący żądanej operacji ma- 



Rys. 9. Schemat blokowy komputera optycznego. Laser zaopa¬ 
trzony jest w układ teleskopowy poszerzający wiązkę. Urządzenie 
wejściowe zmienia dane wejściowe w wejściowe sygnały optyczne, 
urządzenie zaś wyjściowe zmienia wyjściowe sygnały optyczne 
w dane pożądane dla odbiorcy 


tematycznej, z w. procesorem optycznym. Pamięć ope- pamięć 
racyjną stanowi zbiór optycznych filtrów częstości optyczna 
przestrzennych, umieszcza się je w płaszczyźnie wid¬ 
mowej. Urządzenie wyjściowe służy do odbierania 
wyniku obliczeń w postaci obrazów optycznych, 
także do przetwarzania wyjściowych sygnałów 
optycznych na inne (np. elektryczne) — zgodnie z za¬ 
potrzebowaniem odbiorcy. Rodzaj użytego filtru czę¬ 
stości przestrzennych decyduje o rodzaju operacji ma¬ 
tematycznej przeprowadzanej przez dany komputer 
optyczny. Jeśli liczba kolejnych operacji matematycz¬ 
nych wykonywanych przez procesor optyczny jest 
znaczna, trzeba w odpowiednim etapie obliczeń zmie¬ 
niać filtry wstawiane w płaszczyzny widmowe układu. 

Filtry przechowywane są w bloku pamięci optycznej. 

Komputery optyczne to wyspecjalizowane maszyny 
optyczne przystosowane do wykonywania określo¬ 
nych operacji matematycznych. Jako przykład omó¬ 
wimy komputer optyczny służący do rozpoznawania 
danych. Jego zadanie polega na tym, aby ze zbioru 
sygnałów podawanych na wejściu komputera wybrać 
poszukiwany, czyli inaczej mówiąc — ze zbioru 
funkcji wybrać określoną (trzeba np. zidentyfikować 
linie papilarne palca osobnika podejrzanego o zbrod¬ 
nię na podstawie policyjnej kartoteki linii papilar¬ 
nych kryminalistów, liczącej zwykle wiele tysięcy 
pozycji). Wprawdzie istnieją elektroniczne maszyny 
cyfrowe przystosowane do rozpoznawania danych, 
lecz takie zadania są dla nich pracochłonne i długo¬ 
trwałe, podczas gdy komputer optyczny wykonuje je 
łatwo i szybko. 

Typowym i już klasycznym układem optycznym do 
rozpoznawania danych jest korelator optyczny z do- 



przekształcenia Fouriera (II) 
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korelator pasowanym filtrem holograficznym, zaproponowany 
optyczny przez Van der Lugta w 1963 r. (rys. 10). Na wejściu 
Van der Lugta korelatora podaje się za pomocą przetwornika (może 
być nim zwykłe przezrocze) sygnał optyczny, który na¬ 
leży porównać z jakimś wzorcowym sygnałem op¬ 
tycznym, zapisanym w pamięci komputera w postaci 
dopasowanego filtru holograficznego częstości prze¬ 
strzennych. Sygnał wejściowy poddawany jest naj¬ 
pierw transformacji Fouriera w układzie soczewek 
sferycznych, następnie pole świetlne, będące transfor¬ 
matą Fouriera sygnału wejściowego, odtwarza holo¬ 
gram wzorcowy (holograficzny filtr dopasowany), 
umieszczony dokładnie w płaszczyźnie widmowej 
pierwszego stopnia korelatora. 

Holograficzny filtr dopasowany Van der Lugta jest 
rodzajem hologramu Fouriera (-► Holografia), na 
którym zarejestrowano obraz interferencyjny widma 
Fouriera sygnału zadanego i wiązki odniesienia 
(widmo Fouriera jest rozkładem amplitudy i fazy syg¬ 
nału optycznego w funkcji częstości przestrzennych, 
a obserwowane widmo Wienera jest tylko rozkładem 
otrzymywa- natężenia w funkcji tych częstości). Zwykle do otrzy- 
nie filtru do- mywania takich hologramów wykorzystuje się pierw- 
pasowanego szy stopień korelatora optycznego (rys. 11). 

płaszczyzna hologramu 
i płaszczyzna 
widmowa sygnału 



Drugi stopień korelatora dokonuje odwrotnego 
przekształcenia Fouriera poła świetlnego wiązki ugię¬ 
tej na hologramie. Powstają trzy wiązki odtworzone — 
wiązka zerowa, rozchodząca się w zasadzie w kierun¬ 
ku osi układu, nie niosąca żadnej pożytecznej infor¬ 
macji, oraz dwie wiązki ugięte. Jedną z nich można 
nazwać korelacyjną, niesie ona informację o zgod¬ 
ności (niezgodności) rozpoznawanych obiektów. Dru¬ 
gą wiązkę ugiętą można nazwać splotową (odpowiada 
matematycznej operacji zwanej splotem), w tym wy¬ 
padku nie odgrywa ona roli. Ugięta wiązka korelacyj¬ 
na niesie informację o autokorelacji, gdyjest zgodność 
sygnału rozpoznawanego z sygnałem wzorcowym, 
lub o korelacji wzajemnej, gdy takiej zgodności nie 
ma. Rozkład jasności w ugiętej wiązce informacyjnej 
odpowiadający autokorelacji cechuje duża gęstość 
energii w środku obrazu, w wypadku obrazów kore¬ 
lacji wzajemnej rozkład jasności jest szeroko rozmyty. 
Wielkość natężenia w środku obrazu korelacyjnego 
(mierzonego za pomocą fotodetektora o małej śred¬ 
nicy) świadczy o identyczności lub odmienności syg¬ 
nałów porównywanych i wzorcowych, 
szybkość Optyczne komputery zapewniają niezwykłą szyb- 
komputerów kość przeprowadzania operacji matematycznych — 
optycznych niezależnie od stopnia ich skomplikowania. Ogranicza 
ją szybkość wprowadzania i wyprowadzania danych, 
wymiana masek filtrujących częstości przestrzenne itp. 
Komputery optyczne dokonują przede wszystkim 
przekształceń całkowych, choć można ich także użyć 
do różniczkowania. Wadą ich jest jeszcze mała do¬ 
kładność obliczeń (rzędu 1 %) oraz ścisła specjalizacja; 
każdy komputer optyczny może wykonywać tylko 
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określony rodzaj obliczeń. Nie są to maszyny mate¬ 
matyczne uniwersalne. Jaka jest ich przyszłość? Praw¬ 
dopodobnie wkrótce nastąpi era maszyn hybrydo¬ 
wych— swoistych połączeń matematycznych ma¬ 
szyn optycznych i elektronicznych cyfrowych. Część 
zadań, szczególnie pracochłonnych, będą szybko wy¬ 
konywały maszyny optyczne, a pozostałe dokładne 
obliczenia — elektroniczne maszyny cyfrowe. Takie 
hybrydowe maszyny już działają. Natomiast w dalszej 
przyszłości, po pełniejszym poznaniu możliwości za¬ 
stosowania światła spójnego oraz dzięki zminiatury¬ 
zowaniu koherentnych układów optycznych (co na¬ 
leży do optyki zintegrowanej), nastąpi zapewne era 
powszechnego przesyłania i przetwarzania danych 
torami optycznymi. Cała telekomunikacja i maszyno¬ 
wa technika liczenia będą wyzyskiwały światło jako fotonika 
główny nośnik informacji. Elektronikę uzupełni czy 
nawet zastąpi nowa dziedzina — fotonika. 


Struktura informacyjna sygnału optycznego 


Z punktu widzenia optyki fourierowskiej można roz¬ 
ważać także strukturę informacyjną sygnału świetl¬ 
nego. Krótkie omówienie tego zagadnienia rozpocz¬ 
niemy od przypomnienia zasady nieokreśloności 
sygnałów radiowych: Ao>t'At > 1, gdzie cot — czę¬ 
stość czasowa, / — czas trwania sygnału. Zasadę tę 
można rozszerzyć na informacyjne sygnały optyczne: 

Aco z 'Ax ^ 1 i Aco y •Ay > 1 . 


Zgodnie z zasadą nieokreśloności sygnałów optycz¬ 
nych w wypadku monochromatycznego pola świetlne¬ 
go informacyjną czterowymiarową przestrzeń o komórka 
współrzędnych co x , x , c%, y można podzielić na cztero- informacyjna 
wymiarowe komórki o skończonej objętości Aco x ‘Ax • pola 
•Acoy -Ay — 1 . Kształt takiej komórki informacyjnej świetlnego 
można wybrać dowolnie, zachowując jedynie jej obję¬ 
tość. Rysunki 12a, b, c ukazują różne możliwości wy¬ 
boru komórek w przestrzeni dwuwymiarowej co x , x. 

Każdej takiej komórce odpowiada niezależny po¬ 
miar amplitudy i fazy pola świetlnego sygnału. Za¬ 
tem struktura informacyjna sygnału optycznego jest 
dyskretna. Analiza problemu pomiaru pola świetlnego 
z punktu widzenia teorii informacji prowadzi do 
wniosku, że całkowity pomiar optyczny, obejmujący 
pomiar rozkładu amplitudy i fazy przedmiotu świe¬ 
cącego, jest możliwy jedynie przy oświetleniu spójnym, 
natomiast przy oświetleniu przestrzennie niespójnym 



Rys. 12. Diagram informacyjny: a) komórki elementarne Ga¬ 
bora, b) komórki elementarne Fouriera, c) komórki elementarne 
Shannona 


informację o rozkładzie fazy traci się bezpowrotnie. 
Liczba niezależnych parametrów (wyników pomia¬ 
rów) potrzebnych do opisania pola świetlnego w źre¬ 
nicy wyjściowej układu optycznego równa się N przy 
oświetleniu spójnym i N 2 przy oświetleniu niespój¬ 
nym; A^jesi liczbą Shannona, czyli liczbą informacyj¬ 
nych przestrzennych stopni swobody: 

Af = N x Ny 1AS X *Ct>j:max * ASy 'Oy max, 

gdzie AS X i ASy — wymiary liniowe obrazu sygnału 
w kierunku osi x i y 9 a co x max, co ym ax — odpowiednie 




















szerokości pasma częstości przestrzennych przepusz¬ 
czane przez rzeczywisty układ optyczny (czynnik 
2 odpowiada dwóm niezależnym stanom polaryzacji 
światła). W wypadku niemonochromatycznego pola 
świetlnego liczbę tę należy uzupełnić dodatkowym 
czynnikiem: N t X Aco t T, gdzie T — czas obserwacji. 
Im mniejsza jest liczba parametrów potrzebnych do 
opisania sygnału optycznego przechodzącego przez 
tor optyczny, tym bardziej koherentny jest układ. 


Perspektywy optyki fourierowskiej 

Przedstawione wyżej podejście otwiera nowe perspek¬ 
tywy przed przetwarzaniem sygnałów optycznych. 
Jedną z możliwości jest tzw. przelewanie częstości 
przestrzennych. Całkowita liczba informacyjnych 
stopni swobody danego sygnału i toru optycznego 
jest niezmiennikiem, ale przy jej zachowaniu można 
np. zwiększyć zdolność rozdzielczą obrazu w kierunku 
x , a zmniejszyć w kierunku y, „przelewając” częstości 


przestrzenne z kierunku y na kierunek x. Ta możli¬ 
wość będzie wyzyskana zapewne w telewizji hologra- 
graficznej, dla której trudną pod względem technicz¬ 
nym sprawą jest przesyłanie tak wielkiej liczby infor¬ 
macji, jaką niesie hologram. Ponieważ aparat wzro¬ 
kowy człowieka wymaga większej zdolności rozdziel¬ 
czej w poziomie niż w pionie, można uzyskać dobre 
dla oka obrazy przez „przelewanie” częstości prze¬ 
strzennych sygnałów o zmniejszonej liczbie informa¬ 
cyjnych stopni swobody. 

W dalszej przysztosci naieży się spodziewać wyko¬ 
rzystania— jako nośnika informacji — pola elektro¬ 
magnetycznego o jeszcze krótszej fali — nadfioletu 
oraz miękkiego promieniowania rentgenowskiego, 
czyli wyzyskanie tego zakresu widma fal elektroma¬ 
gnetycznych, w którym własności falowe promienio¬ 
wania jeszcze są wyraźne. Przydatność optyki fourie¬ 
rowskiej będzie wówczas niewątpliwa. 

A. Kalestyński Co to są komputery optyczne , w „Człowiek 
i nauka” 1977; J. R. Meyer-Arendt Wstęp do optyki. Warszawa 
1977; A. Piekara Nowe oblicze optyki , Warszawa 1976. 


KRiOFIZYKA 


Nadpłynność 

Eugeniusz Trój nar 

Ciecz kwantowa 

W ciekłym helu w temperaturach bliskich zera bez¬ 
względnego obserwuje się niezwykłe zjawiska, trudne 
do wytłumaczenia na gruncie fizyki klasycznej. Zja¬ 
wiska te bowiem są przejawem działania praw kwan¬ 
towych, a więc tych praw, które rządzą światem ato¬ 
mów i cząsteczek. W ciekłym helu prawa kwantowe 
ciecz przejawiają się w skal* makroskopowej, dlatego taką 
kwantowa ciecz nazywamy cieczą kwantową. 

W ciałach o rozmiarach makroskopowych zjawiska 
kwantowe są przeważnie zamaskowane chaotycznymi 
ruchami cieplnymi atomów czy cząsteczek. W niskich 
temperaturach, gdy zanika bezładny ruch cieplny 
może dojść do wewnętrznego uporządkowania sub¬ 
stancji i wtedy mogą się ujawnić zjawiska kwantowe. 
Nadpłynność jest właśnie wynikiem wysokiego stopnia 
uporządkowania wewnętrznego w ciekłym helu. 
Uporządkowanie to dotyczy ruchów atomów helu, 
a nie ich położeń. Porządkowanie położeń atomów 
w przestrzeni — to krystalizacja, a nadpłynny hel pod 
względem uporządkowania przestrzennego nie różni 
się od innych cieczy, o czym świadczą badania rentge- 
nograficzne. 

Miarą uporządkowania układu jest jedna z funkcji 
termodynamicznych, zwana entropią, przy czym im 
wyższy stopień uporządkowania układu, tym mniejsza 
jest jego entropia. Po przejściu ciekłego helu w stan 



Rys. 1. Zależność en¬ 
tropii ciekłego helu 
pod ciśnieniem pary 
nasyconej od tempe¬ 
ratury 


nadpłynny jego entropia raptownie maleje, co dowodzi 
wewnętrznego podporządkowania się (rys. 1). 

Hel jest jedyną w przyrodzie substancją nie zamar¬ 
zającą pod normalnym ciśnieniem, aż do temperatury 
zera bezwzględnego. Z punktu widzenia fizyki kla¬ 
sycznej w temperaturze zera bezwzględnego każda 
substancja powinna znajdować się w stałym stanie 
skupienia, gdyż wszystkie cząsteczki powinny być 
w zupełnym bezruchu. Zgodnie z prawami fizyki 
kwantowej, całkowita utrata energii ruchu cząsteczek 
nie jest możliwa; nawet w temperaturze zera bez¬ 
względnego cząsteczki wykonują pewien ruch drga¬ 
jący, tzw. drgania zerowe, a jeśli energia tych drgań jest 
wystarczająco duża, to ciało nie krystalizuje. A właś- 
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Rys. 2. Wykres stanu 4 He. 
U dołu zamieszczono dla 
porównania wykres stanu 
normalnej substancji 
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nie w helu energia drgań zerowych jest duża i jedno¬ 
cześnie hel—jako gaz szlachetny — odznacza się 
słabym oddziaływaniem mędzyatomowym. Oba te 
czynniki nie sprzyjają krystalizacji. Aby zestalić hel, 
należy zastosować zwiększone ciśnienie, czyli bardziej 
wykres zbliżyć do siebie poszczególne atomy. Wartość ciśnie- 
stanu nia krystalizacji zależy od temperatury, co ilustruje 
helu zamieszczony na rys. 2 wykres stanu (wykres fazowy). 
Górna krzywa na tym wykresie jest krzywą krystali¬ 
zacji (topnienia), czyli krzywą równowagi fazy stałej 
i ciekłej. Dolna krzywa jest krzywą zależności pręż¬ 
ności nasyconej pary helu od temperatury, czyli krzy¬ 
wą równowagi fazy ciekłej i gazowej — krzywą skra¬ 
plania (wrzenia). Krzywa skraplania kończy się w 
punkcie krytycznym 7kr = 5,2 K, />kr = 2,16 -10® Pa. 
Dla normalnych substancji obie te krzywe łączą się 
z sobą w punkcie potrójnym, gdzie wszystkie trzy fa¬ 
zy — stała, ciekła i gazowa — są w równowadze ter¬ 
modynamicznej. 

Hel nie ma punktu potrójnego, ponieważ krzywa 
wrzenia nie przecina nigdzie krzywej krystalizacji. 
Nie można więc helu zestalić przez obniżanie jego 
temperatury pod ciśnieniem pary nasyconej. Aby hel 
zestalić w pobliżu r=0K, należy zwiększyć ciśnienie 
do 24,5-10 5 Pa. 


Przemiana lambda 


Krzywą krystalizacji helu z krzywą skraplania łączy 
na wykresie fazowym tzw. linia lambda, rozdziela¬ 
jąca obszar cieczy na dwa obszary fazowe: obszar 
hel 1 helu I (He I) i obszar helu II (He II). Pod względem 
własności fizycznych hel I jest normalną cieczą, niczym 
istotnym nie wyróżniającą się spośród innych cieczy. 
Nieco bardziej tylko, niż inne ciecze, przypomina gaz, 
gdyż ma stosunkowo małą lepkość i gęstość, 
hel II Hel II jest cieczą nadpłynną. Przemiana fazowa 
zmieniająca hel I w hel II, zwana przemianą lambda, 
zachodzi pod ciśnieniem pary nasyconej w tempera¬ 
turze Ta = 2,17 K. Ciśnienie odpowiadające tej 
temperaturze wynosi 0,05-10 5 Pa. Pod zwiększonym 
ciśnieniem temperatura przemiany w fazę nadpłynną 
jest niższa i w pobliżu krzywej krzepnięcia wynosi 
1,76 K. Wartości ciśnień i odpowiadających im tempe¬ 
ratur przemiany lambda wyznaczają na wykresie fazo¬ 
wym linię lambda. 

Przemiana lambda jest innym rodzajem przemiany 
fazowej (przemianą fazową II rodzaju) niż np. skra¬ 
planie czy krzepnięcie. Nie towarzyszy jej oddawanie 
lub pobieranie ciepła, nie ma więc „utajonego” ciepła 
linia lambda przemiany. Linia lambda nie jest też krzywą równo¬ 
wagi dwu faz, jak krzywa topnienia lub skraplania, 
gdyż hel II nie może istnieć w równowadze termodyna¬ 
micznej z helem I; cała ciecz — w zależności od tem¬ 
peratury i ciśnienia —jest albo helem I albo helem II. 

Pierwszym zaobserwowanym faktem doświadczal¬ 
nym wskazującym na to, że w ciekłym helu dokonuje 
się jakaś przemiana, była zmiana temperaturowej za- 



temperatura T 


Rys. 3. Zależność ciepła 
właściwego ciekłego he¬ 
lu od temperatury 


Ieżności przenikalności elektrycznej, którą to zmianę 
wykrył w 1927 r. Polak, Mieczysław Wolfke, pracujący 
wtedy w Lejdzie. Przypuszczenie o zachodzącej prze¬ 
mianie potwierdziły pomiary ciepła właściwego, prze¬ 
prowadzone przez W. H. Keesoma. Krzywa zależności 
ciepła właściwego (rys. 3) od temperatury w pobliżu 
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Ta = 2,17 K rozrywa się i wygina ku górze tak, że jej 
kształt przypomina grecką literę X (lambda). Stąd 
pochodzi nazwa przemiany fazowej zachodzącej 
w ciekłym helu. 

Fizycy początkowo nie docenili znaczenia tego od¬ 
krycia i nie zwrócili należytej uwagi na zmiany zacho¬ 
dzące w ciekłym helu. Bez echa przeszło również spo¬ 
strzeżenie J. C. McLennana i jego współpracowników, 
że gdy temperatura helu spada poniżej 2,17 K, ciecz 
nagle przestaje wrzeć, tzn. pęcherzyki pary już się nie 
tworzą w jej objętości. Dopiero w 1938 r., a więc 
sześć lat po odkryciu przemiany lambda i trzydzieści 
lat po pierwszym skropleniu helu przez H. Kamer- 
lingh-Onnesa, P. L. Kapica w Moskwie oraz J. F. Allen 
i A. D. Misener w Cambridge niezależnie od siebie 
odkryli zadziwiającą zdolność helu II do przepływania 
niema! bez tarcia przez bardzo wąskie szczeliny sze¬ 
rokości rzędu 10 -5 cm. Tę właściwość helu II Kapica 
zaproponował nazwać nadpłynnością. 


Podstawowe własności helu II 

Objętość zwykłej cieczy przepływającej w jednostce 
czasu przez rurkę lub szczelinę jest odwrotnie propor¬ 
cjonalna do lepkości cieczy, czyli do jej tarcia we¬ 
wnętrznego. Lepkość wody wynosi około lO -3 Ns/m 2 , 
lepkość helu I około 10 -6 Ns/m 2 , a lepkość helu II 
mierzona tą metodą może wynosić nawet 10~ 12 Ns/m 2 , 
a więc milion razy mniej niż lepkość helu I. Dla cieczy 
zwyczajnych słuszny jest wzór Poiseuille’a: 

V n a 2 -Ap 

1 Srjl ’ (1) 

gdzie Kjest objętością cieczy przepływąjącej w czasie / 
przez rurkę o promieniu a i długości / pod wpływem 
różnicy ciśnień Ap; j? jest współczynnikiem lepkości. 

Dla helu II wyniki pomiarów lepkości metodą 
przepływu są niejednoznaczne, gdyż zależą od średni¬ 
cy kapilary: im większa kapilara, tym mniejszą war¬ 
tość lepkości otrzymuje się z pomiarów. Poza tym 
prędkość przepływu przez wąskie kapilary prawie nie 
zależy od różnicy ciśnień na obu jej końcach, chociża 
powinna być do niej proporcjonalna. 

Można zastosować inny sposób pomiaru lepkości: 
Jeżeli zapełni się cieczą przestrzeń między dwoma 
współosiowymi walcami i będzie się obracać walec ze¬ 
wnętrzny, to ciecz pociągana obracającym się walcem 
będzie oddziaływać na walec wewnętrzny i starać się 
go obrócić w tym samym kierunku (rys. 4). Moment 
obrotowy działający na walec wewnętrzny jest miarą 
lepkości cieczy. Lepkość helu II mierzona tą metodą 
niewiele różni się od lepkości helu I, a poniżej 1 K jest 
nawet od niej większa. Tak więc dwie wypróbowane 
metody pomiaru lepkości zastosowane do normalnych 
cieczy dają takie same wyniki, a zastosowane do helu 
II — wyniki bardzo się od siebie różniące. Pojęcie 
lepkości, dotyczące zwykłych cieczy, w odniesieniu 
do cieczy kwantowej traci swój zwykły sens. 

Drugą osobliwością helu II jest jego olbrzymie prze¬ 
wodnictwo cieplne. Przewodność cieplną « definiuje¬ 
my zwykle jako współczynnik proporcjonalności 
między strumieniem przewodzonego ciepła ą i gra¬ 
dientem temperatury AT/Al, gdzie AT oznacza różnicę 
temperatur między punktami oddalonymi od siebie 
o Al. Równanie przewodnictwa cieplnego można za¬ 
pisać w postaci: 

AT 

9 = ~ x ~aT' 

Znak „minus” pochodzi stąd, że strumień ciepła prze¬ 
pływa w kierunku przeciwnym do kierunku gradientu 
temperatury (gradient jest kierowany umownie w stro¬ 
nę wzrostu temperatury). W pewnych warunkach x 
helu II jest tysiąckrotnie większe niż >c miedzi i wiele 
milionów razy większe niż « helu I. W kąpieli nadpłyn¬ 
nego helu nie da się wytworzyć stałej różnicy tempera- 
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Rys. 4. Układ do 
pomiaru lepkości 
metodą obracają¬ 
cego się walca 

przewodnict¬ 
wo cieplne 
helu II 



















tur. Hel II nie wrze, ponieważ do wytworzenia się pę¬ 
cherzyków pary wewnątrz cieczy potrzebne są nie¬ 
wielkie lokalne przegrzania (fluktuacje temperatury). 
Hel II paruje tylko z powierzchni swobodnej. 

Podobnie jak pomiary lepkości, pomiary współ¬ 
czynnika przewodnictwa cieplnego helu II nie dają 
jednoznacznych wyników. Wartości x zależą od geo¬ 
metrycznych szczegółów aparatury pomiarowej, poza 
tym nie ma proporcjonalności między strumieniem 
ciepła i gradientem temperatury. Największe wartości 
x uzyskuje się wtedy, gdy na końcach bardzo wąskiej 
kapilary wytworzy się niewielka różnica temperatur. 
Przy przepływie helu II przez takie wąskie kapilary 
lub szczeliny uzyskuje się również najmniejsze war¬ 
tości współczynnika lepkości. Nasuwa to myśl o związ¬ 
ku między tymi dwoma zjawiskami. Najwidoczniej 
transport ciepła w helu II ma charakter konwekcyjny 
i jest związany z bezlepkościowym przepływem cieczy. 
W przypadku helu II nie można więc mówić o współ¬ 
czynniku przewodnictwa cieplnego w zwykłym zna¬ 
czeniu. 

doświadczę- Aby wyjaśnić proces przenoszenia ciepła w helu II, 
nie Kapicy przeprowadzono szereg doświadczeń. W jednym z 
nich, wykonanym przez Kapkę, małe naczynie De- 
wara w kształcie kolby z wąską szyjką i z grzejnikiem 
elektrycznym w środku zostało zanurzone w helu II. 
Naprzeciw wylotu szyjki umieszczono niewielką tar¬ 
czę zawieszoną wraz z równoważącym ją ciężarkiem 
na wadze skręceń (rys. 5). Włączenie grzejnika do ob¬ 
wodu prądu powodowało odchylenie tarczy. Po wyłą¬ 
czeniu grzejnika tarcza wracała w poprzednie położe¬ 
nie. Tarcza zachowywała się więc tak, jakby była 
odpychana przez wypływający z naczynia strumień 



cieczy. Cieczy w naczyniu jednak nie ubywało, a Ka¬ 
pka na próżno starał się wykryć strumień płynący 
w przeciwną stronę, tj. wpływający do naczynia (np. 
po jego ściankach). W cieczy nadpłynnej mogą istnieć 
zatem dwa rodzaje ruchów: jeden ruch, jak w nor¬ 
malnej cieczy lepkiej, związany z przekazywaniem 
pędu ciałom w niej zanurzonym, i drugi ruch odbywa¬ 
jący się bez wymiany pędu między cieczą i ciałem sta¬ 
łym. Oczywiście, gdyby naczynie nie było unierucho¬ 


mione, to mogłoby się poruszać w kierunku przeciw¬ 
nym do wypływającego strumienia, jak silnik odrzu- 

towy. . v , 

W innym tego typu doświadczeniu Kapica wyko¬ 
rzystał siłę odrzutu wypływającego strumienia do 
uruchomienia urządzenia przypominającego po- 



hel 

promieniowanie 


Rys. 6. Młynek odrzutowy Kapicy. Zaciem¬ 
nione części młynka są wypełnione ciekłym 



wszechnie znany młynek Segnera (rys. 6). Zgięte ra¬ 
miona tego urządzenia są rurkami prowadzącymi do 
przestrzeni zawartej między podwójnymi ściankami 
cylindrycznego naczynka ze szkła. Młynek wisi na 
pionowej podpórce, wokół której może się swobodnie 
obracać. Całość jest zanurzona w nadpłynnym helu. 
Jeśli na ścianki młynka, wyczernione sadzą od strony 
wewnętrznej, pada smuga światła, to młynek się obra¬ 
ca. Ruch obrotowy młynka może trwać dowolnie 
długo, gdyż — podobnie jak w poprzednio opisanym 
doświadczeniu — cieczy nie ubywa między ściankami 
młynka. Młynek zatrzyma się dopiero po zaprzestaniu 
naświetlania, czyli przerwaniu ogrzewania cieczy 
znajdującej się między ściankami młynka. Wypływa¬ 
jący z naczynia strumień powstaje więc w nagrzewanej 
cieczy nie powodując jej ubytku. 
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Podczas innych doświadczeń, przeprowadzonych 
przez grupę badaczy w Cambridge, okazało się, że 
jeśli do naczynia, w którym ogrzewano hel II, prowa¬ 
dziła cienka kapilara lub wąskie szczeliny, to ciśnienie 
w tym naczyniu wzrastało. W najbardziej widowisko¬ 
wym wariancie tego doświadczenia ciekły hel pod 
wpływem zwiększonego ciśnienia wytryskiwał ku 
górze w postaci fontanny (rys. 7). Przyrząd użyty 
w tym doświadczeniu składał się ze szklanej rurki na¬ 
pełnionej proszkiem szlifierskim i zatkanej kłębkiem 
waty. Rurka była zanurzona w helu II tak, że jej górny 
koniec wystawał nieco ponad poziom cieczy. Gdy na 
filtr proszku szlifierskiego skierowano smugę światła, 
z górnego końca rurki wytrysnął strumień cieczy. 

Mniej widowiskowa, lecz bardziej przejrzysta od¬ 
miana tego doświadczenia pokazana jest na rys. 8. 
Dwa naczynia zawierające hel II połączone są cienką 


grzejnik 
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Rys. 8. Szkic ilustrujący zjawisko termomechaniczne i mecha- 
nokaloryczne 


kapilarą. Ogrzewanie cieczy w jednym z tych naczyń 
powoduje podniesienie się jej poziomu w tym naczy¬ 
niu, natomiast obniżenie — w drugim naczyniu. Róż¬ 
nica ciśnień Ap odpowiadająca tej różnicy poziomów 
jest proporcjonalna do wytworzonej różnicy tempera¬ 
tur A T. Zjawisko to otrzymało nazwę zjawiska termo¬ 
mechanicznego. Istnieje również zjawisko odwrotne, 
zwane zjawiskiem mechanokalorycznym: jeżeli w na¬ 
czyniach połączonych kapilarą wytworzy się mecha¬ 
nicznie różnicę ciśnień, to ta różnica wywoła różnicę 
temperatur. Zależność między Ap i JTjest taka sama 
jak poprzednio. 

Zakładając pełną odwracalność tych zjawisk i trak¬ 
tując układ naczyń jako maszynę cieplną, w której 
dostarczone ciepło zamienia się w całości na pracę 
podnoszenia cieczy na wyższy poziom, London zna¬ 
lazł następującą zależność: 

Ap = qSAT , 

gdzie q oznacza gęstość helu II, zaś S jest entropią 
właściwą cieczy w naczyniu o wyższej temperaturze. 
Wyniki doświadczeń potwierdziły słuszność tego 
wzoru. 


Model dwupłytowy 

Opisane powyżej zjawiska można poglądowo wytłu¬ 
maczyć posługując się tzw. modelem dwupłynowym 
wprowadzonym dla helu II przez L. Tiszę. W tym 
modelu zakłada się, że hel II jest mieszaniną dwu pły¬ 
nów o różnych własnościach fizycznych. Jeden ze 
składników helu to ciecz normalna podobnie jak hel I; 
drugi składnik jest pozbaw-iony lepkości i ma równą 
zeru entropię. Procentowa zawartość składnika nor¬ 
malnego zależy od temperatury. W temperaturze zera 
bezwzględnego cała ciecz jest nadpłynna. W tempera¬ 
turze wyższej od zera pojawia się składnik normalny. 
W miarę wzrostu temperatury udział składnika nor¬ 
malnego zwiększa się coraz bardziej i w temperaturze 
lambda cała ciecz staje się normalna. 

Posługując się tym modelem możemy wyjaśnić 
wynik doświadczenia Kapicy następująco. Ciecz 
ogrzewana wewnątrz zanurzonej kolby ma tempera¬ 
turę wyższą niż otaczająca kąpiel, a więc ma większe 
stężenie składnika normalnego. Hel II stara się wy¬ 
równać wszędzie swój skład (podobnie jak wyrównuje 


się w naczyniu stężenie roztworu), dlatego do wnętrza 
kolby wpływa składnik nadpłynny nie oddziałujący 
ze ściankami naczynia ani tarczą wagi skręceń, nato¬ 
miast z kolby wypływa strumień składnika normalne¬ 
go i zachowuje się jak zwykła ciecz. Jednak, dopóki 
działa grzejnik, do wyrównania składu cieczy we¬ 
wnątrz i na zewnątrz kolby nie dochodzi, gdyż pod 
wpływem ciepła wydzielonego w kolbie dokonuje się 
tam ciągła zamiana składnika nadpłynnego na nor¬ 
malny. Jeśli wlot do naczynia zanurzonego w helu II 
jest bardzo wąski lub zatkany porowatym korkiem 
(np. z proszku szlifierskiego), a wewnątrz naczynia 
temperatura jest wyższa niż w otaczającej kąpieli he¬ 
lowej, to składnik nadpłynny może łatwo do naczynia 
wpływać, natomiast składnik normalny przez taką 
przegrodę przedostaje się z trudnością. W rezultacie 
ciśnienie wewnątrz naczynia wzrasta. Nasuwa się tu 
analogia z ciśnieniem osmotycznym wywołanym róż¬ 
nicą stężeń roztworów (np. soli) rozdzielonych prze¬ 
grodą przepuszczalną dla rozpuszczalnika, lecz nie¬ 
przepuszczalną dla substancji rozpuszczonej. 

Jeżeli po obu stronach porowatej przegrody lub 
w dwu naczyniach połączonych cienką kapilarą wy¬ 
tworzymy w helu II różnicę ciśnień, to pod jej wpły¬ 
wem przez przegrodę lub kapilarę będzie przepływał 
niemal wyłącznie składnik nadpłynny. Ponieważ skład¬ 
nik nadpłynny nie przenosi z sobą ciepła (ściślej 
mówiąc, nie przenosi entropii), temperatura w tej 
części naczynia, do której wpływa składnik nadpłyn¬ 
ny, obniża się. 

Na gruncie modelu dwupłynowego zrozumiała staje 
się także rozbieżność wyników pomiarów lepkości 
dwiema różnymi metodami. Przy przepływie cieczy 
przez kapilarę pod wpływem różnicy ciśnień zasadni¬ 
czą rolę odgrywa pozbawiony lepkości składnik nad¬ 
płynny, podczas gdy obracający się walec pociąga za 
sobą lepki składnik normalny, a ten z kolei oddziałuje 
na walec wewnętrzny. 

Model dwupłynowy tłumaczy także doskonale 
przewodnictwo cieplne helu II: nawet bardzo mała 
różnica temperatur wytworzona w helu II spowoduje 
natychmiastowy przepływ składnika nadpłynnego w 
kierunku wyższej temperatury i odpływ w kierunku 
przeciwnym składnika normalnego; w rezultacie tem¬ 
peratura się wyrówna. 

Gęstość helu II jest sumą gęstości obu jego składni¬ 
ków: q — en-f-gs. Wskaźnik n odnosi się do gęstości 
składnika normalnego, wskaźnik s — do gęstości 
składnika nadpłynnego. Stosunek g n /g, czyli stężenie 
składnika normalnego, jest—jak już wspominaliś¬ 
my— rosnącą funkcją temperatury. Przebieg tej za¬ 
leżności wyznaczył doświadczalnie E. Andronikaszwili 
w 1946 r. Przyrząd, którym się posługiwał składał się 
ze stosu cienkich krążków mikowych, nasadzonych 
w niewielkich odstępach na wspólną oś (rys. 9). Układ 
krążków był zawieszony na sprężystej nici, mógł więc 
wykonywać drgania skrętne wokół swej osi. Umiesz¬ 
czone na osi lusterko umożliwiało obserwację ruchu 
drgającego.- 

Okres t 0 drgań skrętnych takiego układu krążków 
zależy od jego momentu bezwładności B 0 i stałej skrę¬ 
cenia nici k: 


stężenie 

składnika 

normalnego 


nić 

sprężysta 


Ólusterko 


Po zanurzeniu w helu II układ krążków podczas drgań 
porywa z sobą składnik normalny, który więźnie mię¬ 
dzy krążkami, i moment bezwładności układu zwięk¬ 
sza się do B = 2?o~rź? H e gdzie B He jest momentem bez¬ 
władności cieczy uwięzionej między krążkami i poru¬ 
szającej się wraz z nimi, zależnym od jej gęstości. 
Okres drgań wyniesie teraz: 


t = 2k 


Y 


B 0 +B He 

k 


Składnik nadpłynny, jako pozbawiony lepkości, nie 
jest porywany przez poruszające się krążki. Mierząc 


— — krążki 
~ —i miki 

?■ 

I 

Rys. 9. Układ An- 
dronikaszwiliego do 
pomiaru stężenia 
składnika normal¬ 
nego helu II 
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więc okresy drgań układu w zależności od tempera¬ 
tury można znaleźć funkcję Q n /Q = f{T)- Wykres tej 
funkcji przedstawia rys. 10. 



temperatura T 


Rys. 10. Zależność stęże¬ 
nia składnika normalne¬ 
go helu II od tempera¬ 
tury; (p 9 +Pn)fp = 1 


Fale temperaturowe, czyli drugi dźwięk 

Model dwupłynowy nie tylko wyjaśniał większość 
znanych w tym czasie faktów doświadczalnych zwią¬ 
zanych z helem II, ale także pozwalał przewidywać 
nowe zjawiska. Na podstawie tego modelu Tisza prze¬ 
widział możliwość występowania w helu II fal tempe¬ 
raturowych, zwanych później drugim dźwiękiem. 

W nadpłynnym helu, podobnie jak w każdej innej 
cieczy, mogą rozprzestrzeniać się zwykle fale dźwię¬ 
kowe, polegające na drganiach gęstości cieczy. Oba 
składniki helu II poruszają się wtedy jak jedna całość 
drgając w zgodnej fazie. Prowadzi to do kolejnych 
zgęszczeń i rozrzedzeń cieczy rozprzestrzeniających 
się ruchem falowym. Prócz tego zwykłego (pierwsze¬ 
go) dźwięku w nadpłynnym helu możliwy jest jeszcze 
inny ruch falowy, kiedy oba składniki drgają w prze¬ 
ciwnych kierunkach, tzn. z przesunięciem w fazie o kąt 
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pierwszy dźwięk 


drugi dźwięk 


Rys. 11. Wyjaśnienie powstawania pierwszego (a) i drugiego (b) 
dźwięku w helu II na podstawie modelu dwupłynowego. Zgęsz- 
czenie składnika nadpłynnego oznaczono jasnymi krążkami, 
zgęszczenie składnika normalnego — krążkami zaczernionymi 


n (rys. 11). Nie są to więc drgania gęstości cieczy, lecz 
drgania stężenia obu jej składników. Inaczej mówiąc, 
w obranym dowolnie miejscu w cieczy zmienia się 
okresowo wartość stosunku £«/{?« ta ^» że suma 
Q S +Q n = Q pozostaje stała. Ponieważ zmiana stęże¬ 
nia jednego ze składników jest równoważna zmianie 
temperatury, takie zaburzenie rozprzestrzenia się jako 
prędkość fala temperaturowa. Prędkość drugiego dźwięku jest 
drugiego funkcją temperatury i jest mniejsza od prędkości 
dźwięku pierwszego dźwięku (rys. 12). Powyżej punktu lambda. 



Rys. 12. Zależność 
prędkości pierwszego 
i drugiego dźwięku od 
temperatury 


gdy nie ma już składnika nadpłynnego, fala drugiego 
dźwięku istnieć nie może. Fala drugiego dźwięku nie 
mogłaby również istnieć w temperaturze dokładnie 
równej zeru bezwzględnemu, gdyż wtedy ciekły hel 
musiałby być w stanie niewzbudzonym, każde zaś 


Rys. 13. Schemat układu Pieszkowa do pomiaru prędkości dru¬ 
giego dźwięku. Termometr 2 na dnie rury rezonansowej śluzy do 
ustalenia położenia grzejnika 3. Aby w rurze mogła powstać fala 
stojąca, odległość grzejnika od dna rury musi być równa wielo- 
nrJrtwy riłticrnści fali 


wzbudzenie oznacza, że temperatura różni się od zera, 
chociażby nawet o niewielką wartość. 

Prędkość drugiego dźwięku w funkcji temperatury 
po raz pierwszy zmierzył W. Pieszkow (1944). 
Omówimy tutaj późniejszą, udoskonaloną wersję 
jego doświadczenia. Jako źródło drugiego dźwięku 
służył grzejnik elektryczny o bardzo małej bezwład¬ 
ności cieplnej, zasilany sinusoidalnym prądem zmien¬ 
nym. Odbiornikiem (detektorem) fal temperaturo¬ 
wych był termometr oporowy zasilany prądem stałym. 
Zmiany temperatury powodowały zmiany oporu ter¬ 
mometru, a więc drgania spadku napięcia na nim, te 
zaś łatwo można wykryć i określić ich częstość. Pul- 
sacje napięcia na termometrze miały dwukrotnie wyż¬ 
szą częstość niż zmiany prądu w grzejniku, można je 
więc było odróżnić od elektromagnetycznego tła po¬ 
chodzącego od grzejnika. Zarówno grzejnik jak i ter¬ 
mometr nawinięte były w postaci płaskich spirali 
z bardzo cienkiego drutu i umieszczone w rurze rezo¬ 
nansowej (rys. 13). Pizy odpowiednim położeniu 
grzejnika drugi dźwięk odbijał się od dna rury i two¬ 
rzył falę stojącą. Zmieniając odległość termometru od 
dna rury można było znaleźć położenia węzłów i strza¬ 
łek tej fali, a więc określić jej długość. Jeśli znana jest 
długość fali X i częstość drgań temperatury v, można 
obliczyć prędkość drugiego dźwięku: u 2 = Xv. 




uzwojenie 

termometru 


Pełzająca warstwa i prędkość krytyczna 

Warstwa cieczy pełzająca ruchem nadpłynnym po po¬ 
wierzchni ciała stałego — to jeszcze jedna osobliwość 
związana z helem II. Warstwa taka, o grubości rzędu 
10" 8 cm, tj. około 50 średnic atomowych, pokrywa 
każdą powierzchnię ciała stałego stykającego się z he¬ 
lem II i porusza się po niej bez tarcia pod wpływem siły 
grawitacji albo gradientu temperatury. Po ściankach 
kriostatu z helem II wspina się więc do góry w kierun¬ 
ku wzrastającej temperatury cienka nadpłynna war¬ 
stwa i stopniowo wyparowuje stykając się z coraz 
cieplejszymi ściankami. 



Rys. 14. Pełzanie warstwy helu II po ściankach naczynia 


Jeżeli do kąpieli z helu II wstawimy pustą zlewkę pełzanie 
tak, aby jej dno znalazło się poniżej poziomu otacza- warstwy 
jącej ją cieczy (rys. 14), to ciecz pełzając po ściankach helu 
zlewki będzie ją stopniowo napełniać aż do chwili, gdy 
wyrównują się poziomy cieczy wewnątrz i na zewnątrz 
zlewki. Jeśli teraz podniesiemy zlewkę, to hel będzie 
z niej wypełzać po ściankach aż do kolejnego wyrów¬ 
nania poziomów. Jeśli zaś wyjmiemy zlewkę z helem II 
z kąpieli, to z jej dna będą kapać krople cieczy i zlewka 
opróżni się. Tak więc He II w polu grawitacyjnym 
zawsze stara się zająć możliwie najniższy poziom. 

Objętość cieczy (w cm 3 ), którą przenosi pełzająca 
warstwa w ciągu sekundy przez 1 cm długości obwo¬ 
du zlewki, jest niezależna od różnicy poziomów cie¬ 
czy, podobnie jak prędkość przepływu składnika nad¬ 
płynnego w cienkich kapilarach jest niezależna od 
różnicy ciśnień. Nasuwa się więc przypuszczenie, że 

399 











































prędkość istnieje pewna krytyczna prędkość przepływu ograni- 
krytyczna czająca ilość przepływającej cieczy. Przepływ z pręd¬ 
kością większą niż krytyczna utraciłby swój beztar- 
ciowy charakter. 

Rys. 15 przedstawia temperaturową zależność ilości 
przenoszonej cieczy przez 1 cm długości obwodu zlew¬ 
ki w ciągu sekundy. W przedziale temperatur od 1 do 



Rys. 15. Prędkość pełza¬ 
nia warstwy helu II w 
zależności od tempera¬ 
tury. Na osi rzędnych 
naniesiona jest objętość 
cieczy przeniesionej w 
ciągu 1 s przez odcinek 
o długości 1 cm prosto¬ 
padły do kierunku ru¬ 
chu warstwy 


1,5 K ilość ta jest prawie niezależna od temperatury 
i wynosi ok. 7,5-10" 5 cm 3 /(cm-s); przy grubości 
warstwy 10 -<t cm prędkość krytyczna wynosi 75 cm/s. 
Jest to wielkość tego samego rzędu, co wyniki pomia¬ 
rów prędkości przepływu przez cienkie kapilary. 


Wzbudzenia elementarne w helu II 

Posługując się modelem dwupłynowym do wyjaśnie¬ 
nia własności helu II nie powinniśmy zapominać, że 
model ten — to tylko poglądowy sposób opisu zjawisk 
występujących w cieczy kwantowej. W rzeczywistości 
hel II nie składa się z dwu cieczy różniących się między 
sobą własnościami fizycznymi, lecz stanowi jeden 
układ złożony z identycznych atomów. 

Jedną z zasad mechaniki kwantowej jest zasada 
nierozróżnialności jednakowych cząstek układu. 
Zgodnie z tą zasadą wszystkie atomy helu II zawarte 
w jednym naczyniu stanowią jakby jedną gigantyczną 
molekułę, w której ruch jednego atomu nie może być 
niezależny od innych atomów. Nadpłynność jest zja¬ 
wiskiem kolektywnym, właściwym całemu zbiorowi¬ 
sku atomów; nie można mówić o nadpłynności po¬ 
szczególnych atomów. Nie ma więc żadnych podstaw, 
aby niektórym atomom helu II przypisywać inne włas¬ 
ności niż pozostałym. Cała ciecz powinna być rozpa¬ 
trywana jako jedna całość. 

Autorem takiego podejścia do zagadnienia nadpłyn¬ 
ności helu II był L. D. Landau. Swą teorię nadpłyn¬ 
ności Landau opracował w 1941 r., a więc prawie 
w tym samym czasie, kiedy ukazała się publikacja 
Tiszy dotycząca modelu dwupłynowego. Teoria Lan- 
daua przewidywała również możliwość występowania 
drugiego dźwięku w helu II, przy czym jej wyniki le¬ 
piej zgodziły się z późniejszymi danymi doświadczal¬ 
nymi, niż oszacowanie Tiszy. A oto podstawowe za¬ 
łożenia teorii Landaua: 

teoria W temperaturze zera bezwzględnego ciekły hel 
nadpłynności znajduje się w stanie podstawowym, tzn. ma najniższą 
Landaua energię. Jest to energia stanu podstawowego, czyli 
energia drgań zerowych. Podobnie jak w przypadku 
molekuły znajdującej się w stanie podstawowym, 
energia ta nie jest równa zeru. W temperaturach wyż¬ 
szych od zera ciecz przechodzi w jeden ze swoich sta¬ 
nów wzbudzonych. Oznacza to, że w cieczy pojawia się 
jakiś ruch, inny niż drgania zerowe. Jeśli temperatura 
nie jest zbyt wysoka, to ciecz w stanie wzbudzonym 
ma małą energię (mierzoną od poziomu energii stanu 
podstawowego). Małej energii odpowiadają proste 
rodzaje ruchów, np. lokalne zgęszczenia cieczy prze¬ 
mieszczające się w jej objętości, czyli fala dźwiękowa. 

Każda fala dźwiękowa niesie z sobą określoną ener¬ 
gię e i pęd p związane zależnością; 

« = up, ( 2 ) 

gdzie u jest prędkością dźwięku. Fali dźwiękowej 
fonony można formalnie przyporządkować pewną cząstkę 
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obdarzoną energią e i pędem p . Cząstka taka pod 
nazwą fononu jest dobrze znana z teorii ciała stałego 
jako kwant drgań sieci krystalicznej (kwant dźwięku). 

O tym, że kwanty niskoenergetycznych wzbudzeń 
w helu II można utożsamić z kwantami wzbudzeń 
elementarnych w sieci krystalicznej, świadczy jedna¬ 
kowa temperaturowa zależność „sieciowego” ciepła 
właściwego i ciepła właściwego helu II w pobliżu zera 
bezwzględnego. Ciepło właściwe helu II, podobnie jak 
ciepło właściwe sieci krystalicznej ciała stałego, jest 
proporcjonalne do trzeciej potęgi temperatury. 

W temperaturach wyższych od 0,6 K ciepło właści- rotony 
we Chelu II odbiega od zależności C ~ r 3 , co świad¬ 
czy o tym, że istotną rolę zaczyna odgrywać inny typ 
wzbudzeń elementarnych. Te dodatkowe Wzbudzenia 
Landau nazwał rotonami, wiążąc je z elementarnymi 
zawirowaniami w cieczy kwantowej. Rotony wcześniej 
nie były znane i po raz pierwszy wprowadzono je w 
związku z zagadnieniem nadpłynności. Zależność 
pomiędzy energią i pędem rotonu nie jest już zależ¬ 
nością liniową. 

Funkcja charakteryzująca zależność energii od pędu 
nazywa się widmem energetycznym układu. Aby do¬ 
pasować widmo energetyczne helu II do wyników 
pomiarów ciepła właściwego Landau zaproponował 
dla rotonu następującą zależność energii od pędu: 

(3) 

A oznacza tu najmniejszą wartość energii, jaką może 
mieć roton (wtedy jego pęd jest równy p 0 \ p jest masą 
efektywną rotonu. Danym doświadczalnym odpowia¬ 
dają następujące wartości Alk = 8,5 K, p = 0,16 m He , 
pjh = 1,9-10® cm -1 {k — stała Boltzmanna, m He — 
masa atomu He, h — stała Plancka dzielona przez 2n). 

Rys. 16 przedstawia widmo wzbudzeń energetycz¬ 
nych He II. Pogrubionymi liniami oznaczono części 
widma o największej koncentracji wzbudzeń. 



Rys. 16. Widmo energetyczne helu II. Zgrubienia na krzywej 
wskazują na najczęściej występujące wzbudzenia 

Fonony i rotony (a także inne wzbudzenia wystę¬ 
pujące np. w ciele stałym) różnią się od cząstek ele- 



Rys. 17. Zmiana pędu neutronu po rozproszeniu w helu II. P lt 

P t pęd neutronu przed i po rozproszeniu,/? pęd wytworzonego 
wzbudzenia 
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mentarnych takich jak swobodny elektron czy neutron 
tym, że są nierozłącznie związane z ośrodkiem, w któ¬ 
rym powstają i w którym poruszają się: poza tym 
ośrodkiem wzbudzenia samodzielnie istnieć nie mogą. 
W odróżnieniu od „zwykłych” cząstek elementarnych 
Wzbudzenia energetyczne nazywamy kwazicząstkami 
(ni by-cząstkami). 

W 1957 r. R.P. Feynman podał sposób doświadczal¬ 
nego wyznaczenia widma wzbudzeń elementarnych 
w helu II. Zaproponował mianowicie, aby do tego celu 
wykorzystać rozpraszanie w ciekłym helu wiązki mo- 
noenergetycznych neutronów. Neutron przechodząc 
przez hel II może przekazać cieczy część energii i pędu, 
czyli może wytworzyć w cieczy wzbudzenie elementar¬ 
ne. W wyniku tego procesu neutron odchyli się o kąt 
<p od swego pierwotnego kierunku (rys. 17). Jeżeli E x 

i P 1 oznaczają energię i pęd neutronu przed rozpro¬ 
szeniem, a Et i P 2 — po rozproszeniu, to ze względu 
na prawo zachowania energii i pędu można napisać: 

e=E x -E Zi 1 

P «?»-?., 1 

czyli 

pt pi 

o _ r \ _ 

2 m 2 m ’ 

p = / > J-P^-2P 1 / ? 2 cos9?, 


(4a) 

(4b) 


gdzie e i p jest energią i pędem wytworzonego wzbu¬ 
dzenia, m — masą neutronu. Mierząc P u P 2 i kąt <p 
można znaleźć zależność energii e wzbudzenia od jego 
pędu p , czyli wyznaczyć widmo energetyczne helu II. 
Wyniki pomiarów potwierdziły słuszność propozycji 
Landaua dotyczącej kształtu krzywej widmowej. 

Prześledzimy teraz, jak teoria Landaua tłumaczy 
zjawisko nadpłynności, tzn. przepływu bez tarcia. 
Rozpatrzmy hel II w temperaturze 7= OK, przepły¬ 
wający przez kapilarę z prędkością v. Jeśli ciecz 
doznaje tarcia o ścianki rurki, jej energia kinetyczna 
rozprasza się w postaci ciepła. Nagrzewanie się cieczy 
oznacza przejście w stan wzbudzony. Ale układ kwan¬ 
towy, jakim jest hel II, nie może zmieniać swej energii 
w sposób ciągły. Aby ciecz kwantowa mogła przejść 
ze stanu podstawowego w najbliższy stan wzbudzony, 
czyli zmienić swą energię o s = e(p) y musi powstać 
wzbudzenie elementarne, czyli kwazicząstka o energii 
e i pędzie p. Energia i pęd wytworzonej kwazicząstki 
są tu określone w układzie odniesienia spoczywającym 
względem cieczy, a więc poruszającym się względem 
ścian rurki z prędkością v. 

W układzie odniesienia obserwatora związanego 
nieruchomo ze ścianami parki energia wzbudzenia, 

czyli zmiana energii cieczy, wynosi e+pv 9 zgodnie ze 
znanymi z mechaniki wzorami transformacyjnymi 
dla energii i pędu. Wartość tej zmiany energii cieczy 
musi być ujemna, gdyż dla obserwatora nieruchome¬ 
go względem ścian rurki energia kinetyczna cieczy na 
skutek tarcia o ściany może się tylko zmniejszać. Ma¬ 
my więc: , t 

p v < 0. (5) 


Wyrażenie po lewej stronie znaku nierówności ma 
najmniejszą wartość wtedy, gdy wektor prędkości 

cieczy tTi wektor pędu kwazicząstki p mają przeciwne 
zwroty. Wtedy 

s—pv < 0, 


czyli 


e 

v > —. 
P 


( 6 ) 


A więc minimalna wartość prędkości cieczy •wmin, 
która jest konieczna do wytworzenia wzbudzenia ele¬ 
mentarnego, nie może być mniejsza niż (s/p) min. Przy 
mniejszych prędkościach przepływu nie mogą powstać 
wzbudzenia w nadpłynnym helu i przepływ będzie się 
odbywał bez tarcia. 


Zauważmy, że stosunek e/p na wykresie zależności 
e od p jest tangensem kąta a między osią odciętych 
a prostą przechodzącą przez początek układu i punkt 
o współrzędnych p , e. Najmniejszy kąt amin = 
= (e/p) m in utworzy styczna do krzywej e^)w punkcie 
leżącym blisko minimum na rotonowej części widma 
(na rys. 16 styczna ta jest oznaczona linią przerywa¬ 
ną). Tangens najmniejszego kąta odpowiada prędkości 
v m in = 60 m/s. Jest to wartość ok. sto razy większa 
niż krytyczne prędkości przepływu obserwowane w 
doświadczeniach. Powód tej rozbieżności zostanie wy¬ 
jaśniony później. 

Aby mogła pojawić się nadpłynność, kąt a młn nie 
może być równy zeru dla żadnego punktu na krzywej 
e(p). Inaczej mówiąc, oś rzędnych nigdzie nie może 
być styczna do krzywej widma. Tak mogłoby się zda¬ 
rzyć, gdyby np. widmo rotonów miało postać opisaną 
nie wzorem (3) lecz wzorem s = p 2 l2m y jak widmo 
cząstek swobodnych, albo gdyby we wzorze (3) nie 
było wyrazu A oznaczającego minimalną wartość 
dozwolonych energii rotonu. Wartość A nazywana 
jest przerwą energetyczną w widmie dozwolonych 
wartości energii rotonu. 

Gdyby kąt amin był równy zeru, to tga m in = v m in = 
= 0 i każda prędkość przepływu większa od zera po¬ 
wodowałaby utratę nadpłynności, czyli nadpłynność 
w ogóle nie mogłaby wystąpić. Warunek tgamin > 0 
nazywa się kryterium Landaua wystąpienia nadpłyn¬ 
ności. 

Rozpatrzyliśmy przepływ helu II przez rurkę w tem¬ 
peraturze T = 0 K. W temperaturach wyższych od 
zera ciecz znajduje się w jednym ze swoich stanów 
wzbudzonych. Zamiast mówić, że ciecz jest w H-tym 
stanie wzbudzonym, możemy powiedzieć, że w cieczy 
powstało n elementarnych wzbudzeń. W tym ujęciu 
przejście cieczy w kolejny stan wzbudzony jest równo¬ 
ważne wytworzeniu jeszcze jednej kwazicząstki. 

Jeśli temperatura cieczy nie jest zbyt wysoka, to 
koncentracja wzbudzeń w cieczy jest mała i wzbudze¬ 
nia te można traktować jako niezależne od siebie. 
W temperaturach bliskich Tx nie można już zaniedbać 
oddziaływań wzajemnych między wzbudzeniami i kon¬ 
cepcja wzbudzeń elementarnych staje się mało przy¬ 
datna. Poniżej T = 1,8 K możemy jednak gaz wzbu¬ 
dzeń elementarnych uważać za gaz doskonały, tzn. 
możemy pominąć oddziaływania wzajemne cząstek 
tego gazu. 

Kiedy wzbudzeń jest dużo, częściej się z sobą zde¬ 
rzają, czas ich życia At określony wzajemnymi zderze¬ 
niami jest więc krótki, a ponieważ z zasady nieokreślo¬ 
ności Heisenberga wynika, że AeAt = h , to nieokreś¬ 
loność energii As wzbudzeń jest duża, porównywalna 
z ich własnymi energiami Wtedy niecelowe jest po¬ 
sługiwanie się pojęciem wzbudzeń, którym nie można 
przyporządkować określonej energii. 

Ponieważ wyprowadzając kryterium nadpłynności 
nigdzie nie wykorzystano założenia o nieistnieniu 
wzbudzeń elementarnych w cieczy, kryterium to po¬ 
zostaje słuszne także i dla T > 0. A więc przy pręd¬ 
kościach przepływu mniejszych niż v m in nowe wzbu¬ 
dzenia tworzyć się nie będą. Jednak istniejące już w 
cieczy wzbudzenia mogą oddziaływać ze ściankami 
naczynia lub kapilary. Zachowują się one jak cząstecz¬ 
ki normalnego gazu, wymieniają więc ze ściankami 
swą energię i pęd. Gaz wzbudzeń elementarnych od¬ 
powiada więc temu, co w modelu dwupłynowym 
nazwaliśmy składnikiem normalnym. 


Kwantowane wiry 

Pozostała do wyjaśnienia sprawa, dlaczego obserwo¬ 
wane krytyczne prędkości przepływu są prawie sto 
razy mniejsze niż te, które wynikają z kryterium Lan¬ 
daua. Landau w swej teorii uwzględnił tylko dwa ro¬ 
dzaje wzbudzeń w helu II: fonony i rotony. W rzeczy¬ 
wistości prócz tych wzbudzeń elementarnych w nad¬ 
płynnym helu mogą tworzyć się wzbudzenia innego 
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prędkości liniowej 


typu, tzw. kwantowane wiry. Są to wzbudzenia ma¬ 
kroskopowe — w ruchu wirowym bierze udział duża 
liczba atomów helu. Energia wzbudzenia przypadają¬ 
ca na jeden atom jest mała — do wytworzenia wiru 
wystarczają więc małe prędkości przepływu. 

Krytyczna prędkość związana z wytwarzaniem ma¬ 
kroskopowego wiru jest odwrotnie proporcjonalna 
do średnicy rurki, przez którą przepływa hel II. 
W szerokich rurkach prędkość krytyczna jest bardzo 
mała i dlatego w takich rurkach trudno jest obser¬ 
wować nadpłynność. Zależność prędkości krytycznej 
od średnicy rurki jest zrozumiała: im szersza rurka, 
tym łatwiej może się w niej wytworzyć makroskopowy 
wir. 

Wiry tworzą się również w płynach klasycznych, 
zarówno w cieczach, jak i w gazach. Są to jednak wiry 
o dużych, a często nawet ogromnych rozmiarach. 
Wir w wodzie można obserwować np. przy wypusz¬ 
czaniu wody z wanny przez otwór odpływowy w dnie. 
W powietrzu niekiedy tworzą się wiry nazywane trą¬ 
bami powietrznymi. 

Wir obraca się wokół pewnej osi, która nie musi 
być linią prostą. Środkowa część wiru, tzw. jądro, 
obraca się jak bryła sztywna, ze stałą prędkością 
kątową co, a więc prędkość liniowa v w cząstek we¬ 
wnątrz jądra wiru jest proporcjonalna do odległości 
r od osi obrotu, czyli v w = <or. Na zewnątrz jądra 
ciecz lub gaz wiruje w ten sposób, że prędkość li- 



Rys. 18. Zależność prędkości liniowej t? cząsteczek wirującego 
płynu od odległości r od osi wiru; R promień jądra wiru 

niowa jest odwrotnie proporcjonalna do odległość 7 
od środka wiru v z = K/r (rys. 18). Na obwodzie ją¬ 
dra o promieniu R obie prędkości są sobie równe, 
czyli o)R = K/R, skąd: 


K=coRK (17) 

Wielkość K charakteryzuje dany wir i nazywa się na¬ 
tężeniem wiru. Często posługujemy się również po¬ 
jęciem cyrkulacji lub wielkości od niej dwa razy 
mniejszej i nazywanej strumieniem wirowości. Stru¬ 
mień wirowości, określony jako / = nK = co-nR 2 , 
jest więc iloczynem wartości wektora wirowości 

co (czyli wektora prędkości kątowej) i powierzchni 
poprzecznego przekroju jądra. Wektor co jest równo¬ 
legły do osi wiru, czyli prostopadły do wektora v, 
zaś jego zwrot określa reguła śruby prawoskrętnej: 

jeśli obracamy śrubę w kierunku v, to wkręca się ona 
w kierunku co (rys. 19). 

Strumień wirowości jest stały wzdłuż osi wiru. 
W cieczy doskonałej, tj. pozbawionej lepkości i nie¬ 
ściśliwej, jest on również stały w czasie, czyli wir nie 
może się wytworzyć, a jeśli już istnieje, to nie może 
zniknąć. Pod tym względem hel II nie może być uwa¬ 
żany za ciecz doskonałą. 

Moment pędu atomu helu krążącego dokoła jądra 
wiru jest równy mnevr (niHe oznacza masę atomu 
helu). Podobnie jak w wypadku elektronu krążącego 
wokół jądra atomowego, moment pędu nie może 
przybierać wartości dowolnej, lecz musi być krotno¬ 
ścią h. Ponieważ v — K/r, moment pędu atomu helu 
w wirze musi spełniać warunek: mneK — nh , czyli 
I = n(h/2mne)y gdzie n jest liczbą całkowitą. Wiry two¬ 
rzące się w helu II są więc skwantowane, czyli ich 
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strumień wirowości I = rcKjest całkowitą krotnością kwanty 
kwantu strumienia równego A/2/MHe = 0,5 • 10~ 3 cm 2 /s. strumienia 
Wiry w helu II można wytworzyć przez wprowa- wirowości 
dzenie naczynia z helem w ruch obrotowy. Włókna 
wirowe są wtedy równoległe do osi obrotu naczynia 
i rozciągają się od dna naczynia do swobodnej po¬ 
wierzchni cieczy. Wiry zaczną się tworzyć, gdy pręd¬ 
kość kątowa Q naczynia przekroczy pewną wartość 


Rys. 20. Zależność 
moKientu pędu helu 
II od prędkości kąto¬ 
wej obracającego się 
naczynia 



c 2 

prędkość kątowa naczynia Q 


niewiru- 

jąca 

ciecz 

nad¬ 

płynna 


ciecz 
wirującą 
z naczy¬ 
niem 


krytyczną Q C1 zależną od średnicy naczynia. W miarę 
wzrostu Q coraz więcej wirów pojawia się w cieczy 
i moment pędu L cieczy wzrasta. Gdy Q osiągnie 
drugą wartość krytyczną Q C2 > cała ciecz będzie wiro¬ 
wać jak ciecz normalna i L = MQ, gdzie M — masa 
cieczy (rys. 20). 

Próby doświadczalnego potwierdzenia kwantowa¬ 
nia wirów w helu II przez długi czas kończyły się nie¬ 
powodzeniem. Dopiero W. Vinen w 1961 r. wykazał 
istnienie kwantów strumienia wirowości. Badał on, 
jak zachowuje się drgająca struna, dokoła której 
istnieje cyrkulacja cieczy. Na strunę działa wtedy siła 
znana w hydrodynamice jako siła Magnusa. Siła ta 
jest prostopadła do kierunku wektora wirowości i do 
prędkości struny względem niewirującej cieczy, tj. 
cieczy odległej od jądra wiru. Jest ona także propor¬ 
cjonalna do tych wielkości. Badania wykazały, że 
cyrkulacja helu II dokoła struny ma skwantowane 
wartości. 

Najbardziej przekonywającego dowodu istnienia 
kwantów strumienia wirowości dostarczyli G.W. Rey- 
field i F. Reif, którzy mierzyli szybkość poruszania 
się jonów helu w cieczy nadpłynnej. Jon helu zacho¬ 
wuje się jak obca cząstka w helu II i podczas ruchu 
zderza się z wzbudzeniami cieplnymi, czyli doznaje 
tarcia. Celem doświadczenia było wyznaczenie liczby 
wzbudzeń elementarnych jako funkcji temperatury. 

Jony helu uzyskiwały prędkość początkową w polu 
elektrycznym i następnie poruszały się w cieczy nad¬ 
płynnej. W najniższej osiągniętej podczas tych do¬ 
świadczeń temperaturze T = 0,28 K tarcie w helu II 
było tak małe, że jon wędrował bez zderzeń kilka 
cm, ale już w7 = 0,5K droga swobodna jonu wy¬ 
nosiła tylko 10 -4 cm. 

Najdziwniejsze wyniki uzyskano, gdy zwiększono 
natężenie pola elektrycznego, które nadawało jonom 
początkową energię kinetyczną. Okazało się, że pręd¬ 
kość nośnika ładunku maleje, gdy wzrasta jego ener¬ 
gia. Oznaczało to, że ze wzrostem energii rośnie masa 
tworu niosącego ładunek; oszacowano, że ów twór 
musi się składać z wielu tysięcy atomów helu. Nasu- wir 
wało się więc przypuszczenie, że jest to makr osko- makrosko¬ 
powy wir. Dalsze badania wykazały, że jony helu powy 
o wystarczająco dużej energii kinetycznej rzeczywiście 
powodują tworzenie się w helu II wirów w kształcie 
pierścieni, czyli podobnych do kółek z dymu papiero¬ 
sowego. Oś takiego wiru jest więc krzywą zamkniętą 
(kołem), a średnica kółka wirowego o energii 50 eV 
wynosi około 10~ 4 cm i rośnie ze wzrostem energii. 

Każdy z tych pierścieni wirowych niesie dokładnie 
jeden kwant strumienia wirowości równy /r/2mne. 

Tak więc kwantowanie, z którym zwykle spotykamy 
się na poziomie mikrokosmosu, tutaj zostało wykryte 
również w układzie makroskopowym. 
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Koncepcje dotyczące kwantowania wirów w helu II 
odegrały ważną rolę w kształtowaniu się poglądów 
na wiry prądowe w nadprzewodnikach II rodzaju 
w stanie mieszanym. Takie wiry prądowe wytwarzają 
skwantowany strumień magnetyczny (-> Nadprze¬ 
wodnictwo). 


Zagadnienia nadplynności a statystyka 
kwantowa 

Wprowadzając koncepcję modelu dwupłynowego do 
zagadnienia helu II Tisza oparł się na teorii dosko¬ 
nałego gazu bozonów, tj. cząstek o spinie całkowi¬ 
tym. Nazwa tych cząstek pochodzi stąd, że podlegają 
one statystyce Bosego-Einsteina. 

Jądro atomu 4 He, składające się z parzystej liczby 
cząstek o spinach połówkowych, ma ogólny spin 
całkowity; atomy 4 He są więc bozonami. Oddziały¬ 
wanie między atomami ciekłego helu jest bardzo słabe, 
ciekły hel może być więc w przybliżeniu potraktowany 
jako gaz. W wystarczająco niskiej temperaturze w do¬ 
skonałym gazie bozonów powinna nastąpić konden¬ 
sacja pewnej części gazu. Nie jest to jednak konden¬ 
sacja w zwykłym sensie, tzn. skraplanie lub krystali¬ 
zacja, lecz kondensacja w „przestrzeni’.’ pędów. Inny¬ 
mi słowy, pewna liczba N 0 cząstek z ogólnej liczby N 
bozonów zawartych w objętości V powinna znaleźć 
się w stanie podstawowym, tj. najniższym stanie ener¬ 
getycznym z pędem równym zeru. Stosunek N 0 /N 
jest funkcją temperatury. Przyjmując, że masa cząstki 
gazu Bosego jest równa masie atomu 4 He, otrzymuje 
się dla temperatury kondensacji wartość 3,14 K, 
a więc bardzo bliską temperaturze lambda. Zgodność 
jest bardzo dobra, zwłaszcza jeśli weźmiemy pod 
uwagę, że ciekły hel nie jest gazem doskonałym. 

Mikroskopową teorię niedoskonałego gazu bozo¬ 
nów opracował N.N. Bogolubow w 1947 r., posługu¬ 
jąc się metodą drugiego kwantowania (-►Teoria 
pola). W tej metodzie istotną sprawą jest dobór od¬ 
powiedniego hamiltonianu (tj. operatora energii), 
uwzględniającego międzycząstkowe oddziaływanie 
w układzie. Zakładając słabość oddziaływania i sto¬ 
sując odpowiednie przekształcenie hamiltonianu Bo¬ 
golubow otrzymał widmo energetyczne układu zbli¬ 
żone do widma Landaua, zwłaszcza w zakresie ma¬ 
łych pędów. Zwróćmy uwagę, że Landau w swej 
teorii nigdzie nie korzystał z założeń dotyczących 
statystyki cząstek. Landau właściwie odgadł kształt 
widma energetycznego helu II, pasującego do danych 
termodynamicznych. 

Jeszcze inne podejście do zagadnienia nadpłynnego 
helu zaproponował R. P. Feynman. Korzystając 
z ogólnych zasad mechaniki kwantowej wprowadził 
on funkcję y> 0i opisującą stan podstawowy helu II. 
Funkcja y 0 zależy tylko od położeń atomów helu w 
układzie i bardzo słabo zmienia się w przestrzeni od 
cząstki do cząstki. Stany wzbudzone opisuje funkcja 
y>E. Aby funkcja *pe mogła odpowiadać faktom do¬ 
świadczalnym, musi spełniać szereg warunków. Na 
przykład ze względu na statystykę jąder 4 He, funkcja 
y>E musi być parzysta, a więc nie może zmieniać się 
przy zamianie atomów miejscami. Żądane warunki 
spełnia funkcja: y>E = JEffa )W Sumowanie prze- 

prowadza się po wszystkich atomach układu, a f(rj) 
jest funkcją tylko ich położeń r>. Po podstawieniu 
funkcji Vjb do równania Schródingera i zastosowaniu 
metody wariacyjnej Feynman wykazał, że rozwiąza¬ 
niem, przy którym energia układu jest najmniejsza, 
jest f(/j) — eti/typn, zaś wyrażenie na energię ma 

jA 

postać e(p) = 2 mS(p j * gdzie P jest pędem wzbudze¬ 
nia. Symbol S(p) oznacza tzw. czynnik struktury 
cieczy. Kształtu funkcji S(p) nie można obliczyć na 
podstawie ogólnych rozważań, ale można go wyzna¬ 
czyć drogą analizy ugięć promieni rentgenowskich w 
cieczy. Znając S(p) można obliczyć e(p), czyli widmo 


energetyczne układu. Otrzymane w ten sposób widmo 
niewiele różni się od widma Landaua. 

Nadpłynność 3He 

Związek pomiędzy statystyką kwantową i nadpłyn- 
nością jest wyraźnie widoczny w wypadku lekkiego 
izotopu helu, a mianowicie 3 He. Izotop ten występuje 
w przyrodzie jako nikła domieszka 4 He; stanowiona 
zaledwie ok. 10 _3 %, nie wywiera więc żadnego zauwa¬ 
żalnego wpływu na własności 4 He. Z powodu bardzo 
małej zawartości 3 He w naturalnych złożach wydoby¬ 
wanie go stamtąd jest nieopłacalne. 3 He otrzymuje się 
w reakcjach jądrowych przez bombardowanie ato¬ 
mów litu neutronami: 

a Li + « - iH + JHe. 

Powstający w czasie tej reakcji tryt (|H) poprzez roz¬ 
pad p przechodzi w |He; okres połowicznego roz¬ 
padu wynosi 12 lat. 

Jądro atomu 3 He, złożone z trzech nukleonów, 
ma wypadkowy spin połówkowy, czyli jest fermio¬ 
nem. Układ takich cząstek podlega statystyce Fer- 
miego-Diraca. Do układu fermionów stosuje się 
zasada Pauliego orzekająca, że w określonym stanie 
kwantowym nie może znaleźć się więcej niż jedna 
cząstka z danego układu. W stanie z najniższą ener¬ 
gią nie może się więc znaleźć duża liczba cząstek, czyli 
kondensacja nie nastąpi. I rzeczywiście, oziębiany aż 
do 3 mK (0,003 K) lekki izotop helu nie przechodzi 
w stan nadpłynny, chociaż opierając się na zasadzie 
odpowiadających sobie stanów, przez analogię do 
2 4 He, można by się spodziewać, że dla i He temperatura 
ambda wyniesie około 1,5 K. 

Po opracowaniu teorii nadprzewodnictwa stało 
się jasne, że jeśli w układzie fermionów pomiędzy po¬ 
szczególnymi cząstkami działają jakieś, chociażby 
nawet niewielkie, siły przyciągania dalekiego zasięgu, 
to w odpowiednio niskiej temperaturze może dojść 
do połączenia się fermionów w pary, które będą 
mieć sumaryczny spin całkowity. Takie pary (tzw. 
pary Coopera) nie są już fermionami i nie podlegają 
zakazowi Pauliego, może więc nastąpić kondensacja. 
Kondensacja w układzie elektronów przewodnictwa 
w metalach odpowiada przejściu w stan nadprzewod¬ 
nictwa. Kondensat elektronowy może się wtedy po¬ 
ruszać w metalu bez tarcia, czyli bez oporu elektrycz¬ 
nego (-► Nadprzewodnictwo). 

W ciekłym 3 He działają pomiędzy poszczególnymi 
atomami siły przyciągania o dalekim zasięgu. Są to 
siły van der Waalsa. W wystarczająco niskiej tempe¬ 



raturze te słabe siły mogą doprowadzić do łączenia 
się atomów 3 He w pary analogiczne do elektronowych 
par Coopera w nadprzewodnikach. Temperatura, 
w której 3 He przechodzi w stan nadpłynny, zależy od 
ciśnienia i zmienia się od 0,8 mK do 2,6 mK przy 
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zmianie ciśnienia od zera do 33,5 -10 5 Pa. Powyżej 
tego ciśnienia 3 He zestala się. Nadpłynność 3 He 
została doświadczalnie potwierdzona dopiero w ostat¬ 
nich latach. Okazało się przy tym, że przy ciśnieniu 
zawartym w przedziale (21,2-33,5) • 10 5 Pa 3 He ma 
faza dwie nadpłynne fazy, które oznaczono literami A 
A i B i B (rys. 21). Jedna z tych faz (faza A) wykazuje 
wyraźną anizotropię własności fizycznych. Przejście 
z fazy nienadpłynnej w fazę A jest przemianą fazową 
II rodzaju (przemianą lambda), przejście między fazą 
A i B jest przemianą fazową I rodzaju. 

Położenie linii rozdzielających obszary poszcze¬ 
gólnych faz 3 He na wykresie stanu w układzie ciśnie- 
nie-temperatura zależy od natężenia H zewnętrznego 
pola magnetycznego. Jądra 3 He mają (ze względu na 
nieparzystą liczbę nukleonów) różny od zera moment 
magnetyczny. Podany na rys. 21 wykres fazowy 
przedstawia położenie linii dla H — 0. Ze wzrostem 
natężenia pola linia rozdzielająca fazę normalną od 
nadpłynnej przesuwa się w stronę niższych tempera- 
podatność tur. Przy łączeniu się atomów 3 He w pary ich jądrowe 
magnetyczna momenty magnetyczne nie kompensują się i dlatego 
3 He nadpłynny 3 He (zwłaszcza faza A) wykazuje znaczną 
podatność magnetyczną. Podatność magnetyczna 
fazy A jest taka sama, jak w fazie normalnej, w fazie 
B podatność maleje ze spadkiem temperatury (rys. 



Rys. 22. Zależność 
względnej' podatności 
magnetycznej ciekłe¬ 
go 3 He od tempera¬ 
tury przy dwu róż¬ 
nych wartościach ci¬ 
śnienia. xn oznacza 
podatność magne¬ 
tyczną 3 Hc w stanie 
normalnym 


22). A więc już chociażby ze względu na własności 
magnetyczne obie nadpłynne fazy 3 He różnią się od 
helu II. Różnice te występują również przy badaniu 
innych własności fizycznych. Ze względu na możliwość 
uporządkowania przestrzennego pod wpływem pola 
magnetycznego obie nadpłynne fazy 3 He można uwa¬ 
żać za ciekłe kryształy (-* Ciekłe kryształy). 

Badanie własności 3 He w bardzo niskich tempera¬ 
turach jest trudnym zadaniem, toteż prace badawcze 
— chociaż dość zaawansowane — nie dały jeszcze 
pełnego obrazu zagadnienia. O trudnościach ekspery¬ 
mentowania w przedziale temperatur rzędu milikelwi¬ 
na niech świadczy takie porównanie: aby osiągnąć 


punkt przemiany lambda w 4 He, należy uzyskać 
temperaturę niższą ok. 140 razy od pokojowej, na¬ 
tomiast temperatura przemiany 3 He w stan nadpłynny 



będzie jeszcze tysiąckrotnie niższa niż temperatura 
przemiany lambda 4 He. Ponieważ ciepło właściwe 
fazy skondensowanej w tak niskich temperaturach 
jest znikomo małe (rys. 23), to nawet nieznaczne do¬ 
pływy ciepła z zewnątrz mogą ogrzać 3 He powyżej 
jego punktu przemiany w stan nadpłynny. 

Struktura nadpłynnych faz 3 He badana jest także 
od strony teoretycznej. Przypuszcza się, że fazy te 
odpowiadają łączeniu się w pary atomów 3 He znaj¬ 
dujących się w stanie P, tj. w stanie z orbitalnym 
momentem pędu / = 1. Modelem fazy B jest model model fazy B 
z izotropową przerwą energetyczną opracowany przez i model 
R. Baliana i N. R. Werthamera, zaś model fazy A fazy A 
z anizotropią przerwy energetycznej zaproponowali 
P. W. Anderson i P. Morel. Opracowano sześć różnych 
typów modeli takiej anizotropowej fazy. Który z tych 
typów odpowiada rzeczywistości, zadecydują wyniki 
badań doświadczalnych, w szczególności badania jąd¬ 
rowego rezonansu magnetycznego. Badania doświad¬ 
czalne dostarczą także materiału, na podstawie które¬ 
go można będzie poznać widma energetyczne nadpłyn¬ 
nych faz 3 He. 

Odrębnym i dość obszernym zagadnieniem, do 
którego istotny wkład wnieśli także polscy fizycy 
(Z. Galasiewicz), jest nadpłynność mieszanin obu 
izotopów helu: 3 He i 4 He. Taka mieszanina może 
być przykładem mieszaniny cieczy kwantowych typu 
Fermiego i typu Bosego. Sam proces rozpuszczania 
3 He w 4 He jest procesem oziębiającym i dzięki temu 
ma ważne znaczenie w kriogenice przy chłodzeniu 
od 0,5 do 0,05 K. Dalsze chłodzenie odbywa się przez 
krystalizację 3 He pod zwiększonym ciśnieniem. 

C. T. Lane Nadpłynność, Warszawa 1967; K. Mendelssohn 
Na drodze do zera bezwzględnego , Warszawa 1970. 


Nadprzewodnictwo 

Eugeniusz Trojnar 


Nadprzewodnictwo, czyli nieskończenie wielkie prze¬ 
wodnictwo elektryczne odkrył w 1911 r. H. Kamer- 
lingh-Onnes. Wkrótce po udanym skropleniu helu 
i osiągnięciu w ten sposób temperatur rzędu kilku 
kelwinów Kamerlingh-Onnes zajął się badaniem 
zmian oporu elektrycznego metali przy ich oziębianiu 
do niskich temperatur. 

odkrycie Wiadomo, że opór czystych metali wyraźnie zależy 
rtadprzewod- od temperatury, przy czym w temperaturach bliskich 
nictwa pokojowej zależność ta jest liniowa, zaś w niskich 
temperaturach odbiega od liniowości. W metalach 
zanieczyszczonych zależność oporu od temperatury 
jest znacznie słabsza, a w niektórych stopach, jak 
manganin czy konstantan, opór od temperatury pra- 
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wie nie zależy. Kamerlingh-Onnes wybrał więc do 
badań rtęć jako metal, który w owym czasie najlepiej 
można było oczyścić (stosując kilkakrotną destylację). 

Ku jego zdziwieniu opór rtęci, zamiast stopniowo zmie¬ 
niać się wraz z temperaturą, w pobliżu 7 = 4K nagle 
zmalał do niewykrywalnie małej wartości. Później 
okazało się, że czystość metalu nie grała tu istotnej 
roli, gdyż opór zanieczyszczonej rtęci także nagle 
znikał po oziębieniu jej do T < 4 K. Od czystości 
metalu zależała tylko wartość oporu, jaką metal 
wykazywał przed przejściem w stan nadprzewodni¬ 
ctwa. 

Zagadnienie, czy opór nadprzewodnika spada rze- opór nad* 
czy wiście do zera, czy tylko do skończonej, chociaż przewodnika 










bardzo malej wartości, trudno rozstrzygnąć przy 
użyciu zwykłych przyrządów pomiarowych. Przyrządy 
zawsze wnoszą pewien błąd do pomiaru, nie możemy 
więc zmierzyć wielkości mniejszej od tego błędu. 
Możemy jedynie powiedzieć, że sama wielkość nie 
przekracza błędu pomiaru. Najdokładniejsza metoda 
pomiaru bardzo małego oporu polega na wzbudzeniu 
w obwodzie (np. w pierścieniu z nadprzewodnika, 
którego opór chcemy zmierzyć) prądu i pomiarze cza¬ 
su jego zaniku. Jeżeli obwód ma skończony opór, to 
natężenie prądu będzie z czasem maleć, co można wy¬ 
kryć mierząc natężenie pola magnetycznego wytwo¬ 
rzonego przez ten prąd. Takie doświadczenie z oło¬ 
wianym pierścieniem nadprzewodzącym przeprowa¬ 
dził S. C. Collins; po upływie dwu i pół roku nie 
stwierdził on żadnego zauważalnego osłabienia prądu 
krążącego w pierścieniu. Uwzględniając dokładność 
pomiaru natężenia pola magnetycznego i indukcyj- 
ności pierścienia oszacowano, że opór właściwy nad¬ 
przewodzącego ołowiu nie mógł być większy niż 
10“ 26 fi-m. Jest to niezwykle mała wartość, około 
10 17 razy mniejsza niż opór właściwy najlepszych 
przewodników w temperaturze pokojowej, jakimi są 
srebro i miedi. Możemy więc uważać, że opór nad¬ 
przewodnika jest dokładnie równy zeru. 


Obraz kwantowy 

Zjawisko nadprzewodnictwa, podobnie jak i zjawisko 
nadpłynności (-► Nadpłynność), jest przejawem dzia¬ 
łania praw fizyki kwantowej w skali makroskopowej. 
Między tymi zjawiskami istnieją pewne analogie; 
nadprzewodnictwo można potraktować jako nadpłyn¬ 
ność cieczy złożonej z naładowanych cząstek. Tą 
cieczą jest układ elektronów przewodnictwa w me¬ 
talach. W obu wypadkach, zarówno nadpłynności 
helu II, jak i nadprzewodnictwa, mamy do czynienia 
z możliwością przepływu bez tarcia, czyli bez strat 
energii. 

warunki Nadprzewodnictwo występuje tylko w niskich 
występowa- temperaturach. Najwyższa dotychczas notowana tem- 
nia nadprze- peratura, w której stwierdzono jeszcze istnienie nad- 
wodnictwa przewodnictwa, wynosiła 23,2 K. Niskie wartości 
temperatur, w których może pojawiać się nadprze¬ 
wodnictwo, świadczą o tym, że oddziaływanie wy¬ 
wołujące to zjawisko jest bardzo słabe. W wyższych 
temperaturach energia cieplna kT{k — stała Boltz- 
manna, T — temperatura bezwzględna) jest już zbyt 
duża i niszczy uporządkowanie nadprzewodzące. 
Energia oddziaływania wywołującego nadprzewod¬ 
nictwo przypadająca na jedną oddziałującą cząstkę 
jest więc rzędu kTje , gdzie T k jest temperaturą kry¬ 
tyczną, powyżej której nadprzewodnictwo znika. 

Pomimo że możliwość przepływu trwałego prądu 
elektrycznego bez strat odkryto jeszcze w 1911 r., 
to na wyjaśnienie istoty tego zjawiska na podstawie 
mikroskopowych właśności materii trzeba było po¬ 
czekać aż do 1957 r., a więc niemal pół wieku. Ten 
czas wydaje się bardzo długi, zwłaszcza jeśli porównać 
go z czasem, który upłynął od wykrycia nadpłynności 
(1940 r.) do jej objaśnienia przez L. D. Landaua 
(1943 r.). 

Nadpłynność można było objaśnić uwzględniając 
fakt, że atomy helu są bozonami i mogą występować 
w stanie kondensacji Bosego. Elektrony przewod¬ 
nictwa w metalu są jednak fermionami, podlegają 
więc regule zakazu Pauliego i duża ich liczba nie 
może się kondensować w jednym stanie energetycznym 
z pędem równym zeru. Gdy jednak dwa elektrony 
z przeciwnymi spinami i pędami połączą się w parę, 
to taka para będzie mieć ogólny spin całkowity i nie 
będzie już podlegać zakazowi Pauliego. 

Przypuszczenie, że elektrony mogą łączyć się w pa¬ 
ry, wyraził R. A. Ogg jeszcze przed opracowaniem 
teorii nadprzewodnictwa, ale wydawało się ono 
wtedy (1946 r.) nieprawdopodobne, gdyż trudno było 
sobie wyobrazić elektrony powiązane w pary wbrew 


siłom odpychania kulombowskiego. Dopiero H. Froh- 
lich w 1950 r. wskazał na rolę, jaką w nadprzewodni¬ 
ctwie gra oddziaływanie elektronów z siecią krystalicz- pary Coopera 
ną. Wykrycie w tym samym roku efektu izotopowego 
potwierdziło przypuszczenia Frohlicha. Mechanizm 
tworzenia się par elektronowych przy udziale sieci 
wyjaśnił L. Cooper w 1956 r., dlatego takie pary 
nazywamy często parami Coopera. 

Pary elektronów nie są jednak bozonami w ścisłym 
znaczeniu. Doświadczenie wykazuje, że odległość, 
z jakiej oddziałują z sobą elektrony pary, jest znacznie 
większa niż średnia odległość między poszczególnymi 
parami. W takim układzie, złożonym z przenikają¬ 
cych się wzajemnie par cząstek, daje o sobie znać 
wewnętrzna struktura pary, a więc fakt, że jest ona 
złożona z fermionów. Znajduje to odbicie w widmie 
wzbudzeń energetycznych układu elektronów nad¬ 
przewodnika. Kondensat bozonowy, jakim jest hel II, 
ma widmo wzbudzeń energetycznych typu Bosego, 
tzn. wzbudzenia (kwazicząstki) są także bozonami, 
ponieważ zarówno fonony, jak i rotony w nadpłyn¬ 
nym helu mają spin równy zeru; takie kwazicząstki 
mogą tworzyć się pojedynczo. Natomiast kwazi¬ 
cząstki typu Fermiego (ze względu na zachowanie 
spinu) powstają wyłącznie parami, np. elektron 
i dziura lub dwa wzbudzenia elektronowe w wypadku 
rozerwania pary Coopera. Widmo typu Fermiego 
charakteryzuje kondensat elektronowy. Wzbudze¬ 
nia układu elektronów w nadprzewodniku zachowu¬ 
ją się jak elektrony przewodnictwa w normalnym 
metalu. 

W wyjaśnianiu problemu widma wzbudzeń elektro- elektronowo 
nowych w nadprzewodnikach dużą rolę odegrały c j 0 pł o 
staranne pomiary ciepła właściwego. Ciepło właściwe w | a §o|wo 
układu elektronów przewodnictwa w metalu normal¬ 
nym jest liniową funkcją temperatury, w wypadku zaś 
nadprzewodnika elektronowe ciepło właściwe jest 
proporcjonalne do c~ AlkT . Taka zależność wskazuje 
na istnienie przerwy energetycznej A (pasma zabro¬ 
nionych wartości energii) w widmie wzbudzeń elek¬ 
tronowych w nadprzewodniku. Istnienie przerwy 
energetycznej potwierdziły później badania pochłania¬ 
nia promieniowania elektromagnetycznego i ultra¬ 
dźwięków, oraz — najbardziej przekonywająco — 
zjawiska tunelowe. 

Mikroskopowa teoria nadprzewodnictwa uwzględ¬ 
niająca wyniki dotychczasowych badań została stwo¬ 
rzona w 1957 w. przez J. Bardeena, L. Coopera 
i J. Schrieffera, którzy za tę pracę otrzymali w 1973 r. teoria BCS 
nagrodę Nobla. Od pierwszych liter nazwisk twór¬ 
ców jest ona często nazywana teorią BCS. Od czasu 
powstania teoria ta jest ciągle rozwijana i udoskona¬ 
lana przez wielu badaczy. Obecnie nauka o nadprze¬ 
wodnictwie jest bardzo rozbudowaną dziedziną fizyki 
współczesnej i w tym artykule możemy rozpatrzyć 
tylko niektóre jej aspekty. 


Korelacja w układzie elektronów 

Elektrony przewodnictwa w metalu 

Wyjaśnijmy teraz bardziej szczegółowo przyczyny 
znikania oporu elektrycznego. W metalach prąd elek¬ 
tryczny jest to przepływ elektronów przewodnictwa 
(dokładniejsze omówienie przewodnictwa w metalu 
zawiera hasło -* Metale), tj. tych elektronów, które 
nie są związane z poszczególnymi atomami, lecz są 
wspólne dla całej sieci krystalicznej. Często nazywamy elektrony 
je elektronami swobodnymi, chociaż nie są one w pełni swobodne 
swobodne, gdyż — po pierwsze — znajdują się w zmie¬ 
niającym się okresowo w przestrzeni potencjale sieci 
krystalicznej, a po drugie — mogą przybierać tylko 
dozwolone, dyskretne wartości energii, przy czym — 
zgodnie z regułą zakazu Pauliego — ten sam poziom 
energetyczny mogą zajmować co najwyżej dwa elek- 
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trony różniące się orientacją spinu. W danym stanie 
kwantowym może więc znaleźć się tylko jeden eletron 
układu. 

Gęstość stanów elektronowych N, czyli liczba AZ 
stanów kwantowych przypadających na dany prze¬ 
dział energii AE w jednym molu metalu (albo w jed¬ 
nostce objętości), jest funkcją energii E. Gęstość sta¬ 
nów definiujemy jako N(E) = AZ(E)/AE. Wykres 
zależności N od E dla pasma przewodnictwa jest 
przedstawiony na rys. la. Ze względu na wygodę 
w późniejszym posługiwaniu się wykresem oś energii 
kierujemy pionowo, zaś oś gęstości stanów — po¬ 
ziomo. 




elektronowych N(E) elektronowych N(E) 

a) b) 

Rys. 1. Zależność gęstości stanów elektronowych w zależności 
od energii: a) w metalu normalnym, b) w nadprzewodniku (dla 
wyrazistości przerwa energetyczna mocno powiększona). Czarną 
linią oznaczono stany zajęte w T > 0 

W temperaturze T = 0 układ elektronów przewod¬ 
nictwa ma najniższą energię. Elektrony zajmują 
wszystkie nisko leżące stany, a najwyższy z zajętych 
stanów nazywa się poziomem Fermiego (£». Mó¬ 
wimy, że układ elektronów przewodnictwa jest 
w swym stanie podstawowym (niewzbudzonym). 
Energia całego układu jest oczywiście sumą energii 
elektronów we wszystkich stanach zajętych. 

W T > 0 niektóre elektrony wzbudzają się ter¬ 
micznie na wyższe poziomy energetyczne i zwalniają 
stany pod poziomem Fermiego. Elektrony te możemy 
traktować jako wzbudzenia termiczne układu elektro¬ 
nów. Podobnie można traktować zwolnione stany 
(dziury) pod poziomem Fermiego. W T > 0 nastę¬ 
puje więc rozmycie poziomu Fermiego. Szerokość 
przedziału rozmycia jest rzędu kT. W temperaturze 
pokojowej stanowi to około 0,025 eV. Dla porów¬ 
nania podamy, że wysokość poziomu Fermiego nad 
dnem pasma przewodnictwa wynosi kilka eV (do 
10 eV). 

Elektrony zajmujące niskie stany energetyczne nie 
mogą zmieniać swej energii, gdyż wszystkie sąsiednie 
stany dozwolone są już zajęte. Nie mogą więc one 
być przyspieszane w polu elektrycznym, czyli nie 
biorą udziału w przepływie prądu. Pod wpływem pola 
mogą zmieniać swą energię tylko te elektrony, które 
zajmują stany w przedziale rozmycia, tj. w pobliżu 
poziomu Fermiego. 

Elektrony wzbudzone termicznie, podobnie jak 
i dziury, są kwazicząstkami, bo ich własności zależą 
od sieci krystalicznej, w której się poruszają. Ich ruch 
w sieci podlega prawom mechaniki kwantowej i daje 
się opisać funkcjami falowymi modulowanymi z okre¬ 
sem sieci. W niezaburzonej, ściśle okresowej sieci 
krystalicznej fale elektronowe powinny się rozchodzić 
bez przeszkód, czyli nie powinny ulegać rozproszeniom. 
Opór elektryczny nie może więc istnieć w takiej sieci. 
Defekty struktury i drgania cieplne jonów sieci za¬ 
burzają jednak okresowość struktury krystalicznej 
i rozpraszają fale elektronowe. W procesie rozpro¬ 
szenia elektrony przekazują sieci energię nabytą 
w polu elektrycznym. Opór elektryczny jest więc wy¬ 
nikiem zaburzeń w okresowości struktury krystalicz¬ 
nej. Ze spadkiem temperatury słabną drgania jonów 
sieci i opór metali maleje. Ta zaś część oporu, która 
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jest spowodowana defektami struktury lub domiesz¬ 
kami obcych atomów nie zależy od temperatury i po¬ 
zostaje nawet w najniższych temperaturach, jeśli 
metal nie przechodzi w stan nadprzewodnictwa. Jest to 
tzw. opór resztkowy metali. 

Drgania cieplne sieci krystalicznej są skwantowane 
a kwanty drgań nazywają się fononami (—► Dynamika 
sieci krystalicznej). Można więc mówić o rozprosze¬ 
niach elektronów na fononach jako o przyczynie tej 
części oporu elektrycznego, która zależy od tempera¬ 
tury. Opór wzrasta z temperaturą, gdyż zwiększa się 
gęstość gazu fononowego i zderzenia elektronów z fo¬ 
nonami są częstsze. W niektórych metalach w odpo¬ 
wiednio niskiej temperaturze elektrony nie doznają 
rozproszeń na fononach i defektach sieci. Wskazówką, 
gdzie szukać przyczyny tego zjawiska było odkrycie 
efektu izotopowego. 

Efekt izotopowy polega na tym, że różne izotopy 
tego samego pierwiastka nadprzewodzącego (np. 
Sn lub Hg) mają różne temperatury przejścia w stan 
nadprzewodzący (7*), przy czym dla danego pier¬ 
wiastka zachodzi przybliżona zależność: 7fc-|/M = 
= const, gdzie M oznacza masę atomową izotopu. 
Okazało się więc, że dla nadprzewodnictwa, które jest 
zależne od układu elektronów w metalu, istotna jest 
również masa jonów tworzących sieć krystaliczną. 
Należy zatem uwzględnić ruch tych jonów, czyli ich 
drgania. Przyczyn nadprzewodnictwa trzeba przeto 
szukać w oddziaływaniu elektronów przewodnictwa 
z drganiami sieci jonowej, czyli z fononami. Ciekawe, 
że właśnie to oddziaływanie, którego wynikiem jest 
występowanie oporu elektrycznego, w pewnych wa¬ 
runkach może prowadzić do jego znikania. Tym moż¬ 
na wytłumaczyć fakt, że najlepsze przewodniki elek¬ 
tryczności, jakimi są srebro, złoto czy miedź, nie prze¬ 
chodzą w stan nadprzewodnictwa (przynajmniej w tym 
przedziale temperatur, w którym były dotychczas 
przebadane); oddziaływanie elektronów z siecią jest 
w tych metalach zbyt słabe. 


Pary Coopera 

Jeśli w układzie fermionów (czyli cząstek podlegają¬ 
cych regule zakazu Pauliego) między poszczegól¬ 
nymi cząstkami działają siły przyciągania dalekiego 
zasięgu, to mogą one doprowadzić do łączenia się 
cząstek o przeciwnych spinach w pary, które mają 
ogólny spin całkowity i nie podlegają już regule Pau¬ 
liego. Pary takie mogą więc utworzyć kondensat 
cząstek znajdujących się na tym samym poziomie 
energetycznym. Od nazwiska twórcy tej koncepcji 
fermiony związane w pary nazywają się parami Coope¬ 
ra. 

Prowadzące do nadpłynności łączenie się cząstek 
w pary Coopera wydaje się być powszechnym zja¬ 
wiskiem w układach fermionów. Proces ten zachodzi 
np. w ciekłym 3 He. Przypuszcza się, że zachodzi on 
również w gwiazdach neutronowych. Najprawdo¬ 
podobniej pulsary należą do gwiazd nadpłynnych. 

Pomiędzy elektronami przewodnictwa w metalu, 
jako cząstkami o ładunku ujemnym, działają siły 
wzajemnego odpychania. Z powodu ekranowania 
elektronów dodatnimi ładunkami otaczających je jo¬ 
nów sieci krystalicznej, siły te mają krótki zasięg, rzędu 
kilku odległości międzyatomowych. Jak wskazuje 
efekt izotopowy, źródeł dalekozasięgowych sił wza¬ 
jemnego przyciągania się elektronów należy szukać 
w oddziaływaniu elekronów za pośrednictwem sieci 
krystalicznej, tzw. oddziaływania elektronowo-fono- 
nowego. 

Przyciągające oddziaływanie między elektronami 
za pośrednictwem sieci możemy sobie wyobrazić 
w następujący sposób. Elektron porusza się przez sieć 
i deformuje ją na skutek oddziaływania kulombow- 
skiego. Deformacja polega na zgęszczaniu dodatnich 
jonów sieci w pobliżu elektronu. To zgęszczenie do¬ 
datnich jonów oddziałuje z kolei na inny elektron. 
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W rezultacie oba elektrony przyciągają się wzajemnie 
za pośrednictwem sieci. Zgęszczenie jonów oddziały¬ 
wa na elektrony na znacznie większe odległości niż 
bezpośrednie oddziaływanie między elektronami, jest 
więc oddziaływaniem dalekiego zasięgu (rzędu kilku¬ 
set lub kilku tysięcy odległości międzyatomowych). 

Kwantowy opis zjawiska oddziaływania wzajemne¬ 
go między elektronami poprzez sieć jest następujący. 
Elektron poruszający się w krysztale wzbudza ener¬ 
getycznie sieć jonową na wyższy poziom, wytwarza 
więc kwant wzbudzenia sieci, czyli fonon. Ten fonon 
zostaje pochłonięty przez inny elektron i sieć wraca 
do poprzedniego stanu. Siła przyciągania między 
elektronami jest zatem siłą wymiany fononu. Siły 
wymiany znane są w fizyce, np. w teorii jądra atomo¬ 
wego, gdzie siła przyciągania się nukleonów jest siłą 
wymiany mezonu n. 

Tak zwane wirtualne, krótkożyjące fonony wymia¬ 
ny są niezależne od fononów — wzbudzeń cieplnych 
sieci krystalicznej. Te ostatnie pojawiają się tylko 
w T > 0, natomiast fonony wymiany są emitowane 
i pochłaniane przez elektrony także w T # 0. 


Przerwa energetyczna 

Energia fononu nie może być dowolnie wielka, gdyż 
długość fali dźwięku rozchodzącego się w sieci kry¬ 
stalicznej nie może być mniejsza niż stała sieci, czyli 
odległość między sąsiednimi węzłami (energia fo¬ 
nonu e jest związana z długością fali dźwiękowej X 
zależnością: e — hujX — hv, gdzie u oznacza prędkość 
dźwięku, h — stałą Plancka, v — częstość dźwięku). 
Maksymalna energia fononu £ m ax = hv m&x w me¬ 
talach wynosi ok. 10 -2 eV. W procesie łączenia się 
w pary Coopera mogą więc brać udział tylko te 
elektrony, które mają energię mieszczącą się w prze¬ 
dziale o szerokości kv max po obu stronach poziomu 
Fermiego. Jest to wąski przedział w porównaniu 
z wysokością £> poziomu Fermiego nad dnem pasma 
przewodnictwa ( Ef & 10 eV). 

Wiązanie się elektronów w pary prowadzi do zmia¬ 
ny rozkładu stanów energetycznych w pobliżu po¬ 
ziomu Fermiego i do pojawienia się pasma zabro¬ 
nionych wartości energii, czyli do wytworzenia się 
przerwy w widmie wzbudzeń elektronowych (rys. 
Ib). Przerwa ta oddziela stan podstawowy od stanów 
wzbudzonych. Szerokość przerwy energetycznej nie 
może być większa niż /2r max ; zgodnie z teorią BCS, 
w temperaturze T = 0 jest ona równa: 

2J(0) = 3,524:7* = 4/bwe" 1 ", (1) 

gdzie k oznacza stalą Boltzmanna, g jest stałą ma¬ 
teriałową zależną od wielkości oddziaływania elek¬ 
tron-fonon (V) i od gęstości stanów elektronowych 
N(Ef) w normalnym metalu w pobliżu poziomu Fer¬ 
miego. Z teorii wynika, że stała g = VN{Ef) nie może 
być większa niż 0,5 (na ogół bywa mniejsza). 

Przerwa energetyczna w widmie wzbudzeń elektro¬ 
nowych istnieje również w izolatorach i półprzewod¬ 
nikach, gdzie oddziela pasmo walencyjne od pasma 
przewodnictwa. Tam jednak istnienie przerwy energe¬ 
tycznej jest uwarunkowane budową krystaliczną sub¬ 
stancji, natomiast w nadprzewodnikach przerwa 
energetyczna powstaje w wyniku pojawienia się upo¬ 
rządkowania w układzie elektronów przewodnictwa. 
Niszcząc to uporządkowanie (np. przez ogrzanie nad¬ 
przewodnika powyżej Tk) usuwa się przerwę energe¬ 
tyczna. 

W temperaturze zera bezwzględnego elektrony nie- 
związane w pary zajmują stany poniżej przerwy ener¬ 
getycznej; nad przerwą stany są nieobsadzone. Wszy¬ 
stkie pary Coopera stanowiące kondensat elektro¬ 
nowy są w tym samym stanie energetycznym odpo¬ 
wiadającym poziomowi Fermiego. W T > 0 wzbu¬ 
dzenia cieplne powodują osłabienie korelacji między 
elektronami i rozerwanie się części par. Układ elek¬ 
tronów uzyskuje więc dodatkową energię wzbudzenia. 


Podobnie jak w wypadku helu II, pojawienie się 
wzbudzeń energetycznych w układzie elektronów 
możemy potraktować jako tworzenie się kwazicząstek 
o określonej energii. Ponieważ te kwazicząstki za¬ 
chowują się tak samo jak elektrony przewodnictwa, 
nazywamy je niekiedy elektronami normalnymi. 

Wzbudzenia elektronowe zajmują stany leżące nad 
przerwą energetyczną. a . wpływ tem- 

Do rozerwania pary Coopera i utworzenia dwu 
wzbudzeń elektronowych potrzebna jest energia rów¬ 
na szerokości przerwy, czyli wynosząca 2 A. Energia 
o wartości 2A jest energią wiązania pary. Ze wzrostem 
temperatury coraz więcej par ulega rozerwaniu i jed- 



niku od temperatury j/j k 

nocześnie maleje szerokość przerwy energetycznej 
(rys. 2). Energia wiązania pary jest tym większa, im 
więcej elektronów jest związanych w pary, czyli im 
lepsza jest korelacja między elektronami. W T - 7* 
szerokość przerwy maleje do zera i wszystkie pary 
ulegają rozerwaniu. . kolektywny 

Tworzenie się par Coopera jest zjawiskiem kolek- charakter 
tywnym, w którym bierze udział jednocześnie duża 
liczba cząsteczek, dlatego nie należy sobie wyobrażać 
pary Coopera jako dwóch wyodrębnionych, złączo¬ 
nych ze sobą elektronów. Pojedyncza para nie może 
istnieć, należy w zasadzie mówić o korelacji między 
elektronami o przeciwnych pędach i spinach. Korelacja 
ta prowadzi do obniżenia energii układu o 2A(T) na 
każdą parę korelujących z sobą elektronów. W miarę 
wzrostu temperatury coraz liczniejsze wzbudzenia 
cieplne naruszają tę korelację, maleje więc względna 
liczba par oraz energia wiązania pary. W pobliżu 
T k proces ten przybiera gwałtowny charakter. średnia od- 

Spróbujmy jeszcze oszacować, jaka jest średnia m ję. 

odległość między parami Coopera. Ponieważ w 1 cm 3 t zy parami 
metalu jest około 10 22 atomów, to — przyjmując je- Coopera 
den elektron przewodnictwa na atom — otrzymamy 
tyleż elektronów przewodnictwa. W procesie łączenia 
się w pary mogą brać udział tylko te elektrony, któ¬ 
rych energia leży w wąskim przedziale w pobliżu 
poziomu Fermiego, co stanowi około 10 -4 ogólnej 
liczby elektronów przewodnictwa, czyli około 10 18 
elektronów na 1 cm 3 . Średnia odległość między para¬ 
mi wyniesie więc około 10~ 6 cm. Jest to około sto 
razy mniej, niż wynosi odległość, z jakiej oddziałują 
z sobą elektrony pary (czyli średni rozmiar jednej 
pary). W zasięgu korelacji jednej pary mieści się wie¬ 
le innych korelujących z sobą elektronów; po¬ 
szczególne pary nakładają się na siebie i obraz poje¬ 
dynczej pary zaciera się. 


Brak oporu elektrycznego 

Zastanówmy się teraz, jak w koncepcji par Coopera 
tłumaczy się zjawisko bezoporowego przepływu prądu 
elektrycznego w nadprzewodniku, czyli nadpłynność 
w układzie elektronów. Pojawienie się oporu elek¬ 
trycznego oznacza, że elektrony w metalu ulegają 
rozproszeniu, czyli zmieniają swój pęd w zderzeniach 
z fononami lub defektami struktury krystalicznej. 
W procesie łączenia się w pary Coopera uczestniczą 
elektrony o przeciwnych pędach, np. K i — K, tak 
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krytyczna 

gęstość 

prądu 


prąd stacjo¬ 
narny w nad¬ 
przewodniku 


flukson 


że sumaryczny pęd pary — gdy prąd nie płynie —jest 
równy zeru. Para biorąca udział w przepływie prądu 
ma sumaryczny pęd różny od zera, równy np. 2P, 
czyli elektrony pary mają pędy K+P i — K+P, 
Gdyby jeden z elektronów pary uległ rozproszeniu, 
jego pęd zmieniłby się o wartość Q t wynosiłby więc 
— K+P+Q; taki elektron nie mógłby już korelować 
z elektronem o pędzie K+P , czyli para uległaby 
rozerwaniu. To zaś zwiększyłoby energię układu o 
2 A, co jest dla układu niekorzystne (każdy układ stara 
się mieć jak najniższą energię). Elektrony związane 
w parę ni-e biorą zatem udziału w procesie rozprasza¬ 
nia, czyli ich przepływ odbywa się bez tarcia. 

Gdyby jednak gęstość prądu wzrosła do takiej 
wartości, że energia kinetyczna nośników prądu nad¬ 
przewodzącego przekroczyłaby spadek energii wy¬ 
nikły z korelacji, to korelacja uległaby zniszczeniu, 
gdyż przestałaby być energetycznie korzystna. Gę¬ 
stość prądu, przy której w nadprzewodnikach pojawia 
się opór, nazywa się krytyczną gęstością prądu. Nasu¬ 
wa się tu analogia z krytyczną prędkością przepływu 
helu II. 


Kwantowanie strumienia magnetycznego 

W wyniku braku oporu prąd elektryczny wzbudzony 
w zamkniętym obwodzie nadprzewodzącym może 
krążyć dowolnie długo bez jakichkolwiek zauważal¬ 
nych strat. Taki trwały prąd można wzbudzić np. 
w pierścieniu z nadprzewodnika w następujący spo¬ 
sób: podnosi się temperaturę pierścienia powyżej jego 
punktu przejścia w stan normalny 7* i umieszcza się 
go w polu magnetycznym o liniach sił prostopadłych 
do płaszczyzny pierścienia; następnie obniża się tem¬ 
peraturę do T < T/ci usuwa pole magnetyczne. Zmia¬ 
na zewnętrznego pola magnetycznego wzbudzi w nad¬ 
przewodzącym pierścieniu niezanikający prąd elek¬ 
tryczny, który — zgodnie z regułą Lenza — przeciw¬ 
działać będzie tej zmianie, tj. będzie podtrzymywać 
stały w czasie strumień magnetyczny w obszarze oto¬ 
czonym przez pierścień (prąd wzbudzony w stanie 
normalnym szybko zanika). 

Pierścień nadprzewodzący wraz z krążącym w nim 
prądem jest układem stacjonarnym, czyli trwałym 
w czasie. Według mechaniki kwantowej, stany stacjo¬ 
narne są związane z pewnymi warunkami kwanto¬ 
wymi. Na przykład stacjonarne orbity elektronów 
w modelu atomu Bohra są związane z kwantowaniem 
momentu pędu elektronu. Można więc przypuszczać, 
że w pierścieniu nadprzewodzącym możliwe są tylko 
pewne dyskretne stany prądowe, określone warun¬ 
kiem kwantowania jakiejś wielkości fizycznej zwią¬ 
zanej z prądem krążącym w pierścieniu. Taką wielko¬ 
ścią podlegającą kwantyzacji jest strumień magne¬ 
tyczny zawarty w otworze pierścienia. Po raz pierw¬ 
szy przypuszczenie to wypowiedział F. London 
w 1950 r. Doszedł on do wniosku, że strumień magne¬ 
tyczny uwięziony w otworze nadprzewodzącego pierś¬ 
cienia lub wydrążonego walca jest krotnością kwantu 
strumienia równego & 0 = hjq, gdzie ą jest ładunkiem 
elektrycznym nośnika prądu nadprzewodzonego. 
London sądził, że nośnikami prądu nadprzewodzone¬ 
go są pojedyncze elektrony (q — e), czyli że & 0 = 
= 4,14 *10 -15 Wb. Po opracowaniu teorii BCS wy¬ 
jaśniło się, że kwant strumienia magnetycznego, 
zwany także fiuksonem, jest o połowę mniejszy, gdyż 
nośnikami prądu nadprzewodzonego są pary Coopera 
(q = 2e), a więc 0 O = h}2e = 2,07 • 10" 15 Wb. Jest to 
bardzo mała wielkość w porównaniu z tymi wartościa¬ 
mi strumienia, z którymi najczęściej spotykamy się 
w praktyce. Jeśli założymy, że otwór w nadprzewodni¬ 
ku, w którym został uwięziony jeden flukson, ma po¬ 
wierzchnię przekroju poprzecznego równą 1 mm 2 , to 
gęstość strumienia w tym otworze, tzn. indukcja mag¬ 
netyczna B, będzie równa 10 -9 T, czyli około sto 
tysięcy razy mniejsza niż gęstość strumienia ziem¬ 
skiego pola magnetycznego. Tak słabe pole magne- 

408 


tyczne, jak pole ziemskie, wystarcza, aby po jego usu¬ 
nięciu uwięzić we wspomnianym otworze 10 B kwan¬ 
tów strumienia magnetycznego. Zmiana tego stru¬ 
mienia o jeden lub kilka kwantów byłaby właściwie 
nie wykrywalna. 

Pomimo tak małej wartości, kwant strumienia zo- pomiar 
stał jednak doświadczalnie zmierzony. Nadprzewod- fluksonu 
nikiem, w którym uwięziono strumień magnetyczny, 
była cylindryczna warstewka ołowiu o długości 
0,6 mm naparowana na kawałku kwarcowej kapilary 
o średnicy zewnętrznej 10 pm. Kwarcową kapilarę 
z warstewką ołowiu zawieszono za środkową jej 


Rys. 3. Szkice układu do 
pomiaru kwantu strumie¬ 
nia magnetycznego 



magnetyczny 

„zamrożony" 


część na sprężystej nitce, do której przymocowano 
malutkie lusterko (rys. 3). Po zamrożeniu w nadprze¬ 
wodniku stałego strumienia magnetycznego przyło¬ 
żono dodatkowe słabe pole pod kątem prostym do 
rurki i mierzono moment skręcający wywierany na 
rurkę ze strony dodatkowego pola. Moment ten był 
proporcjonalny do wielkości zamrożonego strumienia. 
Stwierdzono, że ten strumień jest zawsze równy wielo¬ 
krotności kwantu strumienia magnetycznego & 0 = 
= h/2e, co było potwierdzeniem teoretycznych prze¬ 
widywań oraz koncepcji dotyczącej łączenia się elek¬ 
tronów w pary. 

Kwantowanie strumienia magnetycznego jest jedną 
z podstawowych własności nadprzewodników i od¬ 
grywa bardzo ważną rolę w stanie mieszanym (o czym 
w dalszej części hasła) oraz w zjawiskach Josephsona. 
Analogiczne zjawisko kwantowania wielkości makro¬ 
skopowej występuje w nadpłynnym helu, gdzie kwan¬ 
tuje się strumień wektora wirowości. Kwantowanie 
strumienia magnetycznego dowodzi wysokiego stop¬ 
nia uporządkowania w układzie nośników prądu 
nadprzewodzonego. Pary Coopera nie mogą poru¬ 
szać się niezależnie jedna od drugiej; wszystkie po¬ 
ruszają się zgodnie, a funkcje falowe opisujące ruch 
tych par mają jednakową długość i są uzgodnione fa¬ 
zowo czyli koherentne (spójne), przy czym koheren¬ 
cja obejmuje cały obszar nadprzewodnika. 


Entropia i energia swobodna 
nadprzewodnika 

O tym, że po przejściu w stan nadprzewodnictwa zwięk- zależność 
sza się uporządkowanie w układzie elektronów świad- entropii od 
czy również zależność entropii nadprzewodnika temperatury 
od temperatury (rys. 4b). Poniżej punktu przejścia 
w stan nadprzewodzący T/c następuje szybki spadek 
entropii. Wartość entropii S układu elektronów prze¬ 
wodnictwa możemy znaleźć mierząc elektronowe 
ciepło właściwe C nadprzewodnika w funkcji tempera¬ 
tury i całkując otrzymaną zależność: 

T 

f ^p- dT = 5(70-5(0). (2) 

0 

Na mocy trzeciej zasady termodynamiki S( 0) = 0. 







entropia 



0 1 T/T k 




Rys. 4. Zależność funkcji termodynamicz¬ 
nych układu elektronów nadprzewodnika 
od temperatury: a) ciepło właściwe; b) 
entropia, c) energia swobodna. Czarnym 
kolorem oznaczono wykresy funkcji dla 
fazy nadprzewodzącej 


Znając entropię w podobny sposób możemy obli¬ 
czyć energię swobodną: 

T 


f 


S(T)dT = G(T)-G(0). 


( 3 ) 


zmniejszyć się od swej maksymalnej wartości, jaką 
ma w głębi nadprzewodnika, do zera na jego granicy. 

Za parametr uporządkowania możemy przyjąć np. 
względną gęstość par Coopera albo względną szero¬ 
kość przerwy energetycznej, tzn. stosunek jej wartości 
lokalnej do wartości w głębi nadprzewodnika. Para¬ 
metr uporządkowania nie znika nagle, lecz maleje 
stopniowo w warstwie o skończonej grubości. Grubość 
tej warstwy nazywamy odległością korelacji lub odległość 
zasięgiem korelacji i oznaczamy literą |. Jest ona (zasięg) 
w przybliżeniu równa odegłości, z jakiej oddziałują koleracji 
z sobą (korelują) elektrony pary. 

Odległość korelacji jest bardzo ważnym parame¬ 
trem charakteryzującym materiał nadprzewodnika. 

Dla czystych metali odległość korelacji jest rzędu 
10 -4 cm, a więc przekracza około 10 000 razy od¬ 
ległość międzyatomową w krysztale. Elektrony nad¬ 
przewodnika korelują więc swe ruchy na stosunkowo 
dużej odległości. Domieszki lub defekty w nadprze¬ 
wodniku zakłócają korelację międzyelektronową 
i zmniejszają odległość korelacji, dlatego stopy me¬ 
tali mają zwykle mały zasięg korelacji (niekiedy 
sto razy mniejszy niż czyste metale). 


Materiały nadprzewodzące 


energia 

kondensacji 


Energia swobodna w temperaturze T — 0, czyli 
(7(0) nie jest dla nas istotna, gdyż interesuje nas tylko 
zmiana energii swobodnej po przejściu w stan nad¬ 
przewodnictwa, czyli różnica G n (T) — G$(T) (znaczki 
n i s odnoszą się do stanu normalnego i nadprzewo¬ 
dzącego). Jak widać na wykresie rys. 4c, dla T<T k 
stan nadprzewodzący jest stanem stabilnym, gdyż 
ma niższą energię swobodną niż stan normalny. 


Energia kondensacji 

Różnica energii swobodnych w stanie normalnym 
i nadprzewodzącym, czyli G n (T) — G${T) y jest funkcją 
temperatury i nazywa się energią kondensacji. Jest 
to właśnie ta część energii, którą traci układ elektro¬ 
nów tworząc kondensat złożony z par Coopera. 
Jak już wspominaliśmy, w pary łączą się nie wszystkie 
elektrony, lecz tylko te, które w stanie normalnym 
zajmują przedział energetyczny o szerokości rzędu 
r UA{T) w pobliżu poziomu Fermiego. Jeśli gęstość 
jednoelektronowych stanów w tym przedziale w nor¬ 
malnym stanie oznaczymy przez N{Ef\ to liczba 
utworzonych par wyniesie ok. X UN{Ep)A(T) na 
jednostkę objętości nadprzewodnika. Energia wiąza¬ 
nia jednej pary jest równa 2 A{T), zatem energia kon¬ 
densacji w T = 0 wyniesie 

G n (0)-Gs(0) = x I 2 N(Ef)A\ 0) (4) 

na jednostkę objętości (albo na atom lub na mol - 
zależnie od tego, jak określono N(Ef)). Stanowi to 
ok. 10- 8 eV na atom, czyli ok. 10" 4 J/cm 3 (są to tylko 
wartości orientacyjne: w zależności od rodzaju ma¬ 
teriału mogą się one wahać o rząd wielkości lub więcej). 
Jest to bardzo mała energia w porównaniu z energią 
kinetyczną układu elektronów (ok. 10 eV na atom) 
lub z energią oddziaływania kulombowskiego. Mała 
wartość tej energii była główną przyczyną trudności 
przy opracowywaniu teorii nadprzewodnictwa, gdy 
trzeba było rozpatrywać małą różnicę dwu dużych 
wielkości. Należało więc uwzględnić tylko te efekty 
które były istotne dla nadprzewodnictwa, a pozosta¬ 
łe —jednakowe dla obu stanów — odrzucić przy roz¬ 
patrywaniu różnicy ich energii. 


Odległość korelacji 

Na granicy nadprzewodnika z materiałem normalnym 
(lub z próżnią) musi znikać uporządkowanie nad¬ 
przewodzące, a więc parametr uporządkowania musi 


Nadprzewodnictwo wykazuje wiele pierwiastków, 
głównie metalicznych, a także wiele stopów i związków 
chemicznych. Rozmieszczenie nadprzewodników w 
układzie okresowym pierwiastków przedstawiono w 
tabeli na następnej stronie. Liczby w tabeli w rubry¬ 
kach pierwiastki oznaczają temperaturę przejścia 
pierwiastków w stan nadprzewodzący; litera p ozna¬ 
cza nadprzewodnictwo pod ciśnieniem, litera /— nad¬ 
przewodnictwo cienkiej warstwy osadzonej z par da¬ 
nego pierwiastka na podłoże chłodzone ciekłym he¬ 
lem, litery a, p, y — fazy krystalograficzne. Niektóre 
pierwiastki nadprzewodzą tylko pod zwiększonym 
ciśnieniem (przechodzą wtedy w inną modyfikację 
krystalograficzną) lub w postaci cienkich warstw o nie- 
krystalicznej strukturze, uzyskanych przez naparowa- 
nie wyjściowego materiału na podłoże oziębione cie¬ 
kłym helem. Nadprzewodnictwo takich warstw świad¬ 
czy o tym, że struktura krystaliczna nie jest koniecz¬ 
nym warunkiem pojawienia się nadprzewodnictwa. 
Nie są nadprzewodnikami metale ferromagnetyczne 
i metale pierwszej grupy układu okresowego (oprócz 
cezu pod ciśnieniem). Wśród nadprzewodników spo¬ 
tyka się pierwiastki krystalizujące w różnych ukła¬ 
dach, przy czym różne modyfikacje krystalograficzne 
tego samego pierwiastka mają na ogół różne tempera¬ 
tury przejścia wstań nadprzewodnictwa. Dowodzi to, 
że nadprzewodnictwo nie jest cechą określonych ato¬ 
mów, lecz zależy od struktury sieci krystalicznej. 

W obecnym stanie wiedzy nie możemy przewi¬ 
dzieć, czy dany pierwiastek może być nadprzewod¬ 
nikiem, czy nie. Możemy tylko wykluczyć nadprze¬ 
wodnictwo ferromagnetyków, gdyż silne wewnętrzne 
pole magnetyczne w tych substancjach niszczy upo¬ 
rządkowanie nadprzewodzące na rzecz uporządko¬ 
wania magnetycznego. Nie ma jednak zasadniczych 
przeszkód dla pojawienia się nadprzewodnictwa np. 
w metalach pierwszej grupy układu okresowego. Być 
może, temperatury ich przejścia w stan nadprzewod¬ 
nictwa są zbyt niskie, niższe niż te, w których były 
one badane. 

Obecnie znamy 38 pierwiastków i około tysiąca 
stopów i związków, które stają się nadprzewodnika¬ 
mi. Lista materiałów nadprzewodzących nie jest 
jeszcze zakończona, gdyż nadal odkrywane są coraz 
to nowe nadprzewodniki. Wśród związków nadprze¬ 
wodzących wiele jest takich, w których żaden ze 
składników z osobna nie jest nadprzewodnikiem (np. 
CuS). Wśród nadprzewodników spotykamy nawet 
substancje organiczne, jak np. anilina czy pirydyna, 
w postaci monomolekulamych warstw rozdzielonych 
chalkogenidkami niektórych metali. 


pierwiastki 


stopy 
i związki 
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Rozmieszczenie nadprzewodników w układzie okresowym pierwiastków 
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Nadprzewodnik w polu 
magnetycznym 

Zjawisko Meissnera 

Przez długi czas po odkryciu nadprzewodnictwa są¬ 
dzono, że nadprzewodnik to jedynie doskonały prze¬ 
wodnik, tzn. przewodnik pozbawiony oporu elek¬ 
trycznego. Dopiero w 1933 r., a więc 22 lata po od¬ 
kryciu znikania oporu, W. Meissner i R. Ochsenfeld 
za pomocą małej ceweczki pomiarowej wyznaczyli 
rozkład linii sił pola magnetycznego dokoła kuli nad¬ 
przewodzącej i odkryli drugą podstawową własność 
nadprzewodnika: linie sił pola zewnętrznego zawsze 
omijają nadprzewodzącą bryłę. Niezależnie od tego, 
czy pole magnetyczne zostało nałożone przed przej¬ 
ściem w stan nadprzewodnictwa, czy po przejściu, 
indukcja magnetyczna w obszarze nadprzewodnika 
jest zawsze równa zeru. Nadprzewodnik jest więc nie 
tylko doskonałym przewodnikiem, ale także dosko¬ 
nałym diamagnetykiem. 

Bryła substancji, która byłaby tylko doskonałym 
przewodnikiem, po nałożeniu pola magnetycznego 
i następnym oziębieniu poniżej temperatury przejścia 
Tk w stan bezoporowy zachowałaby to pole w swej 
objętości nawet po usunięciu pola zewnętrznego, po¬ 
dobnie jak pierścień nadprzewodzący lub wydrążony 
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walec zachowuje pole magnetyczne w Swym otworze. 
Zgodnie z regułą Lentza, każda zmiana pola zew¬ 
nętrznego po przejściu bryły w stan bezoporowy 
wzbudzałaby na jej powierzchni trwały prąd elek¬ 
tryczny, podtrzymujący wewnątrz bryły stałą w czasie 
wartość indukcji magnetycznej. Indukcja magnetycz¬ 
na wewnątrz doskonałego przewodnika byłaby więc 
stale równa tej jej wartości, jaka istniała w chwili 
przejścia w stan bezoporowy. 

Nadprzewodnik tym różni się od przewodnika do¬ 
skonałego, że w chwili przejścia w stan bezoporowy 
wypycha ze swej objętości istniejące tam poprzednio 
pole magnetyczne, tak że B = 0 niezależnie od po¬ 
czątkowej jej wartości. Takie zachowanie się nad¬ 
przewodnika nie daje się wyjaśnić na gruncie elek¬ 
trodynamiki klasycznej. Teorię uwzględniającą za¬ 
chowanie się nadprzewodników w polu magnetycz¬ 
nym, czyli zjawisko Meissnera, opracowali bracia 
F. i H. Londonowie w 1935 roku. 

Wypychanie strumienia magnetycznego z wnętrza 
nadprzewodzącej bryły odbywa się w ten sposób, że 
w chwili przejścia w stan nadprzewodnictwa na po¬ 
wierzchni nadprzewodnika wzbudza się trwały prąd 
elektryczny, który wytwarza własne pole magne¬ 
tyczne kompensujące do zera pole magnetyczne ist¬ 
niejące poprzednio wewnątrz bryły. Ten powierzch¬ 
niowy prąd elektryczny nazywa się prądem Meissnera 
lub prądem ekranującym, gdyż jak gdyby ekranuje 


wypychanie 
pola magne¬ 
tycznego 
przez nad¬ 
przewodnik 





























































on wnętrze nadprzewodnika od pola zewnętrznego. 
Na zewnątrz nadprzewodzącej bryły pole magne¬ 
tyczne pochodzące od prądu Meissnera nakłada się 



Rys. 5. Nadprzewodnik w polu magnetycznym: A linie sił pola 
zewnętrznego przed umieszczeniem w nim nadprzewodnika, 
B linie sił pola magnetycznego wytworzonego przez prąd Meis¬ 
snera po umieszczeniu nadprzewodnika w polu zewnętrznym, 
C limę sił wypadkowego pola magnetycznego powstałego przez 
nałożenie pola prądów Meissnera na pole zewnętrzne 


stan 
nadprzewod¬ 
nictwa 


na pole pierwotne i tworzy wspólne pole wypadkowe; 
linie tego pola wypadkowego opływają nadprzewo¬ 
dzącą bryłę. 

Rys. 5 przedstawia elipsoidalną bryłę nadprze¬ 
wodnika umieszczoną w jednorodnym polu magne¬ 
tycznym. Widać, jak nadprzewodnik zmienia to pole 
zewnętrzne i powoduje, że największa gęstość linii sił 
pola (czyli najsilniejsze pole) występuje na „równiku” 
elipsoidy (rys. 5c). Im większa długość elipsoidy 
w kierunku pola w porównaniu z jej średnicą równi¬ 
kową, tym mniejszy stopień zniekształcenia pola 
zewnętrznego. Gdy elipsoida jest nieskończenie długa 
lub gdy mamy nieskończenie długi walec o osi równo¬ 
ległej do linii sił pola, zniekształcenie pola zewnętrz¬ 
nego w ogóle nie nastąpi. Nieskończenie długi walec 
nadprzewodzący, równoległy do linii sił pola, wraz 
z prądem Meissnera na jego powierzchni możemy 
potraktować jak nieskończenie długi, gęsto nawinięty 
solenoid. Pole magnetyczne takiego solenoidu, wy¬ 
tworzone przez prąd płynący w jego uzwojeniach, jest 
jednorodne wewnątrz solenoidu i równe zeru na 
zewnątrz. Nieskończenie długi solenoid nie zaburza 
więc postronnego pola zewnętrznego. W praktyce za 
nieskończenie długi walec możemy uważać taki wa¬ 
lec, którego długość jest bardzo wielka w porównaniu 
z jego średnicą. 

Zjawisko Meissnera ma bardzo istotne znaczenie 
z punktu widzenia termodynamiki. Dzięki temu zja¬ 
wisku przejście w stan nadprzewodnictwa jest przej¬ 
ściem odwracalnym, może więc być potraktowane 
jako przemiana fazowa. Stan nadprzewodnictwa ce¬ 
chuje zerowa wartość indukcji magnetycznej nieza¬ 
leżnie od tego, w jaki sposób stan ten został osiągnię¬ 
ty: czy najpierw oziębiono substancję do temperatury 
niższej od temperatury przemiany w stan nadprze¬ 
wodnictwa, a później przyłożono pole magnetyczne, 
czy też najpierw umieszczono substancję w polu 
magnetycznym, a potem ją oziębiono. Stan nadprze¬ 
wodnictwa jest więc odrębną termodynamiczną fazą 
substancji. Doskonałego przewodnika nie moglibyśmy 
w ten sposób traktować, gdyż jego stan po utracie 
oporu zależałby od tego, czy był oziębiany w polu 
magnetycznym, czy nie. 


Głębokość wnikania 

Prąd Meissnera, kompensujący wewnątrz nadprze¬ 
wodnika zewnętrzne pole magnetyczne, płynie po 
powierzchni nadprzewodnika w warstwie o pewnej 
grubości. W tej powierzchniowej warstwie indukcja 
magnetyczna jest różna od zera. Możemy więc uwa¬ 
żać, że pole zewnętrzne wnika w powierzchniową war¬ 


stwę nadprzewodnika na pewną głębokość, nazywa¬ 
ną po prostu głębokością wnikania. 

W warstwie powierzchniowej indukcja magnetyczna efoktyv^ia 
zmienia się od wartości, jaka istnieje na zewnątrz, do 
zera w głębi nadprzewodnika. Jeśli, jak to wynika wnikania 
z elektrodynamiki Londonów, indukcja maleje wy¬ 
kładniczo ze wzrostem odległości x od powierzchni, 
czyli B(x) = B(0)e~ 6lx y to w odległości x = <5 zmaleje 
ona e « 2,718... razy w stosunku do tej wartości, jaką 
miała na powierzchni próbki. Odległość <5 można 
uważać za efektywną głębokość wnikania, tj. taką 
odległość, do której indukcja nie zmienia się wcale, 
a po jej przekroczeniu (czyli dla x > $) indukcja jest 
już zerem. Krzywą wykładniczą zastępujemy w ten 
sposób linią łamaną (rys. 6). 



odległość x 

Rys. 6. Zależność lokalnej indukcji magnetycznej B\ou. wewnątrz 
nadprzewodnika od odległości x od powierzchni nadprzewodnika 



temperatura T 

Rys. 7. Zależność głębokości wnikania pola od temperatury 


Głębokość wnikania <5 zależy od temperatury; gdy zależność S 
temperatura zbliża się do 7*, głębokość wnikania o Sempe- 
rośnie do nieskończoności (rys. 7). Oznacza to, że ratury 
w miarę zbliżania się do Th pole magnetyczne stop¬ 
niowo wnika coraz głębiej w nadprzewodnik i w chwi¬ 
li przejścia w stan normalny cała objętość nadprze¬ 
wodnika jest już zajęta przez pole. Głębokość wnika¬ 
nia w temperaturze zera bezwzględnego <5 0 jest ważną 
stałą charakteryzującą dany nadprzewodnik. Po¬ 
dobnie jak zasięg korelacji £, głębokość wnikania <3 0 
zależy od czystości materiału, z tym, że <5 0 zwiększa 
się z koncentracją domieszek. Dla czystych metali 
<5 0 ^ 10" 6 cm; dla niektórych stopów może być na¬ 
wet o dwa rzędy większa. 


Odpychanie nadprzewodnika przez pole 
magnetyczne 

Doskonały diamagnetyzm jest przyczyną wypychania 
nadprzewodnika z obszaru najsilniejszego pola. Od¬ 
wrotnie bywa w przypadku ferromagnetyków: są one 
wciągane w obszar najsilniejszego pola (np. rdzeń że¬ 
lazny jest wciągany do cewki, w której płynie prąd 
elektryczny). Powszechnie znane jest doświadczenie 
z kulą nadprzewodzącą unoszącą się nad pierście¬ 
niami, w których krążą niezanikające prądy elektrycz- 
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ne (wzbudzone w przeciwnych kierunkach); prądy te 
wytwarzają pole magnetyczne odpychające nadprze¬ 
wodzącą kulę. Rysunek 8 ilustruje omawiane zjawis¬ 


ko, rys. 8b pokazuje konfigurację pola magnetycznego 
wytworzonego przez oba pierścienie przed umieszcze¬ 
niem nad nimi kuli, rys. 8c — po umieszczeniu kuli 



Rys. 8. Unoszenie kuli nadprzewodzącej przez pole magnetyczne: a) widok ogólny, b) Unie sil pola magnetycznego wytworzonego przez 
mezamkające prądy płynące w pierścieniach, c) linie sił po umieszczenia kuli nadprzewodzącej nad pierścieniami 



a) 


Rys. 9. Magnes 
unoszący się nad 
czaszą nadprze¬ 
wodzącą: a) zdję¬ 
cie, b) Unie sił 
pola magnesu 



nad pierścieniami. Pole magnetyczne utrzymuje kulę 
równoważąc siłę ciężkości. 

Innym wariantem takiego doświadczenia jest tzw. 
pływający magnes (rys. 9). Magnes sztabkowy opusz¬ 
czony jest nad czaszą nadprzewodzącą. Linie sil pola 
magnetycznego pochodzące od tego magnesu unoszą 
go nad czaszą. Zjawisko to tłumaczymy odpychaniem 
nadprzewodzącej czaszy przez linie sil pola magne¬ 
tycznego. Jeśli czasza jest sztywno umocowana 
w kriostacie, to siła odpychania unosi magnes. 


Krytyczne pole magnetyczne 

Jeśli natężenie pola magnetycznego, w którym umiesz¬ 
czono nadprzewodnik, przekroczy pewną wartość 


A/cm 



Rys. 10. Zależność krytycznych natężeń pól magnetycznych od 
temperatury dla niektórych pierwiastków nadprzewodzących 


pływający 

magnes 
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krytyczną H * — nadprzewodnictwo zniknie, aby 
powrócić znowu, gdy natężenie pola zmniejszy się do 
wartości H < Htc. Krytyczna wartość natężenia pola 
magnetycznego dla danego nadprzewodnika zależy 
od temperatury (rys. 10). Zależność tę można w przy¬ 
bliżeniu wyrazić następującym wzorem: 

H k (T) = jawo® -(T/nn (5) 

wykres stanu Wykres H k (T) jest wykresem stanu dla nadprzewod- 

nadprzewod- nika. Krzywa H k (T) rozdziela ćwierćpłaszczyznę 
nika T-H na dwa obszary fazowe: obszar fazy nadprzewo¬ 
dzącej (pod krzywą) i obszar fazy normalnej (reszta 
ćwierćpłaszczyzny). Krzywa H k (T) jest krzywą równo¬ 
wagi fazowej, tzn. w stanie odpowiadającym punkto¬ 
wi (r 0 , H 0 ) leżącemu na krzywej H k (T) mogą istnieć 
obie fazy obok siebie w równowadze. Wynika to 
stąd, że dla T < Tk obu fazom odpowiadają różne 
wartości entropii (rys. 4b), a więc przejście w stan 
nadprzewodnictwa w polu magnetycznym jest prze¬ 
mianą fazową I rodzaju. Utajone ciepło przemiany 
wynosi Q = T{S n -S $ ). Jeśli H= 0, to przemiana 
zachodzi w T= Tk i ciepło przemiany jest wtedy 
równe zeru, gdyż S n (T k ) = S e (Tk ). W nieobecności 
pola magnetycznego przejście w stan nadprzewod¬ 
nictwa jest więc przemianą fazową II rodzaju. Świad¬ 
czy o tym także kształt krzywej zależności ciepła 
właściwego od temperatury (rys. 5a) zbliżony do 
kształtu litery A. 


Namagnesowanie nadprzewodnika 

Jak widać na rys. 5b, nadprzewodnik w polu magne¬ 
tycznym magnesuje się, czyli przybiera określony 
moment magnetyczny. Jako diamagnetyk, nadprze¬ 
wodnik magnesuje się w kierunku przeciwnym do 
przyłożonego pola magnetycznego, a więc jego mo¬ 
ment magnetyczny jest ujemny. Oczywiście, moment 
magnetyczny nadprzewodnika pochodzi od niezani- 
kających prądów Meissnera, krążących po jego po¬ 
wierzchni. Jak wiadomo, płaska pętla prądu elek¬ 
trycznego ma dipolowy moment magnetyczny równy 
M = IA t gdzie I jest natężeniem prądu w pętli, A — 
polem płaskiej powierzchni otoczonej tą pętlą. Na 
moment magnetyczny nadprzewodnika składają się 
momenty dipolowe wszystkich płaskich pętli prądo¬ 
wych, na jakie można by podzielić powierzchniowy 
prąd Meissnera. 

W ustalonych warunkach moment magnetyczny 
nadprzewodzącej bryły jest proporcjonalny do jej 
objętości, można więc posługiwać się pojęciem nama¬ 
gnesowania, czyli momentu magnetycznego przypa- 
zaleiność dającego na jednostkę objętości. Początkowo na- 
namagneso- magnesowanie wzrasta liniowo ze wzrostem natężenia 
wania pola zewnętrznego, gdyż zwiększa się gęstość po- 
od pola wierzchniowa prądów Meissnera, ekranujących wnę¬ 
trze bryły od tego pola. Gdy natężenie pola przekroczy 
krytyczną wartość Hic, nadprzewodnictwo znika i na¬ 
magnesowanie spada do zera. Taka zależność nama¬ 
gnesowania od natężenia pola magnetycznego jest 
typowa dla nadprzewodników i wyróżnia je spośród 
innych materiałów magnetycznych. W przeciwień¬ 
stwie do namagnesowania, brak oporu elektrycznego 
nie zawsze stanowi wiarygodne kryterium nadprze¬ 
wodnictwa, gdyż niekiedy bywa wynikiem obecności 
domieszek materiału nadprzewodzącego w nienad- 
przewodzącej próbce. Domieszki te mogą utworzyć 
nadprzewodzące ścieżki, zwierające „na krótko” 
resztę materiału. 

Zmiana energii swobodnej w polu 
magnetycznym 

Magnesowanie się nadprzewodnika w polu magne¬ 
tycznym (czyli wzbudzanie prądów Meissnera) 
zwiększa jego energię swobodną o 1 l 2 PoH 2 ^ i ec ^" 
nostkę objętości. Ponieważ zmianę energii dG y spo¬ 


wodowaną magnesowaniem, obliczamy z zależności: 

dG = -MdH, przeto G(/r 0 )-C(0) = - f MdH. 

0 

Dla nadprzewodnika w stanie Meissnera n = —I, 
czyli M — —HV; stąd: 

G S (H 0 ) = GM^UfioHl V, (6) 

gdzie V jest objętością bryły nadprzewodzącej. Jeśli 
pominiemy słaby paramagnetyzm (lub diamagne¬ 
tyzm) normalnego metalu (a ferromagnetyki nie są 
nadprzewodnikami), to energia swobodna w stanie 
normalnym nie będzie zależeć od natężenia pola ma¬ 
gnetycznego, czyli Gn(.H k ) = G n ( 0). 

Gdy natężenie pola zewnętrznego osiągnie wartość zależność 
Hk , energia swobodna w stanie nadprzewodzącym energii 
wzrośnie na tyle, że zrówna się z energią swobodną swobodnej 

od pola 



Rys. 11. Zależność energii swo- q u 

bodnej nadprzewodnika od na¬ 
tężenia pola magnetycznego w natężenie pola 

stałej temperaturze magnetycznego H 

w stanie normalnym (rys. 11). Przy dalszym zwiększa¬ 
niu natężenia pola utrzymywanie stanu nadprze- krytyczne 
wodnictwa byłoby już niekorzystne, gdyż G S (H) > Ratę żeni& 

> G n {H) dla H > Hk , dlatego przy H = H k nad- poła magno . 
przewodnik przechodzi w stan normalny. Krytyczne tycznego 
natężenie pola magnetycznego Hk jest to takie natę¬ 
żenie, przy którym gęstości energii swobodnych w obu 
fazach, normalnej i nadprzewodzącej, są sobie równe. 

To stwierdzenie można uznać za definicję krytycznego 
natężenia pola magnetycznego Hk. Mamy więc: 

Gg(Hk) = Gs(0)~\~ 1 l2t i oHk V — Gn{Hk), 
a ponieważ G n (Hic) = G»(0), to 

Gn{ 0) - G*(0) = V« Po Hl V. (7) 

Wynika z tego, że w nieobecności pola magnetycz¬ 
nego zmiana (spadek) energii spowodowanej po 
przejściu w stan nadprzewodnictwa w wyniku obni¬ 
żenia temperatury (czyli energia kondensacji) wynosi 
ł / 2 PoHl(T) na jednostkę objętości. Porównując 
wyrażenia (4) i (7) otrzymujemy zależność: 

HdJ) = J(T) (8) 


Stan pośredni 

Jeśli próbka nadprzewodnika nie jest walcem równo¬ 
ległym do linii sił zewnętrznego pola magnetycznego, 
to próbka taka zmienia w swoim otoczeniu rozkład 
linii sił, a na jej powierzchni natężenie pola nie wszę¬ 
dzie ma jednakową wartość. Gdy nadprzewodnik ma 
kształt elipsoidy obrotowej skierowanej osią symetrii 
wzdłuż linii sił pola zewnętrznego (jak na rys. 6), natę¬ 
żenie pola ma większą wartość na równiku elipsoidy, 
a mniejszą na biegunach. Jeśli więc natężenie pola 
zwiększa się z czasem, to najwcześniej krytyczną war¬ 
tość osiągnie ono na równiku elipsoidy i pas równi¬ 
kowy najpierw powinien przejść w stan normalny. 
Nie jest to jednak możliwe, gdyż wtedy pole wniknę¬ 
łoby w obszar normalny i natężenie pola zmalałoby 








obszary tam do wartości H < Hk\ obszar pasa równikowego 
normalne musiałby więc odzyskać nadprzewodnictwo, a to 
i nadprze- przywróciłoby wyjściową sytuację. Jedynym możli- 
wodzące wym rozwiązaniem jest podział całej objętości próbki 
na warstwowe obszary fazy normalnej rozdzielone 


linie sil pola magnetycznego 



obszarami fazy nadprzewodzącej (rys. 12). Pole ma¬ 
gnetyczne przenika próbkę poprzez obszary normalne. 
Kształt obszarów normalnych wychodzących na po¬ 
wierzchnię próbki możemy obserwować wizualnie 
po posypaniu próbki proszkiem ferromagnetycznym; 
proszek osiądzie na obszarach normalnych, gdyż tam 
H # 0 (ii. 94, tabl. 24). 

natężenie Stan, w Jakim znajduje się próbka po podziale na 
krytyczne współistniejące obok siebie obszary fazy normalnej 
dla stanu i nadprzewodzącej, nazywamy stanem pośrednim, 
pośredniego Natężenie zewnętrznego pola magnetycznego ff a , 
przy którym próbka przechodzi w stan pośredni, za¬ 
leży od jej kształtu i orientacji względem linii sił, czyli 
od współczynnika rozmagnesowania D: 


H a = (9) 

Dla kuli D = 1 / z i H a = 2 l 3 Hk, dla walca prosto¬ 
padłego do pola H a = x UHic\ walec równoległy do 
pola nie zmienia rozkładu linii sił i przechodzi bez¬ 
pośrednio w stan normalny, gdy H a = H *. 

Makroskopowe rozmiary obszarów poszczegól¬ 
nych faz w stanie pośrednim świadczą o istnieniu do¬ 
datniej energii związanej z powierzchnią rozgrani¬ 
czającą te obszary; w przeciwnym razie korzystniejszy 
byłby bardzo drobny podział, gdyż wtedy przy po¬ 
wierzchni próbki byłoby mniejsze skrzywienie linii 
sił pola przenikającego przez obszary normalne. W 
miarę wzrostu natężenia pola od wartości Hk( 1 D) 
do Hk zwiększa się w próbce udział fazy normalnej 
kosztem fazy nadprzewodzącej. Gdy natężenie pola 
osiągnie wartość Hk> obszary nadprzewodzące znikają 
zupełnie. 

Wewnątrz próbki w stanie pośrednim indukcja 
magnetyczna w obszarach fazy nadprzewodzącej jest 
równa zeru, a w obszarach fazy normalnej B = /* 0 Hk. 
Indukcja średnia dla całej próbki, tj. uśredniona po 
całej objętości próbki, wynosi Bśr = fi 0 Hk'X ny gdzie 
x n jest częścią objętości próbki zajętą przez fazę nor¬ 
malną. Bśr jest liniową funkcją H , czyli udział fazy 
normalnej jest proporcjonalny do H. 
moment dia- Moment diamagnetyczny próbki w stanie pośred- 
magnetyczny nim jest momentem magnetycznym nadprzewodzą- 
w stanie cych obszarów, do których pole nie wnika (tylko one 
pośrednim są ekranowane od pola). Rys. 13 przedstawia zależ¬ 
ności indukcji średniej i momentu magnetycznego od 
natężenia pola zewnętrznego dla trzech próbek nad¬ 
przewodnika o różnym współczynniku rozmagneso¬ 
wania. Zauważmy, że pole powierzchni zawartej mię¬ 
dzy krzywą momentu magnetycznego a osią H jest 
jednakowe dla wszystkich próbek niezależnie od ich 
współczynnika rozmagnesowania, jeśli tylko mają one 
jednakową objętość i jednakową wartość Hk. Pole 
to przedstawia pracę wykonaną przy magnesowaniu 
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próbki, czyli wzrost energii próbki po nałożeniu pola 
magnetycznego H > Hk. Wiemy już, że ten przyrost 
energii jest równy x / 2 f* 0 Hl na jednostkę objętości 
próbki. 



Rys. 13. Zależność średniej indukcji magnetycznej i namagneso¬ 
wania od natężenia pola magnetycznego dla próbek nadprzewod¬ 
nika o różnym współczynniku kształtu D; a — kula, D = l / z ; 
b — walec poprzeczny do linii sił pola, D — V»; c — walec rów¬ 
noległy do linii sił pola, D — 0 

Energia powierzchniowa i dwa typy 
nadprzewodnictwa 


Z granicą rozdziału faz w stanie pośrednim związana 
jest pewna energia powierzchniowa. O jej wartości 



Rys. 14. Szkic ilustrujący powstawanie energii powierzchniowej 
między fazą normalną i nadprzewodzącą 




















































decyduje stosunek wzajemny obu charakterystycz¬ 
nych wielkości w nadprzewodniku, tj. głębokości 
wnikania S pola magnetycznego i zasięgu korelacji £. 
Rozpatrzmy, jakie jest pochodzenie tej energii. 

Linia pionowa na rys. 14 oznacza granicę rozdzie¬ 
lającą obszar fazy nadprzewodzącej od obszaru fazy 
normalnej. Parametr uporządkowania nadprzewo¬ 
dzącego nie zmienia się nagle na tej granicy, lecz 
maleje stopniowo w miarę zbliżania się do obszaru 
fazy normalnej, przy czym odległość, na której na¬ 
stępuje zmiana parametru uporządkowania od wartości 
maksymalnej do zera jest w przybliżeniu równa zasię¬ 
gowi korelacji £. 

W głębi fazy nadprzewodzącej uporządkowanie 
zmniejsza energię swobodną nadprzewodnika o ener¬ 
gię kondensacji, czyli o wartość równą na 

jednostkę objętości. Zmiana gęstości energii (czyli 
energii na jednostkę objętości) w warstwie przygra¬ 
nicznej, wynikająca z uporządkowania elektronów 
w układzie, jest przedstawiona na rys. 14b. Ponieważ 
stopień uporządkowania w warstwie przygranicznej 
jest mniejszy niż w głębi obszaru fazy nadprzewodzą¬ 
cej— gęstość energii swobodnej nie zmniejsza się 
w tej warstwie o a więc warstwa ta wnosi 

efektywny wkład do energii fazy nadprzewodzącej, 
wynoszący na jednostkę objętości warstwy, 

czyli Yafl 0 H^ na jednostkę powierzchni granicznej 
(skuteczna grubość warstwy wynosi £). 

Istnieje jeszcze jeden czynnik wpływający na gęstość 
energii swobodnej w warstwie przygranicznej: jest 
to pole magnetyczne wnikające w obszar fazy nad¬ 
przewodzącej na głębokość skuteczną 6. Pole mag¬ 
netyczne o natężeniu H zwiększa gęstość energii 
swobodnej fazy nadprzewodzącej o Y^o^Y ale 
w warstwie przygranicznej o grubości 6 pole nie po¬ 
woduje wzrostu gęstości energii, gdyż wnika w tę 
warstwę. Jest to równoważne zmniejszeniu energii 
swobodnej obszaru fazy nadprzewodzącej o wartość 
na jednostkę powierzchni granicy rozdziału 
faz (natężenie pola przyjmujemy tu za równe H*, 
gdyż taką wartość ma ona na granicy międzyfazowej 
w stanie pośrednim; jest to warunek stabilności gra¬ 
nicy). 

W głębi fazy nadprzewodzącej oba wkłady w energię 
swobodną (wkład od pola magnetycznego i wkład 
od energii kondensacji) znoszą się wzajemnie i gęstość 
energii fazy nadprzewodzącej jest w stanie pośrednim 
równa gęstości energii fazy normalnej, tak jak w polu 
o natężeniu krytycznym. Na granicy faz przeważa 
zwykle jeden z wkładów, gdyż na ogół długości £ i <5 
nie muszą być sobie równe (rys. 14c). Dodatkowa 
energia związana z granicą rozdziału faz jest więc 
równa na jednostkę powierzchni gra¬ 

nicznej. Jeśli £ > <$, to energia powierzchniowa jest 
nadprzewod- dodatnia i takie nadprzewodniki nazywane są nad- 
niki 1 typu przewodnikami I typu; jeśli £ < <$, to energia po¬ 
wierzchniowa jest ujemna i nadprzewodniki takie 
nadprzewod- należą do drugiej grupy, czyli do nadprzewodników 
niki 11 typu u typiL 

Nadprzewodnikami I typu są prawie wszystkie 
pierwiastki nadprzewodzące (z wyjątkiem Nb, V i Tc), 
oraz niektóre stopy sporządzone na bazie takich me¬ 
tali, jak In, Al, Hg, Sn, przez rozpuszczenie w nich 
niewielkiej domieszki drugiego składnika. Większość 
stopów nadprzewodzących, a w szczególności stopy 
na bazie metali przejściowych, oraz pierwiastki Nb, 
V i Tc należą do nadprzewodników II typu. Nad¬ 
przewodniki obu typów różnią się między sobą pod 
względem termodynamicznym i — w związku z tym — 
inaczej zachowują się w polu magnetycznym. Opisy¬ 
wane tutaj dotychczas własności magnetyczne doty¬ 
czyły nadprzewodników I typu. Nadprzewodniki I 
typu zostały najwcześniej zbadane, gdyż stosunkowo 
łatwo jest otrzymać jednorodne próbki czystych me¬ 
tali. Badania tych nadprzewodników dostarczyły 
informacji, na podstawie których Bardeen, Cooper 
i Schrieffer opracowali w 1957 r. mikroskopową teorię 
nadprzewodnictwa. 


Nadprzewodniki II typu 


Teorię nadprzewodników II typu opracował A. Abri- 
kosow również w 1957 r., ale potwierdzające ją ba¬ 
dania doświadczalne udało się przeprowadzić do¬ 
piero kilka lat później, gdy otrzymano wystarczająco 
jednorodne próbki nadprzewodzących stopów (teoria 
dotyczyła tylko jednorodnych nadprzewodników). 
Zainteresowanie nadprzewodnikami II typu wzrosło 
wyraźnie po 1961 r., kiedy odkryto, że niejednorodne 
próbki tych nadprzewodników mogą przenosić prąd 
elektryczny o dużej gęstości (rzędu 10 5 A/cm 2 ) nawet 
w silnych polach magnetycznych (rzędu kilku tesli). 

Teoria Abrikosowa opierała się na wcześniejszej 
fenomenologicznej teorii Ginzburga i Landaua, tj. 
teorii nie wnikającej w przyczyny nadprzewodnictwa, 
lecz opisującej zjawisko od strony makroskopowej. 

Później Gorkow wykazał, że teoria ta wynika rów¬ 
nież z teorii mikroskopowej. Od pierwszych liter 
nazwisk jej twórców teorię tę nazywamy obecnie 
teorią GLAG, podobnie jak teoria mikroskopowa 
nazywa się teorią BCS. Teoria GLAG podaje ścisłe 
kryterium podziału nadprzewodników na dwa typy: 
jest nim wartość parametru wprowadzonego w tej 
teorii, zwanego parametrem *; jeśli * < lft/2, to 
nadprzewodnik należy do pierwszego typu, jeśli 
*> l/|/2—do drugiego typu. Parametr * jest 
w przybliżeniu równy stosunkowi <5/£. 

Oprócz nadprzewodników doskonałych obu 
wspomnianych typów istnieją nadprzewodniki nie- naejeri- 

doskonałe, czyli niejednorodne lub zdeformowane, dorodno 
Podział nadprzewodników na doskonałe i niedosko- za®formo- 
nałe nie jest zbyt ścisły, gdyż w praktyce prawie zaw- wans 
sze spotykamy się z pewną niedoskonałością nad¬ 
przewodnika. Za miarę doskonałości próbki nad¬ 
przewodnika przyjęto uważać stopień odwracalności 
jego przemiany fazowej w polu magnetycznym. Ze 
względu na zdolność przenoszenia prądów o dużej 
gęstości niektóre niedoskonałe nadprzewodniki II 
typu odgrywają bardzo ważną rolę w zastosowaniach 
praktycznych. Niektórzy nazywają takie nadprze¬ 
wodniki nadprzewodnikami III typu, ale nazwa ta 
nie wydaje się uzasadniona, gdyż nie chodzi tu o jakiś 
nowy typ nadprzewodnictwa. Bardziej stosowną 
byłaby nazwa „twarde nadprzewodniki”, nawiązu¬ 
jąca do ich własności mechanicznych. 


Zachowanie się nadprzewodników KI typu 
w polu magnetycznym 


Prześledźmy, jak zmienia się moment magnetyczny 
M nadprzewodnika II typu ze zmianą natężenia 
zewnętrznego pola magnetycznego H (rys. 15). Dla 
uproszczenia załóżmy, że próbka ma współczynnik 
rozmagnesowania równy zeru i nie zawiera dziur. 

W słabym polu magnetycznym próbka nadprze¬ 
wodnika II typu zachowuje się tak samo, jak próbka 
nadprzewodnika I typu, tzn. wypycha całkowicie ze 
swego wnętrza strumień magnetyczny, czyli wykazuje 
pełne zjawisko Meissnera. Gdy jednak natężenie pola 
zewnętrznego osiągnie wartość Hku czyli tzw. pierw¬ 
szą wartość krytyczną, pole magnetyczne wnika 
w próbkę w postaci pojedynczych włókien strumienia. 
Włókien strumienia magnetycznego nie należy mylić 
z liniami sił pola. Linie sił pola — to tylko formalne 
krzywe, wzdłuż których ustawiają w polu swój 
moment magnetyczny małe próbne dipole. Gęstość 
linii sił pola jest umowna, istotne jest tylko, aby była 
proporcjonalna do gęstości strumienia. Włókna stru¬ 
mienia magnetycznego są natomiast rzeczywistymi 
nitkokształtnymi obszarami nadprzewodnika, w któ¬ 
rych jest skupione pole magnetyczne. Te włókniste 
obszary przenikają próbkę nadprzewodnika na 
wskroś. Każde takie włókno zawiera jeden flukson, 
czyli jeden kwant strumienia magnetycznego. Lokalna 
gęstość strumienia (czyli lokalna indukcja magne- 


pierwsza 

wartość 

krytyczna 


włókna stru¬ 
mienia mag¬ 
netycznego 
(fKuksoidy) 
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tyczna) jest największa w środku włókna i maleje 
w miarę wzrostu odległości od środka (rys. 16). 
Rdzeń włókna ma średnicę rzędu 2£. Dookoła osi 



Rys. 15. Zależność śre¬ 
dniej indukcji magne¬ 
tycznej i namagneso¬ 
wania nadprzewodni¬ 
ka II typu od natęże¬ 
nia pola magnetyczne¬ 
go 


B lok 




Rys. 16. Rozkład lokalnej indukcji magnetycznej i parametru 
uporządkowania dokoła osi wiru prądowego w nadprzewodni¬ 
ku II typu 


rdzenia cyrkulują prądy nadprzewodnictwa o gęstości 
malejącej ze wzrostem odległości od rdzenia. Właśnie 
te prądy wytwarzają pole magnetyczne w rdzeniu 
włókna. Włókno strumienia magnetycznego, zwane 
także fluksoidem, jest więc włóknem wirowym po¬ 
dobnym do włókna wirowego w cieczy, z tym że 
tutaj wokół osi włókna krążą elektrony nadprze¬ 
wodnictwa a nie cząsteczki płynu. Ponieważ wektor 
lokalnej indukcji i?i 0 k we włóknie strumienia mag¬ 
netycznego ma kierunek zewnętrznego pola magne¬ 
tycznego H , włókna nadają próbce dodatni moment 
magnetyczny zmniejszający jej diamagnetyzm. 

W miarę wzrostu natężenia zewnętrznego pola 
magnetycznego coraz więcej fluksoidów przenika 
próbkę nadprzewodnika i w związku z tym coraz 
bardziej zmniejsza się diamagnetyczny moment 
próbki. Podobnie jak w stanie czysto nadprzewodzą¬ 
cym, ten diamagnetyczny moment jest momentem 
prądów Meissnera, krążących po powierzchni próbki 
w kierunku odwrotnym do kierunku krążenia wirów 
prądowych w poszczególnych fłuksoidach (rys. 17). 
druga Gdy natężenie zewnętrznego pola magnetycznego 
wartość osiąga drugą krytyczną wartość ift 2 , fluksoidy gęsto 
krytyczna wypełniają próbkę, rozkład indukcji magnetycznej 
po przekroju poprzecznym próbki staje się jedno- 
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rodny i równy 2 — moment magnetyczny próbki 
zmniejsza się do zera i próbka przechodzi w stan 
normalny. Stosunek HkJHki dla danego nadprze¬ 
wodnika zależy od wartości parametru x (rys. 18). 
Na powierzchni próbki pozostanie jednak jeszcze 
bardzo cienka nadprzewodząca warstwa o grubości 
rzędu zasięgu kolelacji f. Warstwa ta znika dopiero 
wtedy, gdy natężenie pola magnetycznego osiągnie 
trzecią wartość krytyczną Hic 5 = 1,1 Hk 2 . W warstwie 
powierzchniowej może krążyć słaby prąd nadprze¬ 
wodnictwa, moment magnetyczny tego prądu jest 
jednak zbyt mały w porównaniu z poprzednim mo¬ 
mentem magnetycznym ekranujących prądów Meis¬ 
snera, aby go można było zmierzyć tą samą metodą. 


Rys. 17. Prądy powierz¬ 
chniowe i skwantowane- 
wiry prądowe w próbce 
nadprzewodnika II typu 



prądy 

powierzchniowe 
Meissnera 



Nadprzewodząca warstwa powierzchniowa ekranuje 
jednak wnętrze próbki od słabego zmiennego pola 
elektromagnetycznego nałożonego na pole stałe 
H < Hkz , dlatego można ją wykryć metodą pomiaru 
indukcji wzajemnej dwu koncentrycznych cewek, 
wewnątrz których znajduje się badana próbka. War¬ 
stwa powierzchniowa zmniejsza także opór elek¬ 
tryczny próbki, jeśli stały prąd pomiarowy jest wy¬ 
starczająco słaby, aby nie zniszczyć nadprzewodni¬ 
ctwa warstwy. Nadprzewodnictwo warstwy po¬ 
wierzchniowej utrzymuje się do Hk z tylko na tych 
obszarach powierzchni próbki, które są równoległe 
do linii sił pola zewnętrznego. W wypadku istnienia 
składowej pola prostopadłej do powierzchni próbki 
nadprzewodnictwo powierzchniowe znika, gdy Hk % < 
< H < Hk Z - Na obszarach powierzchni próbki pro¬ 
stopadłych do H nadprzewodnictwo powierzchniowe 
powyżej Hk z istnieć nie może. Nie może ono istnieć 
także wtedy, gdy próbka jest pokryta warstwą nienad- 
przewodzącego metalu (np. warstwą miedzi). 
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Stan mieszany 

W polu magnetycznym o natężeniu H większym od 
pierwszej wartości krytycznej a mniejszym od drugiej 
(Hki < H < /ffcs), próbka nadprzewodnika II typu 
nie'jest ani w stanie czysto nadprzewodzącym, ani w 
stanie normalnym. Nie jest też w stanie pośrednim, 
gdyż w objętości próbki nie da się wyodrębnić makro- 
faza skopowych obszarów poszczególnych faz. Całą obję- 
mseszana tość próbki zajmuje jedna faza termodynamiczna, 
która niezbyt trafnie nazywa się fazą mieszaną, mimo 
iż nie jest ona mieszaniną różnych faz. Fazę tę nazywa 
się także fazą Szubnikowa. Przemiany fazowe zwią¬ 
zane z przejściem ze stanu nadprzewodzącego w stan 



mieszany i ze stanu mieszanego w stan normalny przy 
zmianie natężenia pola zewnętrznego są przemianami 
II rodzaju. Przypominamy, że przejście nadprzewod¬ 
nika I typu ze stanu nadprzewodzącego w stan nor¬ 
malny w polu magnetycznym jest przemianą fazową 
I rodzaju. Wykres fazowy dla nadprzewodnika II 
typu jest przedstawiony na rys. 19. 
uporząd- W monokrystalicznej, pozbawionej defektów prób¬ 
kowanie ce nadprzewodnika II typu faza mieszana charakte- 
włókien ryzuje się przestrzennie uporządkowanym rozkładem 
strumienia włókien wirowych strumienia magnetycznego tzw. 
magnetycz- fluksoidów. W płaszczyźnie poprzecznej do linii sił po- 
nego la magnetycznego siatka fluksoidów może mieć układ 
trójkątny lub kwadratowy. Ilustracja 95 z tabl. 25 
przedstawia obraz trójkątnej siatki fluksoidów otrzy¬ 
many pod mikroskopem elektronowym przez Es- 
smanna i Trauble’a po naniesieniu proszku ferro¬ 
magnetycznego na powierzchnię próbki wykonanej 
ze stopu ołów-antymon. Ziarenka proszku skupiły 
się w obszarach najsilniejszego pola, czyli w miejscach, 
gdzie rdzenie wirów wychodzą na powierzchnię 
próbki. 

Podobnie jak lokalna indukcja magnetyczna, upo¬ 
rządkowany przestrzenny rozkład w stanie miesza¬ 
nym wykazuje również parametr uporządkowania 
nadprzewodzącego (np. względna gęstość elektronów 
nadprzewodnictwa). 

Zależność indukcji średniej Bśr (tj. uśrednionej po 
całej objętości próbki) od natężenia zewnętrznego 
pola magnetycznego //jest przedstawiona na rys. 15. 
W stanie Meissnera pole nie wnika do próbki i Bśr — 
= 0. Przy H — Hi Cl Bśr gwałtownie wzrasta, co ozna¬ 
cza, że w próbkę wnika dużo fluksoidów. Dalej B& r 
wzrasta stopniowo ze wzrostem //, zależność Bśr (H) 
nie jest jednak liniowa. Indukcja Bśr jest proporcjo¬ 
nalna do H dopiero w stasie normalnym, tj. powyżej 
H kn . Taka postać funkcji B ir (H) dla nadprzewodni¬ 
ków II typu przypomina zależność momentu pędu 
nadpłynnego helu od prędkości kątowej obracającego 
się naczynia, w którym zawarty jest ten hel. W obu 
tych wypadkach w określonych warunkach pojawiają 
się podobne struktury wirowe. 

27 -r- Encyklopedia fizyki współczesnej 


Zjawiska nieodwracalne 

Histereza magnetyczna 

Proces namagnesowania nadprzewodnika II typu 
w polu magnetycznym jest procesem odwracalnym 
tylko w wypadku doskonałych próbek. Krzywa na¬ 
magnesowania M(H) przebiega wtedy w obu kierun¬ 
kach jednakowo i nie tworzy pętli histerezy. W rzeczy¬ 
wistości próbki nadprzewodników wykazują pewne 
odstępstwo od doskonałości i namagnesowanie próbki 
nie jest jednoznaczną fukcją natężenia pola magne¬ 
tycznego, gdyż zależy od kierunku zmian pola 
(rys. 20). 

Defekty struktury w próbce nadprzewodnika utrud¬ 
niają ruch fluksoidów — zarówno ich wnikanie wp*yisv 
w próbkę przy wzroście H, jak i opuszczanie próbki defektów 
przy zmniejszaniu się H. Defekty mogą w, próbce 
tworzyć lokalne obszary o mniejszej wartości Hk Z \ 
obszary takie przechodzą w stan normalny przy mniej¬ 
szych wartościach natężenia pola i stanowią pułapkę 
(studnię potencjału) dla fluksoidów. Fluksoidy więzną 



Rys. 20. Histereza magnetyczna niejednorodnego nadprzewod¬ 
nika II typu 

w tych miejscach, podobnie jak w otworach w próbce, 
i mogą je opuścić dopiero pod naporem innych fluk¬ 
soidów (pomiędzy fluksoidami o tym samym kierunku 
wektora wirowości z małej odległości działają siły 
wzajemnego odpychania), albo pod wpływem siły 
oddziaływania prądu elektrycznego na fluksoidy, 
jeśli przez próbkę taki prąd płynie. Niekiedy miejsca 
uwięźn-ięcia opuszcza naraz duża liczba fluksoidów, 
co przejawia się gwałtowną zmianą strumienia 
magnetycznego w próbce, czyli tzw. skokiem stru¬ 
mienia. 

Nieodwracalność procesu namagnesowania nad¬ 
przewodnika jest przyczyną rozpraszania energii pola rozpraszanie 
magnetycznego. Miarą strat energetycznych podczas energii 
jednego cyklu namagnesowania jest wielkość pola 
powierzchni ograniczonej pętlą histerezy. W okreso¬ 
wo zmieniającym się polu magnetycznym nadprze¬ 
wodnik II typu w stanie mieszanym rozprasza energię 
tego pola w postaci ciepła, i to zarówno wtedy, gdy 
zmienia się zewnętrzne pole magnetyczne, jak i wtedy, 
gdy zmienia się pole magnetyczne pochodzące od 
prądu zmiennego płynącego przez nadprzewodnik. 


Krytyczna gęstość prądu 

Dla zastosowań technicznych jest szczególnie ważne, 
aby przez przewód z nadprzewodnika można było 
przepuszczać bez strat prąd elektryczny o możliwie 
największym natężeniu. W stanie Meissnera prąd 
płynie tylko po powierzchni nadprzewodnika. Prąd 
stały o natężeniu I płynący przez drut o promieniu r 
wytwarza na jego powierzchni pole magnetyczne 
o natężeniu H = //2rcr. Jeśli natężenie tego pola 
osiągnie wartość H*u drut z nadprzewodnika II typu 
przejdzie w stan mieszany i prąd rozłoży się po całym 
przekroju przewodu. Fluksoidy w próbce będą mieć 
postać zamkniętych współśrodkowych pierścieni ko¬ 
łowych, zgodnie z kształtem linii sił pola magnetycz¬ 
nego wytworzonego przez prąd. Ponieważ energia 
włókna jest proporcjonalna do jego długości, fluksoi¬ 
dy zmniejszają swą długość kurcząc się w kierunku 
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kurczenie się osi i znikają w pobliżu osi- Na ruch fluksoidów wpły- 
i znikanie wa także oddziaływanie między fluksoidami i prądem 
fluksoidów płynącym przez próbkę. 

Ruch włókien strumienia magnetycznego i ich 
znikanie na osi drutu powoduje wydzielanie się ciepła, 
dlatego z przepływem prądu przez nadprzewodnik 
w stanie mieszanym wiąże się rozpraszanie energii. 
Aby uniknąć strat energetycznych, należy w jakiś 
sposób zatrzymać poruszające się fluksoidy, np. przez 
wytwarzanie w drucie defektów, na których fluksoidy 
będą się zaczepiać. W ten sposób można przez drut 
z nadprzewodnika przepuścić bez strat prąd stały 
o natężeniu znacznie większym niż hi — 2nrHki- 
Maksymalny prąd stały, który może przepływać bez 
strat przez daną próbkę drutu, nazywamy prądem 
nasycenia albo prądem krytycznym. Ponieważ na¬ 
tężenie tego prądu zależy od przekroju poprzecznego 
drutu, lepiej posługiwać się pojęciem krytycznej 
gęstości prądu y*. Krytyczna gęstość prądu stałego 
krytyczna dla nadprzewodnika nie jest stałą materiałową (jak 
gęstość np. Hia), gdyż zależy od defektów w strukturze 
prądu próbki, czyli od sposobu jej obróbki. 


Płynięcie strumienia 

Rozpatrzmy teraz bliżej oddziaływanie wzajemne 
między fluksoidami i stałym prądem elektrycznym 
przepływającym przez próbkę. Załóżmy, że drut z 
twardego nadprzewodnika, przez który płynie prąd 
stały, znajduje się w zewnętrznym stałym polu mag¬ 
netycznym skierowanym- prostopadle do osi drutu 
(w takich warunkach pracuje większość uzwojeń 
w urządzeniach elektrycznych prądu stałego) i że 
natężenie pola jest wystarczające do wytworzenia 
w drucie stanu mieszanego. 

Prąd elektryczny płynący wzdłuż drutu będzie od¬ 
działywał na fluksoidy siłą skierowaną prostopadle 
zarówno do kierunku prądu, jak i do osi fluksoidu 


dek napięcia U/, co jest równoważne pojawieniu się opór 
oporu elektrycznego R / = /• U/. Ponieważ opór ten płynięcia 
jest wywołany ruchem płynięcia fluksoidów, nazywa- 
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Rys. 22. Zależ¬ 
ność napięcia 
indukowanego 
ruchem fluksoi¬ 
dów od natęże¬ 
nia prądu i zew¬ 
nętrznego pola 
magnetycznego 





Rys. 21. Szkic ilustrujący ruch fluksoidów w nadprzewodniku 
z prądem w obecności zewnętrznego pola magnetycznego 

(rys. 21). Pochodzenie tej siły, zwanej siłą Lorentza, 
możemy łatwo zrozumieć, jeśli przypomnimy sobie, 
że pole magnetyczne oddziałuje na poruszające się 
ładunki elektryczne (czyli na prąd) siłą prostopadłą 
do linii sił pola i do kierunku ruchu ładunków. Siła 
ta jest siłą wzajemnego oddziaływania prądu i pola 
poprzeczny magnetycznego. Fluksoidy pod wpływem działającej 
ruch na nie siły Lorentza będą się poruszać w poprzek 
fluksoidów drutu. Nie jest to jednak ruch przyśpieszony, gdyż 
towarzyszy mu tarcie, czyli lepkość, pochodząca od 
prądów wirowych, wzbudzonych w próbce tymże 
właśnie ruchem strumienia magnetycznego. Równo¬ 
waga hamującej siły lepkości i siły Lorentza określa 
prędkość ruchu fluksoidów. 

Ponieważ ruch fluksoidów związany jest z pokony¬ 
waniem siły tarcia, czyli z wykonywaniem pracy przez. 
prąd elektryczny, to wzdłuż drogi prądu wystąpi spa- 


Rys. 23. Zależność krytycznej gęstości prądu w nadprzewodniku 
II typu od natężenia pola magnetycznego prostopadłego do kie¬ 
runku prądu 

my go oporem płynięcia strumienia magnetycznego, 
albo krócej — oporem płynięcia. 

Rys. 22 przedstawia zależność spadku napięcia U 
w nadprzewodniku II typu od natężenia przepływa¬ 
jącego przezeń prądu. Dopóki gęstość prądu nie 
osiągnie wartości krytycznej /*, spadek napięcia jest 
równy zeru. Wartość jk dla danej próbki zależy od charakterys< 
natężenia zewnętrznego pola magnetycznego H, tyka nad- , 
a także od jego kierunku względem drutu. Zależność przewodnika 
jk(H ) dla poprzecznego pola magnetycznego jest naj- 11 typu 
ważniejszą charakterystyką twardego nadprzewodnika 
z punktu widzenia jego przydatności do celów prak¬ 
tycznych. Na rys. 23 przedstawione są dwie takie cha¬ 
rakterystyki dla tego samego materiału: jedna dla 
próbki jednorodnej i odprężonej, druga dla próbki 
z defektami struktury krystalicznej. Charakterystyki 
takie podaje się zazwyczaj dla T = 4,2 K. 

Zjawiska nieodwracalne w nadprzewodnikach od¬ 
grywają bardzo ważną rolę w zastosowaniach nad¬ 
przewodników dla celów praktycznych, szczególnie 
w elektrotechnice. Niestety, jak dotąd, teoria nad¬ 
przewodnictwa nie obejmuje zjawisk nieodwracalnych 
(np. oddziaływań fluksoidów z defektami struktury 
krystalicznej); w tym zakresie posługujemy się jedy¬ 
nie uproszczonymi modelowymi przedstawieniami 
i fenomenologicznym ujęciem zagadnienia. 

Zagadnienie wysokotemperatu¬ 
rowego nadprzewodnictwa 

Sprawą doniosłej wagi, zarówno ze względów poz¬ 
nawczych, jak i praktycznych, jest rozstrzygnięcie 
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temperatura zagadnienia, czy nadprzewodnictwo może występo- 
krytyczna wać również w temperaturach wysokich. Zagadnienie 
to można rozpatrywać opierając się na teorii BCS. 
Wyzyskując zależność (1) otrzymujemy, że 7* « 

~ (flje" 1 /*. Symbol 0 oznacza tutaj tzw. temperaturę 
Debye’a, czyli temperaturę charakterystyczną dla 
wzbudzeń fononowych. Temperatura ta zależy od 
budowy krystalicznej danej substancji; jej sens jest 
taki, że kd jest maksymalną energią fononu w danej 
sieci krystalicznej. Parametr g w wykładniku potęgi 
jest iloczynem stałej oddziaływania elektron-fonon- 
-elektron oraz gęstości stanów na poziomie Fermiego 
w stanie normalnym. Tk zależy więc od dwu paramet¬ 
rów, z których jeden charakteryzuje samą sieć krysta¬ 
liczną, a drugi — wielkość oddziaływania elektronów 
z tą siecią. Oddziaływanie to nie może być zbyt silne, 
gdyż wtedy sama sieć stałaby się niestabilna i musia¬ 
łaby przejść w inną modyfikację krystalograficzną 
ze słabszym oddziaływaniem. Parametr g nie może 
więc przybierać zbyt dużych wartości. Dla więk¬ 
szości znanych nadprzewodników g < 1 j 2 . Najwyż¬ 
szą wartość g , bo ok. */*, ma ołów, ale jego tempera¬ 
tura Debye’a jest niska (0 = 95 K) i dlatego 7* dla 
ołowiu jest równa 7,2 K. Czynnik eksponencjalny 
ć - 1 /# zmniejsza więc wartość 0 co najmniej o rząd. 
Trzeba tu zwrócić uwagę, że dla tak dużych g , jak 
w ołowiu, wzór (1) nie stosuje się ściśle, gdyż został 
wyprowadzony przy założeniu, że g < 1. 

Temperatury Debye’a dla większości ciał stałych 
mieszezą się w przedziale 10 2 —10 3 K. Spośród nad¬ 
przewodników najwyższą temperaturę Debye’a (rów¬ 
ną 990 K) ma Be 22 Rn. Jednak gęstość stanów elektro¬ 
nowych w tym związku jest mała (a więc mały pa¬ 
rametr g) i stąd Tk = 9,6 K. 

wodór Istnieją uzasadnione przypuszczenia że zestalony 
metaliczny wodór pod wysokim ciśnieniem (rzędu 2,6 Mbar) 
może przejść w fazę metaliczną, której temperatura 
Debye’a wynosiłaby ok. 3,5-10 3 K. Gdyby ta meta¬ 
liczna faza wodoru okazała się nadprzewodzącą, to 
nawet przy słabym oddziaływaniu elektronowo-fono- 
nowym temperatura krytyczna nie byłaby niższa od 
30 K, a może nawet sięgałaby 200 K w przypadku 
silnego oddziaływania. Można się spodziewać, że na¬ 
wet po usunięciu ciśnienia metaliczna faza zestalone¬ 
go wodoru pozostanie w metastabilnym stanie. Takie 
metastabilne fazy są znane; np. diament w niskich 
temperaturach ma wyższą energię swobodną niż grafit. 

Przy fononowym mechanizmie pojawienia się nad¬ 
przewodnictwa niskie temperatury przejścia w stan 
nadprzewodzący wynikają z własności sieci krystalicz¬ 
nej, która pośredniczy w oddziaływaniu elektronów 
z sobą. Dla uzyskania wyższych temperatur Tk po¬ 
trzebne byłoby oddziaływanie inne, znacznie silniej¬ 
sze niż elektronowo-fononowe. Przypuszcza się, że 
nadprzewodnictwo może się pojawić również w wy¬ 
niku przyciągania się elektronów na skutek wymiany 


wirtualnych ekscytonów. Ekscytony są elementar- ekscytony 
nymi wzbudzeniami układu elektronów. Wzbudzenia 
te przypuszczalnie rozchodzą się ze słabym tłumie- 
nie'm w ośrodkach niemetalicznych, np. w półprze¬ 
wodnikach. Zatem, w celu utworzenia par Coopera 
związanych siłami wymiany ekscytonu trzeba, aby 
metal znajdował się w ciasnym kontakcie z półprze¬ 
wodnikiem lub dielektrykiem, co można osiągnąć 
np. w układach warstwowych. Energia ekscytonów 
może być znacznie większa niż energia fononów, 
a odpowiadająca tej energii temperatura charaktery¬ 
styczna jest równa 9 e = ficojk ^ 10 4 K, co — po 
uwzględnieniu czynnika eksponencjalnego — odpo¬ 
wiadałoby Tk = 10 3 K. Ekscytonowe nadprzewod¬ 
nictwo mogłoby więc istnieć w temperaturze pokojo¬ 
wej, a może nawet i wyższej. 

Ciekawy przykład mechanizmu prowadzącego do przykład 
wysokotemperaturowego nadprzewodnictwa w cząs- Little a 
teczkach organicznych podał W. A. Little. Cząsteczka 
ma kształt przewodzącego łańcucha z bocznymi po¬ 
laryzującymi się gałęziami. Elektrony przewodnictwa 
w łańcuchu mogłyby przyciągać się wzajemnie za 
pośrednictwem polaryzujących się odgałęzień łań¬ 
cucha. Jest to oddziaływanie kulombowskie, a więc 
energia tego oddziaływania może być duża. Według 
ocen Little’a, krytyczna temperatura w tym modelu 
powinna wynosić 2400 K. Głównym zarzutem wy¬ 
suniętym przeciw takiemu poglądowi było stwierdze¬ 
nie, że w jednowymiarowym łańcuchu nadprzewodni¬ 
ctwo nie może istnieć, gdyż fluktuacje gęstości elek¬ 
tronów doprowadziłyby do jego zaniku. 

Ponieważ przy ocenie Tk korzystaliśmy z zależności zakres sto- 
wynikającej z teorii BCS, warto by się jeszcze zasta- sowalności 
nowić nad zakresem stosowalności tej teorii. Teoria teorii BCS 
BCS w ogólnym sformułowaniu nie może uwzględ¬ 
niać szczegółów budowy konkretnej substancji, dla¬ 
tego w poszczególnych wypadkach można otrzymać 
wyniki odbiegające nieco od przewidywań tej teorii. 

Wynika to stąd, że samo oddziaływanie elektronowo- 
fononowe zależy od wielu czynników, między innymi 
od widma fononowego danej substancji oraz od ekra¬ 
nowania elektronów dodatnimi jonami. Oddziały¬ 
wanie to nie zawsze jest słabe, jak założono w teorii. 

Istotne jest jednak, że teoria BCS jest na tyle ogólna, 
że w jej ramach można dokonywać wielu uzupełnień 
i poprawek nie naruszających podstaw samej teorii. 

Uwzględnienie zależności przyciągającego oddzia¬ 
ływania między elektronami od szczegółów budowy 
sieci itp. zmienia postać wzoru (1), wiążącego Tk 
z temperaturą charakterystyczną dla pośredniczących 
w oddziaływaniu między elektronami wzbudzeń, nie 
na tyle jednak, aby można było oczekiwać dla Tk war¬ 
tości znacznie większych, niż wynikające z tego wzoru. 

A. C. Rose-Innes, E. H. Rhoderick Nadprzewodnictwo, War¬ 
szawa 1973; L. Śniadower Półprzewodniki nadprzewodzące , 

Post. Fiz. 23, 157 (1972). 


Zjawiska tunelowe w nadprzewodnikach 


Eugeniusz Trojnar 

Tunelowanie elektronów 
normalnych 


Wyobraźmy sobie obwód elektryczny składający się 
ze źródła prądu stałego, kondensatora płaskiego, 
oporników i mierników, jak na rys. 1. W normalnych 
warunkach trudno oczekiwać, że przez kondensator 
popłynie prąd stały. Jeśli jednak odległość między 
okładkami kondensatora zmniejszy się do ok. 5 nm 
to amperomierz zarejestruje przepływ prądu przez 
Rys. i. Schemat kondensator — mimo istnienia warstwy izolatora 
obwodu do wyzna- m j ędzy okładkami. Przepływ tego prądu jest spowo- 
^Hunclo^h^" dowany kwantowym zjawiskiem tunelowania cząstek 
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przez barierę energetyczną. Wytłumaczymy to zja¬ 
wisko posługując się modelem elektronowych po¬ 
ziomów energetycznych w metalu. 

Kawałek metalu można rozpatrywać jako jamę 
potencjału dla elektronów przewodnictwa. Elektron, 
aby wyjść z metalu, musiałby pokonać siłę przycią¬ 
gania go przez sieć jonową, czyli wykonać pracę wyjś¬ 
cia. Według mechaniki klasycznej musiałby mieć na 
to wystarczającą energię. 

Na rys. 2 przedstawiono schematy poziomów ener¬ 
getycznych w dwu zbliżonych do siebie kawałkach 
metalu (np. w okładzinach kondensatora). Kreski 
poziome oznaczają poziomy energetyczne zajęte 
przez elektrony w temperaturze 7 = OK. Najwyższy 
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poziom z tych poziomów nazywa się poziomem Fermiego. 
Fermiego Wysokość kreski pionowej ponad poziomem Fer¬ 
miego przedstawia wartość pracy wyjścia (IV). Po- 



stany 



b > u- ~ F '- Ef? 

e 

Rys. 2. Elektronowe poziomy energetyczne w układzie złożonym 
z dwu metali rozdzielonych warstwą izolatora {W — praca wyj¬ 
ścia): a) U = 0; poziomy Fermiego Ef leżą naprzeciw siebie; 
b) przyłożone napięcie powoduje przesunięcie poziomów Fermie¬ 
go względem siebie o eU (e — ładunek elek-tronu) 

bariera między obu kawałkami metalu istnieje więc bariera 
potencjału energetyczna nazywana także barierą potencjału. Aby 
w klasyczny sposób pokonać tę barierę, czyli przejść 
przez nią, elektron musiałby mieć energię co najmniej 
równą wysokości tej bariery (czyli równą pracy wyjś¬ 
cia). 

W temperaturze T > 0 K niektóre elektrony wzbu¬ 
dzają się na wyższe poziomy, leżące ponad poziomem 
Fermiego, i wtedy prawdopodobieństwo przejścia 
przez barierę wzrasta. W wysokiej temperaturze może 
nawet występować emisja elektronów z metalu zwana 
termoemisją. Wzbudzone elektrony zwalm.ają stany 
leżące poniżej poziomu Fermiego (rys. 3). 

Fizyka kwantowa dopuszcza możliwość przejścia 
elektronu przez barierę potencjału także w tempera¬ 
turze zbliżonej do zera bezwzględnego, chociaż wtedy 


fala padająca 



stany zwolnione 
(dziury) 


Rys. 3. Przenikanie funkcji falowej przez barierę potencjału; 
kwadrat amplitudy funkcji falowej oznacza prawdopodobień¬ 
stwo znalezienia cząstki w danym miejscu 
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żaden z elektronów nie zajmuje wystarczająco wy¬ 
sokiego poziomu energetycznego. W fizyce kwanto¬ 
wej każdej cząstce przyporządkowuje się określoną 
falę (stan, w jakim znajduje się dana cząstka jest 
opisany równaniem falowym), przy czym kwadrat 
amplitudy tej fali w pewnym punkcie przestrzeni 
oznacza prawdopodobieństwo znalezienia tam cząstki. 

Fala częściowo odbija się od bariery, a częściowo 
przenika przez nią, dlatego istnieje różne od zera 
prawdopodobieństwo znalezienia cząstki również 
po drugiej stronie bariery (rys. 3). Cząstka przenika zjawiska 
przez barierę, jakby przechodziła przez tunel w barie- tunelowe 
rz-e — stąd nazwa takich zjawisk. 

W praktyce bardzo trudno jest umieścić dwa ka¬ 
wałki metalu w małej (ok. 5 nm) odległości, i zarazem 
nie dopuścić do ich zetknięcia, dlatego oba kawałki 
rozdziela się warstwą izolatora. Układ warstwowy 
do badania zjawisk tunelowych w nadprzewodnikach 
można wykonać w następujący sposób: na szklane 
podłoże naparowuje się w próżni warstwę nadprze¬ 
wodzącego metalu (np. Pb), następnie warstwę tę 
poddaje się działaniu powietrza, aby ją utlenić na 
powierzchni (metal trudno utleniający się można po¬ 
kryć cienką warstewką jakiegoś innego izolatora), 
a później naparowuje się na nią ten sam albo inny 
metal nadprzewodzący (np. Sn). 

Zjawiska tunelowe w nadprzewodnikach można 
podzielić na dwa typy: tunelowaniejednocząstkowych 
wzbudzeń (elektronów normalnych) i tunelowanie 
elektronowych par Coopera ( -* nadprzewodnictwo). 
Tunelowanie elektronowych par przewidział teore¬ 
tycznie w 1962 r. B. D. Josephson i dlatego zjawiska 
związane z tym tunelowaaiem noszą nazwę zjawisk 
Josephsona. Za prace dotyczące zjawisk tunelowych 
w nadprzewodnikach (i półprzewodnikach) B. Jo¬ 
sephson, I. Giaever i L. Esaki otrzymali w 1973 r. 
nagrodę Nobla. 

Omówimy najpierw tunelowanie elektronów nor- wykresy 
malnych. Dla wyjaśnienia zjawisk posłużmy się ry- Gęstości 
sunkami podobnymi do rys. 2, z tym że teraz nie stanów 
będziemy oznaczać wysokości bariery, natomiast 
obwiedziemy krzywymi zakończenia kresek obrazu¬ 
jących zajęte poziomy energetyczne. Długość tych 



Rys. 4. Wykresy gęstości stanów dwu nadprzewodników rozdzie¬ 
lonych warstwą izolatora 


poziomych kresek odpowiada liczbi'e stanów (pozio¬ 
mów energetycznych) przypadających na jednostko¬ 
wy przedział energetyczny, w którym leży dana kreska. 
W ten sposób otrzymamy wykresy gęstości stanów 











































elektronowych N{E ) dla obu nadprzewodników roz¬ 
dzielonych barierą (rys. 4). 

przerwa Po obu stronach poziomu Fermiego w nadprze- 
energetyczjia wodnikach istnieje pasmo wzbronionych wartości 
energii dla elektronów, czyli tzw. przerwa w widmie 
wzbudzeń elektronowych. Szerokość połowy tego 
pasma wzbronionego oznaczamy grecką literą delta 
(A). Gęstość stanów elektronowych w nad prze wodni- 
> .ku wzrasta do nieskończoności w miarę zbliżania się 
do górnej lub dolnej krawędzi przerwy energetycznej. 

Jeśli oba nadprzewodniki rozdzielone warstwą 
izolatora mają ten sam potencjał elektryczny, to ich 



Rys. 5. Środkowa część wykresu gęstości stanów (obwiedziona 
, kółkiem na rys. 4) przy różnych warunkach zewnętrznych. 
Strzałki niebieskie wskazują kierunek tunelowania elektronów 


przesunięcie poziomy Fermiego leżą dokładnie naprzeciw siebie 
poziomów (rys. 5a). Przyłożenie napięcia U do bariery, czyli 
Fermiego połączenie każdego z nadprzewodników z odpowied¬ 
nim biegunem źródła napięcia stałego, spowoduje 
przesunięcie się poziomów Fermiego względem siebie 
o przedział, energetyczny eU (e jest ładunkiem elek¬ 
tronu), przy czym wyższy poziom Fermiego ma metal 
połączo.ny z biegunem ujemnym (rys. 5b). W tempe¬ 
raturze T > 0 (rys. 5c) niektóre stany powyżej przer¬ 
wy energetycznej są obsadzone przez wzbwdzone 
cieplnie elektrony, natomiast część stanów poniżej 
przerwy pozostaje wolna. 

Prąd przez barierę może płynąć tylko wtedy, gdy 
naprzeciw obsadzonych stanów po jednej stronie 
bariery śą odpowiednie wolne stany po drugiej stro¬ 
nie. Dopóki przesunięcie poziomów Fermiego jest 
mniejsze od różnicy połówek przerw energetycznych 
A x —A z (odpowiada to napięciu na barierze U > (A x — 
— A 2 y/e ), prąd płynący przez barierę jest bardzo słaby, 
gdyż udział w nim biorą tylko nieliczne wzbudzone 
cieplnie elektrony, a gęstość wolnych stanów leżących 
naprzeciw stanów obsadzonych jest niewielka. Jed¬ 
nakże gdy napl^ęcie wzrośnie do U = (,A X —A^!e, 
górne (albo dolne — w zależności od polaryzacji 
złącza) krawędzie przerw energetycznych obu nad¬ 
przewodników znajdą się naprzeciw siebie i prąd 
tunelujących elektronów zwiększy się, ponieważ w po¬ 
bliżu krawędzi przerwy energetycznej gęstość stanów 
znacznie wzrasta (rys. .5c). Dalsze zwiększenie napię¬ 
cia spowoduje przesunięcie. się względem siebie gór¬ 
nych ('albp dolnych) krawędzi przerw energetycznych 
i w wyniku tego — zmniejszenie prądu, gdyż znów 
zmaleje gęstość wolnych stanów znajdujących się 
naprzeciw stanpw żaj^tyćh *{rys. 4; U > ■(Ą 1 —A 2 )le). 

G.dy -napięcie na barierze wzrośnie do wartości' 
U = (A x +4£le, naprzeciw siebie znajdą się znów, 
krawędzie przerw energetycznych, tym razem górna 
i dolna, i- prąd tunelowy szybko wzrośnie (rys. 5d).. 


Przy dalszym zwiększaniu -się napięcia coraz więcej 
wolnych stanów znajdować się będzie naprzeciw sta¬ 
nów zajętych i prąd będzie wzrastał ze wzrostem na.- 
pięcia. 

Charakterystyka napięciowo-prądowa I =/(£/) ujemny opór 
układu dwu nadprzewodników rozdzielonych cienką elektryczny 
warstwą izolatora wykazuje więc obszar ujemnego 
oporu różniczkowego dljdU w przedziale napięć od 



(A x -AJ/e do (A x +AJ/e (rys. 6). Podobną charaktery¬ 
stykę mają półprzewodnikowe diody tunelowe, co 
nasuwa myśl o wyzyskaniu nadprzewodników jako 
materiału na tunelowe diody nadprzewodnikowe. 

Ponieważ »prąd przy napięciu U < (A x —A«) jes.t 
prądem wzbudzonych cieplnie elektronów, to w tem¬ 
peraturze T — OK prąd ten nie popłynie. Nie popłynie 
również gdy napięcie U < (A 1 +A z ) i ponieważ w tem¬ 
peraturze T = 0 K nie ma wolnych stanów poniżej 
przerwy energetycznej. Wysokość garbu na charakte¬ 
rystyce 7 = /(£/) zależy zatem od temperatury (wzra¬ 
sta wraz z nią). 

Jeśli jedna z okładek rozpatrywanego tutaj konden¬ 
satora jest metalem normalnym (np. nadprzewodni¬ 
kiem powyżej temperatury krytycznej 7*, tzn. że nie 
ma przerwy energetycznej czyli A 2 = 0), to — jak 
łatwo można sprawdzić na odpowiednim schemacie 
poziomów energetycznych — prąd tunelowy popłynie, 
gdy U = A Je, a charakterystyka I —f(U) nie będzie 
mieć garbu. Gładką charakterystykę otrzymuje się 
również wtedy, gdy metale po obu stronach bariery 
są tymi samymi nadprzewodnikami (prąd tunelowy 
popłynie, gdy napięcie osiągnie wartość U = 2 A/e t 
ponieważ teraz A x = A. z ). 

Dane otrzymane z charakterystyk złącza tunelo- zgodność z 
wego i dotyczące szerokości przerwy energetycznej teorią BCS 
w nadprzewodnikach oraz jej zależność od tempera¬ 
tury potwierdzają przewidywania teorii Bardeena, 

Coopera i Schrieffera, dokładniej omówione w haśle 
nadprzewodnictwo. Ale nie tylko te dane można 
uzyskać w wyniku analizy pomiarów prądu tunelo¬ 
wego. Pierwsze i drugie pochodne charakterystyk na- 
pięciowo-prądowych, czyli dljdU i d-IjdU 2 , mogą 
dać informacje o gęstości stanów elektronowych i o 
rozkładzie widmowym fononów w nadprzewodni¬ 
kach. 


Zjawiska Josephsona —tune¬ 
lowanie par Coopera 

Jeśli warstwa rozdzielająca dwa nadprzewodniki jest 
wystarczająco cienka, nie grubsza niż odległość, z ja¬ 
kiej oddziałują z s-obą elektrony pary Coopera (ok? 
1-^2 nm), oprócz tunelowania normalnych elektro¬ 
nów może wystąpić tunelowanie elektronów zwią¬ 
zanych w pary Coopera. Oczywiście, pary nie będą 
mogły tunelować, gdy któryś z nadprzewodników 
układu kanapkowego przejdzie w stan normalny. 

DI*a zrozumienia zjawisk Josephsona musiiny po¬ 
służyć się pojęciem funkcji falowej opisującej stan 
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kwantowy cząstki. Próby wyjaśnienia tych procesów 
oparte na modelu klasycznym przeważnie zawodzą. 
Długość fali X i częstość v związane są z pędem p 
i energią e cząstki zależnościami: 


X — hjp , s = hv , (1) 


gdzie h — stała Plancka. 

funkcja Stan kwantowy pary Coopera można opisać funkcją 
falowa pary falową w postaci: 

Coopera 

rp = y 0 sin2jr 



albo, po uwzględnieniu zależności (1): 


. 2rc x 

= y> 0 Sin —-{px—et). 


( 3 ) 


Dla uproszczenia posłużyliśmy się tu falą płaską roz¬ 
chodzącą się w kierunku osi *. Litera t oznacza czas. 
Argument sinusa: (p = 2jt(px — et)/h nazywa się fazą 
funkcji falowej. 

Sens fizyczny fazy funkcji falowej jest dość trudny 
do uchwycenia. Znacznie łatwiej trafia do wyobraźni 
fizyczna interpretacja amplitudy y 0 funkcji falowej: 
jej kwadrat oznacza prawdopodobieństwo znalezienia 
cząstki w danym miejscu. Jeśli są to cząstki nałado¬ 
wane, jak pary Coopera, to y>\ jest proporcjonalne 
do gęstości ładunku. 

Funkcje falowe wszystkich par Coopera w jedno- 
spójnej bryle nadprzewodnika (tzn. w bryle pozba¬ 
wionej otworów, w których mógłby zostać uwięziony 
strumień magnetyczny) mają jednakową długość. 
Wynika to stąd, że wszystkie pary mają jednakowy 
pęd. Pędy wszystkich par są równe zeru, gdy przez 
nadprzewodnik nie płynie prąd, i różne od zera, ale 
jednakowe, gdy nadprzewodnik jest włączony do 
obwodu prądu. 

Funkcje falowe par elektronów mają także zgodną 
fazę — są spójne (koherentne), przy czym spójność 
rozciąga się na cały obszar nadprzewodnika. Jeżeli 
jest to nawet przewód nadprzewodzący w uzwojeniu 
elektromagnesu osiągający długość do kilku kilome¬ 
trów, to funkcje falowe par elektronów są spójne na 
całej długości tego nadprzewodnika. 

Gdy przez nadprzewodnik nie płynie prąd, pęd par 
Coopera równa się zeru, a długość fali jest nieskoń¬ 
czona (pomijamy tu kwestię zaniku funkcji falowej na 
granicy nadprzewodnika w obszarze o grubości £). 
Oznacza to, że faza funkcji falowej w całym nadprze- 
różnica faz wodniku jest taka sama. Gdy prąd płynie, pęd par 
funkcji J est różny od zera i długość fali ma wartość skończoną, 
falowych jednakową dla wszystkich par. W poszczególnych 
punktach nadprzewodnika faza funkcji falowej ma 
wtedy różną wartość. Różnica faz w dwu punktach 
nadprzewodnika oznacza więc, że między tymi punkt- 
tami przepływa prąd par Coopera. Różnica faz funkcji 
falowych występuje również po obu stronach bariery 
w złączu Josephsona. W zjawiskach Josephsona od¬ 
grywa rolę właśnie ta różnica faz, a nie bezwzględne 
wartości samych faz. 

Bezwzględna wartość fazy funkcji falowej jest wiel¬ 
kością bez znaczenia dla zjawisk fizycznych. Wybór 
tej wielkości jest zresztą zupełnie dowolny, gdyż ani 
punkt początkowy (zero na osi *), ani chwila, od któ¬ 
rej rozpoczynamy liczenie czasu, nie są ustalone z gó¬ 
ry. Pod tym względem faza funkcji falowej przypo¬ 
mina potencjał pola elektrycznego: zero potencjału 
jest także umowne. W zjawiskach fizycznych gra rolę 
różnica potencjałów (napięcie), a nie sam potencjał. 
Faza funkcji falowej ma jeszcze tę własność, znaną 
dobrze z ruchu falowego, że może być określona (już 
po wyborze zera) z dokładnością do 2k. Fazy różniące 
się między sobą o całkowitą wielokrotność liczby 2n 
(czyli o 2nn, gdzie n — 1, 2, 3,...) są identyczne. Bez¬ 
względna wartość różnicy faz funkcji falowych może 
się więc zmieniać od 0 do 271. 

stały prąd Jeśli na barierze w złączu Josephsona wytworzy się 
par Coopera stała w czasie różnica faz funkcji falowych (które nie 


422 


muszą być jednakowe po obu stronach bariery), to 
preez barierę płynie stały prąd par Coopera. Oblicze¬ 
nia, których tu przytaczać nie będziemy, wykazują, 
że gęstość prądu tunelowania par j jest uzależniona 
od różnicy faz (p 1 — ę> 2 = O w następujący sposób: 

j = jk sin 0 (4) 

i może przybierać wartości od zera do jk. Maksymalna 
wartość gęstości prądu (;*) wynosi około 10~ 2 A/cm 2 , 
a więc jest tego samego rzędu, co gęstość prądu tune¬ 
lowania elektronów normalnych. 

Bariera w złączu Josephsona zachowuje się jak nad¬ 
przewodnik, gdyż prąd par Coopera, przepływający 
przez nią, nie powoduje spadku potencjału elektrycz¬ 
nego. Gdyby jednak (np. na skutek zwiększenia siły 
elektromotorycznej w obwodzie źródła zasilania) gę¬ 
stość prądu j na barierze wzrosła powyżej wartości jk, 
to na barierze pojawi się napięcie U odpowiadające 
przepływającemu prądowi i oporowi danej bariery 
dla prądu tunelowania elektronów normalnych. Prąd 
stały par Coopera przestanie wtedy płynąć, a przez 
barierę popłynie prąd tunelowy elektronów normal¬ 
nych, czyli na charakterystyce I = f (U) nastąpi prze¬ 
skok od punktu A do punktu B (wzdłuż linii przery¬ 
wanej na rys. 7). Zmniejszenie siły elektromotorycznej 
w obwodzie umożliwia przywrócenie stałego prądu 
Josephsona, przy czym przejście to następuje wzdłuż 


Rys. 7. Charakterystyka 
prądowo-napięciowa złą¬ 
cza Josephsona (dla prądu 
stałego) 



dolnej linii ciągłej, jk jest krytyczną gęstością prądu 
stałego dla złącza Josephsona, tj. maksymalną gęsto¬ 
ścią prądu j y jaki może płynąć przez dane złącze nie 
powodując na nim spadku napięcia. Po pojawieniu się 
napięcia przez złącze może płynąć prąd stały elektro¬ 
nów normalnych i zmienny prąd Josephsona (szersze 
omówienie tego zjawiska zawiera rozdział Zjawiska 
niestacjonarne). 


Kwanty strumienia magnetycznego 

Funkcja falowa par Coopera nie zawsze przedstawia 
falę płaską poruszającą się w jednym tylko kierunku. 
Np. w nadprzewodniku niejednospójnym, czyli 
z otworem, w którym może być uwięziony strumień 
magnetyczny, fala związana z parą Coopera może 
otaczać ten otwór. Oznacza to, że dokoła otworu 
może płynąć prąd par Coopera. Aby w dowolnie 
obranym punkcie w nadprzewodniku faza funkcji 
falowej zachowała swą jednoznaczności, wzdłuż krzy¬ 
wej zamkniętej, otaczającej uwięziony strumień, musi 
się ułożyć całkowita liczba długość fali. Innymi słowy, 
po jednokrotnym okrążeniu uwięzionego strumienia 
faza funkcji falowej może się zmienić tylko o całko¬ 
witą krotność liczby 27t, czyli o 2nn, gdzie n jest liczbą 
całkowitą. 

Prąd par Coopera dokoła otworu nie może się więc 
zmieniać dowolnie, lecz tylko porcjami takimi, aby 
każdej porcji odpowiadała zmiana fazy funkcji falo¬ 
wej o 27t. Zatem i strumień magnetyczny w otworze 
musi się zmieniać porcjami, odpowiadającymi zmia¬ 
nom prądu par Coopera. Porcje (kwanty) strumienia 
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magnetycznego to znane nam już fluksony (-> Nad¬ 
przewodnictwo), równe 2,07-10~ 15 Wb. Zmiana stru¬ 
mienia o jeden kwant odpowiada zmianie fazy o 2jr. 
Liczba n jest równa liczbie kwantów strumienia uwię¬ 
zionego w otworze. Jeżeli nadprzewodniki II rodzaju 
znajdują się w stanie mieszanym, dotyczy to również 
strumienia magnetycznego zawartego w pojedynczym 
fluksoidzie. Doszliśmy więc do wniosku, że kwanto¬ 
wanie strumienia magnetycznego jest również zja¬ 
wiskiem, w którym, oprócz zjawisk Josephsona, od¬ 
grywa rolę zmiana fazy funkcji falowej nośników 
prądu nadprzewodzącego. 


Wpływ pola magnetycznego na prąd 
Josephsona 


Rozpatrzmy przypadek, kiedy złącze Josephsona 
znajduje się w zewnętrznym polu magnetycznym, któ¬ 
rego wektor indukcji B jest skierowany wzdłuż płasz¬ 
czyzny warstwy izolującej. Obierzmy układ współ¬ 
rzędnych jak na rys 8. Wtedy wektor indukcji ma 
kierunek osi z. 



Rys. 8. Złącze Josephsona w zewnętrznym polu magnetycznym 
(z układem współrzędnych) 
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Rys. 9. Obszar wnikania pola magnetycznego w złącze Josephso¬ 
na, gdzie wektor B Jest prostopadły do płaszczyzny rysunku, 
$ głębokość wnikania w nadprzewodnik, d grubość izolatora 


Rys. 9 przedstawia przekrój złącza w płaszczyźnie 

x—y. Wektor indukcji B pola magnetycznego wnika 
w cały obszar warstwy izolującej i częściowo w nad¬ 
przewodnik na głębokość <5. Strumień magnetyczny 
przenikający złącze wynosi zatem O = B(2S-\-d)I> 
gdzie <5 jest głębokością wnikania pola w nadprze¬ 
wodnik, d — grubością warstwy izolującej, / — dłu¬ 
gością warstwy w kierunku osi x. Jeśli pole w złączu 
jest jednorodne, to różnica faz funkcji falowych bę¬ 
dzie się równomiernie zmieniać z odległością * oscy¬ 
lując między wartościami 0i2rc. Liczba oscylacji jest 
równa liczbie m kwantów strumienia magnetycznego 
9 ? 0 mieszczących się w złączu, czyli m — Liczba 
m nie musi tutaj być liczbą całkowitą, ponieważ złącze 
nie ze wszystkich stron jest otoczone nadprzewodni¬ 
kiem i strumień może znajdować się także poza złą¬ 
czem. Rys. 10 przedstawia rozkład gęstości prądu 
Josephsona j — ytsin© wzdłuż płaszczyzny złącza 


dla m = 2,5. Wartość /*, podobnie jak wówczas, gdy 
nie istnieje pole zewnętrzne, jest maksymalną warto¬ 
ścią gęstości prądu, który może przepływać przez dane 
złącze nie powodując pojawienia się na nim napięcia. 



czyzny złącza (oś x jest prostopadła do wektora B pola magne¬ 
tycznego) 


Maksymalne natężenie prądu par Coopera h, któ¬ 
ry może płynąć przez złącze w polu o indukcji B , 
otrzymamy całkując wyrażenie j = jkSinO = f(x) 
po całej czynnej powierzchni złącza. W rozpatrywa¬ 
nym przypadku sprowadza się to do obliczenia pola 
zawartego między sinusoidą j = f(x) i osią x na od¬ 
cinku osi od 0 do / (rys. 10) i pomnożeniu wyniku 
przez długość złącza wzdłuż osi z. Przy sumowaniu 
pól garbów utworzonych przez sinusoidę j = f(x) 
należy pamiętać, aby garbom leżącym pod osią x , 
czyli odpowiadającym ujemnej wartości /, przypo¬ 
rządkować znak minus. 

Łatwo sprawdzić na rys. 10, że wynik całkowania 
(dodawania pól garbów) będzie różny od zera tylko 
wtedy, gdy na długości / ułoży się niejednakowa liczba 
garbów nad osią x i pod osią x. Maksymalne natę¬ 
żenie prądu h będzie tym większe, im większe pole 
między sinusoidą i osią x pozostanie nieskompenso- 
wane, tzn. pozbawione swego partnera z przeciwnym 
znakiem. Łatwo też zauważyć, że im większa liczba 
fluksonów znajdzie się w obrębie złącza, tym mniejsze 
pole na wykresie j = f(x) może pozostać nieskompen- 
sowane i tym słabszy prąd Josephsona może płynąć 
przez złącze. Oczywiście, prąd może płynąć tylko 
wtedy, gdy złącze zostanie włączone w obwód źródła 
prądu. 

Obliczenia wykazują, że maksymalne natężenie 
prądu Josephsona płynącego przez złącze umiesz¬ 
czone w polu magnetycznym można przedstawić na¬ 
stępującą zależnością: 


sinn(<P/<p 0 ) 
(<PM ’ 


(5) 


gdzie & jest strumieniem zawartym w złączu, <p 0 — 
kwantem strumienia. Wykres tej zależności przedsta¬ 
wia rys. 11. Przekroczenie natężenia h spowoduje 
pojawienie się napięcia na złączu i zanik stałego prą¬ 
du Josephsona. I m jest maksymalnym natężeniem 
prądu Josephsona, który może płynąć przez złącze w 
nieobecności pola magnetycznego. 

Na wielkość strumienia magnetycznego w złączu 
możemy wpływać zmieniając natężenie zewnętrznego 



Josephsona od wielkości strumienia magnetycznego w złączu 
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pola magnetycznego. Z powyżej przytoczonych roz¬ 
ważań i z wzoru (5) wynika, że za każdym razem, gdy 
strumień magnetyczny <P w złączu osiąga wartość 
równą całkowitej wielokrotności kwantu strumienia 
<Po> przez złącze nie może płynąć stały prąd par Co¬ 
opera (może natomiast płynąć normalny prąd tunelo¬ 
wy). Kwant strumienia jest więc okresem oscylacji 
maksymalnego natężenia h stałego prądu tunelowego 
par Coopera przez złącze. Dla typowego złącza 
(1x2- 10 _2 cm, <5^5-10 -5 cm ,d<^S) okres ten w jed¬ 
nostkach indukcji magnetycznej jest rzędu IOjiT 
(0,1 Gs). 

dyfrakcja Krzywa h/Im = f(&/<Po) na rys. 11 przypomina 

na złączu krzywą rozkładu natężenia światła w obrazie dyfrak- 
Josephsona cyjnym otrzymanym od jednej szczeliny. Na złączu 
Josephsona występuje więc dyfrakcja funkcji falo¬ 
wych par Coopera. Możemy również obserwować 
zjawiska interferencyjne w dwu połączonych złączach 
Josephsona. 



Interferencja kwantowa 

Zjawisko interferencji fal par elektronowych wystąpi, 
jeśli w obwód prądu włączymy dwa złącza Josephsona 
nadprzewod- połączone z sobą równolegle nadprzewodzącymi roż¬ 
ni ko wy in- gałęzieniami. Schemat takiego urządzenia, zwanego 
terferometr nadprzewodnikowym interferometrem kwantowym, 
kwantowy przedstawia rys. 12. Przyjmijmy dla uproszczenia, że 

a 


b 

Rys. 12. Pierścień nadprzewodzący z dwoma złączami Josephsona 
(nadprzewodnikowy interferometr kwantowy) 


oba złącza są identyczne, a pętla utworzona z dopro¬ 
wadzeń nadprzewodzących ma oś symetrii. Pomińmy 
na razie modulację faz funkcji falowych w samych 
złączach i rozpatrzmy, jak strumień magnetyczny za¬ 
warty w pętli wpływa na maksymalną wartość na¬ 
tężenia prądu Josephsona płynącego przez złącza. 
Oznaczmy ten strumień przez <Pt\ nie musi on być 
całkowitą wielokrotnością fluksonu ę? 0 , ponieważ 
nie jest to strumień uwięziony w nadprzewodniku 
(pętla ma dwa złącza Josephsona, czyli dwie szczeliny 
w nadprzewodzącym materiale, przez które może 
przenikać strumień magnetyczny). Ze strumieniem 
magnetycznym związany jest prąd elektryczny 
o natężeniu 7 0 = 0r/£, krążący w pętli {L — współ¬ 
czynnik samoindukcji pętli). Prąd 7 0 będzie prądem 
nadprzewodzącym, dopóki na barierach nie pojawi 
się napięcie. Zmiana fazy funkcji falowej w nadprze¬ 
wodzącej części pętli, spowodowana przepływem tego 
prądu, po jednokrotnym okrążeniu wynosi 2nm , gdzie 
m jest liczbą fluksonów w strumieniu magnetycznym 
&t, czyli m — <Pt/<Po. Jak już wspominaliśmy, dzięki 
istnieniu szczelin (złącz) w pętli, liczba m nie musi być 
liczbą całkowitą. 

Oprócz cyrkulującego prądu I 0 może jeszcze przez 
pętlę płynąć prąd 7 ze źródła zasilania obwodu. Ze 
względu na symetrię pętli, prąd ten rozdziela się jed¬ 
nakowo na obie jej części (.na rys. 12 górna i dolna) 
tak, że na każdą część .pętli przypada i 7. Prąd / 
w pętli jest prądem nadprzewodzącym, jeśli jego natę¬ 
żenie nie przekroczy pewnej wartości dopuszczalnej. 
Przez pędę popłyną więc następujące prądy: prąd o 
natężeniu -2*7—7 0 przez górną część pętli i prąd o na¬ 
tężeniu £7+7* przez dolną część. Zmiany faz na barie¬ 
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rach a i b , odpowiadające tym prądom, wynoszą 0 a 
i Gi >. Wzory wiążące zmiany faz z natężeniami prądów 
Josephsona mają postać zgodną z zależnością (4): 

i 7— 7 0 = 7 a sin<9a, 

-ł7-f 7 0 = 7&sin0&, 

gdzie I a i h są prądami krytycznymi dla barier a i ó. 
Ponieważ z założenia bariery te są jednakowe, to 
la ~ Ib — 7fc. 

Na całkowitą zmianę fazy funkcji falowej w górnej 
części pętli, na drodze między punktami A i B , składa 
się zmiana fazy 0 a na barierze a oraz zmiana fazy 
w samym nadprzewodniku (A<p) a . Analogicznie w dol¬ 
nej części faza zmieni się o 0b+(A<p)b. Ze względu 
na konieczność zachowania jednoznaczności faz 
w punktach A i B y zmiany w obu częściach pętli mogą 
się różnić tylko o 2nn y gdzie n jest liczbą całkowitą lub 
zerem. Mamy więc: 

&a+(A<p) a — &b+(4<p)b+2nn. (7) 


Mimo symetrii geometrycznej względem prostej 
AB y zarówno zmiany faz na barierach, jak i zmiany 
faz w nadprzewodzących rozwidleniach pętli mogą 
być różne po obu stronach prostej AB y gdyż w obec¬ 
ności strumienia <Pt w obu częściach pętli płyną prądy 
o różnych natężeniach; w jednej części pętli prąd 7 0 
płynie zgodnie z prądem i 7, a w drugiej części — 
przeciwko prądowi \ 7. Na różne zmiany faz w obu 
częściach symetrycznej pętli wpływa więc wartość 
strumienia <$>t wywołującego przepływ prądu 7 0 . 
Wiemy już, że w nadprzewodzących częściach pętli 
przepływ tego prądu spowoduje zmianę fazy o 2nm y 
czyli {A(p) a —(A<p)b — 2nm = 2k(&tI<p 0 )- 
Równanie (7) możemy więc zapisać: 

Oa—Ob = 2 K {~~~—(8) 

albo: 0u— n (~~ “ = ~ w )‘ (9) 

Oznaczając literą & wartość wyrażenia stojącego po 
jednej (którejkolwiek) stronie powyższego równania 
otrzymamy: 

O a — &+k (—- —/z) oraz 0 b — n[- T —n 
Wo / \ <P* 

Po podstawieniu tych zależności do równania (6) do¬ 
dajemy je stronami i po odpowiednich przekształce¬ 
niach równanie ma postać: 


r = 2 h sin $ * cos Jrc * 


Ponieważ zarówno 7jak i h muszą mieć ten sam znak, 
to występujące tu funkcje trygonometryczne muszą 
być albo obie dodatnie, albo obie. ujemne. Można 
więc napisać: 7 = 2/A:[sin#j -|cos[7r(/z—<£ r /^ 0 )), albo, 
po wprowadzeniu oznaczenia 2/fclsin#! = 7 m a X : 


7 

7max 


COS 


n&r 

n 


( 10 ) 


Wykresem tej funkcji jest krzywa przedstawiona na 
rys. 13. Widzimy, że prąd o maksymalnej wartości 
natężenia, nie powodujący jeszcze spadku potencjału 
(napięcia) na złączach, można przepuścić przez pętlę 
wtedy, gdy strumień magnetyczny w pętli jest całko¬ 
witą wielokrotnością fluksonu. Gdy zaś <Pt = 
— (tf-fDPo, nawet bardzo słaby prąd spowoduje 
pojawienie się napięcia. 

Okresem zmian krytycznego natężenia prądu Jo¬ 
sephsona dla pętli, podobnie jak dla pojedynczego 
złącza, jest flukson. Jednak z powodu dużej powierz¬ 
chni pętli w porównaniu z powierzchnią przekroju 
poprzecznego złącza, dla pętli okres ten w jednostkach 













indukcji jest znacznie mniejszy. Jeśli np. pętla ma 
powierzchnię czynną równą 1 cm*, to zmianie stru¬ 
mienia o 1 fiukson odpowiada zmiana indukcji mag- 



Rys. 13. Zależność maksymalnej wartości natężenia prądu pier¬ 
ścienia z dwoma złączami Josephsona od wielkości strumienia 
magnetycznego zawartego w pierścieniu 



Rys. 14. Zależność prądu krytycznego nadprzewodzącego inter¬ 
ferometru kwantowego od zewnętrznego pola magnetycznego 


netycznej o 2 -10" 11 T. Rys. 14 przedstawia wynik na¬ 
łożenia się oscylacji krytycznego prądu Josephsona, 
spowodowanych zmianami strumienia magnetycznego 
w pętli, na oscylacje wywołane zmianami strumienia 
w samych złączach. 

zastosowanie Na prąd Josephsona w pętli wpływają zauważalnie 
interfero- zmiany indukcji magnetycznej nawet sto razy mniej- 
metru sze od okresu tych zmiaa. Za pomocą interferometru 
kwantowego kwantowego można więc mierzyć zmiany indukcji 
wynoszące 10* 13 T. Takiej czułości nie osiąga żaden 
konwencjonalny miernik. Dzięki swej wysokiej czu¬ 
łości na zmiany pola magnetycznego, nadprzewodzący 
interferometr kwantowy służy również do pomiarów 
takich wielkości jak napięcie lub natężenie prądu 
elektrycznego, przy czym jego czułość jest o kilka rzę¬ 
dów lepsza niż przyrządów klasycznych. 


Zjawiska niestacjonarne 

Przepływ stałego prądu Josephsona przez złącze w 
obecności pola magnetycznego i związane z tym zjawi¬ 
ska interferencyjne są zjawiskami ustalonymi w czasie 
(stacjonarnymi). Prócz tych zjawisk Josephson prze¬ 
widział również możliwość przepływu przez złącze 
prądu zmiennego, co zostało później stwierdzone 



Rys. 15. Schemat przejść tunelowych Josephsona: a) bez napięcia 
na złączu (zjawisko stacjonarne), b) z emisją fotonu pod napię¬ 
ciem na złączu (zjawisko niestacjonarne). Pochłonięcie fotonu 
spowoduje przejście w odwrotnym kierunku (wbrew polamo- 
ści źródła napięcia) 


doświadczalnie i nazwane zmiennoprądowym albo zmienno- 
niestacjonarnym zjawiskiem Josephsona. W zjawi- prądowe 
skach stacjonarnych przepływ stałego prądu nadprze- zjawisko 
wodzącego przez złącze nie powoduje na nim spadku Josephsona 
potencjału elektrycznego (napięcia). Przepływ zmien¬ 
nego prądu Josephsona związany jest z pojawieniem 
się napięcia na złączu (rys. 15). 

Jeśli na złączu ustali się stałe w czasie napięcie C/ 0 , 
to energia par Coopera przechodzących precz złącze 
zmieni się o wartość e 1 —s t = qU 0i gdzie q jest ła¬ 
dunkiem pary. Zmiana energii powoduje zmianę fazy 
<Pi -?2 = Inlk^-e^t = qU<f!h (wynika to z zależno¬ 
ści (3)). Różnica faz po obu stronach złącza zmienia 
się więc w czasie, a ponieważ prąd Josephsona zależy 
od różnicy faz, będzie to prąd zmienny. Wyrażenie 
dla gęstości prądu Josephsona otrzymujemy podsta¬ 
wiając w równaniu (4) różnicę faz O = qU 0 tfh: 



Prąd Josephsona płynący przez łącze pod stałym na- złącz© 
pięciem C/ 0 zmienia się więc okresowo z częstością Josephsona 
kołową co = qUjh. Stałe napięcie na złączu Joseph- jako 
sona może zatem generować prąd zmienny. Moc ta- generator 
kiego generatora jest jednak bardzo mała, gdyż naj¬ 
częściej wynosi około 10“ 11 W. 

Między napięciem na złączu a częstością oscylacji 
prądu v = cof2n istnieje następująca zależność liczbo- 

wa: ~ =4- = 483,6 MHz/nV (q = 2e oraz h są sta- 
U 0 h 

łymi uniwersalnymi, a stosunek h/q — <p 0 jest równy 
kwantowi strumienia magnetycznego). Napięcie U 0 
powinno być mniejsze od U — J 2 )/e, gdyż przy 

wyższych napięciach prąd Josephsona szybko zanika, 
wzrasta natomiast prąd tunelowania elektronów nor¬ 
malnych. Stosowana na ogól wartość napięcia U 0 



warstwy 


warstwy tlenku cyny 


Rys. 16. Złącze tunelowe Giaevera 



Rys. 17. Charakterystyka prądowo-napięciowa złącza przed¬ 
stawionego na rys. 16. Krzywa 7 — charakterystyka / = /(*/) 
złącza a — b przy napięciu na złączu 6 —c równym zeru (Ubc = 0); 
krzywa 2 — charakterystyka / = flJJ) złącza a —b przy napięciu 
Uoc * 0 

leży w przedziale od kilku pV do kilku mV, a odpo¬ 
wiadająca tym napięciom częstość może dochodzić 
nawet do tysiąca GHz. Wykrycie prądów tak wielkiej 
częstości jest możliwe dzięki istnieniu pola elektro¬ 
magnetycznego związanego z tym prądem. Doświad¬ 
czenia wykazujące bezpośrednio istnienie takiego po¬ 
la wykonał J. Giaever w 1964 r., używając do tego doświad- 
celu dwu złącz połączonych z sobą wspólną okładziną czeni© 
(rys. 16). Złącza wykonano w sposób następujący. Gia®vera 
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Na podłoże naniesiono warstwę cyny (<z), poddano ją 
długotrwałemu utlenianiu na powierzchni, aby wy¬ 
tworzyć grubą warstwę tlenku, na nią naparowano 
następną warstwę cyny ( b ) z cienką warstwą tlenku 
na powierzchni i w końcu na wierzch naniesiono 
trzecią warstwę cyny (c). Warstwa izolująca między a 
i b była wystarczająco gruba, aby tłumić prąd Jo- 
sephsona, mógł jednak przez nią przepływać prąd 
tunelowy elektronów normalnych wtedy, gdy do a i b 
przyłożono napięcie Uab (rys. 17, krzywa 1). Charak¬ 
terystyka /=/(£/) dla tego złącza zmieniła się po 
przepuszczeniu pod napięciem Ute zmiennego prądu 
Josephsona przez warstwę izolującą między b i c 
(krzywa 2). Na krzywej pojawiły się schodki odpowia¬ 
dające wartościom napięcia Uab = (2 A ± nqUbc))e, 
gdzie 2A jest szerokością przerwy energetycznej dla 
cyny. Szerokość poszczególnych schodków 2Ubc 
odpowiada energii 2eUbc = hco fotonów emitowa¬ 
nych przez złącze Josephsona (bc) i pochłanianych 
w złączu normalnym (ab). 

Skok normalnego prądu tunelowego na wyższy 
schodek następuje za każdym razem, gdy energia fo¬ 
tonów wzrasta o nową porcję, równą qUbc . 
złącze Złącze Josephsona może być również odbiornikiem 
Josephsona energii promieniowania elektromagnetycznego, wy- 
jako tworzonego przez inne źródło, np. generator mikro- 
odbiornik falowy. Mikrofalowe promieniowanie doprowadza 
się do złącza falowodem. Okazuje się, że wtedy oprócz 
zmiennego prądu Josephsona przez złącze może pły- 



napięcie U 

Rys. 18. Schodkowa charakterystyka I =/(£/) złącza Josephsona 
w zmiennym polu elektromagnetycznym 


nąć także stały prąd Coopera, a charakterystyka na- 
pięciowo-prądowa napromieniowanego złącza jest 
schodkowa, jak na rys. 18. 

Doprowadzenie do złącza promieniowania mikro¬ 
falowego o częstości / = Q/2n można potraktować 
jako przyłożenie dodatkowego napięcia przemiennego 
u = UmCosOt (oprócz napięcia stałego U 0 ). Ogólne 
napięcie wyniesie więc U(t) — U 0 +u m cosQt, a po¬ 
nieważ zmiana w czasie różnicy faz 0 związana jest 
z napięciem U(t) zależnością dSjdt = qU(t)/fi, to 
różnica faz będzie równa: 

0 = ~ f mdi=jrU 0 t+3j£-smOt+p, (12) 


gęstość 
prądu 
Josephsona 
w polu 
zmiennym 


gdzie ft jest stałą całkowania (różnica faz dla 1 = 0). 

Po podstawieniu wyrażenia (12) do wzoru (4) ot¬ 
rzymamy równanie dla gęstości prądu Josephsona w 
zmiennym polu elektromagnetycznym: 

y=y*sin(-^H--fg-sinG/+/?). (13) 

Zmienny prąd Josephsona, o częstości własnej co = 
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= qU 0 lh, jest więc modulowany częstością Q obcego 
pola elektromagnetycznego, czyli sama częstość Jo¬ 
sephsona co zmienia się w czasie. Dzięki tej modulacji 
prąd Josephsona zawiera wiele składowych z różnymi 
częstościami. Wśród tych składowych mogą się zna¬ 
leźć również składowe z częstością równą zeru, co 
odpowiada stałej w czasie składowej prądu. 

Stałe składowe prądu Josephsona można obliczyć po 
rozwinięciu równania (13) w szereg Fouriera-Bessela. 
Okazuje się wtedy, że prąd stały płynie każdorazowo. 
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Rys. 19. Stałoprądowe składowe charakterystyki 1 — f(U) 
w niestacjonarnym zjawisku Josephsona, obliczone z równa¬ 
nia (13) 


gdy częstość josephsonowska co = qU 0 jh zrówna 
się z całkowitą krotnością częstości O pola elektro¬ 
magnetycznego. czyli qUJh = nQ. Charakterystyka 
napięciowo-prądowa powinna się więc składać z pio¬ 
nowych kresek, występujących w punktach odpowiada¬ 
jącym napięciom na złączu, równym 0, AJ2/?, 2(hG/q), 
3 (hQ!q) itd. (rys. 19). Różnica między charakterystyką 
I=f(U) obliczoną z równania (13) i wyznaczoną 
doświadczalnie (rys. 18) jest spowodowana tym, że 
w doświadczeniu obserwujemy stały prąd Josephso¬ 
na na tle prądu tunelowego elektronów normalnych, 
które także wzbudzają się pod wpływem promienio¬ 
wania elektromagnetycznego. 

Dzięki opisanym powyżej własnościom złącze 
Josephsona może służyć zarówno jako generator jak 
i detektor promieniowania elektromagnetycznego w 
zakresie mikrofalowym i w dalekiej podczerwieni. 
Innym sposobem wyzyskania złącza Josephsona jest 
określenie absolutnej jednostki napięcia opartej na 
równaniu U = fiQ/q na podstawie badania charaktery¬ 
styki prądu Josephsona; dokładność jej określenia 
zależy od dokładności, z jaką znamy stałe fizyczne 
e i A, oraz od dokładności, z jaką możemy mierzyć 
częstość 0/2n. 

Powyżej przedstawiono tylko niektóre podstawowe 
zjawiska związane z tunelowaniem par Coopera. 
Z braku miejsca pominięto np. rezonansowe wzbudze¬ 
nie stałej składowej nadprzewodzącego prądu własną 
falą elektromagnetyczną, powstałą w złączu w wyniku 
oddziaływania słabego zewnętrznego pola magne¬ 
tycznego (ok. 10" 4 T) na zmienny prąd Josephsona, 
lub zjawiska zachodzące w pierścieniu nadprzewo¬ 
dzącym z jednym złączem Josephsona. Zwłaszcza te 
ostatnie zjawiska mają ważne znaczenie ze względu 
na zastosowanie praktyczne. 

Prąd Josephsona może płynąć nie tylko przez złą¬ 
cze z barierą w postaci cienkiej warstwy izolatora. 
Barierę może stanowić również warstwa półprzewod¬ 
nika albo normalnego metalu (np. miedzi); może być 
nią również przewężenie w samej warstwie nadprze¬ 
wodzącej (mikromostek Dayema) albo kontakt punk¬ 
towy nadprzewodników. Takie miejsca w nadprze¬ 
wodniku, w których występują opisane zjawiska, na¬ 
zywają się słabymi złączami, a zespół tych zjawisk 
nosi nazwę słabego nadprzewodnictwa. 

Zjawisko Josephsona występuje także w nadpłyn¬ 
nym helu. Słabym złączem łączącym dwa naczynia 
z ciekłym helem II jest otwór o średnicy ok. 10 pm 
w cienkim (0,1 mm grubości) metalowym dnie rury 
wstawionej do kriostatu z helem II (rys. 20). W nor¬ 
malnych warunkach poziomy cieczy w obu naczy¬ 
niach (tj. w rurze i w kriostacie) wyrównują się. Jeśli 
jednak pod otworem umieścimy kwarcowy generator 
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Rys. 20. Schemat 
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zjawisko ultradźwięków, to poziom helu II w rurze podniesie 
Josephsona się na wysokość z spełniającą zależność: mgz — nhv , 
w nsdpłyn- gdzie m — masa atomu helu, g — przyśpieszenie ziem¬ 
nym helu 



Rys. 21. Zjawisko Josephsona w nadpłynnym helu. Zależność 
różnicy poziomów od czasu trwania doświadczenia. Strzałka A 
wskazuje moment włączenia oscylatora, strzałka B — chwilę, 
w której zwiększono moc drgań 


skie, v — częstość drgań kwarcu, n — liczba całko¬ 
wita lub stosunek dwu niewielkich liczb całkowitych. 

Rys. 21 przedstawia zależność różnicy poziomów 
z od czasu trwania eksperymentu. Różnica pozio¬ 
mów utrzymuje się bez zmian dopóki nie wzrośnie 
moc oscylatora kwarcowego; wtedy różnica pozio¬ 
mów zwiększa się. Wykres przypomina „schodkową” 
charakterystykę I=f(U) dla złącza Josephsona 
w nadprzewodnikach pod napięciem i w zewnętrznym 
polu elektromagnetycznym. W helu II rolę napięcia 
odgrywa różnica potencjałów grawitacyjnych gz t rolę 
ładunku — masa atomu helu, rolę częstości poia elek¬ 
tromagnetycznego — częstość ultradźwięku. Można 
oczekiwać również innych analogii między zjawiskami 
Josephsona w nadprzewodnikach i w nadpłynnym 
helu, dotychczas jednak, ze względu na trudności 
eksperymentalne, nie były one obserwowane. 

R. P. Feynman i in. Feynmana wykłady z fizyki , t. 3, War¬ 
szawa 1974; J. Raułuszkiewicz Zjawiska tunelowe w nadprze¬ 
wodnikach , Post. Fiz.23, 181 (1972); A. C. Rose-Innes, E. H. Rho- 
deRiCK Nadprzewodnictwo, Warszawa 1973. 


Zastosowanie nadprzewodnictwa 

Eugeniusz Trojnar 


Mimo iż nadprzewodnictwo zostało odkryte w 1911 r., 
na szerszą skalę zaczęto je stosować dopiero od 
1961 r., tj. od czasu, kiedy nauczono się wytwarzać 
stopy i związki nadprzewodzące o wysokich parame¬ 
trach krytycznych. Wyniki badań nad zjawiskami 
Josephsona także rozszerzyły zakres zastosowań nad¬ 
przewodnictwa, głównie w elektronice i technice po¬ 
miarowej. 

Wszystkie podstawowe własności nadprzewodni¬ 
ków, a więc brak oporu elektrycznego, doskonały 
diamagnetyzm oraz zjawiska tunelowe i kwantowanie 
strumienia magnetycznego mogą mieć zastosowanie 
praktyczne. 

Najbardziej oczywistą korzyścią ze stosowania 
nadprzewodników jest możliwość uniknięcia lub 
zmniejszenia strat energetycznych na ciepło Joule*a 
w urządzeniach elektrycznych. Oczywiście, w ogól¬ 
nym rozrachunku ekonomicznym należy uwzględnić 
koszty utrzymania tych urządzeń w odpowiednio 
niskiej temperaturze. 

Niekiedy o celowości zastosowania nadprzewod¬ 
ników w urządzeniach energetycznych decyduje nie 
tylko zysk ekonomiczny. Ważnym czyrmikiem może 
być również możliwość znacznego zmniejszenia roz¬ 
miarów tych urządzeń przy zachowaniu tej samej mo¬ 
cy nominalnej. Ma to szczególne znaczenie tam, gdzie 
rozmiary i ciężar urządzeń odgrywają decydującą 
rolę. , 

W technice pomiarowej dzięki stosowaniu urządzeń 
nadprzewodnikowych udało się polepszyć czułość 
przyrządów pomiarowych o kilka rzędów, a więc 
osiągnąć wyniki, które innymi sposobami były nie¬ 
osiągalne. 

Omówimy w skrócie najważniejsze urządzenia, 
w których stosuje się lub można zastosować nadprze¬ 
wodniki. Zacznijmy od elektromagnesów nadprze¬ 
wodnikowych, gdyż w tej dziedzinie nadprzewodniki 
znajdują obecnie najszersze zastosowanie. 


Elektromagnesy 

nadprzewodnikowe 

W zwykłych elektromagnesach z uzwojeniem mie¬ 
dzianym dla wzmocnienia pola stosuje się zazwyczaj 
elektro- rdzenie żelazne. Ten sposób jest skuteczny tylko wte- 
magnesy dy, gdy pole wytworzone przez uzwojenie jest słabsze 
zwykłe od pola nasycenia rdzenia. W silniejszych polach 


wkład od rdzenia jest stosunkowo niewielki, dlatego 
stosowanie rdzeni staje się nieopłacalne. Najlepsze 
elektromagnesy rdzeniowe mogą wytwarzać pola 
o indukcji do 6 T w wąskiej szczelinie między nad- 
biegunnikami (tj. w przestrzeni o objętości rzędu 
kilku cm 3 ), a ciężar tych elektromagnesów sięga kil¬ 
ku ton. 

Pola silniejsze niż 6 T wytwarzają bezrdzeniowe 
solenoidy z uzwojeniem miedzianym, chłodzone 
wodą. Pobierają one moc rzędu kilku MW, przy 
czym ta moc wydziela się w uzwojeniu i musi być 
odprowadzona na zewnątrz za pomocą odpowiednie¬ 
go systemu chłodzenia. Ciężar miedzianych uzwojeń 
w takich elektromagnesach wynosi kilkaset kilo¬ 
gramów. 

Stosując nadprzewodnikowe uzwojenia w solenoi- solenoidy 
dach (il. 58, tabl. 16) można uzyskać pola o indukcji nadprzewod- 
do 17 T w objętości roboczej rzędu kilkudziesięciu nikowe 
lub nawet kilkuset cm 3 , lub pola 4 T w objętości rzędu 
kilku m 3 . Elektromagnes z uzwojeniem nadprzewo¬ 
dzącym nie rozprasza mocy, koszty jego eksploatacji 
są więc znacznie niższe niż elektromagnesu z uzwoje¬ 
niem normalnym, zwłaszcza przy długich okresach 
pracy. Po uruchomieniu elektromagnesu nadprze¬ 
wodnikowego można końce jego uzwojeń zewrzeć 
krótkim przewodem nadprzewodzącym i trwały prąd 
w uzwojeniach może krążyć już po odłączeniu źródła 
zasilania. Ciężar elektromagnesu nadprzewodniko¬ 
wego zależy od wielkości przestrzeni, w której wytwo¬ 
rzone jest pole. Jeśli ta objętość wynosi ok. 200 cm 3 , 
to na uzwojenia wystarczy kilka kilogramów materia¬ 
łu nadprzewodzącego. Duże elektromagnesy nad¬ 
przewodnikowe do celów specjalnych mogą jednak 
ważyć kilkaset lub nawet kilka tysięcy kilogramów. 

Materiały na uzwojenia elektromagnesów 
nadprzewodnikowych 

Od nadprzewodników, z których wykonuje się uzwo¬ 
jenia elektromagnesów, wymaga się spełnienia nastę¬ 
pujących warunków: 1) muszą one mieć odpowiednio 
wysokie wartości drugiego krytycznego natężenia 
pola magnetycznego Hk 2 w temperaturze pracy, tj. 
przeważnie w temperaturze wrzenia helu pod nor¬ 
malnym ciśnieniem (4,2 K) lub w nieco wyższej tem¬ 
peraturze w wypadku chłodzenia parami helu. 2) mu¬ 
szą przenosić duże gęstości prądu, rzędu kilkuset 
A/mm 2 , w polu o natężeniu zbliżonym do Hk 2 . 

Do produkcji drutów nadprzewodzących używa się 
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stop Nb-Ti najczęściej stopu Nb-Ti, dla którego H k% (4,2 K) = 
= 90 kA/cm, Tjc = 10 K i gęstość prądu nasycenia 
jk (4,2 K) = 0*6- 10 5 A/cm 2 w polu //= 64 kA/cm 
(rys. 1). Przewody na uzwojenia elektromagnesów 
przeważnie wykonane są z wiązki wielu cienkich dru¬ 
tów Nb-Ti, od kilku do kilkudziesięciu jim średnicy, 
skręconych dookoła osi wiązki (skok skrętu ok. 5 mm) 


A/cm ? 



Rys. 1. Zależność 
krytyc 2 nej gęsto¬ 
ści prądów jk od 
natężenia zewnę¬ 
trznego pola ma¬ 
gnetycznego H±, 
dla Nb-Ti i Nb 3 Sn 
w 7’ = 4,2K 



Rys. 2. Zdjęcie szlifu poprzecznego przewodu nadprzewodniko¬ 
wego 


i zaprasowanych w otoczkę (matrycę) z normalnego 
metalu, najczęściej miedzianą (rys. 2). Mała grubość 
i skręcenie drutów nadprzewodzących zapobiegają 
rozprzestrzeniającym się lawinowo w drucie skokom 
strumienia magnetycznego. Takie nagłe zmiany stru¬ 
mienia powodują wydzielanie się ciepła, mogłyby 
więc doprowadzić do lokalnego przegrzania prze¬ 
wodu i do utraty jego nadprzewodnictwa. Normalny 
metal matrycy odgrywa rolę termicznego i elektrycz¬ 
nego stabilizatora chroniącego przewód przed skut¬ 
kami lokalnego przegrzania. Materiał matrycy ma 
znacznie lepsze przewodnictwo cieplne i elektryczne 
niż stop nadprzewodnikowy w stanie normalnym, 
lepiej odprowadza ciepło do kąpieli helowej, a także 
hamuje gwałtowne przeskoki strumienia magnetycz¬ 
nego. 

Ze stopu Nb-Ti wykonuje się uzwojenia dla elek- 
tromagnesów wytwarzających pola o indukcji do 8 T. 

1 Do wytwarzania silniejszych pól (do 17T) sporządza 
się elektromagnesy nawinięte z taśmy hib z drutu, 
związek w skład których wchodzi związek międzymetaliczny 
Nb 3 Sn Nb 3 Sn wykazujący własności nadprzewodzące. Ma 
on następujące parametry krytyczne: /łj,(4,2K) = 
= 160 kA/cm, Tic = 18 K, j k (4,2 K) = 10* A/cm 2 
w polu ok. 110 kA/cm. Związek międzymetaliczny 
Nb 3 Sn jest kruchy i nie daje się walcować ani wy¬ 
ciągać w druty. Przewody z NbsSn wytwarza się me¬ 
todą dyfuzji termicznej cyny w odpowiednio przy¬ 
gotowane druty lub taśmy niobowe. 

Podobne własności nadprzewodzące i mechaniczne 
jak Nb 3 Sn wykazują związki V 3 Ga i V 3 Si. Rozwój 
technologii wytwarzania stopów nadprzewodzących 
może przynieść nowe materiały na uzwojenia: szcze¬ 
gólnie obiecującym materiałem wydaje się być stop 


potrójny Nb 0 ,7» (AI 0 ,73 Ge 0 , 27 )o, 2 t o parametrach kry¬ 
tycznych (4,2 K) = 220 kA/cm, T k = 23 K. 



indukcja magnetyczna 8 0 

Rys. 3. Zależność strat energetycznych w nadprzewodzącej cewce 
z Nb-Ti od amplitudy B 0 przemiennego pola magnetycznego 
o różnej częstości. Objętość uzwojeń 85 cm J 


W projektach zastosowań twardych nadprzewod¬ 
ników w urządzeniach pracujących w zmiennych po** 
lach magnetycznych należy liczyć się ze stratami ener¬ 
getycznymi w tych nadprzewodnikach. Straty te są 
wynikiem ruchu strumienia magnetycznego i nieod¬ 
wracalności procesu namagnesowania (histereza ma¬ 
gnetyczna) nadprzewodnika (rys. 3). 


Laboratoryjne i przemysłowe zastosowanie 
elektromagnesów nadprzewodnikowych 

Elektromagnesy nadprzewodnikowe stanowią obec¬ 
nie powszechne wyposażenie laboratoriów nauko¬ 
wych, w -których bada się własności substancji w sil¬ 
nych polach magnetycznych. Elektromagnesy o dużej 
jednorodności pola stanowią istotną część aparatury 
do rezonansu jądrowego zastępując stare, ciężkie 
elektromagnesy rdzeniowe, wymagające w dodatku 
bardzo stabilnych, a więc drogich źródeł zasilania 
(stabilność pola. w elektromagnesach nadprzewodni¬ 
kowych uzyskuje się w krótkozwartym reżimie pracy, 
a wysoką jednorodność pola — przez specjalne na¬ 
winięcie). 

W mikroskopach elektronowych można stosować 
soczewki magnetyczne z uzwojeniem nadprzewodzą¬ 
cym, co pozwala uzyskać większą zdolność rozdziel¬ 
czą niż przy użyciu zwykłych soczewek magnetycz¬ 
nych. Elektromagnesy nadprzewodnikowe wielkich 
rozmiarów są wykorzystane w fizyce jądrowej do 
komór pęcherzykowych. Np. magnes wodorowej ko¬ 
mory pęcherzykowej w Argonne (USA) ma 4,8 m 
średnicy wewnętrznej, wytwarza pole o indukcji 1,8 T 
i zawiera 45 t uzwojeń nadprzewodzących. W labora¬ 
toriach fizyki wysokich energii buduje się także akce¬ 
leratory cząstek (np. synchrotrony) z dużymi elek¬ 
tromagnesami nadprzewodnikowymi. 

Elektromagnesy nadprzewodnikowe używane są 
również do badań plazmy i, być może, znajdą szersze 
zastosowanie w generatorach magnetohydrodynamicz- 
nych, jeśli rozpowszechnią się one w energetyce. 
W energetyce elektromagnesy nadprzewodnikowe 
mogą także służyć do akumulacji energii (w postaci 
energii pola magnetycznego), która byłaby wyzyskana 
w godzinach szczytowego zapotrzebowania. Solenoid 
nadprzewodzący o współczynniku samoindukcji L 
może zmagazynować w swej objętości energię mag¬ 
netyczną równą 1 / 2 LP, gdzie/jest natężeniem prądu 
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krążącego bez strat w uzwojeniach krótkozwartego 
solenoidu. Zmagazynowaną energię pola magnetycz¬ 
nego można by w godzinach szczytu przetworzyć na 
energię prądu elektrycznego.. 

Obecnie jednak powszechną uwagę skupiają dwie 
inne możliwości szerokiego, przemysłowego zastoso¬ 
wania elektromagnesów nadprzewodnikowych: w ma¬ 
szynach elektrycznych (silnikach i prądnicach) i w 
lewitujących (unoszących się) pociągach. 


Maszyny efektryczne 


Pierwszymi maszynami elektrycznymi, w których za¬ 
stosowano uzwojenia nadorzewodnikowe, były sil- 
maszyny na niki jednobiegunowe, lub jednakobiegunowe, zwane 
prąd stały też unipolarnymi lub homopolarnymi (rys. 4). Ru- 
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Rys. 4. Silnik unipolarny 


chomą częścią takiego silnika jest okrągła tarcza me¬ 
talowa (albo bęben) wirująca w stałym polu magne¬ 
tycznym wytwarzanym przez elektromagnes nadprze¬ 
wodnikowy. Siła napędzająca wirnik jest siłą oddzia¬ 
ływania pola magnetycznego na stały prąd elektrycz¬ 
ny płynący przez tarczę wirnika w kierunku radialnym 
(albo w bębnie po tworzącej). Prąd do wirnika dopro¬ 
wadzają kontakty ślizgowe. 

Silniki jednobiegunowe z uzwojeniem nadprzewod¬ 
nikowym odznaczają się prostotą konstrukcji i ma¬ 
łymi rozmiarami przy stosunkowo dużej mocy. Straty 
energetyczne są mniejsze niż w silnikach konwencjo¬ 
nalnych. Trudnym zagadnieniem technicznym jest tu 
jednak problem kontaktów ślizgowych, doprowa¬ 
dzających prąd o dużym natężenki, gdyż są to silniki 
niskonapięciowe. Dla zwiększenia napięcia (i zmniej¬ 
szenia natężenia prądu) stosuje się układ wielu tarcz 
połączonych w szereg. Każdy silnik może być także 
prądnicą, jeśli z kontaktów będziemy pobierać prąd 
w zamian za energię mechaniczną poruszającą wirnik. 

Nadprzewodnikowe maszyny jednobiegunowe znaj¬ 
dują zastosowanie w przemyśle chemicznym do elek¬ 
trolizy, w układach napędzających pompy wodne, 
walcarki lub młyny w przemyśle hutniczym, górni¬ 
czym, papierniczym; dzięki dobremu stosunkowi mo¬ 
cy do ciężaru mogą także służyć do napędu statków 
i okrętów. 

maszyny Nadprzewodzące uzwojenia można także stosować 
na prąd w magneśnicach maszyn prądu przemiennego. Wirnik 
przemienny synchronicznej prądnicy z uzwojeniem nadprzewo¬ 
dzącym, zasilany prądem stałym, wytwarza stałe po¬ 
le magnetyczne, wirujące wewnątrz nieruchomego 


twornika* (stojana) i wzbudza w jego uzwojeniach prąd 
przemienny. Przy tej samej prędkości wirowania moc 
prądnicy jest proporcjonalna do indukcji magnetycz¬ 
nej w szczelinie między wirnikiem i stojanem. W kon¬ 
wencjonalnych prądnicach indukcja sięga 1 T; dal¬ 
sze jej zwiększanie jest utrudnione z powodu nasyce¬ 
nia żelaza. Nadprzewodzące uzwojenia wirnika 
umożliwiają zwiększenie indukcji do 4 T bez zastoso¬ 
wania żelaznego rdzenia, a więc przy zmniejszonych 
rozmiarach i masie wirnika. Uzwojenia stojana takiej 
prądnicy wykonuje się jednak z normalnego metalu, 
tj. z miedzi, gdyż zastosowanie nadprzewodzących 
uzwojeń pracujących w silnym zmiennym polu ma¬ 
gnetycznym byłoby związane ze znacznymi stratami 
energetycznymi w tych uzwojeniach, porównywalny¬ 
mi ze stratami w uzwojeniach miedzianych. 

Unoszone magnetycznie pociągi 
(magnetoplany) 

Intensywne prace badawcze dotyczące pociągów uno¬ 
szonych magnetycznie prowadzą kraje, w których 
sprawa szybkiego transportu osób jest palącym za¬ 
gadnieniem (Japonia, USA, RFN). . Prędkość, jaką 
osiągają najszybsze zwyczajne pociągi, nie przekracza 
na ogół 250 km/h. 

Czynnikami ograniczającymi szybkość pociągu są. 
wibracje i słaba przyczepność kół do szyn. Tor, po 
którym jedzie szybki pociąg, musi spełniać bardzo 
wysokie wymagania dotyczące jakości. Pociąg uno¬ 
szący się nad torem pozwala ominąć te trudności. 

Obecnie przeprowadzane są próby z doświadczalnymi 
pojazdami, unoszonymi magnetycznie. 

Przy małych prędkościach pociąg jedzie po torze, magnetoplan 
ale już przy prędkości 90 km/h unosi się nad torem 



Rys. 5. Zależność siły unoszenia od prędkości magnctoplanu 


magnesy nadprzewodnikowe 
liniowego silnika 
synchronicznego 


podłoga wagonu 



magnesy 
nadprzewodnikowe nośne 


płozy (ślizgi) 
lub koła 


uzwojenia „stojana” 
liniowego silnika synchronicznego 
(cewki z metalu normalnego) 

Rys. 6. Przekrój poprzeczny magnetoplanu 
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na wysokości około 30 cm (rys. 5). W podwoziu po¬ 
ciągu umieszczone są elektromagnesy nadprzewodni¬ 
kowe, których pole magnetyczne, poruszając się wraz 
z pociągiem, wzbudza prądy wirowe w metalowych 
płytach (lub cewkach) ułożonych na torze. Pole ma¬ 
gnetyczne tych prądów jest lustrzanym odbiciem pola 
elektromagnesów. Siła odpychania między tymi po¬ 
lami jest siłą unoszącą pojazd (rys. 6). 
silnik Siłę napędową, poruszającą pociąg do przodu, do- 
liniowy starcza liniowy synchroniczny silnik elektryczny, 
synchro- Silnik ten jest właściwie zwykłym silnikiem synchro¬ 
niczny nicznym ze stojanem rozwiniętym w linię. Rolę jego 
wirnika spełniają dodatkowe boczne elektromagnesy 
nadprzewodnikowe, umocowane sztywno w pojeździe. 
Stojan silnika to uźwojenia miedziane lub aluminio¬ 
wa, ułożone wzdłuż toru pojazdu. Prąd elektryczny 
zasilający silnik jest włączany synchronicznie z ru¬ 
chem pojazdu w obwód coraz to nowych segmentów 
stojana znajdujących się nieco przed pojazdem i wy¬ 
łączanych przy mijaniu danego segmentu przez po¬ 
jazd. Biegnące pole magnetyczne wytwarzane przez 
prąd w tych segmentach pociąga za sobą elektromag¬ 
nesy boczne pojazdu, czyli wirnik silnika. W ten spo¬ 
sób pojazd jest prowadzony przez biegnącą falę mag¬ 
netyczną. Elektromagnesy silnika, oprócz funkcji 
napędowej, pełnią jeszcze funkcję stabilizatorów, tj. 
utrzymują pojazd nad środkiem toru. 

Magneśnicę silnika i elektromagnesy nośne pojazdu 
zasila prądnica umieszczona w pojeździe i napędzana 
np. turbiną spalinową. Doświadczalny pojazd osiąga 
prędkość 500 km/h, zabiera 100 pasażerów z bagażem 
(ok. 101) i waży 351 z pełnym wyposażeniem i zapasem 
paliwa na dwie godziny jazdy. Przy maksymalnej 
prędkości pojazd pobiera moc rzędu kilku MW; jest 
ona w głównej mierze zużywana na pokonanie opo¬ 
rów aerodynamicznych (il. 62, tabl. 16). 


Nadprzewodnikowe linie 
przesyłowe (kable) 


Kable nadprzewodnikowe mogą zastąpić napowietrz¬ 
ne linie przesyłowe. Przesyłanie wielkich mocy nor¬ 
malnymi liniami napowietrznymi wymaga stosowania 
wysokich napięć, lecz zwiększanie napięcia wiąże się 
ze wzrostem strat energetycznych na upływ i ulot. 

Kable nadprzewodnikowe stwarzają możliwość 
przysyłania bez strat prądu stałego lub przemiennego 
o dużym natężeniu. Należy tylko liczyć się z wydatko¬ 
waniem energii na utrzymywanie kabla w niskiej tem¬ 
peraturze. Straty na odbieranie doprowadzonego 
z zewnątrz ciepła mogą wynosić ok. 10 W na 1 km 
długości kabla. 

kable prądu Kable prądu stałego można wykonać z twardego 
stałego nadprzewodnika II typu. Ze względu na koszt chło¬ 
dzenia kabla, jego zastosowanie może być opłacalne 
dopiero przy przesyłaniu bardzo dużych mocy (po¬ 
nad 100 MW). Przy odpowiednim doborze nadprze¬ 
wodnika, obciążenie kabla prądem stałym mogłoby 
wynosić ok. 10 5 A/cm 2 . 

Nadprzewodnikowy kabel prądu stałego włączony 
w istniejący system energetyczny prądu przemiennego 
wymagałby zastosowania przetworników na obu 
swych końcach. 

kable prądu Do przesyłania bez strat prądu przemiennego można 
przemień- użyć kabla z nadprzewodnika I typu lub doskonałego 
nego nadprzewodnika II typu pod warunkiem, że amplitu¬ 
da natężenia pola wytw-orzonego przez prąd w kablu 
nie przekroczy wartości Hk x (rys. 7). Ponieważ kabel 
musi pracować w temperaturze nie niższej niż 4,2 K 
(dalsze obniżanie temperatury wiąże się z dużymi 
kłopotami technicznymi), mogą być użyte tylko dwa 
metale: ołów i niob (stopy na ogół mają małe war¬ 
tości Hk l i trudno z nich wykonać doskonały nad¬ 
przewodnik). Prąd przemienny w kablu z nadprze¬ 


wodnika I typu popłynie tylko po jego powierzchni, 
dlatego w takich kablach najkorzystniejsze byłoby 
zastosowanie cienkiej warstwy nadprzewodnika na¬ 
niesionej na nienadprzewodzące podłoże. 

zewnętrzny płaszcz 



Rys. 7. Przekrój poprzeczny kabla nadprzewodnikowego 


Ostatnio jednak pojawiają się projekty zastosowa¬ 
nia w kablach na trójfazowy prąd przemienny nad¬ 
przewodników' twardych, np. Nb-Ti lub Nb 3 Sn, gdyż 
kable z nich wykonane bardziej nadają się do przesy¬ 
łania dużych mocy, a straty nie powinny przekraczać 
0,5% (kable pracują w niezbyt silnym polu własnym). 

Można by więc osiągnąć sprawność równą 99,5%, 
czyli znacznie większą niż w normalnych liniach prze¬ 
syłowych (95%). 

Chłodzenie kabli nadprzewodnikowych o dużej chłodzenie 
długości jest jednak trudnym problemem technicz- kabli 
nym, dlatego wprowadzenie ich do systemów energe¬ 
tycznych nie będzie chyba sprawą najbliższej przysz¬ 
łości. Obecnie stosuje się je raczej w zamkniętych 
układach energetycznych, np. na statkach. 


Zastosowanie nadprzewodników 
w technice wielkich częstości 

Opór powierzchniowy nadprzewodników 

W stanie Meissnera (tzn. w stanie czysto nadprzewo¬ 
dzącym) nadprzewodnik w szybkozmiennym polu 
elektromagnetycznym wykazuje różny od zera opór 
powierzchniowy, gdyż w T > 0 oprócz par Coopera 
istnieją w nadprzewodniku elektrony normalne, które 
rozpraszają energię, podobnie jak w metalach normal¬ 
nych. Jednak w nadprzewodnikach głębokość wnika¬ 
nia S pola elektromagnetycznego daleko od Tk jest 
dużo mniejsza niż grubość warstwy naskórkowości 
ćskin w normalnym metalu przy wysokich częstościach, 
poza tym udział elektronów normalnych szybko ma¬ 
leje ze spadkiem temperatury poniżej 7*; oba te czyn¬ 
niki powodują, że opór powierzchniowy nadprze¬ 
wodników jest znacznie mniejszy niż opór powierz¬ 
chniowy normalnych metali. 

Przy bardzo wielkich częstościach, gdy energia 
fotonów pola elektromagnetycznego przekracza sze¬ 
rokość przerwy energetycznej (hv ^ 2 A), opór po¬ 
wierzchniowy zwiększa się w wyniku pochłaniania 
energii pola na rozrywanie par Coopera i wzbudzenie 
elektronów ponad przerwę energetyczną. Rys. 8 
przedstawia zależność oporu powierzchniowego nad- 
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zależność 
oporu od 
częstości 
i tempera¬ 
tury 


przewodnika od częstości pola elektromagnetyczne¬ 
go v i od zredukowanej temperatury t = TjTk. Po¬ 
nieważ w temperaturze T = 0 szerokość przerwy 
2 A (0) = 3,5kTk, opór powierzchniowy nadprze- 



energia w jednostkach kT k 

Rys. 8. Opór powierzchniowy nadprzewodnika I typu (Al) 
w zmiennym polu elektromagnetycznym; Rs oznacza opór po¬ 
wierzchniowy w stanie nadprzewodzącym, R n — w stanie nor¬ 
malnym 


wodnika z Th x 10 K będzie różny od zera dopiero 

przy v > 10 n Hz. . 

Nadprzewodniki II typu w stanie mieszanym albo 
nadprzewodniki niedoskonale, w które wnika pole 
magnetyczne począwszy od niewielkich wartości na¬ 
tężeń, wykazują w zmiennym polu straty na histerezę 
i na prądy wirowe. Aby uniknąć tych strat, w tech¬ 
nice wysokich częstości stosuje się tylko czyste nad¬ 
przewodniki o możliwie wysokiej wartości tempera¬ 
tury krytycznej Tu. Najczęściej są to: niob 7* = 9 K 
i ołów Tk — 7,2 K. 


Przyspieszanie liniowe 

Nadprzewodnikowe wnęki rezonansowe znajdują 
obecnie zastosowanie w liniowych akceleratorach na¬ 
ładowanych cząstek (np. elektronów). Akcelerator 
liniowy składa się z wielu komór rezonansowych po¬ 
łączonych w szereg (rys. 9). Pole elektromagnetyczne 
w każdej z wnęk zmienia się okresowo, a faza^ drgań 
pola w sąsiednich wnękach różni się o tt/ 2. Nałado¬ 
wana cząstka, jeśli dostanie się do kanału akcelerato¬ 
ra, będzie poddawana w każdej wnęce działaniu pola akcelerator 
elektrycznego. Aby to pole mogło zwiększać energię nadprze- 
cząstki, musi ona trafiać do wnęki w odpowiedniej wodmkowy 


linie pola elektrycznego 



skupiska 


przyspieszonych cząstek 

Rys. 9. Schemat nadprzewodnikowego liniowego akceleratora 

fazie drgań pola, czyli czas przelotu cząstki od jednej 
wnęki do drugiej musi się równać 7a okresu drgań. 

Ponieważ trudno jest zwiększać stopniowo często¬ 
ści drgań pola ze wzrostem szybkości cząstki, działa¬ 
niu pola poddawane są cząstki już przyśpieszone do 
prędkości bliskiej prędkości światła.. Działanie akce¬ 
leratora sprowadza się wtedy do zwiększania energii 
cząstki przez zwiększenie masy relatywistycznej. 


Zastosowanie doskonałego 
diamagnetyzmu 


Łożyska beztarciowe 


anomalne 

zjawisko 

naskórko- 

wości 


Wnęki rezonansowe wysokiej dobroci 

Dobrocią wnęki rezonansowej nazywamy stosunek 
zmagazynowanej w niej energii pola elektromagne¬ 
tycznego w ciągu jednego cyklu do energii rozpro¬ 
szonej na ścianach wnęki. Wnęka miedziana przy 
częstościach rzędu 1 GHz może w normalnej tempe¬ 
raturze mieć dobroć Q = 5«10 4 . Oziębienie wnęki do 
temperatury ciekłego helu, chociaż zmniejsza opor 
właściwy czystej miedzi kilkaset razy, jej dobroć 
zwiększy tylko kilkakrotnie z powodu anomalnego 
zjawiska naskórkowości. Zjawisko to występuje wte¬ 
dy, gdy średnia długość / drogi swobodnej elektronu, 
od której zależy przewodnictwo metalu, staje się.więk- 
sza od grubości warstwy naskórkowości 4 kia (jest to 
warstwa, w którą wnika zmienne pole elektromagne¬ 
tyczne). Wtedy elektrony poruszające się w głąb me¬ 
talu nie mogą być przez pole przyśpieszone na całej 
swej drodze między kolejnymi zderzeniami i dla prze¬ 
wodnictwa są właściwie stracone. Anomalne zjawisko 
naskórkowości ogranicza więc zwiększanie się prze¬ 
wodnictwa powierzchniowego metali przy oziębianiu. 

Inaczej sprawa przedstawia się w przypadku ścia¬ 
nek z nadprzewodnika. Opór powierzchniowy, cho¬ 
ciaż różny od zera przy wysokich częstościach, jest 
jednak znacznie mniejszy niż w normalnych metalach, 
straty energetyczne są nieznaczne i dobroć wnęki 
może sięgać 5-10® przy tej samej częstości 1 GHz. 
Dobroć wnęki jest funkcją częstości; dla metalu nor¬ 
malnego Q ~ \/v, dla nadprzewodnika Q ~ l/v. Jako 
zależność materiału na ściany wnęki używa się najczęściej oło- 
dobroci od wiu lub niobu, na ogół w postaci cienkiej warstwy 
częstości naniesionej na miedziane podłoże. 


Nadprzewodnikowe łożyska beztarciowe działają na 
zasadzie unoszenia nadprzewodnika przez pole ma¬ 
gnetyczne. Siła działająca na jednostkę powierzchni 
nadprzewodnika ze strony pola magnetycznego, czyli 
ciśnienie magnetyczne, wynosi P = 7a^o#7 gdzie H 

_natężenie pola przy powierzchni nadprzewodnika. 

Natężenie to nie może nigdzie przekraczać wartości 
ff kl . Stąd maksymalna wartość P w wypadku nad¬ 
przewodnika wykonanego np. z niobu może wynosić 
15 000 N/m 2 w T = 0 lub 11 000 N/m 2 w T = 4,2 K. 

Beztarciowe łożyska można by zastosować w nad- nadprzewod- 
przewodnikowych maszynach elektrycznych, np. nikowy 
w generatorach prądu przemiennego. Dotychczas żyroskop 
jednak łożyska te znalazły zastosowanie jedynie w 
nadprzewodnikowym żyroskopie. Żyroskop taki jest 
to kula z nadprzewodzącego niobu podtrzymywana 
w próżni przez pole magnetyczne prądów niezanika- 
jących, krążących w dwóch nadprzewodzących pier¬ 
ścieniach. Kula wiruje z prędkością kątową kilkuset 
obrotów na minutę, praktycznie bez strat energii. 

Oś obrotu kuli można obserwować przy pomocy 
przyrządów optycznych. W ruch obrotowy 
nadprzewodzącą kulę wprowadza się stycznymi do 
jej powierzchni strumieniami chłodnego gazowego 
helu. Po nadaniu kuli odpowiedniej prędkości kąto¬ 
wej przestrzeń, gdzie wiruje kula, odpompowuje się 
do wysokiej próżni. 

Ekrany magnetyczne 

Ponieważ ani stałe, ani zmienne pole magnetyczne 
nie wnika w nadprzewodnik (z wyjątkiem cienkiej 


































warstwy powierzchniowej), można w nadprzewodzą¬ 
cej osłonie utrzymać przestrzeń wolną od pól magne¬ 
tycznych. Najkorzystniejszym kształtem dla takiej 
osłony (ekranu) jest kształt elipsoidalny, gdyż wtedy 
linie sił pola łagodnie opływają przeszkodę. Jeśli ekran 
nadprzewodnikowy ma osłaniać przestrzeń roboczą 
od stałego pola magnetycznego, przed jego oziębie¬ 
niem do T < T k należy w miejscu, gdzie następuje 
oziębianie, skompensować możliwie najdokładniej 
zewnętrzne pole magnetyczne, aby nie spowodować 
jego zamrożenia wewnątrz ekranu. 

Nadprzewodnikowe ekrany stosuje się najczęściej 
do osłaniania niskotemperaturowych części czułych 
przewodów pomiarowych od wpływu zewnętrznych 
pól elektromagnetycznych. 


Zastosowania w elektronice, 
technice pomiarowej 
i obliczeniowej 


Galwanometry i woltomierze 

Pomiar słabych napięć stałych konwencjonalnymi 
przyrządami sprawia wiele kłopotów z powodu sił 
termoelektrycznych, powstających w obwodzie pomia¬ 
rowym, oraz szumów cieplnych w przyrządach po¬ 
miarowych, ograniczających ich czułość. Zastosowa¬ 
nie nadprzewodników pozwala na uniknięcie tych 
przeszkód (siły termoelektryczne w stanie nadprze¬ 
wodzącym są równe zeru, a szumy cieplne w tempera¬ 
turze ciekłego helu są bardzo małe). W przypadku 
zmiennych napięć, osłonięcie niskotemperaturowej 
części urządzenia pomiarowego ekranem nadprze¬ 
wodnikowym i zastosowanie nadprzewodnikowych 
transformatorów wzmacniających sygnał umożliwia 
zmniejszenie szumów do poziomu nieosiągalnego tra¬ 
dycyjnymi metodami. 

gałwanometr Pierwszą próbą zastosowania nadprzewodników 
z nadprze- w przyrządach pomiarowych było skonstruowanie 
wodzącą w 1952 r. galwanometru z nadprzewodnikową cewką, 
cewką Dzięki temu można było zmniejszyć opór całego ob¬ 
wodu do 10- 7 n. Aby przy tak małym oporze R stała 
czasowa z przyrządu nie przekraczała sensownej war¬ 
tości (r = Lct/R ), indukcyjność efektywna (Lei) ob¬ 
wodu powinna być również bardzo mała. Cewka mia¬ 
ła więc tylko jeden zwój, a indukcja stałego pola gal¬ 
wanometru wynosiła zaledwie 10~* T. Galwanometr 
miał stałą czasową z — 15 s, a czułość prądowa wy¬ 
nosiła 10~ 5 A, co odpowiada czułości napięciowej 
10~ 7 Cl- 15~ 5 A = 10 -12 V. Dla porównania przytoczy¬ 
my, że najczulsze galwanometry konwencjonalne przy 
takiej samej stałej czasowej mają czułość napięciową 
rzędu 10~ 8 V. 

nadprzewod- Inny typ nadprzewodnikowego urządzenia do po- 
n i ko wy nuaru bardzo słabych napięć stałych skonstruowano 
przerywacz w 1955 r.Jest to nadprzewodnikowy przerywacz (mo¬ 
dulator) w niskoomowym obwodzie mierzonego na¬ 
pięcia, działający podobnie, jak mechaniczny wibra¬ 
tor (czoper) w konwencjonalnych miernikach napię¬ 
cia stałego. Przerywaczem jest cienki drucik nadprze¬ 
wodzący, przechodzący okresowo w stan normalny 
(czyli przerywający obwód) pod wpływem pola mag¬ 
netycznego, zmieniającego się sinusoidalnie z czę¬ 
stością 800 Hz. Działanie przerywacza sprowadza się 
do zamiany mierzonego napięcia stałego na napięcie 
pulsujące, które po wzmocnieniu nadprzewodniko¬ 
wymi transformatorami można mierzyć normalnymi 
przyrządami. Poziom szumów własnych przyrządu 
udało się zmniejszyć do 10~ n V. Stała przyrządu jest 
rzędu 1 s. Przyrząd nadaje się do pomiaru słabych 
sił elektromagnetycznych ze źródeł z małym oporem 
wewnętrznym lub do pomiaru małych oporów (opór 
reszty obwodu, oprócz przerywacza, musi być znacz¬ 
nie mniejszy od oporu przerywacza w stanie normal¬ 
nym). 
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Stosunkowo niedawno (1967 r.) zbudowano przy- pikowolto- 
rząd z wibrującymi cewkami do pomiaru napięć sta- mierz 
łych (rys. 10) o czułości do 10~ 13 V. Seryjna wersja z wibrującymi 

cewkami 

do mikrowoltomierza 
napięcia zmiennego do oscylatora 
piezokwarcowego 



Rys. 10. Schemat nadprzewodnikowego pikowoltomicrza na na¬ 
pięcie stałe, z wibrującymi cewkami 


tego przyrządu (dostępna w handlu) ma czułość 
10~ 12 V i stałą czasową rzędu kilku s. Para cewek nad¬ 
przewodzących połączona ze źródłem mierzonego 
napięcia stałego jest pobudzona do drgań przez ge¬ 
neratory piezokwarcowe, oscyluje z częstością 1 kHz 
między nieruchomymi nadprzewodzącymi cewkami 
pomiarowymi i wzbudza w nich napięcie przemienne, 
a to zaś po wzmocnieniu może być mierzone kon¬ 
wencjonalnymi metodami. 

Obecnie bardzo często do pomiarów bardzo sła¬ 
bych napięć używa się tzw. nadprzewodnikowych 
interferometrów kwantowych, których działanie 
opiera się na zjawiskach Josephsona. Urządzenia te 
wykorzystuje się również przy pomiarach słabych 
zmian pola magnetycznego, dlatego woltomierze 
działające na tej zasadzie będą omówione łącznie 
z magnetometrami. 


Magnetometry 

Do pomiaru bardzo małych zmian pola magnetycz- nac j prz0 . 
nego można wyzyskać nadprzewodnikowy interfero- wodnikowy 
metr kwantowy w kształcie pierścienia z dwoma złą- interferometr 
czarni Josephsona. Zmiany pola powodują zmiany kwantowy 
prądu krytycznego w pierścieniu, a więc i zmiany na- z dwoma 
pięcia na nim, te zaś łatwo można zmierzyć. Taki 2 f ączam i 
przyrząd umożliwia wykrycie zmian indukcji magne¬ 
tycznej rzędu 10~ 13 T. Czułość przyrządu mośna po¬ 
lepszyć przez zastosowanie transformatora nadprze- 


transformator 



wzmocnienie = Lyf L 2 

Rys. 11. Schemat nadprzewodnikowego interferometru kwanto¬ 
wego z transformatorem wzmacniającym 


wodnikowego na wejściu (rys. 11). Jeśli zmiany pola 
są większe niż okres zmian krytycznego natężenia 
prądu dla interferometru kwantowego (-* Zjawiska 
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tunelowe w nadprzewodnikach), to pomiar tych zmian 
sprowadza się do liczenia okresów, czyli kwantów 
strumienia magnetycznego wchodzących do pier¬ 
ścienia lub wychodzących z niego. Niektórym bada¬ 
czom udało się takim przyrządem naliczyć aż 2000 
oscylacji krytycznego natężenia prądu. 

Opracowano również nadprzewodnikowy interfero¬ 
metr kwantowy z jednym złączem, który pracuje na 
prądzie zmiennym o częstości radiowej. Jego czułość 
jest tego samego rzędu, co interferometru stałoprą- 
dowego z podwójnym złączem, ale umożliwia on 
wzmocnienie sygnału wyjściowego w temperaturze 
ciekłego helu, a więc bez zwiększania poziomu szu¬ 
mów. Wzmocnienie następuje przez sprzężenie inter¬ 
ferometru z obwodem LC , zanurzonym w kąpieli 
helowej (rys. 12). W obwodzie tym płynie prąd i 0 



Rys. 12. Schemat zmiennoprądowego interferometru kwantowego 


o częstości rezonansowej. Zmiany strumienia magne¬ 
tycznego w obrębie pierścienia interferometru powo¬ 
dują zmiany krytycznego natężenia prądu pierście¬ 
nia i modulują amplitudę napięcia w obwodzie LC 
z okresem modulacji równym zmianie strumienia 
o 1 kwant. Dla wzmocnienia sygnału można też zasto¬ 
sować transformator nadprzewodnikowy na wejściu. 

Odmianą transformatora nadprzewodnikowego 
jest gradiometr (rys. 13), służący do pomiaru bardzo 
małych gradientów pola magnetycznego. Gradiometr 



Rys. 13. Schemat 
gradiometru 


składa się z dwu jednakowych cewek nadprzewo¬ 
dzących, nawiniętych w przeciwnych kierunkach i po¬ 
łączonych nadprzewodzącymi przewodami. Zmiany 
w czasie jednorodnego pola magnetycznego nie 
wzbudzają w gradiometrze prądu, ponieważ prądy 
z obu cewek kompensują się do zera. Różny od zera 
prąd w obwodzie cewek popłynie tylko wówczas, gdy 
zajdą przestrzenne zmiany pola magnetycznego. Syg¬ 
nał z cewek przekazuje się do magnetometru przez 
sprzężenie indukcyjne. 

Czułe magnetometry służą do pomiarów bardzo 
słabych zmian wielkości magnetycznych. Mierzy się 
nimi podatność magnetyczną ciał w słabych polach 
magnetycznych albo fluktuacje podatności magnetycz¬ 
nej nadprzewodników w pobliżu temperatury prze¬ 
miany 7*. Magnetometry takie można stosować do 
pomiaru małych przesunięć w ciele magnetycznym 
przy wykrywaniu fal grawitacyjnych. Podejmowano 
również z ich pomocą próby wykrycia kwarków. 
Tego typu magnetometr może być także używany 
w medycynie i biologii, np. do wykonania magneto- 
kardiogramu (tzn. do rejestrowania słabych zmian 
pola magnetycznego wywołanych pracą serca) lub 
do badania bioprądów w żywych organizmach za po¬ 
średnictwem wytwarzanych przez nie pól magne-^ 
tycznych. 

Magnetometr można zamienić na woltomierz 
sprzęgając go indukcyjnie z obwodem mierzonego 
napięcia (rys. 14). Napięcie U x wywoła w obwodzie 


z oporem R prąd o natężeniu /, który wytworzy 
w pętji o indukcyjności L strumień magnetyczny #. 
Strumień# przenika pierścień magnetometru i po-* 



Rys. 14. Schemat woltomierza nadprzewodnikowego 


woduje zmianę krytycznego natężenia prądu pier¬ 
ścienia (/*), a więc zmianę napięcia na pierścieniu £/ 0 . 
Aby stała czasowa przyrządu była możliwie niewielka, 
pętla powinna mieć małą indukcyjność (mało zwo¬ 
jów). Jeśli jest tylko jeden zwój, a czułość magneto¬ 
metru jest równa dziesiątej części fluksonu (10~ 16 Wb), 
to przy stałej czasowej 1 s czułość napięciowa wynie¬ 
sie 10~ 18 V. Zwykle nie udaje się osiągnąć tej czułości, 
gdyż szum napięciowy na oporze R — L/z ^ 10 -8 
w temperaturze T — 4,2 K wynosi ok. 10~ 15 V. 


Generatory i detektory 

Złącze Josephsona pod stałym napięciem U gene¬ 
ruje monochromatyczne i spójne promieniowanie 
elektromagnetyczne w zakresie mikrofalowym i w da¬ 
lekiej podczerwieni, tj. w przedziale częstości od 5 do 
1000 GHz. Częstość promieniowania v zależy od na¬ 
pięcia (? = 2 eU/h). Największa dotychczas osiągnię¬ 
ta moc promieniowania wyniosła 10~ 9 W. Przypusz¬ 
cza się jednak, że będzie można uzyskać 10~ 7 W, 
a może nawet 10 -8 W. Szerokość linii może być 
mniejsza niż 1 kHz dla częstości 10 GHz, co stanowi 
mniej niż 10 -7 . 

Złącze Josephsona może być również detektorem 
promieniowania. Pochłaniane promieniowanie pro¬ 
wadzi do wystąpienia schodków na charakterystyce 
prądowo-napięciowej złącza. Taki detektor jest rów¬ 
nocześnie częstościomierzem, ponieważ napięcia, 
przy których pojawiają się schodki, wynoszą U = 
= (nhvj2e), gdzie /zjest liczbą całkowitą. Czułość 
złącza dochodzi do 10 -10 W. 

Większą czułość (10~ 13 W dla v = 70 GHz) de¬ 
tektora uzyskuje się nie przy wyznaczaniu charaktery¬ 
styki schodkowej, lecz przy pomiarze zmiany maksy¬ 
malnego natężenia prądu Josephsona pod wpływem 



temperatura T 

Rys. 15. Zmiana oporu nadprzewodzącej cyny pod wpływem 
nagrzania (Rn opór w stanie normalnym) 


promieniowania. Promieniowanie periodycznie prze¬ 
rywa się wirującą przesłoną i mierzy się zmiany prądu 
miernikiem czułym na fazę. 


woltomierz 
nad przewód 
nikowy 


generatory 


detektory 
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bolometr Do detekcji promieniowania może służyć również 
dprzewod- zwykłe złącze tunelowe (-► Zjawiska tunelowe w nad- 
nikowy przewodnikach — zjawiska niestacjonarne), a także 
zwykły nadprzewodnikowy bolometr w postaci ta¬ 
siemki z nadprzewodzącego materiału. Tasiemkę na¬ 
leży utrzymywać w temperaturze odpowiadającej po¬ 
łowie przedziału przejścia w stan oporowy (rys. 15). 
Pochłaniane promieniowanie powoduje wzrost tem¬ 
peratury bolometru, a zatem i wzrost jego oporu. 
Czułość nadprzewodnikowego bolometru może się¬ 
gać 10 -12 W. Posługiwanie się nim jest jednak utrud¬ 
nione z powodu konieczności utrzymywania stałej 
temperatury w kriostacie w bardzo wąskim prze¬ 
dziale (A Tx 0,001 K). 


Termometr szumowy 

Szumy napięciowe na oporze omowym są funkcją 
temperatury, można je więc wyzyskać do celów ter- 
mometrycznych. Ponieważ częstość promieniowania 
Josephsona jest związana z napięciem na złączu za¬ 
leżnością hv — 2eU y fluktuacje napięciowe będą mo¬ 
dulować częstość Josephsona i wpływać na szerokość 
pasma promieniowania. Złącze Josephsona podłącza 
się do źródła słabego napięcia U w szereg z oporem R. 
Fluktuacje napięciowe na oporze R w temperaturze 
T dają rozmycie częstości promieniowania Josephso¬ 
na: szerokość pasma promieniowania emitowanego 


kriotron 

zwykły 



kriotron 
ze złączem 
losephsona 



Rys. 16. Szkic kriotronu: a) zwykłego, b) ze złączem Josephsona 


przez złącze jest więc proporcjonalna do temperatury 
w skali bezwzględnej: óv = 4 nkTR/(p 0 2 , gdzie 
jest kwantem strumienia magnetycznego. Termome¬ 
trem szumowym wyznaczono już temperaturę do 
20 mK, a przypuszcza się, że można będzie rozszerzyć 
zakres do 1 mK. 


Wzorzec jednostki napięcia 

Schodkowa charakterystyka prądowo-napięciowa złą¬ 
cza Josephsona pobudzonego promieniowaniem elek¬ 
tromagnetycznym albo stałym polem magnetycznym 
może być wykorzystana do ustalenia wzorca jednostki 
napięcia, opartej na stałych uniwersalnych: ładunku 
elementarnym e i stałej Plancka h. Stosunek tych 
stałych, ejh , z innych pomiarów, nie związanych ze 
zjawiskiem Josephsona, jest znany z dokładnością 
10~ 6 , zaś częstość promieniowania można zmierzyć 
z dokładnością do ok. 10" 8 ; to określa nam dokład¬ 
ność, z jaką możemy ustalić jednostkę napięcia. 
Doświadczalnie stwierdzono, że stosunek t//v = 
= hl(2e) nie zależy od: materiału, typu złącza (tunelo¬ 
we, punktowe lub inne), temperatury, natężenia poła 
magnetycznego lub mocy promieniowania, numeru 
schodka («), ani innych ubocznych czynników. Ta 
właśnie niezależność od jakichkolwiek warunków do¬ 
świadczenia predysponuje złącze Josephsona do 
oparcia na nim międzynarodowego wzorca jednostki 
napięcia. Takie wzorce napięcia są już stosowane 
w wielu krajach; w Polsce opracowuje się taki wzo¬ 
rzec na zlecenie Głównego Urzędu Jakości i Miar. 


Elementy maszyn cyfrowych 

Na możliwość wyzyskania nadprzewodnictwa w tech¬ 
nice obliczeniowej zwrócono uwagę jeszcze w 1956 r. 
po skonstruowaniu urządzenia zwanego kriotronem 
(rys. 16). Prąd sterujący w obwodzie wejściowym 
kriotronu może — za pośrednictwem swego pola kriotron 
magnetycznego — wprowadzać obwód wejściowy 
kriotronu w jeden z dwu stabilnych stanów: w stan 
bezoporowy (nadprzewodzący) i w stan oporowy. 

Dzięki temu kriotron działa jako przerzutnik i można 
go zastosować w układach logicznych i komórkach 
pamięci maszyn cyfrowych. Bramkę w obwodzie 
wyjściowym kriotronu, na której pojawia się lub znika 
napięcie, może być cienka warstewka nadprzewodnika 
albo —w czulszych kriotronach —złącze Josephsona. 

Opracowano także inne nadprzewodnikowe ele¬ 
menty pamięci, jak persistor czy komórka Crove’a. 

Elementy te wyróżniają się małymi rozmiarami i ma¬ 
łym poborem mocy. Mimo tych zalet, nadprzewod¬ 
nikowe elementy nie znalazły dotychczas tak szero¬ 
kiego zastosowania w maszynach cyfrowych, jak spo¬ 
dziewano się początkowo. Być może przeszkodą jest 
niewygoda spowodowana koniecznością pracy w ką¬ 
pieli helowej. Z oszacowań ekonomicznych wynika, 
że stosowanie nadprzewodników jest korzystne do¬ 
piero w dużych układach pamięci, powyżej stu mi¬ 
lionów bitów. 

B. B. Goodman Zastosowania nadprzewodnictwa , Post. Fiz. 24, 

371 (1973). 
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KRYSZTAŁY 


Budowa kryształów 

Zygmunt Trzaska Durski 


Od czasów najdawniejszych człowiek znajduje w zie¬ 
mi dziwne naturalne twory o licznych płaskich ścia¬ 
nach, różnorodnych prawidłowych kształtach, pięk¬ 
nych barwach i wspaniałym połysku. Już starożytni 
nazwali te twory kryształami. Później, w miarę do¬ 
skonalenia narzędzi badawczych, gdy wynaleziono 
soczewkę i mikroskop, a następnie, gdy odkryto zja¬ 
wisko dyfrakcji promieni rentgenowskich na kryszta¬ 
łach, oraz gdy zbudowano mikroskop elektronowy — 
okazało się, że większość naturalnych i otrzymywa¬ 
nych sztucznie substancji, w stałym stanie skupienia 
zbudowana jest z kryształów lub krystalitów nieraz 
występowa- bardzo małych. Wyrażając się ściślej mówimy dziś, 
nie że te wszystkie substancje są ciałami krystalicznymi, 
kryształów I tak np. agregatami ziarn minerałów, najczęściej 
krystalicznych są skały, a w glebie znajdują się bar¬ 
dzo małe kryształy minerałów ilastych. Ciałami kry¬ 
stalicznymi są śnieg, lód, ziarna piasku oraz prawie 
wszystkie rudy metali. Z ciał krystalicznych składają 
się naturalne i sztuczne materiały budowlane (np. 
granit, wapień, cement). Ciałami krystalicznymi są 
także produkty hutnicze (metale i ich stopy), więk¬ 
szość wytworów przemysłu chemicznego (np. soda, 
mocznik, saletra, naftalen) i większość środków far¬ 
makologicznych (np. aspiryna, witaminy, penicy¬ 
lina) oraz niektóre artykuły spożywcze (cukier, sól 
kuchenna). 

Ciała krystaliczne mają wiele ciekawych właściwo- 
właściwośc. ści optycznych, mechanicznych, elektrycznych, mag- 
ciał krysta- netycznych, dzięki którym wyróżniają się spośród 
licznych innych ciał w stałym stanie skupienia (tzw. ciał bez¬ 
postaciowych). 

Jedną z podstawowych cech kryształów jest ich 
anizotropia, tzn. zależność właściwości optycznych, 
mechanicznych czy elektrycznych od kierunku w kry¬ 
sztale. Wszystkie kryształy wykazują anizotropię 
twardości (tj. mają różną twardość w różnych kie¬ 
runkach), rozszerzalności cieplnej, przewodnictwa 
cieplnego, przewodnictwa elektrycznego. We wszy¬ 
stkich też kryształach — z wyjątkiem tych, które na¬ 
leżą do układu regularnego — występuje zjawisko 
podwójnego załamania światła. Wiele kryształów ma 
zdolność skręcania płaszczyzny polaryzacji światła. 
Kryształy niektórych substancji wykazują piezoelek- 
tryczność i piroelektryczność. Ciała krystaliczne mają 
ściśle określoną temperaturę topnienia przy określo¬ 
nym ciśnieniu (gdy jednocześnie nie zachodzi che¬ 
miczny rozkład substancji). 

Wymienione wyżej właściwości ciał krystalicznych 
zastosowania wykorzystuje się szeroko w nauce i technice. Krysz- 
ciał krysta- tały „wkroczyły” również do naszego życia codzien- 
licznych nego: bez specjalnych kryształów nie działałyby m.in. 

gramofony elektryczne, radia tranzystorowe, magne¬ 
tofony, telewizory czy nawet zegarki (te „na kamie¬ 
niach”). Z niektórych kryształów (kwarc, sól kamien¬ 
na) przezroczystych dla promieni nadfioletowych 
wykonuje się pryzmaty stosowane w spektrografach 
optycznych, a np. z kryształu fluorytu przezroczyste¬ 
go w podczerwieni — soczewki do obiektywów nokto¬ 
wizorów. Podwójne załamanie światła w kryształach 
kalcytu wykorzystuje się w przyrządach polaryza¬ 
cyjnych (np. pryzmaty Nicola). Niektóre ciała kry¬ 
staliczne wykazujące silną anizotropię absorpcji 
światła służą do sporządzania błon polaryzujących 
światło (polaroidów). Luminescencję niektórych 
kryształów wykorzystano w licznikach cząstek joni¬ 
zujących (liczniki scyntylacyjne). Monokryształy ru¬ 
binu zastosowano do budowy maserów i laserów. 
Kryształy piezoelektryczne stosuje się m.in. do wy¬ 



twarzania ultradźwięków, do pomiarów ciśnień (np. 
w cylindrach silników, w górotworze) oraz jako pod¬ 
stawowe części przetworników elektroakustycznych. 

Kryształy półprzewodnikowe (np. krzem, german) 
znalazły zastosowanie w elektronice. Kryształy o wy¬ 
sokiej twardości mają również różnorodne zastoso¬ 
wanie, np. diamenty służą m.in. do wyrobu narzędzi 
wiertniczych i tarcz szlifierskich oraz do cięcia szkła, 
a z rubinów wykonuje się łożyska (w precyzyjnych 
przyrządach pomiarowych, np. w busolach i zegar¬ 
kach). Kryształy mające piękne barwy i połysk służą 
do wyrobu klejnotów i ozdób (np. diamenty, rubiny, 
szafiry, szmaragdy, ametysty). 

Współczesna nauka i technika potrzebują ciągle 
nowych, o coraz to innych właściwościach, ciał kry¬ 
stalicznych. Na potrzeby techniki nie wystarczają już 
kryształy naturalne, które często są albo zbyt zanie¬ 
czyszczone różnymi domieszkami albo są mało do¬ 
skonałe ze względu na występujące w nich defekty 
budowy. Stąd konieczność sztucznego otrzymywania, 
jak mówimy — „hodowania” — różnych monokrysz¬ 
tałów (-► Otrzymywanie monokryształów), czasami 
o niemal idealnej budowie, często o nowych, nie zna¬ 
nych dotąd a nieraz wprost zaskakujących właściwo¬ 
ściach. 

Cóż to jest więc ciało krystaliczne? Jak możemy je 
zdefiniować? Czym różni się od innych tworów natu- ciała 
ralnych, jak zwierzęta i rośliny, czy też od ciał bez- krystaliczne 
postaciowych, ciekłych lub gazowych? Wyżej użyto 
takich terminów, jak ciało krystaliczne, kryształ, kry¬ 
stalit, monokryształ. Czym te ciała różnią się między 
sobą? 

Wszystkie właściwości kryształów (a ogólniej ciał 
krystalicznych), łącznie z ich postacią zewnętrzną 
i symetrią, są wynikiem—jak to dzisiaj wiemy — 
specyficznej budowy wewnętrznej kryształów, mia¬ 
nowicie nieskończonego trójwymiarowego uporząd¬ 
kowania atomów lub jonów czy cząsteczek. Przykłady 
takiego uporządkowania (w związku nieorganicznym 
i organicznym) pokazano na rys. 1 i 2. 

Ciekawe, że już pierwsi bądacze kryształów, wie- 
dzeni genialną intuicją, starali się wytłumaczyć pow¬ 
stawanie wysoko symetrycznych postaci kryształów 
i tworzenie się płaskich ścian — specyficzną budową 
wewnętrzną. Potrzebne im jednak były do tego celu 
pewne podstawowe cząstki — elementy, z których 



Rys. J. Uporządkowanie jonów talu, glinu i fluoru w komórkach 
elementarnych T1A1F 4 (związek nieorganiczny) 
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Rys. 2. Uporządkowanie cząsteczek COCNHj). w krysztale mocz¬ 
nika (związek organiczny) 


hipotezy próbowali odtworzyć kryształy. I tak np. J. Kepler 
wewnętrznej (1611) przypuszczał, że sześciokątne płatki śniegu 
budowy zbudowane są z kulistych cząstek wody, ściśle sty- 
kryształów kających się z sobą, a R. Hooke (1665) odtworzył 
zewnętrzne postacie kryształów ałunu i soli kamiennej 
układając warstwami jednakowe kulki (należy zau¬ 
ważyć, że dzieje się to ok. 150 lat przed powstaniem 
teorii atomistycznej J. Daltona—1803). Ch. Huy- 
gens (1690) przypisywał najmniejszym cząstkom 
kryształów kalcytu kształt elipsoidy obrotowej. Rów¬ 
nież i M.W. Łomonosow (1749) próbował wytłuma¬ 
czyć wiełościanową postać kryształów prawidłowym 
ułożeniem w przestrzeni kulistych cząstek elementar¬ 
nych (korpuskuł). D. Guglielmini (1688) i R. J. Haiiy 
(1782) na podstawie obserwacji łupliwości kryształów 
wysunęli przypuszczenie, że najmniejsze cząstki, z któ¬ 
rych zbudowane są kryształy, mają postać wielo- 
ścianów. 

Dziś wiemy, że podstawowe elementy, z których 
zbudowane są kryształy (i in. ciała krystaliczne), mają 
postać równoległościanów (udowodnił to teoretycz¬ 
nie w 1850 r, A. Bravais, a doświadczalnie potwierdził 
M. Laue w 1912 r.), a one z kolei utworzone są z ato¬ 
mów (jonów, cząsteczek). Obecnie ciałem krystalicz¬ 
nym nazywa się każde ciało w stałym stanie skupie¬ 
nia mające uporządkowaną, prawidłową (sieciową) 
budowę wewnętrzną. Zależnie od warunków krysta¬ 
lizacji ciała krystaliczne mogą tworzyć monokrysz¬ 
tały lub ciała polikrystaliczne. Ciało polikrystaliczne 
poiikryształ, (polikryształ) składa się z licznych, mikroskopowej 
monokryształ wielkości kryształów lub krystalitów. Monokryszta¬ 
łem jest każdy pojedynczy, duży lub nawet bardzo 
mały kryształ lub ^krystalit, nie wykazujący zrostów 
i pęknięć oraz nie posiadający wrostków innych sub¬ 
stancji. 

Jak już wspomniano, naturalne kryształy, np. ru¬ 
binu, mają płaskie ściany, natomiast otrzymane 
w piecu Verneuila monokryształy rubinu mają 
•kształt gruszki. Otrzymane sztucznie „gruszki rubi¬ 
nowe” są ciałami krystalicznymi o takim samym skła¬ 
dzie chemicznym jak naturalny kryształ rubinu. 
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Wspólną cechą łączącą naturalny kryształ rubinu 
i syntetyczną „gruszkę rubinową” — krystalit—jest 
więc nie ich wygląd zewnętrzny, lecz ich jednakowa — 
przy jednakowym składzie chemicznym — budowa 
wewnętrzna. Tak więc kryształem nazywa s*ię ciało 
w stałym stanie skupienia, o prawidłowej (sieciowej) kryształ 
budowie wewnętrznej mające naturalną postać wielo- a krystalit 
ścianową; natomiast krystalit,mający taką samą bu¬ 
dowę wewnętrzną jak kryształ, ograniczony jest do¬ 
wolną powierzchnią. 


Wewnętrzna budowa ciał 
krystalicznych 

Sieć przestrzenna 

Podstawowe jednostki, z których zbudowane są ciała 
krystaliczne, mają kształt równoległościanów zw. 
komórkami elementarnymi (rys. 3). W danym ciele' komórka 
krystalicznym wszystkie komórki elementarne są elementarna 
oczywiście jednakowe. Nieskończony zbiór jednako¬ 
wych komórek elementarnych, ułożonych względem 
siebie równolegle i ściśle wypełniających przestrzeń 
stanowi sieć przestrzenną (rys. 4). Mówimy, że sieć 



przestrzenna jest geometrycznym, trójwymiarowym sieć 
schematem wewnętrznej budowy kryształów (ciał przestrzenna 
krystalicznych). Według tego schematu ułożone są 
w krysztale wszystkie atomy, jony lub cząsteczki. 

Oczywiście, sieć przestrzenna jako pewien schemat 
jest pojęciem abstrakcyjnym i żadnej „sieci”—jako 
takiej — w rzeczywistym krysztale nie ma. 

Rozmieszczenie atomów (jonów, cząsteczek) w po- struktura 
jedynczej komórce elementarnej nazywamy strukturą kryształu 
kryształu (strukturą ciała krystalicznego, strukturą 
krystaliczną). Natomiast powtarzające się periodycz¬ 
nie w trzech wymiarach przestrzeni (tj. wg schematu 
sieci przestrzennej), wypełnione atomami (jonami, 
cząsteczkami) komórki elementarne tworzą sieć kry- sieć 
staliczną. Mówiąc inaczej: sieć przestrzenna jest krystaliczna 
„szkieletem”, który po wypełnieniu w określony spo¬ 
sób atomami (jonami, cząsteczkami) staje się siecią 
krystaliczną. 

W sieci przestrzennej krawędzie komórek elemen¬ 
tarnych przecinają się w punktach zw. węzłami sie- węzły 
ciowymi. Węzłami nazywa się też punkty na prostych sieciowa 






























sieciowych nie będących krawędziami komórek ele¬ 
mentarnych (np. na środkach ścian komórki ele¬ 
mentarnej, rys. 14). Sieć przestrzenną można trakto¬ 
wać nie tylko jako nieskończony zbiór komórek ele¬ 
mentarnych, ale i jako nieskończony uporządkowany 
prosta zbiór punktów — węzłów. Prosta przeprowadzona 
sieciowa przez dwa dowolne węzły jest prostą sieciową (rys. 

5a). Na prostej sieciowej znajduje się nieskończona 
periody liczba węzłów w jednakowych od siebie odległościach, 
identyczności Odległości te nazywamy periodami identyczności (od¬ 
ległościami translacyjnymi). Przez trzy, nie leżące na 
płaszczyzna jednej prostej, węzły przechodzi płaszczyzna sieciowa 
sieciowa (rys. 5b). Takich płaszczyzn i prostych można wybrać 

a) •-«- 9 - # 



Rys. 5. Prosta sieciowa (a) i płaszczyzna s'ieciowa (b) 

w sieci przestrzennej nieskończenie wiele. Kształt 
i rozmiary komórki elementarnej określane są przez 
stałe tzw. stałe sieciowe (parametry sieciowe), którymi są 
sieciowe długości krawędzi komórki a y b t c oraz kąty a, /?, y 
między tymi krawędziami (rys. 3). Sieć przestrzenna 
jest jednoznacznie określona przez jej komórkę ele¬ 
mentarną. Oznacza to, że wystarczy znać stale sie¬ 
ciowe, by móc odtworzyć sieć przestrzenną, 
współrzędne W sieci przestrzennej mamy do czynienia z nie- 
węzła sieci skończoną liczbą węzłów. Położenie (pozycję) wy¬ 
branego węzła określa się względem układu osi kry¬ 
stalograficznych X, Y, Z za pomocą współrzędnych 
•xyz • (rys. 6). Osie krystalograficzne pokrywają się 
osie krystalo- z trzema nierównoległymi do siebie krawędziami ko- 
graficzne morki elementarnej. 



Sieci Bravais'go 


Biorąc pod uwagę różne możliwe wartości stałych 
sieciowych oraz symetrię sieci przestrzennych można 
układy krys- sieci przestrzenne podzielić na sześć głównych typów, 
talograficzne zwanych układami krystalograficznymi (tab. str. 447). 

Prócz sieci przestrzennych mających węzły tylko 
w narożach komórek elementarnych istnieją jeszcze 


sieci — również spełniające warunki wymienione w ta¬ 
beli, w których węzły występują także na środkach 
ścian lub w środku geometrycznym komórki elemen¬ 
tarnej. Pierwsze z wymienionych wyżej sieci nazy¬ 
wają się sieciami prymitywnymi, a pozostałe — sie¬ 
ciami centrowanymi. Istnieje 14 różnych typów sieci 
prymitywnych i centrowanych, nazywają się one sie¬ 
ciami Bravais’go (lub sieciami translacyjnymi). Po¬ 
dobnie jak sieci, również ich komórki elementarne 
nazywa się prymitywnymi lub centrowanymi (rys. 7). 
Często zamiast mówić o 14 typach sieci Bravais ł go 


sieci 

Bravais'go 

Stec trójskośna 


Sieci jednoskośne: 


Sieoi tełragonalne: 



prymitywna 
Sieci rombowe: 


prymitywna 


Sieci regularne: 


o centrowanej 
.podstawie 


prymitywna 


o centrowanej 
podstawie 


o centrowanym 
środku 


prymitywna 



o centrowanym 
środku 



o centrowanych 

wszystkich 

ścianach 



Rys. 7. Komórki elementarne 14-tu typów sieci Bravais'go 


mówi się o 14 typach komórek elementarnych. Cechą 
charakterystyczną sieci Bravais ł go jest to, że w takiej 
sieci każda prosta sieciowa jest równomiernie obsa¬ 
dzona węzłami. Można ten warunek wypowiedzieć 
też inaczej, mianowicie: przesunięcie całej sieci wzdłuż 
dowolnej prostej sieciowej na odległość równą perio¬ 
dowi identyczności tej prostej (lub jego wielokrot¬ 
ności) prowadzi zawsze do pokrycia się sieci samej ze 
sobą (do nałożenia się na siebie wszystkich węzłów). 

Warunek charakteryzujący sieć Bravais’go speł¬ 
niany jest w sieciach prymitywnych (symbol P) oraz 
w sieciach o centrowanych podstawach (symbol A , 
B lub C — zależnie od pary centrowanych ścian ko¬ 
mórki elementarnej), w sieciach o centrowanym środ¬ 
ku (/), w sieciach o centrowanych wszystkich ścianach 




romboedryczna 


symbole sieci 
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Każdą sieć centrowaną można zawsze rozpatrywać 
jako sieć złożoną z dwu, trzech lub czterech wstawio¬ 
nych w siebie i odpowiednio przesuniętych identycz¬ 
nych sieci prymitywnych (rys. 8). W komórce o cen¬ 
trowanych podstawach mamy dwie sieci prymitywne 
wstawione w siebie, przy czym węzeł początkowy 
jednej z nich ma współrzędne • 000 -, a drugiej • f f 0 •. 
W sieci typu / współrzędne węzłów początkowych sieci 
wstawionych są -000- i-iii- (dwie sieci wstawio¬ 
ne wsiebie); w sieci typu F-000-, -i i 0-, i 0 i- 

i *0 i i* (cztery sieci wstawione w siebie); w sieci 
typu R — *000*, -lii-, -if i- (trzy sieci wsta¬ 
wione w siebie) (rys. 9). 

Znajomość typu sieci Bravais’go w danym krysztale 
daje pewną informację o sposobie rozmieszczenia 
atomów w komórce elementarnej. Jeżeli np. w krysz¬ 
tale, mającym sieć przestrzenną typu F, ugrupowa¬ 
nie n atomów znajduje się wokół węzła -000-, to ta¬ 
kie same grupy n atomów i w takim samym położe¬ 
niu (orientacji) muszą znajdować się wokół węzłów 


brawesowskiej komórce elementarnej można jednak 
zawsze utworzyć komórkę prymitywną, niecentro- 
waną. Komórki prymitywne utworzone dla sieci cen¬ 
trowanych (przykłady takich komórek pokazuje 
rys. 11) zwykle nie oddają rzeczywistej symetrii 
istniejącej w sieci. 



Rys. 11. Przekształcanie komórek centrowanych w prymity¬ 
wne: a) komórki o centrowanych podstawach (typ C);b) o cen¬ 
trowanym środku (typ /); c) o centrowanych wszystkich ścia¬ 
nach (typ F) 



Rys. 10. Kształt cząsteczek adamantanu (a) i urotropiny (b) oraz struktury kryształów (atomy wodoru na rysunkach pominięto) ada- 
mantanu (c) i urotropiny ( d). Cząsteczka adamantanu zbudowana jest z 6 grup CH a i 4 grup CH, w cząsteczce urotropiny 4 grupy CH 
zastąpione są atomami azotu N 


• a 0 f •, • 0 f f •, • H 0 •, a w krysztale o sieci typu l takie 
same ugrupowania atomów i w takiej samej orien¬ 
tacji znajdują się wokół węzłów -000- i -ffi-. 
Ilustrują to dobrze struktury dwóch organicznych 
związków: adamantanu C 10 H 16 i urotropiny (CH 2 ) 6 N 4 
(kształt ich cząsteczek oraz struktury utworzonych z 
nich kryształów przedstawia rys. 10). Kształt cząste¬ 
czek obu związków jest taki sam, ale sieć przestrze¬ 
nna kryształu adamantanu jest siecią regularną typu 
F, a kryształu urotropiny — regularną typu /. 
komórka W sieci przestrzennej kryształu istnieje możliwość 
Wignera- wyboru równoległościennej komórki elementarnej 
Seitza w różny sposób. Zazwyczaj wybiera się ją tak, aby 
kształt jej ścian odzwierciedlał symetrię sieci, oraz aby 
jej objętość była minimalna, liczba kątów prostych 
między krawędziami była maksymalna, a węzły znaj¬ 
dowały się w położeniach zgodnych z jedną z 14 ko¬ 
mórek brawesowskich. Dla każdej sieci o centrowanej 
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Metodę wydzielania symetrycznych komórek pry¬ 
mitywnych we wszystkich sieciach przestrzennych po¬ 
dali Wigner i Seitz. W celu utworzenia takiej komórki 
dany węzeł sieci przestrzennej łączy się odcinkami 
prostymi z najbliższymi węzłami. Następnie przez 
środki tych odcinków prowadzi się płaszczyzny do 
nich prostopadłe (rys. 12). Przecinając się ze sobą 
płaszczyzny te tworzą obszar nazywany symetryczną 



Rys. 12. Komórka elementarna Bravais*go (A) i komórka prymi- 
y*na Wigncra-Seitza ( li ) dwu wymiarowej sieci heksagonalnej 

























































komórKą prymitywną lub komórką Wignera-Seitza 
(przykłady — rys. 13). Komórki te w sieci przestrzen¬ 
nej są wielościanami, którymi można ściśle, bez 
przerw, wypełnić przestrzeń. Komórki Wignera- 
Seitza dla regularnych sieci typu P , I oraz F przedsta¬ 
wiono na rys. 13. Komórki Wignera-Seitza znajdują 
zastosowanie np. w teorii stref Brillouina (-> Struk- 



Rys. 13. Komórki Wignera-Seitza regularnych sieci typu P t I 
oraz F 


tura elektronowa ciał stałych), w której pierwszą strefą 
Brillouina nazywa się komórkę Wignera-Seitza utwo¬ 
rzoną w sieci odwrotnej (-*■ Krystalografia rentge¬ 
nowska). 


Symbole prostych i płaszczyzn sieciowych 

Przez nieskończoną liczbę węzłów znajdujących się 
w sieci przestrzennej możemy prowadzić nieskoń¬ 
czoną liczbę prostych sieciowych i płaszczyzn siecio¬ 
wych. Płaszczyzny sieciowe w sieci przestrzennej na¬ 
chylone różnie w stosunku do osi krystalograficznych 
różnią się między sobą zasadniczo sposobem roz¬ 
mieszczenia węzłów i odległościami od sąsiednich 
płaszczyzn sieciowych. Również i proste sieciowe po¬ 
prowadzone z początku układu osi współrzędnych 
(osi krystalograficznych) są różne, np. węzły znaj¬ 
dują się na nich w różnych odległościach, a i odle¬ 
głości między sąsiednimi równoległymi prostymi są 
różne. 

Weźmy np. sieć krystaliczną złota (układ regularny) 
i wybierzmy w tej sieci komórkę elementarną w taki 
sposób, aby atomy złota znajdowały się w narożach 
komórki i na środkach ścian (rys. 14, 16). Taki wy¬ 
bór komórki elementarnej nie jest koniecznością, gdyż 



Rys. 14. Przykłady prostych sieciowych w sieci krystalicznej złota 

można ją wybrać i tak, aby w jej narożach nie znaj¬ 
dował się żaden atom (np. jak na rys. 10). Taki sam 
typ sieci ( F ) jak złoto mają też aluminium, miedź, 
nikiel i in. 

wskaźniki W komórce elementarnej złota atomy leżące na 
prostej prostej X znajdują się w odległości a od siebie; ale na 
sieciowej prostej sieciowej B atomy leżą w odległościach 


aj/2/2, a na prostej D w odległości a \/ 3. Proste te są 
więc różne; oznaczamy je tzw. wskaźnikami, tj. 3 licz¬ 
bami całkowitymi m, n , p względem siebie pierwszy¬ 
mi, ujętymi w nawias kwadratowy: [mnp]. Liczby 
m, n,p jednoznacznie określają kierunek prostej sie¬ 
ciowej. Wskaźniki prostej sieciowej przechodzącej 
przez węzeł -000- i jakiś drugi są takie same jak wskaź- 





Rys. 15. Najgęstsze ułożenia jednakowych kuł w przestrzeni, 
a) najgęściej upakowana warstwa heksagonalna, b) najgęstsze 
ułożenie regularne (heksagonalne warstwy najgęściej upakowane 
są równoległe do warstwy kul zaciemnionych), c) najgęstsze uło¬ 
żenie heksagonalne (warstwy najgęstszego upakowania położone 
są poziomo) 


komórka 

elementarna 

złota 
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niki tego drugiego węzła sprowadzone do postaci 
liczb całkowitych. Na przykład prosta X przechodzą¬ 
ca'przez węzeł -000- i •100* ma symbol [100], prosta 
B przechodząca przez -000* i -H O* ma symbol 
[110],y prosta C —symbol [101], a prosfa D — 

, [111]. W sieci przestrzennej wszystkie proste siecio¬ 
we równoległe do siebie mają jednakowe wskaźniki, 
struktury Przypatrzmy się teraz płaszczyznom sieciowym wy- 
reąśg^stszego znaczonym w strukturze kryształu złota przez różne 
ułożenia ugrupowania atomów. W krysztale złota (miedzi, 
niklu) wszystkie atomy mają jednakowy kształt — 
przyjmujemy, że kulisty — i tworzą tzw r . strukturę 
najgęstszego ułożenia (upakowania; rys. 15). W struk¬ 
turach tego typu, jednakowych rozmiarów atomy, 
jony a nawet cząsteczki ułożone są w sposób zapew¬ 
niający możliwie największe wypełnienie przestrzeni 



Rys. 16. Kryształ 
złota: a) struktura 
najgęstszego upako¬ 
wania; b,\c) id) obsa¬ 
dzenie atomami pła¬ 
szczyzn sieciowych 
(111), (100) i (110) 
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Rys. 17. Położenie różnych płaszczyzn sieciowych w komórce 
elemen-tarnej 


(100) i (110). Położenie kilku innych płaszczyzn sie¬ 
ciowych przedstawione jest na rys. 17. 



(ok. 74%). Struktury te powstają w wyniku nakła¬ 
dania jedna na drugą najgęściej upakowanych w-arstw 
heksagonalnych. Największe znaczenie w teorii 
struktur kryształów mają dwa najgęstsze ułożenia — 
regularne i heksagonalne. Najgęstsze ułożenie regu¬ 
larne ma sieć Bravais’go typu F y a heksagonalne — 
typu P, przy czym w komórce elementarnej tej ostat¬ 
niej sieci znajdują się dwa węzły w pozycjach -000- 
i .A ii. 

Na rysunku 16b, c, d pokazane są trzy płaszczyzny 
sieciowe przechodzące przez komórkę elementarną 
kryształu złota. Na tych płaszczyznach wyraźnie wi¬ 
dać różne ich obsadzenie przez atomy złota. W płasz¬ 
czyźnie sieciowej pokazanej na rys. 16b atomy złota 
tworzą najgęściej upakowaną warstwę; atomy w tej 
płaszczyźnie ściśle przylegają do siebie. Na następ¬ 
nych dwóch rysunkach (16c, d) wyraźnie widać, że 
rozmieszczenie atomów w zaznaczonych płaszczyz¬ 
nach jest inne, a przede wszystkim znacznie luźniejsze 
niż w pierwszym wypadku. 

Zauważmy też, że każda z zaznaczonych płasz¬ 
czyzn jest inaczej położona w stosunku do osi kry¬ 
stalograficznych. Aby te płaszczyzny móc od siebie 
odróżniać i jakoś „nazywać” zaopatrujemy je w pew- 
symbole i ne symbole. Oznaczamy je symbolami Millera (hkl) 
wskaźniki złożonymi z trzech liczb całkowitych h y k , / (wskaźniki 
Millera Millera) względem siebie pierwszych. 

Wskaźniki h y k y l pokazują, ile razy odcinki od¬ 
cięte na osiach krystalograficznych przez daną płasz¬ 
czyznę są mniejsze od periodów identyczności wzdłuż 
odpowiednich osi. Zgodnie z tą definicją płaszczyzny 
sieciowe pokazane na rys. 16 mają symbole (111), 



Rys. 18. Rzut sieci przestrzennej na płaszczyznę XY (oś Z jest 
prostopadła do płaszczyzny rysunku) z zaznaczonymi śladami 
niektórych płaszczyzn sieciowych ( hkO ) 
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Wskaźnik O w symbolu płaszczyzny sieciowej ozna¬ 
cza, że płaszczyzna ta jest równoległa do związanej 
z tym wskaźnikiem osi krystalograficznej (np. wskaź¬ 
nik h związany jest z osią X itd.). Jeżeli płaszczyzna 
sieciowa przecina ujemny zwrot danej osi krystalogra¬ 
ficznej, to ujemny jest również odpowiedni wskaźnik; 
znak *minus” umieszcza się nad wskaźnikiem, np. 

(In). 

Wszystkie płaszczyzny sieciowe równoległe do sie¬ 
bie mają takie same wskaźniki Millera. Dla zespołu 
równoległych płaszczyzn sieciowych określa się od- 
odległość ległość międzypłaszczyznową d&ki), tj. odległość 
międzypłasz- między dwoma sąsiednimi płaszczyznami, mierzoną 
czyznowa wzdłuż prostej prostopadłej do tych płaszczyzn (rys. 

18). Na rysunku łatwo można zauważyć, że im wyższe 
są wskaźniki, tym sąsiednie płaszczyzny znajdują się 
bliżej siebie. 


Symetria kryształów 

Symetria 



Patrząc na szlaki omamentacyjne pokazane na rys. 
19, intuicyjnie wyczuwamy, że mają one jakąś syme¬ 
trię, że są symetryczne*. Od razu rzuca się w oczy 
pewne uporządkowanie i powtarzanie się podstawo¬ 
wych ,,wzorów'* w tych ornamentach. 

Przyjrzyjmy się teraz np. uporządkowaniu atomów 
krzemu i tlenu (rys. 20) w strukturach kryształów nie¬ 
których krzemianów. Atomy krzemu i tlenu układają 
się w tych kryształach w pewne wzory, powielane 
w nieskończoność. Wzory te wykazują również pewną 
symetrię. Zauważyć można łatwo wyraźne podobień¬ 
stwo uporządkowania z rys. 20a do uporządkowania 
w jednowymiarowym ornamencie z rys. 19. Syme¬ 
tryczne wzory tworzone przez atomy (jony, cząsteczki) 
w kryształach bywają różne, nieraz bardzo skompli¬ 
kowane i bardzo oryginalne. Przykład takiego, 
wprawdzie o nieskomplikowanej symetrii, ale orygi¬ 
nalnego wzoru pokazano na rys. 21, przedstawiają¬ 
cym symetrię ułożenia atomów w różnych warstwach 
struktury kryształu minerału — apofyllitu. 

Bardzo często symetrię wykazują cząsteczki związ¬ 
ków chemicznych. Niekiedy jest to symetria stosun¬ 
kowo prosta, jak np. w cząsteczce mocznika (rys. 22), 
a niekiedy złożona i skomplikowana, jak np. w czą¬ 
steczkach adamantanu i urotropiny (rys. lOa, b). 

Symetria występuje nie tylko w różnych uporząd¬ 
kowaniach atomów (jonów, cząsteczek) w ciałach 
krystalicznych i w samych cząsteczkach, nie tylko 
w różnych ornamentach, w budowlach, dziełach 
sztuki, sprzętach codziennego użytku (człowiek — 
sam na zewnątrz ukształtowany symetrycznie — lubi 
wytwarzać przedmioty symetryczne, ponieważ sy¬ 
metria kbjarzy mu się z pięknem i harmonią kształ¬ 
tów i barw), ale i w przyrodzie ożywionej: symetrycz¬ 
nie— w każdym razie na zewnątrz — zbudowane są 
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Rys. 19. Szlaki ornamentacyjne o różnej symetrii 



Rys. 20. Uporządkowanie atomów krzemu i tlenu w strukturach 
krzemianów: łańcuchowych (a), wstęgowych (b), warstwowych (c) 




O grupa OH O tlen © Iłuor • 

potas €> wapń ^ wodór 

Rys. 21. Symetria w krysztale apofyllitu KCa 4 F[Si 4 Oio] 2 *8 H.O: 
a) warstwa utworzona przez grupy krzemotlenowe, b) warstwa 
utworzona przez jony Ca, K, F, O i OH 
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przeważnie zwierzęta i rośliny. W tych ostatnich 
przypadkach czasem jest to taka symetria, jaka wy¬ 
stępuje w kryształach, a czasem inna (il. 63, 65 i 66, 
tabl. 17). 



Rys. 22. Cząsteczka mocznika 
OC(NH,). Symetria własna czą¬ 
steczki: mm 


Naukę o symetrii, jej rodzajach i sposobach okre¬ 
ślania na najwyższym chyba poziomie postawili kry¬ 
stalografowie, wykrywając i badając symetrię naj¬ 
pierw zewnętrznych postaci kryształów, a później 
i struktur kryształów. Symetria jest właściwością figu¬ 
ry polegającą na tym, że przy określonych zmianach 
położenia tej figury nowe położenia pokrywają się 
z położeniem pierwotnym (tj. figura pokrywa się sama 
ze sobą). O figurze geometrycznej wtedy mówimy, że 
jest symetryczna, gdy składa się z jednakowych, pra¬ 
widłowo rozmieszczonych części, 
symetria Jak w świetle tych sformułowań można zdefinio- 
kryształów wa ^ symetrię kryształów? Jak już wiemy, kryształy 
podczas swobodnego wzrostu otaczają się płaskimi 
ścianami. Naturalne ściany kryształu są zawsze rów¬ 
noległe do określonych płaszczyzn sieciowych sieci 
krystalicznej. Ściany kryształów przecinają się wzdłuż 
linii prostych — krawędzi, którym w sieciach krysta¬ 
licznych odpowiadają określone proste sieciowe. Trzy 
lub więcej ścian przecinających się w jednym punkcie 
tworzy naroże kryształu. Patrząc na rzuty ortogonal¬ 
ne kryształów przedstawione w tabeli Makroskopowe 






Rys. 23. Przykłady kombinacji makroskopowych elementów 
symetrii: a) dwukrotna oś symetrii i przechodzące przez nią dwie 
płaszczyzny symetrii (kryształ: topaz), b) trójkrotna oś symetrii 
i trzy płaszczyzny symetrii (kryształ: turmalin), c) czterokrotna oś 
symetrii i cztery płaszczyzny symetrii (kryształ: rutył), d) sześcio¬ 
krotna oś symetrii i sześć płaszczyzn symetrii (kryształ: beryl); 
powtarzany elementami symetrii fragment kryształu jest zacienio- 
wany; osie i płaszczyzny symetrii są prostopadłe do płaszczyzny 
rysunku 


elementy symetrii i na rys. 23 symetrię zewnętrznych 
postaci kryształów można zdefiniować jako: prawid¬ 
łowe powtarzanie się*w przestrzeni jednakowych pod 
względem geometrycznym i fizycznym ścian, krawędzi 
i naroży. Należy tu jednak podkreślić, że symetria 
zewnętrznych postaci kryształów jest zjawiskiem wtór¬ 
nym, wynikającym z symetrii atomowej budowy dane¬ 
go kryształu, tzn. z symetrii sieci przestrzennej (sieci 
krystalicznej). 
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Podobnie jak symetrię kryształu, symetrię sieci 
przestrzennej (czy sieci krystalicznej) można określić 
jako prawidłowe powtarzanie się w przestrzeni wę¬ 
złów (atomów, cząsteczek), prostych sieciowych, 
płaszczyzn sieciowych, a także komórek elementar¬ 
nych. 

Aby zrealizować dowolne przekształcenie syme¬ 
tryczne, posługujemy się pewnymi pomocniczymi 
punktami, liniami lub płaszczyznami zw. elementami elementy 
symetrii. Elementy symetrii służące do opisu prze- symetrii 
kształceń symetrycznych, którym podlegają frag¬ 
menty zewnętrznych postaci kryształów, nazywają się 
makroskopowymi elementami symetrii. Makrosko- makrosko¬ 
powe elementy symetrii — do których należą osie powe 
symetrii zwykłe, inwersyjne i przemienne, środek sy- elementy 
metrii i płaszczyzna symetrii — odznaczają się tym, symetrii 
że wykonanie za ich pomocą odpowiednich prze¬ 
kształceń symetrycznych doprowadza figurę z po¬ 
wrotem do położenia wyjściowego. W związku z tym 
mówimy o nich, że są elementami symetrii figur skoń¬ 
czonych. Figurami skończonymi są na przykład kry¬ 
stalograficzne wielościany, tworzące zewnętrzne po¬ 
stacie kryształów. 

W sieciach przestrzennych (krystalicznych), prócz 
makroskopowych elementów symetrii, występują 
strukturalne elementy symetrii, którymi są: oś trans¬ 
lacji, śrubowe osie symetrii i płaszczyzny poślizgu. 

Wykonanie odpowiednich przekształceń symetrycz¬ 
nych za pomocą strukturalnych elementów symetrii 
nie doprowadza przekształcanej figury do położenia strukturalne 
wyjściowego. Strukturalne elementy symetrii są ele- elementy 
mentami symetrii figur nieskończonych. Figurami symetrii 
nieskończonymi są np. ornamenty z rys. 19, a także 
sieci przestrzenne czy sieci krystaliczne. 

Rezultaty działania makroskopowych elementów 
symetrii można obserwować na tzw. kryształach ideal¬ 
nych nawet nie uzbrojonym okiem, jeśli tylko kryształ 
jest dostatecznie duży. Strukturalne elementy symetrii 
ujawniają się natomiast prawie wyłącznie w zjawis¬ 
kach dyfrakcyjnych. 


Makroskopowe elementy symetrii 

Jeżeli w krysztale (w jego sieci krystalicznej) istnieje 
taki punkt, że na dowolnej prostej przeprowadzonej 
przez ten punkt, w jednakowej od niego odległości 
znajdują się jednakowe fragmenty kryształu (sieci kry¬ 
stalicznej, sieci przestrzennej), to ten punkt jest środ¬ 
kiem symetrii (centrum symetrii) kryształu. Schemat środek 
działania środka symetrii oraz rezultaty przekształceń symetrii 
względem środka symetrii przedstawione zostały 
w tabeli Makroskopowe elementy symetrii. W tabeli 
tej pokazano również symbole środka symetrii sto¬ 
sowane w krystalografii. 

Gdy dwie części kryształu (sieci krystalicznej) po¬ 
zostają do siebie w takim stosunku, jak przedmiot płaszczyzna 
do swego obrazu w płaskim zwierciadle, to element symetrii 
symetrii łączący ze sobą te części nazywa się płasz¬ 
czyzną symetrii. 

Jeżeli w krysztale (w sieci krystalicznej) dany jego 
fragment powtarza się dwa lub więcej razy (mówimy 
też w tym wypadku, że fragment ten „nakłada się” 
sam na siebie, lub że przekształca się sam w sobie) 
po obrocie kryształu o stale ten sam kąt wokół pew¬ 
nej prostej i gdy powtarzające się fragmenty znajdują 
się stale w jednakowej odległości od tej prostej, to 
prosta ta jest osią symetrii. W kryształach — ze os j e symetrii 
względu na ich budowę sieciową — mogą występo¬ 
wać tylko osie symetrii, wokół których ta sama 
część kryształu (sieci) powtarza się co kąt a = 180°, 

120°, 90°, 60° czyli odpowiednio: 2, 3,4 i 6 razy. Tzw. 
krotność osi n równa się więc 2,3, 4,6 (n = 360°/a). 

W związku z tym osie nazywamy dwu-, trój-, cztero- 
i sześciokrotnymi osiami symetrii. W tabeli przed¬ 
stawione zostały schematy działania osi oraz działa¬ 
nia osi na asymetryczny czworościan i na ściany 
kryształu. 

































Makroskopowe elementy symetrii 
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Strukturalne elementy symetrii - osie śrubowe 


czterokrotna 
oś inwersyjna 



Oprócz tych zwykłych osi symetrii w kryształach 
występuje jeszcze czterokrotna oś inwersyjna. Jest 
ona złożonym elementem s-ymetrii, co polega na tym, 
że dana część kryształu (sieci) powtarza się dopiero 
po wykonaniu dwóch przekształceń, mianowicie 
przekształcenia względem zwykłej czterokrotnej osi 
symetrii i przekształcenia względem środka symetrii. 
Takie złożenie dwóch przekształceń symetrycznych 
nazywa się ich iloczynem. Sposób dokonywania prze¬ 
kształceń względem osi inwersyjnej, schemat działania 
czterokrotnej osi inwersyjnej, działanie takiej osi 
na czworościan oraz działanie osi w krysztale przed¬ 
stawione zostały w tabeli. 

Inne osie, inwersyjne poza osią 4 — a także tzw. 
osie przemienne (będące wynikiem złożenia dwóch 
przekształceń: względem osi symetrii w-krotnej i pro¬ 
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stopadłej do niej płaszczyzny symetrii) nie dają żad¬ 
nych takich przekształceń, których nie można by 
uzyskać za pomocą wymienionych już prostych prze¬ 
kształceń. 


Strukturalno elementy symetrii 

Podstawowym elementem symetrii sieci przestrzen¬ 
nych jest oś translacji. Przekształcenie symetryczne 
względem osi translacji polega na równoległym prze¬ 
suwaniu punktu (lub zbioru punktów) o stale ten 
sam, ściśle określony odcinek r (rys. 24). Odcinek 
ten nazywa się odcinkiem translacji lub periodem 
identyczności. Sieć przestrzenną, ten nieskończony 
zbiór komórek elementarnych, można zbudować pod- 


oś 

translacji 
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Przykłady działania niektórych osi śrubowych i płaszczyzn poślizg 



a), c), e), g) ogólny wygląd struktury; b), d),f), h) rzut struktury na płaszczyznę XY; i), j) rzut na płaszczyznę XY struktury przedsta¬ 
wionej w postaci czworościanów Si0 4 . Na rzutach zaznaczono położenia niektórych elementów symetrii; b) osi 2 if płaszczyzn b i c; 
d) osi 3 a ; O płaszczyzn n; h) osi 4 X i 4 3 oraz płaszczyzn d\ i) osi 6* i 3 2 ; j) osi 3*. Pod nazwą związku są podane symbole grupy prze¬ 
strzennej struktury. Liczby oznaczaj*ą położenia atomów (czworościanów) nad płaszczyzną rysunku wzdłuż osi prostopadłej do niej 
wyrażone w ułamkach odpowiedniego periodu identyczności 



Rys. 24. Tran¬ 
slacja — prze¬ 
sunięcie rów¬ 
noległe wszyst¬ 
kich punktów 
o jednakowy 
odcinek 


metrii o właściwy tej osi kąt a, fragment ten zostaje 
przesunięty w kierunku równoległym do osi symetrii 
o pewną, ściśle określoną część translacji (stale taką 
samą), równą (pin) r, gdzie p i n są liczbami całkowi¬ 
tymi i p < n y np. w przypadku czterokrotnej osi śru¬ 
bowej wykonuje się kolejne obroty o 90°, którym to¬ 
warzyszą przesunięcia translacyjne bądź stale o V 4 r, 
bądź stale o 1 / z t , albo też stale o z Ur (tab. Strukturalne 
elementy symetrii — osie śrubowe). Tak więc istnieją 
trzy czterokrotne osie śrubowe, o trzech różnych skła¬ 
dowych translacyjnych. 

Osie śrubowe oznacza się symbolem n p . Nazwa 


tych osi (śrubowe) pochodzi stąd, żc pod działaniem 
takiej osi wszystkie punkty (fragmenty) sieci krysta¬ 
licznej przesuwają się po liniach śrubowych (lewo- 
lub prawoskrętnych). W strukturach kryształów wy¬ 
stępuje 11 osi śrubowych: osie śrubowe prawoskręt- 
ne — 3 ls 4 lt 6 U 6 Z ; osie śrubowe Jewoskrętne — 3 2 , 

4 3 , 64 , 65 i osie śrubowe neutralne (tj. bez wyróżnio¬ 
nego kierunku skrętu) — 2 lf 4 2 , 6 3 . Schematy dzia¬ 
łania osi śrubowych pokazano w tabeli znajdującej się 
na str. 444. 

W wyniku iloczynu płaszczyzny symetrii oraz trans- płaszczyzny 
lacji powstaje płaszczyzna poślizgu. Działanie jej po- poślizgu 
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lega na tym, że po wykonaniu odbicia zwierciadlane¬ 
go każdego fragmentu struktury w płaszczyźnie sy¬ 
metrii, fragment ten zostaje przesunięty w kierunku 
równoległym do tej płaszczyzny o połowę odpowied¬ 
niego odcinka translacji. Płaszczyznę poślizgu ozna¬ 
cza się symbolem a, b lub c, w zależności od kierunku 
przesunięcia (wzdłuż osi krystalograficznej X, Y 
czy Z). 

W strukturach kryształów występują również bar¬ 
dziej skomplikowane płaszczyzny poślizgu, działa¬ 
jące w taki sposób, że odbiciu zwierciadlanemu to¬ 
warzyszą dwa przesunięcia o 72 lub V 4 odcinka transla¬ 
cji w kierunkach dwóch osi krystalograficznych. Płasz¬ 
czyzna poślizgu typu n może mieć np. takie dwie 
składowe translacyjne: 1 U% X i 1 / 2 t z , a płaszczyzna typu 
d — x Utx i 1 Ut z (r z i t z — odcinki translacji wzdłuż 
osi Z i Z; zob. tab. Strukturalne elementy symetrii — 
płaszczyzny poślizgu i Przykłady działania niektórych 
osi śrubowych i płaszczyzn poślizgu). 


Kombinacje elementów symetrii 


Klasy i układy krystalograficzne 

Kryształy, ich struktury czy sieci krystaliczne mogą 
mieć nie tylko pojedyncze elementy symetrii, jak np. 
tylko środek symetrii, tylko jedną n -krotną oś sy¬ 
metrii zwykłą,, inwersyjną lub śrubową, tylko jedną 
płaszczyznę symetrii lub płaszczyznę poślizgu, ale 
także różne kombinacje (zespoły) elementów sy¬ 
metrii makroskopowych albo strukturalnych, lub 
i makroskopowych i strukturalnych. Działanie róż¬ 
nych kombinacji w-krotnych osi symetrii i płaszczyzn 
symetrii na ściany kryształów, dające wyobrażenie 
o kształtach kryształów przedstawiono na rys. 23. 

Różne możliwe w kryształach kombinacje makro¬ 
skopowych elementów symetrii przecinających się w 
jednym punkcie tworzą klasy symetrii kryształów 


Układy krystalograficzne i klasy symetrii 


Układ 

krystalogra¬ 

ficzny 

Elementy 
symetrii 
charaktery¬ 
zujące układ 

Stałe sieciowe 
komórki ele¬ 
mentarnej 

Symbol klasy wg 

Wszystkie ele¬ 
menty symetrii 
klasy 

Klasa (nazwa) 

tablic 

między- 

nar. a ) 

Schocn- 

fliesa b ) 

1 Kreutza 0 ) 

Trójskośny 

_ 

a ^ b & c 

1 

Ci 

Z.1 

_ 

jednościanu 



cc ź P & y 

1 

Ci 

C 

C 

dwuścianu 



a b 9 * c 

2 

c 2 

L l 

Z.2 

sfenoidu jednoskośnego 

Jednoskośny 

L2 lub P 

cc = y = 90° 

m 

C, 

p u 

P 

daszka jednoskośnego 



P ź 90° 

2/m 

. c th 

L l- C 

L 2 PC 

słupa jednoskośnego 


V- 1_L 2 

a Jż b =£ c 

mml 

C zv 

L\.P X 

L 2 2P 

piramidy rombowej 

Rombowy 

lub 

cc = fi = y = 

222 

D z 


3L Z 

czworościanu rombowego 


m p 

= 90° 

mmm2 

D 2 h 

L\, L%, C 

3L 2 3PC 

podwójnej piramidy rombowej 




4 

$4 


A* 

czworościanu tetragonalnego 




4 

c 4 


L* 

piramidy tetragonalnej 




4/m 

C Ah 

L*,C 

L*PC 

podwójnej piramidy tetragonalnej 

Tetragonalny 

L 4 lub A 4 

a = b ź c 








« = p = y = 

42 m 

d 

L x 

A*2L Z 2P 

skalenoedru tetragonalnego 



= 90° 

4 mm 

c 4y 

Ll P x 

LHP 

piramidy dytetragonalnej 




422 

*>4 

Ll L% 

L*4L2 

trapezoedru tetragonalnego 




4/mmm 


Ll Ll, C 

LHL^SPC 

podwójnej piramidy dytetragonalnej 




3 

c 3 

Ll 

L3 

piramidy trygonalnej 




3 

C 3 t 

LIC 

L*C 

romboedru 




3m 

C 3 y 

Ll P x 

L33P 

piramidy dytrygonalnej 




32 

*>3 

LlL% 

L33Z.2 

trapezoedru trygonalnego 




3m 

D 3d 

Ll L\, C 

L33L23PC 

skalenoedru trygonalnego 



a = b c 

6 


L\, P z 

L3 P 

podwójne 'piramidy trygonalnej 

Heksagonalny 

U 3 lub L3 

a = p = 90° 

6m2 


Ll.L\,P t 

L*3L*4P 

podwójnej piramidy dytrygonalnej 



y = 120° 

6 

C6 

L\ 

L* 

piramidy heksagonalnej 




6/m 

C 6 * 

L\, C 

L*PC 

podwójnej piramidy heksagonalnej 




6mm 

C« v 

Ll P x 

L*6P 

piramidy dyheksagonalnej 




622 


Ci. Ci 

L*6L* 

trapezoedru heksagonalnego 




6/mmm 


Ll L%, C 

L*6L*7PC 
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LlL’ x 
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nego 




m3m 

O h 

Ll Ll, C 
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a ) International Tables for X-Ray Crystallography , Birmingham 1952. b ) A. M. Scboenflies — niemiecki matematyk (1853-1928)’ 
C )S. Kreutz — polski mineralog i krystalograf (1883-1941). 

Uwaga: L* oznacza dwukrotną oś symetrii równoległą do krystalograficznej osi Z;P U oznacza płaszczyznę symetrii prostopadłą do kry¬ 
stalograficznej osi Y; Afm oznacza płaszczyznę symetrii prostopadłą do czterokrotnej osi symetrii. 


klasy symetrii 
(grupy 
punktowe ) 
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(klasy krystalograficzne lub grupy punktowe). Kom¬ 
binacji takich istnieje tylko 32 i grupuje się je w 6 
układów krystalograficznych. Kryształy dowolnego 
związku chemicznego można zawsze zaliczyć na pod¬ 
stawie ich symetrii makroskopowej do jednej z 32 klas 
symetrii. W tab. Układy krystalograficzne i klasy sy¬ 
metrii pokazano podział klas między układy krysta¬ 
lograficzne oraz podano elementy symetrii i stałe 
sieciowe charakteryzujące poszczególne układy. Naz¬ 
wa klasy pochodzi od postaci prostej ogólnej występu¬ 
jącej w danej klasie. 

Przy ujęciu zagadnienia symetrii szerszym niż w 
krystalografii, tj. przy uwzględnieniu istnienia osi 5-, 
7-, 8-, ...-krotnych, liczba klas symetrii staje się nie¬ 
skończona. Łatwo jest wtedy utworzyć z klas symetrii 
szeregi, z których każdy kończy się klasą zawierającą 
oś symetrii o krotności nieskończonej (oo lub L x ) t 
np.: 1, 2, 3, 4, 5, 6,... ,oo; 2, 222, 32, 422,52,622, 
... , oo2; m, mml, 3 m, 4 mm, 5m, 6mm, ... , oo mm itp. 
Klasy symetrii (grupy punktowe), w których wystę- 
grupy pują osie o krotności nieskończonej, nazywają się gru- 
graniczne parni granicznymi. Jak pokazał P. Curie, grup takich 
jest siedem; mają one symbole: oo, oo2, oo/m, oo mm, 
oo jmm, oooo, ooo om. Grupy graniczne znajdują zasto¬ 
sowania przy opisywaniu fizycznych własności krysz¬ 
tałów. 

układy krys- Układem krystalograficznym nazywa się zespół klas 
taiograficzne symetrii, których elementy symetrii powodują jedna¬ 
kowa ograniczenia stałych sieciowych (np. w układzie 
tetragonalnym obecność osi X 4 powoduje równość 
krawędzi a i b w komórce elementarnej oraz wymaga, 
by kąty a, /?, y były kątami prostymi). Wszystkie klasy 
danego zespołu można opisać przy użyciu takiego 
samego układu osi odniesienia scharakteryzowanego 
przez stałe sieciowe. 

Jak pokazano w tabeli (Układy krystalograficzne 
i klasy symetrii) istnieje sześć układów krystalogra¬ 
ficznych: trójskośny, jednoskośny, rombowy, tetra- 
gonalny, heksagonalny i regularny. Niekiedy (w fizyce 
ciała stałego i w mineralogii) heksagonalne klasy sy¬ 
metrii z trójkrotną osią symetrii wydziela się jako 
odrębny układ — trygonalny, w którym komórka 
elementarna ma kształt romboedru (a = b = c, a = 
= fi = y 90°). Z punktu widzenia krystalografii 
strukturalnej nie jest to słuszne, gdyż sieć przestrzenna 
zarówno w obecności osi 6, jak i osi 3 jest taka sama, 
nie ma więc odrębnej sieci „trygonalnej”, a poza tym 
prymitywną komórkę elementarną o kształcie rombo- 



Rys. 25. Prymitywna komórka trygonalna (a) jako centrowana 
komórka heksagonalna typu R (c) i związek między tymi komór¬ 
kami (b) 


edru można zawsze przedstawić (rys. 25) jako podwój¬ 
nie centrowaną komórkę heksagonalną typu JR. Tak 
więc w krystalografii strukturalnej rozróżnia się 6 
układów krystalograficznych, łącząc co najwyżej 
klasy z osią 3 w tzw. podukład trygonalny. 


Zewnętrzne postacie kryształów 

'Jak już niejednokrotnie wspomniano, kryształy pod¬ 
czas swego wzrostu dążą do otaczania się płaskimi 
ścianami. W rezultacie povrstają zwykle wielościano- 
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w:e postacie kryształów, nieraz bardzo oryginalne, 
bardzo skomplikowane, a najczęściej bardzo ładne. 
Ściany na krysztale nie tworzą się w sposób dowolny, 
są one ściśle związane z sieciową budową wewnętrzną 
kryształów i ich symetrią. 

Zespoły ścian na krysztale nazywa się postaciami 
krystalograficznymi, wśród których rozróżnia się po¬ 
stacie proste i postacie złożone. 

Postać prostą stanowi zespół ścian symetrycznie 
równoznacznych, tzn. związanych ze sobą elementami 
symetrii. Taki zespół ścian otrzymuje się w rezultacie 
poddania jednej ściany działaniu elementów symetrii 
danej klasy symetrii. Postaci prostych jest 47 (rys. 26). 
Postać prostą oznacza się symbolem, którym są 
wskaźniki jednej ze ścian tej postaci ujęte w nawias 
klamrowy: {hkl}; np. sześcian oznacza się symbolem 
{100}, a ośmiościan: {111}. 

Postacią prostą ogólną nazywa się postać, której 
ściany nachylone są skośnie względem elementów sy¬ 
metrii lub osi krystalograficznych. Ściany postaci 
ogólnej mają zawsze symbol typu (hkl), np. (321). 
Postacie proste szczególne mają ściany prostopadłe, 
równoległe, albo nachylone symetrycznie względem 
elementów symetrii lub osi krystalograficznych; sym¬ 
bolami takich ścian są np. (100), (110), (111), (221). 
W każdej klasie symetrii występuje jedna postać pro¬ 
sta ogólna {hkl} i kilka postaci prostych szczególnych, 
np. {100}, {110}, {hhl} itd. Ściany postaci prostych 
zamkniętych (np. czworościanu, sześcianu, podwój¬ 
nych piramid) całkowicie ograniczają część przestrze¬ 
ni, natomiast ściany postaci prostych otwartych 
(np. dwuścianu, słupów, piramid) nie zamykają prze¬ 
strzeni. 

Kryształ, na którym występują ściany kilku postaci 
prostych, ma postać złożoną (rys. 27). Bardzo często 
spotykane są kryształy, których postać zewnętrzna 
jest kombinacją kilku czy kilkunastu nawet postaci 
prostych ogólnych i szczególnych. 

W klasycznej nauce o postaciach prostych wystę¬ 
pują postacie o jednakowych nazwach i jednakowych 
kształtach (zarysach ścian), lecz różniące się syme¬ 
trią. Wśród postaci prostych istnieje np. tylko jeden 
jednościan występujący zarówno na kryształach trój- 
skośnych, jak i na kryształach jednoskośnych, rom¬ 
bowych, tetragonalnych czy heksagonalnych. A. W. 
Szubnikow zauważył, że chociaż w geometrii wystę¬ 
puje tylko jeden sześcian, to w krystalografii jest ich 
pięć — o różnej symetrii, występujących w pięciu 
klasach symetrii układu regularnego. Podobnie i jed¬ 
nościan ma inną symetrię w układzie np. jednoskoś- 
nym, a inną w układzie rombowym, tetragonalnym 
czy heksagonalnym. Jeżeli dla poszczególnych postaci 
prostych, występujących w różnych klasach symetrii 
uwzględni się symetrię tych klas, to okazuje się, że 
postaci prostych jest nie 47, lecz 146, a nawet 193, gdy 
weźmie się jeszcze pod uwagę odmiany enancjomor- 
ficzne istniejące dla niektórych postaci (G. B. Bokij). 
Uwzględnienie przy charakteryzowaniu postaci pro¬ 
stych elementów symetrii grup przestrzennych dopro¬ 
wadziło do wyprowadzenia 1403 strukturalnych od¬ 
mian postaci prostych (I. 1. Szafranowskij). Dwie 
odmiany strukturalne jednej postaci prostej są różne 
wtedy, gdy ich ściany różnią się elementami symetrii 
swojej grupy przestrzennej. W ten sposób sześcian ma 
np. 36 odmian strukturalnych. 

Pełniejszy opis kryształów rzeczywistych uwzględ¬ 
niający różne nieprawidłowości ich rozwoju wymagał 
rozszerzenia nauki o postaciach prostych w jeszcze 
inny sposób. Wprowadzono w tym celu pojęcie po¬ 
staci prostej krawędziowej i postaci prostej wierz¬ 
chołkowej. W tym ujęciu 47 krystalograficznych po¬ 
staci prostych nazywa się postaciami ścianowymi. 

Postać prostą wierzchołkowy stanowi zespół na¬ 
roży kryształu otrzymywanych jedno z drugiego za 

Rys. 27. Przykład kryształu o postaci złożonej: beryl — klasa 
symetrii 6/mmm; postacie proste: k podwójna piramida dyheksa- 
gonalna, Imn podwójne piramidy heksagonalne, o dwuścian, p 
słup heksagonalny 
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29 - Encyklopedia fizyki współczesnej 
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pomocą elementów symetrii. Postacie wierzchołkowe 
mogą być płaskie i przestrzenne. Postaci wierzchołko¬ 
wych płaskich jest 10, a przestrzennych — 47. Przy¬ 
kładem płaskich postaci wierzchołkowych mogą być 
zgrubienia na końcach śnieżynek (rys. 28). 




Rys. 28. Śnieżynki — przykłady postaci wierzchołkowych 


Postacią prostą krawędziową nazywa się zespół 
jednakowych krawędzi kryształu wyprowadzonych 
z jednej krawędzi za pomocą elementów symetrii 
(W. I. Michiejew, 1.1. Szafranowskij). Postaci krawę¬ 
dziowych płaskich jest 27, a przestrzennych 303. 
Przykładem postaci krawędziowych są śnieżynki, 
kryształy cerusytu oraz wszystkie możliwe złożone 
zbrużdżenia ścian kryształów (rys. 29, 30). 




Rys. 29. Śnieżynki — przykłady postaci krawędziowych 


kryształu. Sieć przestrzenna idealnego kryształu jest 
tworem jednorodnym, nie wykazującym zakłóceń 
w żadnym kierunku. Zewnętrzna i wewnętrzna budo¬ 
wa kryształów, zarówno naturalnych jak i otrzymy¬ 
wanych sztucznie najczęściej wykazuje wiele niedo¬ 
skonałości i odbiega znacznie od idealnych modeli 
przedstawianych przez teorie symetrii i sieciowej bu¬ 
dowy kryształów. Takie niedoskonałe kryształy na¬ 
zywa się kryształami rzeczywistymi. O tym, jak może 
wyglądać zewnętrzna postać rzeczywistych kryszta¬ 
łów kwarcu a, w porównaniu z kryształem idealnym, 
daje pewne wyobrażenie rys. 32. 


kryształ 

rzeczywisty 



Stwierdzono, że kryształy rzeczywiste zbudowane 
są najczęściej z bloków wielkości rzędu 10“ 5 cm 
(lub mniej) o prawidłowej budowie sieciowej, jednak 
nieznacznie skręconych względem siebie (rys. 33). 

Kryształ mający tego rodzaju budowę wewnętrzną na- kryształ 
żywa się kryształem mozaikowym. mozaikowy 


Rys. 30. Zbrużdżenia ścian kryształów — przy¬ 
kłady postaci krawędziowych, a) sfalcryt, b) pi¬ 
ryt, c) arsenopiryt 




Między postaciami wierzchołkowymi, krawędzio¬ 
wymi i ścianowymi istnieją wzajemne powiązania. 
Widoczne jest to np. na szkieletowym krysztale soli 
kuchennej o kształcie piramidalnego lejka (tego ro¬ 
dzaju kryształy pływają na powierzchniach słonych 



jezior). Maleńkie wierzchołkowe sześciany łączą się ze 
sobą podczas wzrostu kryształu i tworzą krawędziowe 
słupki, które nakładając się na siebie przechodzą w 
ścianki wklęsłego lejka — piramidki (rys. 31). 


Kryształy idealne i kryształy rzeczywiste 

Na krysztale idealnym wszystkie ściany należące do 
jednej postaci prostej mają ten sam kształt i tę samą 
wielkość oraz są jednakowo oddalone od środka 



Rys. 33. Schemat mozaikowej budowy kryształu 


W budowie sieci krystalicznej występują lokalne 
zakłócenia prawidłowości jej budowy, zwane defekta¬ 
mi punktowymi. Zasadniczymi typami tych defek¬ 
tów są defekty Frenkla, polegające na przesunięciu 
atomów (jonów) z węzłów sieci do przestrzeni mię¬ 
dzywęzłowych (rys. 34). oraz defekty Schottky’ego 
(wakansje), polegające na nieobsadzeniu przez atomy 
(jony) części węzłów sieci (rys. 35). 

Innym rodzajem niedokładności w budowie sieci 
przestrzennej kryształów są dyslokacje, będące defek¬ 
tami liniowymi. Dyslokacje polegają na przesunięciu 
części płaszczyzn sieciowych w stosunku do innych, 
przy zachowaniu spójności sieci. Istnieją dyslokacje 
krawędziowe, śrubowe i mieszane. Jeżeli jedna z pła- 


defekty 

punktowe 



Rys. 34. Defekty 
Frenkla 
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dyslokacje szczyzn sieciowych urywa się we wnętrzu sieci prze¬ 
strzennej, to wewnętrzny brzeg tej płaszczyzny tworzy 
dyslokację krawędziową (rys. 36). Dyslokacja śrubowa 
istnieje w krysztale wówczas, gdy płaszczyzny siecio¬ 
we jedynie w przybliżeniu są do siebie równoległe 
i połączone są ze sobą w taki sposób, że sieć prze¬ 
strzenna kryształu stanowi jakby jedną płaszczyznę 
sieciową, tworzącą powierzchnię śrubową (rys. 37). 
W dyslokacjach mieszanych można rozróżnić dyslo¬ 
kacje składowe: krawędziową i śrubową. 

Wiele właściwości fizycznych ciał krystalicznych 
zależy nie tylko od ich składu chemicznego i ich struk¬ 
tury, ale także od istniejących w nich rozmaitych de¬ 
fektów. Defekty mają wpływ m.in. na własności op¬ 
tyczne, półprzewodnikowe, magnetyczne, elektryczne 
i cieplne ciał krystalicznych oraz na ich wytrzymałość 
mechaniczną, a także na wzrost kryształów. 


Grupy przestrzenne 

Różne możliwe w strukturach ciał krystalicznych 
kombinacje makroskopowych i strukturalnych ele¬ 
mentów symetrii tworzą grupy przestrzenne. Tak jak 
grupy punktowe (klasy symetrii) charakteryzują sy¬ 
metrię zewnętrznych postaci kryształów, tak grupy 
przestrzenne charakteryzują symetrię struktur krysz¬ 
tałów. Istnieje 230 grup przestrzennych. Każdy układ 
krystalograficzny obejmuje pewną liczbę grup prze¬ 
strzennych, podzielonych z kolei między poszczególne 

• ••••• klasy symetrii. 

Grupy przestrzenne opisuje się zwykle za pomocą 

•••••• tzw. symboli międzynarodowych, składających się 

• • • • • z dużej litery oznaczającej typ sieci Bravais*go, liczb 

• »•••• oznaczających osie symetrii zwykłe, inwersyjne lub 

śrubowe i małych liter oznaczających płaszczyzny sy- 

• # # # # metrii lub płaszczyzny poślizgu. Międzynarodowy sym- 

• • • • • boi grupy przestrzennej jest tak skonstruowany, że 

• • • » • • na jego podstawie można wyznaczyć wszystkie ele- 

Rys. 35. Defekty m enty symetrii w danej grupie przestrzennej i okre- 
siottky’ego śiić ich rozmieszczenie w komórce elementarnej. 

Każdej grupie przestrzennej odpowiada tylko jedna 
klasa krystalograficzna, którą można łatwo wyzna- 
symbofe czyć dla danej grupy przestrzennej, zamieniając w tej 
grup prze- ostatniej wszystkie osie śrubowe i płaszczyzny poślizgu 
strzennych na zwykłe osie i płaszczyzny oraz przesuwając równo¬ 
legle wszystkie elementy symetrii tak, by przecinały 
się w jednym punkcie. W podobny sposób (zamienia¬ 
jąc strukturalne elementy symetrii na makroskopowe 
i odrzucając symbol sieci Bravais’go) z symbolu grupy 
przestrzennej można uzyskać symbol klasy krystalo¬ 
graficznej, do której dana grupa przestrzenna należy, 
np.: Pcal l mml (to oznacza, że grupa Pcal x należy 
do klasy mml w układzie rombowym). 

Każda grupa przestrzenna ma właściwe sobie tzw. 
zespoły pozycji symetrycznie równoznacznych, czyli 
przestrzenne układy punktów związanych ze sobą 
elementami symetrii. Każdy taki zespół punktów po¬ 
wstaje z jednego punktu wyjściowego (a więc mamy 
tu „rozmnożenie” punktu) przez poddanie go działa¬ 


niu wszystkich elementów symetrii danej grupy prze- liczebność 
strzennej. Liczba punktów znajdujących się w jednej (krotność) 
komórce elementarnej, czyli tzw. liczebność lub krot- pozycji 
ność pozycji, może być różna w różnych zespołach 
pozycji danej grupy przestrzennej i jest zależna od 
położenia punktu wyjściowego względem elementów 
symetrii. W każdej grupie przestrzennej istnieje jeden 
zespół pozycji symetrycznie równoznacznych w poło¬ 
żeniu ogólnym i kilka zespołów pozycji w położeniach 
szczególnych. Zwykle w kryształach tylko niektóre 
zespoły pozycji danej grupy przestrzennej są obsadza¬ 
ne przez atomy (jony, cząsteczki). 

Symetrię grup przestrzennych i zespoły pozycji sy¬ 
metrycznie równoznacznych przedstawia się graficz¬ 
nie w rzucie na jedną ze ścian komórki elementarnej, 
zwykle na płaszczyznę XY. Takie rzuty dla trzech 
grup przestrzennych należących do układu rombowe¬ 
go pokazano na rys. 38, 39, 40. Na rysunkach tych 
wyraźnie widać różnice, w przestrzennych ugrupowa¬ 
niach punktów i w liczebności pozycji ogólnej, zależne 
od zmiany elementów symetrii i typu sieci Bravais ł go 
w obrębie jednej klasy symetrii. 

Badanie struktury każdego ciała krystalicznego 
rozpoczyna się od wyznaczenia: jego stałych siecio- 
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Rys. 38. Grupa przestrzenna Pca2 1 (klasa symetrii mm): a) Roz¬ 
mieszczenie elementów symetrii w komórce elementarnej; wszy¬ 
stkie elementy symetrii są prostopadłe do płaszczyzny rysunku, 
b) Zespół pozycji symetrycznie równoznacznych w położeniu 
ogólnym; znak + oznacza, że punkt znajduje się nad płaszczyzną 
rysunku w odległości z od niej; przecinek wpisany w kółko ozna¬ 
cza, że dany punkt powstał w wyniku odbicia w płaszczyźnie sy¬ 
metrii (zwykłej lub poślizgu); l } 2 + przy punkcie znaczy, że punkt 
znajduje się nad płaszczyzną rysunku na wysokości z- j- l / 2 odcinka 
translacji prostopadłego do płaszczyzny rysunku, liczebność po¬ 
zycji ogólnej 4; współrzędne punktów; xyz; x,y,' L f t ,-\-z\ l l 3 —x, 
y> l it + z\ 1 U J rX,y y z 
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Rys. 39. Grupa przestrzenna Pba2 (klasa symetrii mm): a) ele¬ 
menty symetrii, b) zespół pozycji symetrycznie równoznacznych 
w położeniu ogólnym; liczebność pozycji 4; współrzędne punk¬ 
tów: xyz, xyz ; l f s —x, 1 l i -i-y,z\ l / 2 ±x > l f 2 —y,z 
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Rys. 40. Grupa przestrzenna Iba2 (klasa symetrii mm): a) ele¬ 
menty symetrii, b) zespół pozycji symetrycznie równoznacznych 
w położeniu ogólnym; liczebność pozycji 8; współrzędne punktów: 
xyz; xyz; x t y?!«+z\ x,y, l l 2 +z; l f 2 +x, l l 2 -y y z; l ł 2 ~x, 1 U+y,z; 
Va - *,V* —y, l h + Z\ 1 lz+x, l !i +y,'l 2 +r 
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znaczenie 
grup prze¬ 
strzennych 


struktura 

mocznika 


wych, liczby atomów (jonów, cząsteczek) znajdują¬ 
cych się w komórce elementarnej oraz grupy prze¬ 
strzennej. Bez znajomości grupy przestrzennej jest 
wręcz niemożliwe dalsze badanie struktury, tj. wy¬ 
znaczenie pozycji atomów w komórce elementarnej. 
Z kolei bez znajomości współrzędnych • xyz • atomów 
nie można określić długości wiązań, kątów między 
wiązaniami, wzajemnej konfiguracji atomów a w re¬ 
zultacie i kształtu czy to np. kompleksowego jonu 
czy też całej cząsteczki. 

Dlaczego tak ważne jest wyznaczenie grupy prze¬ 
strzennej? Otóż wydawałoby się, że atomy czy zespoły 
atomów mogą w komórkach elementarnych ciał kry¬ 
stalicznych zajmować miejsca zupełnie dowolne, naj¬ 
wyżej określone położeniem atomu w cząsteczce. 
Tymczasem tak nie jest. W komórkach elementarnych 
atomy zajmują miejsca w określonych zespołach po¬ 
zycji symetrycznie równoznacznych i to najczęściej 
tak, aby liczba atomów jednego rodzaju była zgodna 
z liczebnością pozycji. Tak więc, znajomość grupy 
przestrzennej ciała krystalicznego zmniejsza nieogra¬ 
niczoną liczbę dowolnych położeń w komórce ele¬ 
mentarnej dla każdego z atomów, do ściśle określo¬ 
nych zespołów pozycji. Przy badaniu struktury krysz¬ 
tału zadanie sprowadza się więc do określenia, który 
zespół pozycji zajmowany jest przez dany rodzaj 
atomów. W obrębie danego zespołu wystarczy już 
tylko wyznaczyć parametry x,y,z dla jednego (!) 
atomu. Współrzędne pozostałych atomów zajmują¬ 
cych tę pozycję dane są wówczas niejako automatycz¬ 
nie. Warto tu wspomnieć, że liczebności pozycji są 
nieraz bardzo wysokie, np. 16, 24, 32, a w niektórych 
grupach przestrzennych układu regularnego — 48, 96 
a nawet 192(1). Należy zauważyć, że mogą istnieć 
i takie kryształy, w których kilka różnych rodzajów 
atomów może zajmować kilka pozycji ogólnych o róż¬ 
nych parametrach x,y,z, a są i takie kryształy, w któ¬ 
rych atomy zajmują wyłącznie pozycje szczególne (np. 
kryształy Au, NaCl). Struktury różnych związków 
chemicznych należące do jednej grupy przestrzennej 
mogą więc różnić się między sobą rodzajami i liczbą 
zajętych przez atomy zespołów pozycji symetrycznie 
równoznacznych, a także wartościami liczbowymi 
parametrów x,y,z punktu przyjętego za wyjściowy 
w danym zespole pozycji. 

Zobaczymy teraz, jak realizowane są w konkret¬ 
nych przypadkach podane wyżej definicje i zależności. 
Rozpatrzmy w tym celu strukturę związku chemicz¬ 
nego o wzorze CO(NH 2 ) 2 , nazywanego mocznikiem 
lub karbamidem. 

Mocznik krystalizuje w układzie tetragonalnym, 
w klasie skalenoedru tetragonalnego 42m, w grupie 
przestrzennej P42 x m. Kryształy ograniczone są zwykle 
ścianami czworościanu tetragonalnego {111} i słupa 
tetragonalnego {110}. W komórce elementarnej o 
krawędziach a — 5,661 A, c — 4,712 A znajdują się 
dwie cząsteczki COONHa)^ Cząsteczka CO(NH 2 )2 
jest płaska, tj. wszystkie jej atomy leżą w jednej 
płaszczyźnie. Symetria własna cząsteczki jest mm. 
W komórce elementarnej należy w sumie rozmieścić: 
dwa atomy tlenu, dwa atomy węgla, cztery atomy 
azotu i osiem atomów wodoru. Stwierdzono, że atomy 
tlenu zajmują pozycję szczególną o liczebności 2 
o współrzędnych 02'zii0z(zo = 0,5998); atomy węgla 
zajmują tę samą pozycję, z tym tylko, że inna jest 
wielkość parametru z (z c — 0,3308); atomy azotu 
zajmują pozycję szczególną o liczebności 4, o współ¬ 
rzędnych xa—x, z; x ,2 J rx y z\ i— XyX,z ; j -f x,x, z (xx = 
= 0,1419, zn = 0,1857). Atomy wodoru zajmują dwa 
te same zespoły pozycji co i atomy azotu, oczywiście 
przy innych parametrach x i z (jchi = 0,2390, zhi — 
= 0,2770, *h 2 = 0,1240, zh 2 = 0,0460). Jak widać, 
w krysztale mocznika pozycja ogólna grupy prze¬ 
strzennej wcale nie jest zajęta przez atomy. 

Strukturę mocznika badano metodami rentgeno- 
strukturalnymi, elektronograficznymi i neutronogra¬ 
ficznymi. Dla znajdujących się w komórce elementar¬ 
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nej 16 atomów należało wyznaczyć 48 parametrów 
x,y,z. Jednakże ze względu na symetrię grupy prze¬ 
strzennej, wystarczy w tej strukturze znaleźć położenia 
tylko jednego atomu tlenu, jednego atomu węgla, 
jednego atomu azotu i dwóch atomów wodoru (czyli 
położenia tylko 5 atomów (!); położenia pozostałych 
atomów wynikają automatycznie z zespołów pozycji 
symetrycznie równoznacznych), a więc w sumie wy¬ 
znaczenie 15 parametrów x,y,z. Jak się okazało, 
ze względu na to, że atomy zajmują pozycje szczególne 
wystarczające było określenie tylko 8 (!) parametrów 
(z 0 , zc, xx> z Nt xhi, zhi, *h 2 , z H2 ). Tak więc znajo¬ 
mość grupy przestrzennej zredukowała liczbę koniecz¬ 
nych do wyznaczenia parametrów z 48 do 8. Położenie 



Rys. 41. Struktura mocznika COtNH*)*: a) Rzut struktury na 
płaszczyznę XY\ zaznaczono położenie osi czterokrotnych in- 
wersyjnych w jednej komórce elementarnej, b) Elementy symetrii 
grupy przestrzennej P42 x m 


cząsteczek mocznika w komórce elementarnej oraz 
usytuowanie ich względem elementów symetrii grupy 
przestrzennej P42 x m pokazane jest na rys. 41. Na 
podstawie współpśędnych xyz atomów można łatwo 
obliczyć długości wiązań między atomami, kąty mię¬ 
dzy wiązaniami oraz określić kształt cząsteczki (rys. 

22). Cząsteczki połączone są między sobą wiązaniami 
wodorowymi: każdy atom tlenu tworzy cztery wiąza¬ 
nia wodorowe z atomami azotu należącymi do trzech 
różnych cząsteczek (rys. 2). 

Jak wynika z opisu struktury mocznika, w komórce 
elementarnej pewna liczba atomów (5 — w opisywa¬ 
nym przypadku) tworzy swego rodzaju zespół powta¬ 
rzany elementami symetrii grupy przestrzennej w ca¬ 
łej objętości komórki elementarnej (no i w całym 
krysztale). Taka grupa atomów nazywa się motywem mo tyw 
struktury, a część komórki elementarnej, w której struktury 
znajduje się motyw, jest asymetryczną częścią ko¬ 
mórki. Znając grupę przestrzenną danego ciała kry¬ 
stalicznego wystarczy wyznaczyć współrzędne ato¬ 
mów tylko w motywie struktury, a następnie można 
powtórzyć ten motyw w całym krysztale. 

Podobne zależności występują także w strukturach 
innych pierwiastków czy związków chemicznych. 


Problemy krystalografii 
współczesnej 


Przedstawiona teoria symetrii jest już dziś teorią 
klasyczną, dotyczącą kryształów idealnych. Niewzru- 
szoność praw klasycznej krystalografii zostaje poważ¬ 
nie zachwiana, gdy budowa kryształów odbiega od 
idealnej symetrii sieciowej. Przyjmuje się, że w krysz¬ 
tałach idealnych każdy tego samego rodzaju atom, 
pełniący w strukturze tę samą funkcję, znajduje się w 
jednakowych warunkach geometrycznych i fizycz¬ 
nych. W rzeczywistości takie kryształy w przyrodzie' 
nie występują i bardzo trudne jest ich otrzymanie 
sztuczne. Idealny kryształ musiałby być w zasadzie 
kryształem nieskończonym, stwierdzono bowiem, że 








struktury 

biologiczne 


mono¬ 

kryształy 


na powierzchni kryształu atomy układają się inaczej 
niż w jego wnętrzu. 

W latach trzydziestych rentgcnostrukturalne meto¬ 
dy badania kryształów zaczęto stosować do badania 
struktur biologicznych, m.in. kryształów białek. I tu 
zaczęły się dziać dziwne rzeczy, gdyż wkrótce okazało, 
się, że metody klasycznej krystalografii są niewystar¬ 
czające dla interpretacji wyników tych badań. Ogólnie 
przyjmuje się, że kryształami są struktury uporządko¬ 
wane w trzech kierunkach przestrzeni. Możliwe są 
jednak i struktury uporządkowane tylko w jednym 
lub dwu wymiarach. Struktury takie nie podlegają 
ograniczeniom klasycznej krystalografii. Mogą w nich 
występować np. 5- i 7-krotne osie symetrii, a jednost¬ 
kami strukturalnymi mogą być prócz atomów, jonów 
czy cząsteczek np. wirusy (il. 64, tabl. 17). Wiele 
struktur biologicznych tworzy kryształy dwuwymia¬ 
rowe. Powierzchniami dwuwymiarowych kryształów 
są otwarte cylindry i zamknięte kule, na których roz¬ 
mieszczane są równoważne cząstki. Doświadczalnie, 
metodą dyfrakcji promieni rentgenowskich stwier¬ 
dzono istnienie wirusów mających postać kul, cylin¬ 
drów oraz wielościanów. 

W wyniku badań rentgenostrukturalnych okazało 
się, iż symetria heliksów a w białkach fibrylarnych 
nie mieści się w klasycznej teorii symetrii kryształów, 
gdyż np. w polipeptydzie na jeden zwój heliksu nie 
przypada całkowita liczba grup aminokwasowych 
(jest to sprzeczne z własnościami klasycznej osi śru¬ 
bowej). Bywa np., że 18 reszt aminokwasowych mieści 
się w 5 zwojach heliksu, co w sumie daje osiemnasto- 
krotną oś śrubową o składowej translacyjnej s / 18 . 
Symbol takiej osi: 18 s . 

Wirusy globularne krystalizują na tyle dobrze, że 


można otrzymać obrazy dyfrakcyjne ich monokry¬ 
ształów. Kryształy wirusa zarazy pomidorowej mają 
komórkę elementarną w kształcie sześcianu (a = 

= 386 A), lecz symetria tej komórki nie należy do 
układu regularnego. Dla poszczególnych cząsteczek 
wirusa j charakterystyczna jest symetria ikosaedru 
i w związku z tym nic mają one symetrii krystalogra¬ 
ficznej. Ikosaedr (rys. 42) jest wielościanem zbudowa¬ 
nym z 20 ścian będących jednakowymi równobocz- Rys. 42. Ikosaedr 
nymi trójkątami. W ikosaedrzc istnieje 6 pięciokrot¬ 
nych osi symetrii, 10 trójkrotnych i 15 dwukrotnych 
osi symetrii. Taka symetria charakterystyczna jest dla 
wszystkich „sferycznych” wirusów roślinnych i nie¬ 
których wirusów ssaków. 

Z tych przykładów widać, że zaistniała potrzeba 
stworzenia nowej, uogólnionej, rozszerzonej krystalo¬ 
grafii, w której proste i płaszczyzny sieciowe zostałyby 
zastąpione dowolnymi krzywymi i powierzchniami 
pełniącymi ich rolę w strukturach. Klasyczna krysta¬ 
lografia, z jej prostymi i płaszczyznami sieciowymi 
byłaby szczególnym przypadkiem tej nowej, uogól¬ 
nionej krystalografii (-► Współczesne teorie symetrii 
w krystalografii). 
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Otrzymywanie monokryształów 

Zdzisław Sołtys 


Duże, przejrzyste pojedyncze kryształy zawsze wzbu¬ 
dzały podziw ludzi symetrią swojego kształtu, zdol¬ 
nością załamywania światła i barwami, a jeśli odzna¬ 
czały się przy tym twardością, nazywano je kamie¬ 
niami szlachetnymi. Niektóre kamienie szlachetne, 
pojedyncze kryształy minerałów, szczególnie po od¬ 
powiedniej obróbce 'szlifierskiej, oprawione w złoto 
lub platynę używane były i są jako cenne ozdoby. 
Najpiękniejsze i najdroższe okazy kryształów od wielu 
wieków przechowywane są w skarbcach władców, 
w prywatnych kolekcjach miłośników minerałów lub 
w muzeach. 

Rozwój nauk przyrodniczych, głównie fizyki ciała 
stałego, stworzył zapotrzebowanie na duże pojedyn¬ 
cze kryształy wielu substancji nieorganicznych i orga¬ 
nicznych. W krótkim czasie okazało się, że naturalne 
źródła są niewystarczające lub w ogóle nie istnieją. 
Stan taki spowodował rozwój laboratoryjnych i prze¬ 
mysłowych metod wytwarzania dużych, pojedynczych 
kryształów zwanych monokryształami. Właściwy 
rozwój metod wytwarzania monokryształów rozpo¬ 
czął się od czasu wynalezienia tranzystora przed 30 
laty. Zastosowanie monokryształów jako materiałów 
konstrukcyjnych głównie w elektronice, a także w in¬ 
nych gałęziach techniki, stało się początkiem tzw. re¬ 
wolucji materiałowej (tabela). 

Obecnie coraz mniej stosuje się materiałów w po¬ 
staci naturalnej łub drobnokrystalicznej zastępując je 
monokryształami. Materiały monokrystaliczne odzna¬ 
czające się doskonałą jednorodnością fizyczną i che¬ 
miczną ujawniły nowe właściwości, nie wykazywane 
przez te same materiały w postaci naturalnej —- za¬ 
nieczyszczonej lub drobnokrystalicznej. (Szczególnie 
interesujące mogą okazać się właściwości polimerów 
organicznych w postaci monokrystalicznej). Od mono¬ 
kryształów nie wymaga się zewnętrznego podobień- 


Zastosowanie niektórych materiałów monokrystalieznych 


Zastosowanie 


Monokryształy* 


Przyrządy półprzewodnikowe: diody 
tranzystory, układy scalone 

Lasery półprzewodnikowe 

Generatory zc stabilizacją 
częstotliwości 

Modulatory i rezonatory laserowe 
wzmacniacze parametryczne 


Si, Ge, GaAs 

rubin AI 3 0 3 :Cr, 
CaWO,, CaF 2 , GaAs 
kwarc a-SiO, 

KH 6 PO„ LiNbO,, 
LiTa0 3 , 

(Ba, NaKNbO,), 


Przetworniki elektromechaniczne 
(piezoelektryczne) 

Przyrządy optyczne: soczewki, 
pryzmaty, polaryzatory 
Optyka w podczerwieni: 

soczewki, pryzmaty 
Przyrządy luminescencyjne 
Detektory promieniowania 


Wzmacniacze ultradźwiękowe 
Wzmacniacze mikrofalowe 
Podzespoły mikrofalowe magnet. 

Elementy pamięci maszyn 
cyfrowych 


Monochromatory, filtry strumienia 
neutronów 

Materiały ścierne i elementy tnące 


Łożyska w przyrządach pomiaro¬ 
wych i mechanizmach precyzyjnych 
Klejnoty i ozdoby 


kwarc «-SiO a , BaTiOj, 
GaAs, sól Seignette’a 
NaK(C 4 H 4 0*)4H,0 
kalcyt CaCOa, CaF s , 
SK> 8 , NaNO a 
Ge, Si, LiF, KBr 

GaP, Ga(As, P), GaAs 
antracen C^H,,,, KC1, 

Si, GaAs, NaJ:Tl, 

Ge: Li, NH 4 H 4 P0 4 
CdS 

rubin Ali0 5 :Cr 
granaty, np. Y,Fe 3 0« 
(YIG) 
granat 

Eu ł>g Gd lt iAI« 6 Fe 4 < 5 0 „ 
na podłożu granatu 
GdoAl.O,, 

Cu, Zn, stop 0,92 Co + 
+0,08Fe 

korund ac-Al,0», szafir 
Al 2 O a :Fc, Ti, diament C, 
węglik krzemu SiC 
szafir, korund, rubiny 

rubiny, szafiry 


zastosowanie 

monokrysz¬ 

tałów 


•Zapis Al,O a :Cr oznacza, że chrom jest niewielką domieszką 
w krysztale, celowo wprowadzonym zanieczyszczeniem. Zapis 
typu Ga(As, P) oznacza, że pewna część atomów arsenu jest 
zastąpiona przez atomy fosforu w krysztale arsenku galu GaAs. 
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stwa (choć nie zawsze) do naturalnych pojedynczych 
kryształów, ale za to wysokiej czystości chemicznej 
(wymagana dopuszczalna zawartość zanieczyszczeń 
czasem jest znacznie poniżej 10“ 6 %) oraz dużej do¬ 
skonałości krystalograficznej (jednolita sieć prze¬ 
strzenna bez dyslokacji i innych defektów w rozmiesz¬ 
czeniu atomów w krysztale, Budowa kryształów), 
braku naprężeń mechanicznych itp. Uzyskiwane mo¬ 
nokryształy powinny zawierać celowo wprowadzone 
w żądanej ilości domieszki różnych atomów rozmiesz¬ 
czonych w przestrzeni monokryształu równomiernie 
lub w inny, z góry określony sposób. Wszystkie te 
wymagania spełnia współczesna technologia wytwa¬ 
rzania monokryształów rozmaitych substancji, mimo 
że procesy monokrystalizacji (wzrostu monokryszta¬ 
łów) nie są jeszcze teoretycznie dobrze wyjaśnione. 
Umiejętność „hodowli’* monokryształów jest jeszcze 
do dziś bardziej sztuką niż nauką. 

Monokryształy tworzą się w procesie powstawania 
fazy stałej (krystalicznej) z fazy gazowej albo z fazy 
ciekłej lub w procesie przemiany jednej fazy stałej 
w inną. Powstanie fazy stałej w środowisku gazowym 
lub ciekłym polega na wytworzeniu trwałego zarodka 
po wstawanie fazy stałej i utrzymywaniu w tym ośrodku warunków, 
zarodków w których zarodek ten może rosnąć. Warunkiem ko¬ 
niecznym do wytworzenia się zarodków fazy stałej 
jest powstanie przesycenia w ośrodku gazowym lub 
w roztworze, a przechłodzenia — w ośrodku ciekłym. 
Miarą przesycenia jest różnica ciśnienia (stężenia) 
ponad ciśnienie (stężenie) równowagowe w danej tem¬ 
peraturze. Miarą przechłodzenia jest różnica tempera¬ 
tury układu poniżej temperatury topnienia fazy stałej. 
Im większe przesycenie lub przechłodzenie, tym ła¬ 
twiej i tym więcej powstaje zarodków drobnych. Dla 
uzyskania kilku trwałych i względnie dużych zarod¬ 
ków i ich dalszego wzrostu konieczne jest małe prze¬ 
sycenie (przechłodzenie). 

W hodowli monokryształów bardzo często, a w nie¬ 
których wypadkach wyłącznie, wykorzystuje się nie 
przypadkowe powstawanie zarodków fazy stałej wsku¬ 
tek przechłodzenia czy przesycenia, lecz przeprowadza 
się proces polegający na powiększeniu objętości nie- 
zarodź wielkiego monokryształu, zwanego zarodzią, umiesz- 
kryształu czonego w ośrodku dostarczającym materiału do jego 
wzrostu. Zarodzie otrzymuje się z przypadkowo po¬ 
wstałych w przesyconym lub przechłodzonym roztwo¬ 
rze zarodków, jednakże tak kieruje się procesem, aby 
powstało ich niewiele. Często duże zarodzie kształtuje 
się przez rozcinanie lub szlifowanie w postać pręci¬ 
ków o wybranej orientacji krystalograficznej powie¬ 
rzchni czołowej zarodzi. Wtedy dalszy wzrost zarodzi 
monokryształu może odbywać się tylko zgodnie z tym 
wybranym kierunkiem. 


Wzrost monokryształów 
z roztworów ciekłych 

Proces wzrostu monokryształów 
z roztworów wodnych 

Najstarszą metodą otrzymywania substancji w postaci 
krystalicznej jest hodowla kryształów z roztworów 
wodnych. Tak otrzymuje się sól kuchenną z solanek, 
nawozy sztuczne itp. Tak też wytwarza się cukier, 
pierwszą drobnokrystaliczną substancję otrzymywaną 
przemysłowo na wielką skalę, a nie występującą w 
przyrodzie w postaci krystalicznej. Zwykłe przemy¬ 
słowe procesy krystalizacji mają na celu wydzielenie 
z roztworu w maksymalnej ilości jednorodnego pro¬ 
duktu w postaci drobnych kryształów o prawie jedna¬ 
kowych rozmiarach, zaś doskonałość otrzymanych 
kryształów jest bez znaczenia. 

W procesie wytwarzania dużych kryształów o dużej 
doskonałości krystalograficznej z roztworów ciekłych 
zasadniczo nie wykorzystuje się spontanicznego po- 
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wstawania zarodków w roztworze przesyconym i ich 
dalszego wzrostu, lecz kontroluje się wzrost kryształu 
na zarodzi zawieszonej w roztworze o stałym przesy¬ 
ceniu (stałe przesycanie roztworu uzyskuje się przez 
bardzo powolne w miarę wzrostu kryształu ochładza¬ 
nie roztworu według odpowiedniego programu). 

Szybkość wzrostu poszczególnych płaskich ścian kry¬ 
ształu zawieszonego w roztworze zależy od wielu 
czynników, m.in. od stężenia, temperatury, lepkości 
roztworu, dyfuzji substancji rozpuszczonej do rosną¬ 
cej powierzchni kryształu, zawartości zanieczyszczeń 
oraz celowo dodanych domieszek. Od parametrów 
roztworu zależą także kształt otrzymywanych krysz- hodowla 
tałów i ich doskonałość. Na przykład podczas kry- soli 
stalizacji chlorku sodowego NaCl z czystego roztworu kuchennej 
powstają małe nieprzejrzyste kryształy, ale dodanie 
0,1% jonów Pb 2+ do zakwaszonego roztworu NaCl 
powoduje, że w temperaturze 75°C otrzymuje się 
spore (6x6x6 mm) przejrzyste monokryształy NaCl 
o dużej doskonałości. 

Najprostszy sposób otrzymywania monokryszta¬ 
łów polega na zawieszeniu zarodzi na nici (druciku) 
w roztworze nasyconym w temperaturze wyższej od 
temperatury otoczenia; zarodź ta podczas naturalnego 
swobodnego stygnięcia roztworu powiększa swoje 
rozmiary. Doskonalsze kryształy uzyskuje się na za- 
rodziach ruchomych. W krystalizatorze Holdena 
(rys. 1) zarodzie mocowane są na końcach prętów metoda 
wolframowych zaciśniętych w ramionach obracają- Holdena 



cego się bardzo powoli (i ze zmianą kierunku obrotu) 
mieszadła zanurzonego w naczyniu z roztworem nasy¬ 
conym. Delikatne mieszanie powoduje wyrównywanie 
się stężenia roztworu ochładzanego w sposób ciągły 
o 0,1-1,5°C na dobę. W dużych przemysłowych kry- 
stalizatorach typu Holdena otrzymuje się np. 
monokryształy fosforanu dwuwodoroamonowego 
NH 4 H 2 PO« o masie ok. 20 kg; czas wzrostu takięgo 
monokryształu wynosi 4 miesiące. 

Ogólna masa monokryształów związków nieorga¬ 
nicznych i organicznych hodowanych na świecie 
z roztworów wodnych w zwykłych temperaturach 
przekracza kilkaset ton rocznie. 


Proces wzrostu monokryształów z topnika 

W podwyższonych temperaturach stopione sole, 
tlenki, wodorotlenki lub metale stają się rozpuszczal¬ 
nikami (topnikami) innych substancji. Mieszaninę 
substancji, która ma być otrzymana w postaci mono¬ 
kryształu, i topnika, umieszcza się w tyglu odpornym 
na działanie stopu i ogrzewa się ją do stopienia. 
Skład mieszaniny dobiera się tak, aby uzyskać w top¬ 
niku roztwór nasycony substancji krystalizującej. 
Początkowo tygiel ochładza się powoli z szybkością 












kilku, kilkunastu stopni na godzinę. W pewnym mo¬ 
mencie powstaje przesycenie i rozpoczyna się tworze¬ 
nie zarodków a następnie dalszy ich wzrost, ewentu¬ 
alnie wzrost umieszczonej w tyglu zarodzi. Przez cały 
czas krystalizacji, zachodzącej zwykle w temperatu¬ 
rze 800-900°C, temperaturę tygla obniża się bardzo 
powoli, po czym ochładza się go szybciej. Chłodny 
topnik i kryształy wymywa się z tygla gorącą wodą, 
roztworami kwasów lub zasad w zależności od rodza¬ 
ju kryształów i rodzaju topnika, a następnie wytwo¬ 
rzone kryształy oddziela się od siebie. Monokryształy 
otrzymane tą metodą mogą zawierać pewną ilość za¬ 
trzymanego (okludowanego) topnika, 
hodowla Z roztworów w topniku otrzymuje się np. mono- 
tytanianu kryształy tytanianu baru BaTi0 3 ze stopionego fluorku 
baru potasowego KF (zakres temperatury krystalizacji 
1200-850°C, szybkość studzenia 1-5°C na godzinę); 
monokryształy fosforku galu GaP z roztworu w galu 
(zakres temperatury krystalizacji 1200-900°C, szyb¬ 
kość studzenia 1°C na godzinę). 


Krystalizacja hydrotermafna 

Dość dawno zauważono że kwarc, znany jako sub¬ 
stancja nierozpuszczalna w wodzie w temperaturach 
zwykłych, wykazuje pewną rozpuszczalność w tempe¬ 
raturach w pobliżu lub powyżej jej temperatury kry¬ 
tycznej (374,2°C), szczególnie jeśli do rozpuszczania 



przegroda 


łom kwarcowy 


korpus autoklawu 


zarodzie 


uszczelnienie 


głowica, autoklawu 


Rys. 2. Autoklaw do monokrystalizacji kwarcu metodą hydroter- 
malną 


użyje się słabo zasadowego roztworu. Proces nosi 
nazwę krystalizacji hydrotermalnej. Przebiega on w 
grubościennych stalowych autoklawach, pod ciśnie¬ 
niem 145 MPa (rys. 2). W autoklawie umieszcza się 
na dnie złom kwarcowy o odpowiednim uziarnieniu. 
hodowla Następnie autoklaw napełnia się roztworem wodoro- 
kwarcu a tlenku sodowego NaOH i ogrzewa w taki sposób, aby 
temperatura dołu autoklawu wynosiła ok. 400 C C, 
a temperatura obszaru krystalizacji wynosiła 360°C. 
Monokryształy kwarcu rosną w tych warunkach ok. 
6 mm dziennie w kierunku [0001]. 


Monokryształy kwaicu wyhodowane metodą hy- 
drotermalną w dużym autoklawie w Western Electric 
Company pokazane na il. 3 (tabl. 1) mają masę 
ok. 800 g każdy. Metodą hydrotermalną otrzymuje 
się i inne monokryształy, np. korundu a-A1 2 Ó 3 hodowla 
z wodnego 1 molowego roztworu węglanu sodowego korundu 
Na 2 C0 3 (temperatura krystalizacji 405°C, tempera- i magnetytu 
tura rozpuszczania 435°C), a kryształy magnetytu 
Fe 3 0 4 z 0,5 molowego roztworu wodnego chlorku 
amonowego NH 4 C1 (odpowiednie temperatury 530°C 
i 515°C). 


Wzrost monokryształów podczas 
krzepnięcia substancji stopionej 


Proces krzepnięcia stopionej substancji czyli proces 
krystalizacji przebiega pod warunkiem odprowadza¬ 
nia ciepła z fazy ciekłej i rozpoczyna się od powstania 
unoszących się w jej objętości trwałych zarodków fazy 
stałej (kryształów), jeżeli występuje, przynajmniej lo¬ 
kalnie, temperatura nieco niższa od temperatury top¬ 
nienia, tzn. jeżeli występuje lokalnie przechłodzona 
faza ciekła. Dalszy wzrost kryształów na tych zarod¬ 
kach ewentualnie na zarodziach umieszczonych w 
stopionej substancji następuje w wyniku umiejsca¬ 
wiania się atomów (jonów, cząsteczek) fazy ciekłej 
w węzłach sieci kryształu na powierzchni zarodków 
trwałych lub zarodzi. Proces taki może przebiegać w 
sposób naturalny lub może być sterowany. Wszystkie 
procesy otrzymywania monokryształów na skalę tech¬ 
niczną są procesami sterowanymi. Stosowana metoda 
wzrostu monokryształu w procesie przemiany fazy 
ciekłej w stałą zależy od właściwości fizycznych sub- 
stancj i krystalizowanęi. 

Monokryształy otrzymywane podczas krzepnięcia postać 
substancji roztopionej mają zwykle kształt prętów lub otrzymywa 
wydłużonych bloków. W temperaturze krzepnięcia nych mono- 
substancja stopiona ma dużą lepKość, iaK ze nie mogą kryształów 
wytworzyć się płaskie powierzchnie ścian charaktery¬ 
styczne dla substancji krystalicznych, uzyskiwanych 
podczas krystalizacji z roztworów lub powstające pod¬ 
czas kondensacji fazy gazowej. Otrzymywane pręty 
monokrystaliczne i bloki są właściwie krystalitami, 
jednakże powszechnie nazywa się je monokryształami. 

Niemniej cały taki krystalit — monokryształ ma jed¬ 
nolitą sieć przestrzenną, wykazującą tę samą symetrię 
i stałe sieciowe, jaką wykazuje kryształ z wykształ¬ 
conymi ścianami. Średnice monokryształów wytwa¬ 
rzanych obecnie wynoszą od kilkunastu a nawet kilku¬ 
dziesięciu milimetrów, a długości od kilku do kilku¬ 
dziesięciu centymetrów. Masa pojedynczych bloków 
monokryształów, np. krzemu, dochodzi do ok. 20 kg 
(cena takiego monokryształu wynosi nawet ponad 
20 tys. dolarów za 1 kg). Wytwarza się obecnie na 
większą skalę monokryształy ponad 50 pierwiastków, 
bardzo wielu związków chemicznych, a nawet mono¬ 
kryształy niektórych stopów. W większości metod 
otrzymywania monokryształów podczas krzepnięcia 
stopionej substancji wykorzystuje się gotowe zarodzie. 


Monokrystalizacja metodą 
Bridgirtana-Stockbargera 

Najpowszechniej stosowaną metodą wytwarzania za¬ 
rodków kryształu we wstępnej fazie procesu jest meto¬ 
da Bridgmana-Stockbargera. Sterowanie wzrostem 
zarodków powstających w obszarze gradientu tem¬ 
peratury w ampule-tyglu polega na odpowiednim 
ukształtowaniu dna tygla. Tylko zarodek ułożony 
równolegle do osi pionowej może rosnąć i wypełnić 
całą ampułę. Wszystkie inne zarodki kończą swój 
wzrost na ściance wydłużonej części dna ampuły-tygla. 
Po zakończeniu tej fazy tygiel opuszcza się mechanicz¬ 
nie w dół niecą — w obszar o niższej temperaturze — 
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z prędkością kilku milimetrów na godzinę i uzyskuje Istnieją liczne odmiany metody Czochralskiego do- 
się ostatecznie monokryształ wypełniający ampułę-ty- stosowane do właściwości substancji (tabela). Proces 
giel (rys. 3). Ampułę (łódkę) można również umieścić wyciągania kryształów prowadzi się w atmosferze 



pokrywa 


uchwyt metalowy 

Rys. 3. Schemat urządzenia do otrzymywania monokryształów 
metodą Bridgmana-Stockbargera 


przegroda 


piec / 


piec // 


granica faz 


monokryształ 


w piecu poziomo. Substancje łatwo parujące lub roz¬ 
kładające się w temperaturze niższej niż temperatura 
topnienia umieszcza się w szczelnie zespawanych am- 
pułach, zwykle kwarcowych, ustawionych poziomo, 
zastosowanie Metodę Bridgmana-Stockbargera stosuje się przy 
motody wytwarzaniu monokryształów związków półprzewod- 
Bridgmsraa- nikowych łatwo rozkładających się poniżej tempera- 
Stcckbar- tury topnienia, większości metali oraz niektórych 
gera związków nieorganicznych i organicznych (tabela). 


Przykłady monokrystałizacji metodą Bridgmana-Stock¬ 
bargera 


Substancja 

Tempera¬ 
tura top¬ 
nienia 
°C 

Gra¬ 

dient 

tempe¬ 

ratury 

°C/mm 

Szyb¬ 

kość 

wzrostu 

(opusz¬ 

czania 

tygla) 

mm/h 

Mate¬ 

riał 

tygla 

(ampu- 

ły) 

Atmosfe¬ 

ra 

Argon Ar 

-189,4 

0.5 

60 

szkło 

argon 

Miedź Cu 
Fluorek wap¬ 

1083 

12 

16 

grafit 

azot 

nia CaF a 

1392 

10 

1 

grafit 

próżnia 

Arsen As 

814 

(3,6 MPa) 

8 

(pozio¬ 

my) 

ok.10 

kwarc 

pary ar¬ 
senu 
(6 MPa) 

Arsenek 
galu GaAs 

1238 

(rozkład) 

30 

(pozio¬ 

my) 

20 

kwarc 

pary ar¬ 
senu 

(0,09 MPa) 


Mono krystalizacja metodą Czochralskiego 

W metodzie Czochralskiego również wykorzystuje się 
wzrost monokryształu na gotowej zarodzi umocowa¬ 
nej w uchwycie i stykającej się z powierzchnią sub¬ 
stancji stopionej. W miarę odprowadzania ciepła przez 
zaródź i przez uchwyt na granicy faz ciecz-zaródź 
narasta monokryształ powoli unoszony uchwytem 
zarodzi. Podczas obserwacji tego procesu odnosi się 
wrażenie, że monokryształ jest wyciągany z fazy sto- 
metoda pionej znajdującej się w tyglu; stąd druga nazwa me- 
wyciągania tody — metoda wyciągania monokryształu (rys. 4). 

Jeśli szybkość krystalizacji jest większa niż szybkość 
wyciągania, średnica powstającego kryształu jest coraz 
większa i odwrotnie. Podobny efekt uzyskuje się w 
wyniku obniżenia temperatury przy granicy faz przez 
obniżenie temperatury substancji stopionej znajdują¬ 
cej się w tyglu. Natomiast gdy szybkości wyciągania 
i krystalizacji są sobie równe, a ponadto uchwyt 
z monokryształem wprawiony jest w ruch obrotowy, 
to uzysKujemy monokryształ o stałej średnicy. 
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Rys. 4. Schemat urządzenia do wyciągania monokryształów me¬ 
todą Czochralskiego 


gazu ochronnego (argon, azot, wodór, hel), w próżni 
lub w układzie otwartym na powietrzu. Monokrysz¬ 
tały substancji rozkładających się w pobliżu tempera¬ 
tury topnienia otrzymuje się w komorze pod odpo¬ 
wiednim ciśnieniem par składników, mniejszym lub 
większym od ciśnienia atmosferycznego. Tygle do 
topienia ogrzewane są grzejnikami oporowymi. Dość 


Przykłady monokrystalizacji metodą Czochralskiego 


Substancja 

Tem¬ 

pera¬ 

tura 

Pręd¬ 

kość 

wycią¬ 

gania 

cm/h 

Atmosfera, 

warunki 

procesu 

. Rozmiary mono¬ 
kryształu 

top¬ 

nienia 

°C 

! śred¬ 
nica 
mm 

dłu¬ 

gość 

mm 

masa 

kg 

Bizmut Bi 

271 

3 

próżnia 

75 

180 


German, Ge 

938 

0,6-36 

próżnia, 
tygiel gra¬ 
fitowy 

35 

300 


Krzem Si 

1410 

3-6 

próżnia lub 
argon 

100 

1000 

20 

Arsenek 

galu 

GaAs 

Wolframian 

wapnia 

CaWO 

1238 

(roz¬ 

kład) 

1530 

1,5-3,5 

0,5-2 

ciśnienie As 
0,09 MPa 
lub powie¬ 
rzchnia po¬ 
kryta 
ochronnie 
stopionym 
boraksem 
i ciśn. 0,09 
MPa azotu 
powietrze, 
grzanie prą¬ 
dami w.cz., 
tygiel 
rodowy 

35 

200 






















































































wygodne jest stosowanie ogrzewania, nawet do wyso¬ 
kich temperatur, za pomocą indukcyjnych prądów 
wielkiej częstotliwości (w.cz.). W wypadku gdy topimy 
metale lub inne substancje przewodzące, one same są 
odbiornikami energii wytwarzanej przez pole wielkiej 
częstotliwości i mogą zostać ogrzane aż do stopienia 
w tyglu z materiału nieprzewodzącego prądu elek¬ 
trycznego. Jeśli są to substancje nieprzewodzące, ty¬ 
giel kwarcowy umieszcza się w dodatkowym tyglu 
grafitowym. 

zastosowanie Monokryształy otrzymane metodą Czochralskiego 
metody odznaczają się bardzo wysoką doskonałością krysta- 
Czochral- lograficzną; niektóre są bezdyslokacyjne, nie obser- 
skiego wuje się także występowania w nich naprężeń mecha¬ 
nicznych. Ponieważ podczas procesu krzepnięcia gra¬ 
nica między fazą ciekłą i stałą jest płaska, mono¬ 
kryształy otrzymane tą metodą są szczególnie przy¬ 
datne do produkcji cienkich płytek, które tnie się 
z dużego monokryształu prostopadle do osi wzrostu. 
Płytki te nie wykazują niejednorodności własności 
fizycznych wzdłuż promienia. 


Topienie strefowe 

Monokryształy pierwiastków i niektórych stopów 
o wysokich temperaturach topnienia (ponad 1400°C) 
można otrzymać w procesie topienia strefowego. Na 
jednym końcu łódki (tygla) umieszcza się zaródź, 



a) ruch strefy 



a w jej pozostałej części materiał polikrystaliczny. 
Między zarodzią i polikryształem wytwarza się łączą¬ 
cą je strefę stopioną i przesuwa się tę strefę z pręd¬ 
kością krystalizacji w kierunku od zarodzi (rys. 5a i b). 
W ten sposób uzyskuje się monokryształ o przekroju 
poprzecznym nadanym przez kształt łódki. 

Najbardziej interesująca jest beztyglowa odmiana 
tej metody, polegająca na tym, że w czasie procesu 
monokrystalizacji pręt polikrystaliczny i zaródź znaj¬ 
dują się w pozycji pionowej. Stopioną strefę między 
dwoma odcinkami „pręta” utrzymują siły napięcia 
powierzchniowego i jej grubość maksymalna jest 
ograniczona. W metalach i substancjach przewodzą¬ 
cych prąd elektryczny stopioną strefę uzyskuje się naj¬ 
częściej za pomocą cewki indukcyjnej wielkiej często¬ 
ści w atmosferze gazu ochronnego lub przez bombar¬ 
dowanie wąskiej strefy na obwodzie pręta odpowied¬ 
nio ukształtowaną wiązką elektronów w próżni (rys. 
5c i d). Otrzymywane tą metodą pręty monokrysta- 
liczne mają przekrój kołowy, podobnie jak pręty 
otrzymywane metodą Czochralskiego. W zależności 
od wielkości napięcia powierzchniowego w tempera¬ 
turze topnienia na powierzchni zewnętrznej pręta 
mogą się zaznaczyć słabiej lub mocniej ślady symetrii 
krystalograficznej w stosunku do kierunku wybranego 
dla zarodzi. Na przykład dla kierunku [111] wybra¬ 
nego dla zarodzi germanu przekrój pręta mono- 


Przyklady monokrystalizacji metodą pływającej strefy 
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ca 

mm 
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3 

25 

17 
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18 

6 

3 

Tytan Ti 
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6 

10 

10 
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3370 
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tronami 

18 

3-6 

3-6 


krystalicznego germanu wykazuje wyraźniej symetrię 
osi trójkrotnej [111] niż przekrój pręta krzemu (il. 99, 
tabl. 25). Metoda topienia strefowego beztyglowego 
nosi nazwę metody pływającej strefy (tabela). 


b) ruch strefy 



Rys. 5. Sposoby wytwarzania strefy stopionej w procesie mono¬ 
krystalizacji a) w otwartej łódce — grzanie prądami w.cz.; b) w 
zatopionej ampule — grzejnik oporowy strefy lub prądy w.cz.; 
c) sposób beztyglowy — grzanie prądami w.cz.; d) sposób bez- 
tyglowy — bombardowanie strefy elektronami w próżni 


Monokrystafizacja metodą Verneuila 

Modyfikacją metody monokrystalizacji na zarodzi 
w temperaturze krzepnięcia substancji jest metoda 
Verneuila. Jej oryginalność polega na dodawaniu 
materiału w postaci topiącego się proszku do kropli 
cieczy znajdującej się na wierzchołku wytwarzanego 
monokryształu (rys. 6). W pierwszym rozwiązaniu 
technicznym Vemeuila (1902) służącym do otrzymy¬ 
wania monokryształów korundu (a-Al 2 0 3 ), szafiru 
(A1 2 0 3 : Ti i Fe) i rubinu (A1 2 0 3 : Cr) posługiwano się 
palnikiem tlenowo-wodorowym do wytworzenia 
kropli i do topienia drobnokrystalicznego tlenku 
glinu (a-Al 2 0 3 ) z ewentualnymi domieszkami lub 
mieszaniny tlenku magnezu MgO i tlenku glinu do 
wytworzenia monokrystalicznego spinelu Mg(A10 2 ) 2 . 
Monokryształy szafiru, korundu czy rubinu otrzymy¬ 
wane tą metodą były z reguły mało doskonałe i pękały 
po ostudzeniu wskutek naprężeń wywołanych wystę¬ 
powaniem dużych gradientów temperatury podczas 
wzrostu kryształu będącego słabym przewodnikiem 
ciepła. Sztuczne rubiny stosowano początkowo głów¬ 
nie w jubilerstwie, jako łożyska (kamienie) w ze¬ 
garkach lub jako pryzmaty do czułych wag. 

Dopiero rozwój fizyki i elektroniki ciała stałego po 
II wojnie światowej wpłynął na udoskonalenie metody 
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Verneuila i otrzymywane obecnie tą metodą mono¬ 
kryształy odznaczają się lepszymi właściwościami niż 
kryształy naturalne. Zastosowano precyzyjne urzą- 



Rys. 6. Schemat urządzenia do otrzymywania monokryształów 
metodą Ycrncuiia 


dzenia do sterowania procesem wzrostu i usuwania 
naprężeń w kryształach oraz wprowadzono kilka no¬ 
wych układów ogrzewania (palnik plazmowy, ogrze¬ 
wanie prądami indukcyjnymi wielkiej częstotliwości, 
ogrzewanie zogniskowaną energią promieniowania 
zastosowanie łuku elektrycznego). Umożliwiło to otrzymywanie 
metody monokryształów nie tylko korundu, szafiru czy ru- 
Verneuila binu, ale też i in. trudno topliwych tlenków jak ru- 
tylu TiOo (temperatura topnienia Ti = 1830°C), 
tlenku cyrkonu Zr0 2 (Tt = 2700°C), tlenku magnezu 
MgO (T t — 2640°C), tlenku wapnia CaO (Tt — 
— 2570°C), tlenku niklu NiO (Tt — 2090°C) oraz 
ferrytów (Tt = 1200-1800 o Q. 

Metodą Verneuila uzyskano też monokryształy 
węglików, azotków, borków, krzemków, berylków 
metali, substancji bardzo łatwo utleniających się 
i bardzo trudno topliwych (Tt — 2000-4000°C). 
Metodą Vemeuila wytwarza się obecnie monokrysz¬ 
tały ok. 100 substancji. 


Wzrost monokryształów przez 
przemianę w fazie stałej 

Otrzymywanie dużych monokryształów przez prze¬ 
mianę w fazie stałej stosuje sic wtedy, gdy zależy nam 
na uzyskaniu monokryształów o określonym kształ¬ 
cie, np. w postaci cienkich taśm, drutów o małej 
średnicy, albo gdy ma być zachowana jednorodność 
składu stopu lub rozmieszczenie atomów domieszki. 
Jeśli substancja podlega przemianie fazowej w fazie 
stałej między temperaturą topnienia i temperaturą 
pokojową, metoda ta jest w zasadzie jedyną metodą 
otrzymywania monokryształu o określonej strukturze, 
szczególnie, gdy substancja ma wysoką temperaturę 
topnienia. Proces monokrystalizacji przez przemianę 
w fazie stałej jest możliwy dzięki naturalnej iendencji 
każdego układu do uzyskania minimum energii (mo¬ 
nokryształ ma mniejszą energię niż polikryształ). 

458 


Wzrost monokryształów substancji niemetalicz¬ 
nych przez przemianę w fazie stałej jest procesem 
bardzo złożonym i zależy od wielu czynników. Prze¬ 
ważnie stosuje się spiekanie proszków sprasowanych spiekanie 
w kształtki. Spiekanie odbywa się w temperaturze proszków 
niewiele niższej od temperatury topnienia substancji. 

Uzyskuje się zwykle kilka (kilkanaście) kilkumilime¬ 
trowych ziaren monokrystalicznych w objętości 
próbki. 


Monokrystalizacja przez wyżarzanie 

W wypadku metali poddaje się je najpierw odkształ¬ 
ceniu prawie do granicy plastyczności przez walco¬ 
wanie, zgniatanie, rozciąganie, kucie, przeciąganie itp. 
Nagromadzona w ten sposób w materiale energia 
wystarcza do przemiany polikrystalicznego metalu 
lub stopu w monokryształ. W zwykłych temperatu¬ 
rach przemiana taka jest bardzo powolna, podgrzewa 
się więc układ do odpowiedniej temperatury dla przy¬ 
spieszenia przemiany i wywołania wzrostu jednego 
z ziaren polikryształu w duże ziarno monokrystaliczne 
(lub kilka dużych ziaren) wypełniające całą objętość 
użytej próbki. Małe ziarna zostają „pożarte” przez 
sąsiadujące z nimi ziarno rosnące. 

Proces monokrystalizacji przez wyżarzenie od¬ 
kształceń plastycznych bardzo często można przepro¬ 
wadzić w aparaturze takiej samej jak przy metodzie 
Bridgmana-Stockbargera, z tym że stosujemy od¬ 
wrotny gradient temperatury w stosunku do ruchu 
próbki w piecu i oczywiście nie używamy tygla, gdyż 
przemiana zachodzi w fazie stałej. Aby przyspieszyć 
pierwszą fazę procesu (wytwarzanie zarodków), cienki 
koniec próbki odkształcamy dodatkowo przez zgnia¬ 
tanie bezpośrednio przed wyżarzaniem. Druty meta¬ 
liczne Mo, W, Ta, Nb, Fe o średnicach nawet do kilku¬ 
nastu mm przeciąga się przez piec i dodatkowo pod¬ 
grzewa się je prądem elektrycznym w celu wytwo- metoda 
rżenia odpowiedniego gradientu temperatury — me- Andrade'a 



Rys. 7. Schemat urządzenia do otrzymywania cienkich drutów 
monokrystalicznych przez przemianę w fazie stałej (metodą An- 
drade’a) 

toda Andrade’a (rys. 7). Wymagane odkształcenia 
powstają podczas przeciągania drutu w przeciągar¬ 
kach; stosuje się też dodatkowe naciąganie podczas 
wyżarzania. 

Głównymi wadami metody monokrystalizacji przez 
przemianę w fazie stałej są trudności z zarodkowaniem 
i wytworzeniem tylko jednego dobrze wykształconego 
monokryształu o żądanej orientacji. 
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Wzrost monokryształów 
z fazy gazowej 

W procesie hodowania monokryształów z fazy gazo¬ 
wej wykorzystuje się zjawisko sublimacji i kondensa¬ 
cji lub pewien typ reakcji chemicznych. Proces może 
być prowadzony w zamkniętym naczyniu lub w ukła¬ 
dzie otwartym z przepływem gazu nośnego w zależ¬ 
ności od właściwości krystalizowanej substancji, 
układ Drobnokrystaliczną substancję, tzw. źródło, z któ- 
zamknięty rego mają powstać duże monokryształy, umieszcza się 
w ampule, zwykle kwarcowej, wytwarza się w niej 
próżnię lub napełnia się ją gazem obojętnym do od¬ 
powiedniego ciśnienia i zatapia (rys. 8a). Ampułę 
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Rys. 8. Schematy urządzeń do otrzymywania monokryształów 
z fazy gazowej a) w układzie zamkniętym w zatopionej ampule; 

b) w układzie zamkniętym w komorze z próżnią dynamiczną; 

c) w układzie otwartym, w przepływie gazu nośnego 


umieszcza się w piecu mającym dwie strefy tempera¬ 
tury (wyższej i niższej) dostosowane do właściwości 
substancji krystalizowanej. W strefie źródła następuje 
sublimacja (lub parowanie) substancji, a w strefie mo- 
nokrystalizacji — kondensacja jej pary. Pomiędzy 
strefą źródła i strefą monokryształu powstaje różnica 
ciśnień, która utrzymuje stałe przesycenie. Krystali¬ 
zacja zachodzi na zarodku lub zarodkach utworzo¬ 
nych w najwęższym miejscu ampuły albo na zarodzi 
umieszczonej tam przed zatopieniem ampuły. Jeśli 
ogólne ciśnienie gazu (prężność pary) w ampule w 
temperaturze procesu jest niewielkie, o szybkości pro¬ 
cesu decyduje proces dyfuzji cząsteczek pary (gazu) 
wewnątrz rury; przy większych ciśnieniach lub w razie 


napełnienia ampuły gazem obojętnym odgrywają rolę układ 
procesy konwekcji. Odmianą układu zamkniętego z próżnią 
jest układ z próżnią dynamiczną (rys. 8b) stosowany dynamiczną 
do uzyskiwania monokrystalicznych warstw metali 
i półprzewodników na płytkach podłożowych umiesz¬ 
czonych nad silnie ogrzanym źródłem parującym w 
próżni zwykle rzędu 10” 4 Pa i lepszej (tabela). 


Przykłady monokrystalizacji z fazy gazowej 
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Mechanizmy procesu w obu układach zamknię- układ 
tych i w układzie otwartym (rys. 8c) są analogiczne, otwarty 
jednakże przepływający gaz nośny przenosi znacznie 
większe ilości pary parującego źródła i szybkość wzro¬ 
stu w układzie otwartym jest znacznie większa, niż 
w zamkniętej ampule czy w próżni. Otrzymanie du¬ 
żych pojedynczych kryształów w metodzie otwartej 
jest jednak trudne. Znaczne stężenia substancji ułat¬ 
wiają powstawanie wielu nowych zarodków podczas 
trwania procesu, a utrudniają wzrost monokryszta¬ 
łów na już istniejących zarodkach. 


Wykorzystanie reakcji chemicznych 

Substancją służącą do budowy monokryształu z fazy 
gazowej mogą być też produkty reakcji chemicznej. 

Jedną z metod otrzymywania monokrystalicznego 
korundu a-Al 2 0 3 jest wykorzystanie nieodwracalnej 
reakcji par chlorku glinu A1C1 3 z wodorem i dwutlen¬ 
kiem węgla. Procesy tego typu prowadzi się zwykle 
w układzie otwartym. 

Inną metodą wykorzystującą reakcje chemiczne metoda 
do przenoszenia substancji źródła w obszar mono- transportu 
kryształu jest sposób zwany metodą transportu che- chemicznego 
micznego. Polega ona na dodaniu do układu niewiel¬ 
kiej ilości substancji, zwanej transporterem, która rea¬ 
gując z substancją źródła wytwarza wyłącznie pro¬ 
dukty gazowe. W innym miejscu układu, w innej tem¬ 
peraturze, produkty te reagują ze sobą ponownie 
i wytwarzają w reakcji odwracalnej trwałą fazę sta- 


Przykłady monokrystalizacji metodą transportu chemicz¬ 
nego w układzie otwartym i zamkniętym 
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łą — monokryształ substancji źródła. Uwalnia się 
przy tym substancja-transporter przenoszona przez 
konwekcję lub dyfuzję do obszaru źródła—jeśli 
proces odbywa się w układzie zamkniętym — lub 
unoszona przez gaz nośny poza układ otwarty. Me¬ 
tody transportu chemicznego znalazły zastosowanie 
do otrzymywania monokryształów pierwiastków 
i związków o niskich prężnościach par lub do związ¬ 
ków bardzo łatwo rozkładających się po ogrzaniu, 
których utrzymanie w układzie zamkniętym jedno¬ 
składnikowym (bez reakcji chemicznej) jest niemożliwe 
lub zbyt powolne (tabela). 

Reakcje transportu chemicznego, odwracalne i nie¬ 
odwracalne, znalazły zastosowanie zarówno do wy¬ 
twarzania dużych monokryształów, jak i tzw. warstw 
epitaksjalnych. Są to cienkie, o grubości kilku do kil¬ 
kudziesięciu mikrometrów, monokrystaliczne war¬ 


stwy „narośnięte” na płaskim podłożu monokrysta- 
licznym będącym zarodzią. Warstwy te powtarzając 
strukturę podłoża-zarodzi mogą mieć nieco zmie¬ 
niany skład chemiczny przez wprowadzanie do rosną¬ 
cej warstwy niewielkiej ilości domieszki. Na granicy 
podłoże-warstwa uzyskuje się w ten sposób zamie¬ 
rzony skok właściwości substancji monokryształu. 

Metoda epitaksjalnej monokrystalizacji krzemu stała warstwy 
się podstawą rozwoju technologii krzemowych ukła- epitaksjalne 
dów scalonych stosowanych powszechnie w kalkula¬ 
torach, komputerach, coraz powszechniej w odbiorni¬ 
kach radiowych i telewizyjnych, a także w układach 
regulacji i sterowania automatycznego procesów prze¬ 
mysłowych (-*• Mikroelektronika). 

W. D. Lawson i S. Nielsen Otrzymywanie monokryształów. 

Warszawa 1962; The Art and Science of Growing Crystals, J. J. 

Gilman (ed.), London 1963. 


Dyslokacje w kryształach 

Tadeusz Figielski 


Dyslokacje są liniowymi defektami struktury krysta¬ 
licznej. Wpływają one w zasadniczy sposób na wła¬ 
sności mechaniczne ciał stałych, również ważną rolę 
odgrywają w materiałach półprzewodnikowych stoso¬ 
wanych w elektronice. 

Zdumiewa nas fakt, że jeszcze niedawno — przed 
wysunięciem koncepcji dyslokacji, gdyjuż została roz¬ 
szyfrowana kwantowa struktura atomu — fizycy nie 
rozumieli, dlaczego sztabka czystego metalu jest pla¬ 
styczna zaraz po jej wytopieniu, a staje się twarda 
i wytrzymała po kuciu lub walcowaniu. Wyrażając 
się ściślej, nie rozumiano, dlaczego wytrzymałość 
kryształu na ścinanie jest o wiele rzędów niższa niż ta, 
jaką przewidywała najprostsza teoria plastyczności, 
w której zakładano, że całe płaszczyzny atomowe 
kryształu ślizgają się jedne po drugich. Rozwiązanie 
tej zagadki dali trzej badacze G. J. Taylor, E. Orowan 
i M. Polany i, którzy niezależnie od siebie zapropo¬ 
nowali w 1934 r. koncepcję dyslokacji w krysztale, 
wektor Rozważmy na początku pojęcie dyslokacji w oś- 
Burgersa rodku ciągłym. Wyobraźmy sobie doskonale sprę¬ 
żysty materiał w postaci walca, w którym wykonano 
nacięcie wzdłuż płaszczyzny ABCD aż do jego osi 
(rys. 1). Przemieśćmy następnie dwie przylegające 




Rozróżnia się dwa zasadnicze typy dyslokacji: 
dyslokację krawędziową (rys. la), w której, wektor 
Burgersa jest prostopadły do linii (osi) dyslokacji oraz 
dyslokację śrubową (rys. Ib) — gdy wektor Burgersa dyslokacja 
jest równoległy do osi. Ogólnie dyslokacja może mieć krawędzio- 
zarówno składową krawędziową, jak i śrubowy, czyli W a 
może być typu mieszanego. Przykładem takiej dyslo- i śrubowa 
kacji jest dyslokacja sześćdziesięciostopniowa wy¬ 
stępująca w kryształach o strukturze diamentu (rys. 

12; 60° jest kątem między wektorem Burgersa i osią 
dyslokacji). 

Istnieje ogólne prawo ułatwiające rozpatrywanie 
geometrycznych zagadnień związanych z dyslokacja¬ 
mi: wektor Burgersa musi być zachowany wzdłuż 
całej linii dyslokacyjnej. Z prawa tego wynika, że 
dyslokacja nie urywa się wewnątrz kryształu; może 
ona kończyć się jedynie na jego powierzchniach lub 
tworzyć zamknięte pętle. (ii. 80, tabl. 21). 

Dyslokacja krawędziowa z jednostkowym wekto¬ 
rem Burgersa w najprostszej sieci krystalicznej jest 
równoważna umieszczeniu dodatkowej płaszczyzny 
atomowej między dwiema sąsiadującymi płaszczy¬ 
znami krystalicznymi (rys. 2). Można zauważyć, że 
każdy atom na krawędzi tej płaszczyzny (będącej 



części walca wzdłuż płaszczyzny przecięcia o wektor 
V. Ten rodzaj zakłócenia, rozciągający się wzdłuż 

linii AB (osi), nazywa się dyslokacją, a wektor b — 
wektorem Burgersa dyslokacji. W sieci krystalicznej 
wektor Burgersa może przyjmować jedynie pewne 
wartości dyskretne; dyslokacja z najkrótszym możli- 
dyslokacja wym wektorem Burgersa nazywa się dyslokacją ied- 
jednostkowa nostkową. 
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linią dyslokacji) ma mniej sąsiadów niż atom w sieci 
doskonałej. A zatem w kryształach o wiązaniu kowa¬ 
lencyjnym jedno wiązanie w każdym atomie krawę¬ 
dziowym jest wolne; jest ono nazywane wiązaniem wiązanie 
wiszącym i odgrywa bardzo ważną rolę w elektrono- wiszące 
wych własnościach dyslokacji. 

Rola pojęcia dyslokacji w teorii plastyczności jest 
oczywista. Zamiast jednoczesnego przemieszczania 
podczas deformacji kryształu całych płaszczyzn ato- 
















































ruch mowych, wystarczy przemieszczanie kolejnych rzędów 
poślizgowy atomów znajdujących się na linii dyslokacyjnej. Ten 
dyslokacji rodzaj ruchu jest dobrze znany z praktyki domowej 
np. ułatwia przesuwanie ciężkiego dywanu (rys. 3). 



Rys. 3. Mechanizm dyslokacji może być użyteczny przy przesu¬ 
waniu ciężkiego dywanu 


W krysztale taki proces może być opisany przez ruch 
dyslokacji; jest to ruch poślizgowy dyslokacji zacho¬ 
dzący w płaszczyźnie poślizgu. Uprzywilejowanymi 
płaszczyznami poślizgu są płaszczyzny krystalogra¬ 
ficzne o najgęstszym upakowaniu atomów, 
ruch w kryształach o wiązaniu kowalencyjnym naprę- 
przegięcia żenie niezbędne do wywołania poślizgu całej linii 
dyslokacyjnej jest stosunkowo duże i wówczas bar¬ 
dziej uprzywilejowanym procesem może być ruch 
dyslokacji zachodzący stopniowo wzdłuż krótkiego 
jej odcinka. Taki proces jest możliwy, gdy dyslo¬ 
kacja zawiera przegięcie leżące w tej samej płaszczy¬ 
źnie poślizgu i o długości równej zazwyczaj jednost¬ 
kowemu wektorowi Burgersa (rys. 4). Przegięcie może 
ślizgać się wzdłuż dyslokacji, a jego przemieszczenie 
się zjednego końca dyslokacjido drugiego jest równo- 
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Rys. 4. Przegięcie i 
jego ruch wzdłuż dy¬ 
slokacji (a, b, c), d) 
podwójne przegięcie 



Rys. 5. Przecięcie się dwóch dyslokacji krawędziowych, prowa- 
dzące do wytworzenia przegięć 


ważne przesunięciu całej dyslokacji o jednostkowy 
wektor Burgersa. Podwójne przegięcia mogą być 
wzbudzane spontanicznie przez drgania cieplne sieci 
(rys. 4d), jak również mogą być wytwarzane w wyniku 
przecięcia się dwóch dyslokacji leżących w różnych 
płaszczyznach poślizgu (rys. 5). 

Pod wpływem działania na kryształ stałego ze- „kwant" ^ 
wnętrznego naprężenia r dyslokacja wykonuje ruch deformacji 
poślizgowy i w końcu opuszcza kryształ pozostawiając plastycznej 
po sobie uskok — „kwant” plastycznej deformacji 
(rys. 6). Taki prosty model prowadzi oczywiście do 
wystąpienia pewnej górnej granicy stopnia deformacji 
plastycznej kryształu, która byłaby określona gęstością 




Rys. 6. Ruch poślizgowy dyslokacji jest równoważny deformacji 
plastycznej kryształu 


dyslokacji początkowo istniejących w krysztale. Po¬ 
nieważ doświadczalnie nie obserwuje się takiej gra¬ 
nicy, należy wnioskować, że podczas plastycznego 
„płynięcia” kryształu działają pewne mechanizmy 
wytwarzania (generacji) lub powielania dyslokacji rozmnażanie 
Jednym z bardziej znanych jest mechanizm generacji dyslokacji 
Franka-Reada, który zachodzi wówczas, gdy 
w płaszczyźnie poślizgu występują przeszkody w ru¬ 
chu dyslokacji —tzw. punkty zaczepienia. Działa¬ 
cie tego typu mechanizmu przedstawia rys. 7. 


Am -• B 


A 


B 




Rys. 7. Mechanizm Fran¬ 
ka-Reada generacji dyslo¬ 
kacji. Odcinek linii dyslo¬ 
kacyjnej, unieruchomiony 
między punktami A i B 
leżącymi w płaszczyźnie 
poślizgu, wygina się pod 
wpływem przyłożonego 
naprężenia, a następnie 
zamyka się wytwarzając 
pętle dyslokacyjne 
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Podatność kryształu na działanie sił mechanicz¬ 
nych można zobrazować za pomocą wykresu, na 
którym na osi rzędnych odłożone jest działające na¬ 
prężenie (np. siła rozciągająca na jednostkę przekroju 
poprzecznego kryształu), natomiast na osi odcię- 
wspśname tych — odkształcenie (np. względna zmiana długości 
się kryształu). Przykładowa zależność tego rodzaju 
dyslokacji przedstawiona jest na rys. 8, gdzie można wyróżnić 



Rys. 8. Zależność naprężenia od odkształcenia monokryształu 
metalu 





Rys. 9. Wspinanie 
się dyslokacji wy¬ 
wołane dopływem 
luk 


obserwacje 

dyslokacji 


trzy charakterystyczne obszary. W obszarze 1 kryształ 
zachowuje się doskonale sprężyście. Odkształcenie 
jest tu proporcjonalne do naprężenia i jest całkowicie 
odwracalne. W obszarze 2 kryształ zaczyna plastycz¬ 
nie (nieodwracalnie) „płynąć”. Małe przyrosty na¬ 
prężenia wywołują duże zmiany długości kryształu. 
Jest to obszar, w którym zachodzi intensywny ruch 
poślizgowy i rozmnażanie dyslokacji. Przy dalszej 
deformacji osiąga się trzeci obszar, w którym nastę¬ 
puje utwardzanie kryształu. Liczba dyslokacji leżą¬ 
cych w różnych płaszczyznach poślizgu jest wówczas 
tak duża, że blokują one sobie wzajemnie możliwości 
ruchu, utrudniając deformację plastyczną. 

Ruch poślizgowy dyslokacji jest ruchem zacho¬ 
wawczym, co oznacza, że nie towarzyszy mu trans¬ 
port masy. W wyższych temperaturach może stać się 
istotny niezachowawczy rodzaj ruchu dyslokacji, 
który jest wywołany dopływem lub odpływem łuk lub 
atomów międzywęzłowych; ruch taki nazywany jest 
wspinaniem się dyslokacji (rys. 9). 

Przez długi czas dyslokacje były koncepcją czysto 
teoretyczną, zanim nauczono się je uwidaczniać 
w krysztale. Pierwszą i najprostszą metodą było uży¬ 
cie specjalnych środków trawiących, atakujących naj¬ 
bardziej obszary kryształu, w których dyslokacje wy¬ 
chodzą na powierzchnię. Ilustracja 79 (tabl. 21) przed¬ 
stawia jedną z pierwszych identyfikacji jamek tra¬ 
wienia na germanie z pojedynczymi dyslokacjami. 
Dyslokacje są tu uszeregowane liniowo tworząc tzw. 
małokątową granicę ziaren (ii. 82, tabl. 21). Obecnie 
możemy oglądać dyslokacje wewnątrz kryształu sto¬ 
sując topografię rentgenowską lub — bardziej szcze¬ 
gółowo — wykorzystując elektronową mikroskopię 
prześwietleniową (-> Mikroskopia elektronowa i il. 
87, tabl. 22). Za pomocą tej metody można również 
obserwować dyslokacje podczas ich ruchu. Badania 
elektronomikroskopowe wykazują, że dyslokacje by¬ 
wają często rozszczepione na dyslokacje częściowe 
z ułamkowym wektorem Burgersa. Płaski defekt roz¬ 
ciągający się między rozszczepioną parą nazywa się 
błędem ułożenia. 

Wokół linii dyslokacyjnej istnieje złożone pole na¬ 
prężeń mechanicznych. W pobliżu dyslokacji krawę¬ 
dziowej deformacja sieci ma charakter dylatacji bądź 
kompresji w zależności od położenia obszaru w sto¬ 
sunku do płaszczyzny poślizgu dyslokacji. To pole 
naprężeń jest przyczyną silnego oddziaływania dyslo¬ 
kacji z defektami punktowymi i atomami domieszko¬ 
wymi w krysztale. W szczególności domieszki mogą 
działać jako punkty zaczepienia dyslokacji, hamując 
ich ruch poślizgowy. 

462 


Dyslokacje odgrywają istotną rolę w mechanizmie wzrost 
wzrostu kryształów. Na rys. 10 pokazana jest dyslo- kryształów 
kacia śrubowa, której wyjśoie na powierzchnię sta- 






Rys. 10. Dyslokacja śru¬ 
bowa i spiralny wzrost 
kryształu 



nowi nie wysycający się zarodek szybkiego wzrostu 
kryształu. Jego działanie polega na tym, że zewnętrzne 
atomy łatwo wbudowują się w kryształ w miejscach, 
gdzie mogą się one wiązać z więcej niż jednym ato¬ 
mem. Gdy na powierzchni kryształu istnieje prosty 
stopień (rys. 11), mechanizm szybkiego wzrostu 
przestaje działać po skompletowaniu pełnej warstwy 
atomowej. 



Rys. II. Schodek na 
krysztale nie podtrzy¬ 
muje stałego szybkiego 
wzrostu kryształu 



Energia związana z naprężeniami wokół dyslokacji 
jest tak duża, że dyslokacja, w przeciwieństwie do de¬ 
fektów punktowych (luk i atomów międzywęzło¬ 
wych), nie może pewstać samoistnie w krysztale w wy¬ 
niku drgań cieplnych atomów; dyslokacja nie jest więc 
defektem termodynamicznie równowagowym. Wynika 
stąd, że dyslokacje mogą być w zasadzie całkowicie 
usunięte z kryształu. Obecnie tzw. kryształy bezdyslo- kryształy 
kacyjne półprzewodników germanu i krzemu produ- bezdysfoka- 
kowane są w skali przemysłowej. cyjne 











































wpływ 
dyslokacji 
na domiesz¬ 
kowanie 


bariera 

potencjału 

wokół 

dyslokacji 


W materiałach półprzewodnikowych dyslokacje 
wpływają w sposób istotny zarówno na procesy ato¬ 
mowe jak i elektronowe. Wpływ ten jest w zasadzie 
ujemny. Wzdłuż dyslokacji zachodzi wzmożona dy¬ 
fuzja domieszek psująca ich rozkład przestrzenny 
w przyrządach półprzewodnikowych. Dyslokacje 
w sposób drastyczny obniżają czas życia mniejszo¬ 
ściowych nośników prądu, działając jako efektywne 
centra rekombinacji (-»» Fizyka przyrządów półprze¬ 
wodnikowych). Wreszcie dyslokacje zapoczątkowują 
lawinowe przebicie w złączach n-p , obniżając tym 
samym wartość maksymalnego napięcia zaporowego, 
przy którym mogą pracować diody półprzewodni¬ 
kowe. Jest zatem sprawą oczywistą, że technologowie 
czynią wielki wysiłek, ażeby uniknąć dyslokacji 
w materiałach i strukturach półprzewodnikowych. 

Fizyka zjawisk elektronowych związanych z dyslo¬ 
kacjami w półprzewodnikach jest bardzo interesująca. 
Na krawędzi dodatkowej półpłaszczyzny atomowej, 
jaką stanowi dyslokacja, zlokalizowane są niewysy- 
cone, „wiszące” wiązania chemiczne. W wypadku 
półprzewodników atomowych, germanu i krzemu, są 
to ściśle ukierunkowane wiązania kowalencyjne (rys. 
12). Sterczą one prostopadle do osi dyslokacji i są 



Rys. 12. Dyslokacja szcśćdziesięciostopniowa w krysztale o struk¬ 
turze diamentu 


odległe od siebie jedynie o kilka A. Dodatkowy elek¬ 
tron może być wychwycony z pasma przewodnictwa 
półprzewodnika na wiszące wiązanie, lub też wiszący 
elektron może być przeniesiony do pasma. W pierw¬ 
szym wypadku dyslokacja staje się naładowana 


ujemnie, w drugim — dodatnio. Proces ładowania 
dyslokacji zachodzi sportanicznie aż do momentu 
osiągnięcia równowagi termodynamicznej układu. 

Znak i wielkość ładunku na dyslokacji zależy od ener¬ 
gii Fermiego w krysztale. Ten ładunek powoduje wy¬ 
tworzenie potencjału elektrostatycznego na dyslokacji. 

Różnica potencjałów powstająca między linią dyslo¬ 
kacyjną a otaczającym ją materiałem odgrywa za¬ 
sadniczą rolę w procesach rekombinacji nośników 
prądu w półprzewodnikach. Od niej zależy dopływ 
nośników do dyslokacji będących bardzo efektyw¬ 
nymi centrami rekombinacji. 

Oświetlenie półprzewodnika światłem generują- foto- 
cym dodatkowe nośniki prądu zmniejsza ładunek plastyczność 
dyslokacji. Efekt ten jest prawdopodobnie przyczyną 
obserwowanego w związkach półprzewodnikowych 
zjawiska fotoplastyczności. Zjawisko to polega na 



Rys. 13. Zjawisko fotoplastyczne w krysztale tcllurku kadmu 
(CdTc). Naprężenie niezbędne do wywołania określonej defor¬ 
macji plastycznej wzrasta przy oświetleniu kryształu 


zmianie efektywnej ruchliwości dyslokacji pod wpły¬ 
wem oświetlenia, co powoduje zmianę twardości 
kryształu (rys. 13). 

Wiszące elektrony wzdłuż dyslokacji krawędziowej dyslokacje — 
mają niesparowane spiny i związany z nimi moment centra para¬ 
magnetyczny. Dyslokacje są zatem centrami para- magnetyczne 
magnetycznymi w krysztale. Moment magnetyczny 
pochodzący od dyslokacji został rzeczywiście wykryty 
doświadczalnie przy badaniu elektronowego rezo¬ 
nansu paramagnetycznego w krzemie. 

J. Weertman, J. R. Weertman Podstawy teorii dyslokacji , 

Warszawa 1969. 


Badanie struktury kryształów 


Teoria wewnętrznej budowy kryształów, obejmująca 
teorię sieciową A. Bravais’go i teorię grup przes¬ 
trzennych J. S. Fiodorowa, A. Schoenfliesa i W. Bar- 
lowa powstała w XIX w. 

Słuszność tych teorii potwierdzono doświadczalnie 
dopiero w r. 1912, gdy przy próbach wyjaśnienia na¬ 
tury (fale czy cząstki?) promieniowania rentgenow¬ 
skiego M. von Laue, W. Friedrich i P. Knipping 
wykazali, że promienie rentgenowskie ulegają dy¬ 
frakcji na sieciach przestrzennych kryształów. Rok 
1912 stał się rokiem przełomowym dla rozwoju kry sta¬ 
lografii, gdyż odkrycie Lauego, Friedricha i Knippin- 
ga dało początek nowym jej gałęziom, związanym z 
badaniami rodzajów sieci przestrzennych występują¬ 
cych w ciałach krystalicznych i badaniem rozmieszczeń 
atomów, jonów lub cząsteczek w komórkach ele¬ 
mentarnych: krystalografii rentgenowskiej i analizie 
strukturalnej kryształów. 

Dwanaście lat później, L. de Broglie sformułował 
hipotezę o falowym charakterze ruchu cząstek. Do¬ 
świadczalnym potwierdzeniem tej hipotezy było po¬ 


kazanie w 1927 r., przez C. I. Davissona i L. H. Ger- 
mera, że elektrony ulegają dyfrakcji na sieciach prze¬ 
strzennych ciał krystalicznych, podobnie jak promie¬ 
nie rentgenowskie. Pomyślnie zakończone doświad¬ 
czenia nad dyfrakcją neutronów przeprowadzili 
w 1936 r. P. N. Mitchell i D. P. Powells. Te dwa do¬ 
świadczenia dały początek nowym metodom badania 
struktury kryształów: elektronografii i neutronogra¬ 
fii, a pierwsze z nich doprowadziło ponadto do skon¬ 
struowania w 1931 r. przez M. Knolla i E. Ruska, mi¬ 
kroskopu elektronowego. 


Krystalografia rentgenowska 

Zygmunt Trzaska Durski 

Eksperyment, który dał początek krystalografii rent¬ 
genowskiej, przeprowadzony w 1912 r. przez Lauego, 
Friedricha i Knippinga był niesłychanie prosty, zwła- 
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szcza jeśli weźmie się pod uwagę używane obecnie, 
nieraz bardzo skomplikowane, przyrządy do badania 
dyfrakcji promieni rentgenowskich na kryształach. 
Po prostu — na drodze wąskiej wiązki promieni 
rentgenowskich ustawione zostały kryształ i klisza 
fotograficzna. Po naświetleniu i wywołaniu kliszy 
okazało się, że oprócz śladu padającej wiązki pro¬ 
mieniowania na kliszy pojawiły się ślady wiązek od¬ 
chylonych od kierunku wiązki padającej (tj. ślady 
wiązek ugiętych). 


Odbicie promieni rentgenowskich 
od płaszczyzn sieciowych kryształu 

Zastanówmy się nad tym, skąd w doświadczeniu 
Lauego wzięły się wspomniane wiązki ugięte. Otóż 
wiązki promieni odchylone od kierunku biegnącej 
z lampy wiązki padającej powstają w wyniku swoiste¬ 
go odbicia promieni rentgenowskich przez zespoły 
odbicie równoległych do siebie płaszczyzn sieciowych kry- 
inter- ształe. Odbicie to ma szczególny charakter i nazywa 
ferencyjne się odbiciem interferencyjnym, ponieważ w istocie 
przyczyną jego jest wtórne promieniowanie atomów 
(a właściwie elektronów), uporządkowanych w sieć 
krystaliczną, na które padają promienie rentgenow¬ 
skie. Mianowicie, każdy z elektronów atomów sieci 
krystalicznej pod działaniem promieniowania rent¬ 
genowskiego wykonuje drgania w takt zmian pola 
elektromagnetycznego tego promieniowania, stając 
się w ten sposób źródłem promieniowania wtórnego, 
o takiej samej długości fali jak promieniowanie wzbu¬ 
dzające, lecz rozchodzącego się w przestrzeni kuliście. 
Te fale wtórne interferują ze sobą i w pewnych ściśle 
określonych dla danej sieci przestrzennej i danej dłu¬ 
gości fali promieniowania kierunkach, ulegają wzmoc¬ 
nieniu, co prowadzi do powstawania tzw. wzmocnio¬ 
nych promieni interferencyjnych, obserwowanych 
w doświadczeniach jako promienie ugięte czy też 
promienie odbite. 

Kierunek rozchodzenia się wzmocnionych promie¬ 
ni interferencyjnych (promieni interferencyjnie odbi- 
równanie tych) można określić za pomocą tzw. równania Wul- 
Wulfa— fa-Bragga. Według tego równania interferencyjne od- 
Bragga bicie promieni rentgenowskich o długości fali X od 
płaszczyzny sieciowej ( hkl ) (rys. 1) następuje tylko 
w takim kierunku, określonym tzw. kątem odbłysku 
przy którym różnica dróg AS = 2d {h ki) sin#<&**) 
przebytych przez promienie rentgenowskie odbite od 
dwóch sąsiednich równoległych płaszczyzn siecio¬ 
wych jest równa całkowitej wielokrotności długości 
fali AS = nX. Różnica dróg AS jest sumą odcinków 
AO i OB, o które promień 2 ma dłuższą drogę niż 
promień I. Mówiąc inaczej — interferencyjne odbi¬ 
cie nastąpi wtedy, gdy na drodze AOB zmieści się cał¬ 
kowita liczba długości fal, czyli gdy 


nX — 2d(hki)$\nft(hki)- 



d hkl) 


Rys. 1. Ilustracja równania Wulfa-Bragga; promienie rentge¬ 
nowskie R padają na rodzinę płaszczyzn sieciowych ( hkl) pod 
kątem połysku i zostają odbite (RJ pod kątem odbłysku 
(Pi = #*); (.N — prosta prostopadła do płaszczyzny {hkl)', N, R 
oraz R t leżą w jednej płaszczyźnie) 
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W równaniu tym liczba n — 1,2,3... określa tzw. rząd 
rząd odbicia, czyli liczbę długości fali mieszczących odbicia 
się na drodze ABC (rys. 5). Z równania Wulfa-Bragga 
wynika, że odbicie promieni rentgenowskich przez 
płaszczyzny sieciowe kryształu ma charakter selek¬ 
tywny, tzn. występuje tylko pod pewnymi kątami #, 
ściśle określonymi dla danej sieci krystalicznej i dla 
danej długości fali promieniowania. 

Każdą wiązkę promieni rentgenowskich odbitą 
przez płaszczyzny sieciowe można scharakteryzować 
jej kierunkiem rozchodzenia się i jej intensywnością. 

O geometrycznym rozkładzie w przestrzeni kierunków 
odbitych wiązek promieni decydują symetria i roz¬ 
miary komórki elementarnej. Liczba, rodzaje i wza¬ 
jemna konfiguracja atomów znajdujących się w ko¬ 
mórce elementarnej wpływają wyłącznie na inten¬ 
sywność wiązek odbitych. W związku z tym całość 
badań struktury kryształów za pomocą promieni 
rentgenowskich dzieli się na krystalografię rentge¬ 
nowską i analizę strukturalną kryształów. 

Krystalografia rentgenowska zajmuje się badaniem 
geometrycznego rozkładu w przestrzeni kierunków 
wiązek promieni rentgenowskich odbitych od płasz¬ 
czyzn sieciowych kryształów; na podstawie tego roz¬ 
kładu wyznacza się symetrię i stałe sieciowe sieci 
przestrzennych. Badanie intensywności wiązek odbi¬ 
tych, prowadzące do wyznaczania położeń (współ- analiza 
rzędnych) atomów w komórce elementarnej, jest pod- strukturalna 
stawą analizy strukturalnej kryształów (zob. rozdział kryształów 
„Strukturalna analiza kryształów”). 

Do zakresu krystalografii rentgenowskiej należą 
takie badania jak: określenie układu krystalograficz¬ 
nego, klasy dyfrakcyjnej, grupy przestrzennej (lub 
dyfrakcyjnej) kryształu, wyznaczenie stałych siecio¬ 
wych i objętości komórki elementarnej, wyznaczenie 
liczby atomów (cząsteczek) znajdujących się w ko¬ 
mórce elementarnej. 


Doświadczalne metody krystalografii 
rentgenowskie] 

W celu wykonania sformułowanych wyżej zadań 
oraz przygotowania danych wyjściowych do struktu¬ 
ralnej analizy kryształów stosowane są różne metody 
doświadczalne. W metodach tych tzw. obrazy dy¬ 
frakcyjne monokryształów lub ciał polikrystalicznych, 
uzyskane przy użyciu promieniowania rentgenowskiego 
zawierającego fale różnych długości (promieniowanie 
polichromatyczne) lub promieniowania o jednej dłu¬ 
gości fali (promieniowanie monochromatyczne), re¬ 
jestrowane są na błonie fotograficznej bądź leż za 
pomocą liczników Geigera-Mullera, proporcjonal¬ 
nych lub scyntylacyjnych. 

Przyrządy umożliwiające rejestrowanie obrazów kamery 
dyfrakcyjnych na błonie fotograficznej nazywają się rentgenow- 
kamerami rentgenowskimi. W użyciu są różne typy skie 
kamer. Istnieją kamery uniwersalne, pozwalające na 
wykonywanie rentgenogramów różnymi metodami, 
oraz kamery przeznaczone do wykonywania rentge¬ 
nogramów tylko jedną metodą. Istnieją kamery słu¬ 
żące do badania monokryształów oraz kamery do 
badania ciał polikrystalicznych, przy czym zarówno 
jedne, jak i drugie konstruowane są z przeznaczeniem 
do badań w warunkach normalnej temperatury i ciś¬ 
nienia oraz do badań w warunkach specjalnych, np. 
w wysokiej i niskiej temperaturze, pod wysokim ciś¬ 
nieniem, w atmosferze ochronnej (w atmosferze helu, 
azotu) itp. 

Aparaty, w których położenie i intensywność wią- dyfrakto- 
zek odbitych rejestruje się za pomocą liczników metry rent- 
Geigera-Miillera lub liczników scyntylacyjnych, na- genewskie 
żywa się dyfraktometrami rentgenowskimi (il. 77, 

78, tabl. 20). 

Uzyskiwane różnymi metodami i zarejestrowane rentgeno- 
na błonie fotograficznej lub za pomocą liczników gramy 
obrazy dyfrakcyjne ciał krystalicznych nazywa się (dyfrakto- 
rentgenogramami lub dyfraktogramami. Zaczernione gramy) 








plamki na rentgenogramach, będące śladami wiązek 
promieni rentgenowskich odbitych od płaszczyzn 
refleksy sieciowych, nazywa się zwykle refleksami. 

Przystępując do badania struktury kryształu, prze¬ 
de wszystkim należy ustalić kształt (tj. symetrię), typ 
i wymiary komórki elementarnej, a także liczbę ato¬ 
mów czy cząsteczek, które w tej komórce należy roz¬ 
mieścić. Jeżeli na podstawie zewnętrznego wyglądu 
kryształu nie można wyciągnąć wniosków o jego 
symetrii i przynależności do układu krystalograficz¬ 
nego, wówczas wykorzystuje się zjawisko dyfrakcji 
promieni rentgenowskich, stosując tzw. metodę Laue- 

metoda g °Metodą Lauego bada się monokryształ grubości 

Laucao 0,05-0,3 mm. Badany monokryształ przykleja się (np. 

woskiem, plasteliną) do tzw. główki goniometrycznej 
(il. 75, tabl. 20) będącej urządzeniem umożliwiającym 
zmianę nachylenia monokryształu względem padającej 
wiązki promieni oraz przesuwanie go w kamerze 
w kierunkach do siebie prostopadłych. Na umieszczo¬ 
ny w kamerze Lauego (il. 73, tabl. 20) nieruchomy 
monokryształ pada wiązka polichromatycznych, 
równoległych promieni rentgenowskich, wydzielona 
za pomocą tzw. kolimatora z szerokiej, rozbieżnej 
wiązki promieni rozchodzących się od anody lampy 
rentgenowskiej. Wiązka padająca po przejściu przez 
kolimator ma średnicę ok. 0,5-1,0 mm (rys. 2). 


symbolem 1 jest obrazem asymetrycznym i powstaje 
zawsze wtedy, gdy w monokrysztale, równolegle do 
wiązki padającej, nie znajduje się żaden z wymienio¬ 
nych wyżej elementów symetrii. 



* 




'• a 



lauegram 


Rys. 2. Metoda Lauego; schemat otrzymywania rentgenogramów 
za* pomocą promieni przechodzących R z i promieni wstecznych K z 

Otrzymany obraz dyfrakcyjny kryształu rejestruje 
się zwykle na płaskiej błonie fotograficznej ustawio¬ 
nej za monokryształem, prostopadle do kierunku 
wiązki padającej. Przy takim ustawieniu błony foto¬ 
graficznej mamy do czynienia z metodą promieni 
przechodzących. Otrzymane tą metodą rentgenogra- 
my nazywa się lauegramami (il. 68, tabl. 18). 

W metodzie Lauego błonę fotograficzną można 
ustawić rówmież między monokryształem a lampą 
rentgenowską. Jest to wtedy metoda promieni wstecz¬ 
nych, którą można wykonywać rentgenogramy (tzw. 
epigramy) monokryształów zupełnie nieprzenikhwych 
epigram dla stosowane j wiązki promieni, np. monokryształów 
bardzo dużych lub bardzo silnie pochłaniających pro¬ 
mieniowanie. . , , , . 

Metoda Lauego służy głównie do badania symetrii 
makroskopowej monokryształów. Jest to możliwe 
dlatego, że gdy w monokrysztale promienie biegną 
równolegle do dwu-, trój-, cztero- czy sześciokrotnej 
osi symetrii lub równolegle do płaszczyzny symetrii, 
to ślady wiązek odbitych od ułożonych zgodnie z sy¬ 
metrią płaszczyzn sieciowych będą na rentgenogramie 
odpowiednio symetrycznie rozmieszczone wokoł sia¬ 
du wiązki padającej. Jeżeli wiązka padająca przecho¬ 
dzi przez kryształ równolegle do w-krotnej osi symetrii, 
wzdłuż której przecina się n płaszczyzn symetrii, to 
na rentgenogramie wokół plamki pierwotnej wystąpi 
symetryczne ułożenie refleksów równocześnie wzglę¬ 
dem /i-krotnej osi symetrii i n płaszczyzn symetrii, 
obrazy Istnieje 10 różnych typów obrazów Lauego, tzn. 
Lauego różnych symetrycznych rozmieszczeń refleksów na 
rentgenogramach. Obrazy te mają symetrię: 1, 2, 3, 
4, 6, m, 2/n, 3 m, 4m, 6m (rys. 3). Obraz oznaczony 


m 2m 3m 

Rys. 3. 10 typów symetrii lauegramów 

Na podstawie rentgenogramów wykonanych me¬ 
todą Lauego nie można jednak stwierdzić obecności 
w monokrysztale środka symetrii. W związku z tym, 
stosując metodę Lauego, nie można danego mono¬ 
kryształu zaszeregować do jednej z 32 klas krystalo¬ 
graficznych (-> Budowa kryształów), tylko do jednej 
z 11 klas dyfrakcyjnych (klas Lauego), obejmujących 
po kilka klas krystalograficznych (różniących się mię¬ 
dzy sobą jedynie obecnością lub brakiem środka sy¬ 
metrii). Jedną klasę Lauego o symbolu 4 /mmm tworzą 
np. cztery klasy tetragonalne: 4 /mmm, 422, 4m/n, 
42 m. Klasy dyfrakcyjne oznaczone są symbolami: 1, 
2 jm y mmm , 4//n, 4 /mmm, 3, 3/n, 6//n, 6//n/n/n, /n3, 

m3m. ... 

Opisana niżej metoda obracanego kryształu i jej 
różne odmiany w-ymagają obracania badanego mo¬ 
nokryształu wokół pewnej prostej sieciowej (np. osi 
krystalograficznej X, Y lub Z). Odpowiednie usta¬ 
wienie monokryształu przeprowadza się stosując me¬ 
todę Lauego. Po wyznaczeniu w monokrysztale kie¬ 
runków osi krystalograficznych można już stosunko¬ 
wo łatwo wykonać pomiary długości krawędzi ko¬ 
mórki elementarnej za pomocą metody obracane¬ 
go kryształu. 1 . . 

W metodzie obracanego kryształu wąska wiązka 
(o średnicy 0,5-1,0 mm) równoległych monochroma¬ 
tycznych promieni rentgenowskich pada na mono¬ 
kryształ, któremu zwykle nadaje się kształt walca 
(o średnicy 0,1-0,3 mm i długości kilku mm) lub kulki 
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Rys. 4a. Schemat metody obracanego kryształu; K — prosta sie¬ 
ciowa kryształu, wokół której kryształ jest obracany 
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(mającej średnicę kilku dziesiątych mm). Główkę 
goniometryczną z przyklejonym monokryształem 
umieszcza się w odpowiedniej kamerze. Monokrysz¬ 
tał podczas wykonywania rentgenogramu jest obra¬ 
cany wokół jednej z osi krystalograficznych lub wokół 
innej prostej sieciowej o niskich wskaźnikach. Oś 
obrotu monokryształu jest prostopadła do wiązki 
promieni padających. W tych warunkach wzmocnio¬ 
ne promienie interferencyjne układają się na powierz¬ 
chniach stożków kołowych (rys. 4a), zwanych stożkami 
dyfrakcyjnymi, o wspólnej osi będącej prostą sie¬ 
ciową, wokół której obracany jest monokryształ. 
Monokryształ obracany jest w tym celu. aby coraz 
to inne jego płaszczyzny sieciowe mogły się znaleźć 
w pozycji odbijającej promienie rentgenowskie. 

. Zbiór wiązek promieni odbitych od płaszczyzn 
sieciowych danego monokryształu, czyli jego tzw. 
obraz dyfrakcyjny, rejestruje się najczęściej na błonie 
fotograficznej zwiniętej w walec, umieszczony współ¬ 
osiowo z osią obrotu kryształu. Na tak wykonanym 
rentgenogramie, po jego rozprostowaniu, refleksy uło¬ 
żone są wzdłuż równoległych do siebie prostych, któ¬ 
re nazywane są warstwicami (ilustracja 70, tabl. 19\ 
Warstwice są oczywiście śladami stożków dyfrakcyj¬ 
nych. 

Przy danej długości fali X promieniowania odle¬ 
głość między warstwicami b n zależy od periodu iden¬ 
tyczności J tej prostej sieciowej, wokół której kryształ 
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nych. W tym celu wykonuje się rentgenogramy przy 
obracaniu monokryształu kolejno wokół osi krysta¬ 
lograficznych X, y, Z. 

Po wyznaczeniu kształtu i rozmiarów komórki wyznaczanie 
elementarnej można wyznaczyć liczbę Z atomów liczby Z 
(cząsteczek) znajdujących się w komórce elementar¬ 
nej. Wykonuje się to w następujący sposób: Należy 
masę jednej komórki elementarnej podzielić przez wy¬ 
rażoną w gramach masę jednego atomu (czy jednej 
cząstcczKi). Masę jednej komorki elementarnej znaj¬ 
duje się mnożąc jej objętość V przez gęstość mono¬ 
kryształu D. Masę jednego atomu (cząsteczki) uzysku¬ 
je się przez pomnożenie masy atomowej (cząsteczko¬ 
wej) przez 1 / 12 masy atomu węgla 12 C, wynoszącą 
1,660435 *10 -24 g. Ostatecznie liczbę Z oblicza się ze 
wzoru 

z =_ 

Af •1,660435-10 ' 21 ’ 

gdzie M oznacza masę atomową (cząsteczkową), V 
jest wyrażone w cm 3 , a D w g/cm 3 . 

W krystalografii rentgenowskiej jednym z ważniej- wskaźniko¬ 
wych, ale i trudniejszych zadań jest tzw. wskaźnik©- wanie 
wanie refleksów, tj. przypisywanie poszczególnym refleksów 
refleksom wskaźników płaszczyzn sieciowych odbija¬ 
jących promienie rentgenowskie pod danym kątem tf, 
połączone z ustalaniem rzędu odbicia. 

Znajomość wskaźników refleksów jest niezbędna 
np. przy określaniu grupy przestrzennej kryształów 
czy wyznaczaniu położeń atomów w komórce ele¬ 
mentarnej . 

Wskaźnikując refleksy uwzględnia się fakt, że tylko 
ich część powstaje w wyniku odbicia promieni przez 
płaszczyzny sieciowe o różnych odległościach mię- 
dzypłaszczyznowych. Wiele refleksów powstaje bo¬ 
wiem w wyniku odbicia promieni przez jedną i tę 
samą płaszczyznę sieciową pod różnymi kątami & — 
spełniającymi jednak zawsze równanie Wulfa-Brag- 
ga. Są to refleksy otrzymywane w różnych rzędach 
odbicia, dla n — 1,2, 3... Różnica dróg promieni od¬ 
bitych w rzędzie pierwszym (n = 1) od dwóch sąsied- 
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był obracany. J można obliczyć stosując wzór nX = 
= J sin Vn 9 gdzie n jest rzędem ugięcia i numerem 
kolejnej warstwicy, v n — kątem warstwicowym dla 
«-tej warstwicy. Kąt v n wyznacza się z zależności 

v n ^ bnjr, gdzie r jest promieniem cylindrycznie 
zwiniętej błony fotograficznej, a b n — odległością 
(w mm) między warstwicą /i-tą a zerową. 

Mierząc wzdłuż jednej warstwicy odległość l 
(w mm) między każdymi dwoma refleksami symetrycz¬ 
nie położonymi względem śladu wiązki padającej 
(rys. 4b), można wyznaczyć braggowski kąt #, co z kolei 
pozwala na obliczenie — z równania Wulfa-Brag- 
ga — odległości międzypłaszczyznowej d {h ja) tej ro¬ 
dziny płaszczyzn sieciowych, które odbijając promie¬ 
nie rentgenowskie utworzyły dane refleksy. Dla war¬ 
stwicy zerowej zachodzi np. zależność: 

/ U 

2nr 360° ’ 

Odmianami metody obracanego kryształu są: me¬ 
toda kołysanego kryształu (w której monokryształ 
jest obracany nie stale o 360°, lecz jedynie tam i z po¬ 
wrotem, w pewnym niewielkim zakresie kątów) oraz 
metody goniometryczne. 

Ponieważ na podstawie wielkości kąta warstwico- 
wego v można z łatwością bezpośrednio wyznaczać 
periody identyczności prostych sieciowych, metody 
obracanego i kołysanego kryształu są podstawowymi 
metodami określania rozmiarów komórek elementar- 
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nich płaszczyzn sieciowych jest równa 1A, w rzędzie 
drugim (/i = 2) — równa jest 21, w rzędzie trzecim 
(« = 3) — 3A itd. (rys. 5). 

Wskaźnikowane refleksy oznacza się millerowskimi 
wskaźnikami h, k, l tych płaszczyzn sieciowych, które 
odbijały promieniowanie, przemnożonymi przez rząd 
odbicia. Otrzymane w ten sposób liczby całkowite 
h, k, l nazywają się wskaźnikami refleksów. Nie mu- 
symbole szą być one oczywiście liczbami pierwszymi względem 
refleksów siebie, a dla odróżnienia od symboli płaszczyzn sie¬ 
ciowych zapisuje się je bez nawiasu okrągłego. Tak 
więc np. symbol 444 oznacza refleks powstały w wy¬ 
niku odbicia promieni w rzędzie czwartym od pła¬ 
szczyzny sieciowej (111). Przy wyznaczaniu grupy 
przestrzennej kryształu czy do celu analizy struktu¬ 
ralnej kryształów wskaźnikuje się zwykle refleksy na 
rentgenogramach wykonanych metodami gonio- 
metrycznymi. Można jednakże wskaźnikować re¬ 
fleksy i na rentgenogramach otrzymywanych metodą 
Lauego lub metodami proszkowymi. 

Wyobraźmy sobie kryształ, w którym istnieją różne 
rodziny płaszczyzn sieciowych o jednakowych lub 
prawie jednakowych odległościach między płaszczy¬ 
znowych. Jak się okazuje, tego rodzaju sytuacja ma 
duży wpływ r na wygląd rentgenogramu wykonanego 
niejedno- metodą obracanego kryształu, gdyż leżące na jednym 
znaczność stożku dyfrakcyjnym promienie rentgenowskie, od- 
wskaźniko- bite przez płaszczyzny sieciowa o takich samych lub 
wania bardzo bliskich wartościach d(hki) t utworzą jeden 
refleks (w obrębie jednej warstwicy kierunki promieni 
odbitych zależą tylko od d ( hki)). W rezultacie takiego 
nakładania się na siebie refleksów niemożliwe się staje 
przeprowadzenie jednoznacznego ich wskaźnikowa¬ 
nia. Oznacza to, że jednemu refleksowi można przy¬ 
pisać wskaźniki dwu lub nawet kilku płaszczyzn odbi¬ 
jających. Nie można również określić intensywności 
nakładających się na siebie refleksów. Niejednoznacz¬ 
ne wskaźnikowanie refleksów może np. uniemożliwić 
prawidłowe wyznaczenie grupy przestrzennej bada¬ 
nego kryształu. 

Nakładania się na siebie refleksów można jednak 
uniknąć wykonując rentgenogramy w specjalny spo¬ 
sób. Wykorzystuje się przy tym fakt, że np. płaszczy¬ 
zny sieciowe ( hkl ) i {h'k'l') o bliskich lub takich sa¬ 
mych odległościach międzypłaszczyznowych nie znaj¬ 
dą się podczas wykonywania rentgenogramu metodą 
obracanego kryształu w pozycji odbijającej równo¬ 
cześnie, lecz znajdą się w niej kolejno, po obrocie 
kryształu o pewien kąt <p , tj. kąt między normalnymi 
płaszczyzn sieciowych {hkl) i {h'k'1). Jeżeli podczas 
obracania kryształu o kąt <p przesunięta zostanie błona 
fotograficzna, to promienie rentgenowskie odbite od 
płaszczyzn {hkl) i {h'k'1*) nie padną na to samo 
miejsce błony. 

metody oo< Metody goniometryczne polegają na zsynchronizo- 
niometryczne wanym z obrotem kryształu przesuwaniu błony foto¬ 
graficznej. W metodach tych na jednej błonie foto¬ 
graficznej rejestruje się refleksy należące tylko do jed¬ 
nej warstwicy; pozostałe warstwice zostają usunięte 
przez specjalne przysłony (tzw. blendy warstwicowe). 
Tak więc w metodach goniometrycznych refleksy jed¬ 
nej warstwicy zostają rozłożone na całej powierzchni 
rentgenogramu. Kamery rentgenowskie, za pomocą 
goniometry których uzyskuje się tego rodzaju dwuwymiarowe 
rentgenów- „rozwinięcia’’ poszczególnych warstwie, nazywają się 
skie goniometrami rentgenowskimi. Najczęściej stosowa¬ 
nymi metodami goniometrycznymi są metoda Weis- 
senberga i metoda de Jonga-Boumana. 
metoda W metodzie Weisscnberga skolimowana wiązka 
Weissenberga monochromatycznych promieni rentgenowskich pada 
na obracający się wokół wybranej prostej sieciowej 
monokryształ. Cylindrycznie zwinięta błona foto¬ 
graficzna, umisezczona współosiowo z osią obrotu 
monokryształu, przesuwa się — tam i z powrotem 
równolegle do osi obrotu monokryształu. Pomiędzy 
kryształem a błoną fotograficzną znajduje się cylin¬ 
dryczna blenda warstwicowa ze szczeliną. Przez tę 
szczelinę promienie odbite od płaszczyzn sieciowych 


dochodzą do błony fotograficznej. W kamerze Weis¬ 
senberga rozwinięcie dowolnej warstwicy można uzy¬ 
skać zmieniając w określony sposób kąt między kie¬ 
runkiem wiązki padającej promieni a osią obrotu 
kryształu i ustawiając odpowiednio szczelinę blendy 
warstwicowej. Wskaźnikowanie refleksów na rent¬ 
genogramach wykonanych metodą Weissenberga jest 
jednak dość skomplikowane, ponieważ metodą tą 
otrzymuje się na rentgenogramach zniekształcone 
obrazy płaszczyzn sieci odwrotnej (il. 69, tabl. 18 
i il. 76, tabl. 20). . . „ 

Sieć odwrotna jest konstrukcją ściśle związaną siec 
z siecią przestrzenną kryształu i służy do rozwiązywa- odwrotna 
nia szeregu zagadnień krystalografii rentgenowskiej. 

Sieć odwrotną konstruuje się prowadząc z dowolnego 
węzła „rzeczywistej” sieci przestrzennej — przyjętego 
za początek układu osi współrzędnych — normalne 
do wszystkich rodzin płaszczyzn sieciowych {hkl) 

(rys. 6). Wzdłuż tych normalnych zaznacza się punk¬ 
ty (węzły) znajdujące się w odległościach d* — n/d { hki) 
od początku układu współrzędnych {n jest liczbą cał¬ 
kowitą). Otrzymane punkty ułożone są w przestrzeni 



Rys. 6. Konstrukcja płaszczyzny X*Z* sieci odwrotnej 


periodycznie, tworząc trójwymiarową sieć nazywaną 
siecią odwrotną. Jak wynika z samej konstrukcji, 
płaszczyznom sieci rzeczywistej odpowiadają węzły 
sieci odwrotnej. Wskaźniki węzłów sieci odwrotnej są 
wskaźnikami płaszczyzn sieciowych pomnożonymi 
przez liczbę n. Osie sieci odwrotnej oznacza się sym¬ 
bolami**, 7*, Z*, a jej parametry symbolami a*, b *, 
c*, a*, £*, y*. Z konstrukcji sieci odwrotnej wynika 
również, że 


a* — —:-, O — —J - y C-j * 

^< 100 ) "( 010 ) “( 001 ) 

Sieć odwrotna przedstawia wszystkie teoretycznie 
możliwe odbicia promieni rentgenowskich od płasz¬ 
czyzn sieciowych kryształu. Warstwica na rentgeno- 
gramie otrzymanym metodą obracanego kryształu 
odpowiada jednej płaszczyźnie sieci odwrotnej. 

Niezniekształcone obrazy płaszczyzn sieci odwrot- metoda 
nej otrzymuje się goniometryczną metodą de Jonga- de Jonga- 
Boumana, w kamerze nazywanej retigrafem (il. 74, Baumana 
tabl. 20). Skolimowana wiązka monochromatycznych 
promieni rentgenowskich pada na obracający się mo- retigraf 
nokryształ. Wiązka padająca tworzy z -płaszczyzną 
prostopadłą do osi obrotu monokryształu kąt fi (rys. 

7); zmieniając odpowiednio ten kąt można uzyskać 
rozwinięcie dowolnej warstwicy, tzn. można otrzymać 
obraz dowolnej płaszczyzny sieci odwrotnej, prosto¬ 
padłej do osi obrotu. Promienie odbite od płaszczyzn 
sieciowych kryształu, leżące na powierzchni jednego 
stożka dyfrakcyjnego, docierają do błony fotogra¬ 
ficznej przez pierścieniową szczelinę w płaskiej blen¬ 
dzie warstwicowej. Płaska błona fotograficzna b y usta¬ 
wiona prostopadle do osi obrotu kryształu, obraca 
się z tą samą prędkością kątową i w tym samym kie- 
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runku co monokryształ. Osie obrotu monokryształu a niami integralnymi. Powstają one dlatego, że wskutek wygaszania 
i błony fotograficznej są do siebie równoległe i prze- centrowania komórki pojawiają się pomiędzy nie- integralne 
sunięte względem siebie na odległość zależną od którymi płaszczyznami sieciowymi „dodatkowe” 


wiązka promieni 



Rys. 7. Metoda cle Jonga-Boumana: a) zasada metody, b) kine¬ 
matyczny schemat kamery 


retigram numeru rozwijanej warstwicy. Otrzymywane rentge- 
nogramy nazywa się retigramami. Refleksy na reti- 
gramach mają kształt litery x. 

Wskaźnikowanie refleksów na retigramach jest 
bardzo łatwe, polega na określeniu współrzędnych re¬ 
fleksów względem osi sieci odwrotnej (il. 72, tabl. 19). 
metoda Na podobnej zasadzie oparta jest metoda precesyj- 
precesyjna na, w której monokryształ nie wykonuje ruchu obro¬ 
towego, lecz ruch precesyjny, tak że np. jedna z jego 
osi ( X , Y lub Z) obraca się wokół wiązki promieni pa¬ 
dających. tworząc z nią stały kąt. 


Wyznaczanie grupy przestrzennej kryształu 

Może się zdarzyć, że na rentgenogramach po prostu 
brakuje niektórych refleksów i na retigramach wi¬ 
doczne są jakby puste miejsca. Mówimy wtedy, że 
pewne refleksy zostały wygaszone. Jeżeli brakuje 
refleksów w niektórych, ściśle określonych dla danej 
płaszczyzny sieciowej rzędach odbicia, to mamy do 
czynienia z wygaszaniami systematycznymi. Wyga¬ 
szania systematyczne refleksów są powodowane przez 
centrowane komórki elementarne oraz przez struktu¬ 
ralne elementy symetrii. Z wygaszaniami systema- 
wygaszania tycznymi refleksów mamy do czynienia wówczas, gdy 
systema- w wyniku odbicia promieni rentgenowskich, np. od 
tyczne płaszczyzny (l 10), powstają tylko refleksy 220, 440, 
660, 880,..., a brak refleksów 110, 330, 550, 770 ... itp. 

Badanie wygaszań systematycznych, które wymaga 
uprzedniego wywskaźnikowania refleksów', prowadzi 
więc do wykrywania w krysztale osi śrubowych 
i płaszczyzn poślizgu oraz ustalania typu sieci Bra- 
vais’go. 

Wygaszania systematyczne powodowane przez cen¬ 
trowane komórki elementarne nazywają się wygasza- 


Rys. 8. Płaszczyzny sieciowe 
(100), (110), (120), w komór¬ 
ce elementarnej sieci typu 7 
(komórkę elementarną i pła¬ 
szczyzny sieciowe przedsta¬ 
wiono w rzucie prostokąt¬ 
nym na płaszczyznę XY). 

Liniami niebieskimi zazna¬ 
czono płaszczyzny „dodat¬ 
kowe” 

płaszczyzny (w porównaniu z komórką prymitywną), 
tak że dla pewnych rzędów odbicia różnice dróg stają 
się równe nie n 2, lecz (n/2)X. W sieci typu I dodatkowe 
płaszczyzny sieciowa znajdują się np. pomiędzy płasz¬ 
czyznami (100) i (120), a nie ma ich między płaszczyz¬ 
nami (110) (rys. 8). Na rentgenogramach kryształów 
mających sieci typu I wystąpią więc np. refleksy 002, 

004, 006 ..., 240,480, 6 -12-0..., 110,220,330,440.... 

Ogólnie: dla sieci typu 1 występują tylko te refleksy, 
dla których suma wskaźników jest liczbą parzystą: re 9uła 
h+k-rl — 2 n. Powyższe uogólnienie jest tzw. regułą w Y9aszań 
wygaszań dla sieci typu /. 

Typ sieci Bravais’go w krysztale można również 
wyznaczyć bez wskaźnikowania refleksów i badania 
reguł wygaszań, po prostu mierząc oprócz stałych 
sieciowych a , 6, c periody identyczności prostych sie¬ 
ciowych będących przekątnymi ścian komórki ele¬ 
mentarnej oraz period identyczności jednej z prostych 
sieciowych będących przekątnymi przestrzennymi 
komórki elementarnej. 

Śrubowe osie symetrii powodują powstawanie wy- wygaszania 
gaszań systematycznych zwanych wygaszaniami seryj- ser Vjne 
nymi. Są to wygaszania dotyczące refleksów powsta¬ 
jących w wyniku odbicia promieni rentgenowskich od 
płaszczyzny sieciowej prostopadłej do osi śrubowej. 

Wygaszania te pojawiają się dlatego, że w wyniku 
działania ^-krotnej osi śrubowej następuje jakby 
rozszczepienie płaszczyzny sieciowej prostopadłej do 
niej np. na n płaszczyzn (w porównaniu z działaniem 
zwykłej /i-krotnej osi symetrii; rys. 9). Jeżeli w sieci 
przestrzennej istnieje np. oś 4 t o kierunku [001], to 
refleksy o wskaźnikach typu 00/wystąpią na rentgeno- 
gramic tylko w'tedy, gdy l — An (tzn. refleksy 004, 

008, 00-12 ...). 





Rys. 9. 'Płaszczyzna sieciowa (001) w komórkach elementarnych 
sieci przestrzennych z czterokrotną osią symetrii: a) zwykła, 
b) śrubową (rzut prostokątny na płaszczyznę YZ)\ liniami nie¬ 
bieskimi zaznaczono „dodatkowe” płaszczyzny (001) 


Trzeci rodzaj wygaszań systematycznych — wyga- wygaszania 
szania pasowe — powodują płaszczyzny poślizgu, pasowe 
w wyniku bowiem działania tych ostatnich także po- 
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wstają dodatkowe płaszczyzny sieciowe (rys. 10). 
Jeżeli np. w krysztale występuje płaszczyzna poślizgu 
typu c równoległa do (010), to refleksy o wskaźnikach 



Rys. 10. Płaszczyzna poślizgu c równoległa do płaszczyzny ry¬ 
sunku powoduje pojawienie się dodatkowych (linie niebieskie) 
płaszczyzn sieciowych (fcO/), w stosunku do sieci przestrzennej 
bez płaszczyzny poślizgu (rzut prostokątny na płaszczyznę X2T) 


typu hOl wystąpią na rentgenogramach tylko wtedy, 
gdy / = 2n. 

Dla każdego rodzaju sieci Bravais*go, osi śrubowej, 
płaszczyzny poślizgu istnieje ściśle określona reguła 
wygaszać refleksów. Kombinacje tych reguł dają pra¬ 
wa wygaszać dla poszczególnych grup przestrzennych. 
Prawa te, zebrane w specjalnych tabelach (np. Inter¬ 
national Tables for Jf-Ray Crystallography, Bir¬ 
mingham 1952), umożliwiają identyfikację grup 
przestrzennych (dyfrakcyjnych) po przeprowadzeniu 
analizy wygaszać refleksów. Ponieważ na podstawie 
wygaszać nie można stwierdzić obecności lub braku 
środka symetrii w krysztale, a pozostałe makroskopo¬ 
we elementy symetrii również nie wpływają na wyga¬ 
szania, to niektórych grup przestrzennych nie można 
od siebie odróżnić, gdyż grupy te dają jednakowe wy¬ 
gaszania. W związku z tym dany kryształ można za¬ 
kwalifikować jedynie do jednej ze 122 grup dyfrakcyj¬ 
nych, a nie do jednej z 230 grup przestrzennych. Osta¬ 
tecznego wyboru grupy przestrzennej w obrębie grupy 
dyfrakcyjnej można dokonać badając anizotropię nie¬ 
których fizycznych własności kryształów (np. wystę¬ 
powanie gawiska piezoelektrycznego lub piroelek- 
trycznego) lub analizując liczbę maksimów na wykre¬ 
sie funkcji Pattersona (zob. rozdział „Strukturalna 
analiza kryształów”). 



Czterokołowy dyfraktometr do 
monokryształów 

Najdoskonalszym obecnie przyrządem do badania 
struktury kryształów jest automatyczny czterokołowy 
dyfraktometr rentgenowski, określający z wielką pre¬ 
cyzją położenie odbitych wiązek promieni oraz ich 
natężenie. Dyfraktometr taki składa się ze źródła 
promieniowania rentgenowskiego, czterokołowego 

<P 

O 


kryształ 


detektor 


Rys. 11. Układ osi a>, *P t x,2d w automatycznym czterokołowym 
dyfraktometrze do badania monokryształów 


goniometru, detektora, urządzenia pomiarowo-reje- 
strującego i komputera. 

Monokryształ przymocowany do główki gomo- 
metrycznej można obracać niezależnie wokół czterech 
osi w, śP, 25 (rys. 11) za pomocą 4 kół (łuków) urzą¬ 
dzenia goniometrycznego. Kryształ znajduje się zawsze 
w punkcie przecięcia się osi wszystkich czterech 
kół. Obroty kryształu wokół osr w, d>, % pozwalają 
ustawić dowolną jego płaszczyznę sieciową w pozycji 
odbijającej promieniowanie. Koło 29 umożliwia usta¬ 
wienie detektora w takiej pozycji, przy której dany 
promień odbity może zostać zarejestrowany (detekto¬ 
rem jest zwykle licznik proporcjonalny lub scyntyla¬ 
cyjny). Dzięki licznikom można zmierzyć intensyw¬ 
ność refleksu z bardzo dużą dokładnością — ok. 1%. 

Zadaniem komputera jest sterowanie procesem 
automatycznego poszukiwania refleksu oraz pomiaru 
jego położenia i natężenia, a także rejestrowanie mie¬ 
rzonych wielkości. 

Niektóre typy dyfraktometrów wymagają uprzed¬ 
niego wyznaczenia stałych sieciowych i grupy prze¬ 
strzennej badanego kryształu (metodami fotograficz¬ 
nymi) oraz wstępnego zorientowania kryształu na go- 
niometrze. Inne typy — nie potrzebują żadnych wstęp¬ 
nych wiadomości o badanym krysztale oraz nie wyma¬ 
gają orientowania kryształu: same, sterowane swoim 
minikomputerem określają i mierzą komórkę elemen¬ 
tarną. Istnieją też dyfraktometry, które ze zmierzo¬ 
nych intensywności od razu przygotowują dane (zbiory 
wartości |Fa*i|) do analizy strukturalnej. 

Automatyczne dyfraktometry do monokryształów 
(il. 78, tabl. 20), mimo że zapewniają znacznie większą 
precyzję i szybkość pomiarów niż metody fotograficzne, 
nie są jeszcze przyrządami idealnymi, zwłaszcza gdy 
chodzi o badanie struktur kryształów niestabilnych 
(np. kryształów białek) czy kryształów o bardzo dużych 
krawędziach komórki elementarnej. Zbyt długi jest 
bowiem czas pomiaru każdego refleksu (wynosi 1,5-3 
min) i czas poszukiwania refleksu, tzn. odpowiedniego 
orientowania czterech osi goniometru. Trzeba wziąć 
pod uwagę, że mierzy się nieraz po kilka tysięcy re¬ 
fleksów (np. A. Korczyński, M. Nardelli, M. A. Pellin- 
ghelli zmierzyli w r. 1973 przy badaniu struktury krysz¬ 
tałów HgCI^SCOsTH*)* za pomocą dyfraktometru 
AED Siemensa intensywność 5785 refleksów’, z szyb¬ 
kością 1 pomiar na 90 s, nie licząc czasu ustawienia 
przez przyrząd płaszczyzn sieciowych w pozycji od¬ 
bijającej). Przy badaniu struktury kryształów bia¬ 
łek—oprócz konieczności zmierzenia wielu tysięcy 
refleksów — występuje dodatkowe utrudnienie, zwią¬ 
zane z rozkładem chemicznym tych kryształów pod¬ 
czas pomiarów; w rezultacie wielokrotna wymiana 
kryształów na goniometrze wydłuża czas badania. 

Trwające obecnie na świecie poszukiwania nowych 
rozwiązań konstrukcyjnych dyfraktometrów, umożli¬ 
wiających skrócenie czasu przeprowadzania badan 
jednego kryształu, idą w kilku kierunkach: w kierun¬ 
ku przyspieszania pracy istniejących gomometrów, 
np. przez równoczesne ustawianie wszystkich czterech 
osi goniometru czy zwiększanie szybkości obrotu 
monokryształu (do 1500°/min) wokół poszczególnych 
osi' w kierunku stosowania źródeł promieniowania 
rentgenowskiego o dużej mocy (lampy rentgenowskie 
z wirującą anodą), co skraca czas ustawiania kryształu 
i detektora we właściwej pozycji dzięki powstawaniu 
intensywniejszych wiązek odbitych, oraz kierunku 
zastosowania zamiast jednego licznika kilku liczni¬ 
ków, mierzących równocześnie kilka wiązek, tzw. 
„jednoczesnych” lub „prawie jednoczesnych ’. 

’ Szybkie pomiary przeprowadza się również w dy¬ 
fraktometrach pozycyjnych, w których obraz dyfrak¬ 
cyjny jest rejestrowany przez mozaikę liczników, albo 
w tzw. dyfraktometrach energodyspersyjnych, w któ¬ 
rych się stosuje promieniowanie polichromatyczne 
i rejestruje się równocześnie wszystkie rzędy odbicia 
od jednej płaszczyzny sieciowej. W pierwszym wy¬ 
padku miniaturowe liczniki półprzewodnikowe lub 
proporcjonalne układa się w jedno- lub dwuwymiaro- 
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we mozaiki. Kryształ wykonuje tylko jeden obrót 
o 360°, a podczas tego obrotu mierzy się wszystkie 
wiązki odbite odpowiadające jednej płaszczyźnie 
sieci odwrotnej. W jednym z dyfraktometrów zasto¬ 
sowano np. jednowymiarową mozaikę liczników pół¬ 
przewodnikowych rozmieszczoną na luku 180°. W tej 
mozaice znajdowało się 128 liczników o wymiarach 
3 x 4 mm. W takim dyfraktometrze uzyskano prawie 
dziesięciokrotne skrócenie czasu przeprowadzania 
pomiarów jednego kryształu. W innym dyfrakto¬ 
metrze zastosowano 4 segmenty łukowe mozaiki 
liczników, a każdy z nich zawierał 128 liczników pro¬ 
porcjonalnych. Wydajność takiego dyfraktometru 
zależy od stałych sieciowych badanego kryształu i wy¬ 
gaszeń systematycznych i jest 20-60 razy większa niż 
wydajność dyfraktometru z jednym licznikiem. 

W dyfraktometrach do monokryształów stosuje się 
również tzw. wieloniciową kamerę proporcjonalną, 
będącą ^dwuwymiarowym detektorem „czułym na 
pozycję”, oraz pozycyjno czułe detektory scyntylacyj¬ 
ne, przetwarzające (za pomocą ekranu — konwertora 
polikrystalicznego ZnS lub monokrystalicznego Nal) 
rentgenowski obraz dyfrakcyjny na obraz w świetle 
widzialnym. Jasność takiego obrazu przetwornik 
elektronooptyczny wzmacnia 10 5 razy, a po wzmocnie¬ 
niu obraz ten jest zapamiętywany w lampie telewi¬ 
zyjnej (ikonoskooie) i dalej odczytywany przez 
elektroniczną maszynę cyfrową. Te ostatnie dyfrak¬ 
tometry imitują w swej pracy serię rentgenogramów 
wykonywanych metodą kołysanego kryształu. 

Metody proszkowe 

Większość ciał stałych występujących w przyrodzie 
i wytwarzanych przez człowieka (np. skały, metale, 
materiały ceramiczne i budowlane) to konglomeraty 
drobnych, mikroskopowej wielkości kryształów. Nie 
występują tu tak duże kryształy, by do ich badania 
można było zastosować metodę obracanego kryształu 
czy metodę Lauego. 

Rentgen os trukturalne badania ciał polikrystalicz¬ 
nych przeprowadza się za pomocą metody opracowa¬ 
nej przez Debye’a, Sherrera i Hulla oraz jej różnych 
odmian (takich jak metody ogniskujące czy metoda 
dyfraktometryczna). 

W metodzie Debye ł a-Scherrera-Hulla wąska wiąz¬ 
ka równoległych, monochromatycznych promieni 
rentgenowskich pada na preparat sporządzony z kry¬ 
stalicznego proszku. Preparat może mieć kształt prę¬ 
cika o średnicy ok. 0,3 mm i długości 2-3 mm. Wiel¬ 
kość ziaren proszku powinna być rzędu 1 pm, co 
oznacza, że w celu otrzymania takiego proszku nale¬ 
żałoby np. sześcienny monokryształ o krawędzi dłu¬ 
gości 1 mm podzielić na ok. 10 9 drobnych krystalitów. 

W takim preparacie w odbijaniu promieni rentge¬ 
nowskich biorą udział te płaszczyzny sieciowe po¬ 
szczególnych krystalitów, które zupełnie przypadko¬ 
wo znajdują się w pozycji spełniającej równanie Wulfa- 
Bragga. W każdym krystalicie odbija promienie rent¬ 
genowskie tylko jedna płaszczyzna sieciowa, ale teore¬ 
tycznie w każdym krystalicie może to być inna płasz¬ 
czyzna. Ponieważ w preparacie jest praktycznie nie¬ 
skończona liczba krystalitów, a liczba płaszczyzn 
sieciowych odbijających promieniowanie jest ograni¬ 
czona, to w wielu krystalitach promienie rentgenow¬ 
skie będą odbijane przez tę samą płaszczyznę sieciową. 

Płaszczyzny sieciowe o tej samej odległości między- 
pfaszczyznowej, ułożone w preparacie chaotycznie, 
odbijają promienie rentgenowskie w różnych kierun¬ 
kach przestrzeni, ale zawsze pod tym samym kątem 
w stosunku do wiązki padającej. W rezultacie 
promienie odbite w różnych krystalitach od tej samej 
rodziny płaszczyzn sieciowych (hkl) leżą na powierzch¬ 
ni stożka (tzw. stożka Debye’a), którego osią jest pro¬ 
mień padający. Dla każdej rodziny płaszczyzn sie¬ 
ciowych powstaje odrębny stożek promieni odbitych 
(rys. 12). 


Obraz dyfrakcyjny preparatu proszkowego reje¬ 
struje się albo na płaskiej błonie fotograficznej, albo 
znacznie częściej — na błonie fotograficznej zwiniętej 



Rys. 12. Stożki promieni odbitych w metodzie Debyc*a-Scher- 
rera-KuIla 


w walec. W pierwszym wypadku refleksy na rentgeno- 
gramie mają kształt pierścieni o różnej intensywności, 
w drugim — linii krzywych wyższego rzędu (il. 67, 
tabl. 18). Dla danego refleksu można zawsze wy¬ 
znaczyć kąt połysku £, obliczyć wartość d h ja oraz 
zmierzyć intensywność. Obraz dyfrakcyjny rejestruje 
się również za pomocą licznika Geigera-Mullera lub 
scyntylacyjnego w dyfraktometrze rentgenowskim. 

Metodami proszkowymi można rozwiązywać nie¬ 
które zadania krystalografii rentgenowskiej, jak np. 
wyznaczanie stałych sieciowych czy grup przestrzen¬ 
nych. Jednak możliwości stosowania tych metod 
w krystalografii rentgenowskiej czy w analizie struktu¬ 
ralnej kryształów są bardzo ograniczone, przede 
wszystkim ze względu na trudności przy wskaźniko¬ 
waniu refleksów. Wskaźnikowanie to jest stosunkowo 
proste jedynie na rentgenogramach proszkowych 
kryształów regularnych, heksagonalnych i tetrago- 
nalnych; natomiast dla kryształów trójskośnych, 
jednoskośnych i rombowych wskaźnikowanie jest bar¬ 
dzo trudne, a w dodatku często niejednoznaczne ze 
względu na nakładanie się refleksów. 


zastosowanie 
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Rentgenografia stosowana 

Metody proszkowe znajdują natomiast szereg zasto¬ 
sowań praktycznych w chemii, fizyce, metalurgii czy 
geologii i są podstawą tzw. rentgenografii stosowanej. 

Do takich praktycznych zastosowań należą: jakościo¬ 
we i ilościowe określanie składu fazowego substancji analiza 
(tzw. analiza fazowa), wyznaczanie wielkości krysta- fazowa 
litów, precyzyjne pomiary stałych sieciowych (do¬ 
kładność ich określenia może osiągnąć 10- 5 -10- 6 !), 
wyznaczanie współczynników rozszerzalności, ba¬ 
danie tekstur, badanie naprężeń wewnętrznych. 

Każda substancja krystaliczna oddziałując z pa¬ 
dającymi na nią promieniami rentgenowskimi tworzy 
charakteryzujący ją jednoznacznie obraz dyfrakcyjny. 

Tak więc i rentgenogramy proszkowe (bo tylko na 
nich zarejestrowany jest cały obraz dyfrakcyjny) jed¬ 
noznacznie charakteryzują daną substancję i to bez 
względu na to, czy występuje ona jako czysta faza, 
czy jako składnik mieszaniny. Jeśli badana substancja 
stanowi mieszaninę dwóch lub więcej związków che¬ 
micznych (faz), to każda z tych faz daje na rentgeno- 
gramie proszkowym swoje własne refleksy. Analiza fa¬ 
zowa pozwala wykrywać substancje krystaliczne w ta¬ 
kiej postaci, w jakiej występują one w danym prepa¬ 
racie, a nie w postaci jonów czy pierwiastków che¬ 
micznych wchodzących w ich skład. Tak więc np. 
dyfrakcyjna analiza fazowa pozwala stwierdzić, że 
w mieszaninie NaCl i KBr występują chlorek sodowy 
i bromek potasowy, a nie chlorek potasowy i bromek 
sodowy (analiza chemiczna wykazałaby w takiej mie- 
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Rys. 13. Tekstura 
drutu aluminiowe¬ 
go; do osi drutu 
równoległy jest w 
przybliżeniu kieru¬ 
nek [111] krystali¬ 
tów 



Rys. 14. Tekstura 
walcowanej blachy 
stalowej; do powie¬ 
rzchni blachy jest 
równoległa płasz¬ 
czyzna sieciowa 
(100) krystalitów, a 
do kierunku walco¬ 
wania — kierunek 
IHO] 


szaninie obecność jonów Na + , K + , Cl", Br , lecz nie 
wskazałaby, jak te jony połączone są ze sobą w ciele 
stałym). Dyfrakcyjna analiza fazowa pozwala rozróż¬ 
niać w prosty sposób odmiany polimorficzne ciał kry¬ 
stalicznych. Można odróżnić np. kalcyt CaC0 3 od 
aragonitu CaC0 3 i vaterytu CaC0 3 lub odróżnić od 
siebie jedenaście odmian Si0 2 . 

Jakościową analizę fazową przeprowadza się po¬ 
równując wartości dhki i intensywności I poszczegól¬ 
nych refleksów wyznaczone z rentgenogramu prosz¬ 
kowego badanej substancji z wartościami d h ki i 1 po¬ 
danymi w tzw. rentgenograficznym wzorcu liczbowym. 
Wzorzec ten jest tabelką, w której się znajdują war¬ 
tości dhki i 1 otrzymane z rentgenogramu proszkowe¬ 
go substancji wzorcowej. Rentgenograficzne wzorce 
liczbowe gromadzi się w specjalnych kartotekach, jak 
np. kartoteka Powder Diffraction Data, wydawana 
w USA przez JC PDS — International Centre for 
Diffraction Data (dawniej tzw. kartoteka ASTM). 
Odpowiedni wzorzec w takiej kartotece (liczącej kilka¬ 
dziesiąt tysięcy kart) wynajduje się za pomocą specjal¬ 
nego klucza. Na podstawie rentgenogramu proszko¬ 
wego można jednoznacznie zidentjdikować substancję 
— również w mieszaninie — znajdując w kartotece 
odpowiedni wzorzec. 

Teksturą, albo teksturą krystaliczną, nazywa się 
uprzywilejowaną wzajemną orientację przestrzenną 
krystalitów w materiale polikrystalicznym. Tekstury 
powstają m.in. podczas krystalizacji, odlewania, ciąg¬ 
nienia i zgniatania materiałów. Występują np. we 
włóknach azbestu, w drutach i blachach. W drutach 
ciągnionych tekstura polega na ułożeniu krystalitów 
pewnym kierunkiem w przybliżeniu równolegle do 
osi drutu (rys. 13). W blachach walcowanych krystali¬ 
ty układają się pewnym kierunkiem w przybliżeniu 
równolegle do kierunku walcowania (oznaczonego 
strzałką na rys. 14), a pewną płaszczyzną sieciową 
równolegle do powierzchni blachy. Występowanie 
tekstury ma wpływ — czasem dodatni, czasem ujem¬ 
ny — na wiele właściwości materiałów, m.in. na wy¬ 
trzymałość i na twardość metali. Stąd duże znaczenie 
ma badanie tekstur rentgenostrukturalną metodą 
proszkową. Występowanie tekstury w materiale poli¬ 
krystalicznym wpływa na wyglądy rentgenogramu 
proszkowego, albowiem intensywność jednych reflek¬ 
sów wzrasta, a innych maleje lub pozostaje bez zmia¬ 
ny. Refleksy przybierają kształt łuków i układają się 
wzdłuż warstwie (il. 7lb, c, tabl. 19). 

Za pomocą metod proszkowych można uzyskać 
wiele interesujących danych o polimerach organicz¬ 
nych. Istnienie w strukturze polimerów obszarów 
bezpostaciowych i krystalicznych powoduje występo¬ 
wanie na rentgenogramie proszkowym rozmytego 
szerokiego refleksu od fazy bezpostaciowej oraz re¬ 
fleksów charakterystycznych dla fazy krystalicznej 
(il. 71a, tabl. 19). Pod wpływem np. rozciągania próbki 
polimeru obszary krystaliczne bezładnie w nim roz¬ 
łożone mogą uzyskać orientację zależną od kierunku 
przykładanych sił, czyli w polimerze może zostać wy¬ 
tworzona tekstura. Rentgenogram proszkowy stek- 
sturowanego polimeru (również i metalu) jest podobny 
do rentgenogramu wykonanego metodą obracanego 
kryształu (il. 71, tabl. 19), a z takiego rentgenogramu, 
z odległości między warstwicami, można wyznaczyć 
jedną z krawędzi komórki elementarnej kryształu po¬ 
limeru. Często jest to jedyna metoda uzyskania stałych 
sieciowych polimerów, gdyż nie zawsze można uzys¬ 
kać monokryształy danego polimeru o wielkości od¬ 
powiedniej do badań dyfrakcyjnych. 

G.B.Bokij, M. A. Poraj-Koszic Rentgenostrukturnyj analiz 
t.l, Moskwa 1964; M. J. Buerger X-Ray Crystallography, New 
York 1942; J. Chojnacki Elementy krystalografii cAemrcrrtey'i 
cznej Warszawa 1971; W.C. Hamilton Science 169, 133 (1970); 
A. Korczyński, M. Nardelli, M. A. Pellinghelli Roczniki 
Chem. 47, 905 (1973);G.H.W. Milburn X-Ray Crystallography , 
London 1973; K. Łukaszewicz, W. Trzebiatowski Zarys rentge- 
nograficznej analizy strukturalnej , Katowice 1960; Z. Trzaska 
Durski Podstawy krystalografii rentgenowskiej i analizy struktu¬ 
ralnej kryształów , Warszawa 1973; W. Trzebiatowski Zarys rent - 
genograficznej analizy strukturalnej , Katowice 1960;M. M. Uman- 
SKIJ Apparatura rentgenostrukturnych issledowamj, Moskwa 1960. 
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Janusz Leciejewicz 

Odkrycie dyfrakcji wiązki elektronów w folii niklowej 
przez C. J. Davissona i L. H. Germera (1927 r.) było 
doświadczalnym potwierdzeniem hipotezy L. de Bro- 
glie’a o falowym charakterze ruchu cząstek (1924 r.). 

Długość fali elektronów A jest związana z pędem elek¬ 
tronu p zależnością de Broglie’a 
A = h{p = h/mv , 

gdzie: h — stała Plancka, m — masa spoczynkowa 
elektronu, v — prędkość elektronu. Wyrażając pręd¬ 
kość elektronów przez przyspieszającą je różnicę po¬ 
tencjałów U i podstawiając wartości liczbowe na h i /«, 
otrzymuje się zależność 

X = 12,26/fu , 

w której X wyraża się w A a U w V. W zależności tej 
nie uwzględnia się relatywistycznego wzrostu masy 
elektronu ze zwiększaniem się jego prędkości. Błąd 
w określeniu A, związany z pominięciem poprawki 
relatywistycznej, wynosi 2-3% dla U rzędu 20-40 kV, 
wzrasta jednak do 10% przy różnicy potencjałów 
200 kV. 

Spójne i sprężyste rozpraszanie wiązki elektronów 
przez sieć krystaliczną prowadzi do powstawania ma¬ 
ksimów interferencyjnych (refleksów) występujących 
pod kątem ugięcia # określonym prawem Wulfa- 
Bragga (zob. rozdział „Krystalografia rentgenow¬ 
ska”). Natężenie ugiętych wiązek elektronów zależy 
od struktury krystalicznej badanej substancji. 

Wiązką elektronów padając na atom ulega ugięciu 
wskutek oddziaływania kulombowskiego z polem 
elektrostatycznym atomu. Pole to pochodzi zarówno 
od dodatniego jądra atomu jak i ujemnej powłoki 
elektronowej. Dodatni potencjał jądra (proporcjo¬ 
nalny do liczby atomowej Z) jest skupiony na małej 
przestrzeni wokół jądra, natomiast potencjał ujemny 
pochodzący od powłoki elektronowej, bardziej „roz¬ 
myty”, jest funkcją zarówno liczby elektronów jak 
i ich rozkładu w powłoce atomu. Zatem wielkość cha¬ 
rakteryzująca ugięcie elektronów na atomie — ato¬ 
mowy czynnik rozpraszania elektronów fe — zależy 
od ładunku jądra i od liczby elektronów. Zależność 
od liczby elektronów w powłoce atomu opisuje ato¬ 
mowy czynnik rozpraszania promieni rentgenowskich 
/ r , będący funkcją kąta ugięcia #. Ogólnie można to 
zapisać: 

f e {d) = cons t[Z-/r(#)]. 

Taka zależność f e od kąta ugięcia # powoduje, że ato¬ 
my o małym Z (atomy lekkie) są stosunkowo silnymi 
ośrodkami rozpraszającymi elektrony. Jest więc moż¬ 
liwe określenie położeń atomów lekkich w obecności 
atomów z dużym Z (atomów ciężkich) ze znacznie 
większą dokładnością niż na to pozwala metoda 

dyfrakcji promieni rentgenowskich. 

Elektrony jako cząstki obdarzone ładunkiem elek¬ 
trycznym, oddziałują silnie z atomami i są absorbowa¬ 
ne. Dlatego wnikają do wnętrza kryształu na niewiel¬ 
kie głębokości (przyspieszone różnicą potencjałów 
200 kV wnikają na głębokość 1000 A). Zjawisko to 
ogranicza zakres stosowalności metody dyfrakcji 
elektronów do preparatów cienkowarstwowych. Z 
drugiej strony jednak umożliwia badanie struktury 
materiałów występujących w postaci cienkich warstw, 
nawet wtedy gdy grubości ich wynoszą tylko 500 A. 

Badanie materiałów w postaci warstw grubości badanie 
rzędu mikrometrów stwarza konieczność stosowania cienkich 
elektronów przyspieszanych różnicą potencjału 50- warstw 
100 kV. Elektrony te mają długość fali 0,055-0,039 A, 
wtedy braggowskie kąty ugięcia dla większości ma- 
teriałów nieorganicznych nie przekraczają 3-4°. 

Do określania odległości międzypłaszczyznowych 
dhki można użyć równania Wulfa-Bragga («A = 

= 2^ sin#) w postaci przybliżonej. Ponieważ kąt 
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określanie 2& (rys. 1) jest bardzo mały, można napisać 2sini? a 
dnia ~ sin 2# ~ tg 2# = rwci/L, a więc 
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gdzie: r hki — odległość między śladem ugiętej wiązki 
a śladem wiązki pierwotnej na błonie fotograficznej, 
L — odległość między preparatem a błoną fotogra¬ 
ficzną. Przybliżenie to wprowadza błąd nie większy 
niż 1 %. Mierząc różnicę potencjału przyspieszającego, 
wyznacza się długość fali elektronów A; L jest stałą 
aparaturową, r^ki natomiast mierzy się na tzw. elek- 
tronogramie -— obrazie dyfrakcyjnym zarejestrowa¬ 
nym na błonie fotograficznej. 

Można wyróżnić 3 grupy elektronogramów ciał 
stałych: 1) Elektronogramy punktowe z refleksami 
w postaci plamek (ii. 81a, tabl. 21). Otrzymuje się je, 
gdy badana substancja jest pojedynczym kryształem 
lub składa się z oddzielnych bloków krystalicznych 
o osiach w przybliżeniu równoległych do siebie. Elek¬ 
tronogramy tego rodzaju są głównie wykorzystywane 
do oznaczenia struktury krystalicznej badanej sub¬ 
stancji. 2) Elektronogramy tekstur — maksima dy¬ 
frakcyjne (refleksy) mają postać łuków (il. 81b, tabl. 
21). Powstają one, gdy badany preparat jest zbiorem 
bloków krystalicznych rozłożonych w sposób statys¬ 
tycznie przypadkowy, jednakże mających określone 
płaszczyzny równoległe do siebie. Na jednym takim 
elektronogramie występują prawie wszystkie refleksy 
możliwe dla danego typu struktury. Refleksy te ukła¬ 
dają się wg określonych reguł, co ułatwia ich wskaźni¬ 
kowanie. Na elektronogramach tekstur można mie¬ 
rzyć z dużą dokładnością natężenia refleksów. Z ich 
wartości wyznacza się rozkład potencjału elektryczne- 
go w komórce elementarnej, a zatem pozycje atomów 
v/ komórce (zob. rozdział „Strukturalna analiza 
kryształów”). 3) Elektronogramy ciał polikrystalicz¬ 
nych (badany preparat zbudowany jest z chaotycznie 
rozłożonych bloków krystalicznych), zawierają mak¬ 
sima interferencyjne w postaci pierścieni (il. 81 c, tabl. 
21). Rozkład pierścieni określa zbiór odległości mię- 
dzypłaszczyznowych dhki. Takie elektronogramy wy¬ 
korzystywane są w badaniach struktury, zwłaszcza 
struktuiy substancji o wysokiej symetrii krystalogra¬ 
ficznej, do wyznaczenia parametrów komórki ele¬ 
mentarnej, a także do wyznaczenia składu fazowego 
preparatu. 

Elektronogramy otrzymuje się bądź przepuszczając 
wiązkę elektronów przez odpowiednio cienką folię 
(transmisja), bądź przez odbicie od powierzchni ma¬ 
teriału. Schemat układu do rejestracji ugiętych pro¬ 
mieni elektronowych (tzw. elektronografu) przedsta- 



Rys. 2. Schemat układu do rejestracji ugiętych 
promieni elektronowych 


wia rys. 2. Rozbieżna wiązka elektronów z żarzącej się 
katody zostaje przyspieszona w polu elektrycznym 
między katodą a anodą. Wiązka ta zostaje następnie 
zogniskowana w płaszczyźnie błony fotograficznej 
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za pomocą soczewki elektromagnetycznej. Preparat 
substancji badanej (w położeniu transmisji) jest 
umieszczony między soczewką a błoną fotograficzną. 
Cały układ znajduje się w wysokiej próżni (10 _s - 
10~ 7 Pa). 


W zależności od różnicy potencjału przyspieszają¬ 
cego wyróżnia się dwie techniki dyfrakcyjne. W pierw¬ 
szej metodzie — metodzie dyfrakcji elektronów nisko- 
energetycznych, tzw. LEED (Low Energy Electron 
Diffraction) — elektrony są przyspieszane różnicą 
potencjałów od 30 do 600 V. Mała przenikliwość po¬ 
wolnych elektronów ogranicza stosowalność tej me¬ 
tody. Przy tym jest konieczne stosowanie preparatów 
cienkowarstwowych o nadzwyczaj starannie przygoto¬ 
wywanej powierzchni — bez zanieczyszczeń i znie¬ 
kształceń, wymagana próżnia — rzędu 10* 7 Pa. Ugięte 
elektrony są przyspieszane dodatnim potencjałem 
5 kV, co ułatwia znacznie rejestrację ugiętych wiązek. 
Obraz dyfrakcyjny otrzymuje się w bardzo krótkim 
czasie, co pozwala na śledzenie procesów zachodzą¬ 
cych w trakcie naświetlania. Metodę LEED wykorzy¬ 
stuje się w badaniach rozkładu jonów metali na po¬ 
wierzchni katalizatora, mechanizmu absorpcji gazów 
na powierzchniach, mechanizmu powstawania cien¬ 
kich warstw tlenkowych na powierzchniach półprze¬ 
wodników itd. Druga metoda — to metoda dyfrakcji 
elektronów wysokoenergetycznych, tzw. HEED (High 
Energy Electron Diffraction). Jest ona stosowana 
w typowych elektronografach. Elektrony są przyspie¬ 
szane różnicą potencjałów 50 kV i wnikają do bada¬ 
nego materiału na głębokość do 1000 A. Większa 
przenikliwość powoduje, że nie jest konieczne tak 
bardzo staranne przygotowanie powierzchni, jak przy 
dyfrakcji elektronów niskoenergetycznych. 

Metody elektronografii pozwalają na uzyskanie 
danych szczególnie ważnych do poznania własności 
materiałów. Umożliwiają określenie struktury we¬ 
wnętrznej kryształów, tzn. określenie rozmiarów ko¬ 
mórki elementarnej kryształu oraz ustalenie pozycji 
atomów w komórce. Elektronografia nadaje się 
szczególme dobrze do badania struktury warstw po¬ 
wierzchniowych i ich zmian wywołanych obróbką 
technologiczną, procesami utleniania i azotowania, 
korozją. Struktura warstw powierzchniowych jest na 
ogół różna od struktury wnętrza materiału (-> Stany 
powierzchniowe ciał stałych). Bardzo ważne wyniki 
uzyskuje się z elektronograficznych badań warstw 
epitaksjalnych oraz badań naprężeń wywołanych de¬ 
formacją plastyczną. Metody dyfrakcji elektronów są 
wykorzystywane powszechnie w dziedzinie krystalo¬ 
grafii submikroskopowej — do wyznaczania wielkości 
i kształtu mikroziaren krystalicznych w stanie dużego 
rozdrobnienia, do określania orientacji mikroziaren 
na granicy faz, do badania mechanizmu powstawania 
struktur przejściowych na powierzchniach. W dziedzi¬ 
nie krystalografii submikroskopowej znaczne usługi 
oddaje łączenie metody dyfrakcji elektronów z mikro¬ 
skopią elektronową (zob. rozdział „Mikroskopia 
elektronowa”). 


J. Chojnacki Metalografia strukturalna , Katowice 1966; 
B. K. Wajnsztejn Strukturnaja Elektronografija, Moskwa 1956; 
B. K. Wajnsztejn, Sowremiennaja Krystalografia , Moskwa 1979! 


Neutronografia strukturalna 
i magnetyczna 

Janusz Leciejewicz 

Rozpraszanie neutronów 

Wkrótce po odkryciu neutronu (J. Chadwick, 1932 r.) 
Mitchell i Powells (1936 r.) wykonali doświadczenie 
mające na celu sprawdzenie, czy ruch neutronów ma 
charakter falowy, tzn. czy jest spełnione równanie fa¬ 
lowe de Broglie ł a 

X = h/mv. 


metoda 

LEED 


metoda 

HEED 



















gdzie: X jest długością fali neutronu, h — stałą Planc¬ 
ka, m — masą neutronu, v —jego prędkością, 
dyfrakcja Stwierdzono, że neutrony ze źródła radowo-berylo- 
neulronów wego po przepuszczeniu przez warstwę parafiny uległy 
odbiciu od płaszczyzny sieciowej (111) kryształu 
tlenku magnezu pod kątem padania i odbicia wynika¬ 
jącym z równania Wulfa-Bragga dla długości fali 
neutronów ok. 1,6 A. Doświadczenie to miało charak¬ 
ter pokazowy. Wskutek bardzo małego natężenia wią¬ 
zek neutronów ze źródeł radowo-berylowych, zjawisko 
dyfrakcji neutronów nie mogło być wykorzystane do 
badania struktury kryształów. Dopiero rozpowszech¬ 
nienie reaktorów jądrowych po 1945 r. umożliwiło 
praktyczne zastosowanie dyfrakcji neutronów termicz¬ 
nych do badań strukturalnych. 

W oddziaływaniu z kryształem swój charakter falo¬ 
wy szczególnie silnie przejawiają neutrony termiczne. 
Ulegają one dyfrakcji zgodnie z prawem Wulfa-Brag¬ 
ga podobnie jak promienie rentgenowskie o zbliżonej 
długości fali (zob. rozdział „Krystalografia rentge¬ 
nowska*’) i elektrony (zob. rozdział „Elektronogra- 
fia”). Zjawisko dyfrakcji neutronów może być więc 
wykorzystane do określenia położeń atomów w krysz¬ 
tale, czyli do oznaczania struktury kryształu. 

Mechanizm oddziaływania neutronów z atomami 
jest jednak inny niż w wypadku promieni rentgenow¬ 
skich i elektronów, które są rozpraszane przez po¬ 
włokę elektronową atomu. Neutrony są rozpraszane 
przez jądra atomowe. W procesie rozpraszania siły 
działające między jądrem a neutronem są bardzo krót¬ 
kiego zasięgu — rzędu promienia jądra, tj. 10* 14 m 
(-* Siły jądrowe). Jądra atomowe są więc dla neutro¬ 
nów o długości fali rzędu 10 -10 m (1 A) punktowymi 
ośrodkami rozpraszania. 


Długość rozpraszania niektórych nuklidów 


Nuklid 

Z 

b, 10- łl m 

Nuklid 

Z 

b, 10- 14 m 

X H 

1 

-0,378 

Fe 

26 

0,96 

■K 

I 

0,65 

Co 

27 

0,25 

iaę 

6 

0,661 

Ni 

28 

1,03 

N 

7 

0,940 

W 

74 

0,466 

O 

8 

0,577 

Pb 

82 

0,96 

Ti 

22 

-0,34 

3 ”U 

92 

0,85 


Wg Acta Cryst. A28, 357 (1972) 


długość Zdolność jądra do rozpraszania neutronów termicz- 
rozpraszania n >' ch charakteryzuje wielkość zwana długością roz- 
y * praszania b , zależna od struktury danego jądra. Tak 

więc izotopy tego samego pierwiastka mają różne war¬ 
tości 6, a ponadto zależność b od liczby atomowej 
jest nieregularna (tabela). Dla niektórych nuklidów 
(np. jąder wodoru — protonów, jąder tytanu) prze¬ 
sunięcie fazowe między rozproszoną falą neutronową 
a falą padającą wynosi 0, a nie 71 , jak to jest przy roz¬ 
praszaniu promieni rentgenowskich i elektronów. 
Umownie przyjmuje się więc, że przy wartości zero, 
długość rozpraszania ma znak ujemny. Niezależność 
b od liczby atomowej ma istotne znaczenie przy wyko¬ 
rzystaniu dyfrakcji neutronów w analizie strukturalnej 
kryształów. Przede wszystkim możliwe jest wyznacze¬ 
nie z jednakową dokładnością położeń atomów lek¬ 
kich i ciężkich (o małym i dużym Z) występujących 
obok siebie w komórce elementarnej kryształu. Przy 
stosowaniu metod krystalografii rentgenowskiej ato¬ 
my ciężkie odgrywają dominującą rolę w procesie roz¬ 
praszania. Stąd oznaczenie położeń atomów lekkich, 
gdy w komórce elementarnej występują również ato¬ 
my ciężkie, jest zwykle obarczone dużym błędem, 
wyznaczanie Wykorzystując metody neutronograficzne można więc 
V położeń wyznaczyć z dużą dokładnością położenia atomów 
atomów (jąder) wodoru w substancjach organicznych, wodor- 
lekkich kach metali i innych związkach zawierających wodór, 
np. w hydratach, wodorotlenkach itd. Ponieważ jądra 
wodoru rozpraszają neutrony w znacznej mierze nie¬ 
spójnie (powstaje duże tło), w neutronograficzne i 


analizie strukturalnej korzystniejsze jest stosowanie 
związków chemicznych, w których atomy wodoru za¬ 
stąpione są atomami deuteru. 


Neutronografia strukturalna 

Metody neutronograficzne były i są stosowane przy 
weryfikacji struktur kryształów tlenków metali cięż¬ 
kich (np. tlenków ołowiu, tlenków uranu), węglików rozróżnianie 
ciężkich metali (np. węglików wolframu). Metodami atomów 
tymi można również rozróżniać atomy o zbliżonych o zbliżonych 
liczbach atomowych, np. węgla, azotu i tlenu. Jest Z 
to szczególnie ważne przy analizie struktury substancji 
organicznych. Atomy te są nierozróżnialne dla pro¬ 
mieni rentgenowskich, podobnie jak atomy żelaza, 
niklu i kobaltu występujące w ważnych technicznie 
stopach i niektórych materiałach magnetycznych 
(np. w ferrytach). 

Natężenie neutronowych maksimów interferencyj¬ 
nych (refleksów), podobnie jak w dyfrakcji promieni natężenie 
rentgenowskich (zob. rozdział „Strukturalna analiza refleksów 
kryształów”) jest proporcjonalne do kwadratu modu¬ 
łu amplitudy struktury Fhki (czynnika struktury): 

Ihkl ~ \Fhkl\~, 

N 

Fhkl = Z 
}~1 

JV — liczba jąder (atomów) w komórce elementarnej 
kryształu, xj y yj, Zj — współrzędne /-ego jądra w ko¬ 
mórce, hkl — wskaźnik refleksu, bj — długość rozpra¬ 
szania jądra j. Monochromatyzacji wiązki, czyli 
wyodrębnienia wiązki o bardzo wąskim paśmie dłu¬ 
gości fali, dokonuje się zwykle przez odbicie wiązki od 
określonej płaszczyzny kryształu ustawionej pod brag- 
gowskim kątem w stosunku do skolimowanej wiązki 
polichromatycznej. Typowymi monochromatorami 
neutronów są monokryształy miedzi, cynku lub glinu. 
Monochromator jest umieszczony w osłonie z ołowiu 
lub żeliwa otoczonej następnie grubymi osłonami spo¬ 
rządzonymi z mieszaniny boraksu z parafiną oraz 
zewnętrzną osłoną wodną (rys. 1). Osłony pochłaniają 
promieniowanie y oraz rozproszone przez monochro¬ 
mator neutrony termiczne i prędkie. 



Rys. 1. Schemat dyfraktometru neutronów 


Przyrząd do otrzymywania widma neutronów ugię- dyfraktometr 
tych przez kryształ nosi nazwę dyfraktometru neu- neutronów 
tronów (rys. 1 i il. 83, tabl. 21). Jest on skonstruowa¬ 
ny na tej samej zasadzie co dyfraktometr rentgenow¬ 
ski. Ze względu na duże rozmiary licznika neutronów 
oraz znaczny ciężar jego osłony, dyfraktometr neu¬ 
tronów ma większe rozmiary i jest cięższy niż dyfrak¬ 
tometr rentgenowski. Obrót stolika próbki dyfrakto- 
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metru jest sprzężony w stosunku 1:2 z ruchem ramie¬ 
nia, na którym znajduje się licznik. Zapewnia to za¬ 
chowanie równości kąta padania i odbicia neutronów 
na próbkę badaną. Ruch stolika i ramienia odbywa 
się zwykle skokowo, np. co 5' kąta rozproszenia. 

Do badań strukturalnych wykorzystuje się z reguły 
monochromatyczną wiązkę neutronów. Neutrony po- 
lichromatyczne wychodzące na zewnątrz reaktora 
przechodzą zwykle przez kolimator umieszczony w ka¬ 
nale reaktora. Zadaniem kolimatora jest otrzymanie 
wiązki o określonym przekroju i rozbieżności. Koli¬ 
mator ten powoduje również obniżenie tła instrumen¬ 
talnego wywołanego neutronami prędkimi i promie¬ 
niowaniem y. Strumień neutronów monochromatycz¬ 
nych ze standardowych reaktorów doświadczalnych 
ma natężenie o kilka rzędów wielkości mniejsze niż 
strumień fotonów promieni rentgenowskich (z lampy 
rentgenowskiej), do badań neutronograficznych ko¬ 
nieczne jest więc stosowanie próbek stosunkowo du¬ 
żych: rzędu kilkunastu gramów (próbki polikrysta¬ 
liczne) i kilkunastu miligramów (monokryształy). 

Stolik typowego dyfraktometru neutronów jest 
tak skonstruowany, aby mógł udźwignąć ciężar kilku¬ 
set kG— kriostatu, elektromagnesu itd. Ruchy ze¬ 
społów dyfraktometru są zdalnie sterowane a pomiary 
całkowicie zautomatyzowane. 

Bardzo prostym przykładem wykorzystania metod 
dyfrakcji neutronów do oznaczania struktury krysta¬ 
licznej pviązku zawierającego obok siebie atomy 
o dużej i małej liczbie atomowej jest mon o węglik wol¬ 
framu (WC). Badania rentgenograficzne pozwoliły 
ustalić tylko położenie atomów wolframu. Są jednak 
możliwe aż 3 modele struktury WC różniące się poło¬ 
żeniami atomów węgla, ale dające prawie jednakowe 
natężenia refleksów rentgenowskich. W procesie roz¬ 
praszania promieni rentgenowskich atomy wolframu 
odgrywają bowiem dominującą rolę, gdyż mają 74 
elektrony a atomy węgla tylko 6 elektronów. 

Jak wynika z przytoczonej poprzednio tabeli, w pro¬ 
cesie rozpraszania neutronów termicznych jądra ato¬ 
mów węgla są silniejszymi ośrodkami rozpraszania 
niż jądra atomu wolframu. Wyniki badań neutrono¬ 
graficznych jednoznacznie pokazały, że monowęglik 
wolframu ma strukturę taką jak przedstawiona na 
rys. 2a z uporządkowanym rozkładem atomów węgla. 
Proponowane modele o strukturze typu arsenku niklu 
(rys. 2b), czy też ze statystycznie nieuporządkowanym 
rozkładem atomów węgla (rys. 2c) są nie do przyjęcia 
ze względu na całkowity brak zgodności między obli¬ 
czonymi na ich podstawie natężeniami refleksów 
neutronowych a natężeniami obserwowanymi. 



Dobrym przykładem ilustrującym wykorzystanie 
dyfrakcji neutronów jest oznaczenie struktury związ- struktura 
ku organicznego benzenu. Jądra wodoru mają ujemną benzenu 
amplitudę rozpraszania b. Strukturę C 6 H c wyznaczo¬ 
no wykorzystując dane otrzymane dla próbki mono- 
krystalicznej. Na rys. 3 jest pokazana fourierowska 
mapa gęstości jądrowej, analogiczna do mapy gęstości 
elektronowej omówionej w rozdziale „Strukturalna 
analiza kryształów”. Kontury zaznaczone linią prze¬ 
rywaną dotyczą „ujemnej” gęstości jądrowej wynika¬ 
jącej z faktu, że b dla protonów ma znak ujemny. Tak 
więc, dopiero badanie neutronograficzne dostarczyło 
po raz pierwszy bezpośredniej doświadczalnej wery¬ 
fikacji modelu Kekulćgo budowy cząsteczki benzenu. 

Metoda dyfrakcji neutronów wykorzystywana jest 
powszechnie do badania struktury krystalicznej za¬ 
równo związków nieorganicznych jak i organicznych 
i biologicznie czynnych, a także badania przemian fa¬ 
zowych zachodzących w ferroelektrykach, przemian 
porządek-nieporządek w metalach, a ponadto do iden¬ 
tyfikacji składu fazowego materiałów. 


Neutronografia magnetyczna 

Oddziaływanie momentu magnetycznego neutronu 
z momentami magnetycznymi jonów w sieci kryształu 
prowadzi do zjawiska rozpraszania neutronów. W 
substancjach paramagnetycznych rozproszenie to jest 
niespójne i maleje ze wzrostem kąta rozpraszania, 
wskutek zależności od magnetycznego czynnika ato¬ 
mowego, określającego rozkład niesparowanych elek¬ 
tronów warunkujących moment magnetyczny jonów. 

W substancjach odznaczających się uporządkowaniem 
momentów magnetycznych, tzn. o określonej orienta¬ 
cji momentów magnetycznych w stosunku do elemen¬ 
tów symetrii kryształu, czyli mających strukturę mag¬ 
netyczną, rozpraszanie magnetyczne neutronów jest 
spójne i sprężyste. Na neutronogramach, łącznie 
z refleksami pochodzącymi od neutronów rozproszo¬ 
nych przez wszystkie jądra w komórce elementarnej 
kryształu, występują magnetyczne maksima interfe¬ 
rencyjne (refleksy magnetyczne). 

Wykorzystując magnetyczne rozpraszanie neutro¬ 
nów uzyskuje się nieosiągalny innymi metodami bez¬ 
pośredni wgląd w konfigurację momentów magnetycz¬ 
nych poniżej temperatury Curie lub Neela (-> Teoria 
magnetyzmu). Śledząc zmianę natężenia refleksów natężenie 
magnetycznych w funkcji temperatury, można wyzna- refleksu 
czyć krzywą namagnesowania, bowiem natężenie refie- magnetycz- 
ksu magnetycznego I^ kl jest proporcjonalne do kwa- nego 
dratu momentu magnetycznego jonu : 

2 * 

Magnetyczna amplituda struktury 

M 

/"I 

gdzie: pj — ~^~ c z f i W ~ 0,2695-10~ 12 /}/*/; e i m — 

ładunek i masa spoczynkowa elektronu, y — moment 
magnetyczny neutronu, c — prędkość światła, — 
atomowy czynnik magnetyczny jonu, w — moment 

magnetyczny jonu (w magnetonach Bohra), qj — 
wektor oddziaływania magnetycznego wiążący kieru¬ 
nek momentu magnetycznego jonu z wektorem pro¬ 
stopadłym do płaszczyzny odbijającej {hkl) (\q\ 2 = 

= sin 2 a, gdzie a jest kątem między tymi kierunkami) 

>'U zj — współrzędne jonu; sumowanie obejmuje 
jony paramagnetyczne w magnetycznej komórce ele¬ 
mentarnej, których jest M. Gdy do badania wykorzys¬ 
tywane są niespoiaryzowane neutrony, tj. gdy wszyst¬ 
kie kierunki ustawienia momentów magnetycznych 
neutronów są jednakowo prawdopodobne, wtedy roz¬ 
praszanie magnetyczne i jądrowe są względem siebie 
niespójne. Natężenie refleksu spowodowanego rozpra- 
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szaniem neutronów przez jądra i rozpraszaniem mag¬ 
netycznym wyraża się zależnością: 

hu ~ lAwp+jJHF," 

W substancjach antyferromagnetycznych momenty 
magnetyczne jonów w sąsiednich komórkach elemen¬ 
tarnych skierowane są antyrównolegle. Oznacza to, że 
wyznaczanie co druga komórka elementarna jest identyczna. Ele- 
struktury mentama komórka magnetyczna powstaje przez po- 
magnetycznej dwojenie w jednym kierunku komórki krystalogra¬ 
ficznej. Na neutronogramach pojawiają się wtedy re¬ 
fleksy od „nadstruktury magnetycznej”. Na rys. 4 
przedstawione są neutronogramy monoarsenku uranu 
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Rys. 4. Neutronogramy monoarsenku uranu otrzymane w tem¬ 
peraturze 4,2 K, 80 K i 300 K. Refleksy magnetyczne oznaczone 
zostały literą M. Wskaźniki połówkowe oznaczają, że magne¬ 
tyczna komórka jest podwojona w jednym kierunku w stosunku 
do komórki krystalograficznej (struktura magnetyczna A ) 
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(UAs) wykonane w temperaturze 4,2 K, 80 K, 300 K. 
Położenia refleksów magnetycznych wskazują, że 
w 4,2 K występuje w UAs uporządkowanie antyferro¬ 
magnetyczne prowadzące do podwojenia komórki 
krystalograficznej w jednym tylko kierunku. Symetria 
komórki magnetycznej jest więc w temperaturze 4,2 K 
tetragonalna (struktura A na rys. 5). W temperaturze 
80 K stwierdzono występowanie innego typu upo¬ 
rządkowania antyferromagnetycznego (struktura B 
na rys. 5) — również o symetrii tetragonalnej, chociaż 
komórka krystalograficzna i magnetyczna ma wów¬ 
czas jednakowe rozmiary. Mierząc w funkcji tempe¬ 
ratury natężenie refleksu magnetycznego oznaczonego 
wskaźnikiem M10 x U , charakterystycznego dla struk¬ 
tury typu A stwierdzono, że zanika on nagle w tempe¬ 
raturze 66 K (rys. 6). W tej samej temperaturze poja¬ 
wia się refleks magnetyczny M100 związany ze struk¬ 
turą magnetyczną typu B. Zanika on w temperaturze 
127 K (temperatura Nećla) — następuje przejście do 
stanu paramagnetycznego. Można więc neutronogra¬ 
ficznie wyznaczyć nie tylko strukturę magnetyczną 


Rys. 5. Struktura magnetyczna monoarsenku uranu w tempera¬ 
turze 4,2 K (struktura magnetyczna A) i 80 K (struktura magne¬ 
tyczna B). Kierunki momentów magnetycznych w obu wypad¬ 
kach są równoległe do osi czterokrotnej — komórka magnetyczna 
ma symetrię tetragonalną 



Rys. 6. Zależność od temperatury natężeń refleksów magnetycz¬ 
nych charakterystycznych dla struktury magnetycznej typu A 
( M10 V,) i typu B (Ml00). W temperaturze 66 K ma miejsce 
magnetyczna przemiana fazowa. Przejście do stanu paramagne¬ 
tycznego zachodzi przy 127 K (punkt Ncćla) 


w danej temperaturze, lecz również określić zakres 
temperatury stabilności poszczególnych faz magne¬ 
tycznych. Prowadząc pomiary neutronograficzne 
otrzymuje się krzywe namagnesowania bez obecności 
zewnętrznego pola magnetycznego. Wyznaczyć można 
również wartości momentu magnetycznego w stanie 
uporządkowania antyferromagnetycznego. 

Zastosowanie zjawiska dyfrakcji magnetycznej neu¬ 
tronów umożliwiło w 1946 r. pełne potwierdzenie mo¬ 
delu uporządkowania antyferromagnetycznego postu¬ 
lowanego przez Nećla jeszcze w 1934 r. Doprowadziło 
następnie do odkrycia bardziej złożonych typów upo¬ 
rządkowania magnetycznego, w tym helikoidalnego. 

Natężenie refleksów magnetycznych jest zależne od 
kierunku zewnętrznego pola magnetycznego przyło¬ 
żonego do badanej próbki; przyłożenie pola magne¬ 
tycznego o kierunku prostopadłym do płaszczyzny od¬ 
bijającej prowadzi do całkowitego wygaszenia roz¬ 
praszania magnetycznego. Pozwala to na wyodręb¬ 
nienie rozpraszania przez jądra od rozpraszania mag¬ 
netycznego,^ a tym samym na wyznaczenie struktury 
krystalicznej substancji magnetycznej. Przykładając 
zewnętrzne pole magnetyczne równolegle do płasz¬ 
czyzny rozpraszającej uzyskujemy maksymalne roz¬ 
praszanie magnetyczne ( ‘\q\ 2 =1). 

Przy użyciu wiązki spolaryzowanych neutronów 
(tzn. mających jednakowy kierunek spinów) rozpro¬ 
szenie przez jądra i rozpraszanie magnetyczne są spój¬ 
ne względem siebie. Metoda spolaryzowanej wiązki 
umożliwia wyznaczenie z dużą dokładnością udziału 
magnetycznego rozpraszania w natężeniu refleksu. 
Jest więc wykorzystywana głównie do wyznaczenia 
wartości magnetycznego czynnika atomowego i war¬ 
tości momentu magnetycznego jonów paramagnetycz¬ 
nych tworzących substancje ferromagnetyczne. 

G. E. Bacon Neutron Diffraction, Oxford 1975; J. Chojnacki 
Metalografia strukturalna , Katowice 1966; J- A. Izjumow, R. P. 
Oz jerów Magnitnaja Niejtronografija , Moskwa 1966. J. Lecie- 
jewicz Zarys neutronografii kryształów , Warszawa 1980; J. Le- 
ciejewicz Wstęp do dyfraktometru neutronów , Warszawa 1979; 
J. Z. Nozik, R. P. Oz jerów, K. Hennig Strukturnaja Niejtro¬ 
nografija , Moskwa 1979. 
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Strukturalna analiza kryształów 

Zofia Kosturkiew/cz 

Strukturalną analizą kryształów (rentgenowską ana¬ 
lizą strukturalną kryształów) nazywa się zespół metod 
obliczeniowych prowadzących do uzyskania szczegó¬ 
łowego obrazu rozmieszczenia atomów w przestrzeni, 
na podstawie analizy zmierzonych intensywności wią¬ 
zek promieni rentgenowskich odbitych przez płasz¬ 
czyzny sieciowe kryształu. W celu określenia struktury 
całego kryształu wystarczy określić wymiary i sy¬ 
metrię jego komórki elementarnej i wzajemne rozmie¬ 
szczenie atomów (cząsteczek) wewnątrz komórki. 
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Kierunki rozchodzenia się promieni ugiętych zależą 
od wielkości parametrów sieciowych i od symetrii 
kryształu (zob. rozdział „Krystalografia rentgenow¬ 
ska”). Natomiast natężenia promieni ugiętych zależą 
od tego, jakie atomy znajdują się w poszczególnych 
pozycjach komórki elementarnej, a więc od tego jak 
obsadzone są atomami płaszczyzny sieciowe (/z/c/), 
pomiar Dane o natężeniach ugiętych wiązek promieni rent- 
intensyw- genowskich uzyskuje się metodami fotograficznymi, 
ności stosując odpowiednie kamery rentgenowskie, bądź też 
refleksów metodami licznikowymi w dyfraktometrach rentge¬ 
nowskich. Przy stosowaniu fotograficznych metod 
rejestracji obrazu dyfrakcyjnego zaczernienie re¬ 
fleksów na rentgenogramach ocenia się (mierzy) na¬ 
stępującymi sposobami: 1) wizualnie, porównując 
zaczernienie refleksów z kalibrowaną, wielostopniową 
skalą; wówczas błąd pomiaru jest jednak nie mniejszy 
niż 10%; 2) za pomocą mikrofotometru, w którym 
zaczernienie refleksów określa fotokomórka; 3) auto¬ 
matycznym mikrodensytometrem, rejestrującym zmie¬ 
rzone przez fotokomórkę intensywności refleksów na 
taśmie magnetycznej w minikomputerze, z którego 
otrzymuje się wydruk intensywności refleksów wraz 
z ich wskaźnikami; precyzja pomiarów przeprowa¬ 
dzonych tą metodą dorównuje precyzji metod licz¬ 
nikowych. Metody licznikowe pomiaru natężeń po¬ 
legają na zliczaniu fotonów w ugiętej wiązce promieni 
za pomocą licznika Geigera-Mlillera lub licznika pro¬ 
porcjonalnego czy scyntylacyjnego w dyfraktometrze 
rentgenowskim. Liczniki umożliwiają wielką precyzję 
pomiarów intensywności, błąd pomiaru bowiem nie 
przekracza 1%. Coraz większą popularnością cieszy 
się czterokołowy dyfraktometr do monokryształów. 

Według kinematycznej teorii dyfrakcji promieni 
rentgenowskich na kryształach o budowie mozaiko¬ 
wej natężenie I ugiętej wiązki promieni jest propor¬ 
cjonalne do kwadratu czynnika struktury F: 

hkl = k\Fhkl\ Z 

(współczynnik proporcjonalności k jest związany 
m.in. z absorpcją promieniowania przez kryształ, 
drganiami cieplnymi atomów w krysztale i polaryza- 
czynnik cją promieniowania rentgenowskiego). Czynnik struk- 
struktury tury zależy z kolei od rozmieszczenia atomów w ko¬ 
mórce elementarnej i jest dany wzorem 

Fm = 

gdzie Xj, yj, zj są współrzędnymi y-ego atomu w ko¬ 
mórce elementarnej, wyrażonymi w ułamkach dłu- 
czynnik gości jej krawędzi, zaś czynnik atomowy fj określa 
atomowy stosunek amplitudy fali ugiętej na y-ym atomie do 
amplitudy fali ugiętej przez pojedynczy elektron; 
jego wartość jest zależna od liczby atomowej y-ego 
atomu oraz od braggowskiego kąta ■&. 

Czynnik struktury jest wynikiem sumowania j 
amplitud fal rentgenowskich ugiętych na j atomach, 
znajdujących się w komórce elementarnej, w trakcie 
odbijania tych promieni przez rodzinę płaszczyzn 
sieciowych ( hkl ) (rys. 1). 

kąt Każda z fal ugiętych na y-ym atomie ma amplitudę 
przesunięcia proporcjonalną do czynnika atomowego fj i kąt 
fazowego przesunięcia fazowego (fazę) a w stosunku do fali 
ugiętej na atomie znajdującym się w początku układu 
współrzędnych. Ponieważ różnica faz między pro¬ 
mieniami rentgenowskimi odbitymi od kolejnych 
równoległych płaszczyzn sieciowych {hkl) wynosi 
271 (warunek Wulfa-Bragga), to różnica faz dla trans¬ 
lacji jednostkowych (parametrów a , b, c) wzdłuż osi 
X , Y, Z wynosi 2 nh t 2nk , 2kL Dla rodziny płaszczyzn 
sieciowych {hkl) różnica faz (przesunięcie fazowe) 
między punktem początkowym układu osi współ¬ 
rzędnych 000 i punktem y , z (każdy z tych dwóch 

punktów leży w płaszczyźnie sieciowej należącej do 
rodziny {hkl) t rys. 2) równa się sumie różnic faz 
pomiędzy końcami wektorów równoległych do osi 
i łączących te dwa punkty: 

a = 2n{hx-rky J rlz). 


Czynnik struktury można przedstawić za pomocą 
jego modułu i fazy 

Fhu = \F h jcilzxp(i<Xhki) 
lub jako liczbę zespoloną 

Fhkl = Ahkl + iBhkly 

przy czym A i B można przedstawić (rys. 1) w postaci 
trygonometrycznej: 

Ahki — fjcos 2n{hxj+kyj+łzj) f 

i 

Bhki = fjsm2n(hxj+kyj+lzj). 
i 

Jeśli w kryształach znajduje się środek symetrii, 
to część urojona liczby zespolonej staje się równa zeru. 

Gdyby była znana struktura kryształu, można by 
było obliczyć czynniki struktury, a więc i intensyw¬ 
ność wiązek promieni rentgenowskich odbitych od 
wszystkich płaszczyzn sieciowych kryształu. W rent- 



Rys. 1. Czynnik struktury i 7 jako suma amplitud atomowych fy. 
a) dla kryształu niecentrosymetrycznego, b) dla kryształu centro- 
symetrycznego 



Rys. 2. Różnica faz pomiędzy punktami 000 i *00 wynosi 2nhx, 
pomiędzy *00 i *y0 — 2xky i pomiędzy xy0 i xyz — 2 nfz 
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cel analizy genowskiej analizie strukturalnej kryształów zadanie 
strukturalnej jest jednak odwrotne: zmierzone są intensywności 
wiązek odbitych od różnych płaszczyzn sieciowych, 
czyli znane są moduły czynników struktury, a celem 
analizy strukturalnej jest określenie struktury kry¬ 
ształu. 

Kryształ można traktować jako obszar wypełniony 
elektronami w sposób okresowy, przy czym okresami 
są parametry komórki elementarnej <?, ó, c. Zagęszcze¬ 
nie elektronów określa miejsce znajdowania się atomu. 
Jądra atomów są ,niewidoczne” dla promieni rentge¬ 
nowskich. Za pomocą dyfrakcji promieni rentge¬ 
nowskich bada się rozkład chmur elektronowych. 
Liczba elektronów przypadająca na jednostkę obję¬ 
tości w punkcie komórki elementarnej o współrzęd¬ 
nych x t y, z jest dana przez następujące wyrażenie: 

gęstość o(xvz) = -— V 1 V 1 V 1 F»we“ 2ni '<**+**+**>. 

elektronowa QK y } V 2j 2j 

h,k,l —oo 

gdzie oipcyz ) jest gęstością elektronową w punkcie 

>*, z, a V — objętością komórki elementarnej. 

Obliczenie rozkładu gęstości elektronowej przez 
sumowanie podanego wyżej szeregu Fouriera nazywa 
trójwymiaro- s ię w analizie strukturalnej trójwymiarową syntezą 
wa synteza Fouriera. Przeprowadzając syntezę Fouriera komórkę 
Fouriera elementarną dzieli się na takie części (rys. 3), jakie 
pozwalają uniknąć przeoczenia jakichkolwiek ato¬ 
mów. Np. komórkę o wymiarach 10,5 x 10, 4 x 8,0 A 
dzieli się odpowiednio na 40x40 x 30 części, tak aby 
gęstość elektronową można było obliczać w punktach 
odległych od siebie o ok. 0,25 A. Taki podział ko¬ 
mórki elementarnej stwarza konieczność sumowania 
szeregu Fouriera w 48 tys. punktów. Jeśli dla badane¬ 
go kryształu zarejestrowanych zostało tylko 2 tys. 
natężeń refleksów (a rejestruje się i 4-6 tys.), to obli¬ 
czenie jednej syntezy wymaga 96 min (!) sumowań. 
Zwykle prowadzi się obliczenia tylko dla połowy lub 
czwartej części komórki elementarnej, w pozostałej 
bowiem części komórki rezultaty obliczeń są powta¬ 
rzalne w wyniku operacji symetrii, niemniej ogrom 
obliczeń spowodował, że badania tego typu mogły się 
rozwinąć na szerszą skalę dopiero w erze komputerów. 

Niekiedy można zmniejszyć ilość obliczeń w ten 
sposób, że na podstawie danych o natężeniach reflek¬ 
sów z jednej warstwicy (zawierającej np. refleksy 
hkO) oblicza się rzut gęstości elektronowej wydłuż 
jednej z osi krystalograficznych na płaszczyznę pro- 
dwu- stopadłą do tej osi (rys. 4 i,5). Jest to dwuwymiarowa 
wymiarowa synteza Fouriera 

synteza 00+ 

Fouriera ^ = y^y^ FhlcoC -^o^m 

h,k-=>- 00 

(A jest powierzchnią płaszczyzny rzutu prostopadłej 
do osi Z). W dwuwymiarowej syntezie Fouriera 
oblicza się gęstość elektronową, np. w 1600 punktach 
(40x40) na podstawce ok. 200 refleksów z jednej 
warstwicy zerowej. Zmniejsza to ilość obliczeń do 
320 tys. sumowań dla jednej syntezy. Wykonane 
w ten sposób dwa rzuty wzdłuż dwóch osi dają obraz 
trójwymiarowy. Wynik jest jednak mniej dokładny 
niż w syntezie trójwymiarowej. Syntezy Fouriera 
mapy przedstawia się graficznie jako mapy gęstości elektro- 
gęstości nowej, na których punkty o jednakowej gęstości 
elektronowej elektronowej łączy się liniami ciągłymi w warstwice 
(rys. 3 i 5). 

Jednak nie pracochłonność obliczeń stanowi naj¬ 
większą trudność w badaniach strukturalnych. Pod- 
problem stawową trudnością jest problem fazowy. W doświad- 
fazowy czeniach otrzymuje się intensywności refleksów hki, 
z których wyznacza się czynniki struktury, lecz nie 
można określić kąta fazowego a. Podkreślmy więc, że 
doświadczalnie uzyskuje się tylko IFałiI — tj. wartości 
bezwzględne czynników struktury, a nie poznaje się 
ich kątów fazowych. Problem fazowy musi być roz¬ 
wiązywany w badaniach strukturalnych na podstawie 


dość złożonych analiz. Obecnie stosuje się głównie dwa 
sposoby rozwiązywania problemu fazowego. Są 
nimi analiza funkcji Pattersona (nazywanej też funk¬ 
cją wektorów międzyatomowych) oraz metody bez¬ 
pośrednie, wykorzystujące statystyczne zależności 
między fazami czynników strukturalnych. Dawniej 



Rys. 3. Fragment komórki elementarnej z uwidocznionym po¬ 
działem krawędzi komórki elementarnej na części umożliwiające 
lokalizację atomów 



Rys. 4. Metoda rzutu dwuwymiarowego — synteza p(xy) 



Rys. 5. Obraz struktury rozwiązanej metodą dwuwymiarowej 
syntezy Fouriera p(xy) (amid kwasu 4-chlorochinaldynowego) 
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stosowano jeszcze metodę prób i błędów, polegającą 
na tym, że odgadywano przybliżoną strukturę, obli¬ 
czano dla niej Fhki i porównywano wartości obliczo¬ 
nych czynników struktury F c ze zmierzonymi do¬ 
świadczalnie czynnikami F 0 . Jeśli czynniki F c i F 0 
były w miarę zgodne, uznawano strukturę za rozwią¬ 
zaną. Metoda ta mogła być jednak stosowana tylko 
do najprostszych struktur kryształów, w których ato¬ 
my lub jony zajmują położenia szczególne — w na-, 
różach lub na środkach ścian czy krawędzi komórki 
elementarnej (jak np. w diamencie i NaCl). O takim 
rozmieszczeniu wnioskuje się łatwo np. na podstawie 
liczby atomów znajdujących się w komórce elementar¬ 
nej, wielokrotnie mniejszej niż liczba zdeterminowana 
przez symetrię kryształu. Wówczas gdy atomy znaj-, 
dują się w położeniu dowolnym, odgadnięcie pra¬ 
widłowej struktury jest niemożliwe, gdyż zmiana 
o ułamek angstrema położenia w komórce elementar¬ 
nej cząsteczki nawet o znanym kształcie (a często 
i pojedynczego atomu) zmienia drastycznie wartości 
czynników struktury, dając negatywny wynik porów¬ 
nania F 0 i F c . 

Najczęściej stosowaną metodą rozwiązywania pro¬ 
blemu fazowego jest synteza Pattersona. Polega ona 
na tym, że do wzoru na gęstość elektronową g za¬ 
miast czynnika struktury Fhki o nieznanym znaku lub 



fazie wstawia się uzyskaną bezpośrednio w doświad¬ 
czeniu wartość Fhki, której nie potrzeba przypisywać 
znaku lub fazy. Funkcję Pattersona w punkcie uvw 
komórki elementarnej określa więc wyrażenie 

1 +0 ° 

p(iww) = — jr yjy iF/ 1 ^e-** i<ła+ * , ’ + * K ' > 

lub w postaci trygonometrycznej 

•fco 

P{uuw) = 1 Fhki i 2 cos 2Jt (hu -\-kv-{-lw). 

h,k,l *—oo 

Rozkład funkcji Pattersona, obliczony w sposób 
analogiczny do opisanego dla rozkładu gęstości elek¬ 
tronowej, prezentuje nie strukturę, lecz położenia 
wektorów łączących każde dwa atomy w strukturze 
wektory (wektorów międzyatomowych), poprowadzonych z 
między- początku układu współrzędnych. Każdemu maksi- 
atomowe mum na rozkładzie funkcji Pattersona odpowiadają 
w komórce elementarnej kryształu dwa atomy 
o współrzędnych xt, y iy z< oraz x }y y jy Zj. Tak więc 
u — Xi—Xj y v = yi—yj , w = Zi—Zj. Jeżeli w komórce 
elementarnej znajduje się W atomów, to na rozkładzie 
funkcji Pattersona wystąpi N(N-\) maksimów, często 
nakładających się na siebie. 

Niezależnie od symetrii kryształu, rozkład funk¬ 
cji Pattersona jest zawsze centrosymetryczny, po¬ 
nieważ dowolna para atomów może być wiązana 
dwoma równoległymi, lecz przeciwnie skierowanymi 
wektorami. Syntezę Pattersona przedstawia się gra- 



Rys. 7. Przykład dwuwymiarowego rozkładu funkcji Pattersona 
P(uv) (amid kwasu 4-chIorochinaIdynowego) 


ficznie jako mapę (diagram wektorowy) z przepro¬ 
wadzonymi na niej warstwicami (rys. 7). W punkcie diagram 
początkowym układu osi współrzędnych znajduje się wektorowy 
zawsze silne maksimum, którego wielkość jest pro¬ 
porcjonalna do sumy kwadratów liczb atomowych 
Zj, Z 2 ,..., Zi, Zj atomów tworzących daną strukturę: 

Jeśli wektor uvw w tzw. przestrzeni Pattersona łączy 
dwa atomy o dużych liczbach porządkowych Zj ly 
Zj 2 silnie rozpraszające promieniowanie (tzw. atomy 
ciężkie), to funkcja Pattersona ma silne maksimum 
w punkcie u y v y w. Wielkość tego maksimum jest 
proporcjonalna do iloczynu Zj 1 • Z/ 2 . Orientację 
i długość takiego wektora można z łatwością odczy¬ 
tać z mapy (diagramu) Pattersona, co pozwala zloka¬ 
lizować położenia najcięższych atomów w komórce 
elementarnej. 

Rozszyfrowanie syntezy Pattersona polega na zna¬ 
lezieniu struktury, z której ta synteza powstała. 

Wśród wielu maksimów pattersonowskich należy 

więc znaleźć te, które tworzą motyw struktury. Do 

rozszyfrowania syntez Pattersona wykorzystuje się 

obecnie głównie metody superpozycyjne, a spośród 

nich metodę minimalizacji, która w korzystnej sytua- metoda 

cji wydziela z syntezy Pattersona pełny obraz struk- minimalizacji 

tury. 

Funkcję Pattersona można zastosować do określe¬ 
nia symetrii kryształów. Analizując liczbę maksimów 
na mapie Pattersona, można stwierdzić obecność lub 
brak środka symetrii w krysztale. Badając wielkość 
pattersonowskich maksimów oraz skupienia maksi¬ 
mów na pewnych liniach lub płaszczyznach funkcji 
wektorów międzyatomowych, zamiast 122 grup dy¬ 
frakcyjnych (zob. rozdział „Krystalografia rentge¬ 
nowska”) można jednoznacznie wyznaczyć aż 208 (!) 
grup przestrzennych. 

Jeżeli w komórce elementarnej kryształu występują 
równocześnie atomy ciężkie i lekkie, to z rozkładu 
funkcji Pattersona odnajduje się zwykle tylko współ¬ 
rzędne x , y, z atomów ciężkich. Współrzędne te 
pozwalają na obliczenie wartości czynników Fhki dla 
struktury złożonej tylko z tych atomów. Tak obliczo¬ 
ny zbiór wartości F c różni się oczywiście od wartości 
F 0 określonych doświadczalnie dla badanej struktury, 
ale niemniej umożliwia dalsze postępowanie polega- 
































jące na tym, że doświadczalnie uzyskanym wartoś¬ 
ciom F 0 przypisuje się kąty fazowe a, obliczone dla 
pozycji x, y, z atomów ciężkich i za ich pomocą 
oblicza się pierwsze przybliżenie rozkładu gęstości 
elektronowej Q(xyz) (synteza Fouriera). Jeśli w kryszta- 
metoda le występuje środek symetrii, to część urojona wyra- 
kolejnych żenią Fhki = Ahki+iBhki równa się 0 (wtedy bowiem 
przybliżeń kąt fazowy wynosi 0° lub 180°, a jego cosinus równa 
się +1 lub — 1) i wówczas problem fazowy sprowadza 
się do przypisania każdej wartości \Fhki\ znaku + 
lub -. 

Gdy atom ciężki ma odpowiednio dużą liczbę ato¬ 
mową w stosunku do sumy liczb porządkowych ato¬ 
mów lekkich, to pierwsze przybliżenie syntezy Fourie¬ 
ra wyjaśnia niemal całą strukturę. Strukturę tę udo- 
kładnia się dalej metodą kolejnych przybliżeń szere¬ 
gów Fouriera, polegającą na powtarzaniu opisanej 
wyżej procedury. 

Najlepszą metodą uzyskiwania bezpośrednich in¬ 
formacji o kątach fazowych czynników struktury 
j est badanie par kryształów izomorficznych. W jednym 
z tych kryształów podstawia się na miejsce określo¬ 
nego atomu — atom ciężki. Takie dwa kryształy, 
o zbliżonym składzie chemicznym, krystalizujące 
w tej samej grupie przestrzennej i mające zbliżone 
rozmiary komórek elementarnych oraz takie same 
współrzędne odpowiadających sobie- atomów — 
nazywają się kryształami izomorficznymi. Różnica 
intensywności tych samych refleksów (tj. refleksów 
o tych samych wskaźnikach) dla obydwu kryształów 
pozwala oznaczyć kąty fazowe (znaki) czynników 
struktury Fhki , co umożliwia obliczenie o(xyz). 
metody Metody bezpośrednie oznaczania kątów fazowych 
bezpośrednie (znaków) są oparte na założeniu, że gęstość elektro¬ 
nowa w krysztale nie jest nigdy ujemna i że jest bliska 
zeru poza miejscami znajdowania się atomów. W me¬ 
todach tych, za pomocą równań statystycznie praw¬ 
dopodobnych ustala się zależności pomiędzy fazami 
czy znakami czynników struktury. 

Problemu fazowego nie można rozwiązać metodą 
prób i błędów. Jeżeli bowiem dla danej struktury 
zmierzono intensywności N refleksów, to zmieniając 
znak każdego kolejnego czynnika struktury, korzy¬ 
stając ze wzoru na gęstość elektronową o(xyz) można 
obliczyć 2 N wariantów rozkładów gęstości elektrono¬ 
wej, przy czym tylko jeden z nich będzie przedstawiał 
prawdziwą strukturę. Postępując w ten sposób, dla 
10 refleksów należałoby obliczyć 1024 rozkładów, 
dla 20 czynników struktury 1 048 576 (!) rozkładów, 
a badając struktury kryształów mierzy się intensyw¬ 
ności dla ponad tysiąca refleksów. Dla struktur nie- 
centrosymetrycznych liczba wariantów byłaby wprost 



nieskończona, a ich mechaniczne obliczanie byłoby 
pozbawione sensu. 

Jaki jest więc tok postępowania? Na początku wy¬ 
biera się tylko najbardziej intensywne refleksy (dwu¬ 
krotnie silniejsze od średniej arytmetycznej wszystkich 
intensywności) i przez obliczenia arytmetyczne wy¬ 
prowadza się zależności między fazami lub znakami; 
słuszność tych zależności jest tym prawdopodobniej¬ 
sza, im wyższe są wartości bezwzględne czynników 
struktury wchodzących w relacje. Dla struktur nie- 
centrosymetrycznych najczęściej jest stosowana na¬ 
stępująca zależność między kątami fazowymi: 

ccFhki ~ a.Fh'k'i'+<x.Fn-h' 9 k-k',i-i' 

a dla struktur centrosymetrycznych — zależność mię¬ 
dzy znakami s : 

sFhkl ~ sFh'k'l'-sFh-h', l-l'. 

Wynika stąd, że np. sF«koo — sF 100 -sF 100> a więc wa¬ 
runek, by czynniki struktury o wskaźnikach parzys¬ 
tych — były dodatnie. Następny krok, po znalezieniu 
modelu struktury na podstawie najsilniejszych reflek¬ 
sów, polega na zastosowaniu metody kolejnych przy¬ 
bliżeń obliczania gęstości elektronowej przy korzysta¬ 
niu już z pełnego zbioru Fhki. 

Metody bezpośrednie rozwiązywania problemu fa¬ 
zowego stają się coraz bardziej popularne, gdyż służą 
do badania struktur tych kryształów, w których 
wszystkie atomy mają zbliżone liczby atomowe, co 
uniemożliwia stosowanie metody Pattersona. 

Kryterium poprawności określenia struktury sta¬ 
nowi wskaźnik rozbieżności 

r = I\\Fo\-\f c \II2\f 0 \. 

Im mniejszy jest wskaźnik rozbieżności, tym większa 
jest dokładność rozwiązania struktury. Przy wyzna¬ 
czeniu intensywności refleksów metodami fotogra¬ 
ficznymi wskaźnik rozbieżności wynosi ok. 0,1 (10%), 
a przy stosowaniu licznikowych metod pomiaru na¬ 
tężeń refleksów wartość jego zmniejsza się do 0,07- 
0,03 (tj. 7-3%). Po ustaleniu na podstawie syntez 
Fouriera przybliżonych współrzędnych wszystkich 
atomów, dalsze udokładnienie parametrów pozycyj¬ 
nych atomów oraz wielkości drgań termicznych ato¬ 
mów przeprowadza się metodą najmniejszych kwadra¬ 
tów. Funkcja, która podlega minimalizacji, ma po¬ 
ra 

stać £ w r (For-Fcr)\ gdzie w jest wagą statystyczną 

przypisywaną dokładności pomiaru natężenia po¬ 
szczególnych refleksów F 0 , a F c — czynnikiem stru¬ 
ktury Fhki obliczonym dla udokładnianego modelu 
struktury. 

W najprostszym modelu struktury przyjmuje się 
występowanie izotropowych (tzn. jednakowych we 
wszystkich kierunkach) drgań termicznych atomów 
i dla każdego atomu oblicza się tzw. izotropowe in¬ 
dywidualne czynniki temperaturowe. Drgania ter¬ 
miczne atomów wzrastają szybko, gdy temperatura 
kryształu jest bliska temperaturze topnienia i powo¬ 
dują zmniejszenie intensywności refleksów ze wzro¬ 
stem kąta odbłysku £. Zależność czynnika atomowego 
/ od izotropowego czynnika temperaturowego B 
wyraża wzór / = / 0 e“* (X — długość fali pro¬ 

mieniowania rentgenowskiego). 

Ruchy termiczne atomów można analizować do¬ 
kładniej, opisuj ąc je za pomocą elipsoidy trójosiowej, 
której osie określają wielkości drgań atomu w trzech 
prostopadłych do siebie kierunkach. Zależność czyn¬ 
nika atomowego / od anizotropowego czynnika 
temperaturowego wyraża wzór 

j = ^ e -(& 11 ft 2 +& 2 ofcM 3 3* 2 +&12 fcfc + & 23 Jti + b 31 /tZ ). 

Sześć składowych tensora drgań anizotropowych 
ba określa wymiary półosi elipsoidy oraz orientację 
półosi względem przyjętego układu osi współrzęd¬ 
nych. Ten sposób przedstawiania ruchów termicz¬ 
nych atomów ilustruje rys. 8. 


wskaźnik 
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Ostatnie stadium analizy stanowi obliczenie od¬ 
chyleń standardowych dla współrzędnych y, z ato¬ 
mów, ocena błędów przypadkowych i systematycz¬ 
nych popełnionych przy pomiarze natężeń refleksów. 
Na podstawie współrzędnych wszystkich atomów 
oblicza się długości wiązań, kąty walencyjne, określa 
wzajemne ułożenie cząsteczek lub innych elementów 
strukturalnych w krysztale. 

Analiza strukturalna daje obraz struktury uśred¬ 
nionej w czasie. Wielkości drgań termicznych „widzi- 
my” jako wielkość rozmycia położenia atomu. Meto¬ 
dami analizy strukturalnej określono struktury za¬ 
równo o budowie najprostszej (np. metali), jak i naj¬ 
bardziej złożonej (białka i tRNA). 

G. H. Stout, L. H. Jensen, X-ray Structure Detcrmination , 
Toronto 1969. 


Mikroskopia elektronowa 

Tadeusz Warmiński 

Mikroskopia elektronowa jest skrótowym określe¬ 
niem szerokiego zespołu zagadnień badawczych i kon¬ 
strukcyjnych związanych z coraz powszechniejszym 
wykorzystaniem w naukach przyrodniczych, medycz¬ 
nych i technicznych grupy przyrządów elektronowo- 
optycznych zwanych mikroskopami elektronowymi. 
Ich wspólną cechą charakterystyczną jest zdolność 
do projekcji na ekranie i rejestracji powiększonych 
obrazów badanych przedmiotów (próbek lub prepa¬ 
ratów) przy wykorzystaniu jako źródła oświetlenia 
skolimowanej wiązki elektronów o energii od kilku¬ 
set eV do kilku MeV. Skonstruowanie pierwszego 
mikroskopu elektronowego typu transmisyjnego 
(M. Knoll i E. Ruska. 1931 r.), który powstał przez 
analogię z prześwietleniowym mikroskopem optycz¬ 
nym, było logiczną konsekwencją doświadczalnego 
potwierdzenia natury falowej elektronu (C. J. Da- 
visson, L. H. Germer, G. P. Thomson, 1927 r.). Zgod¬ 
nie z teorią Abbego należało oczekiwać wysokiej 
zdolności rozdzielczej takiego mikroskopu, ponieważ 


próbki wypełnia się wówczas sygnałami elektrono¬ 
wymi i elektromagnetycznymi, zaznaczonymi sche¬ 
matycznie na rys. 1. Każdy z nich niesie określonego 
typu informację o strukturze materiału próbki (w sen¬ 
sie przestrzennym lub energetycznym), dotyczącą 


wiązka 

elektronów 

ł 



obszaru oddziaływań. Wybór rejestrowanego sygnału 
określa zakres dostępnych informacji (tabela); bio¬ 
log może być zainteresowany innego typu obrazem 
mikroskopowym aniżeli fizyk czy metalurg. 


Zależność informacji od wyboru sygnału 


Prędkości, masy i długości fali elektronu w zależności od Treść informacji 


jego energii (w 0 — masa spoczynkowa) 

Morfologia 


IV, eV 

r, m/s 

r/c 

nx 10 3X ,kg 

m{rn 0 

;.,A 

Skład chemiczny 
(kompozycja) 

1 

5,93-10 ł 

0,002 

9,11 

1+2-10-* 

12,3 

10 

1,87-10* 

0,006 

9,11 

l-ł-2-10" 5 

3,87 

Krystalografia 

10 2 

5,93-10* 

0,02 

9,11 

1,0002 

1,32 


10 3 

1,86*10 7 

0,06 

9,13 

1,0020 

0,386 


10* 

5.83-10 7 

0,19 

9,29 

1,0196 

0,122 

Wiązania chemicz¬ 

10 5 

1,64-10* 

0,55 

10,9 

1,196 

0,0369 

ne 

10* 

2,83-10* 

0,94 

26,9 

2,96 

0,00868 

Własności elektro¬ 

10 7 

2,99-10* 

0,999 

187,8 

20,6 

0,00118 

magnetyczne 


Rodzaj sygnału 


wszystkie sypiały z wyjątkiem promieni 
rentgenowskich i elektronów Augera 
promienie rentgenowskie, katodolumincs- 
cencja, elektrony odbite i elektrony Auge¬ 
ra 

elektrony odbite, elektrony przechodzące 
(transmitowane) przez próbkę, elektrony 
wtórne, promienie rentgenowskie 
elektrony Augera, promienie rentgenow¬ 
skie 

elektrony wtórne, elektrony absorbowane 
w próbce, siła elektromotoryczna 


wysokoenergetycznym elektronom odpowiadają dłu¬ 
gości fali znacznie krótsze aniżeli w wypadku światła. 

Czynnikiem znacznie ograniczającym zdolność roz¬ 
dzielczą soczewek elektromagnetycznych (niezależnie 
od zjawiska dyfrakcji elektronów) jest zła zdolność 
ogniskowania wiązek elektronów biegnących pod 
kątem a do osi optycznej. Dopuszczalne wartości tego 
kąta nie przekraczają zazwyczaj lO^-lO -4 rad. 
Osiągalne zdolności rozdzielcze współczesnych mi¬ 
kroskopów elektronowych wynoszą 2-3 A i są 
porównywalne z graniczną rozdzielczością soczewki 
magnetycznej wynikającą z rozważań teoretycznych 
(S = 0,4c s a 3 -f 0,6 U/sina; c s — współczynnik aber¬ 
racji sferycznej). Jest to niewątpliwa przewaga mi¬ 
kroskopu elektronowego nad optycznym, którego 
zdolność rozdzielcza nie przekracza 2000 A 

W ostatnim dziesięcioleciu okazało się jednak, że 
nie tylko możliwość uzyskiwania bardzo wysokich 
powiększeń rozstrzyga o atrakcyjności mikroskopów 
elektronowych. Przyjrzyjmy się efektom oddziaływa¬ 
nia skolimowanej wiązki elektronów z próbką ma¬ 
terii, zazwyczaj ciała stałego. Przestrzeń wokół 


Stosując odpowiedni, różny dla różnych sygnałów, 
system generacji i detekcji wybranego sygnału otrzy¬ 
muje się obraz mikroskopowy lub, inaczej, mapę 
stanowiącą czasoprzestrzennie uporządkowany zapis 
jego intensywności. Podstawowym warunkiem wła¬ 
ściwego odczytu obrazu mikroskopowego jest zna¬ 
jomość procesów fizycznych zachodzących w próbce 
podczas bombardowania jej wysokoenergetycznymi 
elektronami. Na szybki rozwój mikroskopii elektro¬ 
nowej miał więc niewątpliwy wpływ znaczny postęp 
w zakresie fizyki ciała stałego, gazów, elektronów 
i promieniowania rentgenowskiego. Trzeba pamiętać, 
że z punktu widzenia mikroskopii elektronowej są 
ważne nie tylko procesy elastycznych rozproszeń 
elektronów w próbce, ale również rozproszeń nie¬ 
elastycznych, prowadzących do zmniejszenia ich 
pierwotnej energii. Straty energii dzielą się statystycz¬ 
nie w następujący sposób: w energię termiczną zostaje 
przekształcone średnio 95% utraconej energii, w ener¬ 
gię promieniowania rentgenowskiego (ciągłego i cha¬ 
rakterystycznego) — ok. 1%, elektrony reemitowane 
(wtórne, odbite i Augera) unoszą 4% energii. 
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emisja Jonizacja atomów elektronami lub promieniami rentgenow- 
. . +r * skimi powoduje powstawanie luk na wewnętrznych powłokach 
eieKTronu elektronowych. Elementarnym procesem relaksacji jest zapełnie- 
Augera nie luki na poziomie energetycznym E\ przez elektron z niższej 
energetycznie powłoki Ej, Różnica energii Eu może opuścić atom 
unoszona przez foton charakterystycznego promieniowania 
rentgenowskiego, ale także w postaci bezpromienistej (emisja 
elektronu Augera). Elektron Augera wyrzucony z powłoki (lub 
pod powłok i) Eh ma energię Ei—Ej — Eh, która podobnie jak 
energia fotonu jest wielkością charakteryzującą atom danego 
pierwiastka chemicznego. Relaksacja atomu przez emisję elek¬ 
tronu Augera jest pośrednim, ale nie końcowym, procesem pro¬ 
wadzącym do stanu równowagi elektrycznej, ponieważ pozosta¬ 
wia atom podwójnie zjonizowany z tukami na poziomach Ej 
oraz Eh. Wydajność każdego z dwóch wzajemnie konkurencyj¬ 
nych procesów określają liczbowo współczynniki prawdopodo¬ 
bieństwa zwane wydajnością fluorescencyjną i wydajnością pro- 

_ cesu Augera, a w sumie równe jedności. Wydajność fluorescen- 

1E próżni cyjną można zapisać w postaci ilorazu zawierającego w liczniku 
sumę fotonów wszystkich linii promieniowania rentgenowskiego 
danej serii, emitowanych statystycznie w jednostce czasu, a w mia¬ 
nowniku liczbę luk na poziomie Ei generowanych w tym samym 
^ ^^ czasie. Na przykład dla serii K iloraz ten ma postać: 

-<% - Ej Wk = y (”*); nk * + n k fi + .„ 

Zj Nk = Nx 
i 

Istnieje wyraźna zależność wydajności od liczby atomowej pier- 
“O w wiastka Z. Stwierdzono, że pod względem wydajności proces 



liczba atomowa Z 

Zależność wydajności procesu Augera od liczby atomowej Z 


Augera dominuje w pierwiastkach lekkich (Z < 15) zjonizowa- 
nych na powłoce K oraz we wszystkich pierwiastkach mających 
luki na dalszych powłokach. Czynnikiem ograniczającym dotych¬ 
czasowy rozwój spektroskopii elektronów Augera w wypadku 
ciała stałego jest konieczność stosowania wysokiej próżni. Dla 
większości pierwiastków energie elektronów Augera mają war¬ 
tości od 50 do 2000 eV, co określa maksymalną grubość war¬ 
stwy powierzchniowej próbki poddawanej analizie na ok. 10-15 A. 
Czystość powierzchni jest więc w spektroskopii Augera sprawą 
bardzo istotną. Taka czystość jest nieosiągalna w otoczeniu ga¬ 
zów resztkowych o ciśnieniu wyższym niż 10~* Pa. 

tworzenie Obecnie istnieją dwa systemy tworzenia obrazu 
obrazu mikroskopowego, niezależnie od wyboru sygnału, 
mikroskopo- W systemie konwencjonalnym zakłada się równoczes- 
wego ne oświetlenie względnie szeroką wiązką elektronów 
(kilka pm) całego pola obserwacji, przedstawianego 
w obrazie mikroskopowym. Tym samym wszystkie 
elementy obrazu mikroskopowego powstają również 
równocześnie i, pomijając możliwe zmiany próbki w 
trakcie obserwacji, proces tworzenia obrazu nie 
jest w tym systemie funkqą czasu. W systemie 
skaningowym wiązka elektronów ,,omiata” ob¬ 
szar obserwacji w sposób dokładnie taki sam, jak 
w lampie kineskopowej, która zazwyczaj spełnia 
funkcję czytnika w układzie detekcyjnym mikroskopu 
elektronowego. Ruch wiązki elektronowej po próbce 
jest zsynchronizowany z ruchem plamki świetlnej 
poruszającej się po ekranie lampy kineskopowej. 
Zasada systemu skaningowego polega na rozbiciu 
obszaru obserwacji na drobne części składowe i ko¬ 
lejnym ich odwzorowywaniu w obrazie mikroskopo¬ 
wym, przy czym każdej części odpowiada tylko jeden 
element obrazu. System zakłada czasowo przestrzenną 
korelację przekazu informacji między próbką i czyt¬ 
nikiem obrazu (ekranem lampy kineskopowej, sa- 
mopisem X-Y itp.). Zdolność rozdzielcza w systemie 
skaningowym zależy od stopnia kolimacji wiązki 
elektronowej oświetlającej próbkę, ale także od geome¬ 
trycznych rozmiarów mikroobszaru, wewnątrz któ¬ 


rego jest generowany określony sygnał (tabela). 
Wysoką rozdzielczość uzyskuje się, gdy wiązka elek¬ 
tronów jest możliwie silnie skolimowana. Przy zasto- 


Zestawienie osiągalnych wartości zdolności rozdzielczej 
w systemie skaningowym 


<5, A 

Rodzaj sygnału 

1-10 

elektrony transmitowane przez próbkę 

5-10* 

elektrony Augera 

10* 

elektrony wtórne 

5 *10 ! -10 4 

elektrony odbite 

10 4 -10‘ 

elektrony absorbowane w próbce 

10*-5 *10 4 

promieniowanie rentgenowskie 

10*-10 4 

katodoluminescencja 


sowaniu termoemisyjnych katod wolframowych 
i dwu- lub trójstopniowego układu ogniskowania 
przekrój wiązki elektronów o natężeniu 10~ 12 A 
wynosi 80-100 A, natomiast przy zastosowaniu bar¬ 
dzo jasnych, samoogniskujących wyrzutni polowo- 
emisyjnych (autoemisja z katody ostrzowej) można go 
zmniejszyć do kilkunastu A. 

W określonego rodzaju detektorach istnieje ścisła 
współzależność pomiędzy liczbą różnych elementów 
obrazu mikroskopowego, czasem jego rejestracji i naj¬ 
mniejszą dopuszczalną wartością prądu sygnału elek¬ 
tronowego. Stosując jako detektor fotopowielacz mo¬ 
żna np. zarejestrować obraz złożony z 10 6 elementów 
w czasie 100 s przy prądzie sygnału 2,6-10“ 12 A 
Omiń = 2,6- 10~ 18 rt/f, gdzie n — liczba elementów, 
t — czas rejestracji). 

Obydwa wymienione systemy są stosowane w kon- 
trukcji różnego typu mikroskopów elektronowych, 
których nazwy zawierają specyfikację systemu oraz 
ewentualnie podstawowego rejestrowanego sygnału. 
W ostatnich latach produkowane są coraz bardziej 
skomplikowane układy, swego rodzaju kombajny 
elektronowo-optyczne, z przeznaczeniem do kom¬ 
pleksowych badań mikroskopowo-spektroskopowych, 
którym trudno znaleźć właściwą nazwę i dlatego są one 
oznaczane wyłącznie symbolami (np. HP-5, HP-51, 
BS-350). 


Transmisyjny mikroskop elektronowy 
(TEM) 

Jest to historycznie pierwszy i jednocześnie najbar¬ 
dziej rozpowszechniony typ mikroskopu elektrono¬ 
wego (il. 88, tabl. 22). TEM pracujący w systemie 
konwencjonalnym (CTEM) jest najbardziej zbliżony 
do mikroskopu optycznego. Zasadniczym elementem 
CTEM jest soczewka elektromagnetyczna obiektywu, 
której zasadę działania wyjaśnia rys. 2. Jej pole dzia- 



Rys. 2. Zasada działania soczewki obiektywu w mikroskopie 
transmisyjnym; AB płaszczyzna dyfraktogramu, CD płaszczyzna 
obrazu mikroskopowego 
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, łania to obszar pomiędzy próbką i diafragmą, zwaną 
aperturą obiektywu. Wiązka elektronów oświetlająca 
próbkę jest ograniczona przez aperturę kondensora 
do średnicy 1-5 pm. Powiększenie soczewki obiekty¬ 
wu wynosi kilkaset. Po przejściu przez tę soczewkę 
elektrony tworzą dwa obrazy: wzór dyfrakcyjny 
(elektronogram) w płaszczyźnie ogniskowania AB 
oraz obraz mikroskopowy w płaszczyźnie CD (od¬ 
ległość pomiędzy płaszczyznami AB i CD wynosi 
5 cm). Wzór dyfrakcyjny i obraz mikroskopowy 
sprzężone są transformatą Fouriera (przy założeniu 
braku aberracji). Po powiększeniu, zazwyczaj dwu¬ 
stopniowym (soczewka zw. pośrednią i soczewka 
projektora tworzą układ odpowiadający okularowi 
w mikroskopie optycznym), każdy z tych obrazów mo¬ 
że być zarejestrowany na ekranie fluorescencyjnym 
(pokrytym luminoforem) albo na kliszy fotograficz¬ 
nej. 

TEM TEM pracujący w systemie skaningowym (STEM) 
w systemie nie zawiera soczewek tworzących obraz między prób- 
skaningo- ką i detektorem obrazu — zazwyczaj fotopowiela- 
wym czem (rys. 3). Obniża to negatywny wpływ strat 



f fotopowielacz 

j_ Rys. 3. Zasada działania skanin¬ 

gowego transmisyjnego mikro¬ 
skopu elektronowego 


energii elektronów, przez co z równą wyrazistością 
w STEM można oglądać próbki 2-5 razy grubsze 
aniżeli w CTEM. Teoretycznie STEM i CTEM po¬ 
winny dawać identyczne obrazy mikroskopowe, 
w praktyce jednak zdolność rozdzielcza STEM — 
ograniczona średnicą sondy (wiązki elektronowej) — 
jest nie mniejsza niż 5 A. Zaletą STEM, szczególnie 
istotną w zastosowaniach w biologii i medycynie, jest 
elektroniczna regulacja kontrastowości obrazu i mo¬ 
żliwość pracy przy bardzo małym prądzie wiązki 
(10" 10 -10" 12 A, w porównaniu z 10" MO" 7 A dla 
CTEM). Wielkość prądu wpływa z kolei na osiągalną 
w TEM zdolność rozdzielczą (tabela). 

Obydwa systemy TEM umożliwiają tworzenie 
obrazów mikroskopowych w polu jasnym i w polu 
obrazy w polu ciemnym. Otrzymuje się je odpowiednio przez wy- 
jasnym * odrębnienie wiązki centralnej lub jednego z bocznych 
ctemnym maksimów dyfrakcyjnych (refleksów). Obserwacja 
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w polu jasnym odpowiada patrzeniu na przedmiot 
pod światło, co nie zawsze sprzyja dobrej widoczno¬ 
ści. Z kolei obserwacja przedmiotu w świetle roz¬ 
proszonym, czyli w polu ciemnym, przy jednoczesnej 


Zeleżność zdolności rozdzielczej od rodzaju próbki (TEM) 
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możliwości zmian konfiguracji oko-przedmiot-źródło 
światła, pozwala na znacznie bardziej precyzyjną 
analizę jego struktury (w wypadku mikroskopii elek¬ 
tronowej bardziej istotna jest struktura niejednorod¬ 
ności wnętrza aniżeli powierzchni próbki). 

W mikroskopii elektronowej duże znaczenie ma od¬ 
powiednie przygotowanie próbki. Przy zazwyczaj sto¬ 
sowanych wiązkach elektronowych o energii 100 keV 
próbki muszą mieć grubość nie większą niż 1000 A. 
Preparatyka próbek jest tematem, który stanowi sa¬ 
moistną dziedzinę wiedzy fizykochemicznej. Próbki 
dzielą się na dwie zasadnicze grupy: repliki powierz¬ 
chni i cienkie folie materiału stanowiącego przedmiot 
badań mikroskopowych. Repliki, otrzymywane przez 
pokrycie próbki cienką warstewką dobrze przylega¬ 
jącej substancji (np. naparowanie węglem), po od¬ 
dzieleniu od podłoża i odpowiedniej dalszej obróbce 
(cieniowanie, czyli naparowanie pod kątem ciężkim 
metalem) umożliwiają otrzymanie obrazu mikrosko¬ 
powego topografii powierzchni próbki z rozdzielczo¬ 
ścią do 20 A. Pewne rodzaje replik, zwane ekstrak¬ 
cyjnymi, umożliwiają bezpośrednią obserwację drob¬ 
nych wydzieleń (mikroobszarów o innych własnoś¬ 
ciach fizykochemicznych) pochodzących z próbki. 

W ostatnim dziesięcioleciu znaczenie replik zma¬ 
lało, w wyniku upowszechnienia skaningowych me¬ 
tod przetwarzających na obraz mikroskopowy sygna¬ 
ły elektronów odbitych i wtórnych emitowanych 
z powierzchni próbek litych. Wzrosła natomiast li¬ 
czebność i wyrafinowanie technik służących otrzymy¬ 
waniu cienkich folii. Próbki do badań fizycznych czy 
inżynierii materiałowej otrzymuje się przez polero¬ 
wanie chemiczne, elektrochemiczne, trawienie jonowe 
lub walcowanie. Preparaty biologiczne tnie się na 
cienkie próbki za pomocą ultramikrotomu. Proble¬ 
mem jest w tym wypadku zabezpieczenie delikatnej 
tkanki preparatu przed uszkodzeniem w wyniku 
cięcia lub odwodnienia. Podstawowymi składnikami 
próbek organicznych są pierwiastki lekkie, dające 
znikomy kontrast. Kontrast od różnych strukturalnie 
części próbki można polepszyć nasycając próbkę 
substancjami zawierającymi pierwiastki ciężkie (np. 
Os). Nasycenie ciężkimi pierwiastkami stanowi ana¬ 
logię do barwienia preparatów organicznych przy 
obserwacji w mikroskopie optycznym. 

W dziedzinie badań biologicznych i medycznych 
wykorzystuje się TEM do poznania biologii komórek, 
w szczególności budowy jądra komórkowego, cyto- 
plazmy i błony komórkowej (-►Błony komórkowe, 
Molekularne podstawy skurczu mięśnia). Ustalenie 
ilości i rodzajów występujących w nich organelli 
w powiązaniu z możliwością określenia ich funkcji 
chemicznych dało podstawę pogłębienia wiedzy o fun¬ 
kcjonowaniu tkanek. Wiele obiektów biologicznych 
ma dostatecznie małe rozmiary, aby je bezpośrednio 
obserwować w TEM, np. bakterie i wirusy. Ich cechą 
specyficzną jest zachowanie określonego typu sy¬ 
metrii przestrzennej. Doskonalenie jakości zdjęć 
właśnie tego typu obiektów oraz zastosowanie kom¬ 
putera i holografii umożliwiło rozwój mikroskopowej 
metody badań zw. trójwymiarową rekonstrukcją. 
Trójwymiarowa rekonstrukcja cząsteczek dostarcza 
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dziś pełnej, przestrzennej informacji o budowie we¬ 
wnętrznej i kształcie, na przykład wirusa z rozdziel¬ 
czością 10 A. 

badania W dziedzinie inżynierii materiałowej za pomocą 
materiałowe TEM uzyskano bezpośredni dowód istnienia defek¬ 
tów sieci krystalicznej, dyslokacji i błędów ułożenia 
(il. 87, tabl. 22). Zrozumienie znaczenia dyslokacji 
w procesie deformacji plastycznej materiałów, szcze¬ 
gólnie blokowania ich ruchu przez drobne wydzielenia 
stało się podstawą oceny własności sprężystych wielu 
metali i stopów. Możliwość łatwego aparaturowego 
przejścia od wzoru dyfrakcyjnego do obrazu mikro¬ 
skopowego została wykorzystana do identyfikacji 
struktury wydzieleń w materiałach wieloskładniko¬ 
wych. Obecnie jest możliwe przy zastosowaniu mi- 
kro-mikrodyfrakcji określenie struktury wydzielenia 
o średnicy 200 A. W tym kontekście duże znaczenie 
ma zastosowanie TEM do badania przemian fazo¬ 
wych. W fizyce półprzewodników poznanie geometrii 
dyslokacji pozwoliło w kilku wypadkach (Si, ZnTe) 
na pełniejsze wyjaśnienie własności elektronowych 
i optycznych tych materiałów (-> Dyslokacje w kry¬ 
ształach). 

Za pomocą TEM o dużej rozdzielczości i przy za¬ 
stosowaniu komputera można — z obrazu mikro¬ 
skopowego płaszczyzn sieciowych — wnioskować 
o strukturze sieci krystalicznej materiału (defektach 
itp.). Innym zadaniem mikroskopii wysokorozdziel¬ 
czej jest obserwacja pojedynczych atomów i cząste¬ 
czek. Operując analogią optyczną zauważenie obiektu 
o rozmiarach atomu (3-4 A) z odległości 30 cm odpo¬ 
wiada sytuacji, w której chcemy dostrzec kulkę szlda- 
ną o średnicy 0,03 mm z odległości 30 km. Obraz 
atomów ciężkich pierwiastków (U, Th) uzyskano (la¬ 
ta 1969-70) zarówno w CTEM (w ciemnym polu), 
jak również w STEM. 

badania Ważnym kierunkiem zastosowań TEM są badania 
„in situ" „in situ", w których próbka jest poddawana progra¬ 
mowanym zmianom (przez chłodzenie, grzanie, pod¬ 
świetlanie, rozciąganie) wewnątrz kolumny mikro¬ 
skopu. Do grupy mikroskopów specjalnie przystoso¬ 
wanych do takich badań należy niewątpliwie zaliczyć 
HVEM wysokonapięciowy TEM (HVEM), pracujący przy 
napięciu przyspieszającym elektrony od 1 do 3 MV. 
Elektrony o takich wysokich energiach, poza zwiększo¬ 
ną przenikliwością (próbki mogą mieć grubość ok. 
10 4 A), powodują powstawanie defektów radiacyj¬ 
nych. Relatywistyczne elektrony o energii większej 
niż krytyczna wartość JFmin po przeniknięciu powło¬ 
ki K atomu w sieci krystalicznej powodują jego wy¬ 
bicie w położenie międzywęzłowe. W ten sposób po¬ 
wstaje para defektów typu Frenkla — luka oraz atom 
międzywęzłowy (tabela). Defekty radiacyjne bada 
się dla celów poznawczych i aplikacyjnych w pół¬ 
przewodnikach i materiałach reaktorowych. Głów- 


Defekty radiacyjne generowane wysokoenergetycznymi 
elektronami (HVEM) 
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nym atutem HVEM jest przyspieszenie tempa pro¬ 
cesów takich, jakie zachodzą w akceleratorach linio¬ 
wych i reaktorach, procesów, które prowadzą do two¬ 
rzenia agregatów defektów punktowych wpływają¬ 
cych na zmianę własności materiałów. Przy ustalonej 
gęstości prądu elektronowego skupienie ich w plamkę 
o średnicy ok. 10~ 12 m 2 , zamiast na powierzchni 
10~ 4 m 2 , powoduje przyspieszenie generacji defektów 
w proporcji czasu jak 1 min do 200 lat. 


Odbiciowy mikroskop elektronowy (REM) 


Mikroskopy należące do tej i do dwóch dalszych grup 
stosuje się wyłącznie do obserwacji powierzchni próbek 
litych. W systemie konwencjonalnym wykorzysty¬ 
wane są elektrony o wysokiej energii, rozproszone na 
próbce pod małymi kątami (rys. 4). Zasadniczym 
czynnikiem ograniczającym zdolność rozdzielczą jest 
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Rys. 4. Zasada działania mikroskopu odbiciowego 


aberracja chromatyczna, którą zmniejsza się pęzez 
stosowanie małych kątów 0i i 0 2 . Czynnikiem pogar¬ 
szającym zdolność rozdzielczą przy małych apertu- 
rach jest rozmycie dyfrakcyjne. Zdolność rozdzielcza 
nie przekracza 300 A (0i = 2°, 0 2 = 23°). Problemem 
jest również mała jasność obrazu. Przetworniki elek- 
tronooptyczne dają rozwiązanie tylko pozorne, po¬ 
nieważ ze swej strony pogarszają zdolność rozdziel¬ 
czą. Konwencjonalny REM wykorzystuje się głównie 
do badań związanych z dyfrakcją wysokoenergetycz¬ 
nych elektronów (HEED), stanowiących cenne źródło 
informacji o strukturze krystalicznej cienkiej warstwy 
powierzchniowej. Inne jego zastosowanie — to stereo- 
metria, korzystająca z kontrastowych i długich cieni 
od nierówności topograficznych. 

REM pracujący w systemie skaningowym (ŚREM, 
często skrótowo oznaczany symbolem SEM) tworzy 
obraz powierzchni próbki wykorzystując sygnały 
elektronów odbitych, wtórnych, absorbowanych 
i katodoluminescencji, a w szczególnych wypadkach 
również elektronów Augera (konieczna próżnia co 
najmniej 10~ 6 Pa). Wiązka elektronów oświetlająca 
próbkę pada na nią na ogół pod dowolnym (zazwy¬ 
czaj 90°), ale stałym kątem. Tylko w badaniach orien¬ 
tacji krystalograficznej powierzchni stosuje się zmien¬ 
ny kąt wejścia elektronów do próbki. Ze względu na 
silną kolimację pierwotnej (oświetlającej) wiązki 
elektronów ŚREM ma dużą głębię ostrości (rys. 5). 
Dlatego nadaje się specjalnie do badania kruchych 
próbek o złożonym kształcie, często spotykanych 

zdolność rozdzielacza 


10 5 10 4 10 3 10 2 A 



Rys. 5. Zależność głębi ostrości od powiększenia dla mikrosko¬ 
pów optycznych i mikroskopu elektronowego typu ŚREM 
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w Siologii i w mikroelektronice. Zdjęcia mikroskopo¬ 
we wykonane w świetle elektronów odbitych (il. 85a, 
tabi 22) ujawniają nie tylko nierówności powierzchni 
rozdzielanie (kontrast topograficzny), ale także jej skład che- 
obrazów to- miczny (kontrast kompozycyjny). Istnieje możliwość 
pograftcz- rozdzielenia obrazów topograficznych i kompozycyj¬ 
nych i kom- nych. W badaniu półprzewodników jest istotna moż- 
pozycyjnych liwość przetwarzania na obraz mikroskopowy prądu 
wywołanego absorbowaną wiązką elektronów, w 
w szczególności siły elektromotorycznej (il. 85b). 
Jeśli próbka ma złącze p-n , prąd ten indukuje do¬ 
datkowe przewodnictwo elektryczne, którego roz¬ 
kład przestrzenny dostarcza informacji o własnoś¬ 
ciach elektronowych półprzewodnika, takich jak 
droga dyfuzji i czas życia nośników mniejszościo¬ 
wych. Na koniec katodoluminescencja (il. 85c) 
obserwowana w materiałach organicznych i nie¬ 
których półprzewodnikach (np. CdS, ZnS, GaAs, 
CdTe) jest czuła na zanieczyszczenia i defekty sieci. 


Emisyjny mikroskop elektronowy (EEM) 

W tej grupie mikroskopów lita próbka spełnia funkcję 
katody, tzn. emitera elektronów tworzących obraz. 
Wymuszenie emisji elektronów może nastąpić w wy¬ 
niku podwyższenia temperatury próbki (termoemi- 
sja), bombardowania elektronami lub jonami (emisja 
wtórna i jonowo-elektronowa), oświetlenia (fotoemi- 
sja) lub działania silnego poła elektrycznego (aut<> 
emisja). Układ elektronowo-optyczny formowania 
obrazu w EEM jest podobny jak w CTEM. Zdolność 
rozdzielcza ó zależy od rozmycia energetycznego 
A W elektronów i od pola elektrostatycznego E przy 
powierzchni próbki (S = 0,6J W/E) 9 a także od ro¬ 
dzaju emisji (200 A przy termoemisji i T — 2800 K, 
£=3*10® V/m; 500-1000 A przy emisji jonowo- 
elektronowej; 800 A przy fotoemisji; 1000 A przy 
emisji wtórnej). W warunkach termo- i fotoemisji 
zasadniczym czynnikiem tworzenia kontrastu jest 
lokalna wartość pracy wyjścia elektronów z próbki, 
zastosowanie EEM znalazł zastosowanie w fizyce metali przy 
EEM badaniu zdolności emisyjnej katod, w analizie prze- 
* mian fazowych w badaniach „in situ” wzajemnego 
oddziaływania jonów z materią (obserwacja równo¬ 
czesnego trawienia jonowego i utleniania próbki) itp. 



projektor Przykładem prostego EEM jest projektor elektro- 
elektronowy nowy pokazany na rys. 6. Zazwyczaj jest to kolba 
szklana (wewnątrz pokryta w przedniej części lumino¬ 
forem), w którą są wtopione: metalowe ostrze o pro¬ 
mieniu krzywizny 10M0 4 A (katoda) oraz otaczający 
je metalowy pierścień (anoda). Ciśnienie w kolbie wy¬ 
nosi 10 -8 -10~* Pa. Przyłożenie do anody napięcia 
dodatniego rzędu kilku kV powoduje powstanie przy 
powierzchni ostrza pola elektrostatycznego 10 9 -10 10 
V/m, które wystarcza do wywołania autoemisji. 
Powiększenie M = R/rp, gdzie R — odległość między 
katodą i ekranem, r — promień krzywizny ostrza 
(nagrzewanie ostrza powoduje, że jego czubek ulega 
zaokrągleniu), p — współczynnik zniekształcenia 
obrazu. Na ogół M = 200 tys. Zdolność rozdzielczą 
projektora elektronowego (ok. 25 A) ogranicza wy¬ 
stępowanie składowej prędkości elektronów stycznej 
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do powierzchni ostrza oraz, w mniejszym stopniu, zastosowanie 
dyfrakcja elektronów. Mikroskopy tego typu wy- projektora 
korzystuje się do badania autoemisji z metali trudno 
topliwych i półprzewodników, badania zjawiska ad¬ 
sorpcji i chemisorpcji oraz wyznaczania pracy wyjścia 
z różnych płaszczyzn sieciowych w monokryształach. 

Zwierciadlany mikroskop elektronowy (MEM) 

W mikroskopie zwierciadlanym lub inaczej w zwier¬ 
ciadle elektronowym elektrony oświetlające powierz¬ 
chnię litej próbki nie stykają się z nią bezpośrednio. 

Zasadniczym jego elementem jest obiektyw imersyjny, 
utworzony z próbki i cylindrycznej diafragmy (rys. 

7). Pomiędzy próbką (podaje się na nią ujemne napię- 



Rys. 7. Zasada działania zwierciadlanego mikroskopu 
elektronowego 


cie V 0 = 10-30 kV) i diafragmą (uziemiona) istnieje 
silne pole elektrostatyczne E 0 , które przekazuje elek¬ 
tronom tworzącym obraz mikroskopowy informacje 
o próbce. Szczególne znaczenie ma kształt tzw. zero- zerowa po- 
wej powierzchni ekwipotencjalnej, to jest powierzchni, wierzchnia 
na której następuje zahamowanie i zawrócenie elek- ekwipofen- 
tronów w kierunku ekranu fluorescencyjnego. Wy- cjalna 
boru zerowej powierzchni dokonuje się przez przyło¬ 
żenie do katody napięcia o kilka do kilkunastu woltów 
wyższego niż do próbki. Próbka przekazuje zerowej 
powierzchni ekwipotencjalnej szczegóły topografii 
swojej powierzchni oraz dodatkowo kształt wystę¬ 
pujących na niej pól elektrostatycznych i magnetycz¬ 
nych. Poprzeczna (względem osi optycznej) geome¬ 
tryczna zdolność rozdzielcza nie przekracza 1000 A 
(przy E 0 = 5-10* V/m). Najważniejszym parametrem 
decydującym o atrakcyjności MEM jest jednak nie 
geomettyczna, ale napięciowa zdolność rozdzielcza, 
określająca wykrywalną składową zmiany pola elek¬ 
trycznego w kierunku równoległym do powierzchni 
próbki. Stwierdzono, że nie przekracza ona wartości 
6-10 7 V/m a . Dzięki wysokiej czułości napięciowej 
MEM znalazł zastosowanie w badaniu elektrycznie zastosowanie 
aktywnych elementów powierzchni półprzewodników MEM 
(np. złącz p-n, il. 86, tabl. 22), ferroelektryków, a tak¬ 
że materiałów magnetycznych. Na specjalne podkreś¬ 
lenie zasługuje przydatność MEM do badań fizycz¬ 
nych, czego przykładem jest obserwacja zmian prze¬ 
wodnictwa elektrycznego powierzchni kryształu krze¬ 
mu w wyniku wymuszonej migracji zawartych w jego 
sieci krystalicznej domieszek atomów obcych. 





































Analityczny mikroskop elektronowy (EMA) 

przestrzenny Mikroskopy tego typu służą do przedstawienia w ob- 
rozkład razie mikroskopowym przestrzennego rozkładu wy- 
pierwiastka branego pierwiastka chemicznego, stanowiącego 
składnik materiału próbki. Zazwyczaj osiąga się taki 
obraz (il. 84, tabl. 22) przez sprzężenie TEM lub 
REM z odpowiednim spektrometrem, który analizuje 
widmo charakterystycznego promieniowania rentge¬ 
nowskiego, elektronów transmitowanych przez prób¬ 
kę, ewentualnie elektronów Augera. Procesy emisji 
kwantu charakterystycznego promieniowania rent¬ 


genowskiego i elektronu Augera o określonej energii 
są wzajemnie konkurencyjne. Pierwszy dominuje 
w atomach pierwiastków ciężkich, drugi — lekkich. 
Dobór spektrometru (w wypadku elektronów Augera 
jest to również specjalnego typu ŚREM) powinien 
zależeć od oczekiwanego składu chemicznego próbki. 

Z. Bojarski Mikroanalizator rentgenowski , Katowice 1971; 
I. Goldstein H. Yakowitz (red.) Practica Scanning Electron 
Microscopy , New York 1975; P. B. Hirsch i in. Electron Micro - 
scopy of Thin Crystals , London 1971; D. B. Holt i in. (ed.) Quan- 
titative Scanning Electron Microscopy , London 1974; J. Kozu- 
bowski Metody transmisyjnej mikroskopii elektronowej , Kato¬ 
wice 1975. 


Osiągnięcia krystalografii białek 

Tadeusz Bartczak 


Największe osiągnięcia analizy strukturalnej kryszta¬ 
łów i krystalochemii w ostatnich dziesięciu latach 
wiążą się z tzw. krystalografią białek. W obecnej 
chwili rentgenowska analiza strukturalna białek sta¬ 
nowi jedyną metodę, za pomocą której można uzys¬ 
kać precyzyjne dane strukturalne, tzn. przestrzenne 
współrzędne atomów. 

Biopolimery takie jak białka są bardzo delikatnym 
i trudnym obiektem badań. Po pierwsze — już próby 
wyhodowania kryształów dostatecznie dużych (wy¬ 
miary liniowe * ^ 0,3 mm) wymagają zastosowania 
nowoczesnych technik eksperymentalnych rozległej 
wiedzy biochemicznej, wykonania setek doświad¬ 
czeń i nierzadko kończą się niepowodzeniem. Po 
drugie — kryształy biopolimerów są zwykle o wiele 
nieuporząd- bardziej nieuporządkowane niż kryształy zbudowane 
kowanie z małych cząsteczek organicznych. Znaczy to, że czą- 
statyczne steczki, grupy lub łańcuchy atomów mogą być różnie 
i termiczne zorientowane w tej samej części komórki elementar¬ 
nej. Takie nieuporządkowanie nosi nazwę nieuporząd¬ 
kowani statycznego i powoduje duże trudności 
eksperymentalne. W kryształach biopolimerów ob¬ 
serwuje się ponadto nieuporządkowanie całych 
cząsteczek spowodowane drganiami termicznymi ato¬ 
mów. Jak wiadomo, ok. 50% objętości kryształów 
białek zwykle stanowi woda. Te cząsteczki wody 
mogą być mocno związane z powierzchnią cząsteczki 
białka albo luźno utrzymywane w przestrzeniach 
pomiędzy sąsiednimi cząsteczkami białka. Otoczenie 
przez „poduszkę” wody powoduje, że cząsteczki 
biopolimeru są luźniej ulokowane w sieci krystalicz¬ 
nej i dlatego zdolne są do wykonywania dużych drgań 
termicznych. 

Wreszcie wielkie rozmiary kryształów białek (ty¬ 
powy okres identyczności komórki elementarnej 
100 A w porównaniu z przeciętnym okresem iden¬ 
tyczności 10 A dla kryształu małej cząsteczki orga¬ 
nicznej) powoduje, że trzeba zmierzyć i przetworzyć 
ogromną liczbę interferencji. 

Te specyficzne cechy kryształów białek spowodo¬ 
wały, że metody ich badania za pomocą promieni 
rentgenowskich wyodrębniły się w oddzielną dzie¬ 
dzinę badań: krystalografię białek. Opracowanie 
wielu specyficznych technik badawczych i metod 
obliczeniowych umożliwiło pomyślne zbadanie wielu 
struktur białkowych i dlatego stanowi największe 
osiągnięcie analizy strukturalnej i jedno z najwięk¬ 
szych osiągnięć nauki ostatnich lat. Dyfrakcja pro¬ 
mieni rentgenowskich umożliwiła realizację jednego 
z podstawowych celów biologii molekularnej: in¬ 
terpretację funkcji biologicznej poprzez poznanie 
własności fizycznych i chemicznych struktur biolo¬ 
gicznych. Wstępnym warunkiem fizykochemicznej in¬ 
terpretacji procesów życiowych jest poznanie struk¬ 
tury odpowiednich komponentów życia na poziomie 
atomowym. Krystalografia rentgenowska jest jedyną 
znaną metodą dostarczającą tych informacji w sposób 
kompleksowy. 


Rozwój krystalografii białek 

Krystalografia białek rozwinęła się raptownie w ostat¬ 
nich kilkunastu latach, dzięki rozwojowi elektronicz¬ 
nej techniki obliczeniowej i nowoczesnych metod 
pomiaru intensywności promieniowania rentgenow¬ 
skiego ugiętego na krysztale (stosuje się tzw. automa¬ 
tyczne, czterokołowe dyfraktometry monokrysta- 
liczne). Pierwsze eksperymenty wykonane były przez 
J. Bemala i D. Crowfoot w 1934 r. w Cambridge na 
krysztale pepsyny, metodą rejestracji na błonie foto¬ 
graficznej. Uświadomiły one badaczom fundamen¬ 
talny fakt, że wielkie cząsteczki biologiczne są upo¬ 
rządkowane w sieć krystaliczną i że ich struktury 
można wobec tego określić metodami dyfrakcji rent¬ 
genowskiej. Z tego okresu pochodzi anegdota o tym, 
jak D. Crowfoot — późniejsza laureatka nagrody 
Nobla, pedałowała na rowerze do laboratorium, 
w środku nocy, przez uśpiony Oxford, aby jeszcze 
raz upewnić się, że kryształ insuliny naprawdę ugiął 
promieniowanie, co poprzedniego dnia zarejestrowała 
na błonie fotograficznej. Historia ta dobrze ilustruje 
wielkie podniecenie, jakie opanowywało badaczy 
w tamtych czasach, po otrzymaniu każdego udanego 
rentgenogramu białka. Wspomniane kryształy pep¬ 
syny otrzymano w Uppsali w sposób zupełnie przy¬ 
padkowy z roztworu, który stał w spokoju przez kilka 
tygodni. Ilustruje to sposób, w jaki wybierano obiekty 
do badań we wczesnych latach rozwoju krystalografii 
białek. Badano nie te białka, które były najważniejsze 
z punktu widzenia ich znaczenia biologicznego, ale 
te, które były łatwo dostępne i które można było 
łatwo wykrystalizować. Upłynąć musiało następnych 
35 lat, zanim metody krystalografii białek rozwinęły 
się na tyle, żeby można było ogłosić drukiem opis 
struktury insuliny. 

W krystalografii białek tzw. „problem fazowy” izomorficzne 
{-> Strukturalna analiza kryształów) jest szczególnie pochodne 
trudny ze względu na złożoną budowę tych cząste- białek 
czek. Trudności te pokonał M. von Perutz wraz ze z atomem 
współpracownikami w laboratorium L. _ Bragga ciężkim 
w Cambridge. Wykazali oni, że tzw. „ciężki atom”, 
np. atom rtęci, można wprowadzić do kryształu białka 
bez zakłócenia sposobu ułożenia atomów w krysztale, 
otrzymując kryształ pochodnej izomorficznej, który 
wykazuje znaczne i możliwe do zarejestrowania zmia¬ 
ny intensywności promieni ugiętych. Metoda ta do¬ 
prowadziła w 1960 r. do ustalenia po raz pierwszy 
struktury białka — mioglobiny przez J.C. Kendrew 
i współpracowników. 


Ograniczone możliwości krystalografii 
białek 

W krystalografii białek analiza strukturalna uwień¬ 
czona sukcesem stanowi dopiero punkt wyjściowy 
do wielu doświadczeń mających na celu wyświetlenie 
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ich funkcji biologicznych. Należy tu wspomnieć 
o trudnościach występujących w badaniu funkcji, 
jakie spełniają białka. Po pierwsze białko musi być 
wykrystalizowane, ażeby w ogóle można je było ba¬ 
dać za pomocą dyfrakcji promieni rentgenowskich. 
Powstaje problem, czy krystalizacja białka zmienia 
jego strukturę? Na szczęście odpowiedź może być 
przecząca, jeśli przyjmiemy, że struktura w krysztale 
reprezentuje trwałą konformację równowagową czą¬ 
steczki. Siły, które utrzymują cząsteczki białka w sieci 
krystalicznej, są o wiele słabsze niż te siły, które rzą¬ 
dzą strukturą samego białka wskutek mniejszej liczby 
wpływ kry- kontaktów międzyatomowych między cząsteczkami 
statizacji na białka niż w obrębie samej cząsteczki. Zatem duże 
konformację zmiany konformacyjne nie są prawdopodobne. Nie¬ 
kiedy te same białka wyizolowane z różnych orga¬ 
nizmów zwierzęcych czy roślinnych lub w ogóle to 
samo białko wykrystalizowane w bardzo różniących 
się warunkach miało struktury bardzo podobne. Ma¬ 
łych różnic konformacyjnych pomiędzy białkiem kry¬ 
stalicznym a tym samym białkiem w roztworze nie 
można wykluczyć, chociaż znany jest również fakt, 
że pewne białka zachowują swoją aktywność biolo¬ 
giczną w krysztale. W sytuacji, kiedy brakuje infor¬ 
macji strukturalnych na temat białek w roztworach, 
musimy akceptować strukturę krystaliczną jako punkt 
wyjściowy do interpretacji zachowania się tej czą¬ 
steczki w roztworze. 

Metoda rentgenograficzna jest w swej istocie sta¬ 
tyczna, a procesy biologiczne są w swej istocie'' dyna¬ 
miczne. Eksperyment rentgenograficzny, który wy¬ 
maga określonego czasu na jego przeprowadzenie, 
zwykle kilku dni, dostarcza obrazu cząsteczki, który 
jest uśredniony w tym czasie. Nie można za pomocą 
jedynie metody rentgenograficznej oznaczyć struktur 
przejściowych przyjmowanych przez cząsteczkę białka 
w trakcie spełniania jej funkcji biologicznej. Wyciąga¬ 
nie prawidłowych wniosków wymaga ścisłej współ¬ 
pracy z innymi dyscyplinami nauki. Metody magne¬ 
tycznego rezonansu jądrowego stale ulepszane stwa¬ 
rzają największe szanse badania takich struktur 
przejściowych. 


Etapy badania strukturalnego 
białek krystalicznych 

Badanie struktury białka składa się zwykle z ośmiu 
etapów: krystalizacja, przygotowanie izomorficznych 
pochodnych z atomem ciężkim, zmierzenie i zareje¬ 
strowanie intensywności promieni rentgenowskich 
ugiętych na krysztale białka, przetwarzanie tych da¬ 
nych w postać nadającą się do obliczeń, określenie 
położeń atomów ciężkich, obliczanie faz, interpretacja 
map gęstości elektronowej i uściślenie danych doty¬ 
czących otrzymanych współrzędnych atomowych, 
krystalizacja Krystalograf musi nie tylko wykrystalizować białko, 

ale także wyhodować kryształ pokaźnych rozmiarów. 
Jest to konieczne, ponieważ intensywności promieni 
ugiętych na krysztale są mniej więcej proporcjonalne 
do objętości kryształu, a odwrotnie proporcjonalne 
do objętości krystalograficznej komórki elementarnej, 
która nie może być mniejsza od jednej podjednostki 
białka. Dla białek o masie cząsteczkowej poniżej 
50 000 daltonów, kryształ o wymiarach liniowych 
0,1 mm dałby prawdopodobnie obraz dyfrakcyjny 
pozwalający na wydedukowanie podstawowych da¬ 
nych komórki krystalograficznej. Aby pomyślnie 
wykonać analizę z wysoką rozdzielczością, konieczny 
jest kryształ o wymiarach liniowych co najmniej 
0,3 mm. Dla białek o większej masie cząsteczkowej 
wymagane wymiary są większe. Aby zastosować me¬ 
todę neutronograficzną potrzebne są kryształy o wy¬ 
miarach liniowych 3 mm nawet dla najmniejszych 
białek. Jedynie metodami mikroskopii elektronowej 
można badać bardzo małe kryształy. 

Krystalizacja białek jest zadaniem bardzo trudnym, 
gdyż wiele białek jest dostępnych w bardzo ma- 
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łych ilościach. W ostatnich latach rozwinięto szereg 
nowych metod krystalizacji, co pozwala na wybór 
białek do badań na bardziej racjonalnych podsta¬ 
wach. 

Krystalizuje się białko oczyszczone, wyizolowane 
z odpowiedniego materiału biologicznego. Trzeba się 
starać, aby w miarę możliwości białko pozostawało 
w postaci biochemicznie aktywnej. Należy zbadać 
zależność rozpuszczalności od pH, mocy jonowej, 
rozpuszczalników organicznych i temperatury, z 
uwzględnieniem zależności już określonych przez 
badania biochemiczne. Aby zobrazować skalę trud¬ 
ności, z jakimi spotykają się badacze przytoczymy 
pracę F. Lynena i współpracowników nad krystali¬ 
zacją syntetazy kwasu tłuszczowego — wieloenzymo- 
wego kompleksu składającego się z siedmiu białek 
o całkowitej masie cząsteczkowej 2,3 x 10 6 daltonów. 

W preparacie, który przechowywano przez 15 mie¬ 
sięcy w temperaturze 4°C, zaobserwowano obecność 
mikrokryształów. Następnie zmieniano warunki kry¬ 
stalizacji w sposób systematyczny w innych prepara¬ 
tach, do których wprowadzano te mikrokryształy 
jako zarodki krystalizacji. Ustalono w ten sposób 
optymalne warunki, w których udało się wyhodować 
kryształy w postaci słupów heksagonalnych o wymia¬ 
rach liniowych 0,1 mm w ciągu 2 dni. 

Nawet jeżeli udaje się wyhodować kryształy, to 
często warto kontynuować badania nad innymi wa¬ 
runkami krystalizacji, w których uda się może otrzy¬ 
mać odmianę polimorficzną bardziej odpowiednią 
do badań rentgenograficznych. Tak np. praca nad 
otrzymaniem kryształów chymotrypsynogenu trwała 
przez całe lata, na skutek otrzymywania nieodpo¬ 
wiedniej odmiany kryształów. Otrzymano dziesięć 
różnych odmian krystalicznych enzymu allosterycz- 
nego, asparginianu transkarbamylazy (masa czą¬ 
steczkowa 300 000 daltonów). Odmianę najbardziej 
odpowiednią do badań znaleziono przez przypadek. 

Również insulina wykazuje polimorfizm postaci kry¬ 
stalicznych. Odmiana rombowa otrzymywana przy 
pH < 7 jest nietrwała w temperaturze pokojowej, 
trwała jest natomiast odmiana romboedryczna wykry¬ 
stalizowana przy pH = 6,3. 

Wspomnieć trzeba nadto, że kryształy białek różnią 
się jeszcze i tym od kryształów mniejszych*cząsteczek 
organicznych, że zawierają znaczną ilość ciekłego 
rozpuszczalnika (rys. 1). 

Metoda izomorficznego podstawienia została po metoda izo- 
raz pierwszy zastosowana przez J.M. Robertsona morficznego 
i I. Woodwarda w 1937 r. w ich analizach ftalocyja- podstawienia 
nin.‘ 

Kryształy białka zawierają duże kanały wypełnione 
roztworem macierzystym. Często jest możliwe przy¬ 
łączenie ciężkiego atomu do powierzchni białka 
w ten sposób, że nie zakłóca on struktury molekular¬ 
nej ani krystalicznej, ale zajmuje położenie w jednym 
z tych kanałów. Wzdłuż nich atomy ciężkie dyfundują 
w głąb natywnych kryształów białka. Jeśli atom ciężki 
wykazuje wystarczającą „gęstość elektronową”, to 
zaobserwuje się zmiany w obrazie rentgenograficz- 
nym. Na przykład wprowadzenie atomu rtęci, który 
ma 80 elektronów, do białka o masie cząsteczkowej 
24 000 daltonów powoduje średnią zmianę inten¬ 
sywności o 40%. Możliwe do interpretacji mapy 
gęstości elektronowej kompleksu nukleaza-inhibitor 
uzyskano używając tylko jednej pochodnej izomor¬ 
ficznej, otrzymanej przez wprowadzenie stosunkowo 
lekkiego atomu jodu — zawierającego 46 elektro¬ 
nów. Większe białka wymagają cięższych atomów 
i stosuje się jony kompleksowe metali, takie jak 
[Ta 6 Cl J2 ] 2+ , [W 6 CI 8 ] 4+ i inne. Każdy z czynników 
struktury (-> Strukturalna analiza kryształów) po¬ 
chodnej zawierającej atom ciężki, oznaczanych jako 
Fu* jest wektorową sumą udziałów białka F i atomu 

ciężkiego /. Zatem Fh = F-\-f. Pierwszym krokiem 
w analizie jest określenie położenia atomu ciężkiego. 

Można to osiągnąć za pomocą syntezy Pattersona, 




w której stosuje się jako współczynniki różnice 
(|F//| —|F|) 2 . Cząsteczki białek krystalizują w nie- 
centrosymetrycznych grupach przestrzennych (-> 
Kryształy), jednak pewne dwuwymiarowe rzuty 
funkcji Pattersona są zwykle centrosymetryczne. 
Ułatwia to bardzo określenie współrzędnych atomu 
ciężkiego na takich rzutach, ponieważ fazy są równe 
0 lub 180° a wobec tego czynniki struktury przyjmują 
wartości -Hf 7 ! lub — JF|. 

Zwykle nie wystarcza analizowanie jednej pochod¬ 
nej z atomem ciężkim i wymagane jest otrzymanie 
dwu łub więcej takich pochodnych. Alternatywną 
metoda ano- metodą określania faz, która wymaga zastosowania 
malnego tylko jednej pochodnej z atomem ciężkim, jest wy- 
rozpraszania korzystanie zjawiska anomalnego rozpraszania. 

W normalnych warunkach obowiązuje prawo Frie- 
dela: F(hkl) — F(hkl ), nawet jeżeli struktura jest nie- 
centrcsymetryczna. Oznacza to, że niemożliwe jest 
rozróżnienie pomiędzy dwiema strukturami enan- 
cjomerycznymi (tzn. mającymi się do siebie tak jak 
przedmiot i jego odbicie w lustrze, albo jak dłoń prawa 
w stosunku do lewej). Jeśli jednak długość fali pro¬ 
mieniowania pierwotnego jest bardzo zbliżona do 
tzw. progu absorpcji któregoś atomu w strukturze, 



Rys. 1. Ułożenie heksamerów insuliny w krysztale romboedrycz- 
nej insuliny 2-cynkowej. Kryształ składa się w istocie z dwu faz: 
stałej składającej się z cząsteczek białka stykających się w kilku 
miejscach i tworzących otwartą sieć i wypełnionej przez fazę 
ciekłą. Cząsteczki rozpuszczalnika przylegające do cząsteczek 
białka wykazują często wysoki stopień uporządkowania i są po¬ 
wiązane silnymi wiązaniami wodorowymi ż powierzchniowymi 
grupami polarnymi białka. Natomiast rozpuszczalnik wewnątrz 
dużych kanałów, które mogą mieć szerokość do 2 mm, jest nie¬ 
uporządkowany, tak jak to bywa w zwykłych cieczach (wg Blun- 
della) 


wtedy fala ugięta wykazuje anomalne przesunięcie 
fazy, które nieco wyprzedza fazę normalną. Powo¬ 
duje to różnicę intensywności pomiędzy refleksami 



Rys. 2. Schemat sposobu wiązania pochodnej rtęci z mioglobi- 
ną. Dolna część okręgu wyobraża grupę hemową. Symbole 
w kółkach oznaczają aminokwasy i ich położenie w łańcuchu 
polipeptydowym (wg H. C. Watsona i in.) 

(hkl) i Qikl). D. M. Blow i M.G. Rossmann wykorzy¬ 
stali tę metodę do analizy hemoglobiny i jej pochodnej 
zawierającej 4 cząsteczki HgCl 2 . Na rys. 2 jest poka¬ 
zany schemat wiązania pochodnej rtęci z mioglobiną. 

Metoda fotograficzna ma tę wielką zaletę, że re- pomiar inten- 
jestruje się przy jej użyciu wielką liczbę promieni sywności 
ugiętych w jednym eksperymencie, ale potem trzeba promieni 
zmierzyć intensywność każdej plamki na wywołanej ugiętych 
błonie fotograficznej, co jest zadaniem żmudnym na krysztale 
i ogromnie pracochłonnym. Ta wada metody foto- białka 
graficznej była jednym z powodów, dla których zbu¬ 
dowano aparaty do bezpośredniego pomiaru inten¬ 
sywności promieni ugiętych metodą rejestracji licz¬ 
nikowej. Są to automatyczne czterokołowe dyfrakto¬ 
metry monokrystaliczne sterowane komputerami. 

Komputer służy do obliczania położeń kątowych kry¬ 
ształu i licznika scyntylacyjnego i przestawiania ich 
w położenia umożliwiające zmierzenie następnego 
refleksu. Metoda ta wymaga oddzielnego zbadania 
każdego maksimum dyfrakcyjnego i dlatego zebranie 
danych o intensywności około 10 000 promieni ugię¬ 
tych zajmuje zwykle kilka dni. W ciągu tego czasu 
kryształ białka podlega naświetlaniu, co powoduje 
jego nieodwracalne uszkodzenie radiacyjne. Stanowi 
to jeden z głównych problemów dyfraktometru rent¬ 
genowskiej i zmusza krystalografa do opracowania 
takiej strategii zbierania danych o intensywności pro¬ 
mieni ugiętych, która pozwoli zbierać je z żądaną do¬ 
kładnością, a jednocześnie zminimalizuje czas ekspo¬ 
zycji kryształu w wiązce promieni rentgenowskich. 

W ostatnich latach starano się zaradzić trudnościom 
badawczym przez opracowanie nowych aparatów 
i urządzeń pomiarowych. Skonstruowano automa¬ 
tyczne mierniki stopnia zaczernienia (gęstości op¬ 
tycznej) plamek na rentgenogramach, tzw. densy¬ 
tometry i dyfraktometry przystosowane do jedno¬ 
czesnej rejestracji intensywności trzech do pięciu 
refleksów, co oczywiście skraca całkowity czas po¬ 
miaru trzy do pięciu razy. Opracowano także nowe 
rodzaje kamer fotograficznch. 

Omówimy jeszcze krótko etap interpretacji map interpretacja 
gęstości elektronowej (map Fouriera), pomijając po- map 
zostałe etapy jako zbyt specjalistyczne. Należy tu wy gęstości 
jaśnić pojęcie rozdzielczości. Najmniejsza odległość elektronowej 
r, która może być rozróżniona na obrazie uzyskanym 
za pomocą promieni rentgenowskich, jest określona 
przez wyrażenie: 

r a; OJldm = 0,71A/2sin 0(max), 
gdzie sin0(max) oznacza maksymalną wartość 
sin 6 (0 — kąt odbłysku Bragga) dla refleksów uży- 
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tych do obliczenia sum Fouriera, a dm jest odpo¬ 
wiednią minimalną odległością międzypłaszczyznową. 
Możliwa do osiągnięcia rozdzielczość dla kryształów 
białek jest ograniczona przez wyżej wspomniane nie¬ 
uporządkowanie statyczne i termiczne. W praktyce 
rozdzielczość krystalografii białek przyjęło się podawanie nominal- 
mapy nej rozdzielczości mapy gęstości elektronowej jako 
dm 9 tzn. minimalnej odległości międzypłaszczyzno- 
wej, dla której wartości czynników struktury F są 
włączone w szeregi Fouriera. Terminy „rozdzielczość 
6 A” (tzn. niska) i „rozdzielczość 2,0 A” (tzn. wyso¬ 
ka) użyte przy podawaniu danych oznaczają, że dane 
dyfrakcyjne zostały zebrane do granicy tej właśnie 
odległości międzypłaszczyznowej. 

Po rozwiązaniu problemu fazowego można obliczyć 
syntezę Fouriera i wykreślić mapę gęstości elektro¬ 
nowej, na której krystalograf stara się zidentyfikować 
położenie atomów. Gdy cząsteczki są małe, mapa gę¬ 
stości elektronowej może być obliczona przy wysokiej 
rozdzielczości 1 A lub nawet wyższej i interpretacja 
takiej mapy jest zupełnie prosta. Wspomniane już 
nieuporządkowanie w krysztale białek może być tak 
duże, iż najlepsza możliwa rozdzielczość wyniesie je¬ 
dynie 2 lub 3 A. Zwykle można zidentyfikować głów¬ 
ny łańcuch polipeptydowy, gdy rozdzielczość wyno¬ 
si 3 A, ale nie pozwala ona na rozróżnienie pojedyn¬ 
czych atomów. 

Przy rozdzielczości 2 A jest możliwe zidentyfiko¬ 
wanie raczej grup niż indywidualnych atomów. Jeżeli 
jest znana szczegółowa struktura chemiczna białka, 
tj. kolejność aminokwasów wzdłuż łańcucha polipep- 
tydowego, wtedy odpowiednie łańcuchy boczne można 
szybko rozpoznać. Jeśli taka wstępna budowa che¬ 
miczna jest znana tylko częściowo albo nie znana 
wcale, wtedy jest konieczne zidentyfikowanie poszcze¬ 
gólnych aminokwasów wprost z mapy gęstości elek¬ 
tronowej. Cztery aminokwasy: tryptofan, fenyloala- 
nina, tyrozyna i histydyna posiadają aromatyczne 
łańcuchy boczne, które można zwykle łatwo rozpo¬ 
znać. Tryptofan wyróżnia się swoimi rozmiarami, 
a fenyloalanina jest zwykle ulokowana w obszarach 
hydrofobowych białka. Polarny charakter tyrozyny 
i histydyny sugeruje, że są one najprawdopodobniej 
ulokowane w obszarach hydrofilowych. Aminokwasy 
zawierające siarkę są zwykle łatwo rozróżnialne z po¬ 
wodu rozmiarów atomu siarki. 

Wiele innych aminokwasów można grupować wg 
ich kształtu. Walina i treonina odgałęziają się od ato¬ 
mu Qj, podczas gdy leucyna, kwas asparaginowy 
i asparagina odgałęziają się od atomu Cy itd. Uwagi 
powyższe ilustrują sposób, w jaki wiedza chemiczna 
może być spożytkowana w tego rodzaju rozważa¬ 
niach. Interesującym przykładem takiej analizy może 
być interpretacja mapy gęstości elektronowej wyko- 
struktura nana przez W. N. Lipscomba i współpracowników 
karboksy- Harward University w trakcie ich pracy nad strukturą 
peptydazyA enzymu trawiennego karboksypeptydazy A. Znano 
kolejność aminokwasów w kilku fragmentach en¬ 
zymu, ale brakowało pewnych części i nie była znana 
kolejność fragmentów. W.N. Lipscomb zapropono¬ 
wał na podstawie badań rentgenograficznych kom¬ 
pletną kolejność dla 307 reszt aminokwasowych. 
Nieco później biochemik H. Neurath opublikował 
kolejność aminokwasów w tym enzymie, określoną 
metodami chemicznymi. Porównanie wyników wy¬ 
kazało, że fragmenty zostały poprawnie, co do ko¬ 
lejności, ulokowane na mapie gęstości elektronowej, 
ale liczba znanych fragmentów wynosiła 214 na ogólną 
liczbę 307 aminokwasów. W.N. Lipscomb oznaczał 
pozostałe 93 reszty i okazało się, że zidentyfikował 
on 60% z nich (tj. 56 reszt) poprawnie. 37 niepopraw¬ 
nie określonych reszt wynikało z pomylenia waliny 
z treoniną, leucyny z kwasem asparaginowym i pew¬ 
nych innych błędów. Zatem identyfikacja łańcuchów 
bocznych aminokwasów nie jest w żadnym razie 
jednoznaczna i trzeba w rozważaniach brać po uwagę 
czynniki stereochemiczne, otoczenie miejscowe i wiele 
innych aspektów. 


Interesujące jest badanie struktury papainy — pro- 
teazy roślinnej, dla której chemicy błędnie określili ko¬ 
lejność aminokwasów, a co można było poprawić do¬ 
piero po przestudiowaniu mapy gęstości elektronowej. 

Interpretację map gęstości elektronowej przepro¬ 
wadza się za pomocą porównywania w specjalnych 
urządzeniach (rys. 3) modeli zbudowanych w skali 


źródło światła zwierciadło półprzepuszczalne 



b) 


sekcje mapy gęstości 
elektronowej 


zwierciadło półprzepuszczalne 



Rys. 3. Urządzenie optyczne do porównywania modelu moleku¬ 
larnego z mapami Fouriera gęstości elektronowej: a) lustro pod 
kątem 45° do map gęstości elektronowej, b)lustro równoległe do 
map gęstości elektronowej (wg T. L. Bundella, L. N. Johnsona) 


2 cm/A z otrzymanym obrazem gęstości elektrono¬ 
wej. Urządzenie takie, znane wśród krystalografów skrzynka 
pod popularną nazwą skrzynki albo pudła Richardsa, Richardsa 
zaprojektował F.M. Richards z Yale University. 

Arkusze z przezroczystego materiału z narysowanymi 
na nich cięciami trójwymiarowej mapy gęstości elek¬ 
tronowej hnontuje się pionowo w zaciemnionej części 
urządzenia. Następnie oświetla się wybrane cięcie 
mapy albo jego część i pozorny obraz oświetlonego 
obrazu rzuca się za pomocą półprzepuszczalnego 
lustra na obszar, w którym odbywa się budowanie 
modelu. Można w ten sposób studiować określoną 
część mapy, a budowanie modelu jest bardzo ułat¬ 
wione dzięki porównaniu z pozornym obrazem 
gęstości elektronowej. 

Rozwinięto również metody komputerowe, które 
umożliwiają jednoczesną projekcję mapy i modelu 
na monitorze (odmiana kineskopu telewizyjnego). 

Pozwala to na konstruowanie precyzyjnego i stereo¬ 
chemicznie uzasadnionego modelu łańcucha polipep- 
tydowego. Niedogodnością jest tutaj przedstawienie 
trójwymiarowej struktury w postaci dwuwymiarowe¬ 
go obrazu. 

Lista analiz strukturalnych białek globularnych 
opublikowanych w literaturze naukowej do 1976 r. 
liczy około 90 pozycji (w tym m.in. 48 enzymów, 

7 globin, 14 układów redoksowych, 5 hormonów, 8 
immunoglobin). Liczba zbadanych białek jest niższa, 
gdyż wiele zespołów pracowało nad takimi samymi 
obiektami. Analizy te są wynikiem wytężonej pracy 
dużych zespołów uczonych przy zaangażowaniu 
znacznych środków materialnych. Uzyskano je w sto¬ 
sunkowo krótkim czasie — w ciągu ośmiu lat, poczy¬ 
nając od roku 1968. 
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hemoglobina 


Przykładowe analizy białek 


Przez lata hemoglobina była obiektem szczególnego 
zainteresowania chemików, biochemików i fizjolo¬ 
gów. To łatwo dostępne białko stanowiące główny 
składnik czerwonych ciałek krwi (il. 115, tabl. 28), jest 
niezwykle ważne pod względem fizjologicznym, ponie¬ 
waż zapewnia transport tlenu z płuc arteriami do tka¬ 
nek i transport C0 2 żyłami z powrotem do płuc. He¬ 
moglobina ssaków jest złożona z czterech podjednostek 
(-> Białka), które są parami identyczne. Każda jedno¬ 
stka zawiera 1 atom Fe usytuowany w środku grupy 
hemowej, zawierającej pierścień porfirynowy (rys. 4). 

W. Conant stwierdził już w 1926 r., iż żelazo pozo¬ 
staje w postaci dwuwartościowych jonów żelazawych 
podczas odwracalnego pobierania tlenu, natomiast 
w roztworze bez białka, żelazo grupy hemowej utlenia 
się raptownie do stanu trójwartościowego. Krzywa 
wiązania tlenu do hemoglobiny ma charakterystyczny 
kształt esowaty, który pokazuje, że powinowactwo do 
tlenu zależy od liczby cząsteczek tlenu już związanych. 
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Rys. 4. Grupa hemowa jest zasadniczym składnikiem hemoglo¬ 
bin, cytochromów i enzymów, takich jak kataliza i peroksydaza 
(wg T. L. Bundella, L. N. Johnsona) 


Powinowactwo do tlenu zależy również od stężeń in¬ 
nych metabolitów, takich jak jony wodorowe i fosfo¬ 
rany organiczne, które nie są związane z substratem. 


Kryształy ciekłe 

Antoni Adamczyk 

W artykule wykorzystano materiały udostępnione przez 
prof Mariana Mięsowicza. Za zgodę na ich wykorzy¬ 
stanie autor składa prof. Mięsowiczowi serdeczne po¬ 
dziękowanie. 


Ciekłe kryształy, odrębny stan materii 

Ciekłe kryształy są oryginalnym rodzajem cieczy, któ¬ 
rej cechą wyróżniającą jest anizotropia własności fi¬ 
zycznych. Przez anizotropię rozumiemy, jak zwykle, 
zależność przebiegu zjawiska, tzn. zależność mierzo¬ 
nej wielkości fizycznej od kierunku, w którym wyko¬ 
nujemy pomiar lub od kierunku działania czynnika 
wywołującego zjawisko. Anizotropia — typowa cecha 
wielu kryształów, nigdy nie występuje w cieczach. 
Wyjątkiem są ciekłe kryształy, nazywane z tego po¬ 
wodu także cieczami anizotropowymi lub mezo- 
morficznymi (o budowie pośredniej między cieczami 


Rys. 5. Porównanie różnych struktur mioglobin i hemoglobin 
pokazujące pofałdowanie charakterystyczne dla mioglobin. To 
pofałdowanie jest względnie stałe dla ssaków, owadów i globin 
wyizolowanych z pierścienic. Pokazane sa tylko atomy a węgla: 
a) łańcuch a hemoglobiny końskiej, b) łańcuch fi hemoglobiny 
końskiej, c) mioglobina kaszalota, d) hemoglobina minogi mor¬ 
skiej, e) hemoglobina gatunku Chironomus , f) hemoglobina ga¬ 
tunku Glycera (wg Love’a) 


Hemoglobina stawia zatem szczególne problemy; po 
pierwsze, w jaki sposób otoczenie białkowe kontroluje 
własności atomu żelaza, i po drugie, jak związanie 
tlenu przez jedną z grup hemowych wpływa na po¬ 
winowactwo do tlenu sąsiedniej grupy hemowej. Ba¬ 
dania strukturalne dostarczyły odpowiedzi na te py¬ 
tania. Analiza hemoglobiny i spokrewnionych z nią 
białek monomerycznych wykazała, że hem jest umiesz¬ 
czony w hydrofobowej kieszeni na powierzchni białka, 
zapewniającego środowisko o niskiej stałej dielek¬ 
trycznej, w którym nasycenie tlenem jest faworyzo¬ 
wane, a utlenianie zachodzi trudno. Odwracalne łą¬ 
czenie się tlenu z grupą hemową powoduje zmianę 
stanu elektronowego żelaza — przejście z wysoko- 
spinowego stanu paramagnetycznego do niskospino- 
wego stanu diamagnetycznego. 

M. von Perutz w swoich badaniach rentgenogra- 
ficznych hemoglobiny wykazał, że te współdziałające 
efekty są wyzwalane przez niewielkie ruchy atomu 
żelaza względem pierścienia porfirynowego, które 
mają miejsce w trakcie pobierania tlenu i towarzyszą 
zmianie stanu spinowego żelaza. Te przesunięcia ato¬ 
mu żelaza są przenoszone do innych części cząsteczki, 
tak że więzy trzymające białko w stanie dezoksy (od- 
tlenionym) zostają rozluźnione i dzięki temu następna 
podjednostka może łatwiej pobrać tlen. 

Strukturalne badania białek rozszerzyły naszą wie¬ 
dzę o procesach ewolucji. Stwierdzono m.in., że lizo- 
zym ludzki i kurzy, cytochromy c: koński, makreli 
i tuńczyka oraz hemoglobiny: ludzka, końska, owa¬ 
dzia, minogi morskiej i ochotki tworzą szereg homo¬ 
logiczny, tzn. że rozwinęły się one ze wspólnego przod¬ 
ka — enzymu. Badania strukturalne wykazują, że 
zmiany aminokwasów, szczególnie w obszarze miejsca 
aktywnego, mają mały wpływ na strukturę. Szereg 
struktur hemoglobin i mioglobin pokazany jest na rys. 
5. Ogólna struktura i umieszczenie hemu zostały w 
wysokim stopniu zachowane w trakcie ewolucji. 

C. C. F. Blake Adv. in Protein Chem. 23, 59 (1968); D. M. 
Blow, T. A. Steitz Ara. Rev. of Biochem. 39, 63 (1970); T. L. 
Blundell, L. N. Johnson Protein Crystalography , New York 
1976; J. P. Glusker, K. N. Trueblood Zarys rentgenografii 
kryształów. Warszawa 1977; D. Sherwood Crystałs, X-rays and 
Proteins , London 1976. 




a kryształami). Ciekłe kryształy powstają po stopieniu 
pewnych substancji krystalicznych lub wtedy, gdy w 
rozpuszczalniku o zdecydowanie określonym typie 
rozpuszczalności (polarnym lub niepolarnym) rozpuś¬ 
cimy substancję wykazującą obydwa typy rozpuszcza¬ 
lności, czyli tzw. substancję amfifilową. W pierwszym 
wypadku ciekłe kryształy nazywamy termotropowymi, 
w drugim zaś — liotropowymi. Tak termotropowe, 
jak i liotropowe ciekłe kryształy przechodzą do stanu 
zwykłej cieczy izotropowej po podgrzaniu ich do od¬ 
powiedniej temperatury. W chwili obecnej największe 
znaczenie praktyczne mają ciekłe kryształy termotro¬ 
powe i do nich tylko ograniczymy nasz przegląd. 

W trakcie ogrzewania kryształu substancji mogącej 
posiadać fazę mezomorficzną powstaje najpierw ciekły 
kryształ, a następnie w wyższej temperaturze przecho¬ 
dzi on w stan cieczy izotropowej. Przedział temperatu- 

Fazy upadku kropli ciekłego kryształu na powierzchnię tej samci 
substancji 



489 



ry, w którym istnieje faza mezomorficzna, czyli prze¬ 
dział między temperaturą powstania ciekłego kryszta¬ 
łu i temperaturą jego przejścia w ciecz izotropową, za¬ 
leży od rodzaju substancji i może wynosić bądź uła¬ 
mek stopnia, bądź też kilkadziesiąt, a nawet 100 stop¬ 
ni. W czasie ochładzania takiej substancji z cieczy izo¬ 
tropowej powstaje najpierw ciekły kryształ, który przy 
dalszym ochładzaniu ulega zwykłej krystalizacji. 
Temperatury wymienionych przejść fazowych, zare¬ 
jestrowane w czasie ogrzewania i w czasie chłodzenia, 
na ogół nie pokrywają się ze sobą. Może się również 
zdarzyć, że po stopieniu kryształu powstaje od razu 
ciecz izotropowa i dopiero w czasie jej ochładzania 
pojawia się faza mezomorficzna (zawsze poniżej tem¬ 
peratury topnienia). Takie przejście do stanu mezo- 
morficznego, występujące tylko w czasie chłodzenia, 
przejście nosi nazwę przejścia monotropowego. Przez wiele lat 
monotro- po odkryciu ciekłych kryształów znano tylko substan- 
powe c je, których temperatura przejścia fazowego w stan 
mezomorficzny była znacznie wyższa od temperatury 
pokojowej, zwykle powyżej 100°C. Dopiero w ostat¬ 
nich latach udało się otrzymać substancje, które wy¬ 
stępują w stanie mezomorficznym już w temperaturze 
pokojowej, a nawet w niższej. Odpowiednio dobrane 
mieszaniny mogą być ciekłymi kryształami w tempe¬ 
raturze —50°C, inne natomiast pozostają ciekłymi 
kryształami jeszcze w temperaturze -f300°C. 

Ciekłe kryształy znalazły liczne zastosowania w róż¬ 
nych dziedzinach nauki i techniki. Same jednak włas¬ 
ności tych niezwykłych cieczy stanowią pole bardzo 
atrakcyjnych prac badawczych. 


Trochę historii 


Chemiczne własności substancji ciekłokry¬ 
stalicznych i ich struktura molekularna 

Istotną cechą substancji, które mogą występować jako wydłużony 
ciekłe kryształy, jest wydłużony kształt ich molekuł, kształt 
tak jak to widać na przykładach przedstawionych na molekuł 
rys. 1. U dołu rys. 1 zamieszczono schemat budowy 
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Rys. 1. Wzory strukturalne kilku prostych molekuł substancji 
ciekłokrystalicznych i ogólny schemat ich budowy 


Ciekłe kryształy zostały odkryte już w 1888 r. przez 
austriackiego botanika F. Reinitzera, który zaobser¬ 
wował pod mikroskopem polaryzacyjnym istnienie 
cieczy wykazujących dwójłomność optyczną. W rok 
później O. Lehmann stwierdził, że oryginalna ciecz 
jest nowym stanem materii i nazwał tę ciecz ciekłym 
kryształem. 

Historia rozwoju badań ciekłych kryształów notuje 
trzy okresy rozkwitu. Pierwszy okres to lata wkrótce 
po ich odkryciu. Substancjami tymi zajmowali się 
wtedy głównie chemicy. Przeprowadzono syntezy wie¬ 
lu nowych związków chemicznych, mających fazy me- 
zomorficzne i obserwowano prawidłowości przemian 
fazowych. 

Następny okres — to dwudziestolecie międzywojen¬ 
ne, kiedy to pojawiły się m.in. prace G. Friedela na 
temat własności optycznych ciekłych kryształów. 
W wyniku tych prac G. Friedel zaproponował, do dziś 
obowiązujący, podział na ciekłe kryształy nematyczne, 
smektyczne i cholesterolowe. Wtedy także badano 
własności elektryczne i magnetyczne ciekłych kryszta- 
badanie włas- łów i znaleziono m.in. tak ważną dla obecnych zasto- 
ności optycz- sowaó łatwość orientowania się tych substancji w ze- 
nych, elek- wnętrznych polach elektrycznych i magnetycznych, 
trycznych i Warto wzmiankować, że w owym okresie w Polsce 
magnetycz- (Kraków) intensywnie, jak na owe czasy, rozwijały 
nych się badania nad ciekłymi kryształami. Mamy tu na 
myśli pionierskie badania M. Jeżewskiego nad prze- 
nikalnością elektryczną ciekłych kryształów oraz ba¬ 
danie ich przewodnictwa elektrycznego i wpływu na 
nie pola elektrycznego i magnetycznego (M. Jeżewski, 
M. Mięsowicz). O polskich pracach nad anizotropią 
lepkości ciekłych kryształów będzie mowa dalej. 

Obecny okres rozkwitu, trwający od ok. 10 lat, wią¬ 
że się z szerokim zastosowaniem ciekłych kryształów 
w technice i ze zrozumieniem roli tych substancji w or¬ 
ganizmach żywych. Szeroko bada się i stosuje własno¬ 
ści optyczne i elektrooptyczne ciekłych kryształów, 
bada się także ich udział w procesach biologicznych. 
Dotychczas zsyntezowano ok. 7 tys. związków ciekło¬ 
krystalicznych i ciągle pojawiają się doniesienia o od¬ 
kryciu nowych takich substancji, a nawet całych ich 
grup. 


częściej spotykanych związków ciekłokrystalicznych. 
Zwykle, chociaż nie jest to sztywna reguła, molekuła 
taka składa się z dwu pierścieni benzenowych, połą¬ 
czonych ze sobą bezpośrednio lub za pośrednictwem 
środkowej grupy atomów X i przeciwległe (w położe¬ 
niu para-) przyłączonych grup końcowych Y i Y'. 
Spotyka się także bardziej skomplikowaną budowę 
molekuł. Jako przykład mogą służyć popularne estry 
cholesterolu, np. pelargonian cholesterylu, którego 
wzór strukturalny jest przedstawiony na rys. 2. 



Rys. 2. Wzór strukturalny molekuły cholesterolowego ciekłego 
kryształu — pelargonianu cholesterylu 


Wydłużenie molekuł substancji mezomorficznych, 
czyli stosunek długości molekuł do ich szerokości, wy¬ 
nosi 6 i więcej. Na przykład, długość molekuły p- azo- 
ksyanizolu z rys. 1 wynosi 2 nm, zaś jej szerokość — 
0,3-0,4 nm. 

Pod względem struktury ciekłe kryształy dzielimy 
na trzy zasadnicze typy: 

ciekłe kryształy nematyczne, w których molekuły 
pozostają względem siebie równoległe i nie mają żad¬ 
nych dodatkowych ograniczeń we wzajemnym przesu¬ 
waniu się (rys. 3a); 

ciekłe kryształy smektyczne, w których równoległe 
względem siebie molekuły są rozmieszczone warstwa¬ 
mi, zaś długie osie tych molekuł pozostają prostopadłe 
lub nieco nachylone względem tych warstw (rys. 3b); 

ciekłe kryształy cholesterolowe, w których moleku¬ 
ły są także rozmieszczone warstwowo, ale w ten spo¬ 
sób, że ich długie osie, pozostając wzajemnie równo¬ 
ległe, są jednocześnie równoległe do warstw. Wszyst¬ 
kie molekuły z warstwy następnej są skręcone o pe¬ 
wien stały kąt względem molekuł leżących w warstwie 
poprzedniej (rys. 3c). Wynikiem takiego skręcenia jest 
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Rys. 3. Struktura ciekłych kryształów: a) typ nematyczny, 
b) typ smektyczny, c) typ cholesterolowy 

swoista struktura śrubowa o niesłychanie ciekawych 
własnościach optycznych. 

Każdy z tych trzech typów struktur rozpada się na 
kilka rodzajów, różniących się szczegółami w upo¬ 
rządkowaniu molekuł. Tak więc, wyróżnia się trzy 
rodzaje nematyków, dwa rodzaje cholesterolowych 
ciekłych kryształów i kilkanaście rodzajów smekty- 
ków. 

Geneza słowa „nematyk” bierze początek od grec¬ 
kiego nema — 'nić*. Nazwa struktury nematycznej zo¬ 
stała wyprowadzona od charakterystycznych, ruchli¬ 
wych nici widocznych pod mikroskopem i będących 
zaburzeniami struktury. Smektyki wzięły nazwę od 
greckiego słowa smektos — ‘mydlany*, ponieważ ich 
mętność i lepkość przypomina stężone roztwory myd¬ 
ła. Nazwa cholesterolowych ciekłych kryształów po¬ 
chodzi od estrów cholesterolu, u których ten typ 
struktury po raz pierwszy zaobserwowano. 


Niektóre substancje mają więcej niż jedną fazę cie¬ 
kłokrystaliczną. Jest to tzw. polimezomorfizm. Istnie¬ 
ją substancje, w których występuje kilka faz smek- 
tycznych, u innych występuje najpierw faza smektycz- 
na, zaś w wyższych temperaturach — nematyczna lub 
cholesterolowa itd. W toku ogrzewania substancji 
faza smektyczna, jeżeli występuje w ogóle, to wystę¬ 
puje zawsze jako pierwsza, zaś fazy nematyczna i cho¬ 
lesterolowa pojawiają się dopiero w wyższych tempe¬ 
raturach i poprzedzają przejście substancji do stanu 
cieczy izotropowej. W substancjach jednoskładniko¬ 
wych fazy nematyczna i cholesterolowa nawzajem się 
wykluczają, tzn., że jeżeli w jakiejś substancji wystę¬ 
puje faza cholesterolowa, to tej substancji nie można 
przeprowadzić do fazy nematycznej w drodze zmian 
temperatury. 


Temperatury przejść fazowych kilku substancji ciekło¬ 
krystalicznych (w °C) 


Substancja 

Tk-n 

Tk-s 

Ts-ch 

Ts-n 

Tn-i 

Tch-i 

p-azoksyanizol (PAA) 

118 

_ 

_ 

_ 

135 

_ 

4-/i-butyIo-A r -(4-me- 
t ok sybenzy I ideno)- 
anilina (MBBA) 

22 




47 


pclargonian cho- 
lestcrylu (CN) 

— 

74 

81 1 

— 

— 

93 

oktylocyjanodwufc- 
nyl (OCB) 


21 


[ 32 

40 

40 


Poniżej przedstawiono tabelę zawierającą tempera¬ 
tury przejść fazowych kilku popularnych substancji 
ciekłokrystalicznych. Obok nazwy każdej z nich 
umieszczono, zwyczajowo używane, skróty ich nazw 
angielskich. Temperaturę przejścia z fazy stałej do fazy 
nematycznej oznaczono przez Tk-n, z fazy nematycz¬ 
nej do izotropowej przez Tn-i, z fazy stałej do smek- 
tycznej przez Tk-s, z fazy smektycznej do cholestero¬ 
lowej przez Ts-ch , z fazy smektycznej do nematycz¬ 
nej przez Ts~n oraz z fazy cholesterolowej do izotro¬ 
powej przez Tch-i . Kreska w kolumnie oznacza, że 
odpowiednie przejście fazowe nie występuje w danej 
substancji. 


Model domenowy a model ośrodka ciągłego 
(model continuum) 

Anizotropowe własności ciekłych kryształów wynika¬ 
ją ze wzajemnie równoległego ustawienia się wydłu¬ 
żonych molekuł. Jest intuicyjnie oczywiste, że grupa 
równoległych względem siebie molekuł będzie miała 
inne własności wzdłuż długich osi molekuł, inne zaś 
w kierunku osi krótkich. W dużej objętości ciekłego 
kryształu kierunek uporządkowania molekuł ma cha¬ 
rakter jedynie lokalny. Można więc przyjąć hipotezę, 
że molekuły tworzą ziarniste skupiska (domeny) i kie¬ 
runek uporządkowania molekuł w sąsiednich dome¬ 
nach jest różny. Na podstawie danych doświadczal¬ 
nych obliczono, że liczba jednakowo zorientowanych 
molekuł, tworzących hipotetyczną domenę, jest rzędu 
10®. Rozmiary domen są więc porównywalne z dłu¬ 
gością fali świetlnej i dlatego światło przechodzące 
przez warstwę ciekłego kryształu jest silnie rozpra¬ 
szane. Ten mechanizm może tłumaczyć istnienie męt¬ 
ności charakterystycznej dla wszystkich ciekłych kry¬ 
ształów. 

Molekuły w cieczach mają dużą swobodę przemiesz¬ 
czania się w przestrzeni, mogą więc bardzo łatwo 
przechodzić z jednej domeny do drugiej. Ta wymiana 
molekuł powoduje, że granice domen są silnie roz¬ 
myte. Wydaje się zatem, że bardziej odpowiednim 
modelem nematycznego ciekłego kryształu jest model 
ośrodka ciągłego (model continuum). W tym modelu 
kierunek uporządkowania molekuł zmienia się w spo¬ 
sób ciągły w przestrzeni, mimo że nadal zostaje za¬ 
chowane dalekie uporządkowanie między tymi mole¬ 
kułami. „Dalekie” znaczy tutaj rozciągające się na od- 
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ległości duże w porównaniu z rozmiarami samych mo¬ 
lekuł. Różnicę między modelem domenowym i mo¬ 
delem continuum widać ze szkiców, przedstawionych 
na rys. 4. Wiele zjawisk optycznych i hydrodynamicz- 


model domenowy 


model ciągły 


Rys. 4. Model domenowy i model ośrodka ciągłego (continuum) 


nych świadczy o poprawności raczej modelu conti¬ 
nuum, chociaż na gruncie modelu domenowego łatwo 
można wytłumaczyć kolektywny charakter oddziały¬ 
wania ciekłego kryształu z polami elektrycznymi 
i magnetycznymi. Chodzi o to, że energia oddziały¬ 
wania pojedynczej molekuły z polem jest o kilka rzę¬ 
dów wielkości za mała, aby móc przeciwdziałać nisz¬ 
czącemu działaniu ruchów termicznych. Jeżeli jednak 
przyjąć, że pole działa nie na jedną molekułę, lecz na 
cały ich zbiór zawarty w domenie, to już można wy¬ 
jaśnić, dlaczego orientujące działanie wywierają pola 
o stosunkowo niewielkich natężeniach (zob. niżej). 

Równoległe uporządkowanie molekuł, charaktery¬ 
styczne dla ciekłych kryształów, nie jest idealne. Drga¬ 
nia termiczne molekuł powodują odchylenia od rów¬ 
noległości i jedjmie średni kierunek ich długości osi 
pozostaje niezmieniony. Ten średni kierunek oznacza 

się za pomocą wektora n o długości jednostkowej, 
zwanego dyrektorem (od ang. direciion — ‘kierunek’). 
Im wyższa jest temperatura ciekłego kryształu, tym 
większa amplituda drgań molekuł i tym gorsze upo- 
stopień rządkowanie. Stopień tego uporządkowania można 
uporządko- wyrazić liczbowo za pomocą tzw. parametru upo- 
wania rządkowania S. Dla nematyków: 

*S = f <3 cos*0—1>. 

Znak < > oznacza uśrednienie względem wszystkich 
molekuł, należących do zbioru o jednakowej orienta¬ 
cji. Kąt 0 jest utworzony między dyrektorem n i dłu¬ 
gą osią jednej wybranej molekuły. Gdy uporządko¬ 
wanie znika (jak w cieczach izotropowych), czyli gdy 
każda wartość kąta 0 jest jednakowo prawdopodob¬ 
na, to średnia wartość cos 2 0 = V* i parametr S = 0. 
Dla idealnego uporządkowania 0 jest zawsze równe 
zeru i parametr S = 1. W nematykach, w zależności 
od temperatury, S ma wartość od ok. 0,4 do ok. 0,7. 


Tekstury molekularne 

Teksturą nazywamy sposób ułożenia krystalitów w 
materiale polikrystalicznym, ułożenie włókien w ma¬ 
teriale kompozytowym itd. W wypadku ciekłych 
kryształów przez teksturę rozumiemy sposób prze¬ 
strzennego ustawienia długich molekuł w cienkiej 
warstwie ciekłokrystalicznej. Jest to zatem tekstura 
molekularna. Tekstur molekularnych w ciekłych 
kryształach jest wiele rodzajów; tutaj wspomnimy je¬ 
dynie o kilku najważniejszych z punktu widzenia za¬ 
stosowań ciekłych kryształów. 

Jeżeli w cienkiej warstwie nematyka, zawartej mię¬ 
dzy dwiema powierzchniami szkła lub innego ma¬ 
teriału stałego, długie osie molekuł leżą równolegle 


do obu powierzchni ograniczających i ponadto, gdy 
wszystkie molekuły mają jednakowy kierunek, to ta¬ 
kie uporządkowanie nosi nazwę tekstury planarnej. 
Z tekstury planarnej można łatwo otrzymać teksturę 
skręconego nematyka (ang. twisted nematicś). W tym 
celu obie płytki, między którymi znajduje się warstwa 
planarnie zorientowanego nematyka, należy skręcić 
względem siebie o 90°. Po takim obrocie kierunek mo¬ 
lekuł przylegających do jednej powierzchni tworzy kąt 
prosty z kierunkiem molekuł leżących na drugiej po¬ 
wierzchni. Nematyk w głębi warstwy zostanie zdefor¬ 
mowany w sposób ciągły z wytworzeniem układu 
śrubowego, zupełnie podobnego do struktury chole¬ 
sterolowej (ćwierć skoku śruby). Opisana tekstura jest 
obecnie najczęściej stosowana w układach elektro- 
optycznych. 

Prostopadłe ustawienie molekuł względem po¬ 
wierzchni ograniczających warstwę ciekłego kryształu 
nosi nazwę tekstury homeotropowej. Teksturę tę 
można wytworzyć w nematykach i smektykach. 

Tekstura, która występuje tylko w cholesterolo¬ 
wych ciekłych kryształach i która jest niezbędna, jeśli 
chcemy wykorzystać oryginalne własności optyczne 
i termooptyczne tych substancji, nosi nazwę tekstury 
planarnej Grandjeana. Molekuły w warstwie chole¬ 
sterolowej o tej teksturze pozostają stale równoległe 
do powierzchni ścianek ograniczających, zaś ich kie¬ 
runek w przestrzeni ulega zmianie zgodnie ze spon¬ 
tanicznym skręceniem śrubowym struktury choleste¬ 
rolowej. Innymi słowy, tekstura Grandjeana to takie 
uporządkowanie, w którym oś linii śrubowej jest 
zawsze prostopadła do płaszczyzny podłoża. 

Wreszcie ostatnią teksturą, o której tutaj wspomni¬ 
my, jest tekstura konfokalna, tworzona przez smekty- 
ki i cholesterolowe ciekłe kryształy. Substancje e 
wskutek warstwowej budowy mają tendencję do gru¬ 
powania się w makroskopowe bryłki o dość skompli¬ 
kowanych kształtach. Kształt tych bryłek wynika ze 
współogniskowego '(konfokalnego) połączenia elips 
i hiperbol i stąd nazwa tej tekstury. Cienka warstwa 
ciekłego kryształu, w której została wytworzona tek¬ 
stura konfokalna, ma mleczne, silne zmętnienie, zni¬ 
kające, gdy ciekły kryształ zostanie przeprowadzony 
w dowolną inną teksturę. 
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Niektóre zagadnienia optyki ciekłych 
kryształów 


Ciekłe kryształy są cieczami dwójłomnymi optycznie. 
Znaczy to, że ich współczynnik załamania światła za¬ 
leży od kierunku drgań wektora elektrycznego fali 
świetlnej względem osi optycznej cienkiej warstwy 
ciekłego kryształu. Stanowi to curiosum, ponieważ 
żadne inne ciecze nie wykazują dwójomności, jeżeli 
nie są poddane specjalnym działaniom deformującym. 

Kiedy dwie płytki szklane, między którymi znaj¬ 
duje się cienka warstwa planarnie zorientowanego 
nematyka, umieścimy między dwoma skrzyżowanymi 
polaroidami, to początkowo ciemne pole widzenia zo¬ 
stanie silnie rozjaśnione. Rozjaśnienie to jest najwięk¬ 
sze wtedy, gdy kąt między osią polaroidu a kierun¬ 
kiem uporządkowania molekuł w nematyku jest rów¬ 
ny 45°, najmniejsze — gdy kąt ten jest równy zeru. 
Gdy warstwę nematyka, umieszczoną między wspom¬ 
nianymi płytkami szklanymi, zorientujemy homotro- 
powo, to pole widzenia pozostanie ciemne bez wzglę¬ 
du na obroty płytki. Widać więc, że warstwa zorien¬ 
towanego nematyka ma własności optycznie takie, jak 
płytka wycięta z kryształu jednoosiowego. Oś optycz¬ 
na jest równoległa do warstwy zorientowanej planar¬ 
nie i prostopadła do warstwy o teksturze homotropo- 
wej, czyli jest zawsze równoległa do kierunku długich 
osi molekuł w nematyku. 

Współczynnik załamania wiązki światła spolaryzo¬ 
wanego, w której drgania wektora świetlnego są rów¬ 
noległe do osi optycznej, nazywamy współczynnikiem 
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nadzwyczajnym i oznaczamy symbolem n e . Gdy drga¬ 
nia wektora świetlnego są prostopadle do osi optycz¬ 
nej, to załamanie wiązki określa współczynnik zwy¬ 
czajny, oznaczany n 0 . Kryształ jest dodatni optycznie, 
gdy tie—n<> > 0. Nematyki i smektyki są właśnie kry¬ 
ształami optycznie dodatnimi. Ujemne optycznie są 
tylko cholesterolowe ciekłe kryształy. Na rysunku 5 



Rys. 5. Zależność współczynników załamania «»iBoW PA A od 
temperatury 

przedstawiono zależność współczynników załamania 
nematyka od temperatury. Widać, że ze wzrostem 
temperatury, gdy maleje parametr uporządkowania S , 
maleje również anizotropia optyczna. 

Niezwykłe własności optyczne mają cholesterolowe 
ciekłe kryształy. Rozmieszczenie molekuł w tych sub¬ 
stancjach na linii śrubowej powoduje, że mają one bez¬ 
konkurencyjną w całej przyrodzie skręcalność płasz- 
aktywność czyzny drgań światła spolaryzowanego (aktywność 
optyczna optyczną). Jeżeli w innych substancjach aktywnych 
optycznie płaszczyzna drgań światła obraca się o kilka, 
a najwyżej o kilkanaście stopni na 1 mm drogi, to na 
tej samej drodze w cholesterolowych ciekłych kryszta¬ 
łach płaszczyzna drgań ulega skręceniu nawet o kilka¬ 
dziesiąt tysięcy stopni. Ponadto skręcalność ta może 
być łatwo sterowana przez zewnętrzne oddziaływania 
termiczne, chemiczne, elektryczne, magnetyczne i me¬ 
chaniczne. 

Piękne zabarwienie, tak charakterystyczne dla cho¬ 
lesterolowych ciekłych kryształów, jest wywołane 
odbicie przez zjawisko selektywnego odbicia światła od ich 
światła powierzchni. Długość skoku śruby cholesterolowej jest 
porównywalna z długością fali światła i padające na 
warstwę cholesterolową światło białe odbija się w po¬ 
staci wiązki, która padając na ekran daje obraz tęczy. 
Barwa światła selektywnie odbitego zależy od kąta 
padania światła białego i od kąta obserwacji. Selek¬ 
tywne odbicie ma więc charakter odbicia Bragga i jest 
podobne do odbicia promieni rentgenowskich od 
zwykłych kryształów. Barwy światła odbitego selek¬ 
tywnie są jaskrawe i czyste tylko wtedy, gdy warstwa 
odbijająca ma teksturę grandjeanowską. 

Ze śrubową strukturą cholesterolowych ciekłych 
kryształów wiąże się również zjawisko tzw. dichro¬ 
izmu kołowego. Polega ona na tym, że w warstwie 
dichroizm ciekłego kryształu, mającego teksturę planarną Grand- 
jeana, światło może rozchodzić się tylko w postaci 
wiązki spolaryzowanej kołowo. Skrętność polaryza-' 
cji kołowej jest przeciwna do skrętności śruby chole¬ 
sterolowej, tzn. że jeżeli śruba cholesterolowa jest 
lewoskrętna, to przechodzące przez warstwę światło 
jest spolaryzowane kołowo prawoskrętnie i odwrotnie. 
Jak wiadomo, światło spolaryzowane liniowo można 
rozłożyć na dwie składowe o przeciwnej polaryzacji 
kołowej. Dzięki temu wiązka światła liniowo spolary¬ 
zowanego, padająca na warstwę cholesterolowego 
ciekłego kryształu, zostanie podzielona na dwie wiązki 


kołowo spolaryzowane o przeciwnych skrętnościach, 
przy czym jedna z nich przechodzi przez ciekły krysz¬ 
tał, druga zaś zostaje całkowicie odbita. 


Anizotropia diamagnetyczna i dielektryczna. 

Anizotropia przewodnictwa elektrycznego 

Ciekłe kryształy są diamagnetykami wykazującymi 
anizotropię diamagnetyczną wynikającą, w głównej 
mierze, z istnienia w ich molekułach pierścieni benze¬ 
nowych. Diamagnetyzm pierścienia benzenowego ma 
szczególne własności: elektrony walencyjne, tworzące 
wiązanie typu n między atomami węgla mają swobodę 
ruchu w obszarze całego pierścienia, który dzięki temu 
może być przyrównany do pętli wykonanej z nadprze¬ 
wodnika. W takiej pętli zewnętrzne pole magnetyczne 
indukuje silny prąd, którego własne pole jest skiero¬ 
wane przeciwnie do pola indukującego. Pierścień ben¬ 
zenowy ma tendencję do „uciekania” z pola, czyli do 
ustawiania się tak, aby strumień pola zewnętrznego 
przez jego płaszczyznę był minimalny. Pierścień ben¬ 
zenowy przyjmuje więc położenie równoległe do linii 
sił pola. Taką właśnie orientację względem pola przyj¬ 
mują wszystkie ciekłe kryształy, złożone z molekuł 
zawierających pierścienie benzenowe. 

Anizotropię diamagnetyczną ciekłych kryształów anizotropia 
opisujemy ilościowo przez podanie różnicy podatno- diamagne- 
ści magnetycznych A% = %\\ ~X±> gdzie i x±. oznaczają tyczna 
podatności magnetyczne ciekłego kryształu, w którym 
molekuły są zorientowane — odpowiednio — równo¬ 
ległe i prostopadłe do linii sił pola magnetycznego. 

W ciekłych kryształach wartości Ax są rzędu 10“ 7 . Ze 
wzrostem temperatury wszystkie cechy anizotropowe 
ciekłych kryształów zanikają, maleje także anizotro¬ 
pia diamagnetyczna (rys. 6) 



Rys. 6. Zależność podatności magnetycznej PAA od temperatury 



Rys. 7. Zależność przenikałności elektrycznej PAA od tempe¬ 
ratury 
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anizotropia Ciekle kryształy wykazują również anizotropię di- 
dieflektryczna elektryczną, tzn. ich przenikalność elektryczna, gdy 
molekuły są ustawione równolegle do kierunku po¬ 
miarowego pola elektrycznego (£„), jest zawsze inna, 
niż przenikalność elektryczna (ąj próbki, w której 
molekuły są ustawione prostopadle do kierunku pola. 
Anizotropia dielektryczna As = s n —€j_ maleje ze 
wzrostem temperatury (rys. 7). Wartość anizotropii 
As, a nawet i jej znak, zależą także od częstości pola 
elektrycznego. 

Molekuły w ciekłych kryształach mają z reguły nie- 
zerowy trwały elektryczny moment dipolowy. Gdy 
wektor momentu dipolowego jest skierowany prosto¬ 
padle względem długiej osi molekuły, to ciekły krysz¬ 
tał w polu o małej częstości wykazuje ujemną anizo¬ 
tropię dielektryczną, czyli As = e n < 0. Takimi 
substancjami są np. PAA i MBBA (rys. 1). I odwrot¬ 
nie, kiedy wektor momentu dipolowego jest równo¬ 
legły do długiej osi molekuły, to ciekły kryształ, jak 
np. OCB, ma dodatnią anizotropię dielektryczną, czyli 

£,| — £j_ > 0 . 

Ujemna anizotropia dielektryczna jest z reguły nie¬ 
wielka, zazwyczaj mniejsza od jedności, natomiast 
wartość As w ciekłych kryształach o dodatniej anizo¬ 
tropii dielektrycznej może dochodzić nawet do 20. 

Każdy układ fizyczny osiąga stan równowagi wtedy, 
gdy jego energia swobodna jest możliwie najmniejsza. 
Jeżeli np. krawędzie okładek kondensatora powietrz¬ 
nego zetkniemy z powierzchnią dielektryka ciekłego, 
to po przyłożeniu do okładek napięcia elektrycznego 
zauważymy, że ciecz dielektryczna jest wciągana rfiię- 
dzy okładki. Kondensator „pije” tę ciecz tym obficiej, 
im więksp jest przenikalność elektryczna cieczy i im 
większe jest natężenie pola w kondensatorze. Przy 
stałym ładunku na okładkach kondensatora jego 
energia będzie odwrotnie proporcjonalna do wartości 
przenikalności elektrycznej cieczy wprowadzonej mię¬ 
dzy okładki. 

Jeżeli teraz przestrzeń między okładkami wypełnimy 
cieczą anizotropową dielektrycznie i do kondensatora 
przyłożymy napięcie, to — dzięki "tendencji układu do 
obniżania swej energii swobodnej — ciecz przyjmie 
taką konfigurację, aby pole „widziało” jej największą 
przenikalność elektryczną. Zatem ciekły kryształ 
o ujemnej anizotropii dielektrycznej ustawia się w po¬ 
lu elektrycznym tak, że długie osie molekuł są prosto¬ 
padłe do linii sił pola, powstaje tekstura planarna. 
Z kolei długie osie molekuł w ciekłych kryształach 
o dodatniej anizotropii dielektrycznej przyjmują poło¬ 
żenie równoległe do linii sił pola elektrycznego (tek¬ 
stura homeotropowa). 

Taki sposób orientowania się ciekłych kryształów 
w polu elektrycznym jest bardzo często zaburzany 
przez przepływ prądu jonowego, któremu towarzyszą 
elektrohydrodynamiczne, często bardzo burzliwe 
przepływy ciekłego kryształu. Przepływy elektro¬ 
hydrodynamiczne, towarzyszące prądowi jonowemu 
orientacja mogą powodować orientację długich osi molekuł zaw- 
molekuł sze w kierunku wektora natężenia pola elektrycznego, 
w polu niezależnie od znaku anizotropii dielektrycznej. Fakt, 
»lektrycznym że stałe pole elektryczne orientuje molekuły nematyka 
o ujemnej anizotropii dielektrycznej równolegle do 
kierunku linii sił (a nie prostopadle, jak nakazywałyby 
reguły elektrostatyki) zaobserwowany już został w wy¬ 
żej wymienionych pracach M. Jeżewskiego i M. Mię- 
sowicza. 

Uporządkowanie warstwy ciekłego kryształu przez 
zeymętrzne pole elektryczne lub magnetyczne jest 
osiągalne dopiero wtedy, gdy natężenie pola orientu¬ 
jącego przekroczy pewną wartość progową. Ta war¬ 
tość progowa zależy od wielkości anizotropii diamag- 
netycznej i dielektrycznej, od wielkości odpowiednich 
współczynników sprężystości ciekłego kryształu i od 
grubości jego warstwy. Jeżeli tę grubość oznaczymy 
przez d, to wartości progowe natężeń pola magnetycz¬ 
nego H t i pola elektrycznego E t spełniają przybliżone 
zależności H t d = C x oraz E t d = C 2 , gdzie Ci i C 2 są 
stałymi zależnymi od rodzaju ciekłego kryształu. 
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Przewodnictwo elektryczne ciekłych kryształów ma, przewodnic- 
prawie wyłącznie, charakter jonowy; ich przewodność two 
a zawarta jest przeważnie w przedziale od 10“ 8 do elektryczne 
10" 12 p^cm" 1 . Jak łatwo się domyśleć, również i prze¬ 
wodnictwo elektryczne ma w ciekłych kryształach 
charakter anizotropowy. Jeżeli przez cr„ oznaczymy 
przewodność próbki, w której jony poruszają się rów¬ 
nolegle do kierunku długich osi molekuł, zaś przez 
<?j_ przewodność uwarunkowaną ruchem jonów w kie¬ 
runku prostopadłym do tych osi, to stwierdzamy, że 
w nematykach zawsze a n > Stąd wniosek, że jony 

napotykają mniejszy opór, jeżeli ich ruch jest zgodny 
z kierunkiem długich osi molekuł. Dla określonego 
nematyka stosunek obu przewodności jest zazwyczaj 
bliski 1,5 i niewiele zależy od ich wartości. 

W smektykach relacja między przewodnościami jest 
odwrotna. W tych ciekłych kryształach ruch jonów 
jest łatwiejszy wzdłuż warstw smektycznych, a nie 
wzdłuż długich osi molekuł (jak pamiętamy, molekuły 
w smektykach są prostopadłe lub prawie prostopadłe 
do warstw). Wobec tego w smektykach przewodność 
elektryczna ffj, < <r ± . 


Orientacja molekuł na granicy ciekły 
kryształ-ciało stale 

Ciekłe kryształy są jedynymi substancjami, których 
własności optyczne mogą być radykalnie zmieniane 
już przez słabe oddziaływania powierzchniowe. Ich 
ciekłość, dalekie uporządkowanie molekularne i ani¬ 
zotropia optyczna powodują, że dokładnie odwzoro¬ 
wują one stany powierzchni ciał stałych i pozwalają te 
stany wizualizować. Ta zdolność ciekłych kryształów 
została wykorzystana do wytwarzania określonych 
tekstur molekularnych, głównie w cienkich warstwach 
wchodzących w skład elementów elektrooptycznych. 

Odpowiednia obróbka powierzchni szkła, półprze¬ 
wodnika czy metalu może spowodować, że molekuły 
ciekłych kryształów będą przyjmowały położenie rów¬ 
noległe do tych powierzchni i będą leżały w wyznaczo¬ 
nym kierunku lub też będą do tych powierzchni pro- wytwarzanie 
stopadłe. W pierwszym wypadku wytwarzamy tekstu- tekstury 
rę planarną, w drugim zaś — homeotropową. planarnej 

Teksturę planarną można uzyskać przez jednokie¬ 
runkowe polerowanie powierzchni ciał stałych papie¬ 
rem, tkaniną itp. lub przez ukośne napylanie warstw 
dielektryków i metali. Mikrorowki, powstające na po¬ 
wierzchniach w czasie polerowania lub też wydłużone 
wysepki substancji napylanych ukośnie ustawiają mo¬ 
lekuły ciekłego kryształu, naniesionego na tak przy¬ 
gotowaną powierzchnię, w kierunku równoległym do 
kierunku polerowania lub napylania. Molekuły kon¬ 
taktujące się z powierzchnią stałą pociągają za sobą 
molekuły z wnętrza warstwy ciekłokrystalicznej tak, wytwarzanie 
że jednorodnie zorientowana warstwa może mieć tekstury ho- 
grubość nawet 1 mm. meotropowej 

Aby wytworzyć teksturę homeotropową należy 
spowodować, aby pierwsza warstwa molekuł, kon¬ 
taktująca się z powierzchnią ciała stałego, przyjmowa¬ 
ła względem tej powierzchni położenie prostopadłe. 

W tym celu na powierzchnię stałą nanosi się bardzo 
cienką warstewkę substancji o wydłużonych mole¬ 
kułach, mających na jednym końcu grupę polarną, 
pn. warstewkę lecytyny lub odpowiedniego detergen¬ 
tu. Grupa ta wiąże się z powierzchnią podłoża, reszta 
zaś molekuły wystaje prostopadle nad powierzchnią. 

Molekuły ciekłego kryształu naniesionego na tak przy¬ 
gotowaną powierzchnię ustawiają się równolegle do 
molekuł warstwy inicjującej, tworząc teksturę homeo¬ 
tropową. 

Ciekłokrystaliczne urządzenia elektrooptyczne dzia¬ 
łają głównie na zasadzie deformowania za pomocą 
pola elektrycznego tekstury ciekłego kryształu, na¬ 
rzuconej przez opisane oddziaływania powierzchnio¬ 
we. Po ustaniu działania pola te same oddziaływania 
powierzchniowe przywracają pierwotną teksturę war¬ 
stwie ciekłego kryształu. 
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Rys. 8. Położenie 
molekuł nematyka 
względem porusza¬ 
jącej się płytki przy 
wyznaczaniu trzech 
współczynników le¬ 
pkości 


Anizotropia lepkości. Trzy główne 
współczynniki lepkości nematyków 

Pomiary wpływu orientacji molekuł w ciekłych kry¬ 
ształach na współczynniki lepkości tych substancji 
prowadzone były już dawno. Stosowano wtedy trady¬ 
cyjne metody wiskozymetryczne. Badano m.in. wpływ 
silnego pola magnetycznego, o indukcji rzędu 1 T, na 
prędkość przepływu cieczy nematycznych przez rurki 
kapilarne o średnicy ok. 0,1 mm. Wyniki tych ekspe¬ 
rymentów, wskutek wadliwego doboru warunków, 
były jednak negatywne: włączanie pola, prostopadłe¬ 
go do osi przepływu, nie zmieniało prędkości cieczy 
w kapilarze. Jeszcze w r. 1934 twierdzono, że orienta¬ 
cja molekuł nie ma wpływu na współczynnik lepkości. 

W 1933 r. w Krakowie M. Mięsowicz podjął syste¬ 
matyczne badania własności Teologicznych ciekłych 
kryształów. Wysunął rewolucyjną wówczas ideę ani¬ 
zotropii lepkości tych substancji, a następnie w opra¬ 
cowanym przez siebie bardzo pomysłowym i oryginal¬ 
nym eksperymencie wykrył tę anizotropię i zmierzył 
odpowiednie współczynniki lepkości. Zastosował spe¬ 
cjalną technikę pomiaru, której nowość polegała na 
przyjęciu prostokątnej geometrii przepływu i na za¬ 
stosowaniu bardzo małych gradientów prędkości. 
Zbudowano urządzenie, w którym cienka płytka 
szklana (0,1 mm) o powierzchni kilku cm 2 była zawie¬ 
szana w ciekłokrystalicznym PAA lub /7-azoksyfene- 
tolu. Płytka mogła wykonywać bardzo powolne wa¬ 
hania w płaszczyźnie pionowej (rys. 8). Z wielkości 
tłumienia wahań można było wyznaczyć odpowiednie 
współczynniki lepkości. Badana ciecz była orientowa¬ 
na przez zewnętrzne pole magnetyczne. W odróżnie¬ 
niu od poprzednich rezultatów stwierdzono bardzo 
silny wpływ pola magnetycznego na lepkość obu ciek¬ 
łych kryształów. Określono trzy różne współczynniki 
lepkości: — gdy molekuły leżały wzdłuż poruszają¬ 
cej się płytki, rj 2 — gdy były ustawione do niej prosto¬ 
padle, i 7 ] 3 — gdy leżały w poprzek tej płytki. Z pomia¬ 
rów dla PAA (w temperaturze 122°C) uzyskano war¬ 
tości: = 2,4m*Pa-s, r\ z = 9,2 m-Pa-s, = 3,4 m* 

•Pa-s. Jak widać, anizotropia współczynnika lepkości 
jest bardzo duża (W^h ~ 4). Okazało się, że jest naj¬ 
większą ze wszystkich anizotropii. Poprzednio obser¬ 
wowany brak efektu przy przepływie przez cienkie 
kapilary w porównaniu z tymi rezultatami był do¬ 
wodem silnej orientacji powodowanej przez przepływ 
z gradientem prędkości. 

W ostatnich latach została stworzona ogólna hydro¬ 
dynamika teoretyczna ciekłych kryształów, oparta na 
modelu continuum. W równaniach tej hydrodynami¬ 
ki występuje sześć współczynników Lesliego. Za ich 
pomocą można wyrazić trzy współczynniki lepkości 
Mięsowicza, bo tak są nazywane w literaturze współ¬ 
czynniki rj u rj z i 7j iy a także inne współczynniki lepkości 
występujące przy skomplikowanych deformacjach 
ciekłych kryształów. 


Kilka zagadnień dynamiki 

W ostatnich latach (po 1965 r.) okazało się, że wiele 
ciekawych zjawisk z fizyki ciekłych kryształów można 
opisać ilościowo przy użyciu przedstawionej wyżej 
anizotropii lepkości. Chodzi tu o szeroki zakres zja¬ 
wisk, w których rolę odgrywają ruchy molekularne, 
w tym głównie: rozpraszanie światła; anizotropia 
absorpcji i anizotropia prędkości fal ultradźwięko¬ 
wych; orientacja przez ruch cieczy; orientacja przez 
przepływ prądu elektrycznego; przewodnictwo ciepl¬ 
ne; dyfuzja i samodyfuzja. 

Ze względu na ograniczone ramy tego artykułu, dla 
przykładu zajmiemy się tylko zjawiskiem rozprasza¬ 
nia światła oraz zjawiskiem samodyfuzji. 
rozpraszanie Niedawno stwierdzono, że rozpraszanie światła na 
światła ciekłych kryształach nematycznych daje wiele cieka¬ 
wych informacji na temat ich struktury. Okazało się 
taicże, co jest pewną niespodzianką, że badanie roz¬ 


praszania światła potwierdza zasadnicze założenia 
hydrodynamiki ciekłych kryształów. Ruch termiczny 
molekuł powoduje wystąpienie fluktuacji wektora 
uporządkowania (dyrektora), te zaś — dzięki istnie¬ 
niu anizotropii optycznej ciekłych kryształów — dają 
silne ropraszanie i depolaryzację światła. Fluktuacje 

wektora orientacji, będącego funkcją położenia r 
i czasu t, możemy zapisać w prosty sposób: 

n(r,t) = no+ón(r,t). 

Odchylenie Sn(r, f), jest właśnie miarą fluktuacji i ma 
silny wpływ na natężenie światła rozpraszanego pod 
określonym kątem. Schemat aparatury do pomiaru pomiary 
natężenia światła rozproszonego użytej w Laborato- rozpraszania 
Tium w Orsay jest przedstawiony na rys. 9. światła 


fotopowielacz 



Rys. 9. Aparatura do pomiaru rozpraszania światła w ciekłych 
kryształach (Laboratorium Orsay). Źródłem światła jest laser: 
fotopowielacz rejestruje natężenie światła rozproszonego pod 
określonym kątem 


Pomiary rozpraszania światła pozwoliły znaleźć 
w niezależny sposób wartości współczynników tj u 
i rj z . Z pomiarów tych wynikają interesujące wnioski 
na temat struktury cieczy nematycznych, które przede 
wszystkim pozwalają poddać w wątpliwość słuszność 
modelu domenowego nematyków. 

Nie będziemy zajmować się tutaj szczegółowo za¬ 
gadnieniem absorpcji fal ultradźwiękowych w ciekłych 
kryształach. Zwrócimy tylko uwagę, że badania te, 
przeprowadzone przy częstościach rzędu kilku 
MHz, dały w wyniku takie same wartości r\ z i rj z , 
jakie zostały otrzymane wcześniej metodami w zasa¬ 
dzie statycznymi. Mechanizm przekazywania pędu 
między molekułami jest zatem identyczny w bardzo 
szerokim zakresie częstości. 

Samodyfuzja jest szczególnym rodzajem dyfuzji, samodyfuzja 
w której jedne molekuły ulegają przemieszczeniu w nematy- 
wśród innych molekuł tej samej substancji. W Krako- kach 
wie, w zespole kierowanym przez J. Janika i od dawna 
specjalizującym się w badaniach strukturalnych i w fi¬ 
zyce molekularnej, podjęto intensywne prace nad za¬ 
gadnieniem ciekłych kryształów. W szczególności ze¬ 
spół zajął się problemem samodyfuzji w nematykach. 

Do badań samodyfuzji zastosowano metodę kwazi- 
elastycznego rozpraszania neutronów. Wiązka powol¬ 
nych neutronów o określonej energii, wysyłanych np. 
przez reaktor jądrowy, po rozproszeniu na badanej 
próbce daje tzw. linię, której rozmycie zależy od nie¬ 
uporządkowanych ruchów molekuł w próbce. Zgod¬ 
nie z opisem teoretycznym, dyfuzja prostopadła, w 
której molekuły przemieszczają się prostopadle do 
kierunku orientacji, opisywana współczynnikiem D ±9 
jest powolniejsza od dyfuzji równoległej ze współczyn¬ 
nikiem dyfuzji Z),,, w której molekuły przemieszczają 
się równolegle względem siebie. Zespół J. Janika 
stwierdził doświadczalnie, że istotnie zachodzi za¬ 
leżność D n > D ± . 
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Zastosowanie ciekłych 
kryształów 



Rys. 10. Dyna¬ 
miczne rozprasza¬ 
nie światła w nema- 
tykach. Analogicz¬ 
ny efekt występuje 
także przy orienta¬ 
cji molekuł prosto¬ 
padle dc po¬ 
wierzchni elektrod 


Niezwykłe zainteresowanie, jakie budzą obecnie ciekłe 
kryształy, jest spowodowane ich przydatnością w wie¬ 
lu gałęziach nauki i techniki. Prace oryginalne i arty¬ 
kuły przeglądowe na temat własności i zastosowań 
ciekłych kryształów ukazują się w książkach i czaso¬ 
pismach z dziedziny fizyki, elektroniki, chemii, biolo¬ 
gii, farmacji, medycyny, techniki materiałowej itd. 

Jak dotychczas, szerokie zastosowania znalazły 
prawie wyłącznie nematyki i cholesterolowe ciekłe 
kryształy, chociaż ostatnio prowadzi się badania rów¬ 
nież nad zastosowaniem smektyków. 

Przede wszystkim wykorzystuje się egzotyczne po¬ 
łączenie w ciekłych kryształach anizotropii optycznej 
i cech ciekłości, dzięki którym dają się one łatwo 
orientować lub deformować pod wpływem najróżno¬ 
rodniejszych oddziaływań zewnętrznych. 

W odczytnikach stosowanych w zegarkach elektro¬ 
nicznych, minikalkulatorach, ekranach radarowych 
z pamięcią, elektrooptycznych urządzeniach pamię¬ 
ciowych itd. wykorzystuje się różnorodne zjawiska 
elektrooptyczne. Początkowo do tych celów wykorzy¬ 
stywano zjawisko dynamicznego rozpraszania światła 
(rys. 10). Między dwie płytki szklane, pokryte przewo¬ 
dzącymi warstwami tlenku cyny Sn0 2 lub tlenku indu 
ln 2 0 3 , wprowadzano cienką warstwę nematyka o gru¬ 
bości ok. 30 pm. Nematyk był zorientowany homeo- 
tropowo lub planarnie i był zupełnie przezroczysty. 
Kiedy do elektrod przykładano napięcie, to płynący 
prąd jonowy burzył pierwotne uporządkowanie i war¬ 
stwa nematyka stawała się mleczno biała. Gdy war¬ 
stwa tlenkowa na jednej z elektrod była wytrawiona 
w kształcie siedmiosegmentowego pola numerycznego, 
jak na rys. 11, to po przyłączeniu napięcia do odpo¬ 



wiednich segmentów otrzymywano zobrazowanie żą¬ 
danej cyfry w postaci mlecznej figury na przezroczy¬ 
stym tle. Jednakże w czasie działania odczytnika tego 
typu przebiegają szkodliwe procesy elektrochemiczne, 
powodujące stopniowy rozkład chemiczny ciekłego 
kryształu, toteż obecnie technikę dynamicznego roz¬ 
praszania prawie całkowicie zarzucono. 

W późniejszych rozwiązaniach odczytników ma¬ 
teriał i kształt elektrod pozostały w zasadzie bez 
zmian, zmienił się jednak sposób oddziaływania na 
ciekły kryształ. Obecnie prawie wyłącznie stosuje się 
elektrostatyczne sterowanie warstwą ciekłego kryszta¬ 
łu. Przewodzącą warstwę tlenkową oddziela się od 
ciekłego kryształu bardzo cienką powłoką napylone¬ 
go dielektryka, co eliminuje przepływ prądu jonowe¬ 
go, ale nie przeszkadza we wnikaniu pola elektrycz¬ 
nego do wnętrza warstwy ciekłego kryształu. W tak 
uformowanych komórkach wykorzystuje się w zasa¬ 
dzie cztery efekty elektrooptyczne lub ich modyfika¬ 
cje: 


1) Komórkę, w której nematyk o ujemnej anizotro- elektrosta- 
pii dielektrycznej jest zorientowany homeotropowo tyczne 
przez oddziaływania powierzchniowe, umieszcza się sterowanie 
między skrzyżowanymi polaroidami. Przed przyłoże¬ 
niem napięcia pole widzenia jest ciemne. Włączenie 

napięcia do odpowiednich segmentów powoduje ich 
rozjaśnienie (nematyk o ujemnej anizotropii dielek¬ 
trycznej orientuje się prostopadle do linii sił pola elek¬ 
trycznego). 

2) Między skrzyżowanymi polaroidami umieszcza 
się komórkę zawierającą warstwę planarnie zoriento¬ 
wanego nematyka o dodatniej, tym razem, anizotropii 
dielektrycznej. Ponieważ molekuły takiego nematyka 
orientują się równolegle do kierunku pola elektrycz¬ 
nego, to jednorodne i jasne początkowo pole widze¬ 
nia ulega zaciemnieniu po włączeniu napięcia. 

3) Jeżeli w komórce umieszczonej jak w punkcie 2) 
wytworzymy teksturę skręconego nematyka, która ma 
własność skręcania o 90° płaszczyzny drgań światła 
spolaryzowanego, to pole widzenia między skrzyżowa¬ 
nymi polaroidami będzie początkowo jasne. Po włą¬ 
czeniu napięcia molekuły nematyka orientują się rów¬ 
nolegle do kierunku pola, tekstura śrubowa skręcone¬ 
go nematyka zostaje zniszczona i zamieniona w teks¬ 
turę homeotropową. Znika zdolność skręcania płasz¬ 
czyzny drgań i pole widzenia ulega zaciemnieniu. 

Opisany efekt jest obecnie najczęściej wykorzystywa¬ 
ny w konstrukcjach odczytników ciekłokrystalicz¬ 
nych. 

4) Pod działaniem pola elektrycznego zachodzi indu¬ 
kowana przemiana fazowa cholesterolowego ciekłego 
kryształu w nematyk. Jeżeli warstwa cholesterolowa 
o dodatniej anizotropii dielektrycznej i teksturze kon- 
fokalnej zostanie poddana działaniu pola elektrycz¬ 
nego, to molekuły, dążąc do ustawienia się równo¬ 
legle względem kierunku pola, wytworzą teksturę 
homeotropową, a tym samym cholesterolowy ciekły 
kryształ ulegnie przemianie w nematyk. Mleczna bia¬ 
łość warstwy, wywołana istnieniem tekstury konfo- 
kalnej, zniknie i warstwa będzie zupełnie przezroczy¬ 
sta tak długo, jak długo będzie działało pole sterujące. 

Odczytniki ciekłokrystaliczne, których działanie 
oparte jest na opisanych efektach elektrooptycznych, 
nadają się szczególnie dobrze jako układy pośredniczą¬ 
ce między mikrominiaturowymi urządzeniami elektro¬ 
nicznymi a człowiekiem. Ich sterowanie odbywa się 
na drodze elektrostatycznej przy napięciach rzędu kil¬ 
ku woltów i praktycznie bezprądowó, mogą więc 
współpracować z układami logicznymi bez użycia 
wzmacniaczy. 

Cenną, z punktu widzenia zastosowań, własnością zdolność 
ciekłych kryształów jest ich zdolność orientowania orientowania 
molekuł innych substancji. Jeżeli substancja rozpusz- innych 
czona w ciekłym krysztale ma wydłużone molekuły, molekuł 
to zostaną one zorientowane zgodnie z kierunkiem 
molekuł ciekłego kryształu. Ten efekt jest wykorzysty¬ 
wany do orientacji długich molekuł w czasie ich bada- , 

nia metodami spektroskopii EPR i NMR (-* Spektro¬ 
skopia rezonansów magnetycznych), do tworzenia 
polimerów o zorientowanym usieciowaniu oraz w 
chromatografii gazowej do rozdzielania stereoizome- 
rów wielu substancji. Uporządkowane roztwory sub¬ 
stancji o długich molekułach można przeprowadzić 
w stan stały bez naruszenia uporządkowania ciekło¬ 
krystalicznego. Dokonuje się tego przez gwałtowne 
oziębienie roztworu do temperatury ciekłego azotu, 
w której następuje zamrożenie stanu orientacji. 

Bardzo ciekawe zastosowanie znalazł efekt wzajem- ciekłe 
nego oddziaływania orientującego między ciekłym ferromag- 
kryształem i bardzo drobnymi ziarnami ferromagne- netyki 
tyka. Koloidalne mieszaniny ciekłego kryształu i roz¬ 
pylonego magnetytu mają własności ciekłego ferro- 
magnetyka. Ciecze takie dają się namagnesować, są 
przyciągane przez magnes itd. 

Łatwość zmiany orientacji molekularnej w ciekłych 
kryształach została wykorzystana do badań stanu po¬ 
wierzchni ciał stałych. Niektóre ciekłe kryształy mają 
zdolność spontanicznego tworzenia tekstur homeo- 
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badania tropowych, czyli ich molekuły samorzutnie przyjmują 
powierzchni położenie prostopadłe do powierzchni ciał stałych. Je¬ 
żeli taka powierzchnia ma obszary o innym ładunku 
elektrycznym czy o innym składzie chemicznym, to 
tekstura homeotropowa zostanie w tych obszarach za¬ 
burzona. Zaburzenie to łatwo wykrywać przez obser¬ 
wację warstwy ciekłego kryształu w świetle spolaryzo¬ 
wanym. 

efekt Kerra Spośród efektów optycznych w nematykach należy 
jeszcze wymienić efekt Kerra, czyli pojawienie się 
dwójłomności optycznej w cieczach pod działaniem 
pola elektrycznego o dużym natężeniu. Substancje 
nematyczne w temperaturze, w której znajdują się w fa¬ 
zie izotropowej, mają bardzo dużą stałą Kerra. Stero¬ 
wanie elementami elektrooptycznymi, działającymi 
na zasadzie efektu Kerra jest jednak utrudnione przez 
konieczność stosowania wysokich napięć. 

Długość skoku linii śrubowej w strukturze chole¬ 
sterolowej, decydująca o barwie światła selektywnie 
odbitego, zależy w istotny sposób od temperatury, 
składu chemicznego ciekłego kryształu, od działania 
pól elektrycznych i magnetycznych, a także od oddzia- 
termografia ływaó mechanicznych. Stwarza to pole do wielu za¬ 
stosowań, przede wszystkim w termografii. 

Można komponować mieszaniny cholesterolowych 
ciekłych kryształów tak, aby barwa selektywnego od¬ 
bicia pojawiała się w ściśle określonej temperaturze, 
a ponadto można regulować zakres temperatur, w ja¬ 
kim barwa powinna zmienić się od czerwonej do fio¬ 
letowej. Można np. uzyskać taką mieszaninę, aby 
barwa czerwona przypadała w temperaturze 34°C, zaś 
barwa fioletowa w 36°C. Jeżeli taką mieszaniną po¬ 
kryjemy fragment skóry człowieka, np. rękę, to otrzy¬ 
mamy barwną mapę rozkładu temperatury na skórze, 
jak to pokazano na il. 24 (tabl. 8). Można wytwo¬ 
rzyć mieszaniny, w których przedział między pojawie¬ 
niem się barwy czerwonej i fioletowej wynosi zaledwie 
0,5°C. Warstwy takich czułych termicznie mieszanin 
stosuje się do budowy noktowizorów, do otrzymywa¬ 
nia hologramów w zakresie podczerwieni i mikrofal, 
do wykrywania defektów materiałów, do badań mo¬ 
deli lotniczych itd. 

Barwa selektywnego odbicia zależy także od obec¬ 
ności w powietrzu par wielu substancji organicznych. 
Fakt ten wykorzystuje się do wykrywania zanieczysz¬ 
czeń toksycznych powietrza, do analizy zapachów 
(sztuczny nos) itp. 

Wymienione zastosowania stanowią tylko przykła¬ 
dy najpopularniejsze. Z nowszych zastosowań może¬ 
my tutaj jedynie zasygnalizować wykorzystywanie 
ciekłych kryształów do budowy laserów cieczowych, 
do konstrukcji światłowodów i filtrów optycznych, do 
wykonywania siatek dyfrakcyjnych i do badań topo¬ 
grafii powierzchni ciał stałych metodą interferencji 
światła w cienkich warstwach cholesterolowych ciek¬ 
łych kryształów. 


Ciekle kryształy w strukturach 
biologicznych 


Zjawisko życia jest niezaprzeczalnie najbardziej skom¬ 
plikowanym zespołem procesów fizycznych i chemicz¬ 
nych przebiegających w ośrodkach ciekłych. Wielu 
z tych elementarnych procesów fizykochemicznych 
jeszcze nie znamy, podobnie jak często nie znany, czy 
nawet obecnie nie przeczuwany, jest charakter łańcu¬ 
cha związków przyczynowo-skutkowych między tymi 
procesami. 

Znaczna część substancji, z których zbudowane śą 
organizmy żywe, ma strukturę ciekłokrystaliczną i dla¬ 
tego bez ciekłych kryształów życie w ogóle nie byłoby 
możliwe. W żywych komórkach ciekłe kryształy wystę¬ 
pują przede wszystkim jako elementy strukturalne 
błon biologicznych, ale także jako roztwory wydłużo¬ 
nych makromolekuł i wirusów. 


Ciekłe kryształy są cieczami, w których molekuły 
są w znacznym stopniu względem siebie uporządko¬ 
wane, i dlatego obecność struktur ciekłokrystalicz¬ 
nych w błonach biologicznych narzuca błonom celową 
organizację, dostosowaną do ich funkcji w żywej ko¬ 
mórce. Jednocześnie ciekłość takiego układu upo¬ 
rządkowanego zapewnia błonom dużą elastyczność 
i podatność na oddziaływania zewnętrzne, a także 
— łatwy transport odpowiednich substancji oraz wy¬ 
mianę zużytych lub uszkodzonych fragmentów. 

To, że błony biologiczne istotnie zawierają struktu¬ 
ry ciekłokrystaliczne, zostało stwierdzone metodami 
dyfrakcji promieniowania rentgenowskiego, elektro¬ 
nowego rezonansu paramagnetycznego oraz kalory- 
metrii różnicowej, a także na podstawie badania prze¬ 
mian fazowych wywołanych termicznie w lipidach 
i w błonach. 

Bazę strukturalną każdej błony biologicznej, stano¬ 
wi podwójna warstwa molekuł lipidów, uporządkowa¬ 
nych względem siebie tak jak molekuły w ciekłym 
krysztale smektycznym. Podwójne warstwy lipidowe 
powstają spontanicznie dzięki szczególnej budowie 
molekuł tych substancji, określającej ich zachowanie 
się w kontakcie z rozpuszczalnikiem (-> Błony ko¬ 
mórkowe). 

Wzajemne rozpuszczanie się substancji określa za¬ 
sada „swój do swego”, tzn. że substancje polarne są 
dobrze rozpuszczalne tylko w rozpuszczalnikach po¬ 
larnych i odwrotnie. Tak np. alkohol metylowy 
CH s OH lub kwas octowy CH 3 COOH, dzięki polar¬ 
nym grupom —OH i —COOH, rozpuszczają się 
dobrze w wodzie — rozpuszczalniku silnie polarnym. 
Parafina, złożona głównie z niepolamych węglowo¬ 
dorów, nie rozpuszcza się w wodzie, jest natomiast 
dobrze rozpuszczalna w niepolamym benzenie. Takie 
substancje jak alkohol metylowy i kwas octowy nazy¬ 
wamy substancjami hydrofilowymi (lubiącymi wodę), 
zaś węglowodory — substancjami hydrofobowymi 
(obawiającymi się wody). Gdy jednak w molekułach 
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Rys. 12. Molekuły substancji amfifilowych mają polarną głów¬ 
kę i długi ogon niepolarny. Budowa molekuł: a) mydła, b) lipidu 
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kwasów i alkoholi wzrasta długość łańcucha węglowo¬ 
dorowego, to hydrofobowe działanie tego łańcucha 
równoważy hydrofilowe działanie grupy polarnej i ta¬ 
kie substancje — mające obojnacze cechy rozpuszczal¬ 
ności — nazywamy substancjami amfifilowymi. Typo¬ 
wymi substancjami amfifilowymi, poza wymieniony¬ 
mi już długołańcuchowymi kwasami i alkoholami, są 
również mydła (sole kwasów tłuszczowych, rys. 12a) 
oraz właśnie lipidy (rys. 12b). Wspólną cechą molekuł 
tych związków jest posiadanie przez nie polarnej głów¬ 
ki i jednego lub dwu długich ogonów mepolarnych. 

Po dodaniu do substancji amfifilowej niewielkiej 
ilości wody powstaje uporządkowana struktura ciekło¬ 
krystaliczna. Woda zostaje podzielona na bardzo cien¬ 
kie warstewki lub nici, otoczone ze wszystkich stron 
przez grupy polarne molekuł amfifilowych. Otrzyma¬ 
ny ciekły kryształ, zbudowany z kulistych lub wydłu¬ 
żonych miceli, zawierających rdzeń wodny (rys. 13a), 
lub z cienkich płytek, zwanych lamelami (rys. 13b), 





Rys. 13. Substancje amfifilowe tworzą z wodą okrągłe lub 
wydłużone mi cele (a) oraz płytkowe la mele (b) 

nazywamy ciekłym kryształem liotropowym, czyli 
powstającym pod wpływem działania rozpuszczalni¬ 
ka. Pojedyncze liotropowe lamele, takie jak na rys. 
13b, stanowią bazę strukturalną błon biologicznych, 
połączenia Ciekłokrystaliczny, dwuwarstwowy szkielet błon 
z białkami biologicznych, w którym molekuły lipidów są zwró¬ 
cone ku sobie łańcuchami węglowodorowymi, tworzy 
skomplikowane połączenia z białkami. Substancje 
białkowe o różnej konformacji pokrywają błonę z obu 
stron i w wielu miejscach ją przenikają. Białka umiesz¬ 
czone w błonie spełniają wiele różnorodnych funkcji 
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biologicznych, a poza tym dzięki ich obecności błona 
staje się sztywniejsza, struktura zaś ciekłokrystaliczna 
lipidów nie ulega zniszczeniu pod wpływem nadmiaru 
wody. Przypuszcza się (model Brockerhoffa), że dzia¬ 
łanie białek polegające na utrwalaniu struktury ciekło¬ 
krystalicznej błon jest rezultatem wiązań wodoro¬ 
wych, jakie powstają między grupami karbonylowymi 
fosfolipidów i sfingolipidów jako akceptorami a biał¬ 
kami, cholesterolem i wodą — jako donorami wodo¬ 
ru. Mimo usztywniającego działania białek, błona ma 
ciągle naturę cieczową. Świadczy o tym duża ruchli¬ 
wość molekuł białek w błonie, a także ruchliwość anty¬ 
genów i molekuł lipidów w płaszczyźnie błony. 

Badania spektroskopowe, rentgenograficzne i ter- 
mograficzne dowiodły, że lipidy mogą tworzyć nie 
tylko liotropowe, lecz także termotropowe fazy mezo- 
morficzne, tzn., że przechodzą w stan cieczy anizotro¬ 
powej także bez udziału wody i jedynie pod wpływem 
ogrzewania. Termotropowe przejścia tych substancji 
do fazy mezomorficznej występują jednak w wysokich 
temperaturach i wszystkie ciekłe kryształy, spotykane 
w organizmach żywych, mają bez wyjątku charakter 
liotropowy, wynikający z oddziaływań lipidów z wo¬ 
dą. Usunięcie wody z błon powoduje, że lipidy prze¬ 
chodzą w stan krystaliczny, co oznacza przerwanie 
procesów życiowych w komórkach. Lipidy, kwasy 
nukleinowe i proteiny są aktywne biologicznie tylko 
w obecności wody i odwodnienie powoduje śmierć ko¬ 
mórki, mimo że jej skład chemiczny pozostanie nie 
zmieniony. 

Ciekłe kryształy liotropowe, zawarte w strukturach 
biologicznych, ulegają również przemianie w zwykłą 
ciecz po ich odpowiednim podgrzaniu. Interesujące 
jest, że temperatura przejścia w stan cieczy izotropo¬ 
wej wielu liotropowych ciekłych kryształów lipidów 
i wody wynosi 41 °C, a powyżej tej temperatury, już 
niebezpiecznej dla człowieka, ustają mechanizmy ko¬ 
mórkowe u wielu pierwotniaków i organizmów wielo¬ 
komórkowych. Widać więc, że procesy życia ulegają 
zahamowaniu nie tylko wtedy, gdy lipidy przechodzą 
w stan krystaliczny, lecz także wtedy, gdy znajdą się 
one w fazie cieczy izotropowej. 

Inną, szczególnie ważną dla struktur błonowych 
substancją jest cholesterol. Prawdopodobnie mole¬ 
kuły cholesterolu przyjmują położenie równoległe 
względem molekuł lipidów, jak to przedstawiono na 
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rysunku 14, i przez osłabienie oddziaływań między 
łańcuchami węglowodorowymi utrzymują ciekłokry¬ 
staliczny charakter membran w dużym przedziale 
temperatur. 

Relacje między ciekłokrystalicznym szkieletem błon 
biologicznych i lekami stanowią ważny problem far¬ 
makologiczny. Na przykład dobra rozpuszczalność 
leki w lipidach jest, jak stwierdzono, warunkiem aktyw- 
działające ności leków działających na układ nerwowy. Środki 
na układ usypiające i znieczulające, leki psychotropowe i nar- 
nerwowy kotyki działają na układ nerwowy poprzez ingerencję 
w strukturę i funkcje jego cienkich błon ciekłokrysta¬ 
licznych. Jedne z tych substancji mogą unieruchamiać 
kationy K + , Na + i Ca++, przez co znoszą lub znacznie 
upośledzają przenoszenie sygnałów elektrycznych w 
nerwach, inne zaś, jak np. znany narkotyk LSD, wy¬ 
wołują lokalne zmiany w uporządkowaniu lipidów 
w błonach, prowadzące do niekontrolowanych, halu¬ 
cynogennych reakcji systemu nerwowego. 

Obecnie przypuszcza się, że również powstanie ko¬ 
mórek tkanek nowotworowych związane jest ze zmia¬ 
nami w strukturze błon, ponieważ w komórkach tych 
zanika zdolność reagowania na sygnały przychodzące 
od komórek otaczających. Komórki rakowate „tę¬ 
pieją”, w dużym stopniu zatracają specjalizację i roz¬ 
mnażają się w sposób nie kontrolowany. Zmiany te 
mogą być spowodowane przez czynniki chemiczne, 
mechaniczne, przez działanie wirusów itd. 
biofizyczne Badania błon lipidowych i uporządkowanych ukła- 
modele dów makromolekuł dostarczają więcej informacji 
ciekło- o istocie życia niż jakikolwiek inny dział nauki. Dla- 
krystaliczne tego duże znaczenie przypisuje się badaniom modeli 
błon biologicznych wytworzonych sztucznie w postaci 
podwójnych warstw lipidowych. Warstwy takie 
umieszcza się jako przegrody między dwoma roztwo¬ 
rami elektrolitów, zaś mechanizmy przewodzenia, se¬ 
lektywność jonową oraz działanie określonych domie¬ 
szek bada się przez pomiar natężenia prądu oraz asy¬ 
metrii przewodnictwa w funkcji napięcia i w zależ¬ 
ności od składu obu roztworów. 

Nowe możliwości stwarza modelowanie błon przy 
użyciu warstw ciekłych kryształów o strukturze chole¬ 
sterolowej. Z powodu ułożenia molekuł wzdłuż linii 
śrubowej, grubość tych warstw kilkaset razy przewyż¬ 
sza grubość warstw smektycznych. Dzięki temu war¬ 
stwy cholesterolowe mogą być łatwo obserwowane 
przy użyciu mikroskopu optycznego. Istnieje więc 
możliwość modelowania kształtu błon w zadanych 
warunkach przestrzennych oraz ich rozmieszczenia 
wewnątrz komórek o określonej specjalizacji, a także 
istnieje możliwość badania zarówno biogenezy, jak 
i morfogenezy błon. 

Upakowanie pofałdowanych i przenikających się 
warstw cholesterolowych jest podobne do rozmiesz¬ 
czenia błon wielu organów specjalnych, np. błon re¬ 
ceptorów w oku, rozwiniętych błon mitochondriów 
czy błon w chloroplastach u roślin (il. 109, 110, tabl. 
27). Uwarstwienie kropelek cholesterolowych ciekłych 
kryształów (il. 111, tabl. 27) jest często analogiczne do 
obserwowanego za pomocą mikroskopu elektrono¬ 
wego uwarstwienia roztworów biologicznych. 

Niezwykle ważną ze względu na przewodzenie im¬ 
pulsów nerwowych strukturą membranową jest otocz¬ 


ka mielinowa aksonów, zbudowana z cylindrycznych, figury 
współosiowych warstw lipidowych, tzw. liposomów mielinowe 
(rys. 15). Zdolność tworzenia figur mielinowych mają 
lipidy w połączeniu z wodą i w obecności substancji 



Rys. 15. Schemat budowy tworu mielinowego wytworzonego 
w mieszaninie lipidów i wody 


białkowych. Kształt, rozgałęzienia i strukturę we¬ 
wnętrzną tworów mielinowych można łatwo modelo¬ 
wać także w ciekłych kryształach nematycznych, po 
dodaniu do nich estrów cholesterolu lub niektórych 
substancji aktywnych optycznie (il. 112, tabl. 27). 

Badania' cienkich warstw ciekłych kryształów, 
a zwłaszcza związków między ich morfologią a proce¬ 
sami transportu masy, energii i ładunku elektrycznego 
w powiązaniu z towarzyszącymi im procesami che¬ 
micznymi, pozwolą znacznie przybliżyć rozwiązanie 
tajemnicy materii ożywionej. Badania biofizycznych 
modeli ciekłokrystalicznych mogą się okazać czynni¬ 
kiem integrującym prace w zakresie biochemii, bio¬ 
fizyki, fizjologii itd. i mogą dostarczyć odpowiedzi na 
trudne pytania z pogranicza tych dyscyplin. Prawdzi¬ 
wą trudność stanowi jednak formułowanie popraw¬ 
nych pytań. 

A. Adamczyk, Z. Strugalski Ciekle kryształy. Warszawa 
1976; L. M. Blinoy Zjawiska elektrooptyczne w ciekłych krysz¬ 
tałach , Post. Fiz., 2S, 237 (1977); I. G. Czistiakow Źydkije 
kris taiły, Moskwa 1970; P. G. de Gennes The Physicsof Uquid 
Crystals, Oxford 1974; S. Friberg, R. F. Gould (ed.) Lyotropic 
Uquid Crystals and the Structure of Biomembranes , Washington 
1956; M. Mięsowicz 50 lat polskich badań nad ciekłymi kryszta¬ 
łami, Post. Fiz. 26, 129 (1975). 


Współczesne teorie symetrii 
w krystalografii 

Zygmunt Trzaska Durski 


Rozwój klasycznej teorii symetrii kryształów został 
ukoronowany opracowaniem przez J. S. Fiodorowa, 
A. M. Schoenfliesa i W. Barlowa, w latach osiemdzie¬ 
siątych ubiegłego stulecia, teorii 230 grup przestrzen¬ 


nych. Wydawało się wówczas, że prace nad teorią sy- klasyczna 
metrii kryształów zostały tym samym całkowicie teoria 
zakończone, że nic więcej w tej dziedzinie nie będzie symetrii 
można zrobić. Jednak już wkrótce w pracach samego kryształów 
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Rys. 1. Jedno¬ 
rodne deforma¬ 
cje: sześcian (a) 
przechodzi w 
romboedr w wy¬ 
niku rozciągnię¬ 
cia (b), lub ściś¬ 
nięcia (c) wzdłui 
trójkrotnej osi sy¬ 
metrii (ustawio¬ 
nej pionowo na 
rys. a) 


Fiodorowa pojawiły się elementy uogólniające teorię 
symetrii. Fiodorow wprowadził bowiem do krystalo¬ 
grafii pojęcie „symetrii pozornej” kryształów. Okaza¬ 
ło się więc, że nie wszystko w teorii symetrii jest już 
wiadome. 

W naszym stuleciu rozwój teorii symetrii przebiegał 
w dwu kierunkach. Jeden — dotyczył doskonalenia 
i opracowywania szczegółów klasycznej teorii symetrii, 
drugi — uogólnień tej teorii. Przyjrzyjmy się bliżej 
niektórym fragmentom tych prac. 

Doskonalenie teorii symetrii obejmowało prace nad 
symetrią różnorodnych figur skończonych i nieskoń¬ 
czonych. I tak np.: 1) stwierdzono istnienie siedmiu 
grup symetrii bordiur, tzn. szlaków ornamentacyjnych 
(P. Niggli, G. Polya); 2) wyprowadzono 31 grup sy¬ 
metrii wstęg (A. Speiser); 3) opracowano teorię sy¬ 
metrii rdzeni i stwierdzono istnienie dla nich 75 grup 
symetrii (C. Hermann); 4) ustalono istnienie 80 grup 
symetrii warstw (K. Herman, E. Alexander, C. Her¬ 
mann, L. Weber); 5) stwierdzono możliwość występo¬ 
wania najgęstszych ułożeń kul o jednakowym promie¬ 
niu tylko w 8 grupach przestrzennych (N. W. Biełow). 

Do tego rodzaju prac należy też zaliczyć prace nad 
krystalograficznymi i strukturalnymi odmianami po¬ 
staci prostych, nad postaciami krawędziowymi i wierz¬ 
chołkowymi (-> Budowa kryształów). Stosowane wy¬ 
żej nazwy: bordiura, wstęga, rdzeń, warstwa — nie 
mają znaczenia potocznego, lecz są ściśle określonymi 
terminami naukowymi. Rdzeń definiuje się np. jako 
figurę z jednym kierunkiem szczególnym, nie mającą 
szczególnych punktów i płaszczyzn. Szczególnymi na¬ 
zywają się tu takie punkty, proste i płaszczyzny, które 
nie mają w danej figurze punktów, prostych i płasz¬ 
czyzn sobie równoważnych. Punktem szczególnym jest 
np. środek kwadratu, a szczególną prostą — cztero¬ 
krotna oś symetrii kwadratu (w kwadracie nie ma bo¬ 
wiem innego środka lub innej osi czterokrotnej). 

Uogólnień klasycznej teorii symetrii można było 
poszukiwać przez zmianę lub rozszerzenie podstawo¬ 
wych założeń teorii, a takimi są np. pojęcia: równości 
figur, figury symetrycznej, przekształcenia symetrycz¬ 
nego. Utworzone dotychczas nowe teorie symetrii są 
głównie oparte na różnym rozumieniu pojęcia rów¬ 
ności figur. Pojęcie to zostało sformułowane w XIX w. 
przez A. F. Moebiusa. Według Moebiusa dwie figury 
są równe wtedy, gdy każdemu punktowi jednej figury 
odpowiada punkt w drugiej figurze, a odległość między 
dwoma dowolnymi punktami jednej figury jest równa 
odległości między dwoma takimi samymi punktami 
drugiej figuęy. W klasycznej teorii symetrii wszystkie 
przekształcenia symetryczne figur (-> Budowa krysz¬ 
tałów) są przekształceniami izometrycznymi, tzn. nie 
zmieniającymi odległości między punktami. W wyniku 
swoistych rewizji pojęcia równości figur i rezygnowa¬ 
nia z izometryczności przekształceń wyrosły nowe, 
ogólniejsze w porównaniu z klasyczną, teorie symetrii. 

Pierwsze teorie uogólniające klasyczną teorię sy¬ 
metrii zostały przedstawione w pracach J. S. Fiodoro¬ 
wa o symetrii pozornej (1901) i C. M. VioIi o harmo¬ 
nii kryształów (1904). Później, w 1925 r. D. W. Naliw- 
kin opublikował pracę o symetrii krzywoliniowej, w 
latach 1947-1951 W. I. Michiejew opracował teorię 
homologii kryształów, a w 1960 r. A. W. Szubmkow 
sformułował teorię symetrii podobieństwa. Jednak naj¬ 
bardziej doniosłą w skutkach, mającą ogromny wpływ 
na dalszy rozwój i na dalsze uogólnianie teorii syme¬ 
trii, okazała się teoria antysymetrii A. W. Szubniko- 
wa (1951). 

Symetria pozorna J. S. Fiodorowa wynikła z jego 
prac nad deformacjami jednorodnymi figur geome¬ 
trycznych i kryształów. Jednorodnymi, tzn. nie zmie¬ 
niającymi charakteru figury: figura wyjściowa i po¬ 
chodna mają np. taką samą liczbę wierzchołków, kra¬ 
wędzi, ścian. Deformacje jednorodne powstają w re¬ 
zultacie rozciągnięcia (lub ściśnięcia) albo „przesunię¬ 
cia” figur. W wyniku jednorodnej deformacji figura 
zmienia swoją symetrię. Tak więc operacje rozciągania 
(lub ściskania) i przesunięcia nie są operacjami syme- 
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trii, lecz jak wykazał później W. I. Michiejew jedno¬ 
rodne deformacje są operacjami homologii. Sześcian 
poddany rozciągnięciu lub ściśnięciu przekształca się 



w romboedr (rys. 1), a poddany przesunięciu przemie¬ 
nia się w równoległościan jednoskośny (rys. 2) lub 
trójskośny Możliwe są także przekształcenia odwrotne 
(np. romboedr —► sześcian). Dowolny wielościan pod¬ 
dany jednorodnej deformacji pozostaje wielościanem. 

Przy rozciąganiu (lub ściskaniu) objętość wielościanu 
ulega zmianie, przy przesunięciu objętość pozostaje 
bez zmiany. W obydwu przypadkach zmienia się po¬ 
stać równoległościanu. Badanie jednorodnych defor¬ 
macji doprowadziło Fiodorowa do określenia operacji 
symetrii pozornej. W celu scharakteryzowania syme¬ 
trii pozornej Fiodorow wprowadził pojęcie elementów 
symetrii pozornej: osi i płaszczyzny symetrii pozornej symetria 
(np. odbicie w płaszczyźnie symetrii pozornej może pozorna 
przekształcić trójkąt ukośnokątny w trójkąt prosto¬ 
kątny). Według Fiodorowa wielościanami pozornie 
symetrycznymi względem siebie są: wielościan rzeczy¬ 
wiście symetryczny (tj. mający klasyczne elementy 
symetrii) i wielościan dowolny mający taką samą liczbę 
tak samo ułożonych ścian (jak wielościan pierwszy). 

C.M. VioIa opisał i scharakteryzował harmoniczne harmonia 
własności kryształów oraz samą harmonię, z której 
bezpośrednio wynika symetria. Figura przestrzenna 
może być harmoniczna względem środka harmonii, 
płaszczyzny lub osi harmonii (są to elementy harmo¬ 
nii). Na przykład płaszczyzną harmonii danej figury 




Rys. 3. Figury harmoniczne względem jednej Cyy) i dwóch 
(•*■*, yy) płaszczyzn harmonii 

jest taka płaszczyzna, która dzieli na połowy odległo¬ 
ści między odpowiednimi punktami znajdującymi się 
na równoległych prostych (rys. 3). Równoległe do 
siebie promienie rzutujące płaszczyzny harmonii two¬ 
rzą z tą płaszczyzną pewien kąt. Płaszczyzna symetrii 
jest więc tym szczególnym rodzajem płaszczyzny har¬ 
monii, przy którym promienie rzutujące są prosto¬ 
padłe do płaszczyzny. Harmonia Violi jest identyczna 
z symetrią pozorną Fiodorowa. 
t W. I. Michiejew opierając się na pracach Fiodorowa 
i Yioli opracował teorię homologii kryształów i wyka¬ 
zał, że zarówno symetria pozorna, jak i harmonia są homologia 
homologią. Homologia jest własnością figur polega¬ 
jącą na jednoznacznej odpowiedniości między wszy¬ 
stkimi ich elementami, przy tym odpowiadające sobie 
elementy figur są jednorodne, lecz niekoniecznie jed¬ 
nakowe. Dwie homologiczne figury nie są sobie równe. 















tylko są do siebie podobne w tym sensie, że dowolnej 
prostej w jednej z nich odpowiada prosta w drugiej, a 
dowolnej płaszczyźnie w pierwszej figurze odpowiada 
płaszczyzna w drugiej itd. Homologiczne względem sie¬ 
bie są np. dowolne dwa trójkąty—niezależnie od dłu¬ 
gości ich boków i kątów między bokami. Homologicz¬ 
nymi względem siebie są także każde dwa dowolne 
prostopadłościany, jaknp. sześcian i słup tetragonaln> 
zamknięty dwuścianem. Przekształceniem homolo¬ 
gicznym nazywa się każde przekształcenie przeprowa¬ 
dzające daną figurę w figurę względem niej homolo¬ 
giczną. Pierwszymi przekształceniami homologiczny¬ 
mi zastosowanymi w krystalografii były jednorodne 
deformacje Fiodor owa. 

elementy W homologii kryształów odpowiednikiem elemen- 

homologie tów symetrii z klasycznej teorii symetrii są elementy 
homologii. Do nich należą, prócz zwykłych elemen¬ 
tów symetrii, płaszczyzna homologii, osie homologii 
(o takiej samej krotności jak w symetrii klasycznej) 
oraz osie inwersyjne homologii. Płaszczyzna homo¬ 
logii 77 jest płaszczyzną ukośnego odbicia, tzn. że pro¬ 
mienie rzutujące (które dla płaszczyzny symetrii są 
do niej prostopadłe) tworzą z płaszczyzną 77 pewien 
kąt. Na rys. 4 przedstawiono przekształcenie homolo¬ 
giczne kuli w wyniku działania płaszczyzny 77. Oś ho- 



Rys. 4. Kula po odbiciu w płaszczyźnie homologii U przechodzi 
w elipsoidę 


A 



Rys. 5. Elementy homologii 
ukośnego walca o eliptycznej 
podstawie są następujące: oś 
homologii o nieskończonej krot¬ 
ności Aco* płaszczyzna homolo¬ 
gii II równoległa do płaszczyzny 
podstawy, płaszczyzna symetrii 
ABEF t 2-krotna oś symetrii rów¬ 
noległa do płaszczyzny podsta¬ 
wy, środek symetrii oraz nie¬ 
skończony zbiór płaszczyzn ho¬ 
mologii przechodzących (czyli 
równoległych) przez Aoo 


mologii A n jest prostą, za pomocą której przeprowa¬ 
dza się ukośny kołowy lub eliptyczny obrót. Przy ta¬ 
kim obrocie każdy punkt układu porusza się na ogół 
po elipsie (lub po kole), pny czym elipsa czy koło leżą 
w płaszczyźnie, która może tworzyć z osią pewien kąt 
(rys. 5). Elementy symetrii są rodzajem elementów 
homologii. 

klasy Istnieje 215 klas homologii, czyli różnych możli- 
homologii wych w kryształach zespołów elementów homologii. 
i harmonie Podobnie jak klasy symetrii łączy się w układy krysta¬ 
lograficzne, tak klasy homologii łączy się w harmonie 
(jest ich 7, a mianowicie: harmonia trójskośna, jędno- 
skośna, rombowa, trygonalna, tetragonalna, heksa¬ 
gonalna i regularna). W każdej klasie homologii moż¬ 
na wyprowadzić postacie proste homologii, w których 
ściany tworzące jedną postać homologii mogą należeć 
do różnych krystalograficznych postaci prostych. Mi- 


chiejew sformułował również pojęcie przestrzennej 
grupy homologii i prawidłowego zespołu figur homo¬ 
logicznych (odpowiedników grup przestrzennych i ze¬ 
społu pozycji symetrycznie równoznacznych). Podda¬ 
jąc zespół punktów symetrycznie równoznacznych de¬ 
formacjom jednorodnym, można otrzymać prawidło¬ 
wy zespół figur homologicznych, przy czym elementy 
symetrii grupy przestrzennej przemieniają się w ele¬ 
menty homologii i tworzą grupę przestrzenną homo¬ 
logii. 

W celu opisywania symetrii organizmów żywych 
geolog i paleontolog — D. W. Naliwkin stworzył po¬ 
jęcie symetrii krzywoliniowej. Według Naliwkina 
w przyrodzie istnieje wiele obiektów, które łatwo wy¬ 
ginają się i wyprostowują i tym samym stają się raz 
symetryczne krzywoliniowo, a drugi raz — symetrycz¬ 
ne prostoliniowo. Przejście z jednego stanu w drugi 
jest nadzwyczaj łatwe i właściwie niezauważalne. 
Zwróćmy uwagę np. na żmiję. Jeśli leży ona nierucho¬ 
mo wyprostowana, to zarys jej ciała wykazuje sy¬ 
metrię względem płaszczyzny symetrii (pionowej). Wy¬ 
starczy jednak, aby żmija poruszyła się, wygięła, aby 
jej symetria prostoliniowa znikła. Czy w wyniku po¬ 
ruszenia się, pełznięcia żmii, symetria jej ciała w ogóle 
zginęła? Oczywiście — nie, nastąpiła tylko przemiana 
symetrii prostoliniowej w symetrię krzywoliniową. 
Płaszczyzna symetrii zmieniła się w zakrzywioną po¬ 
wierzchnię symetrii. Podobnie jest z człowiekiem. Cia¬ 
ło człowieka, np. stojącego, ma pionową płaszczyznę 
symetrii. Co się stanie, gdy człowiek nieco się wygnie 
w bok? Czy ciało straci przez to symetrię płaszczyzno¬ 
wą? Oczywiście że nie, zajdzie wtedy jedynie przemia¬ 
na płaszczyzny symetrii w zakrzywioną powierzchnię 
symetrii (tj. płaszczyznę symetrii krzywoliniowej). Po¬ 
dobnie i zgięty kryształ może stać się symetryczny 
krzywoliniowo. Postacie symetryczne prostoliniowo 
są szczególnym rodzajem postaci o symetrii krzywoli¬ 
niowej. W świecie nieorganicznym przeważają posta¬ 
cie proste, słabo wygięte, w organicznym — silnie wy¬ 
gięte, a nawet skręcone. 

Symetria krzywoliniowa może powstawać w wyniku 
zgięcia lub skręcenia zwykłych symetrycznych figur. 
Elementami symetrii krzywoliniowej mogą być: oś 
symetrii krzywoliniowa, oś symetrii spiralna, po¬ 
wierzchnia symetrii zakrzywiona (tj. płaszczyzna sy¬ 
metrii krzywoliniowej), powierzchnia symetrii spi¬ 
ralna, a także — środek symetrii, osie symetrii, płasz¬ 
czyzna symetrii. Elementy symetrii są szczególnymi 
rodzajami elementów symetrii krzywoliniowej. Jeżeli 
walec (rys. 6) zegnie się tak, aby jego tworząca prze¬ 
mieniła się w łuk koła, to płaszczyzna symetrii ABCD 
walca pozostanie płaszczyzną symetrii także i dla zgię¬ 
tego walca, natomiast płaszczyzna EFGH przemieni 
się w płaszczyznę symetrii krzywoliniowej; oś symetrii 
MN o nieskończonej krotności (L«>) zmieni się w oś 
symetrii krzywoliniowej. Tak więc figury niesyme- 
metryczne (w pojęciu symetrii klasycznej) można roz¬ 
patrywać jako krzywoliniowo symetryczne. 



Rys. 6. Walec po zgięciu staje się figurą o krzywoliniowych ele¬ 
mentach symetrii 
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Symetria krzywoliniowa jest rodzajem homologii, 
a symetria, symetria pozorna i harmonia są szczegól¬ 
nymi rodzajami symetrii krzywoliniowej. Dla symetrii 
krzywoliniowej podjęto również próby określenia mo¬ 
żliwych kombinacji elementów symetrii krzywolinio¬ 
wej i wyprowadzenia niektórych klas symetrii krzywo¬ 
liniowej i płaskich postaci „krzywokrawędziowych” 
(P.L. Dubów). 

Chyba każdy zna z lat dziecinnych rosyjską drew¬ 
nianą zabawkę — składaną laleczkę, w której po ot¬ 
warciu znajduje się następna laleczka — mniejsza, 
symetria a w tej jeszcze jedna, którą też można otworzyć i w jej 
podobień- wnętrzu znaleźć następną jeszcze mniejszą itd. Takich 
stwa laleczek, jedna w drugiej jest kilka lub kilkanaście 
(rys. 7). Wszystkie laleczki są właściwie takie same, 


Rys. 7. Symetria podobieństwa: drewniane laleczki „matrioszki” 


W nauce o symetrii podobieństwa za jednakowe — 
jak już wspomniano — uważa się nie tylko rzeczywi¬ 
ście jednakowe figury, ale i wszystkie do nich podob¬ 
ne, tj. figury o tym samym kształcie. Analogicznie do 
operacji symetrii można wprowadzić operacje syme¬ 
trii podobieństwa, które są swoistymi analogami trans¬ 
lacji, odbić w płaszczyznach zwykłych i poślizgu, oraz 


Rys. 8. Symetria 
podobieństwa: 
przykład operacji K 



obrotów wokół osi zwykłych i śrubowych, z tą tylko 
różnicą, że wszystkie te operacje związane są z równo¬ 
czesnym zwiększeniem (lub zmniejszeniem) skali figur 
i odległości między figurami. Operacja K jest naj¬ 
prostszą operacją symetrii podobieństwa; polega ona 
na przenoszeniu wszystkich podobnych części figury 
w położenia równoległe, przy jednoczesnym zwiększa¬ 
niu lub zmniejszaniu skali tych części i odległości mię¬ 
dzy nimi n razy (rys. 8). Operacja L składa się z kolej¬ 
no przeprowadzanych obrotów podobnych części fi¬ 
gury wokół nieruchomej osi o pewien stały kąt <p, 
którym towarzyszy odpowiednie przesuwanie figury 
w kierunku do osi (lub od osi, jeśli operacja jest prowa¬ 
dzona z wnętrza figury; rys. 9). Odpowiadające so¬ 
bie punkty podobnych części figury powinny leżeć na 
spirali logarytmicznej. Operację L można nazwać spi¬ 
ralnym ruchem wokół osi podobieństwa. Łatwo moż¬ 
na zauważyć, że operacja K jest równoważna operacji 



Rys. 9. Konstruk¬ 
cja figury mającej 
symetrię podobień¬ 
stwa L 
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ale różni je ich wielkość. Laleczki są w pewnym sensie 
jednakowe, wyczuwa się tutaj pewien rytm, pewne po¬ 
wtarzanie się, a jeśli występuje powtarzanie się, to jest 
i symetria. Tym razem jest to jednak dziwna symetria. 
Figury są jednakowe, ale różnią się wielkością. Każ¬ 
dym dwu punktom jednej figury odpowiadają dwa 
punkty drugiej figury, ale odległość między nimi jest 
inna. Każdej prostej czy płaszczyźnie w jednej figurze 
odpowiada prosta czy płaszczyzna w drugiej, ale 
o innej wielkości. H. Weyl, który pierwszy poddał 
myśl matematycznego opisania takich prawidłowości, 
nazwał taką „symetrię” podobieństwem, a A. W. Szub- 
nikow, który taki opis stworzył nazwał ją symetrią 
podobieństwa. 

Historia powstania i rozwoju pojęcia symetrii po¬ 
dobieństwa sięga w daleką przeszłość, a tworzyli ją 
uczeni, malarze i architekci. Już Leonardo da Vinci 
stosował symetrię podobieństwa w postaci perspekty¬ 
wy. Symetrię podobieństwa obserwuje się często w 
przyrodzie, np. w ułożeniu liści na młodych pędach 
roślin, w prawidłowym ułożeniu ziarenek w kwiatach 
słonecznika czy rumianku, w spiralnych postaciach 
muszli amonitów, w stożkowych kształtach wielu 
drzew (np. jodła), w szkieletowych postaciach kryszta¬ 
łów i w tzw. piramidach wzrostu kryształów (il. 63, 
64, 66, tabl. 17). 




Rys. 10. Przykłady figur mających symetrię podobieństwa M 



Rys. 11. Przykłady figur mających symetrię podobieństwa L 
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L przeprowadzanej przy <p = 2n (tj. K = L(<p = 2n)). 
Na rys. 11 pokazano przykłady figur skonstruowa¬ 
nych przy zastosowaniu operacji L. Operacja M jest 
analogiem operacji odbicia zwykłego lub poślizgowe¬ 
go w symetrii klasycznej; nazywa się ją odbiciem w 
płaszczyźnie podobieństwa (rys. 10). Operacje K, L 
i M są operacjami symetrii podobieństwa figur dwu- 



Rys. 12. Trójwymiarowa figura powstała w wyniku operacji N 
symetrii podobieństwa 


wymiarowych (płaskich). Operacja JYjest operacją sy¬ 
metrii podobieństwa figur przestrzennych (rys. 12) 
i można ją interpretować jako iloczyn operacji 
L(<p # 2n) i operacji K — L{(p — 2tt), pod warun¬ 
kiem, że obydwie osie są wzajemnie równoległe. W re¬ 
zultacie operacja N powoduje ruch podobnych części 
figury po rozszerzającej się linii śrubowej. 

Operacjami symetrii podobieństwa są oczywiście 
także operacje klasycznej symetrii, stanowiące szcze¬ 
gólny rodzaj ogólniejszych operacji symetrii podobień¬ 
stwa. 

Operacje symetrii podobieństwa można składać ze 
sobą, tworzyć ich kombinacje. Powstają przy tym gru- 
' py symetrii podobieństwa. Kilka przykładów figur na¬ 
leżących do różnych grup pokazano na rys. 13. 

Jak już wspomniano poprzednio, A. W. Szubnikow, 
opierając się na wcześniejszych pracach A. Speisera 
(1927) i L. Webera (1929), sformułował jeszcze jed- 
anty symetria ną nową teorię symetrii, mianowicie teorię antysy- 
metrii. W przyrodzie często spotyka się przedmioty 
podobne do siebie a właściwie równe sobie w pewien 
szczególny sposób, mianowicie: jak pozytyw i ne¬ 
gatyw fotograficzny jednego i tego samego przed¬ 
miotu, jak medal i odcisk medalu, jak pozyton i elek¬ 
tron, jak +1 i —1, jak śruba i gwint, jak postacie 
wzrostu i postacie rozpuszczania kryształów, jak pra¬ 
wa biała rękawiczka z czarnym mankietem i czarna 


prawa rękawiczka z białym mankietem. Szubnikow 
ten rodzaj równości figur nazwał ich antyrównością. 
Ogólnie biorąc, za antyrówne można uważać figury 
o jednakowym kształcie i jednakowych rozmiarach, 
lecz przeciwstawne sobie pod względem jakiejś włas¬ 
ności: np. barwy, znaku, ładunku elektrycznego, kie¬ 
runku momentu magnetycznego. 

Stosunki symetryczne, jakie mogą zachodzić mię¬ 
dzy antyrównymi przedmiotami, figurami, Szubnikow 
nazwał antysymetrią. 

Przekształcenie antysymetryczne można zdefinio¬ 
wać jako przekształcenie symetryczne przemieniające 
figurę białą w czarną lub zmieniające znak figury (-f- 
na —), czyli mówiąc ogólnie — zmieniające własność 
figury na przeciwną. Szubnikow sformułował więc po¬ 
jęcie antysymetrii jako zasadnicze rozszerzenie syme¬ 
trii klasycznej w wyniku dodania zmiany własności 
fizycznej. 

W teorii antysymetrii każdemu punktowi przypisuje 
się znak + lub — w dowolnym znaczeniu, interpreto¬ 
wanym zwykle jako własności fizyczne: znak ładunku 
elektrycznego, czarny lub biały kolor itp. Przekształ¬ 
ceniem antysymetrycznym nazywa się więc izome- 
tryczne przekształcenie figury w siebie samą przy rów¬ 
noczesnej zmianie znaku każdego punktu. W teorii 
antysymetrii rozpatruje się figury charakteryzujące 
się trzema własnościami: +1, —1,0 (np. figura biała, 
czarna i szara). Figury szare nazywa się także figura¬ 
mi neutralnymi. 

W klasycznej teorii symetrii operacje symetrii prze¬ 
prowadzane w przestrzeni trójwymiarowej na trójwy¬ 
miarowych figurach skończonych można formalnie 
rozpatrywać jako operacje w przestrzeni cztero wy¬ 
miarowej. Operacje takie pozostawiają nie zmienioną 
czwartą współrzędną (x 4 ) równą zeru dla wszystkich 
punktów figury. W tym ujęciu operacje antysymetrii 
można rozpatrywać również jako operacje w przestrze¬ 
ni czterowymiarowej, które nie zmieniając bezwzględ¬ 
nych wartości współrzędnych punktów figury wzglę¬ 
dem osi zmieniają ich znak. 

Analogicznie do elementów symetrii istnieją ele¬ 
menty antysymetrii — środek, osie i płaszczyzna anty¬ 
symetrii, antytranslacja, śrubowe osie antysymetrii 
i antypłaszczyzny poślizgu. Przekształcenie antysyme¬ 
tryczne działa zawsze w połączeniu ze zwykłymi ele¬ 
mentami symetrii. Działania różnych elementów anty¬ 
symetrii i porównanie ich z przekształceniami syme¬ 
trycznymi przedstawiono na rys. 14 i 15. Rysunek 16 
pokazuje działanie elementów antysymetrii (niektó¬ 
rych) na asymetryczny czworościan. 

Szubnikow wykazał, że istnieje tylko 122 krystalo¬ 
graficznych punktowych grup antysymetrii (tzn. klas 
antysymetrii; klasy antysymetrii nazywa się także kla¬ 
sami symetrii magnetycznej), a w tym: 32 grupy po¬ 
larne (jednobarwne, np. tylko białe), odpowiadające 
figurom, których punkty symetrycznie równoznaczne 


antyrówność 

figur 


przekształ¬ 
cenie anty- 
symetryozne 


elementy 

antysymetrii 


punktowe 

grupy 

antysymetrii 



symetria 6-L (<p = -Jz/8) 


symetria 3 -mM. 


symetria 8-M 


Rys. 13. Figury o złożonej symetrii podobieństwa (liczba przed symbolem operacji oznacza krotność osi symetrii) 
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Rys. 14. Działanie 6-krotnej osi symetrii prostopadłej do płaszczyzny rysunku (a) obraz działanie 6-krotnej osi antysymetrii 6' 
(b); obróceniu figury o 60° w płaszczyźnie rysunku towarzyszy zmiana barwy figury 



Rys. 15. Figury symetryczne (a, b, c) i antysymetryczne (d, e, f). 
Symetria figur: a) płaszczyzna symetrii /n; b) dwukrotna oś 
symetrii 2; c) środek symetrii 1; d) płaszczyzna antysymetrii m 
e) dwukrotna oś symetrii 2', f) środek antysymetrii Y 



Rys. 16. Działanie elementów antysymetrii na asymetryczny 
czworościan: a) środek antysymetrii 1', b) płaszczyzna antysy¬ 
metrii m\ c) dwukrotna oś antysymetrii 2', d) czterokrotna o 
antysymetrii 4' 




w klasie symetrii m oraz 


mają jeden znak (barwę), i pokrywające się z klasycz¬ 
nymi grupami punktowymi; 32 grupy neutralne (sza¬ 
re), odpowiadające figurom, których punkty nie mają 
żadnego znaku; 58 grup o mieszanej polamości (dwu- 
barwnych, czarno-białych), odpowiadających figu¬ 
rom, których punkty symetrycznie równoznaczne 
mają różne znaki. Szubnikow wprowadził również po¬ 
jęcie postaci prostych dla grup o mieszanej polamości 
(rys. 17). 

Uwzględniając przekształcenie antysymetryczne 
otrzymuje się 22 dwubarwne typy sieci Bravais’go 
(prócz 14 zwykłych, jednobarwnych). Grupami szub- 
nikowskimi nazwano, na cześć twórcy teorii, grupy 
przestrzenne symetrii magnetycznej, tj. grupy prze¬ 
strzenne uwzględniające antysymetrię. Grup tych jest 
1651, a w ich skład wchodzi: 230 przestrzennych grup 
fiodorowskich (polarnych, białych); 230 grup neutral¬ 
nych (szarych) oraz 1191 grup o mieszanej polamości 
(czarno-białych). Grupy szubriikowskie zostały wy¬ 
prowadzone po raz pierwszy przez A. M. Zamorzaje- 
wa (1953) i niezależnie od niego przez N. W. Biełowa, 
N. N. Neronową i T. S. Smirnową (1955). 

Rozwój teorii symetrii nie zakończył się z chwilą po¬ 
jawienia się prac Szubnikowa o antysymetrii i podo¬ 
bieństwie. W krótkim czasie pojawiły się dalsze uogól¬ 
nienia tych teorii. Sam Szubnikow, w 1945 r., a więc 
jeszcze na kilka lat przed ukazaniem się jego książki 
o antysymetrii stwierdził, że jednemu punktowi można 
przypisać nie tylko jeden, lecz równocześnie kilka zna¬ 
ków. Tę myśl, aby antysymetrię uogólnić, Zamorza- 
jew i jego szkoła rozwinęli w postaci antysymetrii 
wielokrotnej, nazwanej też przez nich antysymetrią 
różnego rodzaju. 

W teorii antysymetrii wielokrotnej każdemu punk¬ 
towi figury przypisuje się skończoną liczbę / znaków 
+ lub —, mających różne fizyczne interpretacje. 
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Pierwsi znak może oznaczać np. barwę białą lub 
czarną, drugi — znak ładunku elektrycznego itp. Jeżeli 
np. / = 2, tj. gdy punktowi przypisane są dwa znaki, 
to w wyniku przekształcenia antysymetrycznego pier¬ 
wszego, drugiego czy trzeciego (mieszanego) rodzaju 
ulegnie zmianie tylko pierwszy, tylko drugi, albo 
obydwa znaki równocześnie, np. (++)*£(—b), 

(++)^±(+-), (++)^±(-). Ogółem istnieje 

2* —1 różnych rodzajów antysymetrii. 

Pojęciem bliskim antysymetrii wielokrotnej są „gru¬ 
py złożone” wprowadzone do teorii symetrii przez 
A. L. Mackaya (1957). 

Innym uogólnieniem antysymetrii jest symetria 
barwna N. W. Biełowa i T. N. Tarchowej (1956). Śru¬ 
bowe osie symetrii, płaszczyzny poślizgu i centrowane 
typy sieci Bravais’go powodują, że zespół punktów 
symetrycznie równoznacznych (tj. zespół prawidłowy 
punktów) w położeniu ogólnym rozmieszcza się w ko¬ 
mórce elementarnej na kilku poziomach. Zabarwia¬ 
jąc na różne kol ory rzuty tych punktów na płaszczyznę 
prostopadłą do krystalograficznej osi Z, otrzymuje się 
wielobarwny zespół prawidłowy punktów. Dla osi 2 l9 
42,63, płaszczyzn c, n i sieci A , /, F będzie to dwubarw- 
ny zespół punktów. Dwie barwy na płaszczyźnie rzutu 
odpowiadają więc ułożeniu punktów symetrycznie rów¬ 
noznacznych na dwóch poziomach związanych ze sobą 
osią śrubową lub płaszczyzną poślizgu. Stosunki sy¬ 
metryczne istniejące w figurach dwubarwnych są po 
prostu antysymetrią. Inaczej jest, gdy elementy sy¬ 
metrii lub sama sieć powodują rozmieszczenie zespołu 
punktów symetrycznie równoznacznych na 3, 4 lub 6 
poziomach (symetria krystalograficzna). Tego rodzaju 
rozmieszczenie dają osie 3i, 3 2 , 6*, 6* (trzy poziomy); 
osie 4 l5 4 3 i płaszczyzna d (cztery poziomy) oraz osie 
6i, 65 (sześć poziomów). Rozmieszczenie punktów na 
trzech poziomach powoduje też sieć romboedryczna 
( R ). Jeśli punkty symetrycznie równoznaczne znajdu¬ 
jące się na różnych poziomach zostaną różnie zabar¬ 
wione, to na płaszczyźnie rzutu otrzyma się 3-, 4- lub 
6-barwny prawidłowy zespół punktów. Mamy wów¬ 
czas do czynienia z symetrią wielobarwną (barwną). 
Osie 3 U 3 2 , 60 , 64 , 4x, 4 3 , 6 U 65 , płaszczyzna d oraz sieć 
Bravais’go typu R są wielobarwnymi elementami sy¬ 
metrii. Wszystkie przedstawione wyżej uogólnienia 
symetrii klasycznej obejmuje kwazisymetria, nazywa¬ 
na też P-symetrią (A. M. Zamorzajew). P-symetria 
jest z kolei szczególnym rodzajem kryptosymetrii 
(A. Niggli, H. Wondratschek). Kryptosymetria nie 
obejmuje symetrii kompleksowej, którą z kolei można 
rozszerzyć do kwatemionowej. 

Geometrycznym uogólnieniem symetrii podobień¬ 
stwa jest symetria konformacyjna, w której występują 
zakrzywione elementy symetrii (kule, koła). Innym 
geometrycznym rozszerzeniem symetrii podobieństwa 
jest symetria afiniczna. 

Omówione wyżej teorie z biegiem czasu podlegały 
dalszemu rozwojowi. Rozpoczęto m.in. wyprowadza¬ 


nie przestrzennych grup homologii i badanie antysy¬ 
metrii figur homologicznych. Z połączenia barwnej 
symetrii z antysymetrią powstała barwna antysyme- 
tria, którą następnie uogólniono w postaci barwnej 
antysymetrii różnego rodzaju. Również na symetrię 
podobieństwa przeniesiono idee antysymetrii prostej 
i antysymetrii wielokrotnej, a także rozszerzono ją za 
pomocą pojęć symetrii barwnej i antysymetrii barw¬ 
nej. Idee antysymetrii i symetrii barwnej przeniesiono 
także na symetrię konformacyjną. Zostały już zapo¬ 
czątkowane i rozwijają się nadal prace nad teorią grup 
przestrzennych Fiodorowa w przestrzeniach wielowy¬ 
miarowych i geometriach nieeuklidesowych; np. dla 
n = 4 znaleziono punktowe grupy krystalograficzne 
i wyprowadzono wszystkie sieci Bravais’go. 

Wszystkie prezentowane wyżej teorie różnych ro¬ 
dzajów symetrii wraz z ich uogólnieniami stanowią 
obecnie treść nowej, znajdującej się w pełni rozwoju 
gałęzi krystalografii — krystalografii matematycznej. 

Czy osiągnięto już kres rozwoju teorii symetrii? Nie, 
gdyż w teorii tej nadal istnieją luki, poza tym na opra¬ 
cowanie czekają dalsze problemy, a mianowicie róż¬ 
norodne syntezy fizycznych i geometrycznych uogól¬ 
nień teorii symetrii, wyprowadzenie postaci prostych 
w symetrii podobieństwa, klasyfikacja postaci pros¬ 
tych dla grup punktowych homologii, dokładniejsze 
zbadanie praw symetrii w obcych jeszcze dzisiaj kry¬ 
stalografom przestrzeniach n-wymiarowych oraz w 
przestrzeniach nieeuklidesowych geometrii, np. w 
pseudoeuklidesowej geometrii Minkowskiego, czy 
w przestrzeni Łobaczewskiego. 

Niektóre z przedstawionych wyżej teorii przede 
wszystkim antysymetrią i symetria podobieństwa już 
obecnie mają znaczenie praktyczne. Antysymetrią np. 
znalazła zastosowanie w opisie magnetycznej struktu¬ 
ry kryształów, a także w klasyfikacji bliźniaczych 
i równoległych zrostów kryształów. Stała się także 
źródłem twórczej inspiracji w sztuce, czego przykła¬ 
dem są słynne grafiki M. C. Eschera (il. 65, tabl. 17). 
Symetria podobieństwa natomiast umożliwiła opisa¬ 
nie kształtów muszli amonitu czy spirali wzrostu 
kryształu, które wymykały się dotąd wszelkiemu ści¬ 
słemu opisowi. 
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FIZYKA CIAŁA STAŁEGO 
Metale 

Jacek Furdyna 

W życiu codziennym rozpoznajemy metale po ich 
charakterystycznych cechach zewnętrznych. W tempe¬ 
raturze pokojowej są to ciała stałe o dużej wytrzyma¬ 
łości, mające specyficzny połysk, nie przepuszczają¬ 
ce światła, plastyczne (tzn. kowalne) oraz dobrze 
przewodzące ciepło i elektryczność. Te pozornie nie¬ 
zależne od siebie właściwości mają wspólne podłoże 
na szczeblu atomowym: elektrony w zewnętrznych po- 
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włokach atomów metali (tzw. elektrony walencyjne) są 
bardzo słabo związane z resztą atomu — tworzą gaz 
elektronowy. Obecność tego gazu jest, z kolei, pod¬ 
stawą wiązań międzyatomowych metalu i, jak poka¬ 
żemy, prowadzi do właściwości odróżniających metale 
od innych ciał stałych. 

Zacznijmy od atomu metalu o jednym elektronie 
walencyjnym, np. atomu sodu (rys. 1). Elektron wa- 


krystaJo- 

grafia 

matema¬ 

tyczna 



wiązanie Iencyjny (powłoka 3 s na rys. 1) otacza chmurą elek- 
metaliczne tronową jon sodu Na+, składający się z jądra i silnie 
z nim związanych pozostałych elektronów w powło¬ 
kach \s 9 2s i 2p. Jeżeli przez zbliżenie dwóch atomów 
sodu utworzymy cząsteczkę Na 2 , elektrony walencyjne 



Rys. 1. Przykład pierwiastka jcdnowartościowego—model 
atomu sodu 




e~ 


Rys. 2. Elektrony walencyjne (e~) w sodzie: a) w atomie; b) w czą¬ 
steczce; c) w krysztale 


gaz elektro- (dzięki swemu słabemu wiązaniu z atomem macierzy- 
nów waleń- stym) będą się swobodnie poruszać „na terenie” całej 
cyjnych cząsteczki (rys. 2). Podobnie, jeżeli zbliżymy do siebie 
większą ilość atomów, tworząc w ten sposób kryształ 
sodu, elektrony walencyjne nie pozostaną zlokalizo¬ 
wane przy „swoich” atomach, lecz będą się poruszać 
w objętości całego kryształu. Wynika to z zasady 
nieokreśloności. Elektrony o dużym stopniu lokaliza¬ 
cji mogłyby mieć według tej zasady duże wartości pę¬ 
du, a więc i wysoką energię. Układ w swoim natural¬ 
nym dążeniu do najniższego stanu energii dąży więc 
równocześnie do delokalizacji elektronów. Tak więc 
metal składa się z sieci dodatnich jonów, zanurzo¬ 
nych w gazie swobodnie poruszających się elektro¬ 
nów walencyjnych, które straciły bezpośredni związek 
z atomami macierzystymi i stanowią niejako wspólną 
własność wszystkich jonów równocześnie. Ten gaz 


elektronowy tworzy rodzaj kleju przenikającego prze¬ 
strzeń międzyjonową, który przez oddziaływanie elek¬ 
trostatyczne „wciąga” w siebie dodatnie jony, gęsto je 
przez to upakowując. Takie wzajemne przyciąganie jo¬ 
nów i gazu elektronowego stanowi istotę wiązania 
metalicznego. 


Mechaniczne właściwości metali 


Wiązanie metaliczne różni się tym od wiązań ko- 
walentnych lub jonowych (-> Chemia kwantowa), że 
działa bezkierunkowo i nie zależy w zasadzie od war¬ 
tościowości jonu. Ponieważ wynika ono z bezpośred¬ 
niego oddziaływania różnych ładunków, wiązanie 
w metalach jest przy tym bardzo silne. Te cechy (bez- 
kierunkowość i silne przyciąganie) prowadzą do gęste¬ 
go upakowania (ułożenia) atomów w metalu. 

Najgęstsze upakowanie atomów jest możliwe struktura 
w trzech strukturach krystalicznych: w układzie re¬ 
gularnym płasko centrowanym, w układzie heksago¬ 
nalnym najgęstszego upakowania oraz (w nieco mniej¬ 
szym stopniu) w układzie regularnym przestrzennie 
centrowanym (-►Budowa kryształów). Struktury te 
podobne są do różnych sposobów układania jedna¬ 
kowych kul (przykłady widujemy na straganach 
z owocami). Układy te są również proste, tzn. mają 
wysoki stopień symetrii. Fakt, że prawie wszystkie 
metale tworzą kryształy o jednej z trzech powyższych 
struktur, wynika więc bezpośrednio ze specyficznych 
właściwości „elektronowego kleju”. 

Wspomniana już bezkierunkowość wiązań w metalu 
i niezależność od wielkości ładunku jonu ma również 
dalsze konsekwencje. W krysztale miedzi, np. możemy 
dany atom miedzi (a więc atom jednowartościowy) 
bez trudności zastąpić dwuwartościowym atomem, 
np. cynku. Atom obcego metalu odda swoje elektrony stopy 
walencyjne otaczającemu go gazowi elektronowemu, 
wiążąc się z siecią kryształu przez powstały w ten spo¬ 
sób ładunek, zupełnie tak samo jak sąsiadujące z nim 
atomy miedzi. Atomy różnych metali mogą się więc 
mieszać i układać w dowolnych proporcjach na wspól¬ 
nej sieci krystalicznej. Ta obojętność wiązania na ro¬ 
dzaj atomu (byleby łatwo oddawał elektrony) jest 
właściwością, dzięki której możemy tworzyć stopy spawanie 
metali w szerokim zakresie składów, jak również 
spawać i lutować różne od siebie metale. 



Rys. 3. Odbicie światła przez ziarna metalu o różnych orienta¬ 
cjach krystalograficznych 


Obiekty metalowe, z którymi stykamy się na co 
dzień, są przeważnie polikrystaliczne, składające się 
z wielu ziaren, które często możemy rozróżnić gołym 


506 
















mikrostruk- okiem dzięki sposobowi, w jaki pojedyncze ziarna 
tura odbijają światło (rys. 3). Każde z ziaren jest mono¬ 
kryształem, oddzielonym od przyległych ziaren 
warstwą o grubości jednego lub dwu atomów. Krysta¬ 
liczne uporządkowanie atomów zmienia się więc rap¬ 
townie na przestrzeni tej warstwy. Mimo to, ze wzglę¬ 
du na bezkierunkowy charakter wiązania metaliczne¬ 
go, siła kohezji sąsiadujących ze sobą ziaren nie różni 
się w zasadzie od siły wiążącej atomy wewnątrz kry¬ 
ształu. Rozdzielenie ziaren jest sprawą nader trudną. 
Stąd też pochodzi wysoki stopień wytrzymałości wyro¬ 
bów metalowych, co stanowi o ich ogromnej przy¬ 
datności. 

plastyczność Szczególną cechą metalu jest to, że może on być 
(kowalność) kuty, gięty i walcowany w różne kształty, zachowując 
przy tym swą pierwotną wytrzymałość i inne właści¬ 
wości fizyczne. Proces takiej deformacji plastycznej 
jest schematycznie pokazany na rys. 4. Punktami za¬ 
znaczono jony w sieci kryształu. Rys. 4a przedstawia 
kryształ metalu przed deformacją. Pod wpływem nie- 


kowalne w mniejszym stopniu, łatwiej się kruszą 
i mniej nadają do obróbki mechanicznej. 

Na mechaniczne własności metali ogromny wpływ defekty 
mają defekty składu lub struktury kryształów. Od- w metalach 
różniamy kilka podstawowych rodzajów defektów. 

Jeżeli płaszczyzna atomów nagle się urywa, tworząc 
krawędź (rys. 5), powstałe w ten sposób zaburzenie 


Rys. 5. Dyslokacja kra¬ 
wędziowa w dwóch wy¬ 
miarach 


i • t • 



c) 




Rys. 4. Deformacja metalu w trzech stadiach: a) kryształ przed deformacją; b) odkształcenie sprężyste po przyłożeniu siły zewnętrznej 
(strzałka); c) odkształcenie plastyczne (nieodwracalne) wskutek poślizgu wzdłuż płaszczyzny P t po przekroczeniu granicy sprężystości 


wielkiej siły zewnętrznej (strzałka na rys. 4b) na¬ 
stępuje deformacja sprężysta; po usunięciu siły kry¬ 
ształ powraca do pierwotnego kształtu. Jeżeli jednak 
siła przyłożona (np. uderzenie młotem) przewyższa 
pewną granicę, metal odkształca się nieodwracalnie. 
Proces deformacji plastycznej pokazany jest na rys. 
4c, gdzie cała płaszczyzna atomów prześlizguje się 
poziomo o jedną (całkowitą) stałą sieci, zabierając 
ze sobą górną część kryształu. Rzeczą zasadniczą jest 
to, że mimo zewnętrznego makroskopowego odkształ¬ 
cenia na szczeblu atomowym odtwarza się po poślizgu 
(o jedną lub kilka stałych sieci kryształu) pierwotna 
sytuacja: jony „wskakują” w identyczne położenie 
równowagi (identyczne otoczenie), w jakim znajdowa¬ 
ły się przed deformacją. Mamy więc w rezultacie taki 
sam materiał i takie same właściwości fizyczne. 

Jak widać z rys. 4, plastyczna deformacja metalu 
wynika z poślizgu wzdłuż płaszczyzn w krysztale. 
Na rys. 4a liniami przerywanymi oznaczyliśmy trzy 
różne płaszczyzny sieciowe. W zasadzie poślizg jest 
możliwy wzdłuż każdej takiej płaszczyzny. Najłatwiej 
jest jednak uzyskać poślizg wzdłuż płaszczyzn o naj¬ 
większym zagęszczeniu atomów (a więc poziomo lub 
pionowo). Wynika to z dwóch względów: płaszczyzny 
najgęstszego upakowania są z konieczności najbar¬ 
dziej od siebie oddalone (największa odległość między- 
płaszczyznowa A — rys. 4a), co zmniejsza opór wy¬ 
nikający z potencjału jonów w sąsiednich płaszczyz¬ 
nach; poza tym, w trakcie poślizgu wzdłuż takiej 
płaszczyzny, jony mijają położenia równowagi z naj¬ 
większą częstością. 

Ze względu na wysoki stopień symetrii, regularne 
układy krystaliczne mają wiele płaszczyzn o gęstym 
upakowaniu atomów, co umożliwia łatwy poślizg 
jednocześnie w kilku kierunkach. Dzięki temu metale 
o strukturze regularnej (np. miedź, złoto, ołów) mogą 
z łatwością zmieniać kształt (są łatwo kowalne), bez 
powstawania przy tym pęknięć i dziur. Metale o struk¬ 
turze heksagonalnej, a więc o niższej symetrii, są 



Rys. 6. Defekty punktowe: atom obcy w węźle (c); luka w sieci 
tzw. wakans (ó); obcy atom w pozycji międzywęzłowej (c); do¬ 
datkowy atom własny w pozycji międzywęzłowej, tzw. defekt 
Frenkla ( d ) 

sieci nazywamy dyslokacją. Jest to przykład tzw. de¬ 
fektu liniowego. Sieć kryształu może być również za¬ 
burzona defektami punktowymi, z których cztery 
pokazane są schematycznie na rys. 6. 

Rysunek 7 ilustruje (w dwóch wymiarach), jak waż- wpływ 
ne jest zjawisko dyslokacji dla plastyczności meta- dyslokacji 
li. Pod wpływem zewnętrznej siły (strzałka) wiązania 
linii atomów zostają zerwane, tworząc krawędź w pła¬ 
szczyźnie kryształu (rys. 7b, czarne punkty). Pod 
dalszym naporem siły powstaje krawędź w sąsiedniej 
płaszczyźnie, zaś pierwotna krawędź „goi się” przez 
wskoczenie atomów w położenie równowagi. Pro¬ 
ces ten powtarza się — mówimy wtedy o ruchu dyslo¬ 
kacji. Ruch dyslokacji możemy nawet oglądać pod 
mikroskopem. Jak widać z rys. 7, przemieszczanie się 
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Rys. 7. Schematyczny obraz przemieszczania się dyslokacji pod wpływem siły (strzałka). W rezultacie pierwotny kryształ (a’) zostaje 
odkształcony plastycznie (f) 


dyslokacji prowadzi do odkształcenia kryształu, 
z zachowaniem jego wewnętrznej struktury mikrosko¬ 
powej. 

metale Szczególne znaczenie dyslokacji polega na tym, że 
„twarde" i od nich w dużej mierze zależy, czy metal jest „twardy”, 
„miękkie" czy „miękki”. Pokazaliśmy już, że kowalność metali 
łączy się z istnieniem płaszczyzn poślizgu. Dzięki 
dyslokacjom poślizg taki odbywać się może stopnio¬ 
wo przez zrywanie wiązań w jednym tylko szeregu 
atomów na raz, a nie na przestrzeni całej płaszczyzny 
równocześnie, wymaga więc względnie małej siły 
zewnętrznej. Możemy to porównać do przesuwania 
dużego dywanu po podłodze. Jeżeli zechcemy prze¬ 
sunąć cały dywan za jednym pociągnięciem, natra¬ 
fiamy na duży opór. Możemy natomiast zrobić na 
dywanie fałdę i popychając ją, przesimąć w ten spo¬ 
sób dywan przy użyciu niewspółmiernie niniejszej siły. 
Obliczenia wykazują, że idealny kryształ, zupełnie 
wolny od dyslokacji, musi ulec deformacji sprężystej 
(rys. 4b), rzędu 3 do 10%, zanim nastąpi poślizg (rys. 
4c). W praktyce kryształ czystego metalu zaczyna się 
odkształcać plastycznie już przy deformacjach ok. 
0,01%, właśnie dzięki obecności w nim dyslokacji. 

Ruch dyslokacji możliwy jest dzięki regularności 
sieci kryształu. Zaburzenia porządku sieci (np. atomy 
obce, atomy międzywęzłowe) stanowią więc przeszko¬ 
dę w poruszaniu się dyslokacji. Toteż, wprowadzając 
takie defekty, czynimy metale twardszymi. Złoto 
czternastokaratowe, zawierające domieszki, jest o wie¬ 
le bardziej wytrzymałe („twardsze”) niż złoto zupełnie 
czyste. Zaburzeniem sieci są również połączenia zia¬ 
ren w polikryształach, można więc uzyskać twardszy 
hartowanie metal przez zmniejszenie rozmiaru ziaren. Hartując 
metal przez kucie lub walcowanie, wprowadzamy za¬ 
burzenie sieci, którym są — paradoksalnie — nowe 
dyslokacje. Jeżeli gęstość dyslokacji jest dostatecznie 
duża, dyslokacje poruszające się wzdłuż przecina¬ 
jących się płaszczyzn po prostu wchodzą sobie w dro¬ 
gę, uniemożliwiając dalszy ruch i przez to czyniąc 
metal mniej kowalnym. 


Ruch elektronów w metalu — 
obraz klasyczny 

Wprawdzie od początku podkreślaliśmy rolę elektro¬ 
nów walencyjnych w mechanizmie kohezji, wiążącym 
metal w ciało stałe, jednak nasza uwaga skupiała się 
dotychczas głównie na dodatnich jonach, na ich ukła¬ 
dzie i ruchu. Zajmiemy się teraz bezpośrednio samymi 
elektronami walencyjnymi, którym przypisujemy nie¬ 
które najciekawsze i najbardziej charakterystyczne 
właściwości metali. 

Pełny obraz dynamiki elektronów w metalach jest 
w zasadzie możliwy tylko w ramach mechaniki kwan¬ 
towej. Zanim jednak do tego przystąpimy, opiszemy 
model pokrótce model klasyczny wprowadzony przez P. Dru- 
Drudego dego w 1900 r., prawie natychmiast po odkryciu elek¬ 
tronu przez J. J. Thomsona. Na podstawie modelu 
Drudego będziemy w stanie opisać, przynajmniej 
w sposób jakościowy, główne zjawiska elektryczne, 
termiczne i optyczne zachodzące w metalach. Model 
klasyczny daje przy tym intuicyjny, uchwytny dla 
wyobraźni wgląd w procesy elektronowe. Jego usterki 
natomiast uwypuklają subtelności rzeczywistej sytuacji 
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i istotę poprawek, jakie do obrazu klasycznego wpro¬ 
wadza mechanika kwantowa. 

Model Drudego traktuje elektrony walencyjne me¬ 
talu jako gaz elektronów poruszających się swobodnie 
po całej objętości ciała. W trakcie swego ruchu elek¬ 
trony napotykają jony metalu, z którymi (wg dosłow¬ 
nej interpretacji modelu Drudego) zderzają się i zo¬ 
stają w ten sposób rozpraszane w różnych kierunkach. 

Można by stąd wnioskować, że średnia droga między 
zderzeniami (tzw. droga swobodna) porównywalna 
jest z odległością między jonami, a więc jest rzędu 1 A. 

Obraz ten tłumaczy zjawisko przewodnictwa elek- przewodni- 
trycznego w metalach. Jeżeli do próbki metalu przy- ctwo 
łożymy pole elektryczne E , swobodny elektron zostaje elektryczne 

przyśpieszony (w kierunku przeciwnym do E ze wzglę¬ 
du na ujemny ładunek). Przyśpieszanie trwa aż do mo¬ 
mentu zderzenia, które rozprasza elektron w dowol¬ 
nym kierunku, po czym proces przyśpieszania za¬ 
czyna się od nowa. Na skutek tych przeciwstawnych 
wpływów pola elektrycznego i zderzeń powstaje stan 
równowagi — elektron porusza się wtedy ze średnią 

prędkością proporcjonalną do pola E, tzw. prędkością 
unoszenia (dryfową). Jak więc widać, wypadkowy 
transport ładunku elektrycznego, tzn. prąd elektrycz¬ 


ny, proporcjonalny jest do pola E. Obraz Drudego da¬ 
je nam zatem mikroskopowe uzasadnienie prawa 
Ohma. 

Traktowanie elektronów w metalu jako gazu swo¬ 
bodnych, niezależnych od siebie cząstek klasycznych 
prowadzi również do wniosku, że z każdym elektro¬ 
nem wiąże się energia kinetyczna IkT, gdzie k jest 
stałą Boltzmanna, a T —temperaturą bezwzględną 
kryształu. Dzięki swobodzie poruszania się elektrony 
mogą zatem z łatwością pośredniczyć w przewodzeniu 
ciepła, co tłumaczy bardzo duże na ogół przewodnic¬ 
two cieplne w metalach. 

Niestety ten prosty, klasyczny obraz gazu elektro¬ 
nowego zawodzi przy zastosowaniu do kilku innych 
kluczowych zjawisk. Rozpatrzmy np. wyżej wspom¬ 
niane założenie modelu, że w temperaturze T każdy 
elektron walencyjny wnosi energię kinetyczną %kT. 
Zastosowanie tego założenia do zagadnienia ciepła 
właściwego prowadzi do zupełnie błędnej wartości, 
przewyższającej wartość eksperymentalną o kilka 
rzędów wielkości. Co więcej, ponieważ każdy elektron 
ma moment magnetyczny związany ze spinem, nale¬ 
żałoby się spodziewać, że przy przyłożeniu pola ma¬ 
gnetycznego elektronowe momenty magnetyczne u- 
porządkują się wzdłuż pola i metal wykaże wysoką 
wartość namagnesowania. Tamczasem doświadczalna 
wartość podatności magnetycznej metalu jest znowu 
o kilka rzędów wielkości mniejsza od wartości prze¬ 
widywanej na podstawie klasycznego obrazu gazu 
elektronowego. Nie rozpatrujemy tu metali ferro¬ 
magnetycznych, których właściwości magnetyczne 
(-> Teoria magnetyzmu) wiążą się z głębszymi powło¬ 
kami atomu. Eksperymentalne wartości ciepła właści¬ 
wego i podatności magnetycznej sugerują więc, że 
jedynie drobna część elektronów walencyjnych, a nie 
cały gaz elektronowy, bierze udział w tych procesach. 

Obraz Drudego również nie jest w stanie wyjaśnić, 
dlaczego przewodnictwo elektryczne metali bardzo 
szybko wzrasta z obniżaniem się temperatury, często 
osiągając w temperaturze ciekłego helu (w bardzo czy¬ 
stych kryształach) wartości 10M0* razy większe 
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niż w temperaturze pokojowej. W końcu założenie, że 
droga swobodna elektronu w metalu jest rzędu stałej 
sieci kryształu, również zupełnie nie zgadza się z do¬ 
świadczeniem. Na przykład w bardzo czystych krysz¬ 
tałach galu w temperaturze ciekłego helu długość dro¬ 
gi swobodnej jest kilkaset milionów razy większa niż 
odległość międzyatomowa kryształu. 


Ruch elektronów w metalu — 
obraz kwantowy 


Model przedstawiający elektrony walencyjne metalu 
jako gaz swobodnie poruszających się ładunków jest 
w zasadzie zgodny z rzeczywistością. Błąd modelu 
Drudego wynika z dwóch dalszych, mylnych założeń: 
po pierwsze z założenia, że wszystkie elektrony mają 
jednakowy wpływ na wartość ciepła właściwego i po¬ 
datności magnetycznej; po drugie z założenia, że elek¬ 
trony ulegają rozpraszaniu na stacjonarnych jonach 
w sieci kryształu. Te usterki modelu wynikają bezpo¬ 
średnio z traktowania elektronu jako cząstki klasy¬ 
cznej. Jak się zatem przedstawia rzeczywista (a więc 
kwantowa) sytuacja? 

Wróćmy do pojedynczego atomu sodu. Według 
praw mechaniki kwantowej elektrony atomu znajdują 
się na specyficznych poziomach energetycznych (ozna- 
poziomv czon y c ^ na 1 jako powłoki 1 5, 2y, 2p,i 35). Liczba 
enerqetvczne elektronów przypadających na każdą powłokę jest 
u y ściśle ograniczona zakazem Pauliego, skąd też wynika 
struktura powłokowa poszczególnych atomów (-*■ 
Chemia kwantowa). 

Stany kwantowe elektronów w ciele stałym wywo¬ 
dzą się bezpośrednio ze struktury elektronowej ato¬ 
mu. Możemy uwidocznić to w sposób następujący. 
Wyobraźmy sobie atomy w węzłach sieci fikcyjnego 
kryształu, w którym odległość międzyatomowa (stała 
sieci) może być dowolnie zmieniana. Jeżeli odległość 
międzyatomowa jest wielokrotnie większa niż w krysz¬ 
tale rzeczywistym, atomy są odizolowane i ich kwanto¬ 
we stany energetyczne nie różnią się od stanów poje¬ 
dynczego atomu (lewa strona rys. 8). Gdy stała sieci 
fikcyjnego kryształu stopniowo się zmniejsza, oddzia¬ 
ływanie między atomami rozszczepia każdy poziom 



Rys. 8. Powstawanie pasm energetycznych wskutek oddziały¬ 
wania między atomami, na przykładzie sodu (a oznacza stałą 
sieci kryształu rzeczywistego). Jak widać, pasmo odpowiadające 
elektronom walencyjnym jest tylko częściowo obsadzone — do 
energii Fermiego Ef 


elektronowy na szereg podpoziomów. Z każdego po¬ 
ziomu powstajewięc pasmo stanów energetycznych. 

Jak widać z rys. 8 (i jak należałoby się spodziewać), 
zewnętrzne powłoki atomu są najbardziej rozszcze¬ 
pione wskutek oddziaływania z pozostałymi atoma¬ 
mi kryształu. Widzimy również, że elektrony w krysz¬ 
tale nie mogą mieć energii w przedziałach pomiędzy 
dozwolonymi pasmami (tzw. w przerwach energetycz¬ 
nych). 

Wielkość pasm i przerw energetycznych w danym 
krysztale zależy więc od rzeczywistej odległości 
międzyatomowej a (linia przerywana na rys. 8) oraz od 
rodzaju danego pierwiastka. Natomiast liczba stanów 
elektronowych wewnątrz pasma równa się liczbie ato¬ 
mów w krysztale (ściślej — liczbie komórek elementar¬ 
nych w krysztale). Ponieważ w ciele stałym koncentra¬ 
cja atomów jest rzędu 10 23 na cm 3 , stany te leżą tak 
blisko siebie, że energię wewnątrz pasma możemy 
w praktyce uważać za ciągłą. 


Kwantowy gaz elektronowy 


Rozważmy najwyższe pasmo energetyczne, odpo¬ 
wiadające elektronom walencyjnym (35 na rys. 8). 
W krysztale składającym się z N atomów pasmo za¬ 
wiera N stanów kwantowych. Każdemu z tych stanów 

przypisujemy prędkość v, która odróżnia dany stan 
od pozostałych. Wygodnie jest przedstawić to za 
pomocą tzw. przestrzeni prędkości, pokazanej 
w dwóch wymiarach na rys. 9. Chodzi tu o przestrzeń 
formalną, matematyczną, gdzie wzdłuż osi *, y, z od¬ 
kładamy składowe v x , v y > v z wektora prędkości v. Po¬ 
nieważ stany elektronowe w paśmie odpowiadają dy- 



Rys. 9. Przestrzeń prędkości w dwóch wymiarach. Punkty czarne 
oznaczają stany obsadzone, kółka puste odpowiadają stanom 

nieobsadzonym; t?*- oznacza prędkość Fermiego 


skrętnym wartościom v, każdy taki stan można przed¬ 
stawić oddzielnym punktem w przestrzeni prędkości. 
Wszystkie stany pasma będą w ten sposób przedsta¬ 
wione siecią N punktów (rys. 9). Każdemu z dozwo¬ 
lonych stanów (a więc każdemu punktowi) przypisu¬ 
jemy dyskretną wartość energii kinetycznej E = 
= 7* mv t . Tak więc stany mające tę samą wartość v, 
a różniące się jedynie kierunkiem ruchu (rys. 9, stany 
leżące na okręgu o promieniu v) odpowiadają tej sa¬ 
mej wartości energii. 

Zgodnie z zakazem Pauliego, w danym stanie kwan¬ 
towym mogą znajdować się najwyżej dwa elektrony 
(o odwrotnych kierunkach spinów). Odnosi się to nie 
tylko do stanów elektronowych w pojedynczych ato¬ 
mach (o czym wspominaliśmy powyżej), lecz również 
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i do stanów w pasmach energetycznych kryształu. Za¬ 
stosowanie zakazu Pauliego do pasma elektronów wa¬ 
lencyjnych wprowadza ogromnie ważne, zupełnie no¬ 
we (a więc obce obrazowi klasycznemu) właściwości. 
Elektrony walencyjne metalu stopniowo obsadzają 
stany wewnątrz pasma, począwszy od najniżej poło¬ 
żonych poziomów energetycznych (tzn. od najniż¬ 
szych wielkości v) wzwyż, po dwa elektrony na każdy 
stan. 

Pasmo może więc pomieścić 2 N elektronów. Jeżeli 
w danym materiale mamy mniej niż 2N elektronów 
walencyjnych (np. w sodzie mamy ich dokładnie N ), 
pasmo pasmo jest tylko częściowo obsadzone. Pasmo takie 
przewodni- nazywamy z przyczyn, które wyjaśnią się poniżej, 
ctwa pasmem przewodnictwa. W stanie podstawowym (co 
odpowiada temperaturze zera bezwzględnego) pasmo 
przewodnictwa jest obsadzone do pewnej wartości 


7=0K r>OK 



a) b) 

Rys. 10. Rozkład Fermicgo-Diraca: a) dla T = 0 K; b) dJa tempe¬ 
ratury T wyższej od 0 K 


energii Ef , określonej przez liczbę elektronów walen- 
energia cyjnych metalu (rys. lOa). Energię tę nazywamy e- 
Fermiego nergią Fermiego. Charakterystyczną cechą każdego 
metalu jest posiadanie, w stanie podstawowym, takie¬ 
go częściowo obsadzonego pasma przewodnictwa. 

Punktem wyjściowym dla omówienia wielu zjawisk 
elektronowych w metalach jest rozkład energetyczny 
elektronów w paśmie przewodnictwa, otrzymany przez 
E. Fermiego i P. Diraca przy uwzględnieniu zakazu 
Pauliego. Rozkład Fermiego-Diraca, określający licz¬ 
bę elektronów przypadającą na dany obszar energii, 
pokazaliśmy na rys. 11. Wzrost obsadzenia elektrono¬ 
wego (tzn. liczba elektronów przypadająca w danym 
przedziale energii) wraz ze wzrostem energii można 
zrozumieć rysując koło o promieniu v (rys. 9): im 
większa wartość energii (a więc wielkość v), tym więcej 
odpowiada jej stanów. W temperaturze 0 K rozkład 
urywa się skokowo na energii Fermiego (krzywa 
przerywana na rys. 11), w temperaturze wyższej od 
0 K —jest krzywą ciągłą (rys. 11). 



Rys. 11. Obsadzenie stanów elektronowych w funkcji energii 
w temperaturze zera bezwzględnego (stan podstawowy metalu) 
oraz w temperaturze T (przy T = 300 K JcTIEf « 0,005) 


Rozkład Fermiego-Diraca uwidacznia dwie zasad¬ 
nicze różnice pomiędzy kwantowym gazem elektrono¬ 
wym a klasycznym gazem Drudego. W gazie klasycz¬ 
nym wszystkie elektrony reagują na wpływ tempera¬ 
tury T, zyskując średnią energię kinetyczną */ 2 kT. 
W gazie kwantowym natomiast (jak widać z rys. lOb 
i 11), jedynie elektrony odpowiadające stanom w bez¬ 
pośredniej bliskości energii Fermiego przechodzą ze 
wzrostem temperatury T na wyższe poziomy energe¬ 
tyczne. Po drugie, w gazie klasycznym przy T = 0 K 
wszelki ruch ustaje całkowicie, podczas gdy w gazie 
kwantowym zakaz Pauliego „wymaga”, aby elektrony 
poruszały się ze skończoną prędkością nawet w tem¬ 
peraturze zera bezwzględnego (rys. 9). W metalach, ze 
względu na dużą koncentrację elektronów walencyj¬ 
nych, prędkości te dochodzą do 10 8 cm/s. W gazie 
klasycznym prędkości takie odpowiadałyby wzbudze¬ 
niu termicznemu 50 000 K. 

Górną granicę prędkości dla T = 0IC, odpowiada¬ 
jącą energii Fermiego, nazywamy prędkością Fermie¬ 
go vf . Prędkość tę przedstawiliśmy na rys. 9 jako 
promień vf. Ma to następujące znaczenie fizyczne: 
w temperaturze T = 0K wszystkie obsadzone stany 
znajdują się wewnątrz kuli o promieniu vf . Powierzch¬ 
nia kuli o promieniu vf stanowi zatem granicę między 
stanami obsadzonymi i nieobsadzonymi. Powierzch¬ 
nię tę nazywamy powierzchnią Fermiego. 

Powierzchnia Fermiego jest oczywiście pojęciem 
czysto formalnym, przedstawiającym rozkład prędkoś¬ 
ci w kwantowym gazie elektronowym. Jej ogromna 
przydatność przy omawianiu metali wynika stąd, że 
w wielu kluczowych zjawiskach elektronowych (prze¬ 
wodnictwo elektryczne, zachowanie się ciepła właści¬ 
wego, podatności magnetycznej) udział biorą jedynie 
stany elektronowe na powierzchni Fermiego lub poło¬ 
żone w bezpośredniej jej bliskości. 

Możemy to wyjaśnić następująco. Dozwolone 
stany elektronowe, choć dyskretne, położone są ener¬ 
getycznie bardzo blisko siebie. Energia AE pobrana 
przez elektron z zewnętrznego pola elektrycznego, 
z energii cieplnej, względnie z pola magnetycznego 
jest wprawdzie znikomo mała w porównaniu z £>, ale 
jest porównywalna z odstępami dzielącymi poziomy 
energetyczne wewnątrz pasma. Może więc ona powo¬ 
dować zmiany w rozkładzie elektronów. Przejścia ele¬ 
ktronowe są jednak możliwe jedynie wtedy, gdy 
w przedziale energii AE, liczonej od poziomu obsa¬ 
dzonego przez dany elektron, znajdują się stany wolne. 
Zatem będą zachodziły tylko przejścia elektronów ze 
stanów w bezpośrednim sąsiedztwie powierzchni Fer¬ 
miego (jak to pokazaliśmy dla pobudzenia termiczne¬ 
go, tzn. dla energii AE = z UkT, na rys. lOb i 11), bo¬ 
wiem stany powyżej energii Ef są nieobsadzone. Roz¬ 
ważmy jednak elektron na poziomie głęboko poniżej 
energii Fermiego. Wszelkie stany w zasięgu energii 
AE od tego poziomu są całkowicie obsadzone. Takie 
głębokie poziomy są więc niejako „zablokowane” i nie 
biorą wskutek tego udziału w zjawiskach, w których 
zmiany energii powodowane polem zewnętrznym są 
małe w porównaniu z £>. 

Omawiając niepowodzenia teorii Drudego pokaza¬ 
liśmy, że ciepło właściwe i podatność magnetyczna 
metali mają takie wartości, jak gdyby jedynie znikoma 
liczba elektronów miała na nie wpływ. Możemy to te¬ 
raz natychmiast wytłumaczyć na podstawie rozkładu 
Fermiego-Diraca. Jak już mówiliśmy, jedynie elektro¬ 
ny obsadzające stany tuż przy powierzchni Fermiego 
mogą reagować na zmiany temperatury, pobierać 
energię cieplną i wpływać na wartość ciepła właściwe¬ 
go. Z podatnością magnetyczną jest podobnie. W sta¬ 
nie podstawowym metalu na każdy dozwolony stan 
elektronowy wewnątrz powierzchni Fermiego przy¬ 
padają dwa elektrony o odwrotnych kierunkach 
spinu. W tej sytuacji wypadkowy moment magnetycz¬ 
ny metalu równa się oczywiście zeru. Aby namagne¬ 
sować metal przez przyłożenie pola magnetycznego, 
należy część spinów odwrócić, co (ze względu na za¬ 
kaz Pauliego i na całkowite obsadzenie poziomów 
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położonych poniżej Ef) można uzyskać jedynie przez 
przejścia elektronów na poziomy powyżej Ef. Po¬ 
nieważ energia oddziaływania elektronów z polem 
magnetycznym jest mała w stosunku do £>, spośród 
wszystkich elektronów pasma przewodnictwa tylko te 
odpowiadające poziomom tuż przy powierzchni Fer¬ 
miego przyczyniają się do właściwości magnetycznych 
metalu. 


Przewodnictwo elektryczne 

Sprawa przewodnictwa elektrycznego w metalach 
wymaga dokładniejszego omówienia w świetle kwan¬ 
towego obrazu. Elektrony walencyjne w metalu (tzn. 
w paśmie przewodnictwa) są w ciągłym ruchu. Jak 
widać jednak z rys. 9, w nieobecności pola elektrycz¬ 
nego każdemu elektronowi poruszającemu się w da¬ 
nym kierunku odpowiada inny elektron poruszający 
się z dokładnie taką samą prędkością w kierunku 
przeciwnym. W rezultacie, mimo ruchu ładunków, 
wypadkowy prąd elektryczny jest równy zeru. Jeżeli 

teraz przyłożymy pole elektryczne E, spowoduje ono 
przejścia, które odpowiadają przyspieszaniu (a więc 
zwiększaniu wartości v) elektronów poruszających 
się w kierunku przeciwnym do pola (ze względu na 
ujemny ładunek elektronów) oraz hamowaniu (tzn. 
zmniejszaniu v) elektronów poruszających się w kie¬ 
runku pola. W rezultacie powierzchnia Fermiego (tzn. 
przesunięcie powierzchnia, wewnątrz której znajdują się stany ob- 
powierzchni sadzone) zostaje przesunięta w przestrzeni prędkości, 
Fermiego jak na rys. 12. 



Rys. 12. Przesunięcie kuli Fermiego w przestrzeni prędkości pod 
wpływem pola elektrycznego. Koło zaznaczone linią przerywaną 
odpowiada rozkładowi prędkości w nieobecności pola. Wskutek 
rozproszenia elektrony powracają do nieobsadzonych stanów 
pierwotnego rozkładu (strzałki niebieskie) 

Przyspieszanie elektronów przez pole E (a więc 
przesuwanie powierzchni Fermiego) postępowałoby 
w nieskończoność, gdyby nie rozpraszanie elektronów. 
Wskutek rozpraszania otrzymujemy przejścia ze świe¬ 
żo obsadzonych (pod wpływem pola E) stanów do sta¬ 
nów nieobsadzonych, jak pokazano strzałkami na 
rys. 12. W rezultacie, dzięki współzawodnictwu po¬ 
między przyspieszaniem i rozpraszaniem, przesunięcie 
powierzchni Fermiego osiąga pewną stałą wartość v u , 
proporcjonalną do wielkości pola E. Jest to średnia 
prędkość prędkość elektronów w paśmie przewodnictwa; na- 
unoszenia zywamy ją prędkością unoszenia. 

Należy zauważyć, że większość stanów prędkości 
wewnątrz przesuniętej kuli Fermiego była obsadzona 


również i w nieobecności pola. Prądy elektronowe 
wynikające z tych stanów znoszą się (jak znosiły się 
przed przyłożeniem pola) i nie przyczyniają się do 
wypadkowego prądu elektrycznego. Ponieważ w prak¬ 
tyce przesunięcie v u jest nadzwyczaj małe w porówna¬ 
niu z promieniem vf, jedynie stany położone zupełnie 
blisko powierzchni Fermiego ulegają zmianie pod 

wpływem pola E. Możemy więc powiedzieć, że tylko 
elektrony na powierzchni Fermiego biorą udział 
w przewodnictwie elektrycznym. 

Widzimy również na podstawie tego obrazu, że pasmo 
gdyby wszystkie stany pasma (wszystkie punkty na rys. przewodni- 
9) były obsadzone, żadne zmiany w rozkładzie pręd- ctwa 
kości elektronów nie mogłyby nastąpić pod wpływem 
pola. Istnienie pasm tylko w części zapełnionych jest 
więc konieczne dla przewodzenia prądu elektrycznego 
i dlatego też pasma takie nazywamy pasmami prze¬ 
wodnictwa. 


Rozpraszanie elektronów 

Według dosłownej interpretacji modelu klasycznego 
elektrony są rozpraszane przez zderzenia z dodatnimi 
jonami metalu, co ogranicza drogę swobodną elek¬ 
tronu do kilku angstremów. Jak już wspominaliśmy, 
wniosek ten jest w zupełnej sprzeczności z danymi do¬ 
świadczalnymi. Aby sformułować obraz właściwy, 
należy podkreślić, że w kwantowej mechanice elektro¬ 
ny mają charakter podwójny: zachowują się jak cząst¬ 
ki materii, ale równocześnie jak fale. Zgodnie z tym 
obrazem elektron móżemy traktować jako falę płaską, 
której długość (tzw. długość fali de Broglie’a) wyraża 
się wzorem X = hjp t gdzie p = mv jest wielkością 
pędu elektronu, a h — stałą Plancka. 

W oddziaływaniu z jonami metalu, uporządkowany¬ 
mi periodycznie w sieci kryształu, falowy charakter 
elektronów odgrywa decydującą rolę. Można bowiem 
pokazać, że w doskonale periodycznym układzie 
(jakim jest kryształ idealny) fala płaska rozchodzi się 
bez tłumienia. W zastosowaniu do elektronu w krysz¬ 
tale oznacza to, że dzięki swej falowej naturze, może 
on poruszać się na przestrzeni idealnego kryształu 
zupełnie bez rozpraszania! 

Rozpraszanie więc odbywa się nie na jonach two- rozpraszanie 
rżących periodyczny układ kryształu, lecz na zaburzę- na zaburze¬ 
niach idealnie periodycznej sieci. Elektron może się niach sieci 
zderzać z napotykanymi na swej drodze obcymi ato¬ 
mami (domieszkami), z defektami struktury kryształu 
oraz z termicznymi drganiami sieci, fononami (-* Dy¬ 
namika sieci krystalicznej), powodującymi chwilowe 
odchylenia jonów od położenia równowagi. Obraz 
falowo-korpuskularny elektronu od razu więc tłuma¬ 
czy, dlaczego droga swobodna elektronów, mierzona 
w niskich temperaturach w bardzo czystych próbkach 
o wysokim stopniu doskonałości krystalicznej, jest 
tak długa. 


Ruch elektronów w kryształach 
rzeczywistych 

A 

Chcąc podkreślić podstawowe własności kwantowe 
gazu elektronowego przedstawiliśmy, jak dotychczas, 
obraz nieco wyidealizowany, nie uwzględniliśmy bo¬ 
wiem wpływu dodatnich jonów metalu na ruch 
elektronów (poza wzmianką, że w periodycznej sieci 
kiyształu jony nie powodują rozpraszania). W rzeczy¬ 
wistości, jak pokażemy, wpływ sieci kryształu na dy¬ 
namikę elektronów jest bardzo istotny. 

Ustaliliśmy już, że na każde pasmo energetyczne 
przypada tyle oddzielnych, różnych od siebie stanów 
elektronowych, ile mamy komórek elementarnych 
w objętości kryształu (co u większości metali, dzięki 
ich prostej strukturze, równa się po prostu liczbie ato¬ 
mów). Stany te wynikają z oddziaływania między ato¬ 
mami tworzącymi sieć kryształu. Oczywiście w oddzia- 
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ływaniu tym decydującą rolę odgrywa wzajemne poło¬ 
żenie atomów, a więc geometria sieci. 

Po uwzględnieniu szczegółów krystalograficznych 
otrzymujemy następujący obraz: stany dozwolone 
pasma (powiedzmy, że jest ich AO tworzą siatkę skła¬ 
dającą się z N punktów w przestrzeni prędkości (jak na 
rys. 9). Punkty te jednorodnie wypełniają bryłę 
(w przestrzeni prędkości) o kształcie określonym przez 
symetrię danego kryształu (np. zbiór punktów na 
rys. 9 odpowiada dwuwymiarowej sieci kwadratowej). 
Bryłę tę, zawierającą wszystkie stany pasma (bez 
względu na to, czy są one obsadzone czy nie) nazywa¬ 
my strefą Brillouina. 

W praktyce, ze względów formalnych, stosuje się 
tu nie przestrzeń prędkości, lecz analogiczną prze¬ 
strzeń pędu, gdzie wzdłuż osi x , y, z odkłada się skła¬ 
dowe pędu p x , Pv , Pz, odpowiadające poszczególnym 
stanom elektronowym. Przykłady stref Brillouina 
w przestrzeni pędu dla najczęściej spotykanych struk¬ 
tur krystalicznych metali pokazaliśmy na rys. 13. 
Pędy p w bezpośrednim sąsiedztwie granic strefy od- 


energii kinetycznej od wielkości i kierunku pędu mają 
bezpośredni wpływ na kształt powierzchni Fermiego. 
Powierzchnię tę otrzymaliśmy pierwotnie w kształcie 
kuli, opierając się na założeniu, że energia kinetyczna 
zależy tylko od wielkości pędu, E — \mv 2 = p*/2 m. 
W rzeczywistości, jak się okazuje, ta sama wartość 
energii może odpowiadać dwu różnym wielkościom 
prędkości (względnie pędu) w dwu różnych kierun¬ 
kach. Zatem, wskutek anizotropii kryształu, po¬ 
wierzchnia Fermiego przedstawiająca zbiór wszyst¬ 
kich pędów, odpowiadających tej samej wartości 
energii Ef , ulega zniekształceniu. 

Wpływ struktury kryształu, zniekształcający kulę 
Fermiego, możemy zilustrować za pomocą nieco u- 
proszczonego obrazu. Na rys. 15 układ punktów 
przedstawia stany kryształu wypełniające strefę 
Brillouina. Przypominamy, że stany leżące w pobliżu 
granicy strefy są dużo bardziej podatne na wpływ 
sieci kryształu niż stany w głębi strefy (odpowiadające 
długim falom de Broglie’a). Jeżeli energia Fermiego 
Ef jest dużo niższa od górnej granicy pasma (np. 





Rys. 13. Strefy Brillouina w przestrzeni pędu dla kryształów o strukturze: a) regularnej płasko centrowanej; b) regularnej przestrzennie 
centrowanej; c) heksagonalnej 



Rys. 14. Ruch elek¬ 
tronu (strzałki) w 
dwóch różnych kie¬ 
runkach w krysztale 

cym go i hamującym polu elektrostatycznym jonów, 
co wpływa na jego energię kinetyczną. Elektron poru¬ 
szający się wzdłuż linii poziomej (a na rys. 14) na¬ 
potyka jony w mniejszych odstępach czasu niż np. 
elektron poruszający się z tą samą prędkością wzdłuż 
linii b. Mimo identycznej prędkości elektrony te, ze 
względu na różnączęstość oddziaływań z jonami, mają 
różne energie kinetyczne. Podobnie elektron porusza¬ 
jący się z dużą prędkością odczuwa wpływ jonów 
inaczej niż elektron poruszający się wolniej, chociaż 
w tym samym kierunku. 

Wynikające w ten sposób komplikacje w zależności 


powiadają falom elektronowym o długości A = h{p 
porównywalnej ze stałą sieci. Stany odpowiadające 
takim pędom są przez to dużo bardziej czułe na wpływ 
sieci kryształu niż stany odpowiadające mniejszym 
wartościom pędu. 

Rozważmy następnie wpływ struktury kryształu na 
ruch danego elektronu, poruszającego się np. w dwu¬ 
wymiarowym układzie pokazanym na rys. 14. Elek¬ 
tron taki porusza się w na przemian przyśpieszają¬ 


Rys. 15. Ewolucja kształtu powierzchni Fermiego. Przy małych 
koncentracjach elektronów przestrzeń pędu obsadzona przez 
elektrony leży z dala od granic strefy Brillouina, wpływ sieci 
kryształu na kształt powierzchni Fermiego jest zatem mały i po¬ 
wierzchnia pozostaje w przyhliżeniu kulą ( a ). Przy wyższych 
koncentracjach powierzchnia Fermiego leży bliżej granic strefy, 
silnie ulega więc wpływowi sieci kryształu i znacznie odbiega 
kształtem od kuli (ó) 


pasmo wypełnione go połowy, jalc w wypadku sodu), 
wartości pędu odpowiadające tej wartości Ef leżą 
z dala od granicy strefy Brillouina. Wpływ potencjału 
sieci na stany obsadzone jest wtedy względnie mały 
i powierzchnia Fermiego jest w dobrym przybliżeniu 
kulą (<a na rys. 15). Jeżeli natomiast energia Fermiego 
jest wyższa (jak np. dla bardziej skomplikowanych 
dwu- lub więcej wartościowych metali), tak że pęd 
odpowiadający Ef zbliża się do granicy strefy, wpływ 


powierzchnia 
Fermiego 
w kryszta¬ 
łach rze¬ 
czywistych 
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sieci jest znacznie większy i prowadzi do wyraźnej 
anizotropii powierzchni Fermiego (Jb na rys. 15). Co 
więcej, w przypadku wielowartościowych metali mamy 
do czynienia z nakładającymi się na siebie pasmami 
energetycznymi (do czego jeszcze wrócimy) i skutkiem 
tego z kilkoma strefami Brillouina równocześnie. 
Jednakże ten wypadek ze względu na dodatkowe 
komplikacje, przekracza zakres niniejszego artykułu. 


runku osi z. Obecność pola nie wpływa na składową 

ruchu wzdłuż z, natomiast w płaszczyźnie xy elektron 

wchodzi na orbitę, po której krąży z tzw. częstością częstość cy 

cyklotronową. Jego ruch w płaszczyźnie poprzecznej klotronowa 

do H jest zatem ruchem periodycznym. Jak wiadomo, 
wg zasad mechaniki kwantowej energia w ruchu perio¬ 
dycznym ulega kwantyzacji. Toteż energia kinetyczna 
elektronu związana z jego ruchem poprzecznym do 



Rys 16 Przykłady powierzchni Fermiego: a) sód — sieć regularna przestrzennie centrowana, b) miedź — sieć regularna płasko centro¬ 
wana, cj tul (ziemie rzadkie) — sieć heksagonalna o najgęstszym upakowaniu. Powierzchnie Fermiego pokazane są wewnątrz odpowia¬ 
dających im stref Brillouina 


Na rys. 16 pokazaliśmy przykłady powierzchni 
Fermiego kilku rzeczywistych metali. U góry przed¬ 
stawiony jest przypadek sodu. Struktura krystaliczna 
sodu odpowiada sieci regularnej centrowanej prze¬ 
strzennie. Powierzchnia Fermiego (wewnątrz której 
znajduje się dokładnie połowa stanów pasma, a więc 
połowa objętości strefy Brillouina) jest względnie 
odległa od granic strefy, toteż prawie zupełnie nie ule¬ 
ga zniekształceniu i zachowuje kształt kuli (według 
pomiarów doświadczalnych z dokładnością Viooo)- 
Miedź krystalizuje w strukturze regularnej płasko 
centrowanej, co odpowiada strefie Brillouina poka¬ 
zanej na rys. 13a. Podobnie jak sód, miedź ma jeden 
elektron walencyjny, a więc i tutaj powierzchnia 
Fermiego wypełnia dokładnie połowę objętości 
strefy. Jeżeli wpiszemy kulę o tej objętości w strefę 
Brillouina miedzi, zauważymy, że w niektórych 
punktach powierzchnia kuli (ze względu na specyficz¬ 
ną geometrię strefy) bardzo się zbliża do granic strefy. 
Zgodnie z wyżej opisanym rozumowaniem prowadzi 
to w miejscach zbliżenia do zniekształcenia pierwot¬ 
nej kuli Fermiego. Powierzchnia Fermiego miedzi, 
skonstruowana na podstawie danych doświadczalnych 
i pokazująca odchylenia od sferyczności (tzw. szyjki) 
w miejscach największego zbliżenia do granic strefy 
Brillouina, pokazana jest na rys. 16b. Również na 
rys. 16 pokazaliśmy powierzchnię Fermiego dla bar¬ 
dziej egzotycznego przypadku tulu (dwuwartościowy 
metal z grupy ziem rzadkich, struktura heksagonalna), 
ilustrując nader złożoną strukturę, na jaką napotyka¬ 
my w bardziej skomplikowanych (a więc wielowartoś- 
ciowych) materiałach. 


Poziomy Landaua \ oscySacje kwantowe 

Powierzchnia Fermiego danego metalu stanowi zwarty 
(choć nieco abstrakcyjny) opis jego właściwości elek¬ 
tronowych, np. przewodnictwa elektrycznego, własno¬ 
ści magnetycznych. Topologia powierzchni Fermiego 
jest więc obiektem intensywnych badań doświadczal¬ 
nych współczesnej fizyki. Bardzo pomocne w ustala¬ 
niu szczegółów powierzchni Fermiego jest m.in. zja¬ 
wisko de Haasa-van Alphena (i pokrewne mu zjawisko 
Szubnikowa-de Haasa), wynikające z zachowania się 
elektronów w silnym polu magnetycznym. 

Rozpatrzmy ruch swobodnego elektronu w obec¬ 
ności pola magnetycznego H , przyłożonego np. w kie- 


H (tzn. ze składowymi pędu p x i py ) może mieć tylko 
pewne ściśle określone, kwantowe wartości. Te do¬ 
zwolone poziomy energii, nazywane poziomami 
Landaua, wyrażone są wzorem: 

2 2 poziomy 

El = (l+\)hoc = Landaua 

Im 

gdzie / jest dowolną liczbą całkowitą, co c — częstością 
cyklotronową, a m — masą efektywną elektronu; 
h = k/2n. 

Kwantyzacja Landaua wpływa drastycznie na roz¬ 
kład stanów w przestrzeni pędu, oznacza bowiem, że 
jedynie niektóre składowe pędu w płaszczyźnie prosto¬ 
padłej do pola są dozwolone. Pokazaliśmy to na rys. 

17, przedstawiającym przekrój przestrzeni pędu w pła¬ 
szczyźnie xy. Punkty na rys. 17a, oznaczające dozwo¬ 
lone stany w nieobecności pola, muszą się przemieś¬ 
cić i „osiąść” na stanach odpowiadających energiom 
Ei (rys. 17b). Stany obsadzone, które w nieobecności 



Rys. 17. Wpływ pola magnetycznego na rozkład stanów w prze¬ 
strzeni pędu 


pola wypełniały przestrzeń wewnątrz powierzchni 
Fermiego jednorodną, gęstą siatką punktów, pod 
wpływem pola przemieszczają się (pozostając jednakże 
wewnątrz powierzchni Fermiego) na stany leżące na 
powierzchniach cylindrycznych („rurach”) o stałym 
przekroju, z osią skierowaną wzdłuż pola magnety¬ 
cznego H, jak to widać na rys. 18. Obecność pola 
magnetycznego nie wprowadza ograniczeń wartości 


35 - Łncvklupciłiii łtzvki współczesnej 
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Rys. 18. Rozkład elektronów w przestrzeni pędu w obecności 

pola H w wypadku sferycznej i anizotropowej powierzchni Fer¬ 
miego. Elektrony mogą obsadzać jedynie stany zawarte wewnątrz 
powierzchni Fermiego (linia przerywana) i położone na rurach 
/= 0, 1,2,3... 

pędu wzdłuż H. Na rys. 18b przedstawiliśmy rozkład 
stanów, gdy powierzchnia Fermiego jest bardziej 
skomplikowana. 

Przekrój „rury” stanów odpowiadającej poziomowi 
Ei ma pewną stałą wartość A z, proporcjonalną do wiel¬ 
kości pola H. Przy zwiększaniu pola, z chwilą gdy 
Ai przekroczy maksymalną wartość przekroju po¬ 
wierzchni Fermiego w płaszczyźnie prostopadłej do 
pola, elektrony obsadzające /-ty poziom Landaua 
„przelewają” się na poziomy niższe (/= 1, /=2,... itd.) 
w taki sposób, aby pozostać wewnątrz powierzchni 
Fermiego. Takiemu „przelaniu” się elektronów towa¬ 
rzyszą mierzalne zmiany w przewodnictwie, namagne¬ 
sowaniu i innych zjawiskach elektronowych. W typo¬ 
wych polach magnetycznych rzędu jednej tesli mamy 
wiele tysięcy poziomów Landaua poniżej energii £>, 
które w miarę zwiększania pola jeden po drugim 
„przerastają” powierzchnię Fermiego. Takie kolejne 
„przelewanie” się elektronów na coraz to niższe 
poziomy objawia się w bardzo niskich temperaturach 
oscylacje w ^ orm ^ e oscylacji zjawisk elektronowych jako funk- 
kwantowe C P P oIa > tzw - oscylacji kwantowych. Oscylacje kwan- 
namagneso- towe wart °ści namagnesowania nazywamy efektem 
wania i prze- Haasa-van Alphena, zaś oscylacje przewodności 
wodnictwa elektrycznej — efektem Szubnikowa-de Haasa. Moż¬ 
na pokazać, że oscylacje kwantowe danych wielkości 
są periodyczną funkcją l/i/, a okres oscylacji jest 
proporcjonalny do maksymalnego przekroju po¬ 
wierzchni Fermiego w płaszczyźnie prostopadłej do H . 
Zjawiska te nadają się idealnie do badania nieizotro- 
powych powierzchni Fermiego. Przez pomiar okresu 
oscylacji namagnesowania lub prądu dla różnych 
kierunków pola względem kryształu możemy ustalić 
maksymalne wartości przekroju powierzchni Fermiego 
dla tych kierunków, a zatem topologię powierzchni 
Fermiego z wielką dokładnością. Oscylacje kwantowe 
stanowią więc jedną z najbardziej owocnych, naj¬ 
częściej stosowanych metod badania podstawowych 
właściwości metali. 

Należy dodać, że do obserwowania efektu de 
Haasa-van Alphena i innych oscylacji kwantowych 
muszą być spełnione następujące dwa warunki 
eksperymentalne. Po pierwsze, czas relaksacji elek¬ 
tronu winien być dłuższy od okresu cyklotronowego 
(<ł> c T>l), tak aby droga elektronu między zderze¬ 
niami równała się przynajmniej jednej orbicie cyklo¬ 
tronowej. Po drugie, różnica energii między pozio¬ 
mami Landaua powinna przekraczać energię termicz¬ 
ną elektronu (hco c >kT). Warunki te mogą być spełnio¬ 
ne jedynie w bardzo czystych próbkach, w niskich 
temperaturach (około temperatury ciekłego helu) 
oraz w wysokich polach magnetycznych (rzędu 1 T 
i więcej). 

Efekt de Haasa-van Alphena, a więc oscylacje 
kwantowe namagnesowania w funkcji pola magne¬ 
tycznego, mierzy się przeważnie jednym z dwu sposo- 
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bów. W pierwszym z nich wykorzystujemy fakt, że 

w obecności pola magnetycznego H próbka „odczu¬ 
wa” moment siły proporcjonalny do jej namagneso¬ 
wania M (tzn. do jej momentu magnetycznego), jeżeli 
Mi //nie są równoległe. Sytuacja taka występuje, gdy 

powierzchnia Fermiego jest niesferyczna, a pole H 
skierowane jest dowolnie (tzn. nie wzdłuż osi symetrii). 
Jeżeli zawiesimy próbkę na cienkim a sztywnym prę¬ 
ciku, ulegnie ona skręceniu pod działaniem momentu 
siły wywieranym przez pole. Mierząc położenie 
kątowe tak zawieszonej próbki w funkcji pola otrzy¬ 
mujemy bezpośredni pomiar oscylacji kwantowych 
namagnesowania. Okres oscylacji daje nam, jak już 
wspomniano, wartość ekstremalną przekroju po¬ 
wierzchni Fermiego w płaszczyźnie prostopadłej do 

H. Mierząc zatem zależność okresu oscylacji, (a więc 
zależność ekstremalnego przekroju powierzchni Fer¬ 
miego) od kierunku pola możemy w wielu wypadkach 
wnioskować o kształcie powierzchni Fermiego 
w trzech wymiarach. 

Druga metoda badania oscylacji de Haasa-van 
Alphena polega na pomiarze napięcia indukowanego 
zmiennym polem magnetycznym dH/dt w cewce in¬ 
dukcyjnej otaczającej próbkę metalu. Można poka¬ 
zać, że napięcie to będzie proporcjonalne do dM(dt = 
= (< dM/dH)(dHldt), gdzie M jest namagnesowaniem 
próbki. Jeżeli namagnesowanie M oscyluje w funkcji 
pola H, to przy równomiernej zmianie pola dHjdt 
oscylacje te obserwować będziemy bezpośrednio 
jako oscylacje w indukowanym napięciu cewki 
w funkcji czasu. Metoda indukcyjna nadaje się szcze¬ 
gólnie do zastosowania w wypadku magnesów impul¬ 
sowych, dzięki którym otrzymujemy wzrost pola od 
zera do kilkudziesięciu tesli w przeciągu kilku tysięcz¬ 
nych sekundy. Oscylujący sygnał indukowany w cewce 
można obserwować bezpośrednio na ekranie oscylo¬ 
skopu. 

Wspominaliśmy już, że oscylacje kwantowe wystę¬ 
pują również w zjawiskach transportu w metalach 
(tzw. zjawisko Szubnikowa-de Haasa), które może¬ 
my badać np. przez pomiar oporu próbki w funkcji po¬ 
la magnetycznego. Należy dodać, że oscylacje kwanto¬ 
we występują właściwie w każdym zjawisku, w którym 
biorą udział elektrony przewodnictwa. Możemy je 
zatem również obserwować w takich zjawiskach elek¬ 
tronowych, jak rozchodzenie i tłumienie ultradźwięku 
w metalach, siła termoelektryczna, przewodnictwo 
cieplne, tłumienie fal o częstościach radiowych (tzw. 
fal hel ikonowych), magnetostrykcja (zmiany objętości 
próbki pod wpływem pola) i wiele innych. 


EVletaSe jedno- 
i wielo wartościowe 

Podstawową cechą charakterystyczną metalu, odróż¬ 
niającą go od innych materiałów, jest posiadanie 
pasm energetycznych,w których tylko część stanów 
jest obsadzona przez elektrony nawet przy f=0K 
(tzn. w stanie podstawowym metalu). W krysztale skła¬ 
dającym się z N komórek elementarnych (co w wię¬ 
kszości metali odpowiada po prostu N atomom), na 
każde pasmo przypada N różniących się od siebie, od¬ 
dzielnych stanów. Każde pasmo może zatem pomie¬ 
ścić, zgodnie z zakazem Pauliego, 2 N elektronów. 

Widać z tego, że pierwiastki jednowartościowe 
o prostych strukturach krystalicznych, wnoszące do 
pasma przewodnictwa tylko po jednym elektronie na 
komórkę elementarną (jak np. sód lub miedź), wy¬ 
pełniają pasmo dokładnie do połowy i muszą być 
metalami. 

Czym jednak wytłumaczyć, że pierwiastki dwuwar- 
tościowe (np. beryl, cynk, żelazo) lub nawet niektóre 
czterowartościowe (cyna, ołów) są również metalami? 
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berył Rozpatrzmy przykład berylu, którego atom ma 2 
elektrony w stanie 2 s, a więc pełną powłokę, co powin¬ 
no odpowiadać całkowicie obsadzonemu pasmu 
w krysztale. Wydawałoby się więc, że beryl powinien 
być izolatorem. Gdy jednak zbliżamy atomy berylu do 
siebie, tworząc kryształ (jak na rys. 19), oddziaływanie 



Rys. 19. Nakładanie się pasm w wypadku berylu (a odpowiada 
stałej sieci kryształu rzeczywistego) 

między atomami rozszczepia całkowicie obsadzoną 
powłokę elektronową 2 s oraz nieobsadzeną powłokę 
2 p tak dalece, że odpowiadające im pasma nakładają 
się na siebie. Ponieważ układ jako całość dąży do stanu 
o najniższej energii, elektrony z najwyżej położonych 
poziomów pasma 2 s „przelewają” się do niżej od nich 
leżących poziomów w paśmie 2 p. W wyniku tego ma¬ 
my dwa niecałkowicie obsadzone pasma. Obydwa 
zatem pasma biorą udział w przewodnictwie elektrycz¬ 
nym i innych zjawiskach elektronowych. Jak widać 
z rys. 19, stopień nałożenia się pasm jest określony 
przez wartość stałej sieci: gdyby odległość między ato¬ 
mami kryształu była nieco większa, nałożenie się 
pasm nie nastąpiłoby i beryl byłby półprzewodni¬ 
kiem. 

wpływ Mała różnica w stałej sieci może zatem spowodować 
ciśnienia ogromne zmiany w fizycznych właściwościach ma¬ 
teriału. Warto wspomnieć, że przy zastosowaniu wy¬ 
sokich ciśnień do niektórych niemetali powodujemy 
zmiany w strukturze krystalicznej i w odległościach 
międzyatomowych, w wyniku których możemy otrzy¬ 
mać nakładanie się pasm i materiał staje się wtedy 
metalem. Pod bardzo wysokim ciśnieniem obserwo¬ 
wano przejścia w fazę metaliczną takich pierwiastków 
jak german, krzem i nawet (pod ciśnieniem powyżej 
10 5 MPa) diament! 

Nasuwa się również pytanie, dlaczego nie wszystkie 
pierwiastki o nieparzystej wartościowości są metalami. 
Mogłoby się wydawać, że w przypadku takich pier¬ 
wiastków pasma odpowiadające zewnętrznym po¬ 
włokom atomów są z konieczności tylko częściowo 
obsadzone. Rozważmy to na przykładzie wodoru. 

wodór Wodór jest pierwiastkiem jednowartościowym, w sta¬ 
nie stałym (wodór stały otrzymujemy pod wysokim 
ciśnieniem w niskich temperaturach) jest izolatorem. 
Wynika to stąd, że wiązanie atomów wodoru w czą¬ 
steczce H 2 jest bardzo silne i w stanie stałym wodór jest 
siecią cząsteczek H 2 , a nie atomów. Wodór tworzy 
zatem tzw. kryształ molekularny, w którym (w odróż¬ 
nieniu od prostych układów krystalicznych) na komór¬ 
kę elementarną przypada cząsteczka, a więc dwa e- 
lektrony. W krysztale wodoru mamy więc dokładnie 
tyle elektronów (2 N), ile mieści całkowicie obsadzone 
pasmo energetyczne. Teoria jednak przewiduje, że pod 
niezwykle wysokim ciśnieniem (ponad 2-10 5 MPa) 
wodór stały zmienia swą strukturę krystaliczną i rze¬ 
czywiście staje się metalem. Doświadczenia nad o- 
trzymaniem fazy metalicznej wodoru są obecnie 
w toku. Informacje na ten temat znajdzie Czytelnik 
w artykule „Wysokie ciśnienia”. 


Optyczne właściwości metali 

Metale zwracają na siebie uwagę przez swój pięk¬ 
ny, metaliczny połysk. Optyczne właściwości metalu 
podobnie jak i inne ich cechy charakterystyczne, 
wynikają również w głównej mierze z istnienia nie¬ 
zupełnie obsadzonych pasm energetycznych (a więc 
z istnienia gazu elektronowego). Rozważmy falę świet¬ 
lną o częstością) padającą na gaz swobodnych elektro¬ 
nów. Fala poprzez swoje pole elektryczne zmusza 
elektrony do drgań o tej samej częstości co , co z kolei 
daje zmienną w czasie polaryzację ośrodka. Faza, 
z którą swobodne elektrony oscylują pod wpływem 
fali, jest przy tym taka, że wynikająca z ruchu elektro¬ 
nów polaryzacja jest ujemna (tzn. odwrotna w fazie do 
elektrycznego pola fali). Jak się okaże, z tego właśnie 
faktu wynikają główne cechy optyczne metali. 

Polaryzacja ośrodka może być formalnie wyrażona 
przez tzw. efektywną przenikalność elektryczną (prze- 
nikalność względna) która z kolei stanowi punkt 
wyjściowy przy omówieniu właściwości optycznych 
materiałów. Dla metalu * można wyrazić z dobrym 
przybliżeniem jako: 

* = 1 —(ne 2 łnico 2 e 0 ) = 1 —(cOp/co 2 ), 

gdzie n jest koncentracją elektronów na 1 cm 3 , e — 
ładunkiem, m — masą elektronu, c 0 — przenikalnoś- 
cią próżni, a co p — tzw. częstością plazmową. Człon 
ne 2 lmcoh 0 przedstawia wspomniany wyżej ujemny 
przyczynek swobodnych elektronów do polaryzacji 
ośrodka. Ze względu na dużą koncentrację elektro¬ 
nów w metalach, wartość tego członu w obszarze wi¬ 
dzialnym, podczerwonym i w niższych częstościach 
jest bardzo duża w porównaniu z jednością, a więc 
przenikalność elektryczna x dla tych obszarów czę¬ 
stości ma również wartość ujemną. 

Z równań Maxwella wiemy, że w ośrodku o ujemnej 
przenikalności elektrycznej fale elektromagnetyczne 
nie mogą się rozchodzić. W tych warunkach fale 
świetlne nie mogąc przeniknąć do wnętrza ośrodka, 
zostają całkowicie odbite, niezależnie od częstości. To 
tłumaczy kolor, połysk i brak przezroczystości 
„białych” metali, takich jak srebro lub aluminium. 
Gładkie powierzchnie tych metali, odbijając światło 
w całym obszarze widzialnym, stanowią idealne lu¬ 
stra. Patrząc na błyszczący metal, możemy więc 
powiedzieć że w zasadzie „widzimy” swobodne elek¬ 
trony. 

W powyższym opisie pominęliśmy wpływ absorpcji 
światła. Absorpcja światła przez gaz elektronowy 
spowodowana jest rozpraszaniem elektronów i wyra¬ 
ża się przez poprawkę do x rzędu v/co, gdzie v jest śred¬ 
nią częstością zderzeń. Dla typowych wartość i 
v (KP-10 14 Hz) i dla częstości optycznych (5 • 10 15 Hz) 
poprawka ta jest tak mała, że możemy ją pominąć. 

W naszych rozważaniach nie uwzględniliśmy rów¬ 
nież istnienia niżej położonych, całkowicie obsadzo¬ 
nych pasm energetycznych, takich jak np. pasmo 2 p 
na rys. 8. W większości metali pasma te odpowiadają 
tak niskim energiom w stosunku do pasma elektro¬ 
nów swobodnych, że w zakresie widzialnym energia 
kwantu światła (fotonu) hayjln jest za mała, aby spo¬ 
wodować przejścia elektronowe z tych głęboko po¬ 
łożonych pasm (A na rys. 20a) do poziomów nieob- 
sadzonych (pasmo B). Fale świetlne nie wywołują więc 
żadnych zmian w takich całkowicie obsadzonych 
pasmach. W rezultacie pasma te nie wnoszą nic no¬ 
wego do naszego obrazu właściwości optycznych 
metali. 

Jednakże w wypadku niektórych metali (np. zło¬ 
ta lub miedzi) sprawa przedstawia się inaczej. Energia 
dzieląca pasmo przewodnictwa od niższych pasm jest 
w tych metalach względnie mała, mniej więcej tego 
samego rzędu co energia kwantu hco/lK dla krótszych 
fal widzialnego widma. Zatem fale poniżej pewnej 
długości mogą spowodować przejścia między pas¬ 
mami, tak jak na rys. 20b. W złocie i miedzi energie 
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Rys. 20. Mechanizm absorpcji przez przejścia międ 2 ypasmowe: 
a) energia fotonu jest zbyt mała, aby wywołać przejścia z pasma A 
do stanów nieobsadzonych w paśmie B , b) różnica energii między 
pasmami jest mniejsza, co umożliwia przejścia międzypasmowe 
i związaną z nimi absorpcję w obszarze widzialnym 


barwa złota powodujące takie przejścia odpowiadają falom krót- 
i miedzi sz y m od 500 nm » a w ^ c obszarowi niebieskiemu i fio¬ 
letowemu widma. Fale z tego obszaru widma będą 
więc pochłaniane i częściowo usunięte z odbitego 
przez metal światła. W widmie odbitego światła 
przeważać zatem będą fale dłuższe, a więc światło 
czerwone, pomarańczowe i żółte, co tłumaczy ciepły 
kolor tych metali. Na rys. 21 porównujemy współ¬ 
czynniki odbicia dla srebra i złota, odróżniające metal 
kolorowy i biały. 

Pokazaliśmy poprzednio, że przenikalność elek¬ 
tryczna metali « ma wartość ujemną ze względu na 


wysoką wartość członu ne z jma> 2 e 0 = co^/co 2 . Człon 
ten zmniejsza się jednak z wzrastaniem częstości 
i dla w = <o p w obszarze nadfioletu osiąga wartość 1. 
Dla częstości wyższych od o> p przenikalność elek- 



Rys. 21. Zależność współczynnika odbicia od długości fali dla 
srebra i dla złota 


tryczna * staje się więc dodatnia. Toteż w obszarze 
bardzo krótkich fal (nadfiolet i krótsze) metal staje 
się przeźroczysty i zachowuje się nie inaczej niż dia¬ 
ment lub kwarc w widzialnym zakresie widma. 

M. Ya. Azbel, M. I. Kaganov, I. M. Lifshitz Conduction 
Elcctrons in Metals , Sc. Am. 228, 88 (1973): A. H. Cottrell 
The Naturę of Metals. Sc. Am. 217, 90 (1967); L. Kalinowski 
Fizyka metali, Warszawa 1970; A. R. MacxintOSH The Fermi 
Surface of Metals , Sc. Am. 209, 110 (1963). 


Dielektryki 

Bożena Hilczer 

Dielektrykami (izolatorami) przyjęto nazywać ma¬ 
teriały, które w danych warunkach termodynamicz¬ 
nych (określonej temperaturze i ciśnieniu) mają 
przerwę energetyczną (-* Struktura elektronowa ciał 
stałych) większą od 3 eV, stałoprądową przewodność 
elektryczną w polach poniżej 10 7 V/m mniejszą od 
gromadzenie 10 ‘ 6 oraz tangens kąta strat w zakresie 

ładunku częstości od 50 Hz do 10 6 Hz mniejszy od 0,5. Są to 
kryteria formalne. Najważniejszą własnością fizyczną 
dielektryków jest zdolność do gromadzenia ładunku 
elektrycznego. Własność ta jest znana już bardzo 
dawno. Wyniki eksperymentów z ciałami naładowa¬ 
nymi elektrycznie pozwoliły ustalić prawidłowości 
powszechnie znane jako prawo Coulomba. Stała ma¬ 
teriałowa charakteryzująca ośrodek ze względu na od¬ 
działywanie ładunków zwana jest przenikalnością 
elektryczną e. Z elektrostatyki wiemy również, że 
umieszczenie dielektryka w jednorodnym polu elek¬ 
trycznym powoduje zmianę gęstości linii sił pola 
elektrycznego, zależną od wielkości przenikalności 
elektrycznej dielektryka. Najprostszym przykładem 
jednorodnego pola elektrycznego jest pole panujące 
w kondensatorze płaskim (o powierzchniach okładek 
a odległych o d) umieszczonym w próżni, do którego 
przyłożono napięcie XJ. Na okładkach kondensatora 
zgromadzony jest ładunek Go, linie sił pola elek¬ 
trycznego są prostopadłe do okładek (gdy pominiemy 
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efekty brzćgowe), a natężenie pola elektrycznego 
E = U Id. Znając gęstość D strumienia linii sił pola 
elektrycznego (tzw. przesunięcie elektryczne) oraz 
natężenie E pola elektrycznego możemy wyznaczyć 
przenikalność elektryczną próżni jako stosunek prze¬ 
sunięcia elektrycznego w próżni do natężenia pola 
elektrycznego: e 0 = D/E = C 0 d/a. Wartość przeni¬ 
kalności elektrycznej próżni można doświadczalnie 
wyznaczyć mierząc za pomocą galwanometru bali¬ 
stycznego ładunek Go; wynosi ona s 0 = 8,85*10' 12 
F/m. Gdy między okładkami kondensatora płaskiego 
mającego w próżni pojemność C 0 umieścimy dielek¬ 
tryk, to pojemność jego wzrośnie do wartości C = 
= eC 0 . Liczbę określającą ile razy pojemność kon¬ 
densatora zawierającego dielektryk jest większa od 
pojemności takiego samego kondensatora próżnio¬ 
wego nazywamy przenikalnością elektryczną e. Jeżeli 
do kondensatora z dielektrykiem przyłożymy prze¬ 
mienne napięcie U = U 0 e iolt , to w obwodzie popły¬ 
nie prąd, który w wypadku dielektryka idealnego 
(bezstratnego) będzie wyprzedzał napięcie w fazie 
o tu/ 2 (rys. Ib). Ogólnie, w dielektryku realnym 
(stratnym) oprócz prądu przesunięcia popłynie prąd 
przewodzenia o fazie zgodnej z przyłożonym napię¬ 
ciem (rys. lc) i przenikalność elektryczną wyraża się 
jako wielkość zespoloną e* = e'—ie", gdzie e ozna¬ 
cza rzeczywistą składową przenikalności elektrycznej. 
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Rys. 1. Relacje fazowe między natężeniem prądu 7 i napięciem U: 
a) kondensator próżniowy, b) kondensator z dielektrykiem bez¬ 
stratnym, c) kondensator z dielektrykiem stratnym 


natomiast e" — składową urojoną, charakteryzującą 
straty dielektryczne. Straty dielektryczne przyjęto 
określać wielkością tg <5, czyli stosunku natężenia 
prądu zgodnego w fazie z napięciem do natężenia 
prądu przesunięcia: tg <5 = a>e"C 0 UI<oe'C 0 U =ą e"ie. 
Często do opisu własności dielektryków stratnych 
stosuje się również wielkość G, zwaną przewodnością 
elektryczną, określoną jako iloczyn częstości kołowej 
i urojonej części przenikalności elektrycznej: 
G — a>e 0 e". Wielkość ta opisuje straty energii zwią¬ 
zane z różnymi procesami zachodzącymi w dielek¬ 
tryku. 


Przewodnictwo elektryczne 

Prąd płynący po przyłożeniu do dielektryka stałego 
pola elektrycznego zanika w czasie. Jest to konsek¬ 
wencja czasowej zmiany przewodności elektrycznej 
dielektryka, określonej stosunkiem gęstości prądu 
do natężenia pola elektrycznego. Od wartości prze¬ 
wodności elektrycznej a w stanie ustalonym (gdy 
czasowe zmiany są mniejsze niż kilka procent na go¬ 
dzinę) zależą własności elektryczne dielektryków. 
Jak wspomnieliśmy na wstępie, przewodność elek¬ 
tryczna dielektryków jest mała; w dobrych dielektry¬ 
kach w warunkach normalnych jest mniejsza nawet 
od 10~ 18 O~ 1 m _1 . Przy niskich temperaturach prze¬ 
wodność elektryczna dielektryków bardzo słabo 
zależy od temperatury (rys. 2), a ruchliwość nośni¬ 
ków prądu mieści się w przedziale od 10 -14 do 10~ 4 



Rys. 2. Schematyczne przedstawienie temperaturowej zależności 
przewodnictwa elektrycznego dielektryków 


m 2 /Vs. Ze wzrostem temperatury ruchliwość nośni¬ 
ków prądu rośnie, wiemy jednak, że rośnie również 
liczba nośników prądu (-+■ Półprzewodniki). Ponie¬ 
waż przewodność elektryczna zależy zarówno od 
liczby nośników jak i od ich ruchliwości, a obie te 


wielkości zależą od temperatury w sposób aktywa¬ 
cyjny, to temperaturową zależność przewodności prawo 
elektrycznej dielektryków <j opisuje dobrze prawo Arrheniusa 
Arrheniusa (rys. 2): a = cr 0 e- w '/ fcr , gdzie W oznacza 
energię aktywacji. 

Zastanówmy się teraz, jakie są możliwe sposoby 
transportu elektrycznego w dielektrykach. Aby zmie¬ 
rzyć przewodność elektryczną dielektryka, musimy 
nałożyć na niego elektrody metalowe i przyłożyć 
zewnętrzne pole elektryczne. Diagram struktury pas¬ 
mowej dielektryka z nałożonymi elektrodami jest 
przedstawiony schematycznie na rys. 3a, a zagięcie 
pasm w pobliżu zetknięcia powierzchni metalu i die¬ 
lektryka zależy od pracy wyjścia obydwu materiałów. 



Rys. 3. Struktura pasmowa układu metal-dielektryk-mctal (a) 
i schematyczne przedstawienie tunelowania oraz przewodnictwa 
hoppingowego (b) 


W niezbyt silnych polach elektrycznych (mniejszych 
niż 10 7 V/m) jednym z możliwych mechanizmów 
transportu ładunku w takim układzie jest ruch elek¬ 
tronu lub dziury w pasmach dozwolonych. Poruszający 
się w dielektryku elektron (lub dziura) wywołuje 
jednak lokalną polaryzację sieci, przemieszczającą 
się wraz z nim. Obiekt taki, zachowujący się zupełnie 
inaczej niż swobodny elektron, nazywamy polaro- 
nem. Drugim możliwym mechanizmem jest transport 
elektronów (lub dziur) przez pasmo wzbronione. 
W idealnym dielektryku jest to możliwe tylko w wy¬ 
niku kwantowego procesu tunelowania w bardzo 
cienkich kryształach (o grubościach mniejszych niż 
3 nm). W rzeczywistych dielektrykach defekty sieci 
krystalicznej powodują powstanie paśmie wzbro¬ 
nionym lokalnych, dozwolonych poziomów energe¬ 
tycznych, zwanych poziomami pułapkowymi. Jeżeli 
gęstość lokalnych poziomów pułapkowych jest duża 
i odległości między nimi są małe (mniejsze niż 3 nm), 
to mogą wystąpić zjawiska kwantowe i elektrony 
w przyłożonym polu elektrycznym będą się poruszać 
skacząc od jednej pułapki do drugiej (rys. 3b). Prze¬ 
wodnictwo związane z tym zjawiskiem nazywa się 
przewodnictwem hoppingowym. Przewodnictwo elek¬ 
tryczne dielektryków może mieć również charakter 
jonowy. W tym wypadku transport ładunku w polu 
elektrycznym jest związany z ruchem jonów między 
położeniami międzywęzłowymi lub lukami w węzłach 
sieci, podobnie jak w kryształach jonowych. Ogólnie 
w dielektrykach można wyróżnić kilka możliwych 
mechanizmów transportu elektrycznego. Przewod¬ 
nictwo elektryczne może być związane z ruchem 
elektronów (lub dziur) w obrębie dozwolonych pasm 
energetycznych i proces ten opisuje formalizm ruchu 
polaronów z ruchem elektronów (lub dziur) przez 
pasmo wzbronione, co prow r adzi do procesu tunelo¬ 
wania lub hoppingu, oraz z ruchem ujemnie lub 
dodatnio naładowanych jonów między defektami 
punktowymi sieci. 
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Polaryzacja dielektryczna 

Przyłożenie stałego napięcia U do płaskiego konden¬ 
satora próżniowego spowoduje naładowanie go do 
pojemności C 0 , takiej, aby swobodne ładunki na każ¬ 
dej okładce wytworzyły różnicę potencjałów równą 
co do wielkości U , lecz o przeciwnej polamości 


o 4* 

U 

? — 

1 +' 4- .. + .4-' 4- 4* 4- f 


L-.— . rr 




*> 4- 
U 

— 

[ 4* 4- 4*4- 4* 4* f 


Rys. 4. Wpływ dielektryka na gęstość ładunku na okładkach kon¬ 
densatora 


(rys. 4a). Dielektryk o przenikalności elektrycznej c 
umieszczony między okładkami takiego kondensa¬ 
tora zwiększy jego pojemność, gdyż na okładki kon¬ 
densatora musi dopłynąć ze źródła ładunek kom¬ 
pensujący ładunek polaryzujący dielektryka (rys. 4b). 
Efekt polaryzacji związany jest z orientacją dipoli 
elektrycznych (indukowanych i trwałych) pod wpły¬ 
wem przyłożonego pola elektrycznego. Powstała 
polaryzacja dielektryczna Pjest określona wielkością 
momentu dipolowego jednostki objętości dielektryka. 
Z rys. 4b widać, że polaryzację dielektryka można 
określić również jednoznacznie gęstością ładunków 
na powierzchni dielektryka i definicje te są używane 
zamiennie. Gęstość strumienia linii sił pola elek¬ 
trycznego jest wtedy określona związkiem D = foZs-f- 
-|-P, a ponieważ D — e 0 e'E t wyrażenie wiążące po¬ 
laryzację z natężeniem pola elektrycznego ma po¬ 
stać P = e 0 (e — \)E. Wielkość (s' —1) nazywamy 
również podatnością dielektryczną ośrodka; określa 
ona stosunek gęstości ładunku związanego do gęs¬ 
tości ładunku swobodnego. 

Przy wprowadzaniu wielkości e\ e\ G oraz P, 
traktowaliśmy dielektryk jako ciało izotropowe. 
Kryształy dielektryczne są jednak ciałami wykazują¬ 
cymi anizotropię własności fizycznych, przy czym 
wielkości te są zależne od kierunku w krysztale. Do¬ 
kładny opis własności dielektrycznych, uwzględnia¬ 
jący ich anizotropowy charakter, jest możliwy jedynie 
za pomocą rachunku tensorowego. 

Dotychczas nie wnikaliśmy w molekularny me¬ 
chanizm powstawania polaryzacji dielektrycznej, ani 
nie wyróżnialiśmy rodzaju momentów dipolowych 
odpowiedzialnych za polaryzację dielektryka, związa¬ 
liśmy jedynie polaryzację dielektryczną z wielkością 
natężenia pola elektrycznego. Obecnie omówimy 
molekularne mechanizmy polaryzacji dielektrycznej. 
Na wstępie musimy zdać sobie sprawę, że wewnętrzne 
(lokalne) pole elektryczne F panujące w dielektryku 
różni się dość istotnie od przyłożonego zewnętrznego 
pola E. Zagadnienie pola wewnętrznego jest ciągle jed¬ 
nym z głównych problemów teorii dielektryków i w 
ogólnym wypadku nie jest rozwiązane. R. Clausius 
związał polaryzację dielektryczną z polem wewnętrz¬ 
nym F równaniem: 

P = (e'-\)e 0 E = NocF, 

gdzie a—polaryzowalność, czyli zdolność do tworzenia 
dipoli przez atomy lub molekuły ośrodka, natomiast 
//jest liczbą elementarnych dipoli w jednostce obję¬ 
tości. Pole lokalne w dielektrykach niedipolowych 
i dielektrykach z całkowicie nieuporządkowanymi mo¬ 
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mentami dipolowymi lub dipolami uporządkowa¬ 
nymi w sieć o najwyższej symetrii, można opisać 
w sposób przybliżony wzorem Lorentza: 


F = 



r '+ 2 

3 


E 


(pole Lorentza). 


Inne wyrażenia na pole wewnętrzne podali L. Onsager 
(w ujęciu molekularnym) oraz H. Frohlich i J.G. Kirk- 
wood (na podstawie rozważań statystycznych). Wy¬ 
rażenia te są bardzo skomplikowane i na ogół zastę¬ 
puje się je wyrażeniami otrzymanymi w sposób 
półempiryczny. 

Ogólnie polaryzacja jednorodnego dielektryka 
składa się z polaryzacji dipolowej Pd (wywołanej 
orientacją trwałych molekularnych dipoli w polu 
elektrycznym) oraz z polaryzacji deformacyjnej 
(związanej z indukowaną przez pole elektryczne po¬ 
laryzacją atomową P a i polaryzacją elektronową P e ). 
Istnieją oczywiście materiały dielektryczne nie mające 
trwałych molekularnych momentów dipolowych 
i wtedy ich polaryzacja dielektryczna jest tylko po¬ 
laryzacją deformacyjną. Można wyróżnić również 
dielektryki, w których występuje jedynie polaryzacja 
elektronowa. 

Trwale momenty dipolowe mają molekuły o nie¬ 
symetrycznym rozkładzie ładunku (rys. 5). Moment 
dipolowy dużych molekuł organicznych związany jest 




HCI H 2 0 

Rys. 5. Trwałe momenty dipolowe związane z asymetrią rozkładu 
ładunku w molekułach 


na ogól z takimi grupami dipolowymi jak grupa hydro¬ 
ksylowa O—H lub grupa ketonowa C=0. Całkowi¬ 
ty moment dipolowy molekuły jest wtedy w dobrym 
przybliżeniu równy wektorowej sumie wszystkich 
składowych momentów pochodzących od grup dipo¬ 
lowych. 

Gdy w dielektryku występują trwałe dipole mole¬ 
kularne to w zewnętrznym polu elektrycznym 
orientują się one w kierunku pola i polaryzacja dipo¬ 
lowa, zwana również polaryzacją orientacyjną, jest 
określona średnim rzutem momentów dipolowych na 
kierunek pola wewnętrznego w dielektryku (rys. 6a). 
W przemiennym polu elektrycznym, w najprostszym 
wypadku, gdy w dielektryku występuje tylko jeden 
rodzaj trwałych dipoli molekularnych, zespoloną 
przenikalność elektryczną można przedstawić wzorem: 

00 

= *a4 j P(t)e i<at dt, 

o 

gdzie e a oznacza wartość przenikalności elektrycznej 
przy wysokich częstościach, natomiast p(t) ma cha¬ 
rakter współczynnika zanikania, określającego opóź¬ 
nienie zmian polaryzacji względem zmian pola elek¬ 
trycznego. W roku 1912 P. Debye zaproponował 
wykładniczą formę współczynnika zaniku fi(t) = 
= /?(0)e tlr y z czasem relaksacji t, charakteryzującym 
dielektryk dipolowy i zależnym od temperatury w spo¬ 
sób aktywacyjny. Prowadzi to do dyspersji przeni¬ 
kalności elektrycznej przedstawionej na rys. 6a. 
Debye’owski model dielektryka, w którym wystę¬ 
pują dipole molekularne jednego rodzaju, mające 
jeden czas relaksacji, jest modelem uproszczonym. 
W rzeczywistych dielektrykach występuje na ogół 
rozszerzenie obszaru relaksacji wywołane zarówno 
różnicami naturalnej częstości drgań dipoli związane 
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Rys. 6. Schematyczne przedstawienie polaryzacji orientacyjnej oraz dyspersja i absorpcja debycowska (a), polaryzacji atomowej (b) 
i elektronowej (c) oraz związana z tymi zjawiskami anomalna dyspersja i absorpcja 


z różnicami w rozmiarach i kształtach trwałych dipoli 
molekularnych jak i różnicami energii aktywacji 
dipoli, a więc różną konfiguracją najbliższego sąsiedz¬ 
twa takich samych dipoli molekularnych. Opis ma¬ 
tematyczny tego zjawiska jest bardziej skompliko¬ 
wany, gdyż trzeba wprowadzić funkcje rozkładu cza¬ 
sów relaksacji. Wprowadza się je na ogół w postaci 
podanej przez Cole-Cole, Frohlicha lub Fuossa-Kirk- 
wooda. Ogólna zależność przenikalności elektrycz¬ 
nej od częstości dla układów, w których występuje 
rozpraszanie energii, została podana przez Kramersa 
i Kroniga. Dyspersja przenikalności elektrycznej 
związana z relaksacją polaryzacji dipolowej występuje 
w zakresie częstości mikrofalowych. 

Wróćmy teraz do polaryzacji deformacyjnej i naj¬ 
pierw rozpatrzmy polaryzację atomową i jonową. 
Dla uproszczenia rozważmy molekułę złożoną z dwu 
atomów (lub jonów) A oraz B (rys. 6b), między któ¬ 
rymi występuje oddziaływanie. Przyłożenie pola elek¬ 
trycznego spowoduje rozsunięcie rdzeni atomów 
(jonów), zwiększając odległość między nimi, co po¬ 
woduje powstanie momentu dipolowego (lub jeżeli 
molekuła miała bez pola moment dipolowy—jego 
zwiększenie). Prowadzi to do polaryzacji ośrodka. 
Wiemy jednak, że atomy można traktować również 


jako obiekty składające się z naładowanego dodatnio 
rdzenia, otoczonego chmurami elektronów (rys. 6c), 
których symetria jest określona ich stanami kwanto¬ 
wymi (-* Chemia kwantowa, rozdz. „Atomy wielo- 
elektronowe”). Przyłożenie pola elektrycznego po¬ 
woduje przesunięcie chmury elektronów w r zględem 
rdzenia, co prowadzi również do powstania induko¬ 
wanego momentu dipolowego i w konsekwencji do 
indukowania polaryzacji elektronowej. 

Do polaryzacji atomowej, jonowej, a także elektro- model oscy ła¬ 
nowej można zastosować model oscylatora harmonicz- tora harrrto- 
nego. Przesunięcie przez pole elektryczne ładunków nicznego 
przeciwnych znaków, związanych ze sobą sprężyście, 
powoduje polaryzację ośrodka. Po usunięciu zabu¬ 
rzenia wywołanego polem ładunki wracają do swo¬ 
ich pierwotnych położeń równowagi wykonując drga¬ 
nia, które zanikają z szybkością określoną tłumie¬ 
niem. Gdy pole wywołujące polaryzację deformacyjną 
jest polem przemiennym, układ złożony z takich 
oscylatorów może zaabsorbować energię przy pew¬ 
nej charakterystycznej częstości Zjawisko to jest 
zupełnie analogiczne do absorpcji rezonansowej ob¬ 
wodu elektrycznego zawierającego opór omowy, 
pojemność oraz indukcyjność. Do opisu zależności 
zespolonej przenikalności elektrycznej od częstości 
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pola elektrycznego, gdy zachodzi absorpcja rezonan- 
zanikanie sowa, H. Fróhlich wprowadził czynnik (analogiczny 
polaryzacji do współczynnika Debye’a) określający zanikanie 
polaryzacji: /?(/) = p(0)c- tlv cos(oo 0 t+<p), gdzie <p 
oznacza opóźnienie fazowe polaryzacji względem 
pola elektrycznego. Na rys. 6b i 6c przedstawiono 
zależność s' oraz e" od częstości, w wypadku polary¬ 
zacji atomowej i elektronowej. Rezonansowa absorp¬ 
cja i dyspersja związana z drganiami rdzeni atomo¬ 
wych w molekułach leży w obszarze podczerwieni, 
a związana z drganiami dipola wytworzonego prze¬ 
sunięciem chmury elektronowej względem dodat¬ 
niego rdzenia — w obszarze częstości optycznych. 
W zakresie częstości optycznych zamiast zespolonej 
przenikalności elektrycznej wprowadza się zwykle 
zespolony współczynnik załamania n*, przy czym 
zespolona przenikalność elektryczna e* e = («*) 2 (za¬ 
leżność Maxwella). Polaryzacja deformacyjna może 
być wywołana także polem elektrycznym fali świetl¬ 
nej. Zjawisko to odgrywa istotną rolę, gdy dielektryk 
jest poddany działaniu silnych wiązek światła lase¬ 
rowego. 

polaryzacja Polaryzacja całkowita dielektryka jednorodnego 
dielektryka składa się z polaryzacji deformacyjnej i polaryzacji 
niejedno- orientacyjnej. Materiały dielektryczne są jednak na 
rodnego ogół układami niejednorodnymi. Występujące w cia¬ 
łach stałych defekty sieci krystalicznej (defekty punk¬ 
towe, dyslokacje lub granice ziaren) stanowią pułapki 
dla poruszających się pod wpływem przyłożonego 
pola elektrycznego nośników prądu i w efekcie na 
nich gromadzi się ładunek elektryczny. Ten prze¬ 
strzenny ładunek indukuje ładunek na elektrodach, 

.ryzacja 



co powoduje powstanie dodatkowej polaryzacji Pi. 
Dyspersja i absorpcja dielektryczna związana z ła¬ 
dunkiem zgromadzonym na niejednorodnościach die¬ 
lektryka występuje w obszarze częstości od 10 -5 Hz 
do 10 2 Hz (częstości infraakustyczne i akustyczne). 
Zależność całkowitej polaryzacji dielektryka niejedno¬ 
rodnego od częstości przedstawiono na rys. 7. 


Ferroelektryki 


Omówione powyżej własności dielektryków pozwala¬ 
ją na wyciągnięcie wniosku, że najważniejszą cechą 
charakteryzującą dielektryki jest możliwość zmiany 
ich polaryzacji za pomocą małych zmian zewnętrz¬ 
nego pola elektrycznego. Polaryzacja kryształów die¬ 
lektrycznych może się jednak zmieniać również 
wskutek działania innych czynników zewnętrznych, 
takich jak naprężenia mechaniczne lub temperatura. 
Kryształy, w których małe zmiany naprężeń zewnętrz- 
piezo- nych wywołują zmianę polaryzacji (niezależnie od 
elektryki zmian wywołanych polem elektrycznym), nazywamy 
ktyształami piezoelektrycznymi. Niektóre spośród 
piezoelektryków wykazują polaryzację spontaniczną, 
tzn. polaryzację dielektryczną występującą w zerowym 
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polu elektrycznym i przy zerowych naprężeniach me¬ 
chanicznych, a ponadto polaryzacja ta zmienia się 
wskutek małych zmian temperatury. Kryształy takie 
to piroelektryki. Ze względu na swoje własności 
kryształy te znajdują szerokie zastosowanie jako de¬ 
tektory promieniowania cieplnego, szczególnie pod¬ 
czerwonego, np. w noktowizorach. Niektóre spośród 
kryształów piroelektrycznych mają jeszcze dodatkowo 
niezwykle interesującą własność, mianowicie kierunek 
ich polaryzacji spontanicznej może być zmieniony za 
pomocą zewnętrznego pola elektrycznego o natężeniu 
małym w porównaniu z natężeniem pola wewnętrz¬ 
nego. K^ształy te nazywamy ferroelektrykami, ich 
najważniejszą cechą jest możliwość przepolaryzowa- 
nia. Wystąpienie własności piezo- i piroelektrycznych 
dielektryków można w zasadzie przewidzieć na pod¬ 
stawie znajomości klasy symetrii kryształu, 
nie można jednak oczywiście ocenić wielkości wy¬ 
stępującego efektu. Piezoelektrykami mogą być 
kryształy należące do 20 klas nie mających środka 
symetrii (spośród 32 klas Budowa kryształów), 
natomiast tylko kryształy należące do 10 klas ma¬ 
jących oś symetrii mogą wykazywać własności piro- 
elektryczne. Warunkiem koniecznym wystąpienia 
własności ferroelektrycznych jest przynależność kry¬ 
ształu do klasy polarnej (tzn. mającej oś symetrii), nie 
jest to jednak warunek dostateczny. Jedynie ekspery¬ 
mentalnie można rozstrzygnąć, czy kierunek polaryza¬ 
cji może być zmieniony za pomocą zewnętrznego pola 
elektrycznego. W czasie przepolaryzowania przez kry¬ 
ształ ferroelektryczny płynie prąd przesunięcia, które¬ 
go gęstość jest w każdej chwili miarą szybkości zmian 
polaryzacji. Szybkość zmiany polaryzacji po przyło¬ 
żeniu pola elektrycznego można badać mierząc rze¬ 
czywisty prąd płynący przez opór połączony szerego¬ 
wo z kryształem (rys. 8a), natomiast polaryzację 
spontaniczną można wyznaczyć stosując układ poda¬ 
ny na rys. 8b. Na rysunku tym przedstawiono również 
różnicę odpowiedzi kryształów dielektrycznych bez- 
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Rys. 8. Schematyczne przedstawienie odpowiedzi elektrycznej 
dielektryka bezstratnego oraz ferroelektryka na zmiany pola 
elektrycznego 
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stratnych i kryształów ferroelektrycznych na zmiany 
zewnętrznego pola elektrycznego. Z rysunku widać, 
że polaryzacja dielektryczna ferroelektryków nie jest 
liniową funkcją natężenia pola elektrycznego; za¬ 
leżność P(E) ma kształt typowej pętli histerezy. 
Nieliniowość dielektryczna ferroelektryków jest ich 
bardzo ważną własnością; przejawia się ona również 
w zależności przenikalności elektrycznej od natęże¬ 
nia pola elektrycznego. Pojemność kondensatora 
zawierającego ferroelektryk zależy bardzo silnie od 
natężenia mierzącego pola — mierzona za pomocą 
pola przemiennego, o bardzo małym natężeniu, za¬ 
leży również od natężenia stałego pola polaryzują¬ 
cego. Trzecią bardzo ważną własnością ferroelektry¬ 
ków są anomalie własności fizycznych w temperatu¬ 
rze Curie Tc (temperatura przejścia ze stanu ferro¬ 
elektrycznego do stanu paraelektrycznego). W tem¬ 
peraturze tej przenikalność elektryczna osiąga war¬ 
tość maksymalną, a następnie w fazie paraelektrycz- 
nej maleje hiperbolicznie ze wzrostem temperatury. 



Rys. 9. Zależność od temperatury przenikalności elektrycznej 
siarczanu trójglicyny (przy częstościach radiowych) 

Jej temperaturową zależność opisuje dobrze prawo 
Curie-Weissa (rys. 9), podobnie jak dla ciał ferro¬ 
magnetycznych (-* Teoria magnetyzmu). Niektóre 
spośród ferroelektryków są w fazie paraelektrycznej 
również piezoelektrykami (np. sól Seignette’a, 
kwaśny fosforan potasu KDP) i dla tych kryształów 
pewne, wyróżnione przez symetrię kryształu, mo¬ 
duły piezoelektryczne oraz moduły sprężystości 
osiągają w temperaturze Curie również anomalnie 
duże wartości. Na rys. 10 pokazano charaktery¬ 
styczną temperaturową zależność polaryzacji spon¬ 
tanicznej dla tytanianu baru oraz siarczanu trój- 
glicyny. W pierwszym wypadku przejście ze stanu 
ferroelektrycznego do stanu paraelektrycznego jest 
przemianą fazową I rodzaju i jest związane z zani¬ 
kiem polaryzacji pochodzącej od przesunięcia jonów 
i elektronów w komórce elementarnej typu perow- 
skitu. Drugi wypadek (siarczan trójglicyny) jest przy¬ 
kładem przemiany fazowej II rodzaju i to tzw. prze¬ 
miany fazowej typu porządek-nieporządek. Model 
przemiany fazowej typu porządek-nieporządek przyj¬ 
muje istnienie w sieci krystalicznej elektrycznym 
momentów dipolowych, odwracalnych zewnętrznych 
polem elektrycznym, przy czym w fazie ferroelek¬ 
trycznej równoległe uporządkowanie tych dipoli 
w dużej objętości jest przyczyną polaryzacji sponta¬ 
nicznej kryształu. Powyżej temperatury Curie znika 
uporządkowanie dipoli, a więc znika polaryzacja 
spontaniczna. Aby określić stopień uporządkowania 
ferroelektrycznego wprowadza się parametr uporząd¬ 
kowania dalekiego zasięgu S = (JV + —AL)/(A+4-A_), 
gdzie A+ oznacza liczbę dipoli elementarnych zorien¬ 
towanych w wybranym kierunku dodatnim, a iV_ — 



temperatura 



temperatura 

Rys. 10. Zależność od temperatury polaryzacji spontanicznej: 
a) tytanianu baru i b) siarczanu trójglicyny 


liczbę dipoli zorientowanych w kierunku przeciwnym. 
Parametr uporządkowania ma wartości: S = 0 
w fazie paraelektrycznej, S = -f-1 w fazie ferroelek¬ 
trycznej (oznacza to, że wszystkie dipole są zoriento¬ 
wane w kierunku dodatnim), S = — 1, gdy wszystkie 
dipole są zorientowane w kierunku ujemnym, oraz 
S < lw wypadku niecałkowitego uporządkowania. 
W tym prostym modelu polaryzacja spontaniczna 
P s = j «(iV + + NJ)S, a temperaturowa zależność pa¬ 
rametru uporządkowania dalekiego zasięgu (rys. 11) 
określa temperaturową zależność polaryzacji spon¬ 
tanicznej. Istnieją również kryształy, które mają dwie 
identyczne, antyrównolegle spolaryzowane podsieci, 
tzw. antyferroelektryki. Wypadkowa polaryzacja 



temperatura T ?c 


Rys. 11. Zależność od temperatury parametru uporządkowania 
dla ferroelektryków wykazujących przejście fazowe typu porzą¬ 
dek-nieporządek 

spontaniczna takich kryształów jest równa zeru. 
Gdy antyrównolegle spolaryzowane podsieci nie są 
identyczne, mamy kryształ ferroelektryczny o małej 
wypadkowej wartości polaryzacji spontanicznej. 

Temperaturowa zależność przenikalności elek¬ 
trycznej dla modelu porządek-nieporządek jest okreś¬ 
lona głównie temperaturową zależnością funkcji ko¬ 
relacji (-> Przejścia fazowe i zjawiska krytyczne) opi¬ 
sującej, jak silny jest wpływ dipola o dodatniej (wy¬ 
różnionej) polarności na orientację innych dipoli. 
Funkcja ta ma maksimum w temperaturze Curie. 
Oznacza to, że przemiana fazowa II rodzaju w ferro¬ 
elektrykach jest zjawiskiem związanym z wystąpie¬ 
niem bardzo silnych oddziaływań między dipolami 
ferroelektrycznymi (których orientację można zmie¬ 
nić za pomocą zewnętrznego pola elektrycznego). 
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W krysztale ferroelektrycznym polaryzacja spon¬ 
taniczna nie ma w całej objętości takiego samego 
kierunku. Kryształ jest podzielony na obszary elek- 
struktura trycznie uporządkowane (w których dipole ferro- 
domenowa elektryczne są zorientowane w tym samym kierunku), 
zwane domenami ferroelektrycznymi. Domeny są 
obszarami makroskopowymi, a polaryzacja sponta¬ 
niczna w sąsiednich różnych domenach ma taką samą 
wartość, lecz różni się zwrotem, przy czym kierunek 
polaryzacji musi się pokrywać z kierunkiem odpo¬ 
wiedniej osi polarnej. Znając symetrię kryształu w fa¬ 
zie paraelektrycznej oraz w fazie polarnej można 
przewidzieć dozwolone orientacje ściany domenowej 
w krysztale. Są one określone warunkami ciągłości 
składowej polaryzacji. W tytanianie baru w fazie 

ściany 

domenowe 



tetragonalnej możliwe są tzw. ściany 180°, oddziela¬ 
jące domeny o antyrównoległych kierunkach polary¬ 
zacji, oraz ściany 90°, oddzielające domeny, w których 
kierunki polaryzacji są prostopadłe (rys. 12). W siar¬ 
czanie trójglicyny, który w fazie paraelektrycznej na¬ 
leży do klasy centrosymetrycznej, a w którym w fazie 
ferroelektrycznej polaryzacja spontaniczna jest rów¬ 
noległa do osi b układu jednoskośnego, możliwe są 
jedynie ściany 180°, równoległe do osi b. W soli 
Seignette*a, która również w fazie paraelektrycznej 
jest piezoelektrykiem, a polaryzacja spontaniczna 
w fazie ferroelektrycznej jest równoległa do osi a 
układu jednoskośnego, występuje piezoelektryczna 
deformacja y z . W tym krysztale możliwe są dwie 
orientacje ścian domenowych; występują ściany 
domenowe równoległe do osi a oraz ściany dome¬ 
nowe równoległe do osi c (rys. 12). Podział kryształu 
ferroelektrycznego na domeny jest uwarunkowany 
względami energetycznymi. Kryształ dzieli się na 
domeny w taki sposób, aby ich energia wewnętrzna, 
składająca się z energii objętościowej (elektrycznej 
rozmiary proporcjonalnej do kwadratu polaryzacji oraz sprę- 
domen ^ystej proporcjonalnej do kwadratu deformacji), 
energii depolaryzacji oraz energii ścian domenowych 
miała wartość minimalną. Rozmiary domen w róż¬ 
nych ferroelektrykach są więc różne, ale zależą rów¬ 
nież od wielkości kryształu. Ściany domenowe w fer¬ 
roelektrykach są cienkie w porównaniu ze ścianami 
domenowymi w ferromagnetykach. Mają one grubość 


rzędu kilku stałych sieci, podczas gdy w ferromagne¬ 
tykach grubość jest rzędu kilkuset stałych. Duża gru¬ 
bość ścian domenowych w ferromagnetykach (-*- 
Struktura domenowa i procesy magnesowania) jest 
związana z ciągłą zmianą kierunku namagnesowania 
w ścianie, podczas gdy w ferroelektrykach moment 
dipolowy komórki elementarnej może mieć jedynie 
kierunek jednej z osi polarnych. Dla przykładu można 
podać, że grubość ściany domenowej w siarczanie 
trójglicyny, wyznaczona metodą mikroskopii elek¬ 
tronowej, wynosi około 12 nm. Do badania struktury 
domenowej ferroelektryków stosuje się różne metody, 
których wybór jest uzależniony własnościami bada¬ 
nych kryształów. Na il. 93 (tabl. 23) podano zdjęcia 
struktury domenowej ferroelektryków otrzymane róż¬ 
nymi metodami. 

Fenomenologiczna teoria ferroelektryków podana 
przez A. F. Devonshire’a oraz W. L. Ginzburga jest 
rozwinięciem teorii przemian fazowych L. Landaua. 
Teoria Landaua była oparta na założeniu, że w po¬ 
bliżu punktu przemiany potencjał termodynamiczny 
można rozwinąć w szereg potęgowy względem para¬ 
metru uporządkowania, a współczynniki rozwinięcia 
są funkcjami temperatury oraz ciśnienia. Devonshire 
przyjął, że parametrem uporządkowania ferroelek¬ 
trycznego przejścia fazowego jest polaryzacja. Opra¬ 
cowana przez niego teoria opisuje dobrze niektóre 
własności ferroelektryków. W 1959 W. Cochran 
i P. W. Anderson wysunęli koncepcję, że ferroelek¬ 
tryczna przemiana fazowa jest wynikiem niestabil¬ 
ności jednego z normalnych modów drgań sieci 
krystalicznej (-+ Dynamika sieci krystalicznej) i ten ro¬ 
dzaj drgań został nazwany miękkim modem. Oznacza 
to, że jedno z elementarnych wzbudzeń układu staje 
się niestabilne, gdy temperatura T Tc (tempera¬ 
tura Curie). Częstość tego wzbudzenia dąży do 0, 
gdy wektor falowy dąży do zera. Z teorii dynamiki 
sieci ferroelektryków wynika, że parametrem ferro¬ 
elektrycznej przemiany fazowej są wartości wektora 
falowego niestabilnych fononów. Ponieważ stan fer¬ 
roelektryczny jest stanem polarnym, zatem „miękkie” 
fonony muszą być polarne, są więc aktywne w pod¬ 
czerwieni. Upraszczając można powiedzieć, że war¬ 
tości wektora falowego miękkiego modu opisują 
przemieszczenie atomów wewnątrz komórki elemen¬ 
tarnej oraz różnice fazowe między odpowiednimi 
przesunięciami. Struktura nowej fazy (fazy ferro¬ 
elektrycznej) poniżej temperatury przemiany jest 
superpozycją zamrożonych przesunięć wywołanych 
miękkim modem oraz struktury fazy stabilnej po¬ 
wyżej Tc (rys. 13). Teoria miękkich fononów została 
najpierw rozwinięta dla ferroelektryków typu prze¬ 
sunięcia, jednak tego samego rodzaju koncepcja zo¬ 
stała później zastosowana do ferroelektryków typu 
porządek-nieporządek. 



Rys. 13. Obrazowe przedstawienie wektora falowego miękkiego 
modu ferroelektrycznego w BaTiO, powodującego przemianę 
fazową O ft C Łv 
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ferro- Istnieją ferroelektryki, w których polaryzacja 
elektryki spontaniczna nie jest parametrem uporządkowania, 
niewłaściwe Takie ferroelektryki nazwano ferroelektrykami nie¬ 
właściwymi. Parametr uporządkowania może mieć 
taką samą symetrię jak polaryzacja spontaniczna, 
tak jak w kryształach KH 2 P0 4 , albo może mieć inne 
własności symetrii niż P s (np. w molibdenianie ga¬ 
dolinu Gd 2 (Mo0 4 ) 3 ). 


Elektrety 


Wspomnieliśmy już, że najważniejszą własnością 
dielektryków jest zdolność do gromadzenia ładunku 
elektrycznego. Dielektryk, w którym po usunięciu 
pola elektrycznego utizymuje się polaryzacja dipolo¬ 
wa lub rzeczywiste ładunki elektryczne, nazywamy 
elektretem. Elektret wytwarza zewnętrzne pole elek¬ 
tryczne i w tym sensie jest elektrostatycznym odpo¬ 
wiednikiem magnesu trwałego. Elektrety znane są już 
od dawna (w 1919 r. fizyk japoński M. Eguchi wy¬ 
produkował pierwszy elektret z wosku karnauba). 
Bardzo długo stan elektretowy wiązano z trwałym 
uporządkowaniem orientacji dipoli elektrycznych 
i oddziaływaniem rzeczywistych ładunków wstrzyk¬ 
niętych w procesie ładowania z polaryzacją dipolową, 
a wytwarzane elektrety, głównie z dielektryków dipo¬ 
lowych, miały grubość rzędu centymetrów. Dopiero 
pod koniec lat sześćdziesiątych zaczęto wytwarzać 
elektrety z folii polimerowych wstrzykując z zewnętrz¬ 
nych źródeł* rzeczywisty ładunek elektryczny, 
wytwarzanie Najpierw omówimy sposób wytwarzania klasycz- 
elektretów nych termoelektretów, których pole elektryczne jest 
związane z zamrożoną polaryzacją dipolową (lub po¬ 
chodzi od uporządkowanego ładunku przestrzennego) 
i ładunkami wstrzykniętymi w procesie wytwarzania 
z przestrzeni pomiędzy dielektrykiem a elektrodą. 
Materiałem na termoelektrety dipolowe są dielektryki, 
których moment dipolowy pochodzi na ogół od 
grup karboksylowych lub grup C—Ci dużych molekuł 
organicznych. Klasycznym materiałem termoelektre- 
towym jest wosk karnauba. Termoelektrety dipolowe 
otrzymuje się przez polaryzowanie dielektryków 
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Rys. 14. Obrazowe przedstawienie procesu wytwarzania termo¬ 
elektretów dipolowych oraz termoelektretów z rozkładem prze¬ 
strzennym ładunku (ładunki wstrzyknięte zaznaczono kolorem 
czarnym) 


w silnym zewnętrznym polu elektrycznym w pod¬ 
wyższonej temperaturze (w której możliwy jest obrót 
dipoli molekularnych) i „zamrożenie” uporządko¬ 
wania dipoli elektrycznych przez ochłodzenie dielek¬ 
tryka (rys. 14). Ładunek na powierzchni elektretu 
zaraz po jego wytworzeniu pochodzi przede wszyst¬ 
kim od polaryzacji dipolowej, ma więc znak przeciw¬ 
ny do znaku polamości elektrod (tzw. heteroładunek). 
Maleje on w czasie w sposób relaksacyjny. W pro¬ 
cesie wytwarzania elektretów zostaje jednak również 
do dielektryka wstrzyknięty ładunek rzeczywisty 
z przestrzeni pomiędzy elektrodami a dielektrykiem 
(homoładunek), który zmniejsza się bardzo powoli 
w czasie. Efektywny ładunek powierzchniowy elek¬ 
tretu jest więc sumą ładunku pochodzącego od po¬ 
laryzacji dipolowej i ładunku wstrzykniętego. Ponie¬ 
waż czasowe zmiany gęstości tych ładunków są różne, 
termoelektret dipolowy wykazuje zaraz po wytworze¬ 
niu na powierzchniach heteroładunek, który maleje 
do zera, a następnie pojawia się homoładunek, który 
narasta do wartości maksymalnej i dalej zmienia się 
już w czasie bardzo powoli. Czasowe zmiany efektyw¬ 
nego ładunku termoelektretów obrazuje rys. 15. 



Rys. 15. Zmiany w czasie ładunku termoelektretów dipolowych 


Czas zmiany polamości elektretu oraz wielkość 
ustabilizowanego ładunku i czas życia termoelektretu 
zależą od rodzaju materiału, warunków polaryzowa¬ 
nia oraz warunków r przechowywania. Polaryzując np. 
wosk karnauba w słabych polach (mniejszych od 10* 
V/m) otrzymuje się elektrety wykazujące wyłącznie 
polaryzację dipolową, malejącą w ciągu 10-20 dni 
do pewnej wartości, która utrzymuje się następnie 
w czasie rzędu kilku miesięcy. Elektrety z wosku 
karnauba wytworzone w polach większych od 10® V/m 
wykazują na powierzchni heteroładunek, który w cza¬ 
sie (rzędu minut lub godzin, w zależności od natę¬ 
żenia pola polaryzującego i temperatury przechowy¬ 
wania elektretu) zmniejsza się do wartości zerowej 
i następnie pojawia się homoładunek, którego usta¬ 
bilizowana wartość nie zmienia się w czasie rzędu 
kilkunastu lat. Termoelektrety można otrzymać rów¬ 
nież z dielektryków niedipolowych, gdy rozłożone 
izotropowo w objętości ładunki elektryczne zostaną 
uporządkowane przez pole polaryzujące w podwyż¬ 
szonej temperaturze i ten stan uporządkowania zo¬ 
staje zamrożony. 

Porządkujące działanie pola elektrycznego wyko¬ 
rzystuje się również przy produkcji fotoełektretów 
i radioelektretów, których zasadę otrzymywania po¬ 
kazuje rys. 16b. W wypadku fotoełektretów, które 
są wytwarzane z dielektryków wykazujących foto- 
przewodnictwo, nośniki prądu zostają wzbudzone do 
pasma przewodnictwa pod wpływem światła i następ¬ 
nie spułapkowane w pobliżu elektrod o odpowiedniej 
polamości. Prowadzi to do pojawienia się warstwy 
ładunku przestrzennego. Depolaryzacja takich elek¬ 
tretów jest związana z aktywacją nośników z pułapek 
wskutek wzbudzenia termicznego lub wzbudzenia 
optycznego. Podobny jest mechanizm wytwarzania 
polaryzacji w radioelektretach, z tym że wzbudzenie 
jest wywołane promieniowaniem jonizującym. 
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Rys. 16. Układ do wytwarzania: a) tcrmoełcktretów, b) fotoelek- 
tretów 

Największe zastosowanie praktyczne znalazły jed¬ 
nak elektrety z cienkich folii polimerowych, w któ¬ 
rych zgromadzono duże gęstości ładunku przez im- 
plantowanie go z zewnętrznych źródeł. Najprostszą 
metodą jest ładowanie folii w próżni wiązką elektro¬ 
nów (rys. 17a) o energiach rzędu kilkudziesięciu keV. 
Efektywny ładunek na powierzchni elektretu zależy 
od energii elektronów, natężenia wiązki i czasu bom¬ 
bardowania. Metodą tą można zgromadzić w dielek¬ 
tryku bardzo dużą gęstość ładunku; jedynym ogra¬ 
niczeniem gęstości są przebicia. Ładunek wprowa¬ 
dzony przez napromienienie wiązką monoenerge- 
tycznych elektronów jest zgromadzony w dielektryku 
na określonej głębokości, zdeterminowanej energią 
elektronów. Obrazuje to rys. 18a, na którym pokazano 
przestrzenny rozkład ładunku w elektretach wytwa¬ 
rzanych przez ładowanie elektronami o różnych 
energiach. 
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Rys. 17. Sposoby wytwarzania elcktrclów foliowych: a) łado¬ 
wanie eiektronami, b) metoda wyładowania koronowego, c) me¬ 
toda przebiciowa, d) metoda cieczowa 


I 


J50 keV 


b) 


Rys. 18. Rozkład ładunku we wnętrzu elektretu foliowego (wy¬ 
znaczony przez Collinsa): a) elektret ładowany wiązką elektro¬ 
nów o różnych energiach (ładunek dodatni na powierzchni jest 
wywołany emisją wtórnych elektronów z dielektryka), b) elekret 
ładowany metodą cieczową 


Elektrety foliowe o dużej gęstości ładunku ujem¬ 
nego można otrzymać również wykorzystując wyła¬ 
dowanie koronowe w powietrzu (rys. 17b), podczas 
którego powierzchnia dielektryka jest bombardowana 
elektronami oraz różnego rodzaju jonami ujemnymi. 

Zjawisko to jest nieco bardziej skomplikowane, gdyż 
elektrony wnikają do dielektryka na pewną głębokość, 
natomiast jony ujemne rekombinują, wywołując zmia¬ 
ny chemiczne na powierzchni dielektryka. W efekcie 
otrzymuje się jednak elektrety o dużej gęstości ła¬ 
dunku ujemnego stabilnego w czasie. Należy jednak 
zaznaczyć, że rozkład efektywnego ładunku na 
powierzchni elektretów wytwarzanych metodą wy¬ 
ładowania koronowego wykazuje pewną niejedno¬ 
rodność. 

Do produkcji elektretów foliowych wykorzystuje 
się również procesy przebiciowe na dużej powierzchni 
(rys. 17c). W metodzie tej folia dielektryka jest 
umieszczona pomiędzy elektrodami, do których przy¬ 
kłada się duże napięcie elektryczne, przy czym w celu 
stabilizacji procesów przebiciowych jedna z elektrod 
jest elektrodą o dużym oporze (np. szklaną). Gęstość 
ładunku wytworzonego w ten sposób elektretu zależy 
zarówno od przyłożonego napięcia jak i czasu polary¬ 
zacji, a stabilność jest porównywalna ze stabilnością 
elektretów wytworzonych przez bombardowanie elek¬ 
tronami. 

Elektrety foliowe można również otrzymać za po¬ 
mocą metody, w której wykorzystano przekazywanie 
ładunku do dielektryka z elektrody cieczowej o dużej 
przewodności elektrycznej (rys. 17d). Na powierzchni 
folii gromadzi się duże gęstości ładunku usuwając 
w polu elektrycznym warstewkę cieczy. 

Stosując zaprogramowane starzenie przez wygrza- starzenie 
nie elektretu w podwyższonej temperaturze można elektretów 
ładunek zgromadzony blisko powierzchni wpro- foliowych 
wadzić w głąb dielektryka. Obrazuje to rys. 18b. 

W procesie starzenia zmniejsza się efektywna gęstość 
powierzchniowa ładunku elektretu, natomiast ła¬ 
dunek pozostały wykazuje większą stabilność czasową. 

Jest to korzystne, ponieważ elektrety wyprodukowane 
omówionymi powyżej metodami mają napięcie rów¬ 
noważne rzędu 1000 V, natomiast do zastosowań 
praktycznych potrzebne są na ogół elektrety o napię¬ 
ciach około dziesięciokrotnie mniejszych. 
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Jak wspomniano poprzednio, elektrety wytwarzają 
zewnętrzne pole elektryczne i z tego względu znalazły 
szerokie zastosowanie w urządzeniach, w- których pole 
to jest wykorzystywane w sposób zachowawczy, mia¬ 
nowicie w elektretowych przetwornikach elektroaku¬ 
stycznych. Możliwość wykorzystania eJektretów folio¬ 
wych jako membrany w mikrofonie pojemnościowym 
zmniejszyła wyraźnie koszty produkcji i umożliwiła 
miniaturyzację, a więc uczyniła mikrofon elektretowy 
szczególnie atrakcyjnym. 

Na rys. 19 pokazano schemat budowy mikrofonu 
elektretowego, w którym elektretem jest folia teflo¬ 
nowa jednostronnie metalizowana (grubości 13 Jim 
lub 25 pm). Gęstość powierzchniowa ładunku takiego 




metalizacja elektret foliowy 


przeciwelektroda 


izolatory 



Rys. 19. Schemat budowy: a) mikrofonu i b) głośnika w asy¬ 
metrycznym układzie przeciwsobnym 


elektret foliowy 


izolatory 


elektretu jest rzędu 10 nC/cm 2 i w mikrofonie jest on 
oddalony od przeciwclektrody o ok. 10 pm. Napięcie 
wyjściowe Vm mikrofonu elektretowego, przy danym 
wychyleniu membrany *, zależy od natężenia pola 
elektrycznego w szczelinie powietrznej przetwornika. 
Jest ono określone gęstością powierzchniową ładun¬ 
ku elektretu A f grubością elektretu d e , grubością 
warstwy powietrza cł 0 oraz przenikalnościami elek¬ 
trycznymi e 0 oraz e: 

V = AdoX 

m £q (d 0 +d e e) 

W mikrofonach pojemnościowych (a takim jest właś¬ 
nie przedstawiony mikrofon elektretowy) wychylenie 
membrany zależy liniowo od ciśnienia fali akustycz¬ 
nej w szerokim zakresie częstości, począwszy od 


częstości odcięcia do ok. 20 000 Hz. Odpowiedź na¬ 
pięciowa mikrofonu elektretowego przy stałym na¬ 
tężeniu dźwięku jest więc niezależna od częstości, głośnik 
Elektret foliowy może być również zastosowany elektretowy 
w głośniku; na rys. 19b przedstawiono schemat bu¬ 
dowy głośnika elektretowego pracującego w asy¬ 
metrycznym układzie przeciwsobnym. Przedstawione 
schematy budowy elektretowych przetworników 
elektroakustycznych są schematami najprostszymi. 

Produkcję ich rozpoczęto w 1970 r. Obecnie znane są 
konstrukcje elektretowych przetworników elektro¬ 
akustycznych o specjalnych kierunkowych charakte¬ 
rystykach oraz konstrukcje przetworników pracują¬ 
cych w zakresie częstości infraakustycznych oraz 
ultraakustycznych (od 10~ 3 Hz do 10 8 Hz). 

Na zakończenie należy wspomnieć, że szerokie 
zastosowanie różnego rodzaju elektretów (np. foto- 
elektretów w kserografii, elektretów foliowych w prze- badanie 
twornikach elektroakustycznych, różnego rodzaju starzenia 
przetwornikach elektromechanicznych oraz filtrach elektretów 
elektrostatycznych) wyprzedziły znacznie stan wiedzy 
o podstawowych procesach fizycznych gromadzenia 
ładunku we wnętrzu dielektryka i jego reorganizacji 
w procesie starzenia. Wydaje się, że postęp ten nastąpi 
w najbliższym czasie, gdyż w 1977 r. opracowano 
dwie interesujące metody badania przestrzennego 
rozkładu ładunku w elektretach foliowych. Jedna 
z nich opracowana przez G. M. Sesslera, pozwalająca 
otrzymać informacje o rozkładzie gęstości ładunku 
na grubości elektretu z dokładnością 1 pm, wykorzy¬ 
stuje jako sondę wirtualną elektrodę, którą wytwarza 
się za pomocą monoenergetycznej wiązki elektro¬ 
nowej. Druga metoda, opracowana przez R. E. Col¬ 
linsa, jest metodą nieniszczącą i polega na badaniu 
odpowiedzi elektrycznej po przyłożeniu do jednej 
strony elektretu bardzo krótkiego impulsu cieplnego. 

Stosując tę metodę można otrzymać bezpośrednio 
informacje o wielkości ładunku elektretowego i jego 
średnim położeniu, a po opracowaniu matematycz¬ 
nym— informacje o przestrzennym rozkładzie ła¬ 
dunku w elektrecie i ogólnie w dielektryku. Za pomo¬ 
cą wspomnianej metody można badać również zmia¬ 
ny przestrzennego rozkładu gęstości ładunku w pro¬ 
cesie samorzutnego oraz zaprogramowanego^starzenia 
elektretów, co rokuje nadzieję na wyjaśnienie mecha¬ 
nizmu tego procesu. 

J. C. Anderson Dłelectrics , London 1967; R. Blinc, B. Żekś 
Soft Modes in Ferroelectrics and Antiferroelectrlcs, Amsterdam 
1974; A. Chelkowski Fizyka dielektryków , Warszawa 1979; 

B. Hilczer, J. Małecki Elektrety , Warszawa 1980; S. Kielich 
Molekularna optyka nieliniowa , Warszawa 1977; T. Krajewski 
(red.) Zagadnienia fizyki dielektryków , Warszawa 1970; A. Pie- 
kara Polaryzacja materii. Materiały Konferencji Chemików 
w. Spalę, 1959, str. 268; A. Piekara Mikrofale i spektroskopia 
mikrofalowa. Warszawa 1953. 


Pófprzewod n i ki 

Tadeusz Figieiski 

Spośród olbrzymiej grupy ciał stałych, występujących 
w sposób naturalny w przyrodzie lub' w r ytworzonych 
przez człowieka, wyróżniamy tzw. półprzewodniki. 
Są to substancje krystaliczne, przew-odzące prąd 
elektryczny o szczególnie interesujących właściwoś¬ 
ciach. Zaliczamy do nich materiały wielce różno¬ 
rodne pod względem budowy chemicznej, a więc 
zarówno czyste pierwiastki german i krzem, tlenki 
i siarczki niektórych metali, np. Cu z O, ZnO, Pbs, 
związki międzymetaliczne, jak InSb, Ga As, HgTe 
i wiele innych. Poznanie i wykorzystanie tych materia¬ 
łów stanowi wielki krok naprzód w rozwoju technolo¬ 
gicznym naszej epoki. Przed niespełna trzydziestu 
laty został wynaleziony tranzystor. Od tej pory roz¬ 
począł się, ciągle jeszcze trwający, niezwykle inten¬ 
sywny rozwój fizyki półprzewodników. 


O przewodzeniu prądu elektrycznego 

Przewodnictwo elektryczne półprzewodników, po¬ 
dobnie jak metali, ma naturę elektronową, to znaczy 
elementarnymi nośnikami prądu elektrycznego są tu 
elektrony, obdarzone najmniejszą możliwą porcją 
ujemnego ładunku elektryczności. Wchodzą one 
w skład poszczególnych atomów, z których zbudowa¬ 
ny jest kryształ. Jeśli kryształ przewodzi prąd, ozna¬ 
cza to, że przynajmniej część tych elektronów strąciła 
więź ze swoimi macierzystymi atomami i może sto¬ 
sunkowo swobodnie podróżować po całym krysztale. 

Tak więc możemy wyobrażać sobie, że kryształ metalu 
czy półprzewodnika zbudowany jest z regularnie 
rozmieszczonych jonów — sieci krystalicznej — i cze- 9^2 elektro- 
goś w r rodzaju gazu prawie swobodnych elektronów nowy 
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wypełniających tę sieć. W gazie elektronowym po¬ 
szczególne cząstki poruszają się bezładnie, a ruch ten 
jest tym intensywniejszy, im wyższa jest temperatura, 
uporządko- Z chwilą przyłożenia do kryształu różnicy potencjałów 
wany ruch elektrostatycznych na elektrony działa siła wprowa- 
fadunków dzająca dodatkowy, uporządkowany ruch ładunków, 
elektrycznych który stanowi właśnie prąd elektryczny. 

Wygodnie jest wyobrażać sobie kryształ półprze¬ 
wodnika w postaci prostopadłościennej próbki, któ¬ 
rej jeden wymiar (długość d) jest znacznie większy 
od dwóch pozostałych. Taki kształt próbek jest 



Rys. I. Próbka półprzewodnikowa włączona w obwód prądu 


najczęściej stosowany w badaniach fizycznych. Chcąc 
zmierzyć, powiedzmy, przewodność elektryczną prób¬ 
ki, musimy na jej końcach umieścić elektrody za¬ 
pewniające dobry kontakt elektryczny z zewnętrznym 
obwodem prądu. Jeśli do naszej próbki przyłożymy 
różnicę potencjałów U y to wytwarza ona wewnątrz 
kryształu pole elektryczne o natężeniu ć = U/d. Na 
elektron o ładunku — e działa teraz siła elektrosta¬ 
tyczna, której wartość wynosi F = —eć. Każdy pra¬ 
wie swobodny elektron w krysztale doznaje zatem 
przyspieszenia o wartości a = Fjm w kierunku prze¬ 
ciwnym do pola elektrycznego; m oznacza masę 
elektronu. Gdyby elektrony były całkowicie swobod¬ 
ne, poruszałyby się ruchem jednostajnie przyspieszo¬ 
nym osiągając coraz większe prędkości. Nie uwzględ¬ 
niliśmy w tym jeszcze bezładnego ruchu cieplnego 
elektronów. Ponieważ jednak prędkości dodają się 
tak jak wektory, możemy bez popełnienia błędu 
wyodrębnić z wypadkowego ruchu składową prędkość 
wywołaną unoszeniem elektronów przez pole elek¬ 
tryczne i rozpatrywać ją niezależnie, 
prędkość Prędkość unoszenia elektronu nie może wzrastać 
unoszenia nieskończenie, ponieważ elektron co pewien czas 
zderza się z jonami sieci krystalicznej i ulega rozpro¬ 
szeniu. Jeśli uwzględnimy, że przyspieszenie elektronu 
zachodzi w czasie (t) jego swobodnego przebiegu 
między dwoma zderzeniami, to otrzymamy na mak¬ 
symalną prędkość unoszenia wartość v = ećz/m. Przy 
prawidłowym uwzględnieniu statystycznego rozkładu 
przedziałów czasowych z dla różnych elektronów 
w różnych chwilach wzór ten zostaje słuszny, jeśli 
przez v i z będziemy rozumieć średnie wartości tych 
parametrów w ciągu ruchu. 

Jeśli liczba „swobodnych” elektronów w jednostce 
objętości kryształu, czyli tzw. koncentracja elektro- 
gęstość nów, wynosi n y to gęstość prądu (natężenie prądu na 
prądu jednostkę powierzchni przekroju) płynącego przez 
kryształ wyniesie j — env = en (ez/m)£. Wielkość 
ez/m , oznaczana literą//, jest miarą średniej prędkości, 
jaką nabywa ; elektron w jednostkowym polu elek- 
ruchliwość trycznym i nazywa się ruchliwością elektronu. Wy- 
elektronu prowadzony tu związek między j i <f jest po prostu 
prawem Ohma. Współczynnik proporcjonalności po¬ 
między j i Ć nazywa się przewodnością właściwą c 
materiału, zaś jego odwrotność oporem właściwym q . 
Tak więc a = l/g = j/Ć. Korzystając z uprzednich 
wyprowadzeń można teraz zapisać wyrażenie na a 
w postaci: 

<7 = enp . 

Jest to podstawowy wzór — słuszny nie tylko dla 
półprzewodników — który wiąże przewodność elek¬ 
tryczną materiału z koncentracją i ruchliwością nośni¬ 


ków prądu. Przewodność właściwa ciał zaliczanych 
do półprzewodników zawiera się w bardzo szerokim 
zakresie wartości od 10* do 10~ 10 (Hem) -1 . 

Trzeba od razu zdać sobie sprawę z dwóch istotnych 
rzeczy. Po pierwsze, zarówno koncentracja, jak i ruch¬ 
liwość w konkretnym półprzewodniku mogą dras¬ 
tycznie zmieniać się wraz ze zmianą temperatury. Po 
drugie, w półprzewodniku mogą występować dwa ro¬ 
dzaje nośników prądu. Wówczas przyczynki do prze¬ 
wodnictwa pochodzące od każdego z nich będą się 
sumować. 


Kwantowy opis półprzewodnika 

Traktowanie w dalszym ciągu elektronu jako klasycz¬ 
nej cząstki materii nie zaprowadziłoby nas zbyt da¬ 
leko. Musimy uwzględnić fakt, że w mikroświecie 
obowiązują specyficzne prawa, prawa mechaniki 
kwantowej. Zgodnie z teorią kwantową elektron na- elektron 
leży rozpatrywać jako falę, zwaną czasem falą de jako fala 
Broglie*a. Elektronowi o pędzie p = mv musimy przy¬ 
pisać falę o długości X — hjp y gdzie h jest stałą Plan¬ 
cka. Jeślibyśmy zapytali się w duchu fizyki klasycznej 
(tzn. niekwantowej), gdzie dokładnie znajduje się 
jakiś konkretny elektron, to na gruncie mechaniki 
kwantowej nie dostalibyśmy jednoznacznej odpowie¬ 
dzi. Jeśli bowiem elektron jest opisany prostą falą 
„sinusoidalną”, a zatem ma ściśle określony pęd, 
to jego umiejscowienie,jako fali, jest zupełnie nie¬ 
określone; elektron jest wszędzie. Można, co prawda, 
skonstruować taką falę, której różna od zera amplitu¬ 
da jest zawarta w pewnym skończonym obszarze 
przestrzeni, ale będzie ona wówczas złożeniem kilku 
fal prostych o różnych długościach. Nie będzie ona 
zatem opisywać elektronu o ściśle określonym pędzie. 

Mechanika kwantowa podaje dokładny związek mię¬ 
dzy przedziałami nieokreśloności położenia i pędu 
cząstki w swej słynnej zasadzie — zasadzie nieokreś¬ 
loności Heisenberga. 

Jedną z uderzających konsekwencji tej zasady jest 
coś, co można by nazwać ograniczonością miejsca dla 
elektronów. Mianowicie, dla każdego przedziału pędu 
(lub energii) istnieje w danej objętości ściśle określona 
liczba stanów kwantowych, w których mogą znajdo¬ 
wać się elektrony. Ponadto, zgodnie z tzw. zakazem 
Pauliego, w każdym stanie mogą przebywać co naj¬ 
wyżej dwa elektrony. Różne stany kwantowe swo¬ 
bodnego elektronu możemy opisać różnymi wartoś¬ 
ciami jego energii kinetycznej. 

W teorii kwantowej zostały wyprowadzone przez 
Fermiego i Diraca ogólne prawa statystyczne opisu¬ 
jące prawdopodobieństwo obsadzenia poszczególnych 
stanów elektronami w zależności od temperatury. 

I tak w temperaturze zera bezwzględnego będą obsa¬ 
dzone wszystkie możliwe stany o najniższej energii. 

Przy podwyższaniu temperatury następuje stopniowe 
„rozluźnianie” zapełnienia; część elektronów prze¬ 
chodzi do stanów o wyższej energii. Jeśli jednak po¬ 
równujemy dwa dowolne stany kwantowe, to w rów¬ 
nowadze prawdopodobieństwo obsadzenia stanu 
o niższej energii zawsze pozostaje większe. 

Prześledźmy teraz, w jaki sposób mechanika kwan¬ 
towa modyfikuje nasz prosty obraz przewodnictwa długość fali 
elektrycznego. Podstawy teorii kwantowej ciał stałych elektronowej 
zostały sformułowane jeszcze w latach trzydziestych, 
dzięki pracom licznych badaczy, m.in. A. H. Wilsona 
i F. Blocha. Średnia długość fali elektronu w krysz¬ 
tale półprzewodnikowym jest tysiąc razy większa 
od odległości między sąsiednimi jonami sieci krysta¬ 
licznej. Taka fala rozchodzi się w idealnej sieci prawie 
bez zakłóceń. Można też na to spojrzeć z innego 
punktu widzenia, traktując samą sieć atomową jako 
nośnik fali, tj. jako ośrodek, w którym fala elektro¬ 
nowa została wzbudzona. 

Dla uproszczenia będziemy dalej rozpatrywać za¬ 
chowanie się elektronu w jednowymiarowym, nie¬ 
skończenie długim krysztale reprezentowanym przez 
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Rys. 2. Przyrząd do demonstracji fali elektronowej w krysztale. 
Spiralna kształtka obrazuje zespoloną funkcję falową elektronu 
V, której kwadrat modułu w każdym punkcie wzdłuż osi określa 
prawdopodobieństwo znalezienia tam elektronu. Przez obrót 
korbki wytwarzamy falę biegnącą, a mimo to rozkład prawdo¬ 
podobieństwa pozostaje zawsze taki sam 


łańcuch równoodległych od siebie atomów. Oczywiście 
kryształ taki w rzeczywistości nie istnieje. Stanowi on 
jednak wygodny model, na którym można prześle¬ 
dzić pewne ogólne właściwości trójwymiarowego 
kryształu. Weźmy najpierw pod uwagę falę sprężystą 
rozchodzącą się w naszym łańcuchu — falę tego typu, 
jaka powstałaby, gdybyśmy mocno napięty sznur 
gumowy uderzyli z góry dłonią. W łańcuchu mogą 
rozchodzić się* fale o najrozmaitszych długościach 
w dwu przeciwnych kierunkach. W wielu działach 
wektor fizyki przyjął się wygodny zwyczaj opisywania fali 
falowy o określonej długości i kierunku za pomocą tzw. wek¬ 
tora falowego k. Wektor k jest to wektor, którego 
kierunek jest zgodny z kierunkiem rozchodzenia się 
fali, natomiast jego długość równa się odwrotności 
fali, pomnożonej przez 2rc, tzn.. k = 2njX. 

Chwilowe wychylenia poszczególnych atomów łań¬ 
cucha dla prostych fal sinusoidalnych o różnych dłu- 
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e) 



Rys. 3. Poprzeczne fale sprężyste o malejącej długości k w jed¬ 
nowymiarowym łańcuchu atomowym (przedstawionym na rys. a): 

b)X = 12 a,k - 4a,k - -I- 4 ! d > * ’ 
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dla fali (e) wychylenia atomów są identyczne jak dla fali (b) 


gościach są przedstawione na rys. 3. Kolejne wykresy 
odpowiadają malejącym wartościom X, czyli wzrasta¬ 
jącym długościom wektora falowego. Krzywa na 
rys. 3d przedstawia falę o długości równej podwójnej 
odległości między sąsiednimi atomami, a więc taką, 
w której para sąsiednich atomów drga przeciwsobnie. 
Dla tej fali X = 2a i k — n/a. Każdej fali o wektorze 
falowym leżącym w przedziale od 0 do nja odpowiada 
jeden, ściśle określony rozkład chwilowych wychyleń 
atomów. I tu dochodzimy do bardzo osobliwej włas¬ 
ności ruchu falowego w ośrodku nieciągłym. Jeśli 
w sposób analogiczny do poprzedniego przedstawimy 
fale jeszcze krótsze, to okaże się, że nie tworzą one 
wcale nowych konfiguracji atomów, które nie byłyby 
już uwzględnione w przedziale 0, ±n/a. Fale, których 
wektory falowe różnią się o całkowitą wielokrotność 
2 n/a są fizycznie nierozróżnialne, a zatem są iden¬ 
tyczne. Ta właściwość, która odnosi się równie dobrze 
do fali elektronowej w krysztale, pozwala zrozumieć 
różnicę w zachowaniu się swobodnego elektronu 
i elektronu w sieci krystalicznej. 

Zauważmy przede wszystkim, że wartość pędu elek¬ 
tronu — odwrotnie proporcjonalną do długości fali 
de Broglie ł a — można wyrazić wprost przez wektor 

falowy k. Związek ten ma postać: 

p = hk/2n = hk(h = rt/2ic). 

A zatem wektor falowy i pęd elektronu można uważać 
za wielkości równoważne, tyle że wyrażone w róż¬ 
nych jednostkach. Związek ten pozostaje słuszny rów¬ 
nież dla elektronu poruszającego się w krysztale, 
z tym że wówczas przez p należy rozumieć średni 
w czasie ruchu pęd elektronu (zwany kwazipędem 
lub pędem krystalicznym). 

Energia kinetyczna swobodnego elektronu E = 
= mv 2 !2 = p 2 j2m, co można zapisać teraz jako 

E = ( l/2ny(h*k 2 l2m ) = h*k 2 /2m. 

Wykres energii kinetycznej w funkcji wektora falo¬ 
wego (pędu) jest parabolą. Relacja między energią 

elektronu a jego wektorem falowym, tj. funkcja E{k) 
ma w fizyce ciała stałego fundamentalne znaczenie. 
Wnikliwy Czytelnik zauważy, że znając zależność 

funkcyjną E od k dla swobodnego elektronu, można 
wyrazić z niej prędkość elektronu jako pierwszą po¬ 
chodną E{k ) po k y i podobnie masę elektronu jako 

odwrotność drugiej pochodnej E{k) po k y oczywiście 
z pewnymi współczynnikami. W przypadku swobod¬ 
nego elektronu takie przedstawienie jest tylko for¬ 
malną sztuczką, natomiast jest ono niezmiernie wy¬ 
godne przy rozpatrywaniu elektronów w krysztale 
(-* Dynamika elektronu w ciałach stałych). Jeśli 
wyjdziemy z założenia, że jony sieci krystalicznej 
w ogóle nie oddziałują na ruch elektronu, to wykres 
energii kinetycznej elektronu w naszym jednowymia¬ 
rowym krysztale będzie taką samą parabolą, jak dla 
elektronu swobodnego. Ale w sieci wszystkie wektory 

k różniące się o całkowitą wielokrotność 2 nja opisują 
elektrony z tym samym pędem krystalicznym. Aby 
uwzględnić to na naszym wykresie, musimy podzielić 
go na strefy odpowiadające różnym przedziałom war¬ 
tości k i przenieść odpowiednie odcinki krzywej E(k) 

do pierwszej strefy, tzn. do k leżących w przedziale — 
—n/a, n/a. Taki sposób postępowania pokazany jest 
na rys. 4c. Elektron o określonym pędzie nie ma teraz 
jednoznacznie określonej energii, gdyż może on znaj¬ 
dować się na jednej z wielu gałęzi krzywej E^c). 

Chcielibyśmy jeszcze wiedzieć, czy i w jaki sposób 
samo istnienie sieci krystalicznej wpływa na kształt 

zależności E{k). Ścisły rachunek kwantowy pokazuje, 
że wpływ ten jest najsilniejszy tam, gdzie krzywe od¬ 
powiadające różnym gałęziom E(k) najbardziej się 
do siebie zbliżają, a więc na krawędzi strefy bądź wjej 
środku. Rezultat jest taki, jak gdyby krzywe w tych 
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Rys. 4. Jak tworzą się pasma energii dozwolonej i wzbronionej: 
a) wykres energii kinetycznej swobodnego elektronu w funkcji 

wektora k (pędu), b) ten sam wykres dla prawie swobodnego 
elektronu w krysztale; zaznaczone są strefy zmienności wektora 

k, c) ten sam wykres sprowadzony do pierwszej strefy, d) uw¬ 
zględniono modyfikację wywołaną jonami sieci, e) symboliczne 
przedstawienie pasm energetycznych 


miejscach wzajemnie się odpychały, odkształcając się 
struktura w sposób pokazany na rys. 4d. Wykres ten przedsta- 
ł elektronowa wia to, co nazywamy strukturą elektronową kryształu 
kryształu (-* Struktura elektronowa ciał stałych). Widzimy, że 
wytworzyły się teraz pewne obszary energii, jakiej 
elektron w ogóle nie może posiadać. Mamy więc 
w krysztale występujące na przemian pasma energii 
dozwolonej i wzbronionej dla elektronu. Ciekawe, że 
do takiego samego wniosku doszlibyśmy wychodząc 
z całkiem odmiennych założeń, a mianowicie biorąc 
za punkt wyjścia dozwolone poziomy energii w izolo¬ 
wanych atomach, i śledząc co nastąpi, jeśli te atomy 
zbliżymy do siebie aż do utworzenia kryształu. 


Elektrony i dziury 

W rzeczywistych, trójwymiarowych kryształach struk¬ 
tura energetyczna jest znacznie bardziej skompliko¬ 
wana niż ta, którą przedstawiliśmy na rys. 4d. W szcze¬ 
gólności krzywizna krzywej E(k)> w każdym jej punk¬ 
cie może być zupełnie różna niż dla elektronu swo¬ 
bodnego. Miarą krzywizny jest wartość drugiej po¬ 
chodnej E po £, a ta dla swobodnego elektronu jest 
odwrotnie proporcjonalna do jego masy. Przenosząc 
tego typu argumentację na przypadek elektronu w 
krysztale, powinniśmy przypisać mu masę całkiem 
różną od masy elektronu swobodnego! Ten na pozór 
paradoksalny wniosek ma w istocie rzeczy rozsądne 
uzasadnienie. Elektron w swoim ruchu poprzez krysz¬ 
tał oddziałuje z ładunkami jonów sieci. Zewnętrzne 
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pole elektryczne, potrzebne do nadania elektronowi 
w krysztale pewnego średniego przyspieszenia, będzie 
zatem w ogólności inne niż dla elektronu swobodnego. 
Nie znając dokładnie rozkładu i wartości wewnętrz¬ 
nych pól elektrycznych w krysztale i chcąc być w zgo¬ 
dzie z prawami fizyki, musimy przypisać elektronowi 
pewną fikcyjną masę, różną od jego masy rzeczywistej. 
Nazywamy ją masą efektywną. Nie jest ona wielkością 
stałą, ale zależy od pędu i energii elektronu. Jeżeli 
spojrzymy jeszcze raz na rys. 4d, to zauważymy, że 
w pewnych obszarach, na krawędziach bądź w środku 

strefy, krzywizna E(k) jest ujemna, co odpowiada 
ujemnej masie efektywnej! Nie powinno to nas już 
jednak specjalnie niepokoić. 

Ze względu na skończoną liczbę stanów kwantowych 
pojemność każdego z pasm dozwolonej energii jest 
ograniczona. W paśmie może zmieścić się jedynie 
ściśle określona liczba elektronów, która, jak można 
pokazać, jest zawsze pewną wielokrotnością całkowi¬ 
tej liczby atomów w krysztale. Jeżeli niższe pasmo 
energetyczne jest całkowicie zapełnione, natomiast 
wyższe jest zupełnie puste, to kryształ będzie wówczas 
doskonałym izolatorem prądu. Elektron, ażeby prze¬ 
wodzić, musi uzyskać pod wpływem zewnętrznego 
pola elektrycznego dodatkową prędkość, a zatem 
przejść do innego stanu kwantowego. Tymczasem 
wszystkie możliwe stany w paśmie są już zajęte. 

Taka sytuacja może zaistnieć jedynie w tempera¬ 
turze zera bezwzględnego. W każdej wyższej tempe¬ 
raturze pewna część elektronów jest termicznie wzbu¬ 
dzona do wyższego pustego pasma, gdzie może już 
uczestniczyć w przewodzeniu prądu. To wyższe pasmo 
będziemy zatem nazywać pasmem przewodnictwa, 
natomiast pasmo dolne, zapełnione — pasmem wa¬ 
lencyjnym (rys. 5). 


Rys. 5. Model pasmowy 
półprzewodnika. Zazna¬ 
czone są wzbudzone 
termicznie elektrony i 
dziury 
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Elektron wzbudzony do pasma przewodnictwa po¬ 
zostawia po sobie „dziurę”, czyli pusty stan w paśmie 
walencyjnym. A zatem również w tym paśmie może 
odbywać się teraz przewodzenie. Sytuacja tutaj jest 
jednak nieco osobliwa. Zgodnie ze statystyką obsa¬ 
dzenia stanów, większość „dziur” będzie się znajdo¬ 
wać w obszarze bliskim wierzchołka pasma walen¬ 
cyjnego. Tu jednak elektrony mają ujemną masę 
efektywną (rys. 4d). Kierunek przyspieszenia takich 
elektronów będzie przeciwny niż „normalnych” elek¬ 
tronów. Dla obserwatora, który nie wie nic o masie 
efektywnej, wygląda to tak, jak gdyby elektron był 
teraz obdarzony ładunkiem dodatnim. W istocie 
rzeczy ścisły rachunek pokazuje, że zbiór wszystkich 
elektronów w prawie całkowicie zapełnionym paśmie 
zachowuje się tak, jak niewielka liczba cząstek ob¬ 
darzonych dodatnią masą i dodatnim ładunkiem 
elektrycznym. Liczba tych cząstek jest dokładnie rów¬ 
na liczbie „dziur”. Możemy przeto nadać „dziurze” 
obywatelstwo, uwolnić ją od cudzysłowu i traktować 
ją jako pełnoprawny dodatni nośnik prądu w kryszta¬ 
le, na równi z ujemnym elektronem. Ściślejsze omó¬ 
wienie tych spraw znajdzie Czytelnik w artykule pt. 
„Dynamika elektronów w ciałach stałych”. 

Ze wzrostem temperatury rośnie koncentracja ter¬ 
micznie wzbudzonych elektronów i dziur i kryształ 
staje się coraz bardziej przewodzący. Takie przewodni¬ 
ctwo nazywamy samoistnym. Im mniejsza jest szero¬ 
kość przerwy energetycznej, tj. różnica energii mię- 
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dzy dnem pasma przewodnictwa i wierzchołkiem 
pasma walencyjnego, tym większe jest samoistne 
przewodnictwo kryształu w określonej temperaturze. 
Sytuacja taka jest typowa zarówno dla izolatorów, 
jak i półprzewodników. Różnica między tymi dwiema 
grupami materiałów jest czysto ilościowa i wskutek 
tego w pewnym sensie umowna. Za półprzewodniki 
uważamy zazwyczaj te materiały, których przerwa 
energetyczna jest mniejsza od 5 eV; np. dla InSb wy¬ 
nosi ona 0,18 eV, dla ZnO 3,2 eV. A metale? W meta¬ 
lach mamy sytuację dwojakiego rodzaju; bądź za¬ 
pełnione pasmo walencyjne i puste pasmo przewod¬ 
nictwa zachodzą na siebie, bądź też pasmo przewod¬ 
nictwa jest tylko częściowo zapełnione elektronami 
(-*■ Metale). 

Możemy się spytać, czy można eksperymentalnie 
odróżnić przewodnictwo wywołane dziurami od prze¬ 
wodnictwa elektronowego. Otóż tak. Umożliwia to 
znane od dawna zjawisko Halla, które jest wynikiem 




Rys. 6. Powstawanie w próbce napięcia Halla, w wyniku dzia¬ 
łania pola magnetycznego H 


działania siły Lorentza na poruszający się ładunek 
elektryczny w polu magnetycznym. Jeśli pole elek¬ 
tryczne jest skierowane w kierunku osi x a pole mag¬ 
netyczne w kierunku osi z i nośnikami prądu są wy¬ 
łącznie elektrony to pod wpływem siły Lorentza od¬ 
chylą się one w dodatnim kierunku osi y (rys. 6). 
Wskutek tego na górnej ściance kryształu, prostopad¬ 
łej do osi y , wytworzy się w stosunku do ścianki 
przeciwległej nadmiar ładunku ujemnego i związana 
z tym różnica potencjałów, zwana napięciem Halla. 
Jeśli nośnikami prądu są dziury, to na tej samej 
ściance powstanie nadmiar ładunku dodatniego i znak 
napięcia Halla jest przeciwny. Wielkość napięcia 
Halla jest odwrotnie proporcjonalna do koncentracji 
jednoimiennych nośników prądu. Gdy nośnikami 
prądu są wzbudzone termicznie elektrony i dziury 
w ilościach dokładnie sobie równych, to pochodzące 
od nich przyczynki do napięcia Halla praktycznie 
się zniosą. 


Domieszki w półprzewodnikach 

Badania efektu Halla w różnych półprzewodnikach 
dość wcześnie doprowadziły do wykrycia zdumiewa¬ 
jącego faktu. Ten sam pod względem chemicznym 
półprzewodnik może wykazywać bądź przewodnictwo 
elektronowe bądź dziurowe, w zależności od rodzaju 
wprowadzonych doń minimalnych ilości domieszek. 
Wielkość przewodnictwa wzrasta z domieszkowaniem 
i może być w ten sposób dokładnie regulowana. Te 
wyniki świadczą dobitnie o tym, że przedstawiony do¬ 
tychczas model przewodnictwa nie jest kompletny 
i wymaga istotnego uzupełnienia. Przeprowadzimy je 
na przykładzie germanu. 

German, podobnie jak krzem, krystalizuje, two¬ 
rząc tzw. strukturę typu diamentu, w której każdy 


z atomów jest otoczony czterema najbliższymi sąsia- struktura 
darni (rys. 7). Atom germanu ma w swej zewnętrznej germanu 
powłoce 4 elektrony, które całkowicie wypełniają 
pasmo walencyjne. To właśnie powoduje, że kryształ 
germanu nie jest metalem. Rozpatrując tę sprawę 



Rys. 7. Struktura krystaliczna germanu i krzemu. Czarne kul¬ 
ki obrazują atomy, a łączące je pręty — wiązania chemiczne 


z punktu widzenia krystalochemii powiedzielibyśmy, 
że cztery zewnętrzne elektrony wchodzą w skład wią¬ 
zań chemicznych, zapewniających spójność całego 
kryształu. Para elektronów — po jednym z dwu są¬ 
siednich atomów — wytwarza tzw. wiązanie kowa¬ 
lencyjne. Ten chemiczny punkt widzenia jest pozornie 
całkowicie sprzeczny z uprzednio wprowadzonym 
obrazem prawie swobodnych elektronów. Ale tak nie 
jest. Prawdopodobieństwo znalezienia elektronu wa¬ 
lencyjnego jest rzeczywiście największe w „mostku” 
łączącym dwa sąsiednie atomy. Jednak elektrony te, 
rozpatrywane w dużych obszarach kryształu, zacho¬ 
wują się właśnie tak jak fale — fale prawdopodobień¬ 
stwa. Ten zadziwiający fakt, że to samo zjawisko moż¬ 
na opisać na różne, często pozornie przeciwstawne 
sposoby, jest bardzo powszechny w fizyce. 

Jeśli teraz w miejsce jednego z czterowartościo- domieszki 
wych atomów Ge w krysztale umieścimy jakiś obcy w germanie 
atom o pięciu elektronach w zewnętrznej powłoce 
(takimi są atomy pierwiastków piątej grupy tablicy 
Mendelejewa, np. antymon), to wbuduje on się w sieć 
krystaliczną wykorzystując do wiązań z sąsiadami 
tylko cztery ze swoich elektronów (rys. 8). Pozostały, 



piąty elektron, pozostaje bardzo słabo związany z ato¬ 
mem domieszki i może być stosunkowo łatwo od niej 
oderwany i przeniesiony do pasma przewodnictwa, 
gdzie zachowuje się oczywiście jak zwykły elektron 
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34 - Encyklopedia fizyki współczesnej 
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przewodnictwa. Taką domieszkę nazywamy donorem. 
Analogicznie, jeśli domieszką jest atom trzeciej grupy, 
mający trzy zewnętrzne elektrony, np. ind, to czwar¬ 
ty elektron kosztem niewielkiej energii może być — 
dla skompletowania wiązań — uzupełniony z pasma 
walencyjnego. W paśmie walencyjnym pozostaje 
wówczas przewodząca dziura. Tego typu domieszka 
nazywa się akceptorem. 

Po oderwaniu lub przyłączeniu elektronu, atom do¬ 
mieszki — początkowo neutralny — staje się dodatnio 
lub ujemnie naładowanym jonem. W schemacie pasm 
energetycznych stan kwantowy zlokalizowanego elek¬ 
tronu domieszki obrazujemy rysując kreskę — po- 
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ziom energetyczny — wewnątrz przerwy wzbronionej. 
Dla atomu antymonu poziom ten leży bardzo blisko 
pasma przewodnictwa, ok. 0,01 eV poniżej jego dna. 
Nawet w temperaturze — 200°C prawie wszystkie 
donory Sb ulegają zjonizowaniu, oddając swoje elek¬ 
trony do pasma przewodnictwa. German domieszko¬ 
wany antymonem wykazuje przewodnictwo elektro¬ 
nowe lub, jak mówimy, jest materiałem typu n. Po¬ 
ziom typowego akceptora, indu, leży 0,01 eV ponad 
dnem pasma walencyjnego. Elektrony z pasma wa¬ 
lencyjnego obsadzając poziomy akceptorowe, pozo¬ 
stawiają po sobie dziury. Materiał domieszkowany 
indem ma zatem przewodnictwo dziurowe (lub ina¬ 
czej przewodnictwo typu />), jest więc materiałem 
typu p. 

Wnioski, które tu przedstawiliśmy są na ogół słusz¬ 
ne dla wszystkich półprzewodników, z tym że w róż¬ 
nych materiałach rolę donorów i akceptorów mogą 
spełniać różne domieszki. Co więcej, tę samą rolę 
mogą odgrywać również istniejące zawsze niedosko¬ 
nałości w budowie krystalicznej półprzewodnika, czyli 
defekty sieci (-* Budowa kryształów). Nie zawsze 
jednak poziomy energetyczne domieszek lub defek¬ 
tów leżą tak blisko pasm dozwolonej energii. We¬ 
wnątrz przerwy energetycznej mogą także występo¬ 
wać głębokie poziomy. Są one nazywane czasem pu¬ 
łapkami elektronowymi, dla podkreślenia faktu, że 
utrudnione jest termiczne wyswobodzenie się z nich 
elektronu. 

Jak czułe własności elektryczne półprzewodni¬ 
ków na zawartość domieszek obrazuje fakt, że doda¬ 
nie np. 1 mg antymonu na 1 tonę germanu zmienia 
przewodnictwo elektryczne kryształu na tyle, że decy¬ 
duje to o jego dalszych zastosowaniach technicznych. 
Kariera półprzewodników opiera się przede wszyst¬ 
kim na dwu wielkich osiągnięciach technologicznych. 
Pierwszym z nich było wynalezienie przez W. Pfanna 
sposobu oczyszczania kryształów półprzewodniko¬ 
wych do takiego stopnia czystości, jaki nigdy przed¬ 
tem nie był osiągalny dla żadnych materiałów. Sposób 
ten polega na miejscowym stopieniu pałeczki pół¬ 
przewodnikowej i następnym wielokrotnym przecią¬ 
ganiu stopionej strefy wzdłuż całej długości kryształu. 
Domieszki, które wolą gromadzić się w fazie ciekłej, 
zostają w ten sposób wyprowadzone na brzeg krysz¬ 
tału. 

Drugim osiągnięciem było wytworzenie w tak 
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oczyszczonym materiale dwóch sąsiadujących ze sobą 
obszarów o różnym typie przewodnictwa, czyli otrzy¬ 
manie złącza p-rt. Tak więc w jednym kawałku pół- 


temperatura 



przewodnika możemy mieć dwa względnie ostro roz¬ 
graniczone między sobą obszary, w jednym z nich 
dominującymi, czyli większościowymi nośnikami 
prądu są elektrony, w drugim zaś — dziury. Na¬ 
tężenie prądu, który płynie przez tego rodzaju złącze, 
zależy w sposób zasadniczy od kierunku przyłożone¬ 
go napięcia. Jeśli kierunek polaryzacji jest taki, że 
ujemny biegun baterii połączony jest z obszarem typu 
P> to zarówno dziury, jak i elektrony w swoich ma¬ 
cierzystych obszarach są odciągane przez pole elek¬ 
tryczne z obszaru złącza. W pobliżu granicy p-n wy¬ 
twarza się warstwa zubożona w nośniki prądu i prąd 
płynący przez złącze jest bardzo słaby. Jest to zatem 
kierunek zaporowy. Natomiast przy przeciwnej pola¬ 
ryzacji dziury i elektrony są spychane w kierunku 
złącza; niewielka ich część zostaje nawet „wstrzyknię- 



Rys. 11. Złącze p-n przy 
dwóch kierunkach po¬ 
laryzacji 



ta” do obszarów przeciwnego typu, gdzie występują 
w roli nośników mniejszościowych. Opór elektryczny 
złącza jest wówczas mały, a prąd płynący przezeń 
duży; jest to kierunek przewodzenia. Złącze p-n 
stanowi zatem prostownik prądu przemiennego, 
tzn. diodę półprzewodnikową. 
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Ten mocno uproszczony model złącza p-n , który 
tu przedstawiliśmy, ma wartość raczej mnemotech¬ 
niczną. Opisuje on prawidłowo kierunek prostowania, 
a nawet uwidacznia wystąpienie nowego ważnego zja¬ 
wiska wstrzykiwania nośników mniejszościowych. 
W rzeczywistości warstwa zubożona w nośniki istnieje 
na złączu nawet bez przyłożenia doń zewnętrznego 
napięcia, co jest wynikiem pojawienia się pewnej sa¬ 
moistnej różnicy potencjałów zapewniającej wewnętrz¬ 
ną równowagę tego, bądź co bądź, złożonego układu. 


Światłoczułość półprzewodników 

Wstrzykiwanie za pomocą złącza p-n jest jednym ze 
sposobów chwilowego zwiększenia koncentracji noś¬ 
ników prądu w półprzewodniku. Spośród kilku innych 
znanych sposobów najważniejszym jest oświetlenie 
kryształu. Jaki jest mechanizm oddziaływania światła, 
lub ogólniej promieniowania elektromagnetycznego, 
na kryształ półprzewodnikowy? Najbardziej podsta¬ 
wowym procesem jest wymuszanie przez falę elektro¬ 
magnetyczną przejść elektronu z jednego pasma do¬ 
zwolonej energii do innego. Zjawisko to ma charakter 
rezonansowy i zachodzi tylko wtedy, gdy częstość y 
padającej fali jest dokładnie równa różnicy energii 
E 2 — E x stanów kwantowych, między którymi nastę¬ 
puje przejście, podzielonej przez stałą Plancka h. 
Warunek ten zapisuje się w postaci 

hv — E z — E x . 

hv jest tu energią najmniejszej porcji promieniowania 
o danej częstości, tj. fotonu. 

Jeśli elektron znajduje się początkowo w stanie 
kwantowym o niższej energii — taka sytuacja jest 
charakterystyczna dla równowagi cieplnej — wów¬ 
czas wynikiem oddziaływania z falą elektromagnetycz¬ 
ną będzie wzbudzenie go do stanu o wyższej energii, 
absorpcja Mówimy wtedy, że foton został pochłonięty (zaabsor¬ 
bowany) a jego energia przekazana elektronowi (rys. 
12a). Jeśliby zaś elektron znajdował się początkowo 




Rys. 12. Rodzaje przejść elektronowych z udziałem fali elektro¬ 
magnetycznej: a) absorpcja fotonu, b) emisja wymuszona, c) 
emisja spontaniczna 

na wyższym poziomie energetycznym (a tego rodzaju 
nietrwały stan można wytworzyć), to wówczas nastę¬ 
powałoby przejście rezonansowe na poziom niższy, 
a uwolniona przy tym energia byłaby wypromienio- 
emisja wana w postaci fotonu (rys. 12b). Zjawisko to, zwane 
wymuszona emisją wymuszoną, jest podstawą działania laserów. 

Oczywiście, tego rodzaju przejście elektronu z góry 
na dół może zajść także samorzutnie, bez obecności 
zewnętrznego promieniowania (emisja spontaniczna, 
rys. 12c). 

Jeśli chodzi o półprzewodniki, to przejścia rezo¬ 
nansowe zachodzą przede wszystkim między stanami 
kwantowymi pasma walencyjnego i pasma przewod¬ 
nictwa. Wystąpią one zatem nie przy ściśle określonej 
długości fali, ale w pewnym paśmie długości fal. Naj¬ 
większa długość fali, przy której pojawi się jeszcze re¬ 
zonansowa absorpcja promieniowania, zależy oczy¬ 
wiście od szerokości przerwy wzbronionej danego 
półprzewodnika. Jeśli zapamiętamy prostą relację 
między długością fali w um a energią fotonu w eV: 
X = 1,24//n\ to dla każdego materiału o znanej przer¬ 
wie wzbronionej E g , będziemy mogli obliczyć, kładąc 


hv = E 9i jaka jest progowa długość fali, przy której progowa^ 
rozpoczyna się silna absorpcja światła. Dla krzemu na długość fali 
przykład, dla którego E g = 1,1 eV, wynosi ona 1,1 
jim. Krzem jest więc zupełnie nieprzezroczysty dla 
światła widzialnego. Rzeczywiście, płytka monokry- 
staliczna Si ma wygląd metaliczny. Jest rzeczą zdu¬ 
miewającą, że taka płytka nie stanowi prawie żadnej 
przeszkody dla promieniowania cieplnego, tzn. pod¬ 
czerwonego o długości fali większej od 1,1 pm. Na¬ 
tomiast czysty ZnO, który ma przerwę 3,2 eV, jest 
przezroczysty niemal jak szyba i silnie absorbuje do¬ 
piero promieniowanie nadfioletowe. 

W niektórych półprzewodnikach, takich jak Ge 
i Si, stany kwantowe odpowiadające dnu pasma prze¬ 
wodnictwa oraz wierzchołkowi pasma walencyjnego 


odpowiadają zupełnie różnym wartościom wektora k. 
Przejścia kwantowe między tymi stanami muszą wów¬ 
czas zachodzić ze zmianą pędu krystalicznego elek¬ 
tronu. Ale we wszystkich zjawiskach fizycznych prawa 
zachowania pędu i energii muszą być dokładnie speł¬ 
nione. Foton padającego promieniowania niesie ze 
sobą tak mały pęd, że można go w ogóle nie uwzględ¬ 
niać w tym procesie. Jak wobec tego zbilansować tę 
różnicę pędów? Na pomoc przychodzi tu dodatkowa 
kwazicząstka, tzw. fonon, czyli kwant drgań spręży¬ 
stych sieci krystalicznej (—► Dynamika sieci krystalicz¬ 
nej). W procesie trójcząstkowym, w którym biorą 
udział foton, elektron i emitowany bądź absorbovvany 
fonon, prawa zachowania mogą być już spełnione. 
Jednakże taki proces jest mniej prawdopodobny niż 
proces dwucząstkowy i związana z nim absorpcja, 
a także emisja promieniowania są dużo słabsze. 

Jest rzeczą zupełnie oczywistą, że drgania sieci — 
fonony — będą odgrywać zasadniczą rolę również 
w zjawisku przewodnictwa elektrycznego i innych zja¬ 
wiskach transportu elektronowego w półprzewodni¬ 
kach. Ograniczają one przede wszystkim drogę swo¬ 
bodnego przebiegu elektronu, a tym samym wartość 
ruchliwości nośników prądu. W bardzo niskich tem¬ 
peraturach, gdy drgania sieci są mało intensywne, 
ruchliwość nośników ograniczona jest raczej rozpra¬ 
szaniem na domieszkach i defektach. Dla większości 
półprzewodników ruchliwość nie przekracza zazwy¬ 
czaj w normalnych warunkach wartości kilku tysięcy 
cm 2 /V s. W pewnych jednak materiałach z bardzo 
wąską przerwą energetyczną ruchliwość elektronów 
osiąga monstrualnie duże wielkości. 

Weźmy przykład kryształu będącego stopem dwóch 
związków półprzewodnikowych CdTe i HgTe. Szero¬ 
kość przerwy wzbronionej tego materiału zależy silnie 
od procentowej zawartości obu składników i dla 
stopu, w którym 10% całego materiału stanowi CdTe, 
przerwa energetyczna całkowicie się zamyka. Krzy¬ 
wizna pasma przewodnictwa w pobliżu jego dna staje 
się wówczas bardzo duża i masa efektywna elektronu 
osiąga wartość minimalną. Powoduje to anomalny 
wzrost ruchliwości elektronów, która w niskich tem¬ 
peraturach wyraża się liczbą sześciocyfrową. 

Materiały o tak wielkich ruchliwościach mają osob¬ 
liwe własności w polu magnetycznym. Elektron, które¬ 
go droga swobodnego przebiegu jest wówczas bardzo 
długa, porusza się na skutek działania siły Lorentza 
po orbitach kołowych leżących w płaszczyźnie prosto¬ 
padłej do kierunku pola magnetycznego. W myśl me¬ 
chaniki kwantowej orbity te muszą być skwantowane, 
czyli odpowiadać ściśle określonym nieciągłym war¬ 
tościom energii. Następuje tu zatem pewnego rodzaju 
rozszczepienie pasma przewodnictwa na poszczególne 
poziomy kwantowe (tzw. poziomy Landaua). Stają się 
wtedy możliwe przejścia rezonansowe elektronu mię¬ 
dzy rozszczepionymi poziomami tego samego pasma. 
Energie tych przejść można w szerokim zakresie regu¬ 
lować polem magnetycznym. Leżą już one w obszarze 
długości fal odpowiadających dalekiej podczerwieni. 
Stwarza to interesujące możliwości nowych zastoso¬ 
wań półprzewodników z wąską przerwą energetycz¬ 
ną, np. w przyrządach optoelektronicznych. 
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Wiemy już, że w wyniku absorpcji światła następuje 
wzbudzenie elektronów z pasma walencyjnego do 
pasma przewodnictwa; rezultatem jest pojawienie się 
dodatkowych nośników prądu — elektronów i dziur. 
Tak więc oświetlenie półprzewodnika odpowiednio 
krótkofalowym światłem zwiększa jego przewodni- 
fotoprze- ctwo elektryczne, co jest określane mianem fotoprze- 
wodnictwo wodnictwa. Zjawisko to jest szeroko wykorzystywane 
do wykrywania i pomiaru promieniowania elektro¬ 
magnetycznego. 

Po wyłączeniu oświetlenia wzbudzone światłem 
nośniki prądu zanikają z czasem, aż do całkowitego 
przywrócenia stanu początkowego. Ten proces za¬ 
niku, zwany rekombinacją, może następować na przy- 
rekombinacja kład wskutek samorzutnych przejść elektronów z pas¬ 
ma przewodnictwa do pasma walencyjnego z emisją 
fotonów. W niektórych półprzewodnikach, takich jak 
GaAs, ten sposób powrotu do równowagi jest dość 
uprzywilejowany. Jeśli dodatkowe pary elektron-dziu- 
ra są wprowadzane do materiału przez wstrzykiwanie 
złączem p-n a ich rekombinacja zachodzi z emisją 
promieniowania, to wówczas mamy do czynienia 
elektrolumi- z bezpośrednią przemianą energii elektrycznej w świa- 
nescencja tło, zwaną elektroluminescencją (—► Optoelektroni¬ 
ka półprzewodnikowa). Wydajność takiego świecenia 
ograniczona jest konkurencyjnym mechanizmem re¬ 
kombinacji, w którym uwolniona energia przekazy¬ 
wana jest drganiom sieci. Ten ostatni proces zachodzi 
szczególnie chętnie na wszelkiego rodzaju defektach 
sieci i domieszkach i on to zazwyczaj ogranicza dłu¬ 
gość czasu życia wzbudzonych nośników prądu. 

Od tranzystora do generatora Gunna 

Swoiste właściwości materiałów półprzewodnikowych 
uwidaczniają się wyraziście w pewnym, klasycznym 
już dziś doświadczeniu zaproponowanym przez Hay- 
nesa i W. Shockleya z laboratorium Bell Telephone. 
Opiszemy je tutaj w wersji różniącej się nieco od ory¬ 
ginału. 

Na próbce germanowej — powiedzmy, że jest ona 
typu n — wytworzono w pobliżu jej końców dwa ma¬ 
leńkie obszary typu p. Jedno z utworzonych w ten 
sposób złącz spolaryzowano w kierunku przewodze¬ 
nia, drugie w kierunku zaporowym. To pierwsze złą¬ 
cze nazywamy emiterem, ponieważ wstrzykuje ono do 
próbki nośniki mniejszościowe — dziury. Drugie złą¬ 
cze ma całkiem odmienną właściwość. Może ono „ wy¬ 
sysać’’ dziury z obszaru kryształu bezpośrednio doń 
zasada przylegającego. Dzieje się tak dlatego, że złącze spola- 
ziałania ryzowane zaporowo nie stanowi przeszkody dla nośni- 
tranzystora ków mniejszościowych. Wstrzykiwane przez emiter 
dziury rozprzestrzeniają się w głąb próbki dzięki pro¬ 
cesowi dyfuzji, zanikając po drodze na skutek rekom¬ 
binacji. Ze względu na stosunkowo krótki czas życia 
nadmiarowych nośników, efektywny zasięg chmury 
dziurowej nie przekracza zazwyczaj milimetra. Jeśli 
odległość emiter-kolektor wynosi np. 1 cm, to 
wstrzyknięte dziury nie docierają do kolektora. Można 
im jednak w tym pomóc, przykładając w pewnej chwili 
do kontaktów na końcach próbki taką różnicę poten¬ 
cjałów, która będzie je ciągnąć w kierunku kolektora. 
Chmura nadmiarowych nośników zostaje teraz oder¬ 
wana od emitera i uniesiona polem elektrycznym 
wzdłuż próbki. Jeśli natężenie pola elektrycznego w 
krysztale wynosi, powiedzmy, 50 V/cm, to biorąc pod 
uwagę ruchliwość dziur w Ge — 1800 cm 2 /V s — 
znajdujemy, że prędkość unoszenia wynosi 9 TO 4 cm/s. 
Dziury przebędą zatem odległość emiter-kolektor 
w czasie równym w przybliżeniu 10' 5 s, jest to czas 
znacznie krótszy od czasu życia nadmiarowych noś¬ 
ników prądu w dobrym krysztale. Tak więc prawie 
wszystkie dziury dotrą do obszaru kolektora i tu zo¬ 
staną przezeń wessane, przez co zwiększy się chwilowy 
prąd w obwodzie kolektora. Jeśli na ekranie oscylo¬ 
skopu będziemy rejestrować sygnał elektryczny kolek¬ 
tora, to zaobserwujemy jego przebieg w czasie, taki 
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jak na rys. 13c. Pierwszy skok sygnału pojawia się w 
momencie włączenia pola ciągnącego i jest wywołany 
spadkiem napięcia wzdłuż długości kryształu. Po 
pewnym czasie pojawia się rozmyty sygnał związany 
z dotarciem chmury dziurowej do kolektora. 



Rys. 13. Doświadczenie Haynesa-Shockleya demonstrujące ruch 
chmury dziurowej w polu elektrycznym 


Eksperyment ten wykazuje w sposób bezpośredni 
istnienie dodatnio naładowanych nośników prądu, 
tj. dziur i pozwala wyznaczyć ich ruchliwość a nawet 
czas życia. Demonstruje on również zjawisko wstrzy¬ 
kiwania nośników prądu oraz działanie kolektora. 

Stąd już tylko krok do zrozumienia zasady działania 
tranzystora. Jeśli umieścić emiter i kolektor w dosta¬ 
tecznie malej odległości od siebie, to wówczas, nawet 
bez pola unoszącego nośniki, znaczna część wstrzyk¬ 
niętych dziur dotrze do kolektora. Taki układ, który 
stanowi uproszczony model tranzystora, ma własność 
wzmacniania sygnałów elektrycznych. Sygnał wpro¬ 
wadzony do obwodu emitera jest przenoszony za po¬ 
średnictwem nośników mniejszościowych do obwodu 
kolektora. Ale napięcie przyłożone do kolektora może 
znacznie przewyższać napięcie na emiterze; stąd — 
wzmocnienie mocy przenoszonego sygnału. 

Przyjmowaliśmy dotychczas, że zależność między 
gęstością prądu i natężeniem pola elektrycznego 
w jednorodnym półprzewodniku jest liniowa, tzn. 
spełnia prawo Ohma. Jednakże, to prawo przestaje gorące 
być słuszne dla bardzo silnych pól, gdy prędkość uno- elektrony 
szenia elektronów staje się porównywalna ze średnią 
prędkością ich chaotycznego ruchu cieplnego. Wystę¬ 
puje wówczas zjawisko grzania gazu elektronowego, 
któremu towarzyszy zazwyczaj wzrost rozpraszania 
i zmniejszenie ruchliwości. 

Istnienie „gorących” elektronów może prowadzić 
w pewnych wypadkach do pojawienia się zupełnie no¬ 
wych i niezwykłych zjawisk, np. pojawienie się ujem¬ 
nej przewodności elektrycznej w GaAs. Struktura 
pasmowa tego półprzewodnika przedstawiona jest ujemna prze- 
schematycznie na rys. 14. Pasmo przewodnictwa ma wodność 
bezwzględne minimum (a) w środku strefy Brillouina, elektryczna 

tzn. dla k — 0. To minimum odległe jest od kra¬ 
wędzi pasma walencyjnego (c) o 1,35 eV. W paśmie 
przewodnictwa występują ponadto dodatkowe lokalne 
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minima (ó), odpowiadające pewnym określonym kie¬ 
runkom i wartościom wektora k elektronu. Te lokalne 
minima leżą 0,35 eV powyżej krawędzi pasma prze¬ 
wodnictwa. 



Rys. 14. Schemat struktury elektronowej arsenku galu Ga As: 
a, b — minima pasma przewodnictwa, c —pasmo walencyjne 


W domieszkowanym GaAs typu n elektrony, które 
biorą udział w przewodzeniu prądu, znajdują się, 
w normalnych warunkach, w najniższym, środkowym 
minimum pasma przewodnictwa. W silnych polach 
elektrycznych elektrony uzyskują dodatkową energię 
kinetyczną. Jeśli przyłożone pole zwiększy średnią 
energię kinetyczną elektronów powyżej wartości 
0,35 eV, wówczas następuje obsadzenie elektronami 
bocznych minimów pasma przewodnictwa. Ale po¬ 
jemność bocznych minimów lub, mówiąc ściślej, gę¬ 
stość stanów kwantowych w tych minimach jest 
znacznie większa niż w minimum środkowym, wsku¬ 
tek różnicy ich krzywizn. A zatem, chociaż prawdo¬ 
podobieństwo obsadzenia stanów w bocznych mi¬ 
nimach pozostaje — ze względu na statystykę — 
mniejsze niż w środkowym minimum, to jednak w 
warunkach silnego pola elektrycznego może znaleźć 
się w nich przeważająca część elektronów przewod¬ 
nictwa-. Z drugiej strony mniejsza krzywizna bocznych 
minimów powoduje, że masa efektywna m* znajdują¬ 
cych się tam elektronów jest duża, a zatem ich ruchli¬ 
wość ji = ez/m* jest mała. Mamy już wszystkie ele¬ 
menty niezbędne do tego, aby zrozumieć istotę poja¬ 
wiającego się w GaAs zjawiska ujemnej przewodności 
elektrycznej. Mechanizm tego efektu można teraz la¬ 
pidarnie objaśnić w następujący sposób. W zakresie 
słabych pól elektrycznych większość elektronów znaj¬ 


duje się w środkowym minimum i wtedy obserwuje 
się normalne, niezależne od pola prewodnictwo krysz¬ 
tału. Gdy pole jest dostatecznie silne, rozpoczyna się 
obsadzanie bocznych minimów, w których ruchliwość 
elektronów jest mała. Ze wzrostem pola elektrycznego 
coraz większa część elektronów przechodzi do mini¬ 
mów o malej ruchliwości. W tym zakresie prąd pły¬ 
nący przez kryształ maleje ze wzrostem przyłożonego 
do kryształu napięcia. 

Taka sytuacja jest wielce nienormalna i prowadzi 
do tego, że pole elektryczne wewnątrz kryształu prze- efekt Gunna 
staje być jednorodne. Tworzą się obszary (domeny) 
silnego i słabego pola, ostro od siebie odgraniczone. 

Jch granice przemieszczają się wzdłuż kryształu zgod¬ 
nie z unoszeniem elektronów przez pole elektryczne. 

Docierając do końców kryształu domeny wywołują 
w zewnętrznym obwodzie oscylacje prądu. Jeśli dłu¬ 
gość kryształu jest niewielka, to częstość tych oscylacji 
jest bardzo duża. Zjawisko to, zwane efektem Gunna, 
jest wykorzystywane do generacji fal elektromagne¬ 
tycznych o częstości mikrofalowej (-> Generacja mi¬ 
krofal). 

Dla wygody Czytelnika załączamy krótki wykaz matenasy 
podstawowych materiałów półprzewodnikowych wraz póSprzewod- 
z podaniem ich najważniejszych zastosowań. O bar- nikowe 


Niektóre półprzewodniki 


Materiał 

Przerwa 

energe¬ 

tyczna, 

eV 

Zastosowanie 

InSb 

0,18 

przetworniki magnctoclektryczne, de¬ 
tektory podczerwieni 

Ge 

0,67 

diody, tranzystory, fotodiody 

Si 

M 

diody, tranzystory, baterie słoneczne 

GaAs 

1,35 

diody elektroluminescencyjne, lasery, 
generatory mikrofal 

CdTe 

1,5 

detektory promieniowania jądrowego 

Cu 2 0 

2.1 

prostowniki 

ZnO 

3,2 

luminofory 

CdTe-HgTe 

0-1,5 

detektory promieniowania podczer¬ 
wonego 


dzo wielu z nich w ogóle nie wspominaliśmy w tym 
artykule. 

Fizyka półprzewodników osiągnęła obecnie swój 
okres dojrzałości. Pomimo tego, ciągle prowadzi się 
intensywne poszukiwania zarówno nowych zjawisk, 
jak i nowych materiałów. Istnieją obecnie trzy grupy 
substancji, które przyciągają szczególną uw^agę bada¬ 
czy. Są to tzw. półprzewodniki magnetyczne, półprze¬ 
wodniki amorficzne (niekrystaliczne) oraz półprze¬ 
wodnikowe związki organiczne. 

N. B. Hannay Półprzewodniki , Warszawa 1962; P. S. Kiriejew 
Fizyka półrzewodników. Warszawa 1971; R. A. Smith Półprze¬ 
wodniki, Warszawa 1966. 


Półprzewodniki magnetyczne 

Robert R. Gałązka 


Wszystkie ciała stałe występujące w przyrodzie można 
podzielić na kilka grup, przy czym kryterium po¬ 
działu stanowią ich własności fizyczne. Półprzewod¬ 
niki i magnetyki tworzą dwie duże grupy ciał stałych 
o wyraźnie różnych własnościach fizycznych. W ostat¬ 
nim dziesięcioleciu zaszła potrzeba wyróżnienia no¬ 
wej grupy materiałów, które nazwano półprzewodni¬ 
kami magnetycznymi. Półprzewodniki magnetyczne 
można zdefiniować w różny sposób, np. jako: 

1) magnetyki (materiały magnetyczne) o przewod¬ 
ności elektrycznej od 10 4 do 10~ 10 (Dcm) -1 ; 

2) materiały zawierające jednocześnie swobodne 
nośniki prądu oraz zlokalizowane atomowe momenty 
magnetyczne. Koncentracja nośników prądu może 
się zmieniać pod wpływem warunków zewnętrznych. 


takich jak oświetlenie, temperatura, ciśnienie, pole 
elektryczne i magnetyczne. 

Materiałami magnetycznymi mogą być zarówno 
metale jak i dielektryki — izolatory. Istnieje również 
duża grupa magnetyków o przewodności pośredniej, 
pomiędzy metalami i izolatorami, i właśnie tę grupę 
materiałów nazwano półprzewodnikami magnetycz¬ 
nymi. Warto zwrócić uwagę na to, że pierwsza defi¬ 
nicja charakteryzuje materiał niejako od zewnątrz, 
poprzez makroskopowy parametr, jakim jest prze¬ 
wodność właściwa. 

Definicja druga jest głębsza — charakteryzuje ma¬ 
teriał od strony mikroskopowej. Magnetyczny mo¬ 
ment pędu atomu składa się z części orbitalnej (zwią¬ 
zanej z orbitalnym ruchem elektronów wokół jądra) 
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oraz części spinowej (-* Teoria magnetyzmu). Podob¬ 
nie jak ładunek elektryczny, np. elektronu, charakte¬ 
ryzuje pole elektryczne wytwarzane przez elektron, 
tak spin charakteryzuje pole magnetyczne elektronu. 
Ponieważ moment orbitalny jest wielkością małą, 
o momencie magnetycznym atomu, o magnetycznych 
własnościach pierwiastków i związków chemicznych 
decyduje spin atomu i oddziaływania spinowe. 

W układzie okresowym istnieją dwie grupy pier¬ 
wiastków, których atomy mają szczególnie duży wy¬ 
padkowy spin. Są to tzw. metale przejściowe (np. Mn, 
Fe, Ni, Cr) oraz pierwiastki ziem rzadkich (np. Eu, 
Gd, La). Duża wartość spinu tych atomów związana 
jest z istnieniem niezapełnionych powłok elektrono¬ 
wych d i/odpowiednio dla metali przejściowych i pier¬ 
wiastków ziem rzadkich. Mówiąc w drugiej definicji 
o zlokalizowanych momentach magnetycznych, mie¬ 
liśmy na myśli właśnie obecność tych pierwiastków 
w materiale. 

Możemy teraz uzupełnić definicje półprzewodni¬ 
ków magnetycznych dodając, że każdy półprzewodnik 
magnetyczny musi zawierać w postaci domieszki lub 
składnika co najmniej 1 pierwiastek z grupy metali 
przejściowych lub grupy pierwiastków ziem rzadkich, 
własności Własności fizyczne półprzewodników magnetycz- 
fizyczne nych w dużej części są nowe i nietypowe zarówno dla 
magnetyków, jak i półprzewodników. Dotychczas 
w półprzewodnikach nie uwzględniano oddziaływań 
spinowych (normalne półprzewodniki nie zawierają 
pierwiastków magnetycznych). Fizyka magnetyków 
nie brała pod uwagę wpływu swobodnych nośników 
prądu na oddziaływania spinowe (teorie opracowane 
dla metali magnetycznych ze względu na bardzo dużą 
i stałą koncentrację nośników prądu nie stosują się do 
półprzewodników magnetycznych). Półprzewodniki 
magnetyczne budzą duże zainteresowanie tak z punk¬ 
tu widzenia poznawczego (możliwość obserwacji no¬ 
wych efektów fizycznych) jak i zastosowań (możli¬ 
wość otrzymania półprzewodników o regulowanych 
własnościach magnetycznych — np. przez zmianę 
zawartości atomów magnetycznych, pole magnetycz¬ 
ne, temperaturę, oraz magnetyków o różnych kon¬ 
centracjach swobodnych nośników — elektronów i 
dziur). 

Ze względu na nowość problematyki, jak również 
duże trudności w matematycznym opisie półprzewod¬ 
ników magnetycznych, wiele istniejących teorii, które 
próbują wyjaśnić własności tych materiałów, ma ra¬ 
czej charakter roboczych hipotez. Zrozumienie zja¬ 
wisk zachodzących w półprzewodnikach magnetycz¬ 
nych szybko się pogłębia, ale jeszcze nie może być 
porównywane z wiedzą i aparatem matematycznym, 
jakimi dysponuje fizyka półprzewodników i fizyka 
magnetyków. 


Struktura energetyczna — gęstość stanów 

Elektrony w atomie zajmują określone stany energe¬ 
tyczne. Zmiana energii elektronu (np. przez oświetle¬ 
nie atomu — doprowadzenie do elektronu energii 
fotonu fali elektromagnetycznej) nie może zachodzić 
w sposób ciągły. Elektron przeskakuje na wyższy stan 
energetyczny pochłaniając energię lub spada na niższy 
stan energetyczny oddając energię. Istnieje więc wiele 
dozwolonych dla elektronów stanów — poziomów 
energetycznych, a wszystkie stany pośrednich energii 
są dla elektronu zabronione (-> Struktura elektrono¬ 
wa ciał stałych). 

pasma ener- W krystalicznych ciałach stałych, np. w półprze- 
getyczne w wodnikach, rolę pojedynczych stanów spełniają pas- 
cialach ma energetyczne. Trzy pasma decydują o własnościach 
stałych półprzewodnika: pasmo podstawowe — walencyjne, 
pasmo energii wzbronionej (przerwa energetyczna) 
i pasmo przewodnictwa (-* Półprzewodniki). W roz¬ 
ważaniach nad półprzewodnikami magnetycznymi 
bardzo ważnym parametrem jest gęstość stanów, czyli 
ilość stanów energetycznych na jednostkę energii. 


Jeżeli elektron na skutek zderzeń z innymi elektrona¬ 
mi, czy też rozpraszania przez drgające atomy sieci 
zmienia swoją energię, gęstość stanów dostarcza nam 
informacji, ile stanów energetycznych będzie miał do 
dyspozycji—jak łatwo lub trudno będzie się pod¬ 
dawał zmianom energii. W typowym półprzewodniku 
gęstość stanów energetycznych rośnie monotonicznie 
z energią elektronu lub dziury (rys. 1). 

Popatrzmy teraz na rys. 2 i 3, pokazujące strukturę 
gęstości stanów w półprzewodnikach magnetycznych. 
Widzimy wyraźną różnicę. Pojawiają się dodatkowe 
piki gęstości stanów w pewnych wąskich przedziałach 
energii, co więcej — pojawiają się dozwolone stany w 
paśmie energii wzbronionej. Pasmo przewodnictwa 
i pasmo walencyjne rozdzielają się na dwa, kompliku¬ 
jąc dodatkowo sytuację (fakt rozdzielenia się pasm 
nie występuje zawsze —jest typowy tylko dla ferro- 
magnetyków i tylko dla pewnych kierunków ruchu 
elektronów w krysztale). Za taką komplikację obrazu 
gęstości stanów odpowiedzialne są oczywiście atomy 
„magnetyczne”. Dodatkowe piki gęstości stanów 
związane są właśnie z elektronami d lub/tych atomów. 
Rozszczepianie się pasm związane jest natomiast 


Rys. 1. Zależność gę¬ 
stości stanów energe¬ 
tycznych od energii w 
paśmie walencyjnym i 
paśmie przewodnictwa 
typowego półprzewod¬ 
nika (gęstość stanów w 
paśmie energii wzbro¬ 
nionej równa jest oczy¬ 
wiście zeru) 


Rys. 2. Schematyczny 
obraz gęstości stanów w 
zależności od energii 
dla półprzewodnika fer¬ 
romagnetycznego; (+) 
i (—) oznaczają prze¬ 
ciwne kierunki spinów 
w rozszczepionych pas¬ 
mach przewodnictwa i 
walencyjnym 




gęstość 

stanów 
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Rys. 3. Postulowana struktura gęstości stanów w półprzewod¬ 
niku magnetycznym NiO; £> — poziom Fermiego 

z sumarycznym polem magnetycznym wytworzonym 
przez te atomy. Zwróćmy uwagę na jeszcze jeden fakt 
komplikujący obraz. W dostatecznie niskiej tempera¬ 
turze, gdy cieplne drgania atomów są małe, siły od¬ 
działywań spinowych pomiędzy atomami powodują 
powstanie porządku magnetycznego. Spiny kolejnych 
wewnętrzne atomów „magnetycznych” mogą się dodawać jak 
poJe w ferromagnetykach lub odejmować ja w antyferro¬ 
magnetyczne magnetykach. W ferromagnetycznym półprzewodniku 
powstaje silne wewnętrzne pole magnetyczne, którego 
skutkiem jest rozszczepienie się pasma przewodni- 
twa i pasma walencyjnego. Tak się dzieje, gdy energia 
cieplnych drgań sieci krystalicznej jest dostatecznie 
mała w porównaniu z energią oddziaływań spinowych. 
Dla każdego magnetyka istnieje jednak pewna ściśle 
temperatura określona temperatura (temperatura krytyczna), w 
krytyczna której drgania cieplne sieci niszczą porządek magne¬ 
tyczny i wektory momentów magnetycznych ustawiają 
się przypadkowo. Powyżej tej temperatury nie ma juz 
wewnętrznego pola magnetycznego i tym samym znika 
rozszczepienie pasm. 

Obraz gęstości stanów w materiale wpływa zasad¬ 
niczo na wszystkie własności kryształu. Wielkości 
fizyczne, charakteryzujące materiał, jak np. przewod¬ 
ność elektryczna, przewodność cieplna, siła termo¬ 
elektryczna, a także własności optyczne — zależą 
od gęstości stanów. Można się również spodziewać, 
że szczególną rolę będzie odgrywała temperatura kry¬ 
tyczna: wszystkie własności półprzewodników magne¬ 
tycznych w pobliżu tej temperatury powinny się zmie¬ 
niać dość drastycznie. 


Gigantyczny magnetoopór 

Z szerokiej klasy zjawisk transportu, a więc zjawisk 
związanych z przenoszeniem ładunku i ciepła omów¬ 
my tutaj tylko jedno zjawisko, a mianowicie zależność 
oporu właściwego półprzewodników magnetycznych 
od temperatury i pola magnetycznego (tzw. magneto¬ 
opór). Zachowanie się oporu w półprzewodnikach 
magnetycznych jest zupełnie inne niż w półprzewodni¬ 
kach i metalach magnetycznych. 


Ha rys. 4 i 5 pokazany jest przebieg oporu właści- opór 
wego dla ferromagnetycznego i antyferromagnetycz- —zależność 
nego półprzewodnika w funkcji temperatury dla kilku od tempera- 
pól magnetycznych. W pobliżu temperatury kry tycznej tu ry 
obserwuje się w obu wypadkach bardzo silny wzrost 
oporu. Jest to efekt wyjątkowo duży — opór ma¬ 
teriału zmienia się o kilka rzędów wielkości. W miarę 



Rys. 4. Zależność oporu właściwego ferromagnetycznego pół¬ 
przewodnika (Eu 0 , M La 0t005 S) od temperatury T i pola magne¬ 
tycznego H 



Rys. 5. Zależność oporu właściwego antyferromagnetycznego 
półprzewodnika (Eu 0(80 Cdo, 2 oTe) od temperatury T i pola magne¬ 
tycznego H 

wzrostu temperatury opór ferromagnetycznego pół¬ 
przewodnika szybko maleje, nawet czasami poniżej 
wartości obserwowanej w niskich temperaturach. 
W antyferromagnetycznym półprzewodniku w miarę 
wzrostu temperatury opór próbki dalej rośnie, ale już 
znacznie wolniej. 

Następnym niezwykłym zjawiskiem zachodzącym 
w pobliżu temperatury krytycznej jest zmniejszanie 
się oporu próbki (nawet setki razy) przy stosunkowo 
niewielkiej zmianie pola magnetycznego, czyli gigan¬ 
tyczny ujemny magnetoopór półprzewodników mag¬ 
netycznych. Efekt działania pola magnetycznego 
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ujemny 

magnetoopór 


ruch elektro¬ 
nu w ferro- 
magnetyku 


szybko słabnie w miarę oddalania się od temperatury 
krytycznej (szczególnie w stronę niższych temperatur). 
Tak silnego efektu ujemnego magnetooporu nie ob¬ 
serwuje się w żadnych innych ciałach stałych, oprócz 
półprzewodników magnetycznych. 

Wyjaśnienie powyższych zależności oporu elek¬ 
trycznego półprzewodników magnetycznych od tem¬ 
peratury i pola magnetycznego jest dość złożone, po¬ 
staramy się podać ogólny zarys rozumowania, prowa¬ 
dzący do jakościowego wyjaśnienia tych zależności. 

W ferromagnetyku w niskich temperaturach istnieje 
silne, ukierunkowane, wewnętrzne pole magnetyczne. 
Elektron poruszając się wzdłuż kierunku pola magne¬ 
tycznego porusza się tak, jakby pola nie było. Wynika 
to z podstawowych zasad ruchu elektronu w polu 
magnetycznym. Oczywiście, elektrony w krysztale po¬ 
ruszają się we wszystkich kierunkach i wskutek roz¬ 
proszeń ustawicznie zmieniają swoje tory. Jednak w 
kierunku równoległym do pola magnetycznego roz¬ 
praszanie (związane z wewnętrznym polem magne¬ 
tycznym) nie istnieje (rys. 6). W miarę wzrostu tempe- 
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Rys. 6. Uproszczony schemat ferromagnetycznego kryształu? 
czarne kółka oznaczają atomy mające silny własny moment 
spinowy: a) w temperaturze niższej od krytycznej i zerowym 
zewnętrznym polu magnetycznym elck tron poruszający się 
wzdłuż kierunku wewnętrznego pola magnetycznego H w nie roz¬ 
prasza się, b) w temperaturze wyższej lub równej krytycznej 
i w zerowym zewnętrznym polu magnetycznym elektron poru¬ 
szający się w dowolnym kierunku ulega rozpraszaniu na atomach 
z momentem spinowym, c) w temperaturze równej krytycznej; 
zewnętrzne pole magnetyczne częściowo porządkuje układ spi¬ 
nów; elektron jest bardziej rozpraszany niż w przypadku a, 
ale mniej niż w przypadku b 

ratury idealny porządek magnetyczny zaczyna się 
psuć. Pojawiają się obszary namagnesowane inaczej 
niż główna część kryształu. Rozpraszanie nośników 
prądu wzrasta, tym samym wzrasta również opór 
elektryczny. 

Maksymalny nieporządek panuje w temperaturze 
krytycznej, gdy pękają sprzężenia spinowe najbliżej 
oddziałujących atomów. Lokalne, chaotycznie skiero¬ 
wane pola magnetyczne mogą być tak silne, że niemal 
zatrzymują poruszające się elektrony. Po zapadnięciu 
się ostatnich wiązań spinowych średnie wewnętrzne 

536 


pole magnetyczne szybko spada do zera. Rozprasza¬ 
nie maleje, opór również szybko maleje. 

Przyłożenie zewnętrznego pola magnetycznego jest 
czynnikiem porządkującym sieć magnetyczną — 
przywraca zachwiany porządek magnetyczny, roz¬ 
praszanie maleje, opór również maleje — pojawia się 
ujemny magnetoopór. Wpływ pola magnetycznego 
jest więc w działaniu podobny do efektu obniżania 
temperatury. 

Zastanówmy się teraz, dlaczego w obszarze wyso¬ 
kich temperatur opór ma mniejsze wartości niż obser¬ 
wowane w niskich temperaturach. Otóż w ferromag- samoistny 
netyku, mimo że nie przykładamy zewnętrznego pola magnetoopór 
magnetycznego, wewnętrzne pole magnetyczne wy- ferro- 
wołuje samoistny magnetoopór. Pole magnetyczne magnetyków 
w zwykłych półprzewodnikach powoduje zazwyczaj 
zwiększenie oporu, często bardzo znaczne. Powyżej 
temperatury krytycznej cieplne drgania sieci krysta¬ 
licznej niszczą wewnętrzne pole magnetyczne i opór 
próbki może zmaleć nawet poniżej oporu obserwo¬ 
wanego w bardzo niskich temperaturach, ponieważ 
żaden samoistny magnetoopór już nie istnieje. 

W antyferromagnetycznym półprzewodniku w ni¬ 
skich temperaturach nie ma pola wewnętrznego — 
atomowe pola magnetyczne kompensują się nawza- opór anty- 
jem. Szybki wzrost oporu w miarę podwyższania ferremagne- 
temperatury jest spowodowany częściowym psuciem tyków 
się kompensacji. Pojawiają się lokalne pola magne¬ 
tyczne, a zatem wzrost rozpraszania nośników prądu 
i wzrost oporu. Po osiągnięciu temperatury krytycz¬ 
nej pole magnetyczne wewnętrzne dąży do zera wsku¬ 
tek nieustannych szybkich zmian kierunków momen¬ 
tów magnetycznych, a nie wskutek ponownej kom¬ 
pensacji. Z punktu widzenia pola magnetycznego 
wracamy do sytuacji, jaka była w temperaturach 
niskich, tzn. nieistnienia wewnętrznego pola magne¬ 
tycznego. Opór próbki maleje jednak tylko nieznacz¬ 
nie, ponieważ drgania cieplne sieci krystalicznej są 
także silnym źródłem rozpraszania nośników prądu. 

Drgania te zwiększają się w miarę wzrostu tempera¬ 
tury i opór próbki znów zaczyna rosnąć. Warto pod¬ 
kreślić, że cały efekt został wytłumaczony zmianami 
rozpraszania nośników prądu. Nie zawsze sytuacja 
jest tak jasna. W miarę wzrostu temperatury może się 
jednocześnie zmieniać koncentracja nośników prądu, 
co znacznie komplikuje obraz zmian zachodzących 
w półprzewodnikach magnetycznych. 

Ogólnie można stwierdzić, że wszystkie efekty anomalie 
transportu efekty związane z ruchem . nośników w pobliżu 
prądu, wykazują wiele osobliwości w pobliżu tempe- temperatury 
ratury krytycznej. Anomalnym zmianom, oprócz krytycznej 
oporu właściwego, ulegają: przewodność cieplna, siła 
termoelektryczna, współczynnik Halla itp. Charakte¬ 
rystyczna jest także zależność różnych parametrów 
od kierunku i rodzaju (a tym samym siły) oddziaływań 
magnetycznych. Ponieważ przez tworzenie stopów 
można zmieniać rodzaje oddziaływań spinowych, 
należy oczekiwać bardzo silnych zależności mierzo¬ 
nych parametrów od składu otrzymanych stopów. 

Własności optyczne półprzewodników 
magnetycznych 

Optyczne własności półprzewodników magnetycz¬ 
nych, a więc m.in. takie zjawiska, jak: absorpcja fali 
elektromagnetycznej w zależności od energii fali pa¬ 
dającej, odbicie, efekt skręcania płaszczyzny polary¬ 
zacji (efekt Faradaya), również wykazują anomalie 
w porównaniu z podobnymi zjawiskami obserwowa¬ 
nymi w półprzewodnikach. Anomalie te widoczne są 
zarówno w kształcie obserwowanych krzywych, jak 
również w ich zależności od temperatury i pola mag¬ 
netycznego. Interpretacja otrzymanych wyników jest 
na ogół bardzo trudna i wiele obserwowanych zależ¬ 
ności nie znalazło dotychczas pełnego wyjaśnienia. 

Własności optyczne kryształu stanowią odbicie me¬ 
chanizmów oddziaływania materiału z falą elektro- 


magnetyczną. W materiałach magnetycznych ze 
względu na obecność spinów, wewnętrznych pól mag¬ 
netycznych, fal spinowych itp. powstają nowe formy 
oddziaływań fali elektromagnetycznej z kryształem, 
ponadto komplikują się znane efekty optyczne obser¬ 
wowane w zwykłych półprzewodnikach, 
absorpcja Rozpatrzmy np. jedno z najbardziej typowych zja- 
fali wisk optycznych — absorpcję fali elektromagnetycz- 
elektromag- nej w półprzewodniku magnetycznym. W zwykłym 
netycznej półprzewodniku, jeżeli energia fali padającej jest 
mniejsza od energii wzbronionej (rys. 1) kryształ nie 
absorbuje fali—jest przezroczysty dla padającego 
promieniowania. W półprzewodnikach magnetycz¬ 
nych, w przerwie energetycznej znajdują się pasma 
o dużej gęstości stanów związane z elektronami d lub 
/. Może to być jedno, jak jia rys. 2, lub więcej pasm. 
Jeżeli energia fali elektromagnetycznej będzie równa 
różnicy energii między pasmem walencyjnym i pas¬ 
mem d lub f 7 lub różnicy między d czy / a pasmem 
przewodnictwa (rys. 2), wówczas taka fala może być 
silnie absorbowana, mimo że jej energia jest znacznie 
mniejsza od energetycznej szerokości pasma wzbro- 
przyklad: nionego. Na rys. 2 przedstawiono absorpcję we fluorku 
fluorek europu w zależności od energii fali padającej. Piki 
europu oznaczone numerami od / do 6 odpowiadają różni- 





Rys. 7. Widmo absorpcji dla cienkiej monokrystalicznej warstwy 
fluorku europu (EuF = ) w temperaturze 20 K 

com energii pomiędzy pasmem walencyjnym a ko¬ 
lejnymi stanami elektronów powłoki / europu. Od¬ 
powiedni rysunek struktury gęstości stanów zawie¬ 
rałby więc sześć pików gęstości stanów w przerwie 
energetycznej, a nie jeden jak na rys. 2. Struktura 
widma absorpcji fluorku europu jest stosunkowo pro¬ 
sta i łatwa do interpretacji. Należy jednak pamiętać, 
że nie wszystkie możliwe do wyobrażenia przejścia 
optyczne są dozwolone; różnią się one ponadto na¬ 
tężeniem linii absorpcyjnych, regułami polaryzacji itp. 
Warto zauważyć, że takie czynniki, jak: natężenie linii, 
ich przesuwanie się w funkcji temperatury czy ciśnie¬ 
nia, reguły polaryzacji, są bezpośrednią wskazówką 
ułatwiającą ident>dikację przejścia optycznego. Na 
rys. 7 warto zwrócić uwagę na wartość współczynnika 
absorpcji dla przejść 6 i 7. Są to bardzo duże wartości 
obserwowane na ogół w zwykłych półprzewodnikach 
dla przejść międzypasmowych, co dodatkowo kom¬ 


plikuje eksperyment i może prowadzić do mylnej in¬ 
terpretacji. 

Związki europu wykazują również charakterystycz¬ 
ną anomalię przesuwania się kraw-ędzi absorpcji w 
stronę niższych energii, gdy temperatura maleje 
i kryształ zaczyna się porządkować magnetycznie. 
Podobny efekt powoduje przyłożenie zewnętrznego 
pola magnetycznego. 


Półprzewodniki półmagnetyczne 

Materiały, o których będzie mowa, mieszczą się w 
grupie półprzewodników magnetycznych i obie de¬ 
finicje podane na wstępie doskonale się do nich sto¬ 
sują. Nazwa półprzewodniki półmagnetyczne została 
użyta niejako eksperymentalnie, ponieważ będzie mo¬ 
wa o grupie materiałów jeszcze słabo zbadanych, ale 
o bardzo ciekawych własnościach. Będziemy pod tą 
nazwą rozumieli stopy półprzewodników z magne¬ 
tykami, ale o raczej niewielkiej, najwyżej kilkunasto- 
procentowej zawartości materiału magnetycznego. 

W tego typu materiałach powinny dominować włas¬ 
ności półprzewodnikowe, a własności magnetyczne 
będą istnieć niejako na drugim planie. 

Dotychczas półprzewodnikami magnetycznymi na¬ 
zywaliśmy magnetyki o pewnych własnościach cha¬ 
rakterystycznych dla półprzewodników. Natomiast 
półprzewodniki półmagnetyczne są to półprzewodniki 
o pewTiych własnościach charakterystycznych dla 
magnetyków. Materiałów o takich cechach może być stopy poł- 
bardzo wiele, ponieważ prawie każdy półprzewodnik przewoam- 
może tworzyć stopy z różnymi magnetykami. Można kow z imag- 
sobie wyobrazić ogromną liczbę materiałów zarówno netykami 
o szerokiej przerwie energetycznej i dużym oporze, 
jak np. stopy ZnS-MnS, CdSe-MnSe, CdTe-MnTe 
itd., a także materiały o małej, a nawet zerowej przer¬ 
wie energetycznej i małym oporze, jak np. InSb-MnSb, 

HgTe-MnTe, HgTe-FeTe.HgSe-MnSe itp. W stopach 
mamy możliwość ciągłej i płynnej zmiany koncentra¬ 
cji atomów odpowiedzialnych za magnetyczne włas¬ 
ności materiału. Daje to zarówno możliwość stopnio¬ 
wej zmiany własności półprzewodnika, jak również 
szanse regulacji tych własności. Dotychczas opubli¬ 
kowano niewiele prac na temat własności półprze¬ 
wodników półmagnetycznych, można jednak oczeki¬ 
wać jakościowo i ilościowo nowych efektów fizycz¬ 
nych. Przede wszystkim zewnętrzne pole magnetyczne 
powinno silnie wpływać na własności tych materia¬ 
łów, zarówno na własności obserwowane w efektach 
transportu prądu, jak i efektach optycznych. Można 
się spodziewać nowych oddziaływań elektronów, 
plazmonów czy fononów z falami spinowymi, czy 
smagnonami (—> Wzbudzenia elementarne w ciele sta¬ 
łym). Powinny również wystąpić pewne modyfikacje 
w strukturze energetycznej. Patrząc od strony magne¬ 
tyków, mamy możliwość zmiany typów oddziaływań 
spinowych, co oczywiście jest związane bezpośrednio 
z koncentracją magnetyka w stopie. Otwiera się 
now r a dziedzina w fizyce ciała stałego, która może 
przynieść nie tylko głębszą wiedzę o mechanizmach 
istniejących oddziaływań i strukturach krystalicznych, 
ale również - nowe, a nawet rewelacyjne, praktyczne 
zastosowania tego typu materiałów. 

S. Methfessel, D. C. Mattis Magnetic Semiconductors , Ber¬ 
lin 1968 (ros. Moskwa 1972). 


Struktura elektronowa ciał stałych 


Waldemar Gorzko wski 


Badanie struktury elektronowej za pomocą metod 
mechaniki kwantowej stanowi jedno z najważniejszych 
zagadnień fizyki ciała stałego, a w szczególności fizyki 
metali, półprzewodników i izolatorów. Wykorzystuje 


się przy tym charakterystyczną budowę wewnętrzną 
ciał krystalicznych. W rezultacie otrzymuje się war¬ 
tości dozwolonych poziomów energetycznych zgru¬ 
powanych w pasma. Mimo wyjaśnienia podstawo- 
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wych problemów związanych ze strukturą elektrono¬ 
wą i mimo licznych sukcesów tej teorii, nadal istnieje 
wiele zagadnień nie rozwiązanych, głównie z powodu 
trudności rachunkowych. Ścisły opis układu cząstek 
stanowiących makroskopowe ciało stałe, tj. elektro¬ 
nów i jąder atomowych, wymagałby ułożenia i roz¬ 
wiązania równania (w opisie kwantowym) lub układu 
równań (w opisie klasycznym) zawierającego liczbę 
zmiennych porównywalną z liczbą Avogadra (ok. 
6 TO 23 ). Jest to niewykonalne nawet przy użyciu naj¬ 
potężniejszych maszyn liczących i dlatego stosuje się 
uproszczenia umożliwiające otrzymanie rozwiązań 
przybliżonych. 

Wiele ze stosowanych przybliżeń ma tę własność, 
że ich jakość jest tym lepsza, im więcej cząstek zawiera 
rozpatrywany układ fizyczny. Nie jest to cecha wy¬ 
jątkowa. Na przykład rozpatrując gaz w naczyniu 
operujemy takimi pojęciami, jak ciśnienie, tempera¬ 
tura, entropia itd., które tym lepiej opisują układ, 
im więcej cząsteczek gazu on zawiera — gdyby w na¬ 
czyniu było tylko kilka cząsteczek, posługiwanie się 
wymienionymi pojęciami byłoby mało sensowne, na¬ 
leżałoby wtedy każdą cząsteczkę opisywać oddzielnie, 
uwzględniając jej oddziaływanie z innymi cząsteczka¬ 
mi i ze ściankami naczynia. 

przybliżenie Wspomnianą własność ma również stosowane naj- 
jedno- częściej przybliżenie zwane przybliżeniem jednoelek- 
eiektronowe tronowym. Można je odnosić zarówno do bezposta¬ 
ciowych ciał stałych, jak i do ciał krystalicznych. 
W przybliżeniu tym zakłada się, że ruch każdego 
elektronu walencyjnego można opisać niezależnie 
przyjmując, że porusza się on w pewnym polu po¬ 
tencjalnym V(r) (r — wektor położenia), niezależnym 
od stanu rozpatrywanego elektronu. Potencjał ten jest 
wytwarzany przez pozostałe elektrony walencyjne 
oraz rdzenie atomowe, czyli jądra, wraz z elektronami 
niewalencyjnymi. Strukturę elektronową bezpostacio¬ 
wych ciał stałych bada się od niedawna i nie wiadomo 
jeszcze, jakie metody postępowania okażą się naj¬ 
owocniejsze. W odniesieniu do ciał krystalicznych 
metody, oparte na przybliżeniu jednoelektronowym, 
są podstawowymi metodami badawczymi. 

Oprócz przybliżenia jeanoelektronowego do bada¬ 
nia struktury elektronowej coraz częściej stosuje się 
metody teorii wielu ciał, czyli metody uwzględniające 
wzajemne oddziaływanie wszystkich elektronów wa¬ 
lencyjnych. Tego rodzaju opis wielociałowy jest znacz¬ 
nie trudniejszy od opisu j ednoelektronowego i nie 
stosuje się go tak powszechnie. Istnieją jednak zja¬ 
wiska, których nie można wyjaśnić za pomocą opisu 
jednoelektronowego (np. zjawisko nadprzewodnictwa, 
którego istotę udało się wyjaśnić dopiero za pomocą 
ujęcia wielociałowego, —► Nadprzewodnictwo). 

Dla niektórych ciał krystalicznych przybliżoną 

postać potencjału V(r) można wyznaczyć korzysta¬ 
jąc z mniej lub bardziej uzasadnionych założeń mo¬ 
delowych. Czasami jest to wystarczające, jednak dla 

żadnego kryształu nie znamy takiej postaci V(r) y 
która umożliwiałaby pełny opis podstawowych jego 
własności. Mimo tej trudności wiele zagadnień daje 
się rozwiązać dzięki symetrii kryształów i związanej 

z nią symetrii potencjału V(r). 

Rozmiary rceczywistych kryształów (rzędu mili¬ 
metrów) są wielokrotnie większe od stałej sieci (kilka 
angstremów). Z tego względu na ogół pomija się zja¬ 
wiska powierzchniowe związane z istnieniem po¬ 
wierzchni kryształu (-> Stany powierzchniowe w cia¬ 
łach stałych) i przyjmuje, że kryształ jest nieskończony, 
warunki Czasami na rozpatrywany kryształ nieskończony na- 
Borna- kłada się dodatkowo warunki Boraa-Karmana. Jest to 
Karmana równoważne założeniu, że cały nieskończony kryształ 
jest zbudowany z okresowo powtarzających się w 
przestrzeni makroskopowych segmentów, z których 
każdy jest równoważny badanemu kryształowi rze¬ 
czywistemu. Jeżeli rzeczywisty kryształ jest kostką 
o wymiarach N ± a x x N& 2 x N z a Zy gdzie a u a 2 i a z są 
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stałymi sieci, a N ly N 2 i N z — bardzo dużymi liczbami 
naturalnymi, to warunki Borna-Karmana oznaczają 
po prostu, że d|a dowolnej wielkości fizycznej J> za¬ 
chodzi związek: 

9{x y y y z) = y+n 2 N 2 a 2> z+n z N z a z ) y 

gdzie n u n 2 i n z są dowolnymi liczbami całkowity¬ 
mi. 

Przy badaniu struktury elektronowej kryształów 
najważniejsza okazuje się ich symetria translacyjna, 
tj. fakt, że kryształ ma budowę mikroskopową okre¬ 
sowo powtarzającą się w przestrzeni, co można wy¬ 
razić następującym związkiem spełnianym przez po¬ 
tencjał krystaliczny V{r): 

V(r+n 1 a 1 -f -f n z a z ) = V(r) y 

gdzie a u a 2 i a z są wektorami charakterystycznymi dla 
danej sieci krystalicznej, a n ly n 2 i n z — dowolnymi 
liczbami całkowitymi. Zauważmy, że o ile w wypadku 
warunków Borna-Kńrmana chodziło o makrosko¬ 
pową symetrię dowolnej wielkości fizycznej 9, o tyle 
w wypadku symetrii translacyjnej istotna jest mikro¬ 
skopowa symetria konkretnej wielkości fizycznej — 

potencjału krystalicznego V(r ). 

Z symetrii translacyjnej wynika, że stacjonarne 
funkcje falowe elektronu w krysztale są modulowany¬ 
mi falami płaskimi postaci (tzw. twierdzenie Blocha): 

rfk(r) = u~k(r)c ^ r , (1) 

gdzie k jest wektorem falowym, a u~k{r) — funkcją 
modulującą mającą taką samą symetrię przestrzenną 

jak potencjał V(r). Czynnik = cos"Xr+ isinkr 
reprezentuje falę płaską zapisaną za pomocą liczb 
zespolonych (czynnik zawierający czas w zagadnie¬ 
niach stacjonarnych nie występuje i został pominięty). 

Zgodnie z mechaniką kwantową wszystkie infor¬ 
macje o układzie fizycznym, w danym wypadku o elek¬ 
tronie w krysztale, są zawarte w równaniu Schrodin- 
gera. Przyjmując, że funkcje falowe będące rozwiąza¬ 
niami równania Schródingera mają postać (1), z rów¬ 
nania tego uzyskuje się równanie wyznaczające po¬ 
stać funkcji Uk(r ) oraz dozwolone wartości energii. 
Ogólnym wnioskiem z tego rodzaju rozważań jest to, 
że dozwolone energie E elektronów w krysztale są 

funkcjami wektora falowego k. Wyznaczenie kon¬ 
kretnej zależności E(k ) wymagałoby rozwiązania 
otrzymanego równania. 

W granicznym przypadku tzw. pustej sieci przyj- 
mujesię, że potencjał krystaliczny V zależy od wekto¬ 
ra położenia r, ale bardzo słabo. Można wtedy przy¬ 
jąć, że V(r) jest stałe (lub równe zeru przy odpo¬ 
wiednim wyborze punktu zerowego dla potencjału), 
a mimo to ma symetrię taką jak kryształ, a nie taką, 
jak rzeczywiście zupełnie pusta przestrzeń. Zależność 

E(k) ma wtedy postać: 

E{k) = h 2 k*f2m y 

gdzie h — hj2n (h — stała Plancka), m — masa elek¬ 
tronu. 

Jak wiadomo z mechaniki, energia Ei pęd p cząstki 
swobodnej związane są zależnością 

E — p 2 !2m. 

Zatem wielkość hk odgrywa rolę analogiczną do pędu 
w mechanice. Podobieństw między wektorem hk a pę¬ 
dem jest więcej i z tego względu hk nazwano kwazi- 
pędem. 

Zależność energii E od wektora falowego k trakto¬ 
wana jako jednoznaczna funkcja k (mogącego przyj¬ 
mować dowolne wartości) na ogół nie jest funkcją 
ciągłą. Bliższe badania tej zależności wskazują, że gdy 
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V(r) ź const t to wartość E dla pewnych wartości k 
może zmieniać się skokowo. 

Nieciągłości funkcji E(k) mogą występować tylko 
dla tych k y które spełniają związek: 


gdzie 
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/ 1 , 4 i / 3 oznaczają liczby całkowite. 

Powierzchnie, na których mogą występować nie- 

strefy ciągłości funkcji £(/:) rozbijają przestrzeń wektora k 
Brillouina na rozłączne obszary zwane strefami Brillouina. 

(Przez przestrzeń wektora k rozumie się trójwymiaro¬ 
wą przestrzeń euklidesową, w której na trzech karte- 
zjańskich osiach współrzędnych odłożono k %, k y i k z ). 

Strefa zawierająca punkt k = (0, 0, 0) nazywa się 
pierwszą strefą Brillouina, strefa z nią sąsiadująca 

nazywa się drugą strefą Brillouina, it^. Wektory b u b 2 
i b 3 nazywają się wektorami podstawowymi sieci od¬ 
wrotnej, zaś wektor K — wektorem sieci odwrotnej. 
Wszystkie strefy Brillouina mają jednakową objętość 
i każdą z nich można uważać za pewną komórkę ele¬ 
mentarną sieci odwrotnej. Innymi słowy, całą sieć 
odwrotną można otrzymać z pierwszej strefy Brillou¬ 
ina przez jej równoległe przesuwanie. To samo odnosi 
się do drugiej, trzeciej i dalszych stref Brillouina. 
Strefy Brillouina o różnych numerach mają różne 
kształty. Spośród wszystkich stref wyróżnia się pierw¬ 
sza. W odróżnieniu od innych strefa ta jest jednospój- 
na, tzn. składa się tylko z jednej części. Każda inna 
strefa Brillouina składa się z kilku oddzielnych 
części. 

W przypadku kryształu nieskończonego bez nało¬ 
żonych warunków Borna-Kńrmdna wektory falowe k 


warunki na 
wektory 
falowe 


mogą przyjmować dowolne wartości. Innymi słowy k 
może się zmieniać w sposób ciągły. Nałożenie warun¬ 
ków Borna-Kśrmdna, czyli uwzględnienie skończo¬ 
nych rozmiarów kryształu, połączone z pominięciem 
zjawisk powierzchniowych, jest równoważne nałoże¬ 
niu na k pewnych warunków. Warunki te mogą być 

spełnione tylko dla niektórych wektorów k. W rezul¬ 
tacie dla kryształu z nałożonymi warunkami Borna- 

Karmdna wektory k mogą przyjmować tylko dy¬ 
skretne (nieciągłe) wartości, np. dla kryształu skoń¬ 
czonego mającego kształt równoległościanu o kra¬ 
wędziach L x = N x a x , £2 = N 2 a 2 i L z = wektory k 
mogą przyjmować wartości dane wzorem: 


/ 2 tc _ 2n 2iz _ \ 

X AW" 1 ’ ” 2 ’ jYa 7 ’ 


( 2 ) 


gdzie n x , n 2 i n z są dowolnymi liczbami całkowitymi. 

Wektorom k należącym do pierwszej strefy Brillouina 
odpowiadają wtedy wartości n x , n 2 i n 3 spełniające 
nierówności: 

-Ni/2 < < Nil2. 


Liczba różnych wektorów falowych w każdej ze stref 
Brillouina jest jednakowa i wynosi N x N 2 N 3y czyli jest 


równa liczbie komórek elementarnych w krysztale. 

Dla każdego wektora k 2 z drugiej (trzeciej, czwar¬ 
tej itd.) strefy Brillouina można znaleźć taki wektor 

k x z pierwszej strefy Brillouina, że różnica k 2 —k x bę¬ 
dzie jednym z wektorów sieci odwrotnej K. Funkcje 
falowe yfk(r) odpowiadające wektorom k różniącym 
się o wektor K różnią się jedynie postacią funkcji 
in(r). W związku z tym stany stacjonarne elektronów 

w krysztale można opisywać wartością k z pierwszej 
strefy Brillouina (zredukowany wektor falowy) uwa¬ 
żając u!ć{r) za wieloznaczną funkcję r, a E(k) za wielo¬ 
znaczną funkcję k. Innymi słowy, przy ograniczeniu 
obszaru zmienności wektora k do pierwszej strefy 
Brillouina, każdej wartości r odpowiada więcej niż 
jedna wartość ut(r ), a każdej wartości k — więcej niż 
jedna wartość E(k). Dokładniejsza analiza wskazuje, 
że wieloznaczną funkcję E(k) określoną w całej prze¬ 
strzeni wektora k można traktować jako zespół jedno¬ 
znacznych funkcji ciągłych E n {k) określonych dla k 
z pierwszej strefy Brillouina, numerowanych para¬ 
metrem n o wartościach naturalnych. Mówimy, że 
parametr n numeruje pasma energetyczne, czyli po¬ 
szczególne gałęzie funkcji E(k). 

Kształt stref Brillouina zależy od symetrii transla- 
cyjnej sieci krystalicznej. Na rys. 1 pokazano kształt 
pierwszej i drugiej strefy Brillouina dla sieci regularnej 
płasko i przestrzennie centrowanej. Na rys. 2 poka¬ 
zano zależność energii od wektora falowego dla pustej 


zredukowany 

wektor 

falowy 


pasma ener¬ 
getyczne 


kształt stref 
BriBouina 



Rys. 1 . Pierwsza 
i druga strefa Bril¬ 
louina dla sieci re¬ 
gularnej: a) płasko 
centrowanej, b) 
przestrzennie cen¬ 
trowanej 






druga strefa pierwsza strefa druga strefa 
Brillouinna Brillouinna Brillouinna 


Rys. 2. Zależność E(k) dla pustej sieci. Niebieska parabola od¬ 
powiada niezredukowanemu wektorowi Ar. Po zredukowaniu 
wektora k do pierwszej strefy Brillouina funkcja E(k) określona 

dla k spełniających warunek - nla ^ k <. Ttja staje się funkcją 
wieloznaczną (czarne linie). W przypadku pustej siec: dozwolone 
są wszystkie wartości E^ E 0 
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sieci, a na rys. 3 dla bardziej realistycznego, cho¬ 
ciaż również fikcyjnego przypadku, gdy sieć nie jest 

pusta. Przykład rzeczywistej zależności E n (k) przed¬ 
stawiono na rys. 4. 

A 

E(k) } 

trzecie pasmo 
energii dozwolonych 
C/7-3) 

energie wzbronione 


drugie pasmo 
energii dozwolonych 
<*= 2 ) 

energie wzbronione 
pierwsze pasmo 
gii dozwolonych (n = 1) 

~/a 0 ~/a ?3t/o k 

Rys. 3. Przykład zależności E(k ) dla V(r) & const. Widzimy, 
że na granicach stref Brillouina pojawiły się nieciągłości funkcji 

E(k). Niebieskim kolorem zaznaczono zależność E(k ) dla nie- 
zredukowancgo wektora falowego (wtedy E jest jednoznaczną 

funkcją k). Po zredukowaniu k do pierwszej strefy Brillouina E 

staje się wieloznaczną funkcją k rozpadającą się na kilka jed¬ 
noznacznych gałęzi ciągłych numerowanych parametrem n. Jak 
widać z rysunku, dozwolone energie elektronów mogą leżeć tyl¬ 
ko wewnątrz pewnych przedziałów oddzielonych obszarami 
energii wzbronionych, tj. energii, których nie może mieć elektron 
w stanie stacjonarnym. Szerokość pasma energii wzbronionych 
między pasmem walencyjnym a pasmem przewodnictwa nazy¬ 
wa się przerwą energetyczną (Eg) 






= 4 


2 «► 


Rys. 5. Siany ener¬ 
getyczne atomu 



a) - k - *- 






Rys. 4. Zależność energii E od 
zredukowanego wektora falo¬ 
wego k dla: a) krzemu 
i b) germanu. Ze względu na 
niemożliwość pokazania za¬ 
leżności E od k przebiegające¬ 
go całą trójwymiarową strefę 
Brillouina pokazano jedynie 

zależność E(k) dla k leżących 
na kilku liniach zaznaczonych 
na rys. c) przedstawiającym 
pierwszą strefę Brillouina dla 
germanu i krzemu 


W przytoczonym opisie kwantowym nie uwzględ¬ 
niono własnego momentu pędu elektronu, tj. spinu. 
Wprowadzenie tej wielkości podwaja liczbę pasm, 
lecz nie zmienia zasadniczego kształtu teorii. Nadal 
ważne jest stwierdzenie, że dozwolone energie elektro¬ 
nów mogą leżeć tylko wewnątrz pewnych obszarów 
oddzielonych przerwami energetycznymi i że. stany 
elektronów wewnątrz tych pasm można „numero¬ 
wać’' za pomocą wektora falowego k. 

Sytuacja w kryształach pod pewnymi względami 
przypomina sytuację w atomach i cząsteczkach. Na 
przykład w atomie (iys. 5) główna liczba kwantowa n 
numeruje poszczególne poziomy energetyczne, zaś 
stany elektronów odpowiadające danemu n różnią się 
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wartością liczb kwantowych orbitalnej liczby kwan¬ 
towej / = 0, 1,2,..., n, magnetycznej liczby kwanto¬ 
wej m — 0, +1, ±2,..., zb/ i spinowej liczby kwan¬ 
towej s = 4; 1 / 2 . W krysztale liczba n numeruje pasma, 

zaś wektor k charakteryzuje stany wewnątrz pasma. 

Dla kryształu skończonego liczba różnych stanów 
elektronowych w paśmie, czyli liczba różnych dozwo¬ 
lonych wartości k w pierwszej strefie Brillouina równa 
jest N x N 2 N z> tj. liczbie komórek elementarnych w 
krysztale. Z doświadczenia wiadomo, że szerokość 
pasm energetycznych, tj. różnica między najwyższą 
i najniższą energią elektronów w danym paśmie, jest 
rzędu 1 eV. Wynika stąd, że różnice energii między 
kolejnymi poziomami energetycznymi w paśmie są 
rzędu 10~ 23 eV (dla kryształu skończonego). Szerokość 
strefy Brillouina w kierunku równoległym do osi Xi 
wynosi 2r»/ai. Odległości między kolejnymi dozwolo¬ 
nymi wektorami k w tym kierunku wynoszą 2n/Niai , 
czyli stanowią — z grubsza biorąc —jedną dziesię- 
ciomilionową część szerokości strefy (1 /M ~ 1 /(liczba 
Avogadra) 1/3 ^ 10~ 7 ). Widać, że stany elektronowe 

w krysztale skończonym w przestrzeni wektora k są 
położone bardzo gęsto. Dzięki temu nawet w przy¬ 
padku kryształu skończonego można postępować tak, 
jak postępuje się w przypadku kryształu nieskończo¬ 
nego bez nałożonych warunków Borna-Karmśna, 
tzn. można przyjąć, że wewnątrz pasma każda ener¬ 
gia jest dozwolona, a wewnątrz pierwszej strefy 

Brillouina dozwolone są wszystkie wartości k. Inny- 
rm słowy, można przyjąć, że dopuszczalne wartości E 

i k zmieniają się w sposób ciągły, a nie dyskretny. 

Warto w tym miejscu wyjaśnić rolę warunków Bor- 
na-Karmana. Fizyczne znaczenie tych warunków zo¬ 
stało już omówione poprzednio. Natomiast z matema¬ 
tycznego punktu widzenia nałożenie warunków Bor- 
na-Karmana prowadzi do tego, że zbiory dopuszczal¬ 
nych wartości E i k stają się zbiorami dyskretnymi. 

Bez tych warunków zarówno £jak i k zmieniałyby się 
w sposób ciągły. Ponieważ nawet w przypadku dy¬ 
skretnym w praktyce stosuje się opis ciągły ze względu 
na fakt, że sąsiednie wartości dyskretne są bardzo 
bliskie siebie, mogłoby się wydawać, że nakładanie 
warunków Borna-Kńrmśna niczego nie daje. Tak 
jednak nie jest. Często bowiem zdarza się, że ważna 
jest liczba stanów w paśmie. Wiedząc np. jaka jest 
liczba elektronów walencyjnych przypadających na 
jedną komórkę elementarną, znając liczbę komórek 
elementarnych w krysztale i wiedząc, ile stanów 
„mieści się” w poszczególnych pasmach, bez trudu 
można obliczyć (uwzględniając zakaz Pauliego), ile 
najniższych pasm jest zapełnionych przez elektrony. 

Obliczenia takie przy ciągłej zmienności E i k są 
znacznie mniej przejrzyste. 

Gęstość prawdopodobieństwa Qk(r) znalezienia 
elektronu w punkcie danym wektorem r jest równa 
kwadratowi wartości bezwzględnej funkcji rpk{r) lub 
funkcji u~k(r) (-* Chemia kwantowa); 

Qk(r) = lyX(r)i 2 = \uZ(r) | 2 . 

Dla elektronów walencyjnych funkcja <fk(r) zazwy¬ 
czaj ma wartości istotnie różne od zera w całej ko¬ 
mórce elementarnej, a więc i w całym krysztale (funk¬ 
cja Qk(r) ma taką samą symetrię translacyjną jak po¬ 
tencjał krystaliczny V(r)). Elektrony walencyjne nie 
są więc zlokalizowane w określonych punktach prze¬ 
strzeni, np. przy atomach, lecz są rozmyte po całym 
krysztale. Sytuację taką mamy w większości substan¬ 
cji o praktycznym znaczeniu, chociaż nie musi to 
zawsze być prawdą. Wydaje się, że substancją, dla 

której funkcja oZ{r ) ma wartość istotnie różną od 
zera tylko w części komórki elementarnej jest bor. 
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Dopuszczalne wartości energii całkowitej elektro¬ 
nów E n (k) są „numerowane’* parametrem dyskretnym 
n , wskazującym pasmo, oraz parametrem ciągłym lub 

„prawie ciągłym” k , nie zależą natomiast od położenia 

elektronów w krysztale opisywanego wektorem r. 
zależność Gdybyśmy więc chcieli zrobić wykres dopuszczalnych 

energii E od 7 , to dla każdej dozwolonej wartości E 
otrzymalibyśmy poziomą kreskę. Kreski odpowiada¬ 
jące wszystkim wartościom E, jakie mogą przyjmować 
całkowite energie elektronów, tworzą pasma pokazane 
na rys. 6. Rysunki tego rodzaju są uboższe niż wy- 


n 
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energie 
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Rys. 6. Pasma energe¬ 
tyczne w ciele stałym 


kresy przedstawiające E w zależności od n i k. Uwi¬ 
docznione są na nich jedynie zakresy energii przyjmo¬ 
wane przez elektrony w poszczególnych pasmach i nic 
poza tym. W szczególności nie należy sądzić, że jeśli 
w paśmie mamy tylko jeden elektron, to może on 
„przemieszczać” się w nim swobodnie, bo „ma dużo 
miejsca”. Argumentacja taka, często spotykana przy 
omawianiu urządzeń półprzewodnikowych takich, jak 
tranzystory, diody itp. (zwłaszcza w opracowaniach 
o charakterze popularnym), jest bardzo sugestywna, 
ale nieprawdziwa. Dla stanów stacjonarnych gęstość 
wykres* prawdopodobieństwa znalezienia elektronu w punkcie 

energii 7 czyli wielkość <?&(r) nie zależy od czasu, a więc 
o żadnym ruchu w zwykłym znaczeniu nie może być 
mowy. W wykorzystywanych w praktyce materiałach 
często zdarza się, że istotnie w paśmie pustym elek¬ 
tron walencyjny może się przemieszczać stosunkowo 
swobodnie. Uzasadnienie tego jest jednak dość zło¬ 
żone i odwoływanie się tylko do intuicyjnych wyobra¬ 
żeń na ogół zawodzi. Konieczny jest tu ścisły opis 
kwantowy i traktowanie elektronu jako paczki falo¬ 
wej, czyli pewnej kombinacji stanów stacjonarnych. 
Okazuje się, że o możliwości poruszania się elektronu 
w paśmie decyduje nie tylko liczba elektronów w paś¬ 
mie lecz i inne wielkości, np. stopień nakładania się 
funkcji falowych o różnych wartościach wektora fa¬ 
lowego^ itp. Mogą zdarzać się przypadki, gdy mimo, 
że pasmo jest słabo obsadzone, swoboda ruchu elek¬ 
tronów jest mała. Trudno jest ustalić tu bezwzględnie 
obowiązującą regułę. Z grubsza biorąc można jednak 

powiedzieć, że im funkcje Qk(r ) są bardziej rozmyte, 
tym swoboda ruchu elektronów jest większa (stany 
zdelokalizowane). Odwrotnie — funkcjom wyraźnie 
zlokalizowanym w jakimś obszarze na ogół odpowie- 
da mała swoboda ruchu elektronów (stany zlokalizo¬ 
wane). 

W temperaturze OK elektrony zajmują najniższe 
stany energetyczne. Liczba stanów w paśmie jest 
równa liczbie komórek elementarnych w krysztale, 
pasmo Tego samego rzędu jest też liczba elektronów walen- 
walencyjne cyjnych kryształu. Najwyższe pasmo zawierające 
i pasmo elektrony nazywamy pasmem walencyjnym, zaś pasmo 
przewodni- leżące nad nim — pasmem przewodnictwa lub pas- 
ctwa mem przewodzenia. W zależności od sposobu obsa¬ 
dzenia i wzajemnego położenia pasm oraz od swobody 
ruchu elektronów kryształy dzieli się na izolatory, 
półprzewodniki i metale. 

W izolatorach i czystych półprzewodnikach w tem- 
izolatory peraturze 0 K niższe pasmo (walencyjne) obsadzone 


całkowicie elektronami jest oddzielone od zupełnie 
pustego pasma wyższego (przewodnictwa) przerwą 
energetyczną (rys. 7). W paśmie pustym nie ma co się 


Rys. 7. Struktura 
pasmowa izolato¬ 
rów i półprzewod¬ 
ników samoistnych 
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poruszać, zaś w paśmie całkowicie obsadzonym elek¬ 
trony zajmują wszystkie możliwe stany (o wszystkich 

wartościach k) i też nie mogą się poruszać (zmieniać 
stanu). Tak więc w temperaturze 0 K ani izolatory ani 
półprzewodniki nie mogą przewodzić prądu elek¬ 
trycznego. Między izolatorami i czystymi półprze- p€ ^ przewoc j_ 
wodnikami, czyli półprzewodnikami samoistnymi, \"-,A 
nie ma różnicy jakościowej. Jest jedynie różnica iloś- sa * mo i stn& 
ciowa. Gdy przerwa energetyczna jest dostatecznie 
mała, to w zwykłych temperaturach wskutek wzbu¬ 
dzeń termicznych część elektronów z pasma walencyj¬ 
nego przechodzi do pasma przewodnictwa. 

Jeżeli stany* są zdelokalizowane (ruch elektronów 
jest wtedy w dużym stopniu swobodny), to przez przy¬ 
łożenie zewnętrznego pola elektrycznego łatwo wywo¬ 
łać przepływ prądu i mamy półprzewodnik. 

W izolatorach przerwa energetyczna jest na tyle 
duża, że termiczne przejścia elektronów z pasma wa¬ 
lencyjnego do pasma przewodnictwa są prawie nie¬ 
możliwe, bądź stany elektronowe są silnie zlokalizo¬ 
wane. W pierwszym wypadku brak jest nośników ła¬ 
dunku, natomiast w drugim ruch nośników jest bar¬ 
dzo utrudniony (przyjęło się dość arbitralnie uważać 
za izolatory materiały o przerwie energetycznej więk¬ 
szej od 2,5-3 eV). 

W metalach najwyższe pasmo zawierające niezło- meta | e 
kalizowane eletrony jest zapełnione częściowo lub 
też zachodzi nakładanie pasma walencyjnego na puste 
pasmo przewodnictwa. W obu wypadkach możliwy 
jest ruch elektronów i przepływ prądu (rys. 8). 
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Rys. 8. Struktura pasmowa metali 
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Omówiona wyżej struktura elektronowa odnosisię 
do idealnych kryształów nie zawierających ani do¬ 
mieszek, ani defektów budowy sieci krystalicznej. 

W rzeczywistości sytuacja taka nigdy się nie zdarza. 

Idealny kryształ musiałby mieć entropię równą zeru, wpCyw ^ 
a to dla żadnej temperatury różnej od 0 K nie jest . 
możliwe. Uwzględnienie domieszek i defektów w * defektów 
krysztale prowadzi do wniosku, że w strukturze elek¬ 
tronowej kryształu powinny pojawić się dodatkowe 
poziomy energetyczne. Szczególnie ważne okazują się 
dwa rodzaje poziomów domieszkowych leżące we¬ 
wnątrz przerwy energetycznej: poziomy donorowe 
w pobliżu dna pasma przewodnictwa i poziomy akcep¬ 
torowe w pobliżu wierzchołka pasma walencyjnego. 
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Dla poziomów odpowiadających domieszkom lub 
defektom budowy gęstość prawdopodobieństwa zna¬ 
lezienia elektronu o(r ) jest istotnie różna od zera tylko 
w pewnym obszarze wokół defektu lub domieszki. 
Tego rodzaju stany zlokalizowane zaznaczamy zwykle 
za pomocą linii przerywanej (rys. 9). Przy dużej kon¬ 
centracji domieszek lub defektów obszary odpowia¬ 
dające różnym od zera wartościom różnych funkcji 
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Rys. 9. Poziomy dono¬ 
rowe i akceptorowe 



mo ,7" ^ 10 * Gdy atom y s 3 °d siebie bardzo oddało- rozszczepie 
ne (duża odległość międzyatomowa d\ rozszczepienie nie pozio- 
poziomowjest bardzo małe, a funkcje falowe są silnie mów 
zlokalizowane. W miarę zmniejszania d następują 



pasma do¬ 
mieszkowe 


o(r) zaczynają się nakładać. Stany domieszkowe prze¬ 
stają wtedy być stanami zlokalizowanymi i powstaje 
wąskie pasmo domieszkowe. 

Zazwyczaj poziomy donorowe lub akceptorowe 
odpowiadają domieszkom, mogą one jednak powsta¬ 
wać również wskutek występowania defektów budo¬ 
wy sieci krystalicznej, np. dyslokacji. 

Poziomy donorowe i akceptorowe z reguły bardzo 
silnie wpływają na własności elektryczne kryształów. 
Przez odpowiednie domieszkowanie niektórym izola¬ 
torom można nadać własności półprzewodzące. 

Powstawanie pasm energetycznych można wyjaśnić 
w inny sposób. Sposób ten jest bardziej poglądowy, 
nie stanowi jednak wygodnej podstawy do wykony¬ 
wania niezbędnych obliczeń ilościowych. W sieci 
utworzonej z N komórek elemetarnych znajduje się N 
jednakowych, jednakowo rozmieszczonych atomów. 
Gdyby poszczególne atomy nie oddziaływały ze sobą, 
to każdy prosty poziom elektronowy atomu byłby 
iY-krotnie zwyrodniały. W rzeczywistości atomy od¬ 
działują ze sobą — w przeciwnym wypadku nie utwo- 
rzyiyby kryształu. Oddziaływanie to znosi zwyrod¬ 
nienie: każdy jY-krotnie zwyrodniały poziom roz¬ 
szczepia się na N pojedynczych poziomów leżących 
bardzo blisko siebie i tw-orzących prawie ciągłe pas- 


coraz większe rozszczepienia poziomów, a jednocześ¬ 
nie funkcje falowe elektronów stają się coraz bardziej 
zdelokalizowane. 

Parametry struktury pasmowej, czyli wielkości parametry 
pozwalające określić położenie i kształt funkcji E n (k) y struk *ury 
można w zasadzie obliczyć znając potencjał V(r). fJasmowe ł 
Jest to jednak skomplikowane i częściowo udało się 
tylko w kilku przypadkach. Zazwyczaj strukturę pas¬ 
mową konkretnych ciał krystalicznych wyznacza się 
metodami półempiiycznymi: na podstawie rozważań 
teoretycznych definiuje się pewne parametry, a kon¬ 
kretne wartości tych parametrów przyjmuje się tak, 
aby przewidywane wartości mierzalne były zgodne 
z doświadczeniem dla możliwie szerokiej klasy zja¬ 
wisk. Szczególnie cenne są tu dane z doświadczeń 
optycznych. Badanie krawędzi absorpcji oraz natężeń 
przejść optycznych między rozmaitymi stanami 
pozwala wyznaczyć wielkości przerw energetycznych 
oraz kształt pasm w pobliżu ekstremów funkcji 
En(k). 


*. 1 . AMstLM wstęp ao teorii półprzewodników. Warszawa 1967; 
F.J. Blatt Fizyka ziawisk elektronowych w metalach i pólprzewod- 
tukach, Warszawa 1973, C. Kittel Wstęp do fizyki ciała stałego. 
Warszawa 1970: Ch.A. Wert, R.M. Thomson Fizyka ciała 
stałego. Warszawa 1974. 


Dynamika elektronu w ciałach 
stałych (kryształach) 

Waldemar Gorzkowski 


prędkość 

elektronu 


Ruch elektronu w przestrzennie okresowym polu kry¬ 
stalicznym, związanym z okresową budową kryształu, 
podlega nieco innym prawom niż ruch elektronu swo¬ 
bodnego. Prawa dynamiki elektronu w krysztale za¬ 
zwyczaj staramy się formułować w sposób nawiązu¬ 
jący do praw mechaniki klasycznej, używając języka 
podobnego do języka zwykłej mechaniki. Prawa te 
wyprowadza się z praw mechaniki kwantowej. Są 
one słuszne z pewnymi ograniczeniami i dotyczą 
zwykle wielkości uśrednionych po obszarze komórki 
elementarnej, np. mówiąc o prędkości elektronu mamy 
na myśli średnią prędkość elektronu w komórce ele- 
mentamej. Prędkość tę wyraża wzór: 


= -1 grad? En(k) = 


1 / fl ~ d - 

n ( ćk x En{k) > je Enik) ’ 


8 

okl 


E n (k) 


)• 


O) 


Symbole , -JL oznaczają pochodne fun- 

kcji, która po nich następuje, po odpowiednich zmien¬ 
nych, przy założeniu, że pozostałe zmienne mają usta¬ 
lone wartości (pochodne cząstkowe); fi = h/2n(h— sta- 

la Plancka); E n (k) oznacza energię elektronu z/r-tego 
pasma (w stanie stacjonarnym) w punkcie ~k strefy 
Brillouina (-►Struktura elektronowa ciał stałych), 
gdy na kryształ nie oddziałują pola zewnętrzne. Okreś¬ 
lona wyżej średnia prędkość elektronu jest prędkością 
grupową fal Blocha w /r-tym paśmie. 

Gdy sieć jest pusta zależność E(k) opisuje wzór: 
E = h*k*l2m. 

Prędkość v jest wtedy dana wzorem: 
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W rzeczywistych kryształach zależność E(k) jest bar¬ 
dziej złożona i wyrażenia na v się komplikują. 

W odniesieniu do wielkości średnich podstawowe 
prawa dynamiki elektronów opisujące zmiany kwa- 

zipędu fik , energii E i prędkości v elektronu pod wpły¬ 
wem makroskopowego pola elektrycznego ć i magne¬ 
tycznego H można sformułować w sposób przypomi¬ 
nający klasyczne prawa ruchu: 


4-(Afc) - -et -4-(«xi?), 

_£__ - c _ (2) 

pochodna siła pocho- siła pochodząca 

kwazipędu dząca od poła od pola magne- 
elektrycznego tycznego 

— E = —ećv — —(vxH)v, 

_ f . __(3) 

pochodna siła razy prędkość 

energii 


d 

dt 


v 


przyśpie¬ 

szenie 





stosunek siły do masy 


(4) 


e oznacza tu bezwzględną wartość ładunku elektronu, 
masa a m* nosi nazwę krzywiznowej masy efektywnej. Po- 
efektywna dane wyżej równania odnoszą się do przypadku, gdy 

energia E zależy tylko od wartości wektora k, a nie 
zależy od jego kierunku. Pasma takie nazywamy pa- 
pasma smarni sferycznymi. Krzywiznowa masa efektywna, 
sferyczne a ściślej biorąc jej odwrotność, dana jest wzorem: 


1 1 &E$) (5) 

m* h 2 dk 2 


Analizując wzory (2)-(5) należy zwrócić uwagę na 
następujące sprawy: 1) W równaniach mamy masę 
efektywną a nie masę spoczynkową elektronu 
Jest to bardzo istotna różnica, gdyż wielkości te 
mogą się od siebie różnić nawet o 2-3 rzędy. Dla 
wielu metali masa efektywna m* jest prawie równa 
masie elektronu swobodnego m 0 . Natomiast dla in¬ 
nych substancji na ogół zdarza się to dość rzadko. 
(Wartość masy efektywnej m* można uzyskać z czę¬ 
stości cyklotronowej badając ruch elektronu w ze¬ 
wnętrznym polu magnetycznym; —> Metale). 2) Jeżeli 

funkcja E n (k) jest liniową funkcją k* 9 to masa efek¬ 
tywna m* jest wielkością stałą, niezależną od Ic 
(a więc i od energii E). Pasma o takiej zależności 

pasma E(k) nazywają się pasmami parabolicznymi. W in- 
parabołiczne nych wypadkach masa efektywna zależy od energii 
elektronu. 

Gdy pasma są niesferyczne, tj. gdy E zależy nie 

tylko od wartości wektora k y lecz i od jego kierunku, 
układ równań (2)-(4) należy nieco zmodyfikować. 
Pierwsze dwa pozostają nadal ważne. Natomiast 
równanie (4) przyjmuje postać: 


dvj 

Hi 


-'E- 


1 ,[ 


ĆH- (vxH)i 

c 


h 


/, j = x, y> z. 
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Wielkość (1 nazywa się tensorem odwrotności 
masy efektywnej. Wielkość ta jest określona wzorem: 


/ 1 \ _ 1 d z E{k) . . _ 

\ m* In ~ h- dkidkj ; 1,1 ~ X,y ' 


(5') 


Dyskusja wzoru (5') w ogólnej postaci nie jest wy¬ 
godna. Zazwyczaj dobierając odpowiedni układ 
anizotropo- współrzędnych tensor odwrotności masy efektywnej 
weść masy sprowadza się na podstawie pewnych reguł prze- 
efektywnej kształcania tensorów do szczególnie prostej, tzw. 


diagonalnej postaci, w której wielkości (1 dla 

i ć j są równe zeru; różne od zera są wtedy tylko 
trzy wielkości: (l/w?*) u , (l//rc*) 22 , (l//w*) 3 »., 

We wspomnianym wyżej układzie współrzędnych, 
zwanym układem osi głównych tensora odwrotności 
masy efektywnej, ruch elektronu w każdym z trzech 
kierunków równoległych do osi współrzędnych od¬ 
bywa się niezależnie, chociaż dla każdego z tych kie¬ 
runków elektron ma na ogół inną masę efektywną. 
W praktyce często zdarza się, że dwie spośród trzech 
mas efektywnych są równe. Na ich oznaczenie sto¬ 
suje się symbol m_L. Trzecią masę oznacza się wtedy 
symbolem m n . Anizotropowy charakter masy efek¬ 
tywnej jest przyczyną występowania rozmaitego ro¬ 
dzaju efektów, których nie obserwuje się w wypadku 
elektronów swobodnych. Na przykład przyłożenie 
pola elektrycznego do kryształu o paśmie niesferycz- 
nym może powodować przepływ elektronów w kie¬ 
runku skośnym do kierunku pola (pojawia się wtedy 
napięcie poprzeczne w krysztale). 

Osobliwością masy efektywnej jest to, że może ona 
być ujemna. Ujemnej masie efektywnej odpowiada, 
mówiąc językiem mechaniki klasycznej, przyspie¬ 
szenie w kierunku przeciwnym do kierunku działa¬ 
nia siły. Z różnych względów wygodniej jest wówczas 
mówić o dziurach zamiast o elektronach, czyli o czą¬ 
stkach mających dodatni ładunek i dodatnią masę 
efektywną. Wielkości te co do wartości bezwzględnej 
są równe odpowiednim wartościom dla elektronu. 

Zdarza się, że spośród trzech mas efektywnych 
charakteryzujących pasmo niesferyczne np. tylko 
jedna jest dodatnia a dwie ujemne. Wtedy tylko w jed¬ 
nym kierunku elektron zachowuje się jak cząstka o do¬ 
datniej masie. 

Jak widać z dotychczasowych rozważań, przyspie¬ 
szenie elektronu określone jako dvjdt nie musi być 
równoległe do siły zewnętrznej. Nieizotropowość 
masy efektywnej i nierównoległość przyspieszenia do 
siły zewnętrznej biorą się stąd, że bariery potencjału, 
na które napotyka elektron w swym ruchu, w róż¬ 
nych kierunkach krystalograficznych są różne. Warto 
przy tym zwrócić uwagę, że w równaniach (2)-(4) 
nie występują w postaci jawnej siły wewnętrzne zwią¬ 
zane z istnieniem pola krystalicznego. Siły te jednak 
zostały w tych równaniach uwzględnione w postaci 
niejawnej właśnie w masie efektywnej. Gdyby pole 
krystaliczne nie zostało uwzględnione, to w równa¬ 
niach występowałaby masa elektronu swobodnego 
m 0 a nie m*. 

Zależność E n {k ) w rzeczywistych kryształach może 
być bardzo zawiła. Zwykle najbardziej interesują nas 

jedynie ekstrema funkcji £»(&), a konkretnie maksima 
pasma walencyjnego i minima pasma przewodnictwa, 
bowiem obsadzenie pasm wokół tych punktów jest 
szczególnie podatne na zmiany temperatury i innych 

czynników. Ekstrema E n (k) nie muszą występować 
w środku strefy. W germanie i krzemie maksimum 

energii pasma walencyjnego odpowiada k — 0 
(środek strefy), natomiast minima pasma przewod¬ 
nictwa w krzemie znajdują się wewnątrz, w germa¬ 
nie — na brzegu strefy Brillouina. 

W minimach wartość drugiej pochodnej jest do¬ 
datnia, a w maksimach — ujemna. W odniesieniu do 

funkcji E n (k) oznacza to, że minimom pasma prze¬ 
wodnictwa odpowiada dodatnia masa efektywna 
elektronów. Podobnie maksimom pasma walencyj¬ 
nego odpowiada ujemna masa efektywna elektro¬ 
nów. W częściowo obsadzonych (np. wskutek wzbu¬ 
dzeń termicznych) pasmach przewodnictwa elektrony 
zajmują przede wszystkim stany najniższe, tj. w po¬ 
bliżu minimum (ewentualną nadwyżkę energii elek¬ 
trony tracą wskutek różnego rodzaju efektów roz¬ 
proszeniowych na domieszkach, na drganiach sie¬ 
ci itp.). W związku z tym elektrony w paśmie prze¬ 
wodnictwa mają zwykle dodatnią masę efektywną. 
Inaczej sprawa przedstawia się z pasmem walencyj- 
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ujemna masa 
efektywna 


ekstrema 

pasm 









nym. Pasmo to jest prawie całkowicie wypełnione. 
Niewielka część elektronów wskutek wzbudzeń ter¬ 
micznych opuściła to pasmo przechodząc do pasma 
przewodnictwa i w pobliżu wierzchołka pasma mamy 
stany nieobsadzone. W obszarach strefy Brillouina, 
w których stany elektronowe są obsadzone, zmiany 
stanu elektronów są utrudnione ze względu na zasadę 
Pauliego. Stan mogą zmieniać na ogół tylko te elek¬ 
trony, które znajdują się w pobliżu stanów nieobsa- 
dzonych, a więc te, które znajdują się w pobliżu wierz¬ 
chołka pasma. W tym wypadku masa efektywna elek¬ 
tronów jest ujemna. W zewnętrznych polach elek¬ 
trycznych i magnetycznych nieobsadzone stany elek¬ 
tronowe zachowują się jak pewne cząstki o dodatnim 
ładunku elektrycznym. Cząstki te przyjęto nazywać 
dziurami. Dzięki wprowadzeniu pojęcia dziury, za¬ 
miast mówić o paśmie prawie całkowicie zapełnio¬ 
nym przez elektrony, wygodnie jest mówić o paśmie 
prawie pustym, zawierającym niewielką liczbę dziur. 
Bliższa analiza wskazuje, że dziurze po elektronie 
o ujemnej masie efektywnej należy przypisać dodat¬ 
nią masę efektywną i odwrotnie. Należy jednak pod¬ 
kreślić, że pole elektryczne bądź magnetyczne nie od¬ 
działuje na puste miejsca po elektronach, ale na same 
elektrony. Wprawdzie przy posługiwaniu się opisem 
za pomocą dziur zapominamy o elektronach zapeł¬ 
niających pasmo, jednakże należy sobie zdawać 
sprawę, że własności tych elektronów określają wła¬ 
sności dziur, ich ładunek, masę efektywną itd. Często 
spotykany pogląd, że dziura to miejsce po zwykłym 
elektronie, jest niezupełnie poprawny. Istotnie dziura 
o dodatniej masie efektywnej jest miejscem po elek¬ 
tronie, ale po elektronie o ujemnej masie efektywnej. 

W pasmach sferycznych, dla k bliskich wartości 
ekstremalnej, zależność energii od k jest paraboliczna, 

ale przy k bardziej odległych — pasmo przestaje być 
paraboliczne. Nieparaboliczność pasm zaobserwo¬ 
wano np. w InSb, InAs, HgTe itp. W wielu interesu¬ 
jących substancjach zależność E od k dla pasma prze¬ 
wodnictwa daje się opisać wzorem (przykład pasma 
nieparabolicznego) : 



E g oznacza tu szerokość przerwy energetycznej, 
a m* — masę efektywną na dnie pasma przewod¬ 
nictwa. 

Warto tu zwrócić uwagę, że zależność (6) jest po¬ 
dobna do zależności między pędem i energią elektro¬ 
nów swobodnych w mechanice relatywistycznej. Pełne 
podobieństwo odpowiednich wzorów otrzymuje się 
przez następujące przyporządkowanie: 

m* -> m 0 , E g -> 2/w,>c 2 

(c — prędkość światła). Analogia ta, mimo że jest 
czysto formalna i nie niesie głębszych treści, często 
może ułatwić zrozumienie zjawisk dotyczących wspo¬ 
mnianych substancji osobom, które są obyte ze szcze¬ 
gólną teorią względności. 

Przy badaniu dynamiki elektronów w pasmach sfe- pędowa masa 
rycznych oprócz krzywiznowej masy efektywnej m* efektywna 
często wprowadza się pędową masę efektywną m* * 
określoną wzorem: 

hk — m**v. 

kwazipęd analog 
pędu 

Masa pędowa m** nie musi być równa i często nie 
jest równa masie krzywiznowej m *, ponieważ zwią¬ 
zek hk — m*v na ogół nie zachodzi. Masę m** można 
wyrazić następująco: 

1 1 \ dEn* 

m ** h* k dk 

Dla pasm parabolicznych m* = m**. Dla pasm opi¬ 
sanych zależnością (6) zachodzi związek: 



Masa pędowa, podobnie jak masa krzywiznowa, może 
zależeć od energii elektronu. 

Masa m ** jest wielkością, która odgrywa rolę we 
wszystkich zjawiskach transportu nośników oraz 
w zjawiskach optycznych. Oprócz zasygnalizowanych 

tu kilku rodzajów zależności E n (k) istnieje wiele in¬ 
nych ciekawych typów pasm, jednak nie wszystkie 
z nich są dostatecznie zbadane i nie wszystkie mają 
praktyczne znaczenie. 

Bibliografia —► Struktura elektronowa ciał stałych. 


Dynamika sieci krystalicznej 

V/ac/aw Nazarewicz 


Podstawową własnością odróżniającą stan krysta¬ 
liczny od innych stanów (gazowego, ciekłego, amor¬ 
ficznego) jest periodyczna struktura przestrzenna, 
periodyczna Przy opisie tej struktury korzystamy z pojęcia sieci 
struktura krystalicznej. Rozróżniamy czternaście typów prze- 
przestrzenna strzennych sieci krystalicznych, zwanych sieciami 
Bravais’go. Węzły sieci reprezentują położenie iden¬ 
tycznych atomów lub grupy atomów (jonów). Moż¬ 
liwość przyporządkowania węzłom sieci różnych grup 
atomów prowadzi do dużej liczby odrębnych struktur 
krystalicznych (-* Budowa kryształów). 

Dzięki własności periodyczności przestrzennej (sy¬ 
metrii translacyjnej) można w krysztale rozpatrywać 
tylko pewien ograniczony obszar, zwany komórką 
elementarną. Przez odpowiednie powtarzanie ko¬ 
mórki elementarnej w trzech kierunkach otrzymuje 
się cały kryształ, który stanowi zbiór olbrzymiej 
liczby takich komórek. Określenie kształtu komórki 
elementarnej oraz rodzaju i położenia wchodzących 
w jej skład atomów daje pełny opis własności struk¬ 
turalnych kryształu. Dane te można uzyskać metodą 
dyfrakcji promieniowania rentgenowskiego. 

Rodzaj struktury krystalicznej, jaki ma dana sub¬ 
stancja, zależy od natury oddziaływań między atoma- 
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mi. Ze względu na te oddziaływania wyodrębniamy 
cztery zasadnicze grupy kryształów: kryształy kowa¬ 
lencyjne, jonowe, metaliczne i molekularne (tutaj nie 
rozpatrywane). Wielkość oddziaływań charaktery¬ 
zuje energia wiązania, która przybiera wartości 
w przedziale od dziesiątych części eV do kilku eV 
na atom. 

Oddziaływanie między atomami w krysztale można oddziaływa- 
opisać używając funkcji energii potencjalnej. Funkcja nia między 
ta osiąga minimum, gdy atomy znajdują się w ściśle atomami 
określonych położeniach względem siebie. Położenia 
te są położeniami równowagi. 

Przy opisie niektórych własności kryształów można 
z powodzeniem przyjąć model statyczny, który za¬ 
kłada, że atomy są nieruchome. Założenie to jest jed¬ 
nak idealizacją. W rzeczywistości atomy zawsze wy¬ 
konują małe oscylacje wokół swoich położeń równo¬ 
wagi, których amplituda zależy od temperatury. 

Oscylacje te nazywamy drganiami sieci krystalicznej. 

Drgania sieci krystalicznej odgrywają ważną rolę 
w wielu procesach zachodzących w ciałach stałych. 

Uwzględnienie drgań sieci jest niezbędne przy roz¬ 
patrywaniu własności cieplnych kryształów, jak ciepło drgania sieci 
właściwe, przewodnictwo i rozszerzalność cieplna, krystalicznej 






Spośród wielu innych zjawisk, które zależą od drgań 
sieci, wymienimy tylko rozpraszanie elektronów w me¬ 
talach i półprzewodnikach oraz absorpcję promie¬ 
niowania podczerwonego w dielektrykach i półprze¬ 
wodnikach. 


Podstawowe przybliżenia 


Kryształ można rozpatrywać jako układ złożony 
z dwóch rodzajów cząstek: jąder atomowych i elek¬ 
tronów. Między tymi cząstkami zachodzą oddziały¬ 
wania elektrostatyczne typu kulombowskiego. Wed¬ 
ług mechaniki kwantowej stan kryształu opisuje 
funkcja falowa, która jest rozwiązaniem równania 
Schrodingera dla układu omawianych cząstek. Funk¬ 
cja ta zależy zarówno od współrzędnych jąder ato¬ 
mowych, jak i współrzędnych elektronów (-* Struk¬ 
tura elektronowa ciał stałych). 

przybliżenie U podstaw teorii ciała stałego, a tym samym i teorii 
adiabatyczne dynamiki sieci krystalicznej, leży przybliżenie adia¬ 
batyczne, które pozwala rozpatrywać ruch jąder ato¬ 
mowych i ruch elektronów osobno. Inaczej mówiąc, 
stosując przybliżenie adiabatyczne, można opisać 
stan kryształu za pomocą iloczynu dwóch funkcji fa¬ 
lowych, z których jedna zależy tylko od współrzęd¬ 
nych jąder atomowych, druga — od współrzędnych 
elektronów. 

Przybliżenie adiabatyczne stanie się zrozumiałe, 
gdy zwrócimy uwagę na znaczną różnicę mas jąder 
i elektronów, a co za tym idzie — również różnicę 
prędkości ruchu tych cząstek. Jądra atomowe są 
znacznie cięższe od elektronów i w związku z tym po¬ 
ruszają się znacznie wolniej. Przy zmianie położenia 
jąder atomowych w krysztale prawie natychmiast 
ustala się rozkład przestrzenny elektronów, odpowia¬ 
dający nowym położeniom jąder. Z jednej strony moż¬ 
na więc rozpatrywać ruch elektronów w polu poten¬ 
cjalnym nieruchomych jąder (w ten sposób postępuje 
się m.in. przy badaniu struktury pasmowej kryszta¬ 
łów), z drugiej zaś strony przy rozpatrywaniu ruchu 
jąder atomowych ważne są nie chwilowe położenia 
elektronów, ale pole powstające na skutek ich śred¬ 
niego przestrzennego rozkładu. Pole to jest w pełni 
określone przez współrzędne jąder atomowych. 

W teorii kwantowej drgań sieci krystalicznej przy¬ 
bliżenie adiabatyczne pozwala rozpatrywać równanie 
Schrodingera zależne tylko od współrzędnych jądro¬ 
wych. Przy badaniu drgań sieci w ramach mechaniki 
klasycznej przybliżenie adiabatyczne umożliwia przed¬ 
stawienie oddziaływań międzyatomowych przy użyciu 

funkcji energii potencjalnej U(R\ która zależy tylko 
od współrzędnych jąder atomowych. 

Pomimo wyeliminowania współrzędnych elektro¬ 
nowych otrzymanie funkcji energii potencjalnej U(R) 
w konkretnej postaci nie jest rzeczą łatwą. Zakładamy 
jednak, że funkcję tę można rozwinąć w szereg potę¬ 
gowy względem odchyleń atomów od położeń rów¬ 
nowagi u = R—R 0 (gdzie R 0 oznacza położenie rów¬ 
nowagi) : 

U — Uo+Au+But+Cuti- ..., 

czyli 

u = £/ 0 +i/i+C4+tfs+ ... 0) 




Współczynniki A , B t C, ... zawierają odpowiednio 
pierwszą, drugą itd. pochodną energii potencjalnej 
obliczoną w położeniu równowagi. 

Pierwszy wyraz w rozwinięciu jest energią poten¬ 
cjalną układu nieruchomych atomów znajdujących 
się w położeniu równowagi. Wyraz ten nie odgrywa 
roli w zagadnieniach dynamiki sieci krystalicznej. 

Wyraz U x przedstawia liniową zależność energii 
potencjalnej od odchylenia atomów od położeń rów¬ 
nowagi. Jest on równy zeru, gdyż pierwsza pochodna 
w minimum funkcji jest równa zeru. Wyraz U 2 repre¬ 


zentuje zależność kwadratową energii potencjalnej 
od odchyleń atomów od ich położeń równowagi. 
Ograniczenie rozwinięcia funkcji energii potencjalnej 
do wyrazu U 2 stanowi istotę tzw. przybliżenia harmo¬ 
nicznego. Sens tego przybliżenia w wypadku dwóch 
atomów ilustruje rys. 1, który przedstawia rzeczywi¬ 
sty i przybliżony (paraboliczny) kształt funkcji energii 
potencjalnej. W krysztale energia potencjalna pocho¬ 
dzi od oddziaływań wielu atomów. Funkcja energii 
potencjalnej przedstawia złożoną powierzchnię w wie¬ 
lowymiarowej przestrzeni. 



Rys. 1. Zależność energii potencjalnej od odchylenia atomu od 
położenia równowagi R 0 . Linia niebieska odpowiada przybliżeniu 
harmonicznemu 


Funkcja U w przybliżeniu harmonicznym zadowa¬ 
lająco opisuje oddziaływania międzyatomowe wtedy, 
gdy odchylenia atomów od położeń równowagi są 
małe w porównaniu z odległościami między atomami. 
Z wyjątkiem niektórych kryształów warunek ten jest 
stosunkowo dobrze spełniony w niezbyt wysokich 
temperaturach. W wielu kryształach w temperaturze 
pokojowej odchylenia atomów nie przekraczają 
0,1 A, co stanowi tylko kilka procent odległości mię¬ 
dzyatomowych. 


Równania ruchu 

Wiele problemów dynamiki sieci krystalicznej można 
rozwiązać posługując się metodami mechaniki kla¬ 
sycznej. Punktem wyjścia są newtonowskie równania 

ruchu (ma = F), w których występują masy, przy¬ 
spieszenia i siły. Równania tego typu należy napisać 
dla każdego atomu w sieci krystalicznej. Jest oczy¬ 
wiste, że ze względu na dużą liczbę atomów w krysz¬ 
tale musimy wprowadzić odpowiednie oznaczenia, 
które pozwolą te atomy rozróżniać. Najodpowied¬ 
niejszym sposobem określenia atomu jest podanie 
numeru komórki elementarnej, w której on się znaj¬ 
duje, oraz numeru atomu w komórce elementarnej. 
Po tych wyjaśnieniach wprowadzimy następujące 
oznaczenia niezbędne do dalszych rozważań: m* — 

masa atomu j, R 0 (ls) — położenie równowagi atomu 

s znajdującego się w komórce elementarnej /, u{lś) — 
jego odchylenie od położenia równowagi, t — czas, 
a, p — zbiór trzech współrzędnych kartezjańskich 
x , y, z. Klasyczne równania ruchu w przybliżeniu 
harmonicznym mają postać: 

nu d2 “*'! S) = ^ B„ (ts, l's ') . (2) 

l's' 

aP 

Lewa strona równania jest iloczynem masy i przy¬ 
spieszenia atomu (fe), prawa — przedstawia siłę 
działającą na ten atom pochodzącą od wszystkich 
pozostałych atomów (/V). Siła ta zależy liniowo od 


przybliżenia 

harmoniczne 


klasyczne 

równania 

ruchu 
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stałe odchyleń poszczególnych atomów od położeń równo- 
siłowe wagi. Współczynniki Vs 0 noszą nazwę stałych 

siłowych. Wyrażają się one przez drugą pochodną 
energii potencjalnej względem odchyleń atomów od 
położeń równowagi, obliczoną w położeniu równo¬ 
wagi. W doskonałym krysztale symetria translacyjna 
powoduje, że stałe siłowe zależą tylko od różnicy 
wskaźników / i /', a nie zależą od ich wartości wzię¬ 
tych osobno. 

Liczba równań w układzie (2) wynosi 3rN , gdzie N 
oznacza liczbę komórek elementarnych, r — liczbę 
atomów w jednej komórce. Wartość ta pokrywa się 
z liczbą stopni swobody wszystkich atomów w krysz¬ 
tale. Opisanie drgań sieci w makroskopowej próbce 
krystalicznej objętości 1 cm 3 wymaga olbrzymiej licz¬ 
by równań ruchu, rzędu 10 23 . 

Warto zauważyć, że prawa strona każdego równa¬ 
nia w układzie (2) składa się z dużej liczby wyrazów 
opisujących oddziaływania międzyatomowe. Zwykle 
oddziaływania te silnie maleją ze wzrostem odleg¬ 
łości między atomami. Można to wykorzystać do 
znacznego zmniejszenia liczby rozpatrywanych wy¬ 
razów. 

Istotna trudność, jaką przedstawia zapisany układ 
równań, wynika z faktu, że każde równanie zawiera 
odchylenia wszystkich atomów. Inaczej mówiąc, rów¬ 
nania w układzie (2) są wzajemnie powiązane. Z fi¬ 
zycznego punktu widzenia oznacza to, że odchyleniu 
dowolnego atomu w krysztale od położenia równo¬ 
wagi towarzyszy odchylenie innych atomów. Ruch 
atomów w krysztale ma zatem charakter kolektyw¬ 
ny. 

współrzędne W teorii drgań sieci krystalicznej wykazuje się, że 
normalne 2 ^^ u (j s ) m ożna wprowadzić nowe zmienne Q{, 
które usuwają niedogodną własność układu (2), po¬ 
legającą na wzajemnym powiązaniu równań. Nowy 
układ równań składa się z 3 rN niezależnych równań 
postaci: 

WiQi — 0 («=1,2,..., 3rN). (3) 


Równania tego typu są dobrze znane. Opisują one 
ruch niezależnych oscylatorów harmonicznych. Roz¬ 
wiązania ich zawierają harmoniczną zależność od 
czasu: 

Qi = e°e-^; (4) 

co i —częstość własna oscylatora. W każdym równa¬ 
niu w układzie (3) występuje teraz tylko jedna zmien¬ 
na Qi t którą nazywamy współrzędną normalną. 

Można wykazać, że w doskonałym krysztale, po¬ 
siadającym symetrię translacyjną, każdy oscylator 
wysyła falę płaską postaci: 

wfo) = (5) 

Fala ta jest scharakteryzowana przez wektor falowy 
<7, częstość kołową coj(q) i wektor polaryzacji e,(qj). 

Wektor falowy ą określa kierunek rozchodzenia się 
fali, a jego wartość liczbowa jest równa 2njX (X — 

długość fali). Wektor polaryzacji e 9 (qj) wskazuje 
kierunek drgań atomów i zależy od rodzaju atomu 

(wskaźnik s ). Wskaźniki q i y, występujące przy czę¬ 
stościach i wektorach polaryzacji, klasyfikują roz¬ 
wiązania równań ruchu. Do zagadnienia tego jeszcze 
wrócimy. 

Gdy fale rozchodzą się w kierunkach wysokiej sy¬ 
metrii w krysztale (np. w kierunku [111] w kryszta¬ 
łach o strukturze regularnej), orientacja wektora po¬ 
laryzacji w stosunku do wektora falowego jest łatwa 
do określenia. Drgania można wówczas klasyfikować 

jako ściśle podłużne (gdy e\\ q) lub ściśle poprzeczne 

(gdy e±q). Gdy fale rozchodzą się w innych kierun¬ 
kach, zazwyczaj wektor polaryzacji tworzy z wekto¬ 


rem falowym pewien kąt różny od kąta zerowego lub 
prostego. 

W ramach przybliżenia harmonicznego odchylenia 

atomów u(/s) od położenia równowagi można przed¬ 
stawić w postaci superpozycji 3 rN fal płaskich: 

Sr N 3r jV 

»(Is) = X£W) = (6) 

i Q 3 q 

W równaniu (6) rolę współrzędnych normalnych 
Qj(q) odgrywa wyrażenie: 

= Qfy). (7) 

W tym wypadku współrzędne normalne interpretu¬ 
jemy jako wielkości określające amplitudy fal pła¬ 
skich. Ruch opisany przez współrzędne normalne 
nosi nazwę drgań normalnych. W doskonałej sieci drgania 
krystalicznej drgania normalne mają postać fal pła- normalne 
skich. W każdym drganiu normalnym biorą udział 
wszystkie atomy, które drgają z tą samą częstością. 

Między drganiami poszczególnych atomów istnieje 
stała różnica faz. Ogólna liczba drgań normalnych 
jest równa liczbie stopni swobody dla atomów w kry¬ 
sztale (3rN). 

Aby opis drgań sieci krystalicznej w języku drgań 
normalnych był pełny, pozostaje jeszcze wyznaczyć 

częstość <oj(q) i wektory polaryzacji e 3 (qj). Można 
to osiągnąć przez rozwiązanie układu równań ruchu 
(2). Zgodnie z przedstawionymi wyżej rozważaniami 
zakłada się, że rozwiązania mają postać fali płaskiej. 

Reasumując, współrzędne normalne pozwalają 
sprowadzić zagadnienie ruchu wzajemnie oddziały¬ 
wających atomów do zagadnienia ruchu niezależnych 
oscylatorów harmonicznych. Oscylator harmoniczny 
jest jednym z niewielu układów, dla którego znane są 
ścisłe rozwiązania, zarówno w ramach mechaniki 
klasycznej, jak i kwantowej. Nie można jednak za¬ 
pominać, że wprowadzenie formalizmu oscylatora 
i drgań normalnych jest związane z kwadratową za¬ 
leżnością energii potencjalnej od odchyleń atomów 
od położeń równowagi, która stanowi wynik przybli¬ 
żenia harmonicznego. 

Relacje dyspersji 

Zależność coj{q) charakteryzuje podstawowe wła¬ 
sności dynamiczne sieci krystalicznej i jest przedmio¬ 
tem wielu badań, zarówno teoretycznych, jak i do¬ 
świadczalnych. Funkcja a>(q) nosi nazwę relacji dy¬ 
spersji lub prawa dyspersji. 

Ogólnie relacje dyspersji przedstawiają zależność 
częstości drgań sieci od trzech zmiennych, którymi 





Rys. 2. Powierzchnia stałej częstości w przestrzeni wektora falo¬ 
wego q 
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są składowe wektora falowego q. W trójwymiarowej 
przestrzeni mogą one być przedstawione graficznie 
jako powierzchnie stałej częstości (rys. 2). Analiza 
własności tych powierzchni umożliwia otrzymanie 
ważnych informacji o strukturze widma częstości 
drgań. W praktyce jednak ograniczamy się zwykle do 
rozpatrywania relacji dyspersji tylko dla niektórych, 
wybranych kierunków w przestrzeni wektora falo¬ 
wego q (a tym samym w krysztale). Z reguły są to kie¬ 
runki odznaczające się wysoką symetrią, jak np. kie¬ 
runki [111], [110] i [100] w kryształach o strukturze 
regularnej. Obrazem graficznym relacji dyspersji są 
wówczas krzywe płaskie, które nazywamy krzywymi 
dyspersji. 

Jest zrozumiałe, że kształt krzywych dyspersji wi¬ 
nien zależeć od natury kryształu, a w szczególności 
od charakteru oddziaływań międzyatomowych w 
krysztale. Interesują nas jednak przede wszystkim te 
własności relacji dyspersji, które są wspólne dla 
wszystkich kryształów, niezależnie od typu oddziały¬ 
wań międzyatomowych. Do takich ogólnych wła¬ 
sności relacji dyspersji należy okresowość i parzy¬ 
stość. Własności te oznaczają, że spełnione są nastę¬ 
pujące zależności: 

o s (q) = a>j(q+G) (8) 

cofa) = <oj(-q); (9) 

(7jest wektorem sieci odwrotnej. Okresowość funkcji 

jest następstwem istnienia symetrii translacyj- 
nej w krysztale, która powoduje, że wszystkie nierów- 
noważne fizycznie drgania normalne odpowiadają 

wartościom q położonym w pewnym ograniczonym 
obszarze. Podobnie jak w zagadnieniach struktury 
elektronowej kryształów, obszar ten wygodnie jest 
wybrać w postaci tzw. strefy Brillouina. W trójwy¬ 
miarowej przestrzeni q strefa Brillouina jest zamknię¬ 
tym wielościancm, którego kształt odzwierciedla sy¬ 
metrię kryształu. 

Następną charakterystyczną cechą relacji dyspersji 
jest wieloznaczność. Oznacza to, że każdej wartości 

wektora falowego ą odpowiada więcej niż jedna war¬ 
tość częstości o). W związku z tym krzywe dyspersji 
składają się z gałęzi, które rozróżniamy przy pomocy 
wskaźnika j. 

Ogólna liczba gałęzi drgań w trójwymiarowym 
krysztale jest równa 3r, gdzie r jest liczbą atomów 
w komórce elementarnej. Analiza ruchu drgającego 
prowadzi do klasyfikacji tych gałęzi na akustyczne 
i optyczne. Liczba gałęzi akustycznych jest równa 3, 
a liczba gałęzi optycznych 3r—3. Tak np. w krysztale 
trójwymiarowym, którego komórka elementarna za¬ 
wiera jeden atom, występują tylko trzy gałęzie aku¬ 
styczne (nie ma gałęzi optycznych). W krysztale trój¬ 
wymiarowym z dwoma atomami w komórce elemen¬ 
tarnej jest ogółem sześć gałęzi, z których trzy są ga¬ 
łęziami akustycznymi i trzy — gałęziami optycznymi. 
Własności symetrii kryształu mogą powodować 
zwyrodnienie niektórych z tych gałęzi, co redukuje 
ich liczbę. 

Pozostaje teraz sprecyzować, czym różnią się mię¬ 
dzy sobą gałęzie akustyczne i optyczne. Różnica ta 
najwyraźniej występuje w środku strefy Brillouina, 
dlatego omówimy własności drgań długofalowych 

(7 » 0 ). 

Drgania akustyczne odpowiadają sytuacji, gdy 
wszystkie atomy w komórce elementarnej poruszają 

się w zgodnej fazie. Gdy q = 0, częstość drgań aku¬ 
stycznych jest równa zeru, a przy małych wartościach 

q zmienia się liniowo ze wzrostem q. W pobliżu środka 
strefy Brillouina drgania akustyczne nie różnią się 
od drgań towarzyszących rozchodzeniu się fali aku¬ 
stycznej w krysztale. Fakt ten znajduje odbicie w naz¬ 
wie, która została przyjęta dla omawianych drgań. 


W przypadku drgań optycznych sąsiednie atomy 
w komórce elementarnej poruszają się w fazach prze¬ 
ciwnych, przy tym środek masy komórki elementar¬ 
nej pozostaje w spoczynku. Oznacza to, że amplituda 
drgań atomów jest odwrotnie proporcjonalna do ich 

masy. Gdy ą — 0, częstości drgań optycznych dążą 
zawsze do skończonej wartości, różnej od zera. W kry¬ 
ształach jonowych drgania optyczne wytwarzają oscy¬ 
lujący moment elektryczny. Ponieważ z tym momen¬ 
tem związane są silne oddziaływania optyczne (po¬ 
chłanianie), drgania tego typu otrzymały nazwę drgań 
optycznych. 

Relacje dyspersji w postaci nie skomplikowanego 
wyrażenia matematycznego można otrzymać tylko 
dla kryształów jednowymiarowych. Wykresy typo¬ 
wych zależności dla tych kryształów są przedstawione 
na rys. 3a i 4a. Zgodnie z poprzednio omawianą wła- 



. wektor falowy a 

a) b) 


Rys. 3. Krzywe dyspersji (a) i pasmo dozwolonych częstości 
drgań (b) sieci liniowej z jednym atomem w komórce elemen¬ 
tarnej 



2 a 2 a 

wektor falowy q 



a) b) 

Rys. 4. Krzywe dyspersji (a) i pasma dozwolonych częstości 
drgań (b) sieci liniowej z dwoma atomami w komórce elemen¬ 
tarnej 


snością okresowości funkcji coj(q) zakres zmienności 

wektora falowego q jest ograniczony do przedziału 
(-7t/n, -fjc/n) lub(— k/2zj, -fn/2«r), który w tym wy¬ 
padku określa strefę Brillouina (a — odległość między 
atomami). W krysztale mającym 1 atom w komórce 
elementarnej występuje tylko gałąź akustyczna, a w 
krysztale z dwoma atomami w komórce elementar¬ 
nej— gałąź akustyczna i optyczna. Liczba gałęzi 
drgań jest mniejsza niż w krysztale trójwymiarowym; 
jest to związane z mniejszą liczbą stopni swobody 
przypadających na jeden atom. 

Warto zauważyć, że częstości drgań normalnych 
sieci przybierają tylko wartości leżące w ograniczo¬ 
nym przedziale, zawartym między 0 i pewną maksy¬ 
malną częstością co m . W najprostszym wypadku cały 
obszar dozwolonych częstości tworzy jedno pasmo 
(rys. 3b). W kryształach zawierających dwa atomy 
w komórce elementarnej mogą występować dwa pa¬ 
sma rozdzielone przerwą, z których jedno odpowiada 
drganiom akustycznym, drugie — optycznym (rys. 
4b). Struktura pasmowa i istnienie maksymalnej czę¬ 
stości drgań jest cechą ogólną, niezależną od wymia- 
rowości kryształu. Maksymalna częstość drgań 
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optycznych w kryształach rzeczywistych jest zwykle 
rzędu 10 13 s" 1 . 

Analizę charakteru drgań można stosunkowo łatwo 
przeprowadzić dla kryształów jednowymiarowych. 
Wyniki dotyczące drgań poprzecznych w krysztale 
zawierającym dwa atomy w komórce elementarnej 
są przedstawione na rys. 5. Wzięto pod uwagę dwie 
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Rys. 5. Ruch falowy w sieci liniowej zawierającej dwa atomy 
w komórce elementarnej: a) drganie poprzeczne akustyczne 

w środku strefy Brillouina (4 = 0); b) drganie poprzeczne optycz¬ 
ne w środku strefy Brillouina {q = 0); c) drganie poprzeczne 
akustyczne wewnątrz strefy Brillouina; d) drganie poprzeczne 
optyczne wewnątrz strefy Brillouina 


wartości wektora falowego q ; jedna odpowiada środ- 


krzywe 
dyspersji — 
kryształy 
trójwymiaro¬ 
we 


kowi strefy Brillouina (q = 0), druga znajduje się we¬ 
wnątrz strefy, w pewnej odległości od jej środka. 

Otrzymanie krzywych dyspersji dla rzeczywistych 
trójwymiarowych kryształów (rys. 6) wymaga skom¬ 
plikowanych obliczeń, do których są niezbędne ma¬ 
szyny matematyczne. Przy obliczeniach zakłada się 
odpowiedni model oddziaływań międzyatomowych. 
Stosunkowo prosta sytuacja jest wtedy, gdy oddzia¬ 
ływania międzyatomowe maleją szybko ze wzrostem 


uzyskać krzywe dyspersji zgodne z wynikami pomia¬ 
rów. W zależności od natury badanych kryształów 
stosuje się różne modele oddziaływań międzyatomo¬ 
wych. 

Podstawową metodą eksperymentalną, dzięki której metody eks- 
można otrzymać krzywe dyspersji, jest badanie nie- perymentalne 
sprężystego rozproszenia neutronów powolnych. Po¬ 
równanie obliczonych krzywych dyspersji z wynikami 
pomiarów traktuje się jako metodę kontroli popraw¬ 
ności przyjętego modelu oddziaływań międzyato¬ 
mowych. Zagadnienie niesprężystego rozpraszania 
neutronów powolnych na drganiach sieci omówimy 
w dalszej części tego artykułu, w rozdziale „Doświad¬ 
czalne metody badania drgań sieci”. 

Warto jeszcze zwrócić uwagę na różnice, jakie 
istnieją między falą sprężystą w sieci krystalicznej 
i falą sprężystą w ośrodku ciągłym, nie mającym dy¬ 
skretnej struktury atomowej. Jak to powyżej przed¬ 
stawiliśmy, drgania sieci krystalicznej mają ograni¬ 
czony zakres zmienności częstości i wektora falo¬ 
wego, a zależność między tymi wielkościami wyka¬ 
zuje dyspersję. W wypadku fali sprężystej rozcho¬ 
dzącej się w ośrodku ciągłym częstość i wektor falo¬ 
wy mogą w zasadzie przybierać dowolne wartości, 

a zależność co(q) jest liniowa. 


Widmo wartości wektora falowego 

W dotychczasowych rozważaniach wychodziliśmy wpływ po- 
z założenia, że kryształ jest nieskończony. W rzeczy- wierzchni 
wistości wszystkie kryształy są ograniczone powierzch¬ 
niami i tym samym mają skończone rozmiary. Jest 
oczywiste, że atomy znajdujące się na powierzchni 
lub w jej pobliżu drgają inaczej niż atomy znajdujące 
się wewnątrz kryształu, daleko od powierzchni (inne 
stałe siłowe). Drgania powierzchniowe stanowią przed¬ 
miot specjalnych badań (-* Stany powierzchniowe 
w ciałach stałych). 

W tej chwili interesuje nas jednak, jak obecność 
powierzchni wpływa na drgania sieci krystalicznej 
wewnątrz kryształu. Można przypuszczać, że jeśli 
oddziaływania międzyatomowe szybko maleją ze 
wzrostem odległości, to atomy położone daleko od 
powierzchni „nie czują” jej obecności. Dlatego w rze¬ 
czywistych kryształach warunki brzegowe, jakimi 
się posługujemy przy rozwiązywaniu równań ruchu, 
nie mają wielkiego znaczenia. W tej sytuacji możemy 
je tak sformułować, aby maksymalnie ułatwić roz¬ 
wiązanie równań ruchu. Najwygodniejszą postać pod 
tym względem mają warunki cykliczności Borna- warunki Bor- 
Karmana. Zgodnie z nimi odchylenia atomów od po- na-Kśrmśna 



wektor falowy q 


Rys. 6 . Krzywe dyspcrsj'i drgań sieci kry¬ 
stalicznej krzemu dla trzech kierunków 
krystalograficznych. Linie ciągle przed¬ 
stawiają wyniki obliczeń, a punkty — 
wyniki pomiarów metodą dyfrakcji neu¬ 
tronów powolnych. Pionowa linia prze¬ 
rywana na środkowym rysunku określa 
granicę strefy Brillouina. Litery L i T 
oznaczają odpowiednio gałąź drgań pod¬ 
łużnych i poprzecznych. W rozpatrywa¬ 
nych kierunkach krystalograficznych ga¬ 
łęzie poprzeczne są zwyrodniałe 


odległości. Pozwala to rozpatrywać tylko niewielką 
liczbę stałych siłowych, które można wyrazić przez 
współczynniki sprężystości lub inne dane doświad¬ 
czalne. W wielu kryształach jednak odgrywają istotną 
rolę oddziaływania dalekiego zasięgu, które muszą 
być uwzględnione przy obliczeniach, jeżeli chcemy 


łożenia równowagi muszą się powtarzać z okresem 
równym L : 

u{ls) -«(/+£, s). (10) 

W odniesieniu do kryształu mającego postać sześcianu 
o krawędzi L oznacza to, że odchylenia atomów po- 
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łożonych w punktach symetrycznych na powierzch¬ 
niach sześcianu są identyczne (jednakowe amplitudy 
i fazy). Warunki cykliczności Borna-Karmana po¬ 
zwalają przedstawić ruch atomów w skończonym 
krysztale w postaci fal płaskich bieżących, podobnie 
jak w krysztale nieograniczonym. 

Można łatwo wykazać, że z warunków cykliczności 
wynika dyskretny zbiór wartości, które może przy¬ 
bierać wektor falowy ą wewnątrz strefy Brillouina. 
Wartości te są rozmieszczone w sposób jednorodny: 
w każdym z trzech kierunków są one oddalone od 
siebie o wartość równą 2 n/L (rys. 7). 



Mechanika kwantowa przewiduje, że oscylator har¬ 
moniczny może przybierać tylko dyskretne wartości 
energii, określone wzorem: 

En(qj) = [n(qj)+\\ho>}(q) y (11) 

gdzie n(qj) = 0,1, 2 ..., h — stała Plancka podzielona 
przez 2 tc. Schemat dozwolonych poziomów energe¬ 
tycznych wynikających z tego wzoru jest przedsta¬ 
wiony na rys. 8. 

Każdemu dozwolonemu poziomowi energetyczne¬ 
mu odpowiada pewna liczba kwantowa n(qj\ która 

poziomy 
oscylatora 
harmonicz¬ 
nego 


(n + \)ha)j (?) 



Rys. 7. Rozmieszczenie dozwolonych stanów w przestrzeni ą 
wynikające z cyklicznych warunków brzegowych: a) sieć liniowa, 
b) sieć trójwymiarowa (pokazano tylko stany położone na płasz¬ 
czyźnie qxqy ) 


Całkowita liczba dyskretnych wartości q w strefie 
Brillouina jest równa liczbie komórek elementarnych 
N w krysztale. W makroskopowych kryształach gę¬ 
stość dyskretnych wartości q jest tak duża, że można 

traktować q jako zmienną ciągłą. Pozwala to przy 
obliczeniach zastępować sumowanie po dyskretnych 

wartościach q bardziej wygodnym całkowaniem po 

zmiennej q. Przykładem traktowania q jako zmiennej 
ciągłej są omawiane przed chwilą krzywe dyspersji 
(rys. 6). 


Kwantowanie drgań sieci 

Przedstawiony dotychczas obraz drgań sieci krysta¬ 
licznej otrzymano przy zastosowaniu praw mecha¬ 
niki klasycznej. Może powstać pytanie, czy wyniki 
te nie są przybliżone, a w związku z tym, czy nie 
ulegną zmianie, gdy zastosujemy metody mechaniki 
kwantowej. Okazuje się, że nie. Oscylator harmo¬ 
niczny stanowi taki układ mechaniczny, którego czę¬ 
stość własna co jest zawsze taka sama — niezależnie 
od tego, czy otrzymano ją metodami mechaniki kla¬ 
sycznej, czy kwantowej. Własność ta rozciąga się na 
drgania sieci krystalicznej, które są równoważne 
zbiorowi niezależnych oscylatorów harmonicznych. 

W tej sytuacji zwykle najpierw rozwiązujemy kla¬ 
syczne równania ruchu i otrzymujemy częstości drgań 
(oraz krzywe dyspersji i widmo częstości), a następ¬ 
nie stosujemy procedurę kwantowania oscylatora har¬ 
monicznego. 


| T)0)j(q) 

f ho>j{q) 
\ b<0j (?) 


2 

1 

0 


Rys. S. Diagram poziomów energetycznych oscylatora harmo¬ 
nicznego 


może przybierać tylko wartości całkowite nieujem- 
ne. Odległość między sąsiednimi poziomami energii 

jest równa hcoj(q). Wielkość ta jest najmniejszą porcją 
(kwantem) energii, która może być pobrana lub od¬ 
dana przy zmianie stanu energetycznego oscylatora. 

Kwant energii drgań sieci krystalicznej nosi nazwę fonon 
fononu. Oscylatorowi związanemu z drganiami sieci 
krystalicznej znajdującemu się w stanie kwantowym 

n(qj) odpowiada n(gj) fononów, z których każdy 
ma tę samą wartość energii, równą hcoj{q). Liczby 
kwantowa n{qj) często nazywamy liczbami obsadze¬ 
nia. 

Według mechaniki klasycznej każdy oscylator może 
mieć dowolną wartość energii, która jest proporcjo¬ 
nalna do kwadratu amplitudy drgań. W temperatu¬ 
rze zera bezwzględnego amplituda i energia drgań 
są równe zeru. Natomiast w opisie mechaniki kwan¬ 
towej w temperaturze zera bezwzględnego pozostają drgania 

tzw. drgania zerowe o energii l / 2 ficoj(q), które odpo- Ł 
wiadają stanowi podstawowemu oscylatora okre¬ 
ślonemu liczbą kwantową n(qj ) — 0. Występowanie 
drgań zerowych można wyjaśnić na gruncie zasady 
nieokreśloności Heisenberga. Zgodnie z tą zasadą 
atomy nie mogą być nieruchome, gdyż oznaczało¬ 
by to, że ich położenie jest dokładnie określone, 
a pęd i energia może mieć nieskończenie dużą war¬ 
tość. 

Fonony podlegają kwantowej statystyce Bosego- 
Einsteina. W odróżnieniu od statystyki Fermiego- 
Diraca, która ogranicza liczbę elektronów w tym sa¬ 
mym stanie kwantowym do dwóch (o przeciwnie skie¬ 
rowanych spinach), statystyka Bosego-Einsteina nie 

zabrania, aby w tym samym stanie kwantowym qj 
znajdowała się dowolna liczba fononów. Zgodnie 
z mechaniką statystyczną średnia wartość liczby ob¬ 
sadzenia </*(<?;)> dla oscylatora sieciowego qj w wa¬ 
runkach równowagi termodynamicznej dana jest 
przez następujące wyrażenie: 


<rc(<7/» = 


1 

e ka»(q)IkT _ j 


( 12 ) 
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gdzie k — stała Boltzmanna, T —temperatura bez¬ 
względna. 

Ze wzoru (12) widać, że średnia liczba obsadzenia 
(równoważna średniej liczbie fononów) zależy od 
temperatury. Kształt tej zależności przedstawia rys. 9. 
Można zauważyć, że w dostatecznie wysokich tem¬ 



peraturach (kcaĄq)<śkT) zależność między średnią 
liczbą fononów i temperaturą ma liniowy charakter. 

Należy podkreślić, że wszystkie dotychczasowe 
rozważania odnoszą się do fononów wzbudzonych 
termicznie. Można jednak generować fonony za po¬ 
mocą promieniowania elektromagnetycznego po¬ 
chłanianego w krysztale lub inaczej. Częstości i wek¬ 
tory falowe wytwarzanych wówczas fononów przy¬ 
bierają tylko niektóre spośród możliwych wartości. 
Nie stosuje się do nich prawo rozkładu statystycz¬ 
nego (12). Liczba generowanych fononów jest funkcją 
natężenia padającego na kryształ promieniowania 
i nie zależy od temperatury kryształu. W odróżnieniu 
od drgań sieci wzbudzonych termicznie, które są nie¬ 
spójne, promieniowanie elektromagnetyczne (po¬ 
chodzące z lasera) może wytwarzać drgania normalne 
posiadające własność spójności. 

Przy opisie różnych procesów, w których odgry¬ 
wają rolę drgania sieci, posługujemy się często mode¬ 
lem gazu fononowego. Model ten można wprowadzić 
opierając się na zasadzie dualizmu korpuskulamo- 
-falowego, stanowiącej jedno z podstawowych zało¬ 
żeń mechaniki kwantowej. W myśl tej zasady każ¬ 
demu drganiu normalnemu o częstości coj i wektorze 

falowym g można przypisać określoną liczbę nieroz- 
różniałnych kwazicząstek (fononów) o energii 

kcoj(q) i kwazipędzie hq. W ten sposób zbiór drgań 
normalnych jest zastąpiony przez zbiór kwaziczą¬ 
stek. W ramach przybliżenia harmonicznego kwazi¬ 
cząstki stanowią gaz idealny, w którym nie występują 
wzajemne oddziaływania. 

Oddziaływanie drgań sieci z innymi kwazicząstka¬ 
mi (np. elektronem w krysztale) można traktować 
jako zderzenie, dla którego obowiązuje zasada zacho¬ 
wania energii i pędu. W oddziaływaniach tych fo¬ 
nony mogą powstawać i znikać. Oddziaływanie 
drgań sieci między sobą odpowiada w tym obrazie 
zderzeniu fononów. Dla pojawienia się tego oddzia¬ 
ływania konieczne jest jednak wyjście poza ramy 
przybliżenia harmonicznego. 

Można się oczywiście domyślać, że analogia mię¬ 
dzy kwazicząstkami i zwykłymi cząstkami, takimi jak 
elektrony, protony, neutrony, jest tylko częściowa. 
Wskazuje już na to posługiwanie się terminami kwa¬ 
zicząstka i kwazipęd. 

W odróżnieniu od zwykłych cząstek kwazicząstki 
nie mogą istnieć w próżni. Do ich powstania i istnie¬ 
nia niezbędny jest pewien ośrodek. Dla fononów ta¬ 
kim ośrodkiem jest kryształ. Fonon jako kwaziczą¬ 
stka nie może być „wyjęty” z kryształu. 

Następna istotna różnica wiąże się z pojęciem pędu. 
Jak wiadomo, każda rzeczywista cząstka ma okre¬ 
ślony pęd, a w oddziaływaniach rzeczywistych cząstek 
obowiązuje zasada zachowania pędu. Fononowi nie 


można przypisać pędu fizycznego, ale w oddziaływa¬ 
niach zachowuje się on tak, jakby rolę pędu odgry¬ 
wała wielkość kg. Niekiedy rola ta jest w pewnym 
stopniu ograniczona, gdyż zasada zachowania pędu 
dla oddziaływań z fononami zawiera wyrazy postaci 

kg+kG (G — wektor sieci odwrotnej). W związku 
z tym mówimy czasem, że kg określa pęd fononu 
z dokładnością do wielkości kG. Sens fizyczny wyrazu 

kG można wyjaśnić przyjmując możliwość przeka¬ 
zania pędu do całej sieci krystalicznej. Przedstawione 

wyżej uwagi o znaczeniu wielkości kg w dynamice 
sieci krystalicznej uzasadniają posługiwanie się ter¬ 
minem kwazipęd fononu. 

Warto jeszcze zwrócić uwagę na niektóre dalsze 
różnice między cząstkami i kwazicząstkami. Przeja¬ 
wiają się one w formie zależności energii od pędu. 
Jak wiadomo, dla zwykłych cząstek zależność ta ma 
charakter uniwersalny: dla fotonu jest ona liniowa, 
a dla cząstek nierelatywistycznych — kwadratowa. 
Jeśli chodzi o fonony, to nie mają one takiej uniwer¬ 
salnej zależności energii od pędu. W każdym krysztale 
jest ona inna i zależy od natury oddziaływań między- 
atomowych. Warto dodać, że zależność energii od 
kwazipędu dla fononów jest analogiczna do rozpatry¬ 
wanej przez nas wcześniej zależności częstości drgań 
normalnych od wektora falowego, reprezentowanej 
przez krzywe dyspersji. 

Mimo pewnych różnic występujących między rze¬ 
czywistymi cząstkami i kwazicząstkami (w szczegól¬ 
ności fononami) posługiwanie się pojęciem kwazi¬ 
cząstki jest bardzo wygodne przy opisie różnych od¬ 
działywań zachodzących w krysztale. Jako przykład 
można wymienić oddziaływanie między drganiami 
sieci, oddziaływanie drgań sieci z elektronami w krysz¬ 
tale oraz z polem elektromagnetycznym (z fotonami). 


Widmo częstości drgań 

Przy analizie niektórych własności kryształów zwią¬ 
zanych z drganiami sieci wygodnie jest wprowadzić 
pojęcie rozkładu częstości drgań lub widma częstości 
drgań sieci. Widmo częstości drgań można przed¬ 
stawić w postaci pewnej funkcji, którą oznaczymy 
przez g(a>). Funkcja ta jest zdefiniowana w ten spo¬ 
sób, że wyrażenie g(<o) ch określa liczbę drgań nor¬ 
malnych przypadających na przedział częstości (w, 
co+do). Funkcja g(<o) zwykle spełnia warunek nor¬ 
malizacji, wynikający z żądania, .aby liczba wszy¬ 
stkich drgań normalnych równała się liczbie oscyla¬ 
cyjnych stopni swobody w krysztale. 

Stosunkowo łatwo można obliczyć g(co) dla sieci 
jednowymiarowych. Schematyczny kształt tej funkcji 
jest przedstawiony na rys. 10. Widzimy, że dla dwu- 
atomowej sieci jednowymiarowej widmo częstości 
drgań składa się z dwóch części, z których jedna od¬ 
powiada drganiom akustycznym, druga — drga- 



częsłośc co częstość co 


a) b) 

Rys. 10 Widmo drgań sieci liniowej, a) l jednym atomem w ko¬ 
mórce elementarnej, b) z dwoma atomami w komórce 
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niom optycznym. Można również zauważyć, że przy 
pewnych wartościach <o funkcja ta dąży do nieskoń¬ 
czoności, ale nie powinno to dziwić, gdyż rozpatry¬ 
wany model jest nierealny. 

$r(o>) w W rzeczywistych trójwymiarowych kryształach 
kryształach obliczenia widma częstości drgań wykonuje się wy- 
rzeczywi- łącznie metodami numerycznymi za pomocą elektro- 
stych nowych maszyn matematycznych. W tym celu roz¬ 
wiązuje się równania ruchu dla dostatecznie gęsto 

rozmieszczonych wartości wektora falowego q w 
strefie Brillouina i następnie zlicza się drgania z czę¬ 
stościami zawartymi w przedziałach (co, <o+doS). 

Widmo częstości drgań ma zazwyczaj złożoną struk¬ 
turę, która zależy od rodzaju kryształu. Rys. 11 
przedstawia wyniki obliczeń dla krzemu. W wypadku 



Rys. 11. Widmo częstości drgań sieci krzemu (obliczone) 


kryształów trójwymiarowych funkcja ^(co) nie ma 
nieciągłości typu nieskończoności, jak to miało miej¬ 
sce dla sieci liniowych. Przy dokładnych obliczeniach 
otrzymuje się jednak na krzywych g(co) charaktery¬ 
styczne ostre załamania. 

Teoria drgań sieci pozwala ustalić interesujące 
związki między funkcją g(co) i relagami dyspersji 

cofa). Można mianowicie wykazać, że osobliwości 
punkty funkcji g(oy) odpowiadają określonym punktom w 
krytyczne strefie Brillouina. Noszą one nazwę punktów kry¬ 
tycznych. Położenie punktów krytycznych wyznacza 
się z warunków określających miejsca w strefie Bril¬ 
louina, w których otoczeniu powierzchnie stałej czę¬ 
stości mają kształt trójwymiarowego maksimum, mi¬ 
nimum lub siodła. Po odpowiednich obliczeniach 
otrzymujemy kształt funkcji g(w) w otoczeniu punk¬ 
tów krytycznych związanych z różnymi kształtami 
powierzchni stałej częstości. 

Z rozważań teoretycznych wynika, że liczba róż¬ 
nego typu punktów krytycznych i odpowiadających 



Rys. 12. Pierwsza strefa Brillouina dla kryształów o strukturze 
regularnej płasko centrowanej; r, X, L, W — punkty krytyczne 


im osobliwości funkcji g(cu>) jest określona wyłącznie osobliwości 
przez symetrię kryształu, a nie zależy od charakteru funkcji g(<a) 
oddziaływań międzyatomowych. Punkty krytyczne 
tego rodzaju występują zwykle w strefie Brillouina 
w miejscach odznaczających się wysoką symetrią. Na 
rys. 12 wskazane są położenia punktów krytycznych 
w strefie Brillouina dla kryształów o strukturze st ii 
kamiennej, blendy cynkowej i diamentu. Są one ozna¬ 
czone symbolami r, X, L i W. Rysunek 13 przedsta- 


k 

sM 



krytycznych różnego rodzaju 


wia schematycznie kształt funkcji g(co) w sąsiedztwie 
różnych punktów krytycznych. Krzywa 1 i 4 odpo¬ 
wiada sytuacji, gdy na powierzchni stałej częstości 
występuje odpowiednio minimum i maksimum; krzy¬ 
wa 2 i 3 — gdy powierzchnia ta ma kształt siodła. 

Opierając się na wynikach teorii punktów krytycz¬ 
nych, można przyjąć, że widmo częstości drgań każ¬ 
dego kryształu składa się z szeregu przyczynków po¬ 
chodzących od punktów krytycznych różnego rodzaju. 
Po tych uwagach staje się jasne pochodzenie charak¬ 
terystycznych załamań widocznych na krzywej g(a>) 
przedstawionej na rys. 11. 

Określenie własności termodynamicznych kryszta¬ 
łów (m.in. ciepła właściwego) nie wymaga tak dokład¬ 
nej znajomości kształtu widma częstości drgań. 
Stosunkowo dobre wyniki otrzymujemy posługując 
się bardzo przybliżonymi funkcjami g(a >), otrzyma¬ 
nymi dla bardzo prostych modeli dynamicznych 
kryształu. 

Jednym z takich modeli jest model Einsteina, który 
się opiera na założeniu, że każdy atom w sieci jest 
niezależnym oscylatorem. Widmo częstości drgań 
składa się z jednej wartości co E , wspólnej dla wszy¬ 
stkich oscylatorów (rys. 14a). Częstość tę nazywamy 
częstością Einsteina. W modelu Einsteina drgania 


własności 

termodyna¬ 

miczne 

kryształu 


model 

Einsteina 




Rys. 14. Krzywe dyspersji i widmo częstości drgań; a) model 
Einsteina (coe —częstość Einstćina); b) model Debye'a (cod — 
częstość E>ebye’a) 


sieci nie mają dyspersji. W związku z tym model ten 
źle opisuje drgania akustyczne, odznaczające się dużą 
dyspersją. Można go jednak stosować do drgań 
optycznych, które z reguły wykazują słabą zależność 
częstości od wektora falowego. 
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model Bardziej odpowiednim do opisu drgań akustycz- 
Debye'a nych jest model Debye’a, który traktuje kryształ jako 
ośrodek ciągły i izotropowy. Relacje dyspersji są 
w tym wypadku liniowe, a widmo częstości ma po¬ 
stać g(co) = const-co 2 (rys. 14b). Maksymalna czę¬ 
stość cod (częstość Debye’a) jest określona z warunku 
normalizacji (całkowita liczba drgań w przedziale od 
zera do cod musi być równa 3rN). Jest to pewnego ro¬ 
dzaju odstępstwo od własności ośrodka ciągłego, 
który nie ogranicza liczby drgań normalnych. W mo¬ 
delu Debye’a strefa Brillouina ma kształt kuli, której 

promień qo , zwany wektorem falowym Debye’a, 
odpowiada w przybliżeniu rozmiarom strefy Bril¬ 
louina dla rzeczywistych kryształów. 

Model Debye’a stosunkowo dobrze opisuje drgania 
akustyczne, którym odpowiada długość fali większa 
od odległości międzyatomowych. Kryształ może być 
wtedy traktowany jako ośrodek ciągły, a krzywe 
dyspersji mają charakter liniowy. 

Drgania akustyczne o stosunkowo małych często¬ 
ściach są znacznie silniej wzbudzane niż drgania 
optyczne. W związku z tym decydujący wkład do 
energii wewnętrznej kryształu jest związany z drga¬ 
niami akustycznymi. Dzięki temu model Debye*a 
daje dobre wyniki przy obliczeniach wielkości termo¬ 
dynamicznych. Między innymi pozwala on uzyskać 
poprawną zależność ciepła właściwego kryształów od 
temperatury. 

Oddziaływania anharmoniczne 

Konsekwencją przybliżenia harmonicznego jest moż¬ 
liwość przedstawienia drgań sieci w postaci zbioru 
niezależnych drgań normalnych. W obrazie tym ener¬ 
gia dostarczona selektywnie jednemu drganiu nor¬ 
malnemu nie może być przekazana innym drganiom 
normalnym. Tym samym w doskonałym krysztale 
nie istnieje mechanizm, który by gwarantował przy¬ 
wrócenie równowagi termodynamicznej. 

W opisie kwantowym niezależnym drganiom nor¬ 
malnym odpowiadają fonony, między którymi nie za¬ 
chodzą oddziaływania. Czas życia i droga swobodna 
fononów w doskonałym, nieograniczonym krysztale 
powinny więc osiągać nieskończenie dużą wartość. 

W rzeczywistości jednak żaden kryształ nie jest 
ściśle harmoniczny. Dokładna teoria dynamiki sieci 
winna uwzględniać wyrazy trzeciego rzędu i wyższych 
w rozwinięciu energii potencjalnej względem odchy- 
wyrazy an- leń od położeń równowagi. Wyrazy te nazywamy 
harmoniczne anharmonicznymi. 

Z wyrazami anharmonicznymi wiąże się szereg ma¬ 
kroskopowych własności kryształów', takich jak prze¬ 
wodnictwo cieplne, rozszerzalność cieplna, zależność 
od temperatury współczynników sprężystości oraz 
liniowa zależność od temperatury ciepła właściwego 
w zakresie wysokich temperatur. Nie będziemy się tutaj 
zajmować zastosowaniami teorii anharmonicznej 
drgań sieci do wyjaśnienia wymienionych własności. 
Ograniczymy się wyłącznie do przedstawienia ogólnej 
interpretacji fizycznej wyrazów anharmonicznych. 

Dla szeregu kryształów współczynniki występujące 
przy wyrazach anharmonicznych w rozwinięciu energii 
potencjalnej są małe w porównaniu ze współczynni¬ 
kami przy wyrazach drugiego rzędu. W tej sytuacji 
wyrazy anharmoniczne można traktować jako małe 
zaburzenie drgań normalnych doskonałego kryształu. 
Odpowiednie obliczenia wykazują, że zaburzenie to 
powoduje niewielką zmianę częstości drgań sieci 
(w porównaniu z wynikami teorii harmonicznej) oraz 
pojawienie się czasu relaksacji, czyli powrotu wzbu¬ 
dzonych drgań normalnych do stanu równowagi ter¬ 
modynamicznej. 

czas życia W ujęciu kwantowym efektem wyrazów anharmo- 
fOrionów nicznych jest pojawienie się oddziaływań między fo¬ 
nonami, w wyniku czego fonony mogą powstawać 
i znikać. Prowadzi to do skończonej wartości czasu 
życia i drogi swobodnej fononów. Średni czas życia 
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Rys. 15. Dwa rodzaje procesów trójfononowych: a) absorpcja 
jednego fononu i emisja dwóch innych fononów, b) absorpcja 
dwóch fononów i emisja jednego fononu 

fononów jest równoważny czasowi relaksacji energii 
wzbudzonych drgań normalnych. 

Zarówno częstość, jak i czas życia fononów zależą 
od wartości współczynników anharmonicznych i tern- b) 
peratury. Ze wzrostem temperatury czas życia fono¬ 
nów maleje, gdyż rośnie liczba fononów i w następ¬ 
stwie tego — prawdopodobieństwo oddziaływań mię¬ 
dzy nimi. Dla wielu kryształów efekt ten jest stosunko¬ 
wo mały. Kształt krzywych dyspersji i widma czę¬ 
stości drgań zaledwie w niewielkim stopniu zależy od 
oddziaływań anharmonicznych. Dlatego obliczenia 
tych wielkości prowadzi się z reguły w ramach przy¬ 
bliżenia harmonicznego. 

Bardzo często można się ograniczyć do uwzględ¬ 
nienia pierwszego wyrazu an harmonicznego w roz¬ 
winięciu energii potencjalnej. Wyraz ten reprezentuje 
dwa typy procesów, które schematycznie są przed¬ 
stawione na rys. 15. W procesie (a) jeden fonon znika, 
a dwa inne powstają, w procesie (b) dwa fonony zni¬ 
kają, a na ich miejsce powstaje jeden inny. W od¬ 
działywaniach tych spełnione są zasady zachowania 
energii i kwazipędu, które dla procesu (b)mają postać: 

ficoi-Ą-ftcD* — ńco, 

<h+<22 = <?> 03) 

+ ~ 

Ze względu na zasadę zachowania pędu możliwe są 
dwa rodzaje oddziaływań. Jedno z nich nosi nazwę 
procesu normalnego, drugie — procesu przerzutu lub procesy 
procesu Umklapp. Charakterystyczną cechą procesu przerzutu 
przerzutu jest to, że część pędu określona wielkością 

hG jest przekazana całej sieci krystalicznej. Procesy 
przerzutu odgrywają dużą rolę w zagadnieniach do¬ 
tyczących mechanizmu ustalania się równowagi ter¬ 
modynamicznej w krysztale, mechanizmu, który leży 
u podstaw teorii sieciowego przewodnictwa cieplnego. 



Wpływ defektów na drgania sieci 


Kryształy, z którymi mamy do czynienia w praktyce, 
nigdy nie są doskonałe. Zawierają one zawsze pewną 
koncentrację defektów. Defekty te powodują istotne 
modyfikacje w obrazie drgań sieci kryształów do¬ 
skonałych. 

Wiele ogólnych wyników dotyczących drgań sieci 
z defektami można otrzymać rozpatrując stosunko¬ 
wo proste modele defektów. Do takich należy m.in. 
defekt sieci wytworzony przez atom obcy (domieszkę domieszki 
chemiczną) umieszczony w węźle sieci zamiast atomu 
własnego kryształu. Defekt taki wprowadza lokalne 
zaburzenie, polegające na zmianie masy i stałych si¬ 
łowych w stosunku do wartości w doskonałej sieci. 
Oddziaływania domieszki z atomami sieci zwykle 
mają krótki zasięg, co w praktyce pozwala rozpatry¬ 
wać tylko stałe siłowe między atomem obcym i jego 
najbliższymi sąsiadami. Poza tym w najprostszych 
rozważaniach przyjmuje się, że defekty nie oddzia¬ 
łują między sobą. Jest to uzasadnione zwłaszcza wte¬ 
dy, gdy koncentracja defektów jest mała. 

Własności drgań sieci w kryształach z defektami 
otrzymuje się przez rozwiązywanie odpowiednich 
równań ruchu. Ograniczymy się tutaj do przedstawie¬ 
nia wyników dla sieci jednowymiarowej zawierającej 
jeden atom w komórce elementarnej. Rozwiązanie 
równań ruchu dla takiej sieci z atomem obcym umiesz¬ 
czonym w węźle wykazuje, że widmo drgań sieci skła¬ 
da się z pasma częstości (podobnie jak w sieci do¬ 
skonałej) i jednej dyskretnej częstości położonej po- 




drganie wyżej tego pasma (rys. 16). Dyskretna częstość od- 
iokalne powiada tzw. drgania lokalnemu. Charakterystyczną 
cechą tego drgania jest wykładnicze malenie ampli¬ 
tudy ze wzrostem odległości od atomu obcego (rys. 
17a). Innymi słowy, w drganiu lokalnym bierze udział 
tylko atom obcy i mała liczba atomów znajdujących 
się w jego sąsiedztwie. 



drganie lokalne 


pasmo drgań 
akustycznych 


drganie rezonansowe 


Rys. 16. Położenie drgań lokalnych i rezonansowych w stosunku 
do pasma częstości drgań dozwolonych sieci doskonałej 


Wpływ defektów na częstości drgań normalnych 
w obszarze pasmowym jest pomijalnie mały. Pasmo 
dozwolonych częstości drgań w krysztale zawierają¬ 
cym małą koncentrację defektów pokrywa się z ana¬ 
logicznym pasmem w krysztale doskonałym. Mody¬ 
fikacji ulegają amplitudy drgań normalnych, zwłaszcza 
w pobliżu defektów. Czasem obserwuje się rezonan¬ 
sowy wzrost amplitudy dla określonej częstości drgań 
drgania znajdującej się wewnątrz pasma. Drgania mające tę 
rezonansowe własność noszą nazwę drgań rezonansowych lub 
drgań pseudolokalnych. Biorą w nich udział tylko 
atomy obce i atomy znajdujące się w ich sąsiedztwie 
(rys. 17b). 




Rys. 17. Ruch atomów w sieci liniowej zawierającej atom obcy: 
a) drganie lokalne, b) drganie rezonansowe 


Drgania rezonansowe występują wtedy, gdy prze¬ 
kazanie energii drgań od defektu do sieci jest z ja¬ 
kichś powodów utrudnione i zachodzi powoli. Przy¬ 
czyną utrudniającą ten proces jest zwykle słabe sprzę¬ 
żenie atomu obcego z siecią (małe stałe siłowe) lub 
mała wartość g(co) dla co odpowiadającej częstości 
drgań atomu obcego. 

Drgania lokalne pojawiają się wówczas, gdy atom 
obcy ma masę znacznie mniejszą niż atom macierzy¬ 
sty sieci. Do tego samego efektu prowadzi „wzmoc¬ 
nienie” stałych siłowych sprzęgających atom obcy 
z siecią. Natomiast, aby powstały drgania rezonan¬ 
sowe, muszą być wprowadzone do sieci atomy obce 
o masie większej niż masa atomów macierzystych 
sieci lub musi nastąpić znaczne „osłabienie” stałych 
siłowych. 

Doświadczalne badanie drgań lokalnych, jak rów¬ 
nież rezonansowych przeprowadza się w kryształach 
jonowych i kowalencyjnych metodami optycznymi. 



Rys. 18. Absorpcja podczerwieni przez drgania lokalne jonów 
H - (jon H“ zastępuje w sieci KCI jon Cl~) w krysztale KC1 
(chlorku potasu) w kilku temperaturach. Energia fotonu w mak¬ 
simum krzywych odpowiada długości fali około 21 pm 


W widmach absorpcji podczerwieni obserwuje się 
pasma takie, jak np. na rys. 18; położenie maksimum 
pasma pozwala określić częstość drgania lokalnego 
lub rezonansowego, a jego rozmycie — czas życia. 


Doświadczalne metody badania 
drgań sieci 


Niesprężyste rozproszenie neutronów 
powolnych 

Wśród doświadczalnych metod dostarczających in¬ 
formacji o drganiach sieci szczególnie ważną rolę od¬ 
grywa niesprężyste rozproszenie neutronów powol¬ 
nych. Metodą tą można otrzymać krzywe dyspersji, 
a w wypadku kryształów o strukturze regularnej — 
również widmo częstości drgań. 

W eksperymentach rozproszeniowych stosuje się 
neutrony o energii rzędu 0,1 eV. Neutrony o tej ener¬ 
gii mają długość fali de Broglie’a porównywalną z 
odległościami międzyatomowymi w krysztale. Dla 
takich fal kryształ stanowi swego rodzaju przestrzen¬ 
ną siatkę dyfrakcyjną. Monochromatyczna fala neu¬ 
tronowa padająca na kryształ w wyniku oddziaływa¬ 
nia z jądrami atomowymi ulega rozproszeniu. Gdy 
jądra atomowe w każdym węźle sieci mają identyczne 
własności rozpraszające, fale rozproszone nakładają 
się wzajemnie, dając zjawisko interferencji. Tego ro¬ 
dzaju rozproszenie nazywa się spójnym. Występuje 
ono wówczas, gdy kryształ jest doskonały (brak de¬ 
fektów), jednorodny pod względem izotopowym, a spi¬ 
ny jąder atomowych są równe zeru. Jeżeli natomiast 
kryształ zawiera przypadkowo rozmieszczone izotopy 
lub jego jądra atomowe mają spiny różne od zera, to 
mamy do czynienia z rozproszeniem niespójnym. 

Spójne rozproszenie neutronów w krysztale może 
może być zarówno sprężyste, jak i niesprężyste. W pro¬ 
cesach sprężystych energia neutronu w czasie roz¬ 
proszenia nie ulega zmianie. Efekty interferencyjne 
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odbicie prowadzą do tzw. odbicia braggowskiego od różnych 
braggowskie płaszczyzn w krysztale, co opisuje wzór: 

IdsmO = nX 9 

gdzie d — odległość między płaszczyznami sieciowymi 
w krysztale, <9 — kąt odbicia braggowskiego, n — 
rząd odbicia, k — długość fali de Broglie ł a neutronu. 
Z wzoru tego można wyznaczyć długość fali ź, jeśli 
się zna kąt O z pomiaru. Posługując się związkami: 

E = h 2 j2M n X 2 (M n — masa neutronu), 

\k\ = 2n/k, 


można następnie obliczyć energię i wartość wektora 
falowego neutronu. 

Z punktu widzenia dynamiki sieci krystalicznej 
bardziej interesujące są procesy niesprężystego roz¬ 
proszenia, w których rozproszonemu neutronowi to¬ 
warzyszy pojawienie się łub zniknięcie jednego lub 
niesprężyste więcej fononów. Spójne, niesprężyste rozproszenie 
rozpraszanie neutronów zachodzące z udziałem jednego fononu 
z udziałem wykorzystuje się do otrzymania relacji dyspersji fo- 
1 fononu nonów. Jeżeli neutron ulega rozproszeniu i jednocze¬ 
śnie zachodzi absorpcja jednego fononu, to zasada 
zachowania energii i pędu wymaga spełnienia nastę¬ 
pujących zależności: 

E'-E= J£- = ho>fa\ (14) 

k'-k=^+G, (15) 


gdzie M n — masa, E\ E i k\ k — odpowiednio ener¬ 
gia i pęd neutronu padającego i rozproszonego. Gdy 
w doświadczeniu zmierzy się zmiany energii i pędu 
neutronu, to posługując się równaniami (14) i (15), 
można będzie wyznaczyć częstość i wektor falowy 
fononu uczestniczącego w procesie rozproszenia, 
badanie W badaniach niesprężystego rozproszenia neutro- 
krzy wyeh nów źródłem neutronów są reaktory jądrowe. Prędkie 
dyspersji neutrony wychodzące z reaktora przepuszcza się 
przez moderator (grafit, woda), w którym w wyniku 
szeregu kolejnych zderzeń z lekkimi atomami wytra¬ 
cają one energię lub inaczej mówiąc — ulegają spo¬ 
wolnieniu. Gdy temperatura moderatora jest bliska 
pokojowej, średnia energia neutronu osiąga wartość 
ok. 0,03 eV. Neutrony takie nazywamy termicznymi. 

Rys. 19 przedstawia typowy spektrometr neutrono¬ 
wy przeznaczony do badania krzywych dyspersji neu¬ 
tronów Wiązka termicznych neutronów jest formo- 



Rys. 19. Schemat spektrometru neutronowego do badania krzy¬ 
wych dyspersji: R reaktor, K Xi K 2 , K 9 i JiTjkoJimatory, A", kryształ 
monochromatora, X 2 kryształ badany, X ? kryształ analizatora, 
D detektor neutronów, <P kąt rozproszenia 


wana w kolimatorze K x (kanały w bloku substancji 
pochłaniającej neutrony). Monochromatyzację wiązki 
uzyskuje się przez braggowskie odbicie od kryształu 
X u który odgrywa rolę monochromatora. Energię E 

i wektor falowy K neutronu wyznacza się na pod¬ 
stawie pomiaru kąta Om. Następnie monochroma¬ 
tyczna wiązka pada na badany kryształ X Zt który jest 
zorientowany w określony sposób w stosunku do 
wiązki neutronów. Energia neutronów rozproszonych 
pod kątem <P jest analizowana przez kryształ X 3 . De¬ 

554 


tektor D rejestruje natężenie rozproszonych neutro¬ 
nów w zależności od ich energii dla danego kąta roz¬ 
proszenia 0. W widmie rozproszenia obserwuje się 
maksima interferencyjne odpowiadające rozprosze¬ 
niu z udziałem różnych fononów (rys. 20). Każde 
z tych maksimów pozwala wyznaczyć jedną wartość 



Rys. 20. Typowe widmo neutronów rozproszonych na fononach 


funkcji <*>j(q). Przeprowadzając badanie dla odpowied¬ 
nio dobranych różnych kątów rozproszenia & i róż¬ 
nych orientacji kryształu X 2t można wykreślić całą 

funkcję o>j(q). Specjalne metody, których nie będzie¬ 
my tutaj omawiać, pozwalają określić wektor pola¬ 
ryzacji e s (qf) drgań i przyporządkować je odpowied¬ 
niej gałęzi krzywej dyspersji. Rozmycie maksimów 
interferencyjnych przy dobrej zdolności rozdzielczej 
spektrometru neutronowego charakteryzuje czas życia 
fononów — związany głównie z procesami anharmo- 
nicznymi w krysztale. 

W niektórych kryształach dominującą rolę odgry¬ 
wają procesy niespójnego rozproszenia niesprężyste¬ 
go. Nie można wówczas otrzymać krzywych dyspersji. 
W kryształach o strukturze regularnej zależność na¬ 
tężenia rozproszonych neutronów od energii (przy 
stałym kącie rozproszenia) odzwierciedla kształt wid¬ 
ma częstości drgań g(o>). 

Niewątpliwą zaletą neutronów termicznych w ba¬ 
daniach dynamiki sieci jest to, że ich energia i war¬ 
tość wektora falowego są porównywalne z energią 
i wartością wektora falowego fononów w całym prze¬ 
dziale strefy Briłlouina. Dzięki temu w procesie od¬ 
działywania zachodzą znaczne zmiany tych wielkości, 
łatwe do zmierzenia. Duże znaczenie ma także fakt, 
że w rozproszeniu neutronów mogą brać udział wszy¬ 
stkie fonony, jeżeli tylko spełniona jest zasada zacho¬ 
wania energii i pędu. Pod tym względem zachodzi 
istotna różnica w stosunku do oddziaływania promie¬ 
niowania elektromagnetycznego z fononami, w któ¬ 
rym występują dodatkowe ograniczenia, nie wynika¬ 
jące z zasady zachowania energii i pędu. 


Absorpcja w podczerwieni 

Jednym z efektów oddziaływania promieniowania 
elektromagnetycznego z drganiami sieci jest jego ab¬ 
sorpcja w krysztale, która występuje w szerokim za¬ 
kresie spektralnym, obejmującym tzw. średnią i daleką 
podczerwień (od kilku do 1000 pm). Analiza widma 
absorpcji dostarcza wielu cennych danych o drga¬ 
niach sieci krystalicznej. 

Absorpcja promieniowania na drganiach sieci kry¬ 
stalicznej może być badana tylko w kryształach za¬ 
wierających niezbyt dużą koncentrację swobodnych 
nośników ładunku. W kryształach metali i silnie do¬ 
mieszkowanych półprzewodników absorpcja na swo¬ 
bodnych nośnikach nie pozwala obserwować znacz¬ 
nie słabszych pasm absorpcji związanych z drganiami 
sieci. 

Warunkiem wystąpienia absorpcji promieniowania 
elektromagnetycznego na drganiach sieci jest istnie¬ 
nie oscylującego dipolowego momentu elektrycznego. 
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W kryształach jonowych moment ten powstaje w wy¬ 
niku przeciwfazowego ruchu jonów przeciwnego zna¬ 
ku, odpowiadającego drganiom optycznym. W ko¬ 
mórce elementarnej zawierającej dwa jony moment 

elektryczny M wyraża się wzorem: 

M = c(w+—«-), ( 16 ) 

gdzie e jest ładunkiem jonów, u+ i w_ — odchyleniami 
dodatniego i ujemnego jonu od położenia równowagi. 
W bardziej ścisłych rozważaniach należy uwzględnić 
wkład do dipolowego momentu elektrycznego pocho¬ 
dzący od deformacji powłok elektronowych atomów, 
która zachodzi w czasie drgań sieci. 

Absorpcja promieniowania jest procesem kwanto¬ 
wym, w którym mogą brać udział jeden, dwa lub wię¬ 
cej fononów. W procesach tych obowiązuje zasada 
zachowania energii i kwazipędu. W oddziaływaniu 
jednofononowym zasady te wymagają spełnienia na¬ 
stępujących warunków: 

ft>foton = Wfonon, (17) 



Rys. 21. Zależność współczynnika odbicia od długości fali dla 
kryształu NaCl w różnych temperaturach 


k =q. 


(18) 


Z wzorów (17 i (18) wynika, że absorpcja promie¬ 
niowania elektromagnetycznego z towarzyszącą jej 
emisją jednego fononu zachodzi wtedy, gdy częstość 
fotonu jest równa częstości fononu, a wektory falowe 
fotonu i fononu są zgodnie skierowane i równe co do 
bezwzględnej wartości. 

Częstość fononów optycznych jest zwykle rzędu 
10 13 s -1 . Częstości tej odpowiada wartość wektora fa¬ 
lowego 2,1 • 10 3 cm -1 , która jest o kilka rzędów mniej¬ 
sza od rozmiarów strefy Brillouina. Można stąd wy¬ 
ciągnąć wniosek, że tylko fonony znajdujące się w po¬ 
bliżu środka strefy Brillouina mogą oddziaływać 
z promieniowaniem elektromagnetycznym. Ze 
względu na bardzo małą wartość wektora falowego 
tych fononów w skali strefy Brillouina mówimy, że 

mają one prawie zerową wartość q. 

Oddziaływania optyczne podlegają określonym 
regułom wyboru (-* Spektroskopia atomowa). W wy¬ 
padku absorpcji jednofononowej reguły te można 
sformułować żądając, aby dipolowy moment elek¬ 
tryczny wytwarzany przez drgania sieci był różny 
od zera i miał składową równoległą do wektora 


elektrycznego E 
nego, czyli: 


promieniowania elektromagnetycz¬ 
ni # 0. (19) 


Jeżeli przyjmiemy, że moment elektryczny M jest rów¬ 
noległy do wektora polaryzacji e drgań sieci, to pro¬ 
ste rozważania doprowadzą do wniosku, że tylko fo¬ 
nony optyczne poprzeczne (TO) oddziałują z pro¬ 
mieniowaniem elektromagnetycznym. Fonony op¬ 
tyczne podłużne (LO) nie dają absorpcji promienio¬ 
wania, chociaż wytwarzają w krysztale dipolowy mo¬ 
ment elektryczny. 

W kryształach jonowych procesy jednofononowe 
charakteryzuje bardzo duży współczynnik absorpcji 
(rzędu 10M0® cm -1 ). Do badania tej absorpcji ko^ 
nieczne są bardzo cienkie próbki, które z różnych 
względów trudno jest otrzymać. W związku z tym 
znacznie wygodniej jest badać współczynnik odbicia. 
Stosując odpowiednie wzory matematyczne (tzw. re¬ 
lacje Kramersa-Kroniga), z widma odbicia można 
otrzymać stałe optyczne, a w szczególności współ¬ 
czynnik absorpcji. 

Pasmo odbicia związane z oddziaływaniem fotonu 
z fononem optycznym nosi nazwę reststrahlen band 
(pasmo promieni resztkowych). Występuje ono w 
podczerwieni przy długościach fali rzędu kilkudzie¬ 
sięciu pm. Rysunek 21 przedstawia omawiane pasmo 
odbicia dla kryształu NaCl. Analiza pasma odbicia 
pozwala otrzymać częstość fononu optycznego po¬ 
przecznego (TO) o wektorze falowym q ~ 0, jego czas 
życia oraz siłę oscylatora, która określa wielkość 


sprzężenia promieniowania elektromagnetycznego 
z danym fononem. 

W kryształach kowalencyjnych o strukturze dia¬ 
mentu (krzem, german) atomy są neutralne i elektrycz¬ 
ny moment dipolowy może pochodzić tylko od de¬ 
formacji powłok elektronowych atomów wywoływa¬ 
nej przez drgania sieci. Na dwóch identycznych ato¬ 
mach w komórce elementarnej drgania sieci wytwa¬ 
rzają dipolowe momenty elektryczne równe co do 
wielkości, lecz przeciwnie skierowane. W rezultacie 
całkowity moment elektryczny w komórce elemen¬ 
tarnej, a tym samym w całym krysztale znika. A za¬ 
tem w kryształach tych nie zachodzą procesy jedno¬ 
fononowe. W widmie odbicia nie pojawia się pasmo 
odbicia resztkowego, charakterystyczne dla kryszta¬ 
łów jonowych lub kryształów mających wiązania 
częściowo jonowe. 

Do absorpcji w kryształach kowalencyjnych o struk¬ 
turze diamentu przyczyniają się głównie procesy dwu- 
fononowe. Oddziaływania dwufononowe w tych 
kryształach związane są z dipolowym momentem 
elektrycznym drugiego rzędu, który powstaje, gdy de¬ 
formacja powłok elektronowych atomów jest rezul¬ 
tatem współdziałania dwóch fononów. Procesy dwu¬ 
fononowe występują, oczywiście, nie tylko w kryszta¬ 
łach kowalencyjnych. W kryształach jonowych i częś¬ 
ciowo jonowych są jednak możliwe inne mecha¬ 
nizmy oddziaływania niż te, które przed chwilą przed¬ 
stawiliśmy. Absorpcja związana z procesami dwufo- 
nonowymi jest na ogół znacznie słabsza niż absorpcja 
odpowiadająca procesom jednofononowym. 

W procesach dwufononowych w wyniku absorpcji 
fotonu powstają dwa fonony (proces sumacyjny) lub 
jeden fonon powstaje, a drugi znika (proces różnico¬ 
wy). Oddziałujące fonony mają równe co do wiel¬ 
kości, ale przeciwnie skierowane wektory falowe. 
W procesach tych mogą brać udział fonony z całej 
strefy Brillouina, jeżeli reguły wyboru związane z sy¬ 
metrią komórki elementarnej nie zabraniają oddzia¬ 
ływań. Rysunek 22 przedstawia widmo dwufonono- 
wej absorpcji krzemu. Składa się ono z szeregu suma- 
cyjnych pasm absorpcji, które można przyporządko¬ 
wać określonym kombinacjom dwóch fononów. 
Analiza dwufononowego widma absorpcji pozwala 
wyznaczyć częstość fononów w tych miejscach, w któ¬ 
rych funkcja rozkładu częstości drgań ma maksima. 

Przy dużej zdolności rozdzielczej aparatury pomia¬ 
rowej w widmie absorpcji można zauważyć szczegóły 
związane z punktami krytycznymi omawianymi wy¬ 
żej. Analiza widma absorpcji pozwala w takich razach 
wyznaczyć częstości drgań sieci w ściśle określonych 
punktach strefy Brillouina. Do interpretacji widma 
absorpcji konieczna jest znajomość reguł wyboru, 
które określają dozwolone kombinacje fononów w da¬ 
nym punkcie krytycznym. 
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współczynnik absorpcji 
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absorpcja już wcześniej zaznaczono, badanie procesów 

jednofonono- jednofononowych daje tylko i nformacje o fononach ze 
wa na drga- środka strefy Brillouina. Ograniczenie to jest zwią- 
neach defek- zar *e z zasadą zachowania kwazipędu w oddziały- 
tów waniach foton-fonon. Okazuje się jednak, że można 
„aktywować” zabronioneoddziaływaniajednofonono- 
we przez wprowadzenie do sieci krystalicznej defektów 
(np. domieszek chemicznych). Drgania specjalnie do¬ 
branych defektów zaledwie nieznacznie różnią się od 
drgań atomów własnych kryształu. W czasie drgań 
defektów powstaje oscylujący dipolowy moment elek¬ 
tryczny, który oddziałuje z promieniowaniem elektro¬ 
magnetycznym. Jednofononowa absorpcja promie¬ 
niowania elektromagnetycznego na drganiach defek¬ 
tów odzwierciedla widmo częstości drgań w prawie 
doskonałym krysztale. 


Rozproszenie ramanowshio 

Dotychczas rozpatrywaliśmy procesy, w których za¬ 
chodzi absorpcja fotonu i powstanie (emisja) fono¬ 
nów. Istnieje jeszcze inny rodzaj oddziaływań między 
promieniowaniem elektromagnetycznym i kryształem. 
Oddziaływanie to prowadzi do rozproszenia fotonu 
z jednoczesnym powstaniem (lub zniknięciem) fono¬ 
nów. Nosi ono nazwę rozproszenia ramanowskiego. 

W doświadczalnych badaniach rozproszenia rama¬ 
nowskiego na kryształ pada monochromatyczna 
wiązka światła, która ulega rozproszeniu we wszy¬ 
stkich kierunkach. Analizuje się skład widmowy pro- 
analtza pro- mieniowania rozproszonego. W widmie tym znajduje- 
mśeniowarcia my nie tylko częstość w 0 promieniowania padającego, 
rozproszo- ale także inne częstości, mniejsze i większe niż o>q. 
nego Analiza widma promieniowania rozproszonego do¬ 
starcza informacji o fononach, które biorą udział 
w procesie rozproszenia. 

W rozproszeniu ramanowskim pierwszego rzędu 
powstaje lub znika fonon optyczny ze środka strefy 

Brillouina (q x 0). Rysunek 23 przedstawia schema¬ 
tycznie widmo ramanowskie odpowiadające tego 
rodzaju procesom. Linia centralna o częstości co 0 od¬ 
powiada rozproszeniu Rayleigha, które zachodzi bez 
udziału fononów. Linia o częstości to A związana jest 
z procesem emisji jednego fononu i nosi nazwę linii 
stokesowskiej — światło rozproszone ma mniejszą 
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częstość niż światło padające. Linia o częstości w 2 , 
większej niż częstość światła padającego, powstaje 
w wyniku absorpcji fononu i nazywa się linią anty- 
stokesowską. 
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Rys. 23. Schematyczne widmo ramanowskie pierwszego rzędu 
odpowiadające oddziaływaniu z jednym fononem 


Różnica (co 0 —o> i) lub (co 2 — <o 0 ) określa częstość fo¬ 
nonu biorącego udział w procesie rozproszenia świa¬ 
tła. Gdy w rozproszeniu jest czynna większa liczba 
fononów, widmo ramanowskie składa się z odpowied¬ 
nio większej liczby linii. Rozmycie linii jest zwykle 
związane ze skończonym czasem życia fononów. 

W rozproszeniu ramanowskim obserwuje się także 
procesy drugiego rzędu, w których biorą udział dwa 
fonony. Analiza tych procesów dostarcza danych o 
fononach analogicznych do danych z analizy dwufo- 
nonowych procesów absorpcyjnych. 

Rysunek 24 przedstawia widmo ramanowskie 
trzech kryształów związków półprzewodnikowych gru¬ 
py A m B v . W widmie tym widoczne są dwa silne 
maksima związane z fononami LO i TO oraz słabsze 
maksima odpowiadające procesom drugiego rzędu. 
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Rys. 24. Widmo rozpraszania ramanowskiego w kryształach 
GaAS, InP i AISb w temperaturze pokojowej (część antystoke- 
sowska) 


Prawdopodobieństwo rozproszenia ramanowskiego prawdopodo- 
zależy od wielkości zmian polaryzowalności elektro- bieństwo 
nowej kryształu wywołanej przez drgania sieci. Na- rozproszenia 
tężenie promieniowania rozproszonego w procesach Ramana 
jednofononowych jest zwykle 10 6 -10 7 razy mniejsze od 
natężenia promieniowania padającego. 

Rozproszenie światła, przy którym powstaje lub 
znika fonon akustyczny, nazywa się rozproszeniem 
Brillouina. Rozproszenie to charakteryzuje bardzo 



























rozproszenie mała zmiana częstości (rzędu kilku cm -1 ), która za- 
Brillouina leży od częstości światła padającego. Dla procesów 
rozproszenia ramanowskiego zmiana częstości jest 
mniej więcej o dwa rzędy wielkości większa i ma war¬ 
tość stałą, niezależną od częstości światła padającego. 
Badanie rozproszenia Brillouina jest jedną z metod 
wyznaczenia współczynników sprężystości kryszta¬ 
łów. 

reguły Rozproszenie ramanowskie podlega określonym 
wyboru regułom wyboru. Reguły te nie pokrywają się z regu¬ 
łami dla procesów absorpcyjnych. Dlatego w wid¬ 
mach ramanowskich można często obserwować fo¬ 
nony, które nie pojawiają się w widmach absorpcyj¬ 
nych, np. w kryształach o strukturze diamentu. W 
rozproszeniu ramanowskim pierwszego rzędu biorą 
udział fonony optyczne ze środka strefy Brillouina, 
które nie mogą uczestniczyć w absorpcji jednofono- 
wej. . ... 

W badaniach rozproszenia Ramana i Brillouina 
stosuje się obecnie lasery jako źródła promieniowania 
pobudzającego. Odznaczają się one dużą mocą i wy¬ 
soką monochromatycznością. Dzięki tym cechom 
stało się możliwe wykonanie bardzo precyzyjnych ba¬ 
dań zarówno procesów pierwszego, jak i drugiego 
rzędu. Eksperymenty z określoną geometrią i pola¬ 
ryzacją wiązek światła padającego i rozproszonego 
dostarczają dokładnych informacji nie tylko o często¬ 
ściach fononów, ale również o ich przynależności do 
określonej gałęzi dyspersyjnej. 

Aktualne kierunki badań 

Dynamika sieci krystalicznej jest jednym z najstar¬ 
szych działów fizyki ciała stałego. Jej podstawy te¬ 
oretyczne zostały sformułowane przez P. Debye’a, 
M. Borna i T. Karm&na już w 1912 r. Przez długi jed¬ 
nak okres nie było odpowiednich metod doświadczal¬ 
nych pozwalających badać drgania sieci. Wyniki teorii 
były kontrolowane tylko pośrednio, poprzez oblicza¬ 
nie wielkości termodynamicznych i porównywanie 
tych obliczeń z wynikami pomiarów. Do wymienio¬ 
nych celów zwykle wykorzystywano zależność ciepła 
właściwego od temperatury. 

Właściwe metody umożliwiające badanie własnoścj 
poszczególnych drgań normalnych sieci krystalicznej 
pojawiły się dopiero w okresie ostatnich 20 lat. 
W 1955 r. wykonano pierwsze badania niesprężystego 
rozproszenia neutronów powolnych na drganiach 
sieci. Mniej więcej od początku lat sześćdziesiątych 


zaczęły się pojawiać coraz liczniej prace stosujące w 
badaniach drgań sieci technikę spektroskopii w pod¬ 
czerwieni, a w kilka lat później — laserowej spektro¬ 
skopii ramanowskiej. Intensywny rozwój badań ek¬ 
sperymentalnych stał się czynnikiem stymulującym 
prace teoretyczne. 

Wśród aktualnie prowadzonych badań dynamiki 
sieci krystalicznej można wyróżnić kilka kierunków. 

Jednym z nich jest niewątpliwie badanie dynamiki 
sieci kryształów doskonałych, nie zawierających de- dynamika 
fektów. Celem tych badań jest otrzymanie krzywych siec; bez 
dyspersji i widma częstości drgań dla rzeczywistych defektów 
kryształów. Tematyka ta wiąże się ściśle z zagadnie¬ 
niem oddziaływań międzyatomowych w kryształach. 

Początkowo badania dynamiki sieci były z reguły 
ograniczone do kryształów zawierających niewiele 
(jeden lub dwa) atomów w komórce elementarnej 
i mających jednocześnie stosunkowo prostą strukturę 
krystaliczną o wysokiej symetrii. Obecnie coraz czę¬ 
ściej spotyka się prace dotyczące kryształów o zło¬ 
żonej budowie. Specjalne miejsce w tych badaniach 
zajmują kryształy molekularne, w których oprócz 
zwykłych drgań, nazywanych czasem drganiami trans- 
lacyjnymi, występują drgania torsyjne (skrętne) oraz 
drgania atomów wewnątrz molekuł. 

Oprócz dalszego zainteresowania dynamiką sieci 
kryształów doskonałych, od początku lat sześćdzie¬ 
siątych zaczął się silny rozwój nowego kierunku ba¬ 
dań, który można określić jako dynamikę sieci krysz- dynamika 
tałów zawierających defekty i niedoskonałości. Znacz- sieci 
na grupa prac w tej dziedzinie koncentruje się wokół z defektami 
zagadnień wpływu na widmo drgań sieci małej kon¬ 
centracji defektów punktowych. Wiele uwagi poświę¬ 
ca się także badaniu dynamiki nieuporządkowanych 
kryształów mieszanych, chociaż napotyka się tutaj 
znacznie większe trudności teoretyczne niż przy de¬ 
fektach punktowych. Interesujące zagadnienia, któ¬ 
rych badania znajdują się dopiero w początkowym 
stadium, są związane z dynamiką substancji amor¬ 
ficznych (bezpostaciowych). 

Dokonując przeglądu aktualnych kierunków badań 
nie sposób pominąć obszernej dziedziny, jaką stanowi 
badanie oddziaływań fononów z innymi kwazicząst¬ 
kami w krysztale, takimi jak elektrony, plazmony, 
magnony i in. Poznanie tych oddziaływań jest nie¬ 
zbędne do pełniejszego zrozumienia szeregu własności 
fizycznych kryształów. 

W. Cochran The Dynamics cf Atoms in Crystals, New York 
1974; B. Donovan, J. F. Angress Lattice Vibrations, London 
1971; J. A. Reissland The Physics of Phonons , London 1973. 


Wzbudzenia elementarne w ciałach 
stałych 


Jerzy Czerwonko 

Ogólne pojęcie wzbudzenia 

Wyobraźmy sobie dowolny układ fizyczny o skwan- 
towanych poziomach energetycznych Ek (k — 0, 
1, 2 ...); załóżmy np., że Ek rośnie wraz z k. Układ 
może znajdować się w stanie podstawkowym, tj. w sta¬ 
nie o energii najniższej E 0y lub też w którymś ze sta¬ 
nów wzbudzonych, o energii Ek (k>Q). Energię 
energia Ek—E 0 {k> 0) nazywamy energią wzbudzenia. Jeśli 
wzbudzenia układ jest izolowany i znajduje się w którymś ze sta¬ 
nów o energii Ek (k = 1, 2, 3, ...),to pozostanie w tym 
stanie nieskończenie długo, ze względu na prawo za¬ 
chowania energii; stany wzbudzone układu będą więc 
stanami stabilnymi. Żaden z układów fizycznych nie 
jest jednak izolowany dokładnie, chyba że myślimy 
ewentualnie o tak skomplikowanym układzie fizycz¬ 
nym, jakim jest Wszechświat. (Owo „ewentualnie” 


ma dodatkowy sens, bowiem dla współczesnej ko¬ 
smologii kwestia izolacji Wszechświata nie jest by¬ 
najmniej sprawą trywialną). Jeśli rozpatrywany układ stabilność 
nie jest izolowany, a oddziaływanie układu z otoczę- stanów 
niem jest odstatecznie słabe, to stany wzbudzone nie wzbudzonych 
są stabilne — stabilny jest tylko stan podstawowy. 

Ten ostatni fakt można łatwo zrozumieć, jeśli się 
uwzględni, że prawo zachowania energii obowiązuje 
obecnie w układzie rozszerzonym: układ -f otocze¬ 
nie. Wobec tego, nawet przy dowolnie słabym oddzia¬ 
ływaniu z otoczeniem, układ w stanie wzbudzonym 
może oddać energię otoczeniu i przejść do stanu pod¬ 
stawowego. Z drugiej strony, przejście ze stanu pod¬ 
stawowego do wzbudzonego jest możliwe tylko wte¬ 
dy, gdy otoczenie może dostarczyć układowi w jed¬ 
nej chwili energię jEl —£<> lub większą, co jest osią¬ 
galne jedynie przy dostatecznie silnym oddziaływa- 
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niu. Jak widzimy, istnieje wyraźna analogia między 
stanem podstawowym a stanem równowagi trwałej 
i stanem wzbudzonym a stanem równowagi chwiejnej. 

Zgodnie z podstawowymi zasadami mechaniki 
kwantowej przejście układu ze stanu k do jakiegokol¬ 
wiek innego stanu nie odbywa się „na komendę”, lecz 
w sposób statystyczny. Przejście to można scharakte¬ 
ryzować średnim czasem przebywania w danym sta- 
wzbudzenia nie, zwanym inaczej średnim czasem życia danego 
dobrze stanu lub też czasem relaksacji z k . Przejściu ze stanu 
określone k >0 do stanu k = 0 odpowiada zmiana energii ukła¬ 
du o Ek — E 0 (której, zgodnie z mechaniką kwantową, 
odpowiada częstość v k = (E k -E 0 )lk, gdzie h jest 
stałą Plancka) oraz emisja fali o tej częstości (może 
to być np. fala elektromagnetyczna). Zwróćmy uwa¬ 
gę, że informacje o różnicy poziomów energii uzyskuje 
się wyłącznie na podstawie pomiaru częstości fal, jeśli 
włączyć tu również fale opisujące cząstki. Stąd, jeśli 
v k>\lz ki to jest możliwe określenie częstości fali w cza¬ 
sie życia poziomu (oscylacja w czasie życia poziomu 
zachodzi wielokrotnie), jeśli zaś częstość v k jest po¬ 
równywalna z 1 fik lub mniejsza, to częstości precy¬ 
zyjnie określić się nie da. Dlatego też nie powinno 
zaskakiwać nazwanie takich wzbudzeń, dla których 
vkTk > 1, tj. (Ek-E^ik^h, wzbudzeniami dobrze okre¬ 
ślonymi.^ Zwróćmy uwagę na związek powyższych 
rozważań z zasadą nieokreśloności dla energii, którą 
zapisać można w postaci AE At X, h/ln. 
analogia z Aby łatwiej uzmysłowić sobie sens warunku dobrej 
czystością określoności wzbudzeń, odwołajmy się do analogii 
dźwięku akustycznej, podanej przez twórcę cybernetyki N. 

Wienera. Jak wiadomo wysokość dźwięku jest zwią¬ 
zana z najniższą częstością w nim występującą czyli 
częstością podstawową. Dźwięk będzie czysty, jeśli 
oprócz tej częstości wystąpią w nim wyłącznie czę¬ 
stości harmoniczne będące wielokrotnościami czę¬ 
stości podstawowej. Aby można było wyczuć perio- 
dyczność związaną z częstością podstawową, tj. aby 
była ona „dobrze określona”, potrzeba, aby co naj¬ 
mniej tv>1, przy czym z to tym razem czas trwania 
dźwięku, v zaś — jego częstość podstawowa. Stąd też, 
jeśli \vłączyć dźwięk na czas krótszy niż okres drgań 
dźwięku, to odbierzemy wrażenie dźwięku nieczyste¬ 
go. Dlatego właśnie jest niemożliwe czyste zagranie 
polki czy taranteli przy wykorzystaniu dźwięków naj¬ 
niższych, np. przy grze na organach — włączanych 
pedałami. 


Układy wielu cząstek; cząstki Fermiego 

Wyobraźmy sobie obecnie ciąg poziomów energii 
Ek (k = 0, 1, 2, ...) takich, że E k +i>Ek przy />0. 
Poziomy te są ponadto niezwyrodniałe, tzn. każdemu 
poziomowi Ek odpowiada dokładnie jeden stan. Na 
poziomach tych mogą znajdować się cząstki podlega¬ 
jące statystyce Fermiego, oddziałujące ze sobą na 
tyle słabo, że energia E układu może być z dobrą do¬ 
kładnością zapisana jako 

EqN , 4- EiNi + E Z N Z -f- ... +E k Nk+ ..., 

gdzie A 0 , N u N z , Nk, ...» to liczby przybierające 
wartości zero lub jeden, a określające ile cząstek znaj¬ 
duje się na poziomach E 0 , E lt E 2 ,..., E k ,... (Ze wzglę¬ 
du na związek spinu ze statystyką, wynikający z re¬ 
latywistycznej kwantowej teorii pola, cząstki podle¬ 
gające statystyce Fermiego mają spin połówkowy, co 
oznacza, że w zerowym zewnętrznym polu magne¬ 
tycznym zwyrodnienie każdego poziomu jest pa¬ 
rzyste; podkreślmy jednak, że rozważamy sytuację 
modelową — brak zwyrodnienia). Jeśli liczba cząstek 
Fermiego jest ustalona, tzn. gdy N ? +N 1 +N 2 + 
... +Nk = N = const, to układ ma najniższą ener¬ 
gię przy N k = 1 dla k = 0, 1, 2, .... A-l i N k = 0 
dla k>N. Tak więc stany z N— 1 są obsadzone, 
a stany z k ^ A r są puste. Można również łatwo okre¬ 
ślić wzbudzenia podanego układu. Jeśli cząstkę ze 
stanu k^N—l przenieść do stanu ł^N, to energia 
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powstałego w ten sposób stanu będzie wyższa od ener- anty cząstki 
gii stanu podstawowego Eg = £ , 0 +£’ 1 +£ , 2 -F...4-£a- 1 a dziury 
° Ei—Eky przy czym Ei—E k musi być dodatnie przy 
l>k. Powstały stan można opisać następująco: w sta¬ 
nie k powstała antycząstka, w stanie / zaś — cząstka. 

Termin „antycząstka” użyty tu zgodnie z A. A. 

Abrikosowem, nie jest bynajmniej powszechny w li¬ 
teraturze naukowej; częściej używa się wówczas okre¬ 
ślenia „dziura”. Jest ono jednak mylące ponieważ, jak 
widać z powyższego, ujemność masy efektywnej, isto¬ 
tna przy określeniu dziury w teorii pasmowej (-> Dy¬ 
namika elektronu w ciałach stałych), nie była tu w ogó¬ 
le brana pod uwagę. Można powiedzieć, że jeśli anty¬ 
cząstka znajduje się tak blisko maksimum pasma 
walencyjnego, że jej masa efektywna jest ujemna, to 
jest dziurą. Pojęcie antycząstki jest więc pojęciem 
ogólniejszym od pojęcia dziury, z tym że antyczą¬ 
stki w półprzewodnikach, przy dostatecznie niskich 
temperaturach, są dziurami. 

Używając pojęcia cząstki i antycząstki można opi¬ 
sać wszystkie wzbudzenia rozpatrywanego układu 
o energii 

Eh+Ei 2 + ... +Ei s —Eki—Ek2 — Ek s 

przy /i, / 2 ,...,/«> N, i k u k Zi ...» k s ^N— 1 z cząstka¬ 
mi występującymi w stanach ł l9 / 2 ,..., / i antycząstka- 
mi w stanach k l9 k 2 , k 3 , ..., k 8 . Również wszystkie 
wzbudzenia układu nie oddziałujących ze sobą czą¬ 
stek Fermiego można opisać nie zakładając, że stany 
dla k = 0, 1, 2, ... są niezwyrodniałe, tj. podając zwy¬ 
rodnienie stanów, określane liczbami naturalnymi 
gk wyrażającymi, ile mamy stanów kwantowych 
o energii Ek. 

Związek między rozpatrywanym modelem a struk- związek ze 
turą elektronową ciał stałych jest dość oczywisty, strukturą 
Stanom zajętym w przedstawianym tu modelu, gdy elektronową 
energia całkowita ma najmniejszą wartość, odpo¬ 
wiadają stany spod powierzchni Fermiego w meta¬ 
lach i stany pasma walencyjnego w półprzewodni¬ 
kach; stanom pustym — stany znad powierzchni 
Fermiego i stany pasma przewodnictwa. 


Oddziałujące cząstki Fermiego; wzbudzenia 
elementarne; kwazicząstki 

Dotychczas zakładaliśmy, że cząstki z sobą nie od¬ 
działują, co może być jedynie przybliżeniem — gor¬ 
szym lub lepszym. Oddziaływanie cząstek prowadzi 
do wymiany energii między nimi. Wydzielmy myślo¬ 
wo jedną z cząstek układu; pozostałe potraktujmy 
jako jej otoczenie. Rozważania, podobne do przepro¬ 
wadzonych poprzednio, wykazują, że jeśli oddziały¬ 
wanie międzycząstkowe (a więc i oddziaływanie wy¬ 
dzielonej cząstki z otoczeniem) jest dostatecznie słabe, 
to spowoduje niewielkie przesunięcia poziomów ener¬ 
getycznych wydzielonej cząstki, a także ich niestabil- średni czas 
ność. Poziomom energetycznym cząstki można więc życia pozio- 
przypisać średni czas życia. Analogicznie, przy do- mów energe- 
statecznie słabych oddziaływaniach poziomy jedno- tycznych 
cząstkowe, a więc wzbudzenia układu, będą dobrze 
określone. 

Z drugiej strony, trudno jednak oprzeć się wrażeniu, 
że kryterium słabości oddziaływania cząstek między 
sobą rzadko jest spełnione w ciałach stałych. Aby to 
uzasadnić, rozpatrzmy np. elektrony przewodnictwa 
w metalu. Wiadomo z teorii pasmowej, że oddziały¬ 
wanie z jonami zmienia w sposób zasadniczy własno¬ 
ści elektronów przewodnictwa, np. ich masy efek¬ 
tywne. Oddziaływanie to ma charakter głównie elek¬ 
trostatyczny, czyli jest określone przez średnią od¬ 
ległość pomiędzy elektronem i jonem. Elektrony od¬ 
działują ze sobą również elektrostatycznie, a że jest 
ich mniej więcej tyle samo co i jonów, więc średnia 
odległość między elektronami będzie zbliżona do 
średniej odległości między elektronem i jonem. Dzięki 
temu, oddziaływanie elektronów między sobą po¬ 
winno być wielkością tego samego rzędu co oddziały- 
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wanie elektronów z jonami, które modyfikuje w spo¬ 
sób zasadniczy własności układów elektronów. Od¬ 
działywanie elektron-elektron powinno zatem istot¬ 
nie modyfikować własności układów elektronów. 

Powstaje pytanie, czy w warunkach występujących 
w ciałach stałych można w ogóle mówić o dobrze 
określonych wzbudzeniach. Okazuje się, że można, 
i że na przykład cząstka i antycząstka w metalach le¬ 
żące dostatecznie blisko powierzchni Fermiego, tj. 
o energiach bliskich energii Fermiego £>, tak że ener¬ 
gia cząstki lub antycząstki E spełnia nierówność 
\E—Ef\<Ef, są typowymi przykładami wzbudzeń 
dobrze określonych. Podobnie przedstawia się z re¬ 
guły sprawa z elektronami i dziurami w półprzewod¬ 
nikach, jeśli mamy do czynienia ze wzbudzeniami po¬ 
łożonymi odpowiednio blisko ekstremów pasm. Dla¬ 
czego tak jest? Wyjaśnijmy ten fakt na przykładzie 
elektronów w metalu. Jak wiadomo, pod powierzch¬ 
nią Fermiego znajdują się stany zajęte przez elektro¬ 
ny, ponad nią — stany puste. Elektron można opisać 

podając liczby kwantowe kwazipędu p , energii oraz 
pasma, do którego należy elektron. Oddziaływanie 
międzyelektronowe prowadzi do rozpraszania elek¬ 
tronów na elektronach, tj. do przekazywania sobie 
nawzajem przez elektrony energii i kwazipędu. W każ¬ 
dym akcie rozpraszania musi być zachowana całko¬ 
wita energia oraz całkowity kwazipęd elektronów 
(dokładniej — kwazipęd musi być zachowany z do¬ 
kładnością do wektora sieci odwrotnej pomnożonego 
przez stałą Plancka). Ponadto elektrony — ze względu 
na zasadę Pauliego — muszą trafić po rozproszeniu 
do stanów nie zajętych przez elektrony. 

Ów akt rozpraszania można, zgodnie z podstawami 
mechaniki kwantowej, ująć również w sposób sta¬ 
tystyczny. Mianowicie, prawdopodobieństwo roz¬ 
proszenia określonego stanu w jednostce czasu, od¬ 
wrotnie proporcjonalne do średniego czasu życia da¬ 
nego stanu, będzie tym większe, im więcej jest stanów 
końcowych, w które może przejść dany stan. Aby 
uściślić te rozważania załóżmy, że na kwazipęd narzu¬ 
cono warunki Borna-Kdrmńna (-*• Struktura elek¬ 
tronowa ciał stałych), tj. że 

p x — hn x (L y p y = hn y /L,p z = hn z /L , 

przy czym h jest stałą Plancka, L — długością krawę¬ 
dzi sześciennej kostki kryształu, p x , py, Pz — składo¬ 
wymi pędu elektronu odpowiednio w kierunku *, y 9 r, 
zaś n x , n y > n z —liczbami całkowitymi leżącymi w prze¬ 
dziale -A/2+1, A/2, gdzie A 3 jest liczbą komórek 
w krysztale. Załóżmy, że zależność energii od pędu 
jest najprostsza, tj. 

E(pz, p» f Pz) = (Pl+Pl+Pl)l2m*> 

przy czym m* jest masą efektywną. Niech stan pod¬ 
stawowy układu będzie scharakteryzowany przez ob¬ 
sadzenie wszystkich stanów z 


czyli 


Pl+Pi+Pi < Pb 
n l+ n l+ n l < L* P ph 2 


i nieobsadzenie wszystkich pozostałych stanów; za¬ 
łóżmy dodatkowo, że L 2 p F /h 2 <N 2 l4 po to, aby wszy¬ 
stkie stany obsadzone mieściły się w strefie Brillouina. 
Cząstki jako wzbudzenia będą występowały przy 
nl+n*+r%>L*Pflh* 9 antycząstki zaś —przy nierów¬ 
ności odwrotnej. Niech w układzie znajduje się czy¬ 
stka z liczbami n x , n y , n z oraz antycząstka z n x , n y , n z .. 
Jeśli w wyniku rozproszenia mamy otrzymać również 
cząstkę z m x> m Vy m z oraz antycząstkę z m x , m y > m z to 
jako rezultat praw zachowania pędu i energii mamy: 
n — n ' = m —mi itd. dla składowych y i z, oraz 

— Nietrudno zauważyć, że im bardziej 
w^+/iy+rt® oraz n 2j rn 2 +ń* odległe są od L z p z F fh\ 
tj* od powierzchni Fermiego, tym większe są możli¬ 


wości wyboru liczb m x> m v , m z oraz m ? , m y9 m z . Do¬ 
kładniejsza analiza wykazuje, że liczba stanów, 
w które może przejść cząstka czy też antycząstka 
o energii E , jest proporcjonalna do Ef( 1 — E/E f )\ 
gdzie Ef = P%l2m * jest energią Fermiego. 

Dotychczas nie określaliśmy energii wzbudzeń 
cząstki czy też antycząstki, zawsze określano energię 
wzbudzenia układu złożonego z cząstek i antyczą- 
stek. Właściwą definicję energii wzbudzenia pojedyn- energia 
czego otrzymamy, jeśli będziemy dążyli z energiami wzbudzenia 
wszystkich wzbudzeń, z wyjątkiem jednego, do ener- pojedynczego 
gii £>, tzn. do niewzbudzania innych antycząstek — 
lub cząstek. W efekcie da to Ejc-Ef dla cząstek 
i Ef-Ejc dla antycząstek, co można zapisać jako 
| Ek — Ef\ • Porównanie energii wzbudzenia z przyto¬ 
czonym wyżej rzędem wielkości odwrotności czasu 
życia wskazuje, że przy |£—£>| > Ef wzbudzenia po¬ 
winny być dobrze określone. Dla rozpatrywanego 
przez nas izotropowego modelu energie wzbudzeń 
układu cząstka-antycząstka będą dane w obszarze 
energii, w którym wzbudzenia te są dobrze określone 
(przy pxpf\ przez 

E p = \p*-p* F \l2m* = \p-pp\ (p+PF)l2m*x 
X \P-Pf\V* 

gdzie V = pfItti * nazywa się prędkością cząstek na 
powierzchni Fermiego. Co więcej, nawet dla układów 
silnie oddziałujących, dowolne wzbudzenie o odpo¬ 
wiednio małej energii — w skali Ef — da się zestawić pojęcie wzbu- 
z określonych wyżej cząstek i antycząstek, co znaczy, dzenia e!e- 
że są to wzbudzenia elementarne. W takim sensie bę- mentarnego 
dziemy używali tego pojęcia również dla innych 
układów fizycznych. Nadmieńmy, że przedstawione 
rozważania dotyczą nie tylko rozpatrywanego tutaj 
jako przykład układu izotropowego. Dodajmy rów¬ 
nież, że sprawa wzbudzeń elementarnych staje się 
bardziej skomplikowana w wypadku elektronów 
w nadprzewodnikach, mimo iż podział wzbudzeń 
elementarnych na cząstki i antycząstki pozostaje aktu¬ 
alny. 

Przedstawiony wyżej mechanizm rozpraszania czą¬ 
stek Fermiego na sobie, a więc m.in. elektronów na 
elektronach w ciałach stałych, nie jest jedynym me¬ 
chanizmem prowadzącym do powstania niestabil¬ 
ności wzbudzeń elementarnych. Innym mechanizmem 
jest np. rozpraszanie na kwantach drgań sieci (a więc 
fononach) oraz domieszkach i wszelkiego rodzaju 
niedoskonałośoach struktury kryształu. Niemniej 
jednak, działanie dodatkowych mechanizmów roz¬ 
praszania nie sprawia, przynajmniej dla dostatecznie 
czystych i pozbawionych defektów kryształów, że 
wzbudzenia przestają być dobrze określone dla wzbu¬ 
dzeń o dostatecznie niskiej energii. Rozpatrywano 
tu również wzbudzenia ze stanu podstawowego, 
w którym układ znajduje się jedynie w temperaturze 
zera bezwzględnego, jak wiadomo — nieosiągalnej. 

Okazuje się jednak, że sytuacja pozostaje jakościowo wpływ tem- 
niezmieniona, dopóki temperatura bezwzględna w peratury na 
skali energetycznej kT (& — stała BoJtzmanna) jest określoność 
dostatecznie niska. Warto przy tym zwrócić uwagę, wzbudzenia 
że stwierdzenie, czy kT jest małe, nie jest sprawą tak 
prostą jak dla wielkości bezwymiarowej. W tym wy¬ 
padku określenie niska czy też wysoka temperatura 
zależy od rozpatrywanego układu jak i rozpatrywane¬ 
go zjawiska. Jeżeli oddziaływanie elektronów z fo¬ 
nonami można pominąć, to w metalach jedyną wiel¬ 
kością o wymiarze energii, określającą układ elektro¬ 
nów jest Ef , przy czym EF/k « 5-10 4 K(-►Metale), 
a więc dla metali wystarczy niekiedy spełnić nierów¬ 
ność T<ą 5-10 4 K. 

Jeśli rozpatrywać bardziej skomplikowane zależ¬ 
ności energii elektronów od wektora kwazipędu 
i uwzględniać, że może być więcej pasm częściowo 
zapełnionych, to model gazu nieoddziałujących elek¬ 
tronów opisuje dobrze jakościowo, a niekiedy i ilo¬ 
ściowo, własności elektronowego układu metali, mi¬ 
mo że oddziaływanie elektronów między sobą jest 
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mniej więcej tak samo silne jak oddziaływanie elek¬ 
tronów z siecią krystaliczną. Jest w ogóle rzeczą za¬ 
dziwiającą, jak bardzo przydaje się model idealnego 
gazu kwantowego (Fermiego lub Bosego) przy opisie 
niskotemperaturowych własności wielu układów 
fizycznych z silnym oddziaływaniem. Fakt ten wyjaś¬ 
niono dopiero na gruncie kwantowej teorii wielu ciał 
w latach pięćdziesiątych; wyjaśnienie to było właści¬ 
wie oparte na rozważaniach analogicznych do prze¬ 
prowadzonych rozważań czasów życia poziomów an- 
tycząstkowych i cząstkowych w pobliżu powierzchni 
Fermiego. Niezależnie od tego nie należy sobie wy¬ 
obrażać, że wzbudzenie w układzie silnie oddziałują¬ 
cych cząstek Fermiego polega na przesunięciu realnej 
cząstki spod powierzchni Fermiego nad tę powierzch¬ 
nię należy to rozumieć w ten sposób, że istnieje wza- 
kwazicząstki jemnie jednoznaczna odpowiedniość pomiędzy wzbu- 
i kwazianty- dzeniami realnego układu i wzbudzeniami idealnego 
cząstki układu nieoddziałujących cząstek, pod warunkiem, 
że wzbudzenia mają dostatecznie niską energię. Dla¬ 
tego też słuszniejsze jest nazwanie tych wzbudzeń 
realnego układu odpowiednio kwazicząstkami lub też 
kwaziantycząstkami, a ogólnie — kwazicząstkami. 
Koncepcja kwazicząstek, uzasadniona tutaj w odnie¬ 
sieniu do układów cząstek Fermiego, znajduje po¬ 
wszechne zastosowanie we współczesnej fizyce fazy 
skondensowanej, a więc i ciała stałego. Mówiąc ogól¬ 
nie, kwazicząstki to wyidealizowany układ gazowy, 
którego wzbudzenia o niskiej energii odpowiadają 
we wzajemnie jednoznaczny sposób wzbudzeniom 
układu realnego. Koncepcja kwazicząstek jest kon¬ 
cepcją naczelną w dalszej części tego artykułu. 


Trochę o fononach; 

wzbudzenia w kryształach kwantowych 


fonony 


kryształy 

kwantowe 


Dotychczas rozpatrywaliśmy wyłącznie wzbudzenia 
układów cząstek Fermiego, przy czym wzbudzenia 
ich podlegały również statystyce Fermiego. Nasze 
rozważania pozwoliły na wprowadzenie ogólnej kon¬ 
cepcji kwazicząstki. Charakterystycznym przykładem 
kwazicząstek typu Bosego, i to niezależnie od sta¬ 
tystyki atomów tworzących kryształ, są fonony. 
(Omówiono je w artykule „Dynamika sieci krysta¬ 
licznej”)- Wiadomo stamtąd, że w przybliżeniu har¬ 
monicznym fonony są stabilne, tzn. że ich liczba przy 
ustalonym wektorze falowym i polaryzacji jest stała 
w czasie. Wiadomo również, że efekty anharmoniczne 
prowadzą do niestabilności fononów i, z drugiej stro¬ 
ny, również do przesunięcia ich poziomów energii, 
przy czym wzbudzenia są w dalszym ciągu dobrze 
określone, zaś zmiany poziomów energetycznych nie¬ 
wielkie, jeżeli człony anharmoniczne są dostatecznie 
słabe. Jest to spełnione przy dostatecznie małej ampli¬ 
tudzie drgań atomów, tj. gdy A<^a, przy czym A jest 
amplitudą drgań, zaś a — stałą sieci. Jeśli mechanika 
klasyczna opisywałaby kryształ, to odpowiednio małe 
amplitudy zgadzałyby się z odpowiednio małymi ener¬ 
giami wzbudzeń, przy zerowym wzbudzeniu ampli¬ 
tuda byłaby zerowa. Dlatego też, przy dostatecznie 
niskich temperaturach, człony anharmoniczne byłyby 
pomijalnie małe. Do tego ujęcia wnosi istotne „ale” 
kwantowość zjawiska, ze względu na drgania zerowe 
atomów, zachodzące nawet w temperaturze zera bez¬ 
względnego. Jeżeli ich amplituda jest znacznie mniej¬ 
sza od stałej sieci a , to jesteśmy bliscy obrazu klasycz¬ 
nego i przy odpowiednio niskich temperaturach przy¬ 
bliżenie harmoniczne ma sens. Jeżeli jednak ta ampli¬ 
tuda jest porównywalna za — to przybliżenie harmo¬ 
niczne nie będzie dobre nawet w temperaturze zera 
bezwzględnego; ten rodzaj kryształów nazywa się 
kryształami kwantowymi. Typowym przykładem kry¬ 
ształów kwantowych są kryształy obydwu izotopów 
helu, o masach atomowych 3 i 4; kryształy takie istnie¬ 
ją w temperaturach rzędu paru stopni Kelvina, przy 
ciśnieniach powyżej 25 hPa ( 4 He) i 30 hPa ( 3 He). 
Ogólnie — im mniejsza masa atomowa, tym większa 


tendencja do kwantowości kryształu; tendencję tę 
można ocenić jakościowo nawet przy użyciu modelu 
harmonicznego, jeśli obliczyć amplitudę drgań zero¬ 
wych. 

Ponieważ dla kryształów niekwantowych model 
harmoniczny powinien być dobry przy odpowiednio 
niskich temperaturach, a w modelu harmonicznym fo¬ 
nony są stabilne — więc przy tak niskich tempera¬ 
turach wzbudzenia będą dobrze określone dla wszy¬ 
stkich wektorów falowych k i polaryzacji X. Podobna 
sytuacja może wystąpić również wówczas, gdy efekty 
anharmoniczne są istotne, a więc przy wyższych tem¬ 
peraturach, bądź też dla kryształów kwantowych. 
W tych obydwu wypadkach fonony również istnieją, 
choć przejawiają bardziej złożoną, bardziej kwazi- 
cząstkową strukturę. Warto dodać, że niezależnie od 
struktury kwazicząstek fononowych, z faktu że liczba 

fononów w danym stanie (k, X) może być nieograniczo¬ 
na, wynika, że są to cząstki Bosego, niezależnie od 
statystyki atomów kryształu. 

Pozostańmy nadal przy kryształach kwantowych. 
Odmienny charakter wzbudzeń fononowych nie jest 
ich jedyną cechą specyficzną. Odmiennie niż w innych 
niekwantowych kryształach przebiega tam również 
proces dyfuzji. Jest to proces samodyfuzji, czyli przy¬ 
padkowego błądzenia atomów wśród pozostałych 
atomów kryształu, identycznych z błądzącymi. Ato¬ 
my błądzące wykorzystują przy tym głównie istnienie 
niezajętych miejsc w sieci krystalicznej, zwanych lu¬ 
kami. Dyfuzja polega na zajęciu luki przez sąsiedni 
atom, co tworzy lukę w odpowiednim sąsiednim węźle, 
kolejnym zajęciu tej luki przez sąsiedni atom, co po¬ 
woduje powstanie luki w nowym miejscu, itd. Jeśli 
potraktować lukę jako antycząstkę (str. 558, zwróćmy 
uwagę, że tam była mowa o poziomach energetycz¬ 
nych, tu zaś o miejscach w sieci) to można cały proces 
opisać jako dyfuzję luki (rys. 1). 

Wszystkie czyste substancje, poza 3 He i 4 He, w od¬ 
powiednio niskich temperaturach przechodzą w stan 
stały, również przy zerowym ciśnieniu zewnętrznym. 
Wynika stąd, że kryształ z wszystkimi węzłami regu¬ 
larnej sieci krystalicznej zajętymi przez atomy ma 
najniższą energię. Powoduje to powstanie barier 
energii potencjalnej między węzłami sieci. Bariery 
takie uniemożliwiają przeskok atomu do sąsiedniego 
miejsca, nawet jeżeli jest tam luka, dopóki atom nie 
uzyska, dzięki wzbudzeniu termicznemu energii wy¬ 
starczającej do pokonania bariery potencjału. Obni¬ 
żaniu temperatury towarzyszy zatem zmniejszanie się 
możliwości zarówno tworzenia luk, jak i pokonywa¬ 
nia bariery potencjału, a więc zmniejszanie się współ¬ 
czynnika dyfuzji. (Rozważania te są słuszne przy trak¬ 
towaniu atomu niekwantowo). Mechanika kwantowa 
dopuszcza również, oprócz dozwolonego klasycznie 
skoku nad barierą potencjału, tunelowe przejście 
przez barierę, tj. przejście atomu o energii mniejszej 
od wysokości bariery. Efekty kwantowe są oczywiście 
tym istotniejsze, im dyfundujący atom jest lżejszy 
(nikt bowiem dotychczas — nie bez racji — nie kwan¬ 
tował równania ruchu beczek). Stąd, ten podbarie- 
rowy mechanizm dyfuzji kwantowej, dotyczy, jeśli 
nie brać pod uwagę nierozsądnie małych prawdopo¬ 
dobieństw, jedynie atomów najlżejszych, takich jak 
izotopy helu o liczbie masowej 3 i 4 (wodór z reguły 
nie występuje w postaci atomowej, zaś jego cząstecz¬ 
ka, ze względu na rozmiary, dyfunduje w sposób 
utrudniony). Do dyfuzji jest jednak potrzebne wystę¬ 
powanie luk, które powinny zanikać przy zerowej 
temperaturze bezwzględnej. Czy zatem brak luk 
w kryształach 3 He i 4 He w dostatecznie niskich tem¬ 
peraturach powstrzymuje opisany tutaj proces pod- 
barierowy? Okazuje się, że nie. Rzecz w tym, że zdol¬ 
ność luki do dyfundowania pod barierą potencjału 
może prowadzić do istnienia luk w równowagowym 
krysztale kwantowym nawet w zerowej temperaturze 
bezwzględnej. Spróbujmy wykazać tę możliwość. 

Dla luki kwantowej, mogącej swobodnie dyfundo- 
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Rys. 1. Kolejne eta¬ 
py dyfuzj'i luki w 
kwadratowej sieci 
płaskiej 
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wać, kryształ jest periodycznym polem sił. Ruch w ta¬ 
kim polu opisuje pasmowa teoria ciał stałych. Ener¬ 
gia luki ulega rozszczepieniu w całe pasmo energe¬ 
tyczne, a stan kwantowy luki jest opisywany przez 
wektor kwazipędu. Przy dostatecznie silnym roz¬ 
szczepieniu energii luki, dno pasma może znaleźć się 
poniżej najniższej energii kryształu bez luk — i wtedy 
wytworzenie pewnej liczby luk staje się energetycznie 
dogodne. Popatrzmy na rys. 2 ilustrujący tę możli¬ 
wość. Jego lewa część przedstawia sytuację klasycz¬ 
ną. Energia E 0 oznacza energię kryształu bez luk, 
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E x — energię kryształu z jedną luką. W wyniku dy¬ 
fuzji podbarierowej poziom E x rozszczepia się w całe 
pasmo dozwolonych energii o maksimum i mini¬ 
mum £', co pokazuje prawa część rysunku. Jeśli dno 
pasma znajdzie się poniżej E<> (energia E[ < E 0 ), to 
wytworzenie pewnej liczby luk staje się energetycznie 
dogodne. Dzięki temu luki powinny się znajdować 
również w równowagowym krysztale przy zerowej 
temperaturze bezwzględnej. Należy dodać, że przy 
określaniu struktury takich kryształów nie stwierdzo¬ 
no by istnienia zlokalizowanych luk, byłyby więc one 
„rozmazane” po całym krysztale. Można powiedzieć, 
że funkcja rozkładu gęstości atomów w krysztale 
byłaby nadal periodyczna, z tym że prawdopodobień¬ 
stwo znalezienia atomu w węźle sieci krystalicznej 
byłoby mniejsze od jedności. Ponieważ luki kwantowe 
opisuje teoria pasmowa, można więc stanowi luki 
przypisać wektor kwazipędu. Taka luka jest specy- 
luka jako ficzną kwazicząstką, której występowanie jest charak- 
kwazicząstka terystyczne dla kryształów kwantowych. 

Prawdopodobieństwo dyfuzji kwantowej maleje 
wraz ze wzrostem temperatury, głównie ze względu 
na zderzenia luk z fononami. Dzięki podobnemu 
mechanizmowi zderzeń elektronów z fononami opór 
elektryczny metali maleje wraz z temperaturą. Dla 
kryształów kwantowych, w których luki istnieją rów¬ 
nież w zerze bezwzględnym, współczynnik dyfuzji 
(analog przewodnictwa, nie zaś oporu metali) powi¬ 
nien wzrastać ze spadkiem temperatury, przy dosta¬ 
tecznie niskich temperaturach — gdy dyfuzja kwan¬ 
towa odgrywa główną rolę. Jest to akurat odwrotnie 
niż przy normalnej dyfuzji, dla której, wraz ze wzro¬ 
stem temperatury, wzrasta zarówno liczba wytwo¬ 
rzonych luk jak i prawdopodobieństwo nadbariero- 
wego wzbudzenia atomów, a więc i współczynnik dy¬ 
fuzji. Dlatego współczynnik dyfuzji, malejący wraz 
z temperaturą przy odpowiednio wysokich tempera¬ 
turach, staje się rosnącą funkcją temperatury przy 
temperaturach odpowiednio niskich. Fakt ten, nie¬ 
zrozumiały w klasycznym modelu dyfuzji, został po¬ 
twierdzony doświadczalnie na kryształach helu. 

Omówiona luka kwantowa nie jest jedyną kwazi¬ 
cząstką mogącą występować w kryształach kwanto¬ 
wych. Mogą tu również wystąpić stany związane dwu 
lub więcej luk; podobnie, lekki atom domieszki 
w międzywęźlu kryształu kwantowego, dzięki zja¬ 
wisku tunelowemu, zachowuje się jak kwazicząstka, 
której można przypisać kwazipęd. Dodajmy jeszcze, 
że podany tu opis dyfuzji w krysztale kwantowym 
i związanych z tym wzbudzeń został zaproponowany 
przez I. M. Lifszyca i A. F. Andrejewa. 


Plazmony 

Aby zrozumieć wzbudzenia plazmowe rozważmy 
ekranujące działanie elektronów. Mechanizm tego 
zjawiska jest niezwykle prosty. Wyobraźmy sobie, że 


do elektrycznie obojętnego ośrodka zawierającego ekranowanie 
elektrony swobodne, w takim np. sensie jak elektrony statyczne i 
w metalu, wprowadzono nadmiarowy ładunek do- dynamiczne 
datni. Ładunek ten przyciąga elektrony, dzięki czemu 
ich gęstość w otoczeniu ładunku jest coraz większa. 

Inne cząstki naładowane, a więc jony, mają znacznie 
większą masę i są zlokalizowane, wobec czego zmiana 
gęstości ich ładunku jest znacznie trudniejsza. Wzrost 
ładunku w pobliżu ładunku wprowadzonego kom¬ 
pensuje jego działanie na dużych odległościach. Po¬ 
dany mechanizm ekranowania statycznego może ulec 
istotnej modyfikacji, gdy wprowadzony nadmiarowy 
ładunek porusza się — mówimy wtedy o ekranowaniu 
dynamicznym. Jeśli wprowadzony nadmiarowy ła¬ 
dunek jest ładunkiem ujemnym, to elektrony zostają 
odepchnięte. Wokół wprowadzonego ładunku po¬ 
wstaje nadmiar ładunku dodatniego, który z kolei 
przyciąga elektrony itd., co przekonuje nas, że me¬ 
chanizm ekranowania działa również w stosunku do 
ładunków ujemnych. 

Wyobraźmy sobie teraz, że nadmiarowy ładunek, 
np. dodatni, został nagle wprowadzony do ośrodka. 

Przyciągane przez ten ładunek elektrony zaczęły się 
poruszać w jego kierunku. Po nabraniu pewnej pręd¬ 
kości elektrony będą miały skłonność do poruszania 
się na większą odległość, niż wynikałoby to z ich rów¬ 
nowagowego rozkładu w obecności ładunku nadmia¬ 
rowego. Ulegną one z kolei działaniu sił elektrosta¬ 
tycznych działających w przeciwnym kierunku. I zno¬ 
wu, ze względu na niezerową prędkość poruszania się 
i bezwładność elektronów, będą one miały skłonność 
do dotarcia za daleko. Powtarzanie się tego mecha¬ 
nizmu prowadzi do pojawienia się drgań zwanych drgania 
drganiami plazmy; ich mechanizm jest nierozerwalnie plazmy 
związany z ekranowaniem. 

Spróbujmy otrzymać wzór na częstość tych 
drgań. W tym celu założymy, że ładunek dodatni, 
który ma znacznie mniejsze możliwości poruszania 
się niż elektrony, jest całkowicie nieruchomy i że został 
jednorodnie „rozmazany’’ po całym krysztale. 

Pierwsze z tych założeń jest idealizacją istniejącego 
stanu, drugie zaś związane jest z faktem, że interesują 
nas wzbudzenia o bardzo długiej fali, dla których 
niewielkie (w skali atomowej) niejednorodności roz¬ 
kładu ładunku nie odgrywają żadnej roli. Załóżmy 
również, że nierównowagowy rozkład ładunku został 
spowodowany przez przesunięcie naładowanej war¬ 
stwy o grubości d na niewielką odległość x (x < d, 
rys. 3). 



I i 

Rys. 3 w*- d - >\ 

Warstwa taka zachowuje się jak kondensator płaski. 
Powstaje przy tym stałe pole elektryczne <5, działające 
w takim kierunku, aby przywrócić elektryczną obo¬ 
jętność całej warstwy. Natężenie pola elektrycznego 
określa wzór 

ć = —4nNex, 

w którym N jest koncentracją, tj. liczbą elektronów 
swobodnych w jednostce objętości, ae — ładunkiem 
elektronu. Nazwa „elektrony swobodne” została tu 
użyta nie dla określenia elektronów nieoddziałujących 
ze sobą, ale elektronów mogących swobodnie przepły¬ 
wać. Wzór na natężenie pola elektrycznego wynika 
ze wzoru na pojemność kondensatora płaskiego przy 
uwzględnieniu, że gęstość ładunku powierzchnio¬ 
wego na obu okładkach kondensatora wynosi odpo- 
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wienio ± Nex . Ruch elektronu wewnątrz warstwy 
opisuje równanie 

ma — eć, czyli m(d 2 x/dt 2 ) = —4nNe 2 x, 

w którym m jest masą elektronu. Jego rozwiązaniem 
jest ruch harmoniczny o częstości 

«>*, = (4nNe 2 /m) lf2 t 

zwanej częstością plazmową. Wzbudzenia gęstości 
elektronów swobodnych, w podanym wyżej sensie, 
częstość wzywamy plazmonami. Jako kwazicząstki będące 
plazmonów wynikiem kwantowania ruchu oscylatora podlegają 
one statystyce Bosego. Proste oszacowanie wielkości 
/ift> P /2jc przy założeniu koncentracji elektronów cha¬ 
rakterystycznych dla metali pokazuje, że jest ona 
rzędu energii Fermiego. Nie jest to więc wzbudzenie 
nisko leżące i jego wzbudzenie termiczne jest wysoce 
nieprawdopodobne, ponieważ kT <ś Ef , aż do tem¬ 
peratury topnienia metalu włącznie. Dlatego też sta¬ 
tystyka tych wzbudzeń nie odgrywa istotnej roli przy 
termicznym wzbudzeniu plazmonów, ponieważ kwe¬ 
stia, czy w danym stanie może istnieć jeden plazmon 
czy więcej, w sytuacji gdy ich prawie zupełnie nie ma, 
jest raczej pytaniem akademickim. Zdanie to nie su¬ 
geruje bynajmniej, że plazmony nie są obserwowane, 
wzbudzają się one np. przy przechodzeniu cząstek 
naładowanych przez metal, lub też przy odbiciu od 
jego powierzchni. Eksperymenty takie wykazują, że 
plazmony są z reguły wzbudzeniami dobrze określo¬ 
nymi. 

Dotychczasowe rozważania dotyczyły sytuacji gra¬ 
nicznej — długich fal, czyli zerowej wartości wektora 
falowego. Wnikliwsza analiza wykazuje, że częstość 
plazmonów zależy od wektora falowego, a więc, że 
plazmony podlegają dyspresji. Główna poprawka do 
wyrażenia na co p ma następującą postać w granicy 
długofalowej: yhk 2 /2nm 9 gdzie k 2 oznacza kwadrat 

długości wektora k 9 a y jest wielkością bezwymiarową 
rzędu jedności (y « 0,5 dla Be, Mg i Al). Warto do¬ 
dać, że w teorii uwzględniającej oddziaływanie elek¬ 
tronów między sobą, otrzymuje się również wyrażenie 

na (o p przy k = 0 takiej samej postaci, ale tym razem 
m oznacza masę krystaliczną elektronu, zależną od 
oddziaływania elektronu z siecią krystaliczną, a nie¬ 
zależną od oddziaływania między elektron owego. 

Przy opisie plazmonów powoływaliśmy się głównie 
na przykłady wzbudzeń w metalach. Jednak wzbudze¬ 
nia takie istnieją we wszystkich ciałach stałych za¬ 
wierających swobodne nośniki, a więc również w pół¬ 
przewodnikach. Warto zastanowić się w tym miejscu 
elementar- nac * elementarnością wzbudzeń. Dla wzbudzeń w fa- 
ność z * e skondensowanej, a więc w ciele stałym lub w cie- 
wzhudzeń czac h kwestia ta, podobnie jak elementamość w fizyce 
cząstek, nie jest raz na zawsze rozwiązana, całkowicie 
jednoznaczna i nie sprawiająca kłopotów. Zapropo¬ 
nowane tutaj kryterium elementarności wzbudzeń 
zwraca uwagę na dwa aspekty zagadnienia — na 
niemożność złożenia danego wzbudzenia z pewnych 
innych wzbudzeń oraz — możliwość występowania 
wzbudzenia w innych, bardziej złożonych wzbudze¬ 
niach. W szczególności, jeśli przy tworzeniu takiego 
wzbudzenia istotne jest oddziaływanie między wzbu¬ 
dzeniami składającymi się na nie i we wzbudzeniu tym 
bierze udział duża liczba wzbudzeń składowych, to 
wzbudzenie takie nazywa się kolektywnym. Nietrud¬ 
no zauważyć, że kwazicząstki elektronowe i fonony 
wzbudzenia s 3 wzbudzeniami elementarnymi. Jeśli mowa o plaz- 
koiekty wne monac ^» to można je traktować jako wzbudzenia ko¬ 
lektywne, złożone z elementarnych wzbudzeń kwazi- 
cząstkowych i kwaziantycząstkowych. Przytoczone 
klasyczne wyprowadzenie wyrażenia na częstość plaz¬ 
mową ani nie potwierdza, ani nie odrzuca tego punktu 
widzenia. Warto jednak zwrócić uwagę na to, że do¬ 
wolna, dostatecznie długofalowa zmiana gęstości 
przestrzennej elektronów może być wywołana powsta¬ 
niem przewagi kwazicząstek w jednym obszarze 
przestrzennym, kwaziantycząstek zaś — w innym, 

562 


oraz na dominującą rolę oddziaływania elektronów 
przy drganiach plazmy. Mówienie o kwazicząstkach, 
czy też o kwaziantycząstkach wymaga dostatecznie 
dobrego rozróżnienia ich kwazipędu, aby można było 
stwierdzić, czy są to wzbudzenia spod, czy też znad 
powierzchni Fermiego, czyli Ap musi być znacznie 
mniejsza od pędu Fermiego pf ~ hja, gdzie a jest 
stałą sieci. Z drugiej strony Ax Ap ^ hjAn zgodnie 
z zasadą nieokreśloności, co daje razem oszacowanie 
rozmiarów liniowych wspomnianych obszarów prze¬ 
strzennych: Ax > a. Ponadto, jeśli mamy precyzyjnie 
określać rozchodzenie się fali, to Ax musi być wyraźnie 
mniejsze od długości fali A, a więc jeśli X $> a 9 to opis 
mikroskopowy, w języku kwazicząstek elektrono¬ 
wych, jest równoważny opisowi makroskopowemu 
w języku zmiany gęstości przestrzennej elektronów. 


Ekscytony i polarony 

Omówimy pokrótce jeszcze dwa rodzaje wzbudzeń — 
ekscytony i polarony, które z punktu widzenia po¬ 
danej tu definicji nie są wzbudzeniami elementarnymi, 
mimo iż ekscytony często zalicza się do wzbudzeń 
elementarnych. Ekscytony są stanami związanymi 
elektronu i dziury; występują one głównie w półprze¬ 
wodnikach, półmetalach i kryształach molekular¬ 
nych. Natomiast polarony, będące stanami związa¬ 
nymi elektronu lub dziury z paroma fononami, wy¬ 
stępują z reguły w kryształach jonowych i półprze¬ 
wodnikach polarnych. W tym ostatnim wypadku pola- 
ron powstały z elektronu i polaron powstały z dziury 
mogą związać się również w specyficzny ekscyton. ekscyton 
Wyobraźmy sobie elektron i dziurę. Dziurze można 
przypisać ładunek przeciwny do ładunku elektronu, 
stąd elektron i dziura będą się przyciągały. Załóżmy 
na chwilę, że periodyczne pole kryształu nie istnieje. 

Wtedy ruch elektronu i dziury można rozłożyć na 
dwie składowe: ruch środka masy—jednostajny 
i prostoliniowy — oraz ruch względny. Przy działaniu 
siły przyciągania kulombowskiego ruch względny 
może odbywać się po elipsie, paraboli i hiperboli. 

W ostatnich dwóch sytuacjach cząstki oddalają się 
nieograniczenie od siebie, co odpowiada stanowi nie- 
związanemu. Przy ruchu eliptycznym odległości mię¬ 
dzy cząstkami są ograniczone od góry; taki ruch pod¬ 
lega kwantowaniu identycznemu jak w wypadku 
atomu w-odoru. Może tu wprawdzie zabraknąć, mimo 
lekkich elektronów i ciężkich dziur w półprzewod¬ 
nikach, tak wyróżnionej cząstki centralnej jak proton 
w atomie wodoru. Całkowita energia układu cząstki 
i dziury jest sumą energii ruchu środka masy i energii 
ruchu względnego. Pierwsza z nich zależy w sposób 
ciągły od pędu (£ — P 2 /2M, gdzie M jest sumą mas 
dziury i elektronu, a P — sumą ich pędów), natomiast 
druga z nich tworzy znaną serię poziomów wodoru, 
tyle że z innym współczynnikiem proporcjonalności 
przed — 1 jn 2 , n — 1, 2, ... . Stąd energia całkowita 
układu ma postać: —/?//i 2 +P 2 /2Af. W warunkach 
działania periodycznego pola kryształu podział ruchu 
na dwie niezależne składowe — ruch środka masy 
oraz ruch względny — staje się w zasadzie niemożli¬ 
wy; rozkład taki można przeprowadzić jedynie w po¬ 
bliżu ekstremum pasm energetycznych. Zatem zależ¬ 
ność energii ekscytonu od głównej liczby kwantowej 

n jak i od pędu P ulegnie skomplikowaniu tym bar¬ 
dziej, że P, ze względu na działanie periodycznego 
pola kryształu, jest teraz kwazipędem. Dzięki temu 
możemy mówić o pasmach ekscytonowych. Ponieważ 
przy przestawieniu wszystkich liczb kwantowych pasma 
opisujących dwie jednakowe cząstki Fermiego (fer- eksoytonowe 
miony) funkcja falowa zmienia znak, a przy analo¬ 
gicznym przedstawieniu liczb kwantowych cząstek 
Bosego (bozonów) — pozostaje niezmieniona, więc 
przy przestawieniu dwóch zespołów liczb kwanto¬ 
wych opisujących układy składające się z dwóch fer¬ 
mionów— funkcja również nie zmienia znaku, co 


dowodzi, że ekscytony podlegają statystyce Bosego. 
Ze względu na zerowy wypadkowy ładunek ekscyto¬ 
ny nie biorą udziału w transporcie ładunku, wpływają 
natomiast na własności optyczne kryształów'. Rozróż- 
ekscytony nia się zazwyczaj 2 rodzaje ekscytonów: ekscytony 
Frenkla Frenkla, występujące z reguły w kryształach moleku¬ 
larnych, w których elektron i dziura są praktycznie 
ekscytony biorąc zlokalizowane w molekule, oraz ekscytony 
Wanniera- Wanniera-Motta, o Wysokiem stopniu delokalizacji, 
-Motta występujące z reguły w półprzewodnikach. 

Warto zwrócić uwagę na to, że energie ekscytonów 
odpowiadają energiom z przerwy energetycznej, 
a więc niedopuszczalnym dla kwazicząstek elektro¬ 
nowych. Energia wzbudzenia układu elektron + 
dziura, jeśli obydwie kw-azicząstki znajdują się blisko 
ekstremów pasma przewodnictwa i pasma walencyj¬ 
nego, jest bowiem bliska wielkość przerwy energe¬ 
tycznej E g . Do tego dochodzi ujemna energia od¬ 
działywania kulombowskiego elektronu i dziury, co 
powoduje, że energia ekscytonu jest mniejsza od E g . 
Z drugiej jednak strony, energia ta nie może być ujem¬ 
na, wskazywałoby to bowiem na fakt, że wiązanie się 
przejście elektronów i dziur w ekscytony — tzw. przejście ekscy- 
ekscytonowe tonowe — obniżałoby energię układu, a więc układ 
byłby nietrwały. Zjawisko przejścia ekscytonowego 
pojawia się niekiedy w półmetalach. Podane oszaco¬ 
wanie energii ekscytonu nie zabrania istnieć ekscyto- 
nom o energii większej od Eg. Można jednak wyka¬ 
zać, że takie ekscytony przestają być wzbudzeniami 
dobrze określonymi, gdyż ulegają rozpadowi na 
wzbudzenia elektronowe, a więc dysocjację ekscy¬ 
tonu. Mimo nieelementamości ekscytonów z punktu 
widzenia przyjętej definicji, można je traktować jako 
składowe bardziej skomplikowanych wzbudzeń. 

W specyficznych warunkach, przy dużej gęstości 
ekscytonów w tzw. kroplach ekscytonowych genero¬ 
wanych w półprzewodnikach impulsem laserowym, 
istotne stają się tak oddziaływania międzyekscytono- 
we,jak i wzbudzenia kolektywne układu ekscytonów. 
Ponieważ ekscytony podlegają statystyce Bosego, od¬ 
działywania międzyekscytonowe mogą wręcz dopro¬ 
wadzić do przejścia kropli ekscytonowej w stan nad- 
ciekły podobnie jak to się dzieje z helem 4 He. 
polarony Dodajmy parę słów o polaronach. Elektron od¬ 
działuje z jonami sieci, zatem pojawienie się zmiany 
w równowagowej gęstości elektronów musi powodo¬ 
wać zmianę w rozkładzie gęstości jonów, czyli polary¬ 
zować sieć. Taką zmianę rozkładu gęstości jonów 
można uzyskać przez nałożenie na siebie pewnej liczby 
fal wychyleń jonów z położenia równowagi o różnej 
długości fali — tj. przez związanie elektronu z pewną 
liczbą fononów. Podobnie jak w wypadku ekscyto¬ 
nów wyróżniamy tu polarony o małym promieniu, 
dobrze zlokalizowane, oraz polarony o dużym pro¬ 
mieniu, rzędu wielu stałych sieci krystalicznej. Proces 
wiązania elektronów z fononami powinien prowadzić 
do zwiększenia masy powstałej kwazicząstki, co jest 
intuicyjnie jasne. Analogicznemu procesowi „obra¬ 
stania fononami” może ulegać nie tylko elektron, ale 
i dziura. Stąd, jak już wspomniano, wynika możli¬ 
wość występowania polaronowego ekscytonu, będą¬ 
cego stanem związanym polaronowej dziury i pola¬ 
ronowego elektronu. Wzbudzenia takie można ob¬ 
serwować w półprzewodnikach polarnych, o dużej 
biegunowości wiązań. Rozważania podobne jak dla 
ekscytonów wykazują fermionowy charakter pola- 
ronów. 

Uzupełniając poprzedni opis można powiedzieć, że 
w wyniku polaryzowania sieci przez elektron powstaje 
jama potencjału wychwytująca elektron. Polaron nie 
jest jedyną kwazicząstką o tym charakterze w fazie 
skondensowanej. Wśród kwazicząstek podobnego 
fluktuon typu można wymienić np. fluktuon i fazon. Pierwszy 
i fazon z nich to elektron wychwycony przez jamę potencjału 
wytworzoną w wyniku fluktuacji składników w po¬ 
bliżu elektronu w stopie nieuporządkowanym; drugi 
polega na wychwyceniu elektronu przez obszar fazy 
ferromagnetycznej powstały w paramagnetyku. 


Czy da się zamknąć listę kwazicząstek? 

Polarytony 

Ostatnie dwie kwazicząstki omówiliśmy w skrócie 
niemalże telegraficznym. Nie od rzeczy będzie pytanie 
o kryteria wyboru kwazicząsteczek omówionych 
w tym artykule. Liczba rozmaitych wzbudzeń w fazie 
skondensowanej, elementarnych lub nie — w poda¬ 
nym wyżej sensie, jest tak wielka, że trudno byłoby 
znaleźć fizyka do skompletowania listy wzbudzeń 
„na dzisiaj” na podstawie tego, co aktualnie wie, nie 
zaś na podstawie dodatkowej lektury. Zrezygnowaliś¬ 
my tu więc z omawiania tych wzbudzeń, przy których 
dublowalibyśmy fragmenty innych artykułów. Doty¬ 
czy to fononów (-► Dynamika sieci krystalicznej), 
magnonów (-> Teoria magnetyzmu) oraz specyficz¬ 
nych kwazicząstek elektronowych charakterystycz¬ 
nych dla nadprzewodników (-> Nadprzewodnictwo). 

Ze względu na specyfikę zagadnienia pominęliśmy 
również rozmaite wzbudzenia metali w zewnętrz¬ 
nym silnym polu magnetycznym (fale spinowe w 
metalach normalnych, w stałym zewnętrznym polu 
magnetycznym, fale cyklotronowe, helikony itd.). 

W artykule tym położyliśmy nacisk raczej na wzbu¬ 
dzenia elementarne niż kolektywne i, z drugiej strony, 
na wzbudzenia powszechnie występujące, zdając so¬ 
bie oczywiście sprawę z nieostrości tego ostatniego 
kryterium. Było ono wprawdzie zlekceważone przy 
opisie wzbudzeń w kryształach kwantowych, ale 
usprawiedliwiała nas wtedy niezwykłość sytuacji 
fizycznej. 

Ponieważ kontynuowanie przeglądu kwazicząstek 
w formie wyliczenia przypominającego książkę telefo¬ 
niczną jest raczej pozbawione sensu, zamkniemy listę 
omówieniem polarytonu. Jest to wzbudzenie tym 
różniące się jakościowo od już omówionych lub 
wzmiankowanych, że stanowi ono stan związany 
fotonu z którymś ze wzbudzeń, takich jak fonon op¬ 
tyczny, ekscyton, magnon itp. Omówimy pokrótce 
polarytony fononowe i polarytony ekscytonowe. 

Musimy najpierw wyjaśnić, w jaki sposób fala elek- oddziaływa- 
tromagnetyczna może oddziaływać z fononem optycz- nie fali elek 
nym lub ekscytonem. Otóż wektor elektryczny fali tromagne- 
elektromagnetycznej wywołuje polaryzację elektrycz- tycznej z fo 
ną ośrodka. Ze względu na falowy charakter ruchu nonem lub 
wektora elektrycznego polaryzacja ta ma również ekscytonem 
charakter falowy. Warto przy tym zwrócić uwagę, że 
polaryzacja taka, przynajmniej w ośrodkach o nie¬ 
zbyt silnej anizotropii, jest poprzeczna, tzn. wektor 
polaryzacji jest prostopadły do kierunku rozchodze¬ 
nia się fali, ponieważ fala elektromagnetyczna jest 
poprzeczna. Zastanówmy się, jakiego typu wzbudze¬ 
nia mogą być indukowane przez wektor elektryczny. 

Jeżeli sieć składa się z co najmniej dwóch podsieci, 
obsadzonych przez atomy różnych pierwiastków, to 
na atomach poszczególnych podsieci będzie znajdował 
się nieco inny ładunek elektryczny. Fonon optyczny 
o zerowym wektorze falowym odpowiada jednorod¬ 
nemu przesunięciu podsieci względem siebie tak, aby 
środek masy całego kryształu pozostawał nieruchomy. 

Przy niecałkowitym skompensowaniu ładunku elek¬ 
trycznego na atomach każdej podsieci odpowiada to 
zmianie momentu dipolowego kryształu, a więc jego 
polaryzacji elektrycznej. Możemy stąd wywniosko¬ 
wać, że elektryczne pole fali elektromagnetycznej 
będzie wzbudzało fonony optyczne o polaryzacji po¬ 
przecznej, ze względu na poprzeczny charakter fal 
elektromagnetycznych. Natomiast fonony akustyczne 
odpowiadają drganiom wszystkich podsieci w fazie, 
co nie prowadzi do zmiany momentu dipolowego 
kryształu, a zatem pole elektryczne nie wpływa na 
fonony akustyczne. Oddziaływanie między falą elek¬ 
tromagnetyczną a polaryzacją dynamiczną sieci ma 
charakter przyciągania, bowiem sieć polaryzuje się w 
taki sposób, aby zmniejszyć energię łącznego układu 
promieniowania 4* sieć. Zgodnie z zasadami mechaniki 
kwantowej istnieje zatem możliwość powstania stanu polarytony 
związanego porzecznej polaryzacji sieci, tj. poprzecz- fononowe 
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nie spolaryzowanych fononów optycznych, z kwantami 
pola elektromagnetycznego, czyli fotonami. Wiązanie 
to będzie szczególnie silne przy częstościach promie¬ 
niowania elektromagnetycznego bliskich częstości 
fononów optycznych. Wynika to z faktu, że przy 
zbliżonych do siebie częstościach pola zewnętrznego 
i fononów optycznych mamy do czynienia z rezonan¬ 
sem i polaryzacja jest szczególnie duża. Biorąc typo¬ 
wy rząd wielkości częstości fononów optycznych co 0 
i oceniając na tej podstawie długość fali promienio¬ 
wania elektromagnetycznego (X = 2kc/co 0 ) znajdu¬ 
jemy X x 10 4 rnn. Fonony optyczne będą zatem wią¬ 
zać najsilniej fale bardzo długie w porównaniu z od¬ 
ległością międzyatomową (rzędu 0,1 nm) i polaryton 
fononowy będzie kwazicząstką o wysokim stopniu 
delokalizacji. Opisane kwazicząstki odgrywają istot¬ 
ną rolę w optycznych własnościach tych kryształów, 
dla których wzbudzenie fononu optycznego zmienia 
moment dipolowy kryształu. 

Przejdźmy teraz do polarytonów ekscytonowych. 
Zasada wiązania fali elektromagnetycznej z ekscyto- 
nami jest taka sama, jak w wypadku fononów op¬ 
tycznych, ponieważ ekscyton jest stanem związanym 
kwazicząstek naładowanych. Powstała kwazicząstka 
będzie z wielu względów podobna do opisanego po¬ 
przednio polarytonu fononowego. Wprowadzenie 
koncepcji polarytonu ekscytowanego zmieniło w spo¬ 
sób istotny opis własności optycznych półprzewod¬ 
ników. Przedtem uważano, że fala elektromagne¬ 
tyczna o częstości mniejszej od częstości odpowiada¬ 
jącej szerokości przerwy energetycznej może wzbu¬ 
dzać jedynie ekscytony. Obecnie sądzi się, że taka fala 
elektromagnetyczna wzbudza również polarytony 
ekscytonowe, co komplikuje opis własności optycz¬ 
nych półprzewodników. Jest to fakt, który został po¬ 
twierdzony doświadczalnie. Dodajmy jeszcze, że ana¬ 
logicznie do wzmiankowanych tu polarytonów ma- 
gnonowych wektor pola magnetycznego fali elektro¬ 
magnetycznej sprzęga się z dynamiczną polaryzacją 
magnetyczną, a więc magnonami. 

Warto jeszcze na zakończenie powiedzieć trochę 
o wykrywaniu wzbudzeń w układach fizycznych. Za¬ 
łóżmy, że na układ działa pole zewnętrzne o określo¬ 
nej częstości i określonym wektorze falowym. Wektor 

falowy k i częstość kołowa co pomnożone przez h/2n 
dają odpowiednio pęd i energię kwantu pola. Załóż¬ 
my, że pole to wzbudza kwazicząstki określonego 


typu. Jeśli układ fizyczny jest ciałem stałym, to obo¬ 
wiązuje prawo zachowania kwazipędu, z dokład¬ 
nością do wektora sieci odwrotnej pomnożonego przez 
/*/2 ju, oraz prawo zachowania energii. Jeśli więc będą 

spełnione równości E(kj)+hco(k)/2K = E(k 2 ) oraz 
ki+k — k 2 +K n > gdzie E(k) energia kwazicząstek 

zależna od wektora falowego, a K n — wektor sieci 
odwrotnej, to układ będzie pochłaniał energię pola. 
Dla absolutnie stabilnych kwazicząstek niespełnienie 
którejkolwiek z tych równości powoduje niemożność 
pochłaniania energii przez układ w reakcji: kwazi¬ 
cząstka 4- kwant energii —► inna kwazicząstka, speł¬ 
nienie zaś obydwu tych równości prowadzi do wystą¬ 
pienia nieskończenie cienkiej linii absorpcji. Dla do¬ 
brze określonych wzbudzeń kwazicząstkowych ener¬ 
gie będą nieco rozmyte, zgodnie z zasadą nieokreślo¬ 
ności dla energii, AEr /z/2rc, i wystarczy, aby pier¬ 
wsze z wymienionych równań było spełnione jedynie 
w przybliżony sposób, z dokładnością rzędu hfcr.T. 
Powoduje to, że nieskończenie cienka linia absorpcji 
zmienia się w wąską linię o szerokości rzędu hf2nT 
w skali energii. Dla wzbudzeń, które nie są dobrze 
określone, linie absorpcji stają się liniami szerokimi. 
Wspomniane procesy absorpcji wraz z procesami roz¬ 
praszania, dającymi się wyrazić symbolicznie w spo¬ 
sób następujący: kwazicząstka -f kwant energii-> 
inną kwazicząstkę -f inny kwant energii, spełniają¬ 
cymi odpowiednie prawa zachowania energii i kwa¬ 
zipędu, są podstawowymi metodami zdobywania 
informacji o widmie kwazicząstek. Warto zaznaczyć, 
że oprócz rozpraszania kwantów stosuje się również 
rozpraszanie cząstek, np. rozpraszanie neutronów, 
dające podstawowe informacje o widmie fononów. 

Omawialiśmy tu wzbudzenia związane ze wzbudze¬ 
niami wnętrza trójwymiarowego kryształu. Nieomal 
każde z tych wzbudzeń ma swój analog związany 
z powierzchnią kryształu. Wzbudzenia takie, jak 
zwykle w fizyce powierzchni (-► Stany powierzchnio¬ 
we w ciałach stałych), są opisywane dwuwymiarowym 
wektorem kwazipędu, określonym przez sieć płaską, 
odwrotną do powierzchni kryształu, stanowiącej jego 
granicę. W niektórych wypadkach rozważania nad 
wzbudzeniami powierzchniowymi niewiele się różnią 
od rozważań nad wzbudzeniami objętościowymi. 

M. I. Kaganow Elektrony, fonony, magnony... Warszawa 
1978; M. I. Kaganow, I. M. Lifszyc, Kwaziczasticy, Moskwa 
1976; W. Wardzyński, Polarytony , Post. Fiz. 27, 477 (1976). 


Stany powierzchniowe w ciałach 
stałych 

Jacek Łagowski i Andrzei Morawski 


Powierzchnia rozumiana jako ograniczenie bryły 
ciała stałego lub, w złożonych układach, jako granica 
pomiędzy różnymi fazami pełni istotną rolę w wielu 
zjawiskach, będących przedmiotem równoczesnego 
zainteresowania szeregu dziedzin nauki. Spośród 
szczególnie aktualnych zagadnień związanych z po¬ 
wierzchnią wymienić można badania mechanizmów 
funkcjonowania układów biologicznych, zjawiska 
katalizy itp. 

Zainteresowanie powierzchnią ciała stałego, a zwła¬ 
szcza procesami fizycznymi zachodzącymi na granicy 
złącza metal-półprzewodnik datuje się od 1876 r., 
kiedy to odkryto zjawisko fotowoltaiczne w tego 
rodzaju złączach. Znane już wtedy było prostujące 
działanie kontaktu metal-półprzewodnik (1874 r.). 
Jednak dopiero prace z lat pięćdziesiątych XX w. 
przyczyniły się do istotnego postępu w dziedzinie 
wiedzy o powierzchni. Zapoczątkowany w latach 
dwudziestych naszego stulecia burzliwy rozwój 
fizyki ciała stałego pozwala w stopniu zadawalającym 
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opisywać i rozumieć własności wnętrza kryształów. 
Postęp w technologii umożliwiający otrzymywanie 
dużych, jednorodnych monokryształów zbliżył re¬ 
zultaty badań doświadczalnych do teoretycznych. 
Teoretyczny model krystalicznego ciała stałego za¬ 
kłada translację komórki elementarnej aż do nie¬ 
skończoności ; nie uwzględnia zatem ograniczenia 
przestrzennego kryształu. Wprowadzenie takiego 
ograniczenia, tzn. powierzchni, pociąga za sobą dale¬ 
ko idące konsekwencje. Jak wykazał I. E. Tamm 
(1932 r.), występujące na powierzchni zaburzenie 
periodyczności sieci krystalicznej i w związku z tym 
zaburzenie periodyczności potencjału na granicy 
kryształ-próżnia prowadzi do pojawienia się, nawet 
w idealnych kryształach półprzewodnikowych, 
dozwolonych elektronowych stanów energetycznych 
w obszarze energii wzbronionych (tzw. stanów po¬ 
wierzchniowych Tamma). Zagadnieniem tym zajmo¬ 
wało się następnie wielu fizyków. Do szczególnego 
postępu wiedzy o stanach powierzchniowych dopro- 
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wadziły prace W. Shockleya. Wynalezienie w 1948 r. 
tranzystorów przez J. Bardeena, W. Brattaina 
i W. Shockleya, przy okazji badań powierzcłmi 
półprzewodników, w istotny sposób wzmogło pin- 
teresowanie fizyką półprzewodników i w szczególno¬ 
ści problematyką stanów powierzchniowych, mają¬ 
cych ogromne znaczenie w działaniu kontaktów me- 
tal-półprzewodnik, złączy p-n, tranzystorów, a zwłasz¬ 
cza układów scalonych. Dotychczas jednak nie zo¬ 
stały rozwiązane zasadnicze problemy poznawcze 
i fizyka powierzchni i stanów powierzchniowych nadal 
znajduje się w stadium intensywnego rozwoju. 


Powierzchnie czyste i powierzchnie 
rzeczywiste 

Pochodzenie (natura) stanów powierzchniowych 
oraz zjawiska nimi uwarunkowane wiążą się ściśle 
z charakterem powierzchni kryształu. Najprostszy 
w sensie fizycznym i chemicznym układ stanowi tzw. 
powierzchnia czysta, czyli zewnętrzna powierzchnia 
atomowa (jonowa) kryształu, będąca zakończeniem 
sieci krystalicznej (rys. 1). Najlepszą ilustracją 
takiej powierzchni jest powierzchnia kryształu roz¬ 
łupanego w ultrawysokiej próżni. Istnienie w kryszta¬ 
łach pewnych płaszczyzn sieciowych, tzw. płaszczypi 
łupliwości, umożliwia odsłonięcie płaszczyzn zawie- 
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Rys. 1. Idealna powierzchnia czysta — schemat dwuwymiarowy. 
W zależności od powierzchni krystalograficznej atom powierzch¬ 
niowy ma zerwane jedno wiązanie (np. powierzchnia 111 ger¬ 
manu) lub dwa wiązania (np. powierzchnia 100 germanu) 


rających tylko jeden rodzaj atomów (jonów). Na 
czystość powierzchni odsłoniętych po przełupaniu 
wpływa wtedy tylko czystość całego kryształu, tzn. 
przypadkowe domieszki przedostające się do mono¬ 
kryształu w procesie hodowania. Z powierzchniami 
czystymi można mieć do czynienia jedynia w warun¬ 
kach ultrawysokiej próżni (p < 10" 8 Pa) w ograni¬ 
czonym czasie. W próżni rzędu 10~ 8 Pa już po paru 
godzinach występuje dostrzegalne pokrycie powierz¬ 
chni adsorbowanymi molekułami, co zmienia charak¬ 
ter powierzchni. Powierzchnię czystą można również 
otrzymać usuwając warstwy absorbowane bombar¬ 
dowaniem jonami, elektronami, a w niektórych wy¬ 
padkach również wygrzewaniem kryształu w ultra¬ 
wysokiej próżni. 

Powierzchnie, na których znajdują się warstwy 
adsorbowane, noszą nazwę powierzchni rzeczywi¬ 
stych. Warstwy te mogą być silnie związane z krysz¬ 


tałem, tzw. warstwy chemisorbowane (np. tlen two¬ 
rzący na powierzchni krzemu tlenki), lub warstwy 
słabo związane (np. cząsteczki wody), powstające 
wskutek fizycznej adsorpcji. Zwykle oba rodzaje 
warstw występują równocześnie. Powierzchnia rze¬ 
czywista obejmuje trzy elementy (rys. 2): powierzch- 
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Rys. 2. Powierzchnia rzeczywista — schemat dwuwymiarowy. 
W praktyce, z uwagi na proces dyfuzji w głąb kryształu, rozdział 
kryształ-warstwa adsorbowana nie musi być ostry 

nię rozdziału kryształ-warstwa adsorbowana, warstwę 
adsorbowaną, zewnętrzną powierzchnię rozdziału 
warstwa-otoczenie. 

Przy powszechnie stosowanej obróbce kryształów 
obejmującej cięcie, polerowanie i trawienie chemiczne 
(lub elektrolityczne), które usuwa warstwę przypo¬ 
wierzchniową uszkodzoną przy obróbce mechanicz¬ 
nej, uzyskuje się powierzchnie rzeczywiste. Jeden 
z rodzajów powierzchni rzeczywistych stanowią po¬ 
wierzchnie celowo pokryte warstwami izolatora, prze¬ 
wodnika lub jednego i drugiego. Pewne ich rodzaje, 
tzw. struktury warstwowe (np. struktury MIS — 
metal-izolator-półprzewodnik) wykorzystywane są 
powszechnie jako elementy elektroniczne. 

W dotychczas opanowanych zastosowaniach prak¬ 
tycznych ciał stałych mamy do czynienia jedynie z po¬ 
wierzchniami rzeczywistymi. Znaczenie badań po¬ 
wierzchni czystych określają względy poznawcze. 
Powierzchnie te stanowią najprostszy układ odnie¬ 
sienia, bez którego trudno określić jednoznacznie me¬ 
chanizmy zjawisk zachodzących na dowolnej po¬ 
wierzchni. 


Stany powierzchniowe na powierzohni 
czystej 


Atomowa powierzchnia kryształu jest utworzona 
przez ostatnią płaszczyznę atomów (jonów) sieci kry¬ 
stalicznej (rys. 1). Atomy tworzące tę płaszczyznę są 
pozbawione części swoich sąsiadów niezbędnych do 
skompletowania wiązań sieci krystalicznej. W po¬ 
glądowych modelach atomistycznych uważa się, że 
stany powierzchniowe pochodzą od zerwanych wiązań 
atomów powierzchni, które oddają elektron (stany 
donorowe, rys. 3a) lub też zostają uzupełnione przy¬ 
łączeniem elektronu (stany akceptorowe, rys. 3b). 
W modelu takim liczba stanów powierzchniowych 
wiąże się ściśle z liczbą atomów na powierzchni 
i jest rzędu 10 14 /cm 2 . Ze względu na to, że ruch ele- 



Rys. 3. Stany powierzchniowe związane z zerwanymi wiązania¬ 
mi: a) donorowe, b) akceptorowe. W wypadku (a) atom po¬ 
wierzchni oddaje swój elektron uczestniczący w wiązaniu, ła¬ 
dując się dodatnio; w wypadku (b) przyłącza elektron uzupeł¬ 
niający zerwane wiązanie 
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ktronów jest możliwy po powierzchni (przejście z jed¬ 
nego atomu na drugi), a niemożliwy prostopadle do 
niej, mówi się, że elektrony w stanach powierzchnio¬ 
wych są swobodne w kierunkach równoległych do 
powierzchni, a zlokalizowane prostopadle do niej. 
Modele atomistyczne powierzchni, aczkolwiek nie 
dają ścisłego ilościowego opisu stanów powierzchnio¬ 
wych i procesów elektronowych z nimi związanych, 
stanowią podstawę do jakościowej interpretacji wielu 
zjawisk, w tym w szczególności fizykochemicznej 
aktywności powierzchni, zależności prędkości wzrostu 
kryształów od orientacji powierzchni, różnej odpor¬ 
ności mechanicznej powierzchni itp. 

Znacznie precyzyjniejszy opis stanów powierz¬ 
chniowych na czystej powierzchni można uzyskać na 
gruncie teorii kwantowej. Jednak mimo już ponad 
czterdziestoletnich badań i niewątpliwych postępów 
ciągle jeszcze nie jest możliwy pełny ilościowy opis 
elektronowej struktury powierzchni rzeczywistego 
kryształu. Wielka złożoność zagadnienia zmusza do 
przyjmowania upraszczających założeń dość daleko 
odbiegających od sytuacji istniejącej w rzeczywistym 
krysztale. Podstawowym założeniem upraszczającym 
jest założenie, że symetria translacyjna zachowuje się 
aż do powierzchni. Przy tak postawionym zagadnie¬ 
niu powierzchnia jest traktowana jako obszar przej¬ 
ścia od periodycznie zmieniającej się energii poten¬ 
cjalnej elektronu wewnątrz kryształu (-►Struktura 
elektronowa ciał stałych) do stałej wartości energii 
potencjalnej elektronu w otaczającej kryształ próżni. 
Obszar przejścia stanowi równocześnie barierę po¬ 
tencjału uniemożliwiającą odpływ elektronów z 
kryształu do próżni. Znając rozwiązanie równania 
Schrodingera w obu ośrodkach, tj. znając funkcje 
falowe elektronów w krysztale i w próżni, można 
określić strukturę elektronową na powierzchni. 
Wynikiem takiej analizy są dwa ogólne wnioski: 
1) dla energii elektronu leżącej w obrębie dozwolo¬ 
nych pasm energetycznych powierzchnia nie wpro¬ 
wadza żadnych dodatkowych ograniczeń na stany 
energetyczne elektronu w krysztale; 2) w obszarze 
energii wzbronionych (w przerwie energetycznej) 
pojawiają się pewne poziomy energetyczne, zwane 
stanami powierzchniowymi, dozwolone dla elektro¬ 
nów. Obydwa te wnioski są niezwykle istotne. A mia¬ 
nowicie wniosek pierwszy oznacza, że struktura 
pasmowa cienkich kryształów (coraz powszechniej 
stosowanych do produkcji przyrządów półprzewodni¬ 
kowych) zawiera wszystkie cechy struktury pasmowej 
nieskończonego kryształu; z wniosku zaś drugiego 
wynika, że obecność powierzchni (bariery potencja¬ 
łu na powierzchni) manifestuje się analogicznie jak 
obecność domieszek w krysztale, wprowadzając lokal¬ 
ne poziomy energetyczne w przerwie wzbronionej. 

Przyjęty powszechnie dla poziomów energetycz¬ 
nych na powierzchni termin stany powierzchniowe 
wiąże się ściśle z charakterem funkcji falowych opisu¬ 
jących elektrony na powierzchni. Funkcje falowe tych 
elektronów zanikają wykładniczo w głąb kryształu. 
Oznacza to, że elektrony nie mogą przemieszczać się 
w kierunku prostopadłym do powierzchni, a zatem są 
na niej zlokalizowane. Omówione powyżej ogólne, 
jakościowe wnioski otrzymuje się bez względu na 
kształt bariery potencjalnej przy powierzchni — 
konieczne jest tylko jej istnienie. Chcąc podać peł¬ 
niejszy, ilościowy opis stanów powierzchniowych, 
tzn. określić funkcje falowe elektronów w stanach 
powierzchniowych, położenie energetyczne (wartości 
energii), gęstość tych stanów, należy uwzględnić 
przebieg energii potencjalnej elektronów przy po¬ 
wierzchni. Rozwiązanie tego zagadnienia w sposób 
ścisły nie jest możliwe. Niemożność pełnego opisu 
teoretycznego stanów powierzchniowych wynika z: 
1) nieznajomości rzeczywistego kształtu energii po¬ 
tencjalnej na powierzchni kryształów, 2) występowa¬ 
nia przy powierzchni zaburzenia struktury krystalo¬ 
graficznej — przegrupowania atomów na płaszczyźnie 
sieciowej ograniczającej kryształ i na płaszczyznach 
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z nią sąsiadujących, 3) trudności rachunkowych w ok¬ 
reśleniu funkcji falowych we wnętrzu kryształu odpo¬ 
wiadających energiom wzbronionym. Najtrudniejsze 
do pokonania wydają się problemy 1 i 2. Warunkiem 
ich rozwiązania jest uzyskanie danych doświadczal¬ 
nych o strukturze powierzchni w mikro- i makroskali. 

Duże nadzieje wiąże się tutaj z dalszym rozwojem no¬ 
woczesnych metod badawczych opartych na dyfrakcji 
elektronów (np. metody LEED — dyfrakcji powol¬ 
nych elektronów) oraz spektroskopii jonowej, tzw. 
spektroskopii elektronów Augera, wykorzystującej 
czułe na lokalną strukturę powierzchni zjawisko 
emisji elektronów z kryształu na skutek oddziały¬ 
wania z jonami gazów szlachetnych. 

Uzyskiwane z metod przybliżonych parametry 
stanów powierzchniowych w decydujący sposób za¬ 
leżą od przebiegu energii potencjalnej na powierzchni. 

Ze względów historycznych rozróżnia się dwa typy 
przybliżenia przebiegu energii potencjalnej, które po¬ 
służyły Tammowi (1932 r.) i Shockleyowi (1939 r.) 
do sformułowania pierwszych teorii stanów powierz¬ 
chniowych. Tamm przyjął niesymetryczny przebieg 
energii potencjalnej w otoczeniu ostatniej warstwy 
atomowej, Shockley natomiast zakładał symetryczny przybliżenie 
przebieg potencjału aż do ostatniej warstwy atomowej Tamma 
(rys. 4). W rezultacie Tamm uzyskał jeden poziom 
energetyczny leżący pomiędzy każdymi dwoma pas- 



Rys. 4. Przejście od periodycznie zmiennej energii potencjalnej 
elektronu U wewnątrz kryształu do stałej energii w próżni dla 
idealnego kryształu i idealnej powierzchni. Linia przerywana 
przedstawia przybliżenie Tamma z niesymetrycznym zakończe¬ 
niem energii potencjalnej elektronu na powierzchni (z = 0). 

W przybliżeniu Shockleya energia elektronu zmienia się syme¬ 
trycznie aż do powierzchni; a stała sieci krystalicznej 

mami energii dozwolonych — są to tzw. stany po¬ 
wierzchniowe Tamma, podczas gdy Shockley uzyskał 
dwa poziomy energetyczne leżące w pobliżu środka 
przerwy energetycznej, tzw. stany powierzchniowe przybliżenie 
Shockleya. Jakkolwiek obydwa modele odbiegają Shockleya 
znacznie od sytuacji w krysztale rzeczywistym, odegra¬ 
ły jednakże bardzo ważną rolę w rozwoju całej fizyki 
stanów powierzchniowych. Na podstawie dotychcza¬ 
sowych badań teoretycznych można dzisiaj przynaj¬ 
mniej w sposób jakościowy określić możliwe rodzaje 
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Rys. 5. Rodzaje stanów powierzchniowych na powierzchni czy¬ 
stej: a) poziomy dyskretne o położeniach energetycznych E x 
i jEj, b) pasma o szerokościach SE l i ÓE it c) stany o ciągłym roz¬ 
kładzie gęstości w funkcji energii; Ec t Ex> — energia odpowiada¬ 
jąca dolnej krawędzi pasma przewodnictwa i wierzchołkowi pa¬ 
sma walencyjnego 
















stanów powierzchniowych na powierzchni atomowo 
czystej. Rezultaty te przedstawione są na rys. 5. 
Tak więc możliwe są dyskretne poziomy energetyczne 
o położeniu energetycznym E x i E z> wąskie pasma 
o krawędziach przy energii E 1 i E* (szerokościach 
energetycznych SE^ i SE 2 ) oraz ciągły rozkład stanów 
powierzchniowych z maksimami gęstości stanów 
przy energiach E x i E 2 . 


Stany powierzchniowe na powierzchni 
rzeczywistej 

Zagadnienie stanów powierzchniowych na powierzch¬ 
ni rzeczywistej jest znacznie bardziej skomplikowane 
niż na powierzchni atomowo czystej, tak że teoria 
stanów powierzchniowych w tym wypadku nie została 
dotychczas w sposób zadowalający sformułowana. 
Adsorbowana na zewnętrznej płaszczyźnie atomowej 
kryształu warstwa w sposób zasadniczy zmienia prze¬ 
bieg energii potencjalnej elektronu. W wyniku ad- 
sorbcji zerwane wiązania zostają wysycone (rys. 2), 
co powoduje zanik stanów powierzchniowych charak¬ 
terystycznych dla powierzchni czystych. Pojawiają się 
natomiast inne stany powierzchniowe pochodzące 
od niedopasowania warstwy adsorbowanej z płasz¬ 
czyzną atomową, domieszek gromadzących się na 
granicy rozdziału kryształ-warstwa, domieszek i de¬ 
fektów w warstwie oraz molekuł osiadających na 
granicy rozdziału warstwa adsorbowana-otoczenie. 
Parametry stanów powierzchniowych, takie jak poło¬ 
żenie energetyczne, gęstość, przekrój czynny na wy¬ 
chwyt elektronu czy dziury itp., zależą od powierzchni 
krystalograficznej, obróbki kryształu oraz atmosfery 
gazowej otaczającej kryształ. 

stany szybkie Zazwyczaj stany powierzchniowe występujące na 
i powolne powierzchni rzeczywistej dzieli się na dwie grupy — 
tzw. stany szybkie i powolne. Podział ten dokonywany 
jest ze względu na czas wymiany ładunku pomiędzy 
stanami powierzchniowymi i wnętrzem kryształu. 
Dla stanów szybkich czas ten jest rzędu mikrosekund, 
dla powolnych zaś — milisekund lub dłuższy. Stany 
szybkie o gęstości nie przewyższającej 10 12 na cm 2 
zlokalizowane są na ogół na granicy rozdziału krysz¬ 
tał-warstwa adsorbowana; powolne — wewnątrz 
warstwy adsorbowanej i na granicy rozdziału warstwa 
-otoczenie (liczba tych stanów może osiągać 10 1S na 
cm 2 ). Parametry stanów powierzchniowych uzyskuje 
się doświadczalnie analizując udział stanów powierz¬ 
chniowych w zjawiskach fizycznych, takich jak prze¬ 
wodnictwo powierzchniowe, efekt połowy i fotona- 
pięcie powierzchniowe. 


Udział stanów powierzchniowych 
w zjawiskach fizycznych 


w wielu zjawiskach fizycznych zachodzących w krysz- przewodni- 
tale. Wśród tych zjawisk istnieją takie, w których po- ctwo i rekom- 
wierzchnia daje pewien przyczynek do obserwowanego binacja po- 
w całym krysztale efektu, np. udział przewodnictwa wierzchnio- 
powierzchniowego w całkowitym przewodnictwie wa 
kryształu, udział rekombinacji powierzchniowej w fo- 
toprzewodnictwie itp., oraz takie, które nie istnia¬ 
łyby, gdyby nie było stanów powierzchniowych, np. 
fotonapięcie powierzchniowe. Doświadczalne bada¬ 
nie tych zjawisk jest źródłem informacji o parametrach 
stanów powierzchniowych, takich jak położenie ener¬ 
getyczne, gęstość, przekroje czynne na wychwyt ele¬ 
ktronów i dziur itp. Przy wyjaśnieniu wpływu po¬ 
wierzchni na elektronowe zjawiska zachodzące w kry¬ 
sztale szczególnie ważna jest koncepcja przypowierz¬ 
chniowego obszaru ładunku przestrzennego. 


Przypowierzchniowy obszar ładunku 
przestrzennego 

Koncepcję przypowierzchniowego obszaru ładunku 
wysunęli J. Bardeen, W. Shockley i W. Brattain. 
Stany powierzchniowe traktuje się jako zlokalizowane 
na powierzchni naładowane centra. Oznacza to, że 
powierzchnia jest elektrycznie naładowana. Aby 
kryształ pozostał elektrycznie obojętny, sumaryczny 
ładunek powierzchni musi być zrównoważony rów¬ 
nym co do wartości ładunkiem przeciwnego znaku 
w sąsiadującym z powierzchnią wnętrzem kryształu. 
W ten sposób w krysztale mamy do czynienia z trzema 
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Obecność stanów powierzchniowych, ładunku elek¬ 
trycznego w nich zgromadzonego oraz zmiana ła¬ 
dunku w stanach powierzchniowych przejawia się 


Rys. 6. Schemat energetyczny powierzchni rzeczywistej i przy¬ 
powierzchniowego obszaru ładunku przestrzennego; prostokąta¬ 
mi zaznaczono różne rodzaje stanów powierzchniowych. Podano 
również podstawowe wielkości charakteryzujące powierzchnię 


Przypowierzchniowy obszar ładunku przestrzennego w półprzewodnikach 


Typ przewodni¬ 
ctwa elektrycz¬ 
nego we wnętrzu 
kryształu 

Ładunek w sta¬ 
nach powierzch¬ 
niowych 

Charakterystyka 

nazwa obszaru 

typ przewodnictwa elektrycznego 

Elektronowe 

ujemny 

ujemny o du¬ 
żej wartości 
dodatni 

obszar zubożenia (słabo przewodzący) 

obszar inwersji (przewodzący) 

obszar wzbogacenia (silnie przewodzący) 

elektronowe, koncentracja elektronów mniejsza niż 

we wnętrzu 

dziurowe 

elektronowe, koncentracja elektronów większa niż 
we wnętrzu 

Dziurowe 

ujemny 

dodatni 

dodatni o dużej 
wartości 

obszar wzbogacenia (silnie przewodzący) 

obszar zubożenia (słabo przewodzący) 

obszar inwersji (przewodzący) 

dziurowe, koncentracja dziur większa niż we 
wnętrzu 

dziurowe, koncentracja dziur mniejsza niż we 
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elementami: naładowaną elektrycznie powierzchnią, 
przypowierzchniowym obszarem ładunku przestrzen¬ 
nego — neutralizującym ładunek powierzchni, oraz 
elektrycznie obojętnym wnętrzem kryształu (rys. 6). 
W półprzewodnikach koncentracje elektronów (lub 
obszary dziur) są stosunkowo niewielkie i przypowierzchnio- 
zubożertia, wy obszar ładunku przestrzennego rozciąga się na 
inwersji i głębokość od 10“ 5 cm do 10“ 3 cm. W metalach jest on 
wzbogacenia rzędu 10“ 7 cm i w większości zjawisk nie odgrywa 
znaczącej roli. Zależnie od ładunku w stanach po¬ 
wierzchniowych rozróżnia się trzy obszary ładunku 
powierzchniowego — tzw. obszar zubożenia, inwersji 
i wzbogacenia, scharakteryzowane w tabeli i przed¬ 
stawione na rys. 7. 



a) b) C ) 

Rys. 7. Przypowierzchniowy obszar ładunku przestrzennego 
w półprzewodniku typu n (przewodnictwo elektronowe): a) ob¬ 
szar wzbogacenia — koncentracja elektronów większa niż we 
wnętrzu kryształu, b) obszar zubożenia — koncentracja elektro¬ 
nów mniejsza niż we wnętrzu kryształu, c) obszar inwersji — 
zmiana typu przewodnictwa; we wnętrzu — typ n, w POŁP — 
typ p ; Er.j, Ev energia odpowiadająca dolnej krawędzi pasma 
przewodnictwa i wierzchołkowi pasma walencyjnego, Ef po¬ 
ziom Fermiego. Obszar inwersji jest zawsze oddzielony od obję¬ 
tości obszarem zubożenia 


pole elek- Obszar przypowierzchniowy może mieć zupełnie 
Łrycznewob- inne własności fizyczne niż wnętrze kryształu. Pole 
szarze przy- elektryczne może w nim osiągnąć wartości rzędu 
powierzch- 10 5 V/cm. Może to być obszar izolujący lub silnie 
niowym przewodzący. Ruchliwość nośników prądu jest w nim 
z reguły znacznie niższa niż we wnętrzu kryształu 
(z uwagi na rozpraszanie przez powierzchnię). Inne 
są własności rekombinacyjne. W obszarach silnej 
inwersji i wzbogacenia istotnej modyfikacji ulega 
struktura pasmowa. Charakterystyczne dla wnętrza 
kryształu kwaziciągłe pasma dozwolonych energii 
ulegają kwantyzacji w kierunku prostopadłym do po¬ 
wierzchni, tzn. zachowując ciągłość w kierunkach 
równoległych do powierzchni rozpadają się na układ 
poziomów dyskretnych dla kierunku ruchu elektronu 
(dziury) prostopadłego do powierzchni. 


Przewodnictwo powierzchniowe 

Jedną z najbardziej rozpowszechnionych metod 
eksperymentalnych badania stanów powierzchniowych 
opartych na procesach zachodzących w przypowierz¬ 
chniowym obszarze ładunku przestrzennego stanowi 
pomiar przewodnictwa elektrycznego cienkich płytek 
w funkcji atmosfery gazowej (rys. 8). W metodzie tej 
poddaje się analizie przewodność powierzchniową 
materiału zdefiniowaną jako a s = 1 l 2 d{<r— oot>j), gdzie 
a — całkowita (mierzona) przewodność płytki, 
a Oobj — przewodność objętościowa materiału, czyli — 
gdy płytka jest dostatecznie cienka — przewodność 
odpowiadająca zerowemu ładunkowi na powierzchni, 
d — grubość płytki; czynnik ł / 2 pochodzi z uwzględ¬ 
nienia dwóch powierzchni płytki. Pokazany na rys. 8a 
przebieg przewodności pozwala określić całkowity ła¬ 
dunek w stanach powierzchniowych odpowiadający 
danej atmosferze. Na krzywej można wyodrębnić sil¬ 
nie przewodzące obszary przypowierzchniowe: ob¬ 
szar inwersji, w którym dominuje przewodnictwo 
elektronowe, oraz obszar wzbogacenia o przewodni¬ 
ctwie dziurowym. Obszary te przedzielone są obsza¬ 



Rys. 8. Zmiana przewodnictwa elektrycznego cienkich próbek 
Ge typu p (przewodnictw^ dziurowe) przy zmianach atmosfery 
gazowej oraz zmiana ich oporu elektrycznego przy rozciąganiu 


rem zubożenia przewodzącym słabiej niż wnętrze 
płytki. 

Informacji o przejściu pod działaniem atmosfery 
od dominacji elektronów w przypowierzchniowym 
obszarze ładunku do dominacji dziur dostarcza po¬ 
miar piezooporu (zmiany oporu wywołanej mecha¬ 
nicznym naprężeniem) cienkich płytek garmanowych 
lub krzemowych (rys. 8b). W germanie i krzemie 
elektrony wnoszą do piezooporu przyczynek prze¬ 
ciwnego znaku niż dziury, stąd też całkowity piezo- 
opór cienkiej płytki zmienia znak przy zmianie atmo¬ 
sfery otaczającej płytkę sygnalizując przejście od do¬ 
minacji elektronów do dominacji dziur. 

Należy podkreślić, że przejście pod działaniem 
atmosfery przez wszystkie trzy rodzaje ładunku po¬ 
wierzchniowego możliwe jest jedynie w nielicznych 
wypadkach. W ogromnej większości materiałów pół¬ 
przewodnikowych obszar ten jest obszarem zuboże¬ 
nia o małej przewodności, trudnej do wydzielenia 
z całkowitej przewodności cienkich płytek. Ponadto 
w przewodnictwie powierzchniowym, obok udziału 
swobodnych elektronów i dziur w przypowierzchnio¬ 
wym obszarze ładunku przestrzennego, możliwe jest 
również przewodnictwo po samych stanach powierz¬ 
chniowych, którego nie można określić wskutek bra¬ 
ku modeli teoretycznych stanów powierzchniowych 
(a tym samym i mechanizmu przewodnictwa po sta¬ 
nach powierzchniowych). 


Efekt połowy 

W określaniu położeń energetycznych i koncentracji 
stanów powierzchniowych na powierzchniach rzeczy¬ 
wistych, a niekiedy również na powierzchniach czy¬ 
stych, pomocny jest efekt połowy. Jest to efekt pow¬ 
stający, gdy do kryształu półprzewodnikowego przy¬ 
łoży się zewnętrzne pole elektryczne w sposób po¬ 
jemnościowy. Płaska elektroda przewodząca (naj¬ 
częściej metalowa) tworzy z płytką półprzewodnikową 
kondensator płaski o pojemności C (rys. 9a). Przy¬ 
łożone napięcie U indukuje na elektrodzie i w próbce 
ładunek przeciwnego znaku o wartości Qi n <i = CU. 
Gdyby nie było stanów powierzchniowych, cały ła¬ 
dunek elektryczny indukowany w próbce przejawiał¬ 
by się jako ładunek przewodzących prąd swobodnych 


pomiar 
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b) 

Rys. 9. Układ do pomiaru efektu polowego oraz zależność prze¬ 
wodności elektrycznej cienkiej płytki germanowej typu p od na¬ 
pięcia na elektrodzie polowcj (wykres wykonany jest w funkcji 
— U, gdyż znak ładunku indukowanego w próbce jest przeciwny 
niż ładunku na elektrodzie polowej) 


zastosowanie 
w tranzysto¬ 
rze polowym 


powierzch¬ 
niowy efekt 
piezoelek¬ 
tryczny 


praca 

wyjścia 


nośników (elektronów lub dziur) Q prz ew = Gind- 
W rzeczywistości duża część indukowanego ładunku 
zostaje wychwycona i unieruchomiona w centrach 
na powierzchni próbki (czyli w stanach powierzch¬ 
niowych) i Qprzew/fiind < 1 J różnica Qind —Gprzew jest 

ładunkiem wychwyconym przez stany powierzch¬ 
niowe. O wartości Ćprzew wnioskuje się ze zmian prze¬ 
wodności płytki w funkcji napięcia U przyłożonego 
do elektrody polowej (rys. 9b). 

Przebiegi czasowe zmian przewodności przy włą¬ 
czeniu i wyłączeniu napięcia na elektrodzie umożliwia¬ 
ją określenie parametrów dynamicznych stanów po¬ 
wierzchniowych (przekroju czynnego na wychwyt 
elektronów i dziur) oraz badanie mechanizmów wy¬ 
miany ładunków między wnętrzem kryształu a stanami 
powierzchniowymi (np. zjawisk tunelowych na po¬ 
wierzchni). Efekt połowy ma także ogromne znaczenie 
praktyczne — został on wyzyskany w tranzystorze 
polowym. 

W półprzewodnikach o własnościach piezoelektrycz¬ 
nych (kryształy polarne o strukturze nie mającej 
środka symetrii) wykorzystuje się wersję efektu polo¬ 
wego, w której modulacja pola elektrycznego przy po¬ 
wierzchni odbywa się przez przyłożenie do kryształu 
jednoosiowych naprężeń mechanicznych (tzw. po¬ 
wierzchniowe efekty piezoelektryczne). Przyłożone 
naprężenia powodują powstawanie w krysztale pola¬ 
ryzacji elektrycznej. Różnica w stosunku do klasycz¬ 
nej wersji efektu polowego polega na wykorzystaniu 
pól wewnętrznych, a nie zewnętrznych, co umożliwia 
śledzenie w eksperymencie zmian pracy wyjścia. 
Praca wyjścia W y zdefiniowana jako różnica energii 
pomiędzy położeniem poziomu Fermiego w półprze¬ 
wodniku a energią elektronu w próżni, jest sumą po¬ 
winowactwa elektronowego x> odległości energe¬ 
tycznej poziomu Fermiego Ef od dna pasma prze¬ 
wodnictwa E c i energii eU s wynikającej z istnienia 
powierzchniowej bariery potencjału (rys. 6). W usta¬ 
lonych warunkach — przy określonej temperaturze 
i atmosferze otaczającej kryształ (x i Ef — Ec mają 
wówczas stałe wartości) zmiany pracy wyjścia spo¬ 
wodowane jednoosiowym naprężeniem pozwalają 
śledzić zmiany bariery powierzchniowej U 8 , a więc 
wielkości bezpośrednio związanej z ładunkiem w sta¬ 
nach powierzchniowych. 


Zjawiska fotoeiektryczne wewnętrzne 

Stany powierzchniowe odgrywają szczególnie istotną 
rolę w zjawiskach fotoelektrycznych wewnętrznych 
w ciałach stałych, np. w fotoprzewodnictwie i w pow¬ 
stawaniu fotonapięcia. Stanowią one bowiem do¬ 
datkowy kanał rekombinacyjny, a także biorą bez¬ 
pośrednio udział w pochłanianiu promieniowania 
elektromagnetycznego padającego na kryształ. Wiel¬ 
kość obserwowanego efektu zależy od generacji, 
czyli ilości dodatkowo wytwarzanych swobodnych 
nośników — i od procesu odwrotnego, tzn. rekombi¬ 
nacji (anihilacji) — zaniku generowanych nośników. 
Parametrem opisującym rekombinację par elektron- 
-dziura, a zatem i fotoefekt przy stałej generacji jest 
czas życia generowanych par. Czas ten dla określonego 
kryształu jest tym dłuższy, im mniej jest centrów 
rekombinacyjnych (poziomów lokalnych w przer¬ 
wie wzbronionej). Stany powierzchniowe, które są do¬ 
datkowym, obok istniejących we wnętrzu kryształu, 
kanałem rekombinacyjnym zmniejszają czas życia 
generowanych nośników. Rekombinacja w stanach 
powierzchniowych (rys. 10) wpływa na zależność 
czasu życia od grubości kryształu bądź od głębokości 
wnikania światła. Jeśli światło jest słabo absorbowane 



Rys. 10. Przykład działania stanów powierzchniowych jako cen¬ 
trów rekombinacji. Pary elektron-dziura, generowane światłem 
o energii hv większej od przerwy energetycznej E Vt anihilują szyb¬ 
ciej w obecności stanów powierzchniowych 


(energia padających fotonów odpowiada podstawo¬ 
wej krawędzi absorpcji), generacja par jest jednorod¬ 
na w całej objętości kryształu i w bardzo grubych 
płytkach rekombinacja powierzchniowa nieznacznie 
zmienia czas życia. Natomiast w cienkich kryształach 
(rzędu kilkunastu pm) procesy generacji i rekombina¬ 
cji zachodzą przy powierzchni i na czas życia duży 
wpływ ma rekombinacja powierzchniowa. Tak więc 



długość fali 

Rys. 11. Rozkład spektralny fotoprzewodności siarczku kadmu 
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gdy płytki są cienkie — przy generacji jednorodnej 
obserwuje się silną zależność czasu życia od grubości 
płytki. Jeśli współczynniki absorpcji są duże, światło 
pochłaniane jest w obszarze przypowierzchniowym 
(w przybliżeniu w warstwie o grubości równej od¬ 
wrotności współczynnika absorpcji), a zatem grubość 
płytki jest mało istotnym parametrem. Wynika to 
stąd, że grubość kryształu jest zawsze co najmniej 
kilka razy większa od głębokości wnikania światła. 
Przy generacji przypowierzchniowej szczególnie uprzy¬ 
wilejowana jest więc rekombinacja przez stany po¬ 
wierzchniowe i prawie nie zależy od grubości krysz¬ 
tału a jedynie od stanu powierzchni (ilości centrów 
rekombinacyjnych na powierzchni). Przejawem silnej 
rekombinacji powierzchniowej jest występowanie 
maksimum w rozkładzie spektralnym fotonapięcia, 
fotoprzewodności itp. Przy energii fotonów większej 
od przerwy energetycznej, w obszarze wzrastającego 
nadal współczynnika absorpcji, zamiast spodziewane¬ 
go wzrostu np. fotoprzewodności obserwuje się jej 
zmniejszenie, spowodowane rekombinacją powierz¬ 
chniową (rys. 11). 

ujemny Rekombinacja powierzchniowa jest zjawiskiem 
wpływ re- ujemnie wpływającym na pracę wszystkich fotoele- 
kombinacji mentów, a zwłaszcza fotoogniw i złącz laserowych, 
powierzch- Na przykład przy niewłaściwej obróbce powierzchni 
niowej gęstość stanów powierzchniowych może tak wzrosnąć, 
że wskutek rekombinacji powierzchniowej wielkość 
fotonapięcia będzie znacznie mniejsza od spodziewa¬ 
nej, wynikającej z własności kryształu i wielkości 
generacji. 

Udział stanów powierzchniowych w pochłanianiu 
światła padającego na kryształ związany jest z in¬ 
dukowanymi światłem przejściami elektronowymi 
przedstawionymi na rys. 12. Jest to pochłanianie 
nieznaczne, bezpośrednio mierzalne jedynie przy wy¬ 
korzystaniu wielokrotnego odbicia światła od po- 


elektrycznego w przypowierzchniowym obszarze ła¬ 
dunku przestrzennego, co prowadzi do mechanicznego 
odkształcenia cienkich płytek. Pomiar amplitudy 
drgań w funkcji energii fotonów pozwala m.in. na 
bezpośrednie określenie położenia energii stanów 
powierzchniowych. 



Rys. 13. Wzbudzanie drgań cienkich płytek piezoelektrycznych 
przerywanym strumieniem światła monochromatycznego i re¬ 
jestrowanie ich jako odchylenie odbitego od kryształu promienia 
lasera oraz typowe zależności amplitudy drgań kryształów arsen¬ 
ku galu i siarczku kadmu (grubości 20 pm) od długości fali świa¬ 
tła pobudzającego drgania 



Rys. 12. Schematyczne przedstawienie przejść elektronowych do 
» zc stanów powierzchniowych przy absorpcji fotonów o odpo¬ 
wiedniej energii hv 


wierzchni. W sposób pośredni można je wykryć 
dzięki towarzyszącym tym przejściom zmianom kon¬ 
centracji nośników ładunku w próbce, modyfikacji 
procesów rekombinacji lub zmianie obsadzenia 
stanów powierzchniowych. Stosowane w praktyce me¬ 
tody sprowadzają się w zasadzie do pomiarów foto¬ 
napięcia w funkcji energii fotonów w obszarze hv < Eg. 
W najnowszej z tych metod, tzw. spektroskopii foto- 
spektro- napięcia powierzchniowego, wykorzystuje się zjawis- 
skopia ko zmiany potencjału powierzchniowego (zmiany 
fotonapięcia spadku napięcia na przypowierzchniowym obszarze 
powierzch- ładunku przestrzennego — rys. 6) przy oświetleniu, 
niowego wynikające ze zmiany ładunku elektrostatycznego 
w stanach powierzchniowych pod wpływem przejść 
indukowanych światłem. W kryształach o właściwoś¬ 
ciach piezoelektrycznych, możliwa jest do zrealizo¬ 
wania niezwykle prosta wersja spektroskopii foto¬ 
napięcia powierzchniowego, polegająca na analizie 
wzbudzonych światłem drgań mechanicznych cienkich 
płytek (rys. 13). Wywołana światłem zmiana ładunku 
w stanach powierzchniowych wywołuje zmianę pola 


Fotoomisja (zjawisko fotoelektryczne 
zewnętrzne) 

Jeśli energia fotonów padających na powierzchnię 
jest dostatecznie duża, obserwuje się efekt wybija¬ 
nia elektronów z materiału do otoczenia (zjawisko 
fotoemisji). W przypadku metali próg fotoemisji próg 
(minimalna energia fotonów, przy której obserwuje fotoemisji 
się efekt) pozwala określić pracę wyjścia, czyli różnicę 
pomiędzy energią elektronu w próżni i energią po¬ 
ziomu Fermiego w materiale. W przypadku izola¬ 
torów i niezwyrodniałych półprzewodników, poziom 
Fermiego leży w przerwie energetycznej, stąd też 
obecność elektronów na poziomie Fermiego może wy¬ 
nikać jedynie z istnienia poziomów lokalnych i ich 
koncentracja jest niewielka. Próg fotoemisji pojawia 
się zatem nie przy energii fotonów równej pracy 
wyjścia, lecz przy energii hv P = x+A%+Eg (rys. 14), 
odpowiadającej wybijaniu elektronów z pasma wa- 



metal 


próżnia 


warstwa 

adsorbowana 


praca 

wyjścia 

W 



a) b) 

Rys. 14. Emisja elektronów przy absorpcji fotonów: a) z metalu, 
b) 2 półprzewodnika; hvm i hvp oznaczają energie progowe od¬ 
powiednio metalu i półprzewodnika 
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lencyjnego. Porównanie wielkości hv p i pracy wyjścia 
(mierzonej innymi metodami) pozwala wnioskować 
jak jest położony poziom Fermiego na powierzchni 
kryształu. Położenie poziomu Fermiego zdetermino¬ 
wane jest ładunkiem elektrycznym w stanach po¬ 
wierzchniowych. Badania fotoemisji w ultrawysokiej 
próżni, połączone z oczyszczaniem powierzchni, 
pozwalają wnioskować o skoku energii potencjalnej, 
Ax> na warstwie adsorbowanej. W ostatnim okresie 
szczególne zainteresowanie wzbudzają precyzyjne 
pomiary fotoemisji wywołanej fotonami o energiach 
poniżej energii progowych. Elektrony mogą być wy¬ 
bijane do otoczenia ze stanów powierzchniowych zlo¬ 
kalizowanych w przerwie energetycznej. 


Fononowe stany powierzchniowe 

Obok omówionych wyżej elektronowych stanów po¬ 
wierzchniowych wzrasta zainteresowanie drganiami 
sieci krystalicznej (-> Dynamika sieci krystalicaiej) 
o amplitudzie zanikającej wykładniczo przy przejściu 
od powierzchni w głąb kryształu — tzw. fononowymi 


stanami powierzchniowymi. Inaczej, są to fonony zlo¬ 
kalizowane na powierzchni kryształu. Podobnie jak 
elektronowe stany powierzchniowe, występują na po¬ 
wierzchniach rzeczywistych i czystych i ich natura 
wiąże się zarówno ze strukturą powierzchni, jak też 
z adsorbowanymi na powierzchni molekułami. Fono¬ 
ny powierzchniowe występują zarówno jako drgania 
normalne akustyczne, jak też optyczne, a ich energie 
leżą zazwyczaj w obszarze energii wzbronionych we 
wnętrzu kryształu (poniżej energii objętościowych 
fononów optycznych i powyżej maksymalnej energii 
objętościowych fononów akustycznych). Obok roli 
w określaniu np. termicznych własności kryształów 
lub procesów rozproszeniowych, badania fononów po¬ 
wierzchniowych są uzupełnieniem do badań elektrono¬ 
wych stanów powierzchniowych — obie problematyki 
opierają się na tych samych modelach struktury po¬ 
wierzchni i oddziaływania z otaczającą atmosferą. 

S. G. Dayison, J. D. Leyine Surface States. New York 1970 
(ros. Moskwa 1973); D. R. Frankl Electrical Properties of Se - 
miconductor Surfaces, Oxford 1967; A. Many, Y. Goldstein, 
N. B. Grover Semiconductor Surfaces. Amsterdam 1971; C. G. 
Scott, C. E. Reed, Surface Physics of Phosphors and Semicon¬ 
ductor s, London 1975. 


Wysokie ciśnienia 

Tadeusz Suski 


Układ poddany działaniu ciśnienia zmienia się pod 
różnymi względami. Gaz lub para może zamieniać się 
w ciecz, ciecz — w ciało stałe lub odwrotnie, struktura 
ciała stałego może ulec przeobrażeniu w wyniku zmia¬ 
ny układu atomów. Ciśnienie może wpływać na szyb¬ 
kość i sposób krystalizacji, stopień rozpuszczalności 
jednej substancji w drugiej, może też wpływać na zmia¬ 
nę szybkości zachodzenia wielu reakcji chemicznych. 

Geologia i geofizyka bada rezultaty działania ciś¬ 
nienia w procesie tworzenia się skał i minerałów na 
wysokie Ziemi i we Wszechświecie. Opisuje zjawiska zacho- 
ciśniersić dzące we wnętrzu Ziemi czy innych planet. Zasadnicze 
w przyrodzie znaczenie dla poznania tych zjawisk ma możliwość od¬ 
tworzenia w laboratorium warunków, które decydują 
o zachodzeniu w przyrodzie badanych procesów. Naj¬ 
ważniejszymi parametrami określającymi te warunki 
są wysokie ciśnienia i towarzyszące im wysokie tem¬ 
peratury. Rysunek 1 ilustruje obszary występowania 
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ciśnienie atmosferyczne 


Rys. I. Występowanie wysokich ciśnień w przyrodzie 


wysokich ciśnień w przyrodzie. Dla porównania przed¬ 
stawiono górne granice ciśnień osiąganych w labora¬ 
toriach. 

Inżynieria materiałowa koncentruje się na wyko¬ 
rzystaniu wysokich ciśnień do otrzymywania nowych 
materiałów. Specjalnie prowadzone procesy technolo¬ 
giczne umożliwiają uzyskanie substancji o bardzo 
korzystnych własnościach, np. o wyjątkowej wytrzy¬ 
małości mechanicznej czy też odporności termicznej. 
Wysokie ciśnienia umożliwiają również szersze sto¬ 


sowanie technologii obróbki plastycznej materiałów, 
co prowadzi do znacznej poprawy własności uzyskiwa¬ 
nych elementów. 


Metody otrzymywania wysokich ciśnień 

Do otrzymywania wysokich ciśnień w laboratoriach 
stosuje się aparaturę różnych typów i konstrukcji. 
Różnice w ich budowie zależą od wielkości uzyskiwa¬ 
nych ciśnień, zakresu temperatur, objętości komory, 
aktywności chemicznej stosowanych materiałów. 
Specjalne warunki eksperymentalne, jak na przykład 
konieczność prowadzenia badań elektrycznych, op¬ 
tycznych, magnetycznych czy rentgenowskich, na¬ 
rzucają dodatkowe wymagania co do ich rozwiązań 
konstrukcyjnych. 

W klasyfikacji aparatury wysokociśnieniowej czę¬ 
sto stosuje się podział wg rodzaju ośrodka prze¬ 
kazującego ciśnienia i odpowiednio dzieli się je 
wtedy na aparaturę gazową, cieczową oraz aparaturę, 
w której ośrodkiem przekazującym ciśnienie jest cia¬ 
ło stałe. Doświadczenia wymagające wysokiej pre¬ 
cyzji pomiaru prowadzone są na ogół w ciśnieniowych 
urządzeniach gazowych. Natomiast tam, gdzie głów¬ 
nym celem jest uzyskanie jak najwyższych ciśnień, sto¬ 
suje się aparaturę, w której ośrodkiem przekazującym 
ciśnienie jest ciało stałe. Przy doborze najodpowied¬ 
niejszego urządzenia ciśnieniowego konieczny jest na 
ogół kompromis pomiędzy wygodą w prowadzeniu 
badań a trudnościami wytworzenia wysokiego ciś¬ 
nienia. 

Największą jednorodność ciśnienia gwarantują 
aparatury gazowe. Sprężanie gazów utrudnia jednak 
ich duża ściśliwość oraz konieczność uszczelnienia 
aparatury. Trudności te zmniejszają się oczywiście 
przy zastosowaniu urządzeń cieczowych oraz urzą¬ 
dzeń z ciałem stałym. Ze względu na dużą ściśliwość 
gazów sprężanie ich odbywa się w kilku etapach w cy¬ 
lindrach z ruchomymi tłokami (rys. 2a; il. 59, tabl. 16). 
Sprężony gaz przekazuje się elastyczną kapilarą do 
specjalnie przystosowanej dla danego rodzaju pomia¬ 
rów komory. Wygląd jednej z takich komór przedsta¬ 
wia il. 57 na tabl. 16. 

Maksymalne ciśnienie w aparaturach gazowych nie 
przekracza na ogół 1500 MPa. W tym zakresie ciśnień 
metody badawcze są tak rozwinięte, że możliwe jest 
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przeprowadzenie doświadczeń tak jak w warunkach 
normalnych (tzn. przy ciśnieniu atmosferycznym ok. 
1000 hPa). 
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Rys. 2. Podstawowe typy urządzeń do wytwarzania wysokich 
ciśnień statycznych: a) układ tłok-cylinder, b) kowadło Bridg- 
manna (otaczający próbkę pirofilit jest ośrodkiem przekazującym 
ciśnienie i stanowi izolację termiczną między kowadłami a tło¬ 
kiem i wewnętrznie grzaną próbką), c) urządzenie wielokowadłowe 
Kalla, d) urządzenia typu „belt” 


aparatura Aparaturę cieczową można stosować w znacznie 
cieczowa mniejszym zakresie temperatur niż aparaturę gazową. 

W niskich temperaturach ciecze zestalają się już przy 
bardzo małych ciśnieniach. W wysokich temperatu¬ 
rach ciecz staje się chemicznie niestabilna. Utrudnione 
jest również prowadzenie badań optycznych, gdyż 
ciecze są znacznie mniej przezroczyste niż gazy. 
Urządzenia cieczowe są natomiast znacznie prostsze 
w konstrukcji i łatwiejsze w użyciu niż gazowe. Sprę¬ 
żanie odbywa się tu na ogół również w cylindrze 
z ruchomym tłokiem, jednak ze względu na mniejszą 
ściśliwość wystarcza jeden etap sprężania. Ponadto 
w aparaturze cieczowej trudności z zapewnieniem 
szczelności są znacznie mniejsze niż w aparaturze ga¬ 
zowej. Za pomocą komór cieczowych można uzyskać 
ciśnienie 3 a nawet 5 GPa. 

aparatura Aparatura ciśnieniowa z ośrodkiem stałym, nazy- 
z ciałem wana też często aparaturą kwazihydrostatyczną, 
stałym umożliwia uzyskanie najwyższych ciśnień (rys. 2b, 
c, d). Wytworzone ciśnienia są jednak niejednorodne, 
a bardzo mała objętość komory roboczej ogranicza 
możliwości eksperymentalne do obserwacji jedynie 
dużych, jakościowych efektów najczęściej związanych 
z przemianami fazowymi. W urządzeniach takich jak 
przedstawione na rys. 2b możliwe jest obecnie uzyska¬ 
nie ciśnień do 100 GPa. 

Do uzyskania największych ciśnień stosuje się 
technikę ciśnień dynamicznych. Polega ona na wyko¬ 
rzystaniu fali uderzeniowej powstającej w wyniku 
eksplozji (—► Fale uderzeniowe), co pozwala uzyskiwać 
ciśnienia rzędu 10 4 GPa. Wadą ograniczającą możli¬ 
wości stosowania tej techniki jest trudność kontrolo¬ 
wania warunków doświadczenia, ponieważ ciśnienie 
działa w okresach mikrosekundowych. Ponadto 
fala uderzeniowa powoduje wzrost temperatury do 
kilku tysięcy stopni. 
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Procesy zachodzące przy wysokim ciśnieniu 

Interpretację zachowania się substancji poddanych 
działaniu wysokich ciśnień ułatwia reguła Le Chatelie- reguła Le 
ra. Mówi ona, że układ w stanie równowagi poddany Chateliera 
działaniu sił zewnętrznych dąży do zminimalizowania 
efektu działania przyłożonych sił. Dlatego też ciśnie¬ 
nie dąży do zahamowania wszelkich procesów prowa¬ 
dzących do wzrostu objętości układu i faworyzuje 
reakcje, których wynikiem jest zmniejszenie tej obję¬ 
tości i, wiążący się z tym, wzrost gęstości. 

Regułę Le Chateliera można zilustrować rozważa¬ 
jąc równanie stanu f(p y T) = 0, wiążące termodyna¬ 
miczne parametry stanu: ciśnienie p, gęstość q i tempe¬ 
raturę T. Równanie stanu można przedstawić jako po¬ 
wierzchnię w przestrzeni trójwymiarowej o współrzęd¬ 
nych p> g, T. Każdy z punktów tej powierzchni od¬ 
powiada stanowi, w którym sąsiadujące fazy znajdują 
się w równowadze. Na wykresie (rys. 3) można wyróż¬ 
nić trzy oddzielne obszary odpowiadające trzem sta¬ 
nom skupienia substancji: gazowi, cieczy i ciału sta¬ 
łemu. Faza gazowa i stała znajdują się w równowadze 
wzdłuż krzywej sublimacji: faza stała i ciekła — 
wzdłuż krzywej topnienia (krzepnięcia), a gazowa i cie¬ 
kła— wzdłuż krzywej wrzenia (kondensacji). Każdy 



Rys. 3. Równanie stanu f(p,p< T ) = 0. Rzut powierzchni p f p, T 
na płaszczyznę pT 


punkt tych trzech krzywych odpowiada stanowi (o- 
kreślonemu przez ciśnienie i temperaturę), w którym 
mogą istnieć dwie fazy, a punkt potrójny jest charakte¬ 
rystyczny jako jedyny punkt współistnienia wszystkich 
trzech faz. Należy zauważyć, że krzywa wrzenia nie 
istnieje dla ciśnień i temperatur wyższych niż kry¬ 
tyczne ( pk , Tk). Oznacza to, że można przeprowadzić 
ciecz w gaz w sposób ciągły, nie przekraczając linii 
przejścia fazowego, zwiększając ciśnienie i temperaturę 
powyżej wartości krytycznych. 

W gazie, przy temperaturze powyżej krytycznej, 
wzrost ciśnienia prowadzi do zmniejszenia odległości 
międzyatomowych lub międzycząsteczkowych. Przy wpływ 
ciśnieniach rzędu 10 4 MPa objętość zmniejsza się ciśnienia 
tysiąckrotnie w stosunku do objętości w warunkach na objętość 
normalnych. Poniżej punktu krytycznego, zgodnie 
z równaniem stanu konkretnej substancji, może na¬ 
stąpić przemiana w fazę ciekłą. Wzrost ciśnienia do 
około 5 GPa powoduje 20-50% zmniejszenie obję¬ 
tości cieczy. Ciśnienie podwyższa temperaturę top¬ 
nienia substancji, które krzepną ze zwiększeniem gęs¬ 
tości fazy stałej (rys. 3). W wypadku substancji 
takich jak woda, mających fazę stałą o mniejszej 
gęstości niż ciekła, temperatura krzepnięcia ulega 
obniżeniu ze wzrostem ciśnienia. Na przykład tempe¬ 
ratura krzepnięcia wody przy 200 MPa wynosi —20°C. 

Powyżej 200 MPa woda krystalizuje w innych fazach 
stałych o większej gęstości niż ciecz, a temperatura 
krzepnięcia wzrasta ze wzrostem ciśnienia. Przy 
4500 MPa krzepnięcie zachodzi w temperaturze 
190°C. 

Ciała stałe są mniej ściśliwe niż ciecze, przy czym 
ściśliwość zarówno jednych jak i drugich maleje 
ze wzrostem ciśnienia. Oprócz ciągłych zmian obję¬ 
tości obserwuje się również zmiany skokowe (rys. 4) 
związane z przemianami fazowymi. Nie istnieje ogól¬ 
na reguła pozwalająca przewidzieć dla danej sub¬ 
stancji liczbę możliwych faz i rodzaj przemian fa¬ 
zowych w warunkach działania wysokiego ciśnienia. 











Dopiero wszechstronne określenie mikroskopowej bu¬ 
dowy substancji (symetria rozkładu atomów, ich ro¬ 
dzaj, charakter i wielkość oddziaływań między nimi) 
pomaga zrozumieć jej zachowanie się w warunkach 
działania ciśnienia. 


o 



ciśnienie 

Rys. 4. Zależność objętości różnych ciał stałych od ciśnienia 


Z punktu widzenia atomowej struktury materii 
każda substancja stanowi układ elektronów i rdzeni 
atomowych. Liczba rdzeni atomowych w molu sub¬ 
stancji jest rzędu liczby Avogadra, tzn. 10 23 . W wielu 
zagadnieniach fizyki ciała stałego rozważa się nie¬ 
zależnie zachowanie się elektronów i sieci krysta¬ 
licznej. W innych wypadkach konieczne jest wzięcie 
pod uwagę oddziaływań między tymi dwoma układa¬ 
mi. Istnieją przemiany fazowe, w których zachodzą 
zmiany w strukturze układu elektronów przy zacho¬ 
waniu symetrii rozkładu atomów, tzw. izotypia. 
Mechanizm przemian fazowych ze zmianą struktury 
krystalicznej polegający na przesunięciach atomów, 
przemiany czyli zmianie nie tylko ich odległości ale i symetrii, 
polimorficzne prowadzi do tzw. przemian polimorficznych. Mogą 
być one zapowiadane przez charakterystyczne zmiany 
w strukturze energetycznej drgań cieplnych atomów 
(fononów). Opis i interpretacja wielu przemian fazo¬ 
wych wymaga jednak dokładnego zbadania obu pod- 
układów (elektrony, rdzenie atomowe) wraz z ich 
wzajemnymi oddziaływaniami. 

Na przykładzie cezu poddanego działaniu wysokie¬ 
go ciśnienia pokażemy możliwości modyfikacji, które 
potencjalnie tkwią w stosunkowo mało skomplikowa- 



Rys. 5. Wykres fazowy cezu 


nym układzie atomów. Cez w wysokich ciśnieniach cez pod 

wykazuje zarówno polimorficzną przemianę fazową wysokim 

jak i izostrukturalną (bez zmiany symetrii rozkładu ciśnieniem 

atomów) przemianę elektronową, poza tym staje się 

nadprzewodnikiem. Badania metodami dyfrakcji 

nautronów i promieni rentgenowskich prowadzone 

w temperaturze pokojowej wykazały trzy wartości 

ciśnienia, przy których występuje skokowa zmiana 

objętości tego metalu. Pierwsza osobliwość występuje 

przy 2,37 GPa (rys. 5). Przy tym ciśnieniu następuje 

polimorficzną przemiana fazowa. Towarzyszy jej 

zmiana objętości o około 0,6%; stosunek objętości 

komórki elementarnej cezu po przemianie do objętości 

tej komórki przy ciśnieniu atmosferycznym wynosi 

VjV 0 = 0,63. Przed przemianą fazową atomy tworzą 

sieć przestrzennie centrowaną (bcc), po przemianie — 

płasko centrowaną (fcc ). 

Następna nieciągłość występuje przy 4,22 GPa; 
skok objętości wynosi ok. 9% (VIV 0 = 0,45). Można 
przyjąć, że jest to przemiana izostrukturalna pierw¬ 
szego rodzaju. Struktura nowej fazy jest również płas¬ 
ko centrowana. W rezultacie działania ciśnienia 
zmniejszeniu ulegają atomy cezu. Uważa się, że prze¬ 
miana ta polega na zmianie stanu elektronowego cezu 
z 6s -> 5d. Elektron z powłoki o większym promieniu 
zostaje „wciśnięty” w powłokę o mniejszym promie¬ 
niu. 

Trzecia przemiana Cs III do Cs IV zachodzi przy 
4,27 GPa; objętość maleje o 2,4% (V/V 0 = 0,41). 

Struktura fazy Cs IV nie jest znana. Powyższe zmiany 
są także wykazywane w pomiarach oporu elektrycz¬ 
nego w funkcji ciśnienia. Skokową zmianę właściwoś¬ 
ci cezu obserwuje się ponadto przy ok. 12 GPa. Obni¬ 
żenie temperatury do 1,5 K przy tym ciśnieniu powo¬ 
duje pojawienie się fazy nadprzewodzącej cezu. 


Elektrony i ciśnienie 

Wskutek zbliżania się do siebie atomów tworzących 
pierwotnie układ nie oddziałujących ze sobą cząstek, 
z dyskretnych poziomów energetycznych elektro- wpfyw ciś- 
nów formują się pasma energetyczne (—► Struktura nienia na 
elektronowa ciał stałych). Szerokość przerwy pomię- przerwę ener- 
dzy pasmami, szerokość samego pasma oraz nakłada- getyczną 
nie się pasm zależą od charakteru oddziaływań między 
atomami kryształu. Działanie ciśnienia modyfikuje 
te oddziaływania i prowadzi do obniżenia wielkości 
obszarów energii zabronionej między pasmami (np. 
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Rys. 6. Przewodność właściwa par rtęci w funkcji ciśnienia i gę¬ 
stości 
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między pasmem walencyjnym i przewodnictwa w pół¬ 
przewodnikach) albo wzrostu wielkości nakładania się 
tych pasm, a więc do wzrostu własności metalicznych 
badanej substancji. 

Zachowanie się większości substancji potwierdza 
ten ogólny wniosek. Obserwacja przewodnictwa elek¬ 
trycznego par metali poddanych działaniu ciśnienia 



Rys. 7. Zależność przerwy energetycznej rtęci od gęstości; 
V 0 objętość rtęci w 0 & C i przy ciśnieniu 100 MPa 



Rys. 8. Zależność oporu elektrycznego iterbu od temperatury, 
przy różnych ciśnieniach. Przy ciśnieniu około 1400 MPa widać 
zmianę charakteru funkcji R = f(T) z zależności odpowiadającej 
metalom na zależność odpowiadającą półprzewodnikom 
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wykazuje takie tendencje. Wzrost gęstości par w wa¬ 
runkach powyżej temperatury krytycznej (nie ma moż¬ 
liwości utworzenia się fazy ciekłej w wyniku konden¬ 
sacji par) prowadzi do powstania struktury pasmowej, 
pojawienia się przerwy energetycznej, a następnie 
jej zamknięcia. W rezultacie powoduje to ciągłe 
przejście od własności dielektrycznych przez półprze¬ 
wodnikowe do metalicznych. Przeprowadzono wiele 
doświadczeń obejmujących pomiary przewodności 
elektrycznej, siły termoelektrycznej, efektu Halla oraz 
absorpcji optycznej ciekłej i gazowej rtęci. Zmiana 
gęstości par rtęci od 2 do 6 g/cm 3 przy ciśnieniu nie 
przekraczającym 200 MPa odpowiadała zmianie prze¬ 
wodności elektrycznej o sześć rzędów. Rys. 6 przed¬ 
stawia zależność przewodności par rtęci w funkcji- 
ciśnienia i gęstości w temperaturze 1550°C, a rys. 7 
ilustruje zależność wielkości przerwy energetycznej 
od zmiany gęstości spowodowanej działaniem wyso¬ 
kiego ciśnienia. 

Przy bardzo wysokich ciśnieniach obowiązuje ogól¬ 
na zasada stwierdzająca, że działaniu ciśnienia towa¬ 
rzyszy wzrost charakteru metalicznego substancji. 
Przy ciśnieniach pośrednich obserwuje się jednak 
również zmianę własności w kierunku przeciwnym. 
Ciśnienie wywołuje przemiany metal-półprzewodnik 
czy metal-izolator. W ten sposób zachowuje się np. 
iterb (rys. 8), wapń, stront i bizmut. Przy określonych 
wartościach ciśnienia i temperatury w metalach tych 
„otwiera się” przerwa energetyczna. Warto również 
wspomnieć o zachowaniu się kryształów półprze¬ 
wodnikowych. Na przykład w germanie pod wpływem 
działania ciśnienia przerwa energetyczna początkowo 
rośnie, następnie przechodzi przez maksimum i od ciś¬ 
nień rzędu 4000 MPa ulega zmniejszeniu. Podobne 
wyniki uzyskiwano przy badaniach antymonku galu 
GaSb. Natomiast zachowanie się fosforku galu GaP 
potwierdza ogólną tendencję wzrostu właściwości 
metalicznych wraz z ciśnieniem, i to w pełnym zakresie 
przykładanego ciśnienia. 


Sieć krystaliczna i ciśnienie 

Zmiana odległości między tworzącymi ciało stałe 
atomami powoduje zmianę ich wzajemnych oddziały¬ 
wań, a w konsekwencji zmianę częstości ich drgań ter¬ 
micznych {oh). Gdy substancja poddana jest równo¬ 
miernemu ściskaniu, jej objętość ulega zmniejszeniu, 
atomy drgają wokół położeń o większym udziale sił 
odpychających (-*• Dynamika sieci krystalicznej). 
Wskutek tego powinna znacznie wzrosnąć częstość a>». 
Potwierdzają ten wniosek wyniki pomiarów przy 
wysokich ciśnieniach. Wzrost obserwowano 
w substancjach z wiązaniami jonowymi, kowalencyj¬ 
nymi oraz w kryształach molekularnych. Odbiciem 
tych zmian mikroskopowych jest wzrost współczyn¬ 
ników sprężystości ciał stałych przy wzroście ciśnienia. 
Obserwowane w niektórych kryształach obniżenie 
częstości jednego czy kilku typów drgań termicznych 
atomów wraz ze wzrostem ciśnienia można traktować 
jako zapowiedź utraty stabilności sieci krystalicznej. 
W rezultacie następuje polimorficzna przemiana fa¬ 
zowa; zmienia się symetria rozkładu atomów oraz ich 
wzajemne odlegości. Sytuacja taka powstaje w wielu 
kryształach ferroelektrycznych, na przykład w PbTi0 3 , 
SbSi, a także w kryształach półprzewodnikowych, 
na przykład CdS. 

Występowanie większej lub mniejszej ściśliwości 
oraz polimorficznych przemian fazowych różnorod¬ 
nych substancji związane jest z możliwościami zwięk¬ 
szenia gęstości upakowania atomów czy cząsteczek 
w strukturze substancji. Przypomnieć tu można prze¬ 
mianę fazową w cezie przy 2,37 GPa, podczas której 
przebudowuje się struktura bcc w bardziej gęstą fcc. 
Rodzaj wiązań chemicznych decyduje o istnieniu ta¬ 
kiej a nie innej struktury krystalicznej. Struktura kry¬ 
ształów molekularnych (np. kryształy gazów szlachet¬ 
nych o słabych wiązaniach międzycząsteczkowych 


wzrost cha¬ 
rakteru me¬ 
talicznego 


wpływ ciś¬ 
nienia na 
sprężystość 









modyfikacja i małej gęstości) ulega łatwiej zmianom pod wpływem 
struktur kry- ciśnienia. Dla lodu, który jest również kryształem mo- 
stalicznych lekularnym, określono osiem modyfikacji krystalicz¬ 
nych, istniejących w warunkach różnych ciśnień i tem¬ 
peratur. Kryształy z wiązaniami metalicznymi są na 
ogół mniej ściśliwe od kryształów molekularnych. 
Podobnie jest dla struktur łańcuchowych (parafina), 
czy warstwowych (grafit). Struktury te wykazują 
znaczne zróżnicowanie ściśliwości w różnych kierun¬ 
kach krystalograficznych. Silne wiązania kowalencyj¬ 
ne ograniczają możliwość zwiększenia upakowania 
pod wpływem ciśnienia — substancje z tymi wiąza¬ 
niami należą do najmniej ściśliwych, np. diament 
jest ponad 200 razy mniej ściśliwy niż cez. 


N adprzewod n icf wo 

Głównym mikroskopowym mechanizmem nadprze¬ 
wodnictwa jest oddziaływanie przyciągające między 
elektronami, realizowane za pośrednictwem sieci kry¬ 
stalicznej (oddziaływanie elektron-fonon). Im większe 
jest to oddziaływanie, tym wyższa temperatura Tk 
przejścia do stanu nadprzewodzącego (-* Nadprze¬ 
wodnictwo). Ciśnienie — przez modyfikacje struktur 
krystalicznych lub własności elektronowych, a tak¬ 
że oddziaływania elektron-fonon — wywiera bardzo 
istotny wpływ na zjawisko nadprzewodnictwa. 

Ogromna liczba metali, związków metalicznych, 
a także związków i pierwiastków o charakterze pół¬ 
przewodnikowym w pewnych warunkach może wy¬ 
stępować w fazie nadprzewodzącej. Często warunkiem 
koniecznym pojawienia się nadprzewodnictwa jest 
działanie ciśnienia hydrostatycznego (rys. 9). Induko¬ 
wane ciśnieniem nadprzewodniki grupują się głównie 


niu pojawiają się dwie lub więcej nadprzewodzące fazy nadprze 
fazy wysokociśnieniowe. W barze przy 5,5 GPa po- wodzące 
jawia się faza nadprzewodząca (temperatura przejścia 
Tk « 1,3 K), druga przemiana fazowa zachodzi przy 
ciśnieniu około 14 GPa z Tk ~ 5 K (rys. 10). Faza 
nadprzewodząca pojawia się w cerze przy p X 5 GPa. 

Cer jest obecnie jedynym znanym pierwiastkiem wy- 



Rys. 10. Zależność względnego oporu elektrycznego baru od 
ciśnienia. Przy ciśnieniu 5,5 GPa i ciśnieniu 14 GPa zachodzą 
przemiany fazowe. Powstałe fazy mają własności nadprzewodzące 
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Rys. 9. Układ okresowy pierwiastków: kolor niebieski oznacza pierwiastki nadprzewodzące; kolor szary — pierwiastki magnetyczne; 
kratki w połowie niebieskie odpowiadają pierwiastkom nadprzewodzącym w wysokich ciśnieniach 


metale indu- w dwóch miejscach układu okresowego. Pierwiastki 
kowane z prawej strony układu Mendelejewa przy podwyż- 
ciśnieniem szaniu ciśnienia wykazują na ogół wzrost własności 
metalicznych. Te indukowane ciśnieniem metale, np. 
Ge i Si, przy wysokich ciśnieniach są bez wyjątku nad¬ 
przewodnikami, podobnie jak inne metale sąsiadujące 
w układzie okresowym (Zn, In, Sn), w których elektro¬ 
nami przewodnictwa są elektrony s i p. Z lewej strony 
sytuacja jest bardziej skomplikowana. Indukowane 
ciśnieniem nadprzewodniki bar i cez mają właściwości 
metali przejściowych, a więc i potencjalne możliwości 
by stać się nadprzewodnikami. Mają one niezlokali- 
zowane elektrony s 9 a pod wpływem ciśnienia po¬ 
jawia się dodatkowy udział silnie zlokalizowanych 
elektronów d i f. 

W wielu substancjach poddanych wysokiemu ciśnie- 



Rys. II. Zależność temperatury przejścia nadprzewodzącego 
cynku i kadmu od ciśnienia. Zmniejszenie temperatury przy 
wzroście ciśnienia jest wynikiem obniżenia oddziaływania ele¬ 
ktron-fonon 
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kazującym jednocześnie uporządkowanie magnetycz¬ 
ne i nadprzewodzące (rys. 9). 

wzrost !ub Działanie ciśnienia może prowadzić zarówno do 
obniżenie wzrostu temperatury przejścia nadprzewodzącego, jak 
temperatury również jej obniżenia. Tak na przykład obniżenie Tic 
przejścia i zanik nadprzewodnictwa dla cynku i kadmu (rys. 11) 
w warunkach działania ciśnienia jest wynikiem obni¬ 
żenia wielkości oddziaływania elektron-fonon. Po¬ 
miary przeprowadzone w szerokim zakresie ciśnień 
wskazują, że 7* wielu metali maleje liniowo ze wzro¬ 
stem ciśnienia (dTk/dp < 0). Taki przebieg jest spo¬ 
wodowany głównie wzrostem częstości drgań termicz¬ 
nych atomów wraz ze wzrostem ciśnienia. 


Zastosowanie wysokich ciśnień w inżynierii 
materiałowej 

Uważa się, że każdy materiał istniejący w przyrodzie 
może być wytworzony w warunkach laboratoryjnych. 
Diament, wysokociśnieniowa modyfikacja węgla, jest 
w temperaturze pokojowej i przy ciśnieniach poniżej 
1200 MPa fazą metastabilną termodynamicznie. 
Struktura tej metastabilnej fazy utrzymuje się nieskoń¬ 
czenie długo. Dopiero poddanie diamentu działaniu 
temperatury powyżej 1000°C, przy niskich ciśnieniach, 
prowadzi do przemiany diament-grafit. Dla grafitu 
ciśnienie 20 GPa w temperaturze pokojowej nie jest 
wystarczające do zmiany w diament. Aby zaszła taka 
przemiana, konieczne jest jednoczesne działanie wy¬ 
sokiej temperatury i ciśnienia. 

Od wielu lat podejmowano różne próby otrzymania 
syntetyczny syntetycznego diamentu, m.in. metodą podgrzewania 
diament związków węgla do wysokich temperatur przy jedno¬ 
czesnym stosowaniu wysokich ciśnień. Dokonano tego 
po raz pierwszy w Stanach Zjednoczonych (General 
Electric, 1955 r.). Sukces osiągnięto dzięki zastosowa¬ 
niu ciśnienia rzędu 10 GPa (znacznie wyższych niż 
dotychczas stosowane) jednocześnie z wysokimi tem¬ 
peraturami (ok. 1000°C). Wykorzystano dodatkowo 
działanie katalityczne stopionych metali (np. tanta¬ 
lu). Katalizatory ułatwiają zrywanie silnych wiązań 
międzyatomowych wewnątrz warstw tworzących 
grafit. Katalizator spełnia funkcję rozpuszczalnika 
dla węgla. Z tak wytworzonego roztworu wolny węgiel 
krystalizuje w postaci diamentu. Następuje to w wy¬ 
niku obniżenia stopnia rozpuszczalności diamentu 
w stosunku do rozpuszczalności grafitu w tych samych 
warunkach, tzn. w warunkach działania wysokiej 
temperatury i ciśnienia. Należy dodać, że uzyskiwano 
diament w procesie przemiany grafit-diament rów¬ 
nież bez użycia katalizatorów. Proces taki wymaga 
jednak stosowania ciśnień powyżej 12 GPa i tempera¬ 
tur w granicach 2500-3000°C. 

Poszukiwania nowych materiałów doprowadziły do 
uzyskania wielu ciekawych substancji, wytworzonych 
w warunkach wysokich i ultrawysokich ciśnień, sta¬ 
bilnych przy ciśnieniu atmosferycznym. Udało się na 
koezyt i przykład „zagęścić” kwarc (SiO^). Dwie jego fazy — 
stiszowit koezyt i stiszowit — są substancjami gęstszymi odpo¬ 
wiednio o 10% i 6%. Wytworzenie stiszowitu wymaga 
stosowania ciśnień rzędu 10 GPa przy 600°C. 

Obie laboratoryjnie wytworzone formy Si0 2 zosta¬ 
ły wykryte w kraterach meteorytów. Koezyt został 
także rozpoznany jako produkt podziemnej eksplozji 
jądrowej. Fakty te dają wyobrażenie o możliwościach 
laboratoriów r wysokociśnieniowych. Można je porów¬ 
nywać z tym co istnieje w warunkach naturalnych, 
w procesach zderzeń gigantycznych meteorytów z po¬ 
wierzchnią Ziemi, czy podczas bardzo silnych wybu¬ 
chów nuklearnych. 

Stosując wysokie ciśnienia w procesie syntezy 
różnych materiałów uzyskuje się materiały o własnoś¬ 
ciach szczególnie cennych ze względu na ich zastoso¬ 
wanie. W wielu wypadkach są to materiały nie mające 
odpowiedników w przyrodzie. Człowiek sterując 
procesami technologicznymi ma większe możliwości 
zmian — i to niezależnych — temperatury i ciśnie- 
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nia. W warunkach naturalnych procesy wzrostu i ob¬ 
niżania temperatury są ściśle związane z odpowiedni¬ 
mi wzrostami i redukcją ciśnień. Przykładem materiału 
syntetycznego nie mającego odpowiednika natural¬ 
nego jest regularna odmiana azotku boru BN (bora- 
zon). Związek ten krystalizuje w procesie podobnym 
do stosowanego przy wytwarzaniu diamentu i tworzy 
materiał o strukturze regularnej. Odznacza się ogrom¬ 
ną odpornością termiczną i dużą twardością. 

Wysokie ciśnienia znalazły wiele ważnych zasto¬ 
sowań w dziedzinie obróbki plastycznej materiałów 
zwanej hydrostatycznym wytłaczaniem lub hydroeks- hydro- 
truzją. W metodzie tej wykorzystuje się zjawisko pod- ekstruzja 
wyższenia plastyczności przy wysokim ciśnieniu. Ma¬ 
teriał wyjściowy wraz z ośrodkiem przenoszącym ciś¬ 
nienie (np. olej) zawarty jest w grubościennym cylin¬ 
drze. Cylinder ten z jednej strony zamyka matryca 
z otworem, z drugiej ruchomy tłok. Gdy wskutek 
przesuwania tłoka wzrośnie wystarczająco ciśnienie 


Rys. 13. Elementy uzyskiwane w procesie hydroekstruzji (produk¬ 
ty firmy Asea) 
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Rys. 12. Zasada procesu hydrostatycznego wytłaczania (hydro¬ 
ekstruzji) 














ośrodka ciśnieniowego, materiał (sprężany hydrosta¬ 
tycznie) przechodzi przez otwór w matrycy zmieniając 
swój kształt i zmieniając przekrój (rys. 12). Proces 
hydroekstruzji ma wiele zalet w porównaniu z innymi 
technikami obróbki plastycznej. Oto niektóre z nich: 
proces ten odbywa się w znacznie niższych temperatu¬ 
rach; własności mechaniczne uzyskiwanego materiału 
wykazują dużą jednorodność w całym przekroju. 
Ciśnienie hydrostatyczne zwiększa ciągliwość niektó¬ 
rych twardych i kruchych materiałów do takiego stop¬ 
nia, że ich deformacja następuje znacznie łatwiej (np. 
Be, V, Zr); różnorodność kształtów matrycy pozwala 
uzyskiwać prawie dowolne kształty ekstrudowanych 
elementów (rys. 13), przy czym uzyskuje się dużą do¬ 
kładność wymiarów produktu. Istnieje możliwość 
powlekania jednych materiałów innymi, należy jedy¬ 
nie stosować odpowiednio przygotowane wsady. 


Metaliczny wodór? 


żają, że ten skok odpowiada przemianie dielektrycz¬ 
nego wodoru w wodór metaliczny. Następnie zaczęto 
się zastanawiać nad możliwościami stabilizacji fazy 


Rys. 14. Zależność mię* 
dzy oporem elektrycz¬ 
nym i silą działającą na 
kosvadła w procesie 
otrzymywania metalicz¬ 
nego wodoru (7* — 4,2 
K). Zależność odpo¬ 
wiada wzrostowi ciśnie¬ 
nia 



Jeżeli się spojrzy na pierwszą kolumnę układu okreso¬ 
wego, zwraca uwagę odrębność wodoru w stosunku 
do reszty pierwiastków z tej kolumny. Są one metala¬ 
mi, a tylko wodór ma własności dielektryczne (jest 
izolatorem). Odrębność ta od dawna inspirowała wiele 
prac teoretycznych. Wielu fizyków przewidywało, że 
działanie odpowiednio wysokiego ciśnienia winno 
przeprowadzać dielektryczny wodór w metal. 

Ogromne nakłady finansowe na badania dotyczące 
tego zagadnienia związane są głównie z nadzieją 
własności rozbudzoną przez przewidywania naukowców co do 
nadprzewo- własności nadprzewodzących metalicznego wodoru, 
dzące Wyjątkowo cenną własnością ma być bardzo wysoka 
temperatura przejścia nadprzewodzącego, pomiędzy 
200-300 K. Możliwość zachowania stanu nadprzewo¬ 
dzącego nawet w 200 K (—73°C) otwierałaby zupełnie 
nowe perspektywy przed energetyką. Przewiduje się 
również, że metaliczny wodór mógłby pełnić funkcję 
wysokokalorycznego paliwa nie wprowadzającego 
zanieczyszczeń. 

Obiecujące rezultaty prowadzące do otrzymania 
metalicznego wodoru uzyskano w Instytucie Fizyki 
Wysokich Ciśnień Radzieckiej Akademii Nauk. Nau¬ 
kowcy z tego Instytutu wykorzystali gigantyczną prasę 
hydrauliczną współdziałającą z kowadłami diamento¬ 
wymi ochłodzonymi do 4,2 K. Jedno z nich jest płaskie, 
drugie ma kształt bardzo płaskiego stożka. Takie roz¬ 
wiązanie służy uzyskaniu ciśnień rzędu 100 GPa 
w centralnej części kowadeł. Przez obszar ten prze¬ 
puszczono bardzo czysty gazowy wodór, doprowadza¬ 
jąc do jego zestalenia w postaci cienkiej warstwy. 
Podczas eksperymentu mierzono prąd elektryczny 
płynący w obwodzie, w którym znajdowały się ko¬ 
wadła i warstwa zestalonego wodoru. Pojawienie się 
prądu w tym obwodzie powinno świadczyć o przekro¬ 
czeniu ciśnienia krytycznego. W opisywanym ekspery¬ 
mencie opór elektryczny zmalał o sześć rzędów (od 
10 8 do 10 2 n) przy różnych ciśnieniach leżących między 
100 i 300 GPa (rys. 14). Eksperymentatorzy uwa- 


Rys. 15. Histcreza 
zależności oporu elek¬ 
trycznego od działa¬ 
jącej na kowadła siły 
w procesie otrzymy¬ 
wania metalicznego 
wodoru (T = 4,2 K). 
Strzałki wskazują kie¬ 
runek zmian ciśnienia 



metalicznej wodoru, jego istnieniem w warunkach nor¬ 
malnych oraz możliwościami otrzymania większej 
ilości tej substancji. Znanych jest wiele substancji, 
które istnieją w fazie metastabilnej po usunięciu 
działania ciśnienia (syntetyczny diament). Uczeni 
radzieccy uważają, że bardzo obiecujące z tego punktu Histereza 
widzenia jest występowanie histerezy ciśnieniowej, ciśnieniowa 
Otóż wodór nie powraca do fazy dielektrycznej, gdy 
redukuje się ciśnienie. Pozostaje metaliczny nawet 
w chwili, gdy ciśnienie wynosi około połowy wartości 
krytycznej (rys. 15). Szuka się więc sposobów po¬ 
większenia tej histerezy do wartości gwarantującej 
stabilność uzyskanego nadprzewodnika w warunkach 
zbliżonych do normalnych. 

C. C. Bradley High Pressure Methods in Solid State Research. 

New York 1969; R. S. Bradley (ed.) Advances in High Pressure 
Research , London 1966; P. W. Bridgman The Physics of High 
Pressure , London 1952; H. G. Drickamer, C. W. Frank Electro¬ 
nic Transition and the High Pressure Chemistry and Physics of 
Solids , London 1973; S. W. Popowa, N.A. Bendeliani Wysokijc 
dawlenija, Moskwa 1974. 


MAGNETYZM 
Teoria magnetyzmu 

Jerzy Mielnicki i Bogusia w Mrygoń 

Teoria magnetyzmu obejmuje teorię właściwości 
magnetycznych izolowanych cząstek elementarnych, 
atomów i molekuł, a także zbiorów atomów lub mo¬ 
lekuł w postaci gazu, cieczy lub ciała stałego. Właści¬ 
wości magnetyczne zbioru atomów wynikają z wła- 
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ściwości magnetycznych izolowanych atomów oraz 
z charakteru oddziaływań między pojedynczymi ato¬ 
mami. Natura tych oddziaływań ma decydujące zna¬ 
czenie w kształtowaniu się określonych właściwości 
magnetycznych ciał złożonych z wielu elementarnych 


37 - Encyklopedia fizyki współczesnej 












nośników magnetyzmu. W tym sensie ferromagne¬ 
tyzm, który występuje w niektórych kryształach, jest 
zjawiskiem kolektywnym, ponieważ warunkiem ko¬ 
niecznym pojawienia się ferromagnetyzmu w ciele 
stałym są odpowiednie oddziaływania między elek¬ 
tronami. Jednolity opis właściwości magnetycznych 
elementarnych nośników magnetyzmu oraz zbiorów 
tych nośników z uwzględnieniem oddziaływań możli¬ 
wy jest jedynie w ujęciu teorii kwantowej. Podamy tu 
zarys kwantowej teorii magnetyzmu powłoki elektro¬ 
nowej atomu oraz układu atomowych momentów 
magnetycznych w ciałach stałych o budowie krysta¬ 
licznej. 


Magnetyzm atomowy 


Wiele podstawowych właściwości fizycznych ciał sta¬ 
łych wyjaśnić można znając zachowanie się elektro¬ 
nów na zewnętrznych powłokach atomów izolowa¬ 
nych. Każdy elektron ma własny moment pędu okre¬ 
ślony spinową liczbą kwantową s równą 1 / 2 . Dla spi¬ 
nu s = 1 / 2 jedyne dw'a możliwe rzuty wektora wła¬ 
snego momentu pędu na dowolnie wybrany kierunek 
kwantowa zewnętrznego pola magnetycznego mają tę samą war- 
liczba tość i określone są przez magnetyczną spinową liczbę 
magnetyczna kwantową m s : 

s lzl = m s h\ 


m s może przyjmować tylko dwie wartości dc 
fi = 1,0545887 • 10~ 3 * J • $ — stała Plancka podzielona 
moment przez 2 jc. Ze spinem elektronu związany jest moment 
magnetyczny magnetyczny, którego dwa możliwe rzuty na kieru- 
elektronu nek zewnętrznego pola magnetycznego są równe 

fx[ z] = 2 m s hb. ( 1 ) 

Wielkość jub — ehjlmc , gdzie e oznacza ładunek 
elektronu, m — jego masę spoczynkową, c — pręd¬ 
kość światła, nazywana jest magnetonem Bohra i od¬ 
grywa rolę jednostki momentu magnetycznego w skali 
atomowej. Wartości bezwzględne wektorów spino¬ 
wego momentu pędu i momentu magnetycznego wy¬ 
rażają się wzorami: 


iKi = yW+i)*, 

(2) 

\Ms\ = 2}/j(j -fi) mb. 

(3) 


Określając właściwości magnetyczne powłoki elek¬ 
tronowej atomu, oprócz momentów magnetycznych 
związanych ze spinem elektronów należy uwzględnić 
również momenty magnetyczne związane z ruchem 
orbitalnym elektronów. Pewną rolę odgrywa również 
magnetyzm jądra atomowego. Momenty magnetycz¬ 
ne nukleonów są jednak około 1000 razy mniejsze od 
momentów magnetycznych elektronów. Przykładem 
efektów związanych z momentem magnetycznym ją¬ 
dra może być nadsubtelna struktura widm atomo¬ 
wych (-* Spektroskopia atomowa) bądź jądrowy re¬ 
zonans magnetyczny. 

Wielkość wektora momentu pędu związanego z or¬ 
bitalnym ruchem elektronu wyraża się wzorem: 

|K| = VT(J+i)fi. (4) 


Orbitalna liczba kwantowa / przyjmuje wartości 

/ = 0 , 1 , 2 , ..., («— 1 ), 

orbitalny gdzie n oznacza główną liczbę kwantową. Z orbital- 
moment nym momentem pędu związany jest moment magne- 

magnetyczny tyczny 

\tn\ = //(/+1) mb (5) 


Z mechaniki kwantowej wynika bez dodatkowych 
założeń, że rzuty wektora orbitalnego momentu pędu 
na kierunek zewnętrznego pola mogą przyjmować 
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tylko ściśle określone wartości. Możliwa rzuty orbi¬ 
talnego momentu magnetycznego określone są przez 
zespół magnetycznych orbitalnych liczb kwanto¬ 
wych mi y które mogą przyjmować (2/+1) wartości, 
a mianowicie 

im = -/, -a-i),..., -i,o,i.(/—i),/- 

Mówimy więc, że wektor orbitalnego momentu pędu, 
a tym samym związany z nim moment magnetyczny, 
jest skwantowany przestrzennie (rys. 1). Wartości 



rzutu orbitalnego momentu magnetycznego elektro¬ 
nu na kierunek wyróżniony przez zewnętrzne pole 
wynoszą 


Mi U} = miMB. 


( 6 ) 


Gdy w atomie znajduje się więcej niż jeden elek¬ 
tron, suma wektorowa momentów pędu oraz suma 
momentów magnetycznych poszczególnych elektro¬ 
nów daje w wyniku wypadkowy moment pędu i mo¬ 
ment magnetyczny atomu. Możliwe są dwa sposoby 
złożenia momentów pędu elektronów w atomie. Cał¬ 
kowity moment pędu atomu można otrzymać przez 
dodanie najpierw spinowego i orbitalnego momentu 
poszczególnych elektronów, a następnie zsumowanie 
wypadkowych momentów pędu wszystkich elektro¬ 
nów. Drugi sposób, prowadzący do innych wartości 
energii poziomów energetycznych atomu, polega na 
zsumow-aniu najpierw wszystkich momentów spino¬ 
wych, a następnie momentów orbitalnych poszczę- całkowity 
gólnych elektronów'. Całkowity moment pędu atomu moment 
otrzymuje się przez dodanie wypadkowego momentu pędu atomu 

spinowego Ps i wypadkowego momentu orbitalnego 

Pl. O wyborze sposobu obliczania całkowitego mo¬ 
mentu pędu atomu decyduje wielkość oddziaływania 
pomiędzy momentem spinowym i orbitalnym elek¬ 
tronu. Zwykle sprzężenie spin-orbita jest słabe 
i słuszny jest drugi sposób sumowania momentów 
pędu. Całkowity moment pędu atomu określamy licz¬ 
bą kwantową / (liczbę tę oznacza się zazwyczaj lite¬ 
rą J). Wartości bezwzględne odpowiednich wektorów 
momentu pędu atomu określone są następującymi 
wzorami: 


!?a-| = j/S(S+l) h. 


\Pl\ = l/i-CL-rl) 


\Pl\ = ]//(/-)-1)#. 


Ponieważ wypadkowy moment spinowy i moment 
orbitalny całkowicie zapełnionej powłoki elektrono¬ 
wej atomu równe są zeru, przy obliczaniu wypadko¬ 
wych momentów atomu uwzględnia się jedynie mo¬ 
menty elektronów z powłok niezapełnionych. Z mo¬ 
mentami pędu atomu, określonymi liczbami kwan¬ 
towymi S y L i /, związane są odpowiednie momenty moment 
magnetyczne atomu ms , Mb i Mi • Zarówno moment) magnetyczny 
pędu jak i momenty magnetyczne atomu są skwanto atomu 


















wane analogicznie do momentu pojedynczego elek¬ 
tronu. Liczbom kwantowym S, L i / przyporządko¬ 
wane są odpowiednie magnetyczne liczby kwantowe 
ms , niL i nu. Stosując atomowe liczby kwantowe 
można wyrazić za pomocą wzorów (1) i (6) wartości 
możliwych rzutów spinowego i orbitalnego momentu 
magnetycznego atomu na kierunek zewnętrznego 
pola. Wartości bezwzględnego spinowego i orbital¬ 
nego momentu magnetycznego atomu określone są 
wzorami analogicznymi do wzorów (3) i (5). 

Z porównania wzorów (2) i (3) oraz (4) i (5) wyni¬ 
ka, że spinowy i orbitalny moment magnetyczny nie¬ 
jednakowo wyrażają się przez odpowiednie momenty 
pędu. Dla momentu spinowego stosunek momentu 
magnetycznego do mechanicznego jest dwa razy więk¬ 
szy niż taki sam stosunek dla momentu orbitalnego. 
Z uwagi na ten fakt kierunek wypadkowego momentu 

magnetycznego atomu n nie pokrywa się z kierunkiem 
wypadkowego momentu mechanicznego Pi. Ponie¬ 
waż ładunek elektronu jest ujemny, wektory lis i Ml 
są odpowiednio antyrównoległe do wektorów Ps i Pl. 
W skali, w której długość wektora ul równa się dłu¬ 
gości wektora Pl, długość wektora ns jest równa po¬ 
dwójnej długości wektora Ps. Graficzny obraz sumo¬ 
wania momentów mechanicznych i magnetycznych 
atomu przedstawiony jest na rys. 2. Wypadkowy mo- 



Rys. 2. Sumowanie mechanicznych i magnetycznych momentów 
atomu 

skuteczny nient magnetyczny tworzy z wektorem Pi kąt różny 
moment 0 d 180°. Można powiedzieć, że wektor fi wykonuje 
magnetyczny^ preces ję dokoła kierunku P. Skuteczny moment 
magnetyczny atomu /u rów-ny jest rzutowi wektora /i 

na kierunek wektora Pj. Wykonując odpowiednie 
obliczenia trygonometryczne znajdujemy 

l/T/i = g j/7(/+ I)mb, (7) 

gdzie 

, , 7(/+l)+5(5-ł-l)-L(Z+l) 

. * =I+ - WTi)-- (8) 

jest współczynnikiem rozszczepienia spektroskopo¬ 
wego. Możliwe wartości rzutów wypadkowego mo¬ 
mentu magnetycznego atomu m na kierunek zew¬ 
nętrznego pola określone są wzorem: 

= g nu im ; ( 9 ) 

magnetyczna liczba kwantowa atomu przyjmuje war¬ 
tości 

W przypadkach granicznych, kiedy całkowity moment 

Pi = Psy tzn. gdy L = 0, czynnik rozszczepienia 
spektroskopow-ego g = 2. W drugim skrajnym przy¬ 
padku Pi = ~P L , tzn. gdy S = 0, g = 1. Istnienie 
momentu magnetycznego atomu i omówiona powy¬ 
żej jego kwantyzacja przestrzenna zostały potwier¬ 
dzone w doświadczeniach Sterna i Gerlacha, w któ¬ 
rych badano odchylenie strumienia atomów w nie¬ 
jednorodnym polu magnetycznym. 


Diamagnetyzm 


Najbardziej naturalnym sposobem klasyfikacji sub¬ 
stancji pod względem ich właściwości magnetycznych 
jest podanie wielkości charakteryzującej reakcję oś¬ 
rodka na zewnętrzne pole magnetyczne H. Taką 
wielkością jest z definicji podatność magnetyczna 

X = MIH; 

M jest namagnesowaniem ośrodka, tzn. momentem 
magnetycznym przypadającym na jednostkę objętości. 
Substancje o dodatniej podatności nazywamy para- 
magnetykami, a o ujemnej — diamagnetykami. 

Zjawisko diamagnetyzmu jest powszechne i właści¬ 
we wszystkim bez wyjątku ciałom. Nie zawsze jednak 
zjawisko to można zaobserwować, ponieważ słaby 
efekt diamagnetyczny bywa często przesłonięty przez 
silniejszy efekt paramagnetycznego namagnesowania. 
Diamagnetyzm można obserwować łatwo i bezpo¬ 
średnio wówczas, gdy atomy, jony lub cząsteczki 
mają wypadkowy moment magnetyczny równy zeru. 
Orbity elektronowe w atomach można wyobrażać 
sobie jako kołowe obwody elektryczne o zerowym 
oporze, w których płynie prąd o stałym natężeniu. 
Przyłożenie zewnętrznego pola magnetycznego po¬ 
woduje zmianę przechodzącego przez te obwody stru¬ 
mienia indukcii magnetycznej. W orbitach elektro¬ 
nowych indukują się wówczas dodatkowe prądy, 
które płyną tak długo, jak długo działa zewnętrzne 
pole. Zgodnie z prawem Lenza momenty magne¬ 
tyczne indukowanych prądów kompensują zmianę 
strumienia indukcji magnetycznej, a więc mają kie¬ 
runki przeciwne do pola zewnętrznego. Wobec tego 
substancja złożona z atomów o wypadkowym mo¬ 
mencie magnetycznym równym zeru, umieszczona 
w zewnętrznym polu magnetycznym magnesuje się, 
przy czym zwrot wektora namagnesowania jest prze¬ 
ciwny do wektora natężenia pola. Podatność diama- 
gnetyków jest zwykle bardzo mała, rzędu —10* 6 , i nie 
zależy od temperatury. 

Do diamagnetyków należą wszystkie gazy szla¬ 
chetne, niektóre metale (np. cynk, złoto, rtęć), nie¬ 
które niemetale (np. krzem, fosfor, siarka) oraz wiele 
związków organicznych. 


Paramagnetyzm 


Zjawisko paramagnetyzmu występuje tylko w tych 
materiałach, w których atomy lub molekuły mają 
stały moment magnetyczny. Zastanówmy się, jakie 
jest namagnesowanie ośrodka zawierającego N ato¬ 
mów w jednostce objętości, z których każdy ma mo¬ 
ment magnetyczny ///, umieszczonego w zewnętrznym 

polu magnetycznym o natężeniu H. Zakładamy, że 
atomy nie oddziałują ze sobą. Namagnesowanie 
ośrodka jest wynikiem orientacji momentów magne¬ 
tycznych atomów wzdłuż kierunku przyłożonego pola 
magnetycznego pod wpływem tego pola. Drgania 
cieplne przeciwdziałają porządkującemu działaniu 
pola na momenty magnetyczne. 

Jak już wiemy, moment atomu o liczbie kwantowej 
1 ma (2/+1) możliwych orientacji w przestrzeni, 
a możliwe składowe tego momentu w kierunku pola 
określone są wzorem (9). Prawdopodobieństwo co 
danej orientacji określone jest wzorem Boltzmanna: 

<o~exp(» [ pHlkBT), 

gdzie kii oznacza stałą Boltzmanna, T —temperaturę 
bezwzględną. Iloczyn —ftpH wyraża energię od¬ 
działywania atomu z przyłożonym polem magnetycz¬ 
nym. Namagnesow-anie ośrodka równe jest 

M - A'(10) 
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gdzie oznacza wartość średnią rzutu momentu 

magnetycznego na kierunek pola, którą można obli¬ 
czyć znając wartości energii oddziaływania między 
atomem i polem, odpowiadające poszczególnym orien¬ 
tacjom momentu ///. Wartość dana jest wyra¬ 

żeniem: 

+/ 

£ /'/* ] exp (/Ą :> Hlk B T) 

J£expO tpHIkaT) 

-I 

Podstawiając zamiast // [ / ] prawą stronę równania 
(9), oraz wykonując sumowanie we wzorze (11) otrzy¬ 
mujemy : 

O 1 , z] > =gfi B IBi(x), (12) 

gdzie 

g^rnlH 
X ~ knT ’ 

funkcja a Bj{x) nazywana jest funkcją Brillouina. Na ry- 
Brillouina sunku 3 podane są wykresy Bj(x) dla kilku wartości I. 

Dla x < l (tzn. dla małych natężeń zewnętrznego 



pola magnetycznego) funkcję Bi{x) można przedsta¬ 
wić w przybliżonej postaci: 


Bt(x) = —jf-x; x<ś\. (13) 


Podstawiając prawie strony równości (12) i (13) do 
równania (10) otrzymujemy zależność namagneso¬ 
wania ośrodka od pola H: 


M — 


/(/+D 

3 k B T 


H. 


(14) 


Porównując z definicją podatności magnetycznej 
X = M/H , otrzymujemy: 

X ~ const/7. (15) 


Ośrodki, dla których słuszne jest to równanie, 
Curie znane jako prawo Curie, nazywamy paramagnetyka- 
prawo mi. Prawo Curie mówi, że podatność paramagnetyka 
nie zależy od zewnętrznego pola w zakresie małych 
jego natężeń (* < 1) i jest odwrotnie proporcjonalna 
do temperatury. Z rysunku 3 wynika, że dla dużych 
wartości x> co odpowiada fizycznej sytuacji T -* 0, 
funkcja Brillouina dąży do wartości asymptotycznej. 
Oznacza to, że dla T -* 0 namagnesowanie ośrodka 
osiąga wartość maksymalną, zwaną nasyceniem, na¬ 
wet przy bardzo małych wartościach zewnętrznego 
pola. 
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Zgodność kwantowej teorii paramagnetyzmu z wy¬ 
nikami doświadczalnymi dla wielu ośrodków wyka- przykłady 
żujących właściwości paramagnetyczne jest doskona- para¬ 
ła. Przykładami ośrodków paramagnetycznych mogą magnetyków 
być niektóre metale i pierwiastki oraz ich sole, ga¬ 
zowy tlenek azotu NO, wolne rodniki organiczne, 
jak np. trój feny lornety 1 C(C 6 H 5 ) 3 . 


Spontaniczne uporządkowanie 
magnetyczne 

Znany jest fakt, że pewne kryształy zawierające ato¬ 
my z różnym od zera momentem magnetycznym wy¬ 
kazują w dostatecznie niskich temperaturach spon¬ 
taniczne namagnesowanie w nieobecności zewnętrz¬ 
nego pola magnetycznego. Istnienie makroskopowego 
momentu magnetycznego w krysztale przy H = 0 
sugeruje, że w wyniku wzajemnego oddziaływania 
momenty magnetyczne atomów tworzą regularną 
strukturę (uporządkowanie). Rysunek 4 przedstawia 


; t 


A A 


k 


U 's. 


a) uporządkowanie 
ferromagnetyczne 


b) uporządkowanie 
antyferromagnetyczne 


c) uporządkowanie 
ferrimagnetyczne 


Rys. 4. Niektóre możliwe uporządkowania układów momentów 
magnetycznych 


trzy najbardziej typowe możliwe uporządkowania 
momentów magnetycznych w kryształach wykazują¬ 
cych spontaniczne namagnesowanie. 

Z danych doświadczalnych wynika, że dla kryszta¬ 
łów ferromagnetycznych współczynnik rozszczepie¬ 
nia spektroskopowego g równy jest w przybliżeniu 2. 
Oznacza to, że ferromagnetyzm uwarunkowany jest 
nie orbitalnymi, a spinowymi magnetycznymi mo¬ 
mentami atomów. Jak już wspomniano, momenty 
magnetyczne powłok zapełnionych są równe zeru. 
Elektrony walencyjne kolektywizują się przy powsta¬ 
waniu stanu metalicznego tworząc paramagnetyczny 
gaz elektronów prawie swobodnych (—► Metale). 
Wobec tego ferromagnetyzm możliwy jest jedynie 
w kryształach zawierających atomy pierwiastków 
przejściowych, tzn. atomy mające niezapełnioną we¬ 
wnętrzną powłokę elektronową. Są to metale przej¬ 
ściowe grupy żelaza z niezapełnioną powłoką 3 d oraz 
pierwiastki ziem rzadkich z niezapełnioną powłoką 4/. 
Istnienie niezapełnionej powłoki wewnętrznej jest 
warunkiem koniecznym ale niedostatecznym po¬ 
wstania uporządkowania ferromagnetycznego w 
krysztale. Z metali grupy żelaza tylko żelazo, nikiel 
i kobalt są ferromagnetykami. Z metali ziem rzadkich 
tylko gadolin, dysproz i erb wykazują właściwości 
ferromagnetyczne. Ferromagnetyzm powstaje w wy¬ 
niku oddziaływania wymiennego elektronów z nie- 
zapełnionych powłok, przy czym oddziaływanie to 
jest efektem kwantowym. Kwantowy opis tego od¬ 
działywania podany został przez W. Heisenberga. 
W modelu Heisenberga energia oddziaływania wy¬ 
miennego określona jest następującym wzorem: 

-V 2 

U=-2j£ £s,S f , (16) 

i-i i-l 

gdzie N jest całkowitą liczbą spinów w krysztale, in¬ 
deksy i i j numerują węzły sieci krystalicznej, a Si 

i Sj oznaczają spiny atomów w /-tym i ;-tym węźle 
sieci, traktowane jako klasyczne wektory. Wzór (16) 
uwzględnia oddziaływanie każdego spinu tylko z naj¬ 
bliższymi sąsiadami w liczbie z — stanowi to tzw. 
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przybliżenie najbliższych sąsiadów. Sumowanie we 
wzorze (16) obejmuje każdą parę spinów w krysztale 
tylko raz. Miarą oddziaływania wymiennego jest 
tzw. całka wymiany J — wielkość fizyczna nie mająca 
analogii w fizyce klasycznej. 

W celu ilustracji wzoru (16) rozpatrzymy parę 

oddziałujących ze sobą spinów Si oraz Sj. Na pod¬ 
stawie wzoru (16) energia tego oddziaływania jest 
równa: 

U = -2 JSi S } = -~2JSiSjCo$<p t (17) 

updrządko- gdzie <f jest kątem pomiędzy Si i Sj. Energia układu 
wartie fizycznego w warunkach równowagi termodynamicz- 
antyferro- nej osiąga zawsze minimum. Gdy J > 0> najniższa 
magnetyczne wartość energii U odpowiada wartości kąta <p = 0°. 

i ferri- Stan, któremu odpowiada najniższa energia, nazy- 
magnetyczne wamy stanem podstawowym. Dla J > 0 stanem pod¬ 
stawowym jest więc uporządkowanie typu ferroma¬ 
gnetycznego, tzn. spiny Si i Sj są skierowane równo¬ 
legle (rys. 4a). Dla J < 0 najniższa energia odpowiada 
antyrównoległemu ustawieniu spinów ( 9 ? = 180°). 
oddziały- Możemy wyróżnić wtedy dwa rodzaje uporządkowa- 
wanie n j a — uporządkowanie antyferromagnetyczne (rys. 
wymienne 4 b) oraz ferrimagnetyczne (rys. 4c). W pierwszym 

przypadku wartości bezwzględne spinów Si i Sj są 
takie same i wypadkowy spin uporządkowania anty¬ 
ferromagnetycznego równy jest zeru. W uporządko¬ 
waniu ferrimagnetycznym ze względu na różne war¬ 
tości bezwzględne spinów Si i Sj wypadkowy spin 
jest różny od zera. 

Stany podstawowe realizowane są jedynie w tem¬ 
peraturze zera bezwzględnego. Przy wzroście tem¬ 
peratury, na skutek drgań termicznych sieci krysta¬ 
licznej idealne uporządkowanie spinów ulega coraz 
większemu zaburzeniu i układ N spinów przechodzi 
w jeden z możliwych stanów wzbudzonych o energii 
większej od energii stanu podstawowego. Znajo¬ 
mość energii tych stanów pozwala określić wiele 
właściwości termodynamicznych kryształów ferro¬ 
magnetycznych. 

Omówimy dwie metody teoretycznego opisu ukła¬ 
du oddziałujących ze sobą spinów w temperaturach 
wyższych od zera. Najprostsza i najstarsza teoria 
spontanicznego uporządkowania magnetycznego 
układu N spinów w sieci krystalicznej opiera się na 
koncepcji tzw. pola molekularnego. Jedno z nowszych 
i ściślejszych ujęć teorii posługuje się pojęciem tzw. 
fal spinowych. 


Teoria pola molekularnego 

Wzór (16) zastosowany do jednego atomu znajdują¬ 
cego się w /-tym węźle sieci krystalicznej ma postać: 

z 

U, = -USiJ^Sj. (18) 

P-I 

Oddziaływanie wymienne spinu Si z najbliższymi 
sąsiadami możemy zastąpić oddziaływaniem spinu 

Si z hipotetycznym polem magnetycznym H Cy które 
nazywamy polem molekularnym. Pojęcie pola mole¬ 
kularnego zostało wprowadzone po raz pierwszy 
w klasycznej teorii ferromagnetyzmu przez P. Weissa, 
który założył ad hoc istnienie pola magnetycznego we¬ 
wnątrz kryształu ferromagnetycznego. W ujęciu 
kwantowym pole molekularne ma sens przybliżenia 
modelowego, w którym oddziaływanie wymienne 
wyrażamy w postaci oddziaływania momentu ma¬ 
gnetycznego z efektywnym polem zewnętrznym. 
W takim ujęciu energię U x można zapisać w postaci: 


wyrażonej wzorem (19). Wobec tego, porównując te 
dwa wzory, otrzymujemy 


H e 


2 J 
ZMH 


Zs, 

f-1 


( 20 ) 


Zakładamy następnie, że każdy spin Sj możemy za¬ 
stąpić przez wartość średnią <(S [ | J > . Jest to zasadni¬ 
cze przybliżenie, na którym opiera się metoda pola 
molekularnego. Ponieważ wszystkie atomy są iden¬ 
tyczne i równoważne, wartość średnia > zwią¬ 
zana jest z całkowitym namagnesowaniem kryształu 
zgodnie ze wzorem 


M = Ng M B 


Wobec tego 


H e = 2zJ -<s\ tl y = 

gMB * 


2 zJ 


M. 


( 21 ) 

( 22 ) 


Energia V x określona wzorem (19) ma analogiczną 
postać do wzoru na energię momentu magnetycznego 
umieszczonego w zewnętrznym polu. Wobec tego, 
przeprowadzając podobne rozumowanie jak dla 
ośrodka paramagnetycznego, otrzymujemy wzór na 
namagnesowanie ferromagnetyka analogiczny do 
wzoru ( 12 ): 

M = NgfiBSB s (x\ (23) 


gdzie 


gflsSHe 

k B T 


(24) 


Funkcja Brillouina Bi w'e wzorze (12) zależna jest od 
pola zewnętrznego H. Zakładamy teraz, że zewnętrzne 
pole magnetyczne równe jest zeru. Argument funkcji 
B s we wzorze (23) zależy od pola molekularnego, 
a tym samym od namagnesowania M (wzór 22). 
Mówiąc inaczej, równanie (23) na namagnesowanie 
M jest uwikłane. Najprostszym sposobem znalezie¬ 
nia namagnesowania M w’ danej temperaturze jest 
graficzne rozwiązanie układu równań ( 21 ) i (23). Na 
rysunku 5 przedstawiony jest przykładowy przebieg 


Rys. 5. Zależność sponta¬ 
nicznego namagnesowa¬ 
nia ferromagnetyka od 
temperatury. Czarne 
punkty przedstawiają da¬ 
ne doświadczalne dla ni¬ 
klu; krzywa teoretyczna 
wynika przy S — 1 / 2 z 
teorii pola molekularnego 



spontanicznego namagnesowania w funkcji tempera¬ 
tury otrzymany tą metodą. Temperatura 7c, w której 
znika spontaniczne namagnesowanie, nazywana jest 
temperaturą Curie lub temperaturą krytyczną. Wzór 
na temperaturę Curie otrzymany w teorii pola mole¬ 
kularnego ma postać: 


^ 2zJS(S+l) 

Tc== - vT b — 


(25) 


Dla temperatur T > Tc ferromagnetyk zachowuje 
się w zewnętrznym polu magnetycznym tak jak para- 
magnetyk, przy czym podatność 


U x = -gjisSi He. (19) * = (26) 

Wartość natężenia H c musi być oczywiście taka, aby 

energia wyrażona wzorem (18) była równa energii Wzór (26) znany jest jako prawo Curie-Weissa. 
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spontaniczne Metodę pola molekularnego można również sto- 
namagneso- sować do opisu spontanicznego uporządkowania 
wanie typu antyferromagnetycznego lub ferrimagnetyczne- 
antyferro~ go. W najprostszym modelu materiału antyferroma- 
magnetyka gnetycznego sieć magnetycznych atomów można po¬ 
dzielić na dwie równoważne, wzajemnie przenikające 
się podsieci A i £ w ten sposób, że najbliższymi sąsia¬ 
dami atomów A są atomy B i odwrotnie. Dwupodsie- 
ciowy model antyferromagnetyka przedstawiony jest 
na rys. 6. Dla każdej podsieci oblicza się spontaniczne 



namagnesowanie oddzielnie. Ponieważ wartości bez¬ 
względne wszystkich spinów są jednakowe, wypadko¬ 
we namagnesowanie podsieci A znosi się z namagne¬ 
sowaniem podsieci B, a zatem moment magnetyczny 
kryształu jest równy zeru. Temperaturowa zależność 
namagnesowania podsieci dla uporządkowania anty¬ 
ferromagnetycznego przedstawiona jest schematycz¬ 
nie na rys. 7. 

Temperatura 7>, w której znika jednocześnie upo¬ 
rządkowanie w obydwu podsieciach, nazywana jest 
temperatura temperaturą Nćela. Typowym przykładem prostego 
Nćela antyferromagnetyka jest mangan. 



Rys. 7. Jakościowa zależ¬ 
ność spontanicznego na¬ 
magnesowania podsieci 
kryształu antyferromag¬ 
netycznego od tempera¬ 
tury 


Metoda fal spinowych 


W zakresie niezbyt wysokich temperatur w stosun¬ 
ku do temperatury Tc energia stanów wzbudzonych 
niewiele się różni od energii stanu podstawowego. 
Stany takie można opisać za pomocą tzw. fal spino¬ 
wych, które przechodząc przez kryształ zaburzają 
jego uporządkowanie. 

Rozpatrzmy na wstępie uproszczoną sytuację, 
w której N spinów jest ustawionych w tym samym 
kierunku, przy czym odległość między sąsiednimi 
spinami jest stała i równa a (kryształ jednowymiaro¬ 
wy). Załóżmy ponadto, że spin w miejscu /-tym od¬ 
działuje tylko z najbliższymi sąsiadami znajdują¬ 
cymi się w miejscach i— 1 oraz /+1. Energię oddziały¬ 
wania (16) dla takiego układu spinów można wtedy 
zapisać w postaci: 

U=-\2»iHi, (27) 

t 

gdzie /u jest momentem magnetycznym związanym 

ze spinem Si zależnością m = —gfiiB Si. Oddziały¬ 
wanie /-tego spinu z sąsiadami zastąpiliśmy przez 
oddziaływanie tego spinu z efektywnym polem magne¬ 
tycznym 

Hi = - —(&_!+£i +1 ). (28) 

gfiiB 

Zmianę momentu pędu hSi pod wpływem tego pola 
określa następuiący związek: 

fidSi_ = ^ x czy jj — —g^Si x Hi. (29) 
dt dt 

Moment skręcający wyrażony iloczynem wektoro¬ 
wym finxHi , powoduje zmianę jedynie kierunku 

wektora momentu pędu HSi Gego długość pozostaje 
stała, rys. 8). Rozpisując równanie (29) na składowe 
w kierunku osi x i y i zakładając, że amplitudy S* 


n H> 



Rys. 8. Precesja momentu 
polu magnetycznym Ht 


spontaniczne 

namagneso¬ 

wanie 

ferrimagne- 

tyka 


Podobny model stosuje się do wyznaczania tempe¬ 
raturowej zależności spontanicznego namagnesowa¬ 
nia w przypadku uporządkowania ferrimagnetycz- 
nego. Dla prostych ferrimagnetyków wprowadza się 
dwie podsieci A i B jak na rys. 6, przy czym momenty 
magnetyczne atomów A i B nie są sobie równe. Wy¬ 
padkowe namagnesowanie ferrimagnetyka równe jest 
sumie wektorowej momentów magnetycznych oby¬ 
dwu podsieci: 


M = Ma+Mb. 


i S y są małe, otrzymujemy następujący przybliżony 
układ równań: 

2f A(2S«-Sl-S» +1 \ (30) 

dSj __ 2IS „ __ x _ x . 

dt ~ k 

Rozwiązania tego układu poszukujemy w postaci 
płaskiej fali bieżącej: 


Klasycznym przykładem substancji ferrimagnetycz- 
nych są ferryty. 

Metodą pola molekularnego osiągamy dość dobrą 
zgodność jakościową, a w wielu wypadkach również 
ilościową, wyników teoretycznych z danymi do¬ 
świadczalnymi. Dotyczy to szczególnie prostych 
struktur magnetycznych w zakresie wyższych tem¬ 
peratur. 


Si = u exp i (cot—km a); S y — v exp / (wt—km a), (31) 

którą nazywać będziemy falą spinową. Występujące 
tu wielkości u i v są stałymi, i = }/— 1 , k = 2^/2 jest 
wektorem falowym związanym z falą o długości X. 
Wielkość ma, w której m jest liczbą całkowitą, opi¬ 
suje odległość spinu 5/ od spinu wybranego jako po¬ 
czątek układu odniesienia. 
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Po podstawieniu wielkości (31) do równań (30) 
dostajemy układ równań, który ma rozwiązania tylko 
wtedy, gdy spełniony jest następujący związek: 

hco = 4/5(1 —cos ha). (32) 


Jest to zależność dyspersyjna co = <o{fc) dla fal spino¬ 
wych w jednowymiarowym krysztale. Jeżeli uwzględ¬ 
nić w rozważaniach działanie przyłożonego z zewnątrz 
pola magnetycznego o natężeniu H, to zależność 
dyspersyjna przybiera postać: 

hco = 4/5(1 -cos ka)-Vgfi B H. (33) 


Zależność tę przedstawia rys. 9. 



Rys. 9. Zależność dy¬ 
spersyjna fali spino¬ 
wej rozchodzącej się 
w krysztale jednowy¬ 
miarowym 



Falę spinową w krysztale trójwymiarowym (rys. 
10 ) opisują wzory: 

Sf — «exp i (cot—kn) ; = vcxp i (c ot—kn), (34) 

gdzie wektor falowy k o długości 2ic/A skierowany jest 

wzdłuż kierunku rozchodzenia się fali, zaś wektor r 
opisuje położenie danego jonu w sieci krystalicznej. 
Zależność dyspersyjną dla trójwymiarowego kry¬ 
ształu o strukturze regularnej wyraża wzór 

hco = 2IS[z — £ cos (ka m )]+gMBff; (35) 

m 


sumowanie rozciąga się na z wektorów a m łączących 
wybrany atom z jego najbliższymi sąsiadami. Rozwi¬ 
jając cos (k a m ) w szereg dostajemy dla długich fal 
spinowych (ka < 1, gdzie a — stała sieci krystalicz¬ 
nej) zależność dyspersyjną w postaci przybliżonej: 

hco z, 2 IScPk 2j rgfi bH. (36) 


Ze wzoru tego wynika, że częstość fal spinowych 
w ferromagnetykach jest proporcjonalna do kwadratu 
wektora falowego. 

Rozpatrzmy teraz kryształ antyferromagnetyczny, 
którego sieć krystaliczna przedstawiona jest na rys. 6. 
Rozumując podobnie jak przy ferromagnetykach do¬ 
chodzimy do następującego wzoru określającego 
częstość fal spinowych w krysztale antyferromagne¬ 
tycznym : 

ftO> = gUBMe+HaY-Hlii £ CoikZ m nl*± efl Błr, 

m 
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(37) 


gdzie He , określone wzorem (22), jest efektywnym 
polem opisującym oddziaływanie wymienne pomiędzy 
najbliższymi sąsiadami z różnych podsieci. Uwzględ¬ 
niona została również za pośrednictwem pola H a 
anizotropia magnetokrystaliczna ośrodka (-*• Struk¬ 
tura domenowa i procesy magnesowania), która 
w antyferromagnetykach jest zazwyczaj bardzo silna. 
W wyniku silnej anizotropii częstość fal spinowych 
w antyferromagnetykach jest zwykle znacznie większa 
niż w ferro- czy w ferrimagnetykach. Z powyższego 
wzoru wynika, że przyłożenie zewnętrznego pola ma¬ 
gnetycznego powoduje rozszczepienie krzywej dy¬ 
spersyjnej fal spinowych na dwie gałęzie (rys. 11). 


Rys. 11. Zależność dys¬ 
persyjna fal spinowych 
w krysztale antyferro¬ 
magnetycznym w nie¬ 
obecności zewnętrznego 
pola magnetycznego (li¬ 
nia niebieska), oraz po 
przyłożeniu pola H (li¬ 
nie czarne 



Ze wzoru (37) dostajemy dla długich fal spinowych 
{ka 1) następującą zależność dyspersyjną: 


aj SMB\^H e +HaY-Hl[\- j ' ±g MbH. (38) 


Jeśli pominiemy podobnie, jak przy ferromagne¬ 
tyzmie, anizotropię magnetokrystaliczną kładąc H a = 
= 0, to otrzymamy proporcjonalność częstości co do 
pierwszej potęgi k (w ferromagnetykach zależność ta 
jest kwadratowa). 

Na rys. 6 widzimy dwupodsieciowy kryształ ferri- 
magnetyczny. Różni się on od kryształu antyferro¬ 
magnetycznego tym, że wartości bezwzględne spinów 
z obu podsieci są różne, w wyniku czego wypadkowy 
spin i moment magnetyczny są różne od zera. Taki 
ferrimagnetyk ma dwie gałęzie zależności dyspersyj¬ 
nej (rys. 12). Gałęzie te dla stosunkowo długich fal 
spinowych opisane są przez następujące wzory: 
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hco 2 


h(o x = 4]/ 2 


IS A S B 

S A -S B 


a 2 k 2 +gfitnH y 


(39) 


[ S A S B - 11/2 

i+ 4{S Azrś* ) a * k } +m bH > < 40 > 


gdzie S A i S B są spinami odpowiednio z jednej i dru¬ 
giej podsieci. Występuje przy tym ścisła analogia po¬ 
między gałęzią opisaną przez wzór (39) a zależnością 
dyspersyjną w ferromagnetykach (co ~ k 2 ). Druga 
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gałąź zależności dyspersyjnej występuje tylko w fer- 
rimagnetykach. W przeciwieństwie do sytuacji od¬ 
powiadającej pierwszej gałęzi, precesujące z czę¬ 
stością co 2 spiny z obu podsieci nie są teraz antyrówno- 
ległe, co prowadzi do nieznikania energii wymiennej 
nawet w granicy k -> 0. 



Rys. 12. Dwie gałęzie zależności dyspersyjnej fal spinowych 
w krysztale ferrimagnetycznym w nieobecności pola magnetycz¬ 
nego H. Przyłożenie tego pola powoduje przesunięcie obu gałę¬ 
zi w’ stronę wyższych częstości 


Kwantowanie fal spinowych. Własności 
kryształów magnetycznych w niskich 
temperaturach 

Energie fal spinowych są skwantowane. Oznacza to, 
że energia fali spinowej o częstości o>k i wektorze falo¬ 
wym k nie może przyjmować dowolnych wartości, 
lecz tylko wartości: 

Ek — (41) 

gdzie nk = 0, 1, 2, ... nosi nazwę kwantowej liczby 
fali spinowej, zaś wielkość ftai t określona jest zależ¬ 
nością dyspersyjną. 

magnony Każde elementarne wzbudzenie o energii /to>* nosi 
nazwę magnonu i może być traktowane jako poru¬ 
szająca się w krysztale oddzielna cząstka. W tym uję¬ 
ciu liczbę kwantową nk można traktować jako liczbę 

magnonów o tej samej długości wektora falowego k 
i częstości cok - 

Na podstawie powyższych stwierdzeń można podać 
następującą interpretację nisko położonych stanów 
wzbudzonych kryształu magnetycznego: każdy taki 
stan jest odchyleniem od konfiguracjii dealnego upo¬ 
rządkowania w wyniku występowania wielu fal spi¬ 
nowych. W pierwszym przybliżeniu fale te można 
traktować jako niezależne od siebie. Dany stan wzbu¬ 
dzony określa się podając wartości liczb kwanto¬ 
wych n u ..., n n dla fal spinowych o wektorach k l9 ... 

kn> przy czym dla skończonej próbki może występo¬ 
wać tylko pewna skończona liczba wzbudzeń w*. 

Weźmy teraz pod uwagę jednostkę objętości ferro- 
magnetyka, w skład której wchodzi N spinów, każdy 

o wartości S. Rzuty spinu S na pewien wyróżniony kie¬ 
runek określone są przez magnetyczną liczbę spinową, 
która może przyjmować jedną zwartości 5, 5—1,...» 
—S. Wynikają stąd dwa wnioski. Po pierwsze, w ujęciu 
kwantowym fali spinowej nie można przedstawić tak, 
jak to pokazuje rys. 10. Po drugie, magnetyczna licz¬ 
ba całkowitego spinu układu składającego się z N 
spinów, ms, może przyjmować jedynie wartości A r 5, 
MS—1, ...» —NS. 

W stanie podstawowym, w którym wszystkie spiny 
skierowane są w jedną stronę, magnetyczna liczba 
kwantowa układu m s = iWS. Wzbudzenie jednego 
magnonu wiąże się z odchyleniem jednego ze spinów 
w wyniku czego liczba kwantowa ms maleje do war¬ 
tości NS— 1. To odchylenie spinu na skutek oddziały¬ 
wania wymiennego nie pozostaje zlokalizowane w jed¬ 
nym miejscu, lecz wędruje stale przez całą sieć kry¬ 
staliczną. Takiemu wędrującemu odchyleniu spino¬ 
wemu można, podobnie jak w przedstawieniu kla- 
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sycznym, przypisać pewien wektor falowy k oraz zwią¬ 
zaną z nim częstość co*. 

Jeśli w krysztale zostało wzbudzonych n magno¬ 
nów, to liczba m s wynosi 

ms = NS—n y (42) 


gdyż wzbudzenie każdego magnonu zmniejsza war¬ 
tość rzutu całkowitego spinu na pewien wyróżniony 
kierunek o jedność. Z rzutem tym wiąże się namagne¬ 
sowanie 

M = g n B m s . (43) 

Tak więc jeśli liczba spinów A r odnosi się do jednostki 
objętości rozpatrywanego kryształu, to wzbudzenie n 
magnonów powoduje obniżenie namagnesowania M 
od wartości maksymalnej M 0 = Ngi-isS do wartości 

M = M Q — ngfiB. (44) 

Powyższy wynik można sformułować w sposób na¬ 
stępujący: wzbudzenie jednego magnonu prowadzi 
do zmniejszenia momentu magnetycznego próbki 
o wartość równą gus niezależnie od tego, jaki jest 
wektor falowy i częstości magnonu. 

Wynika stąd ważny wniosek, że jeśli znamy cał¬ 
kowitą liczbę magnonów o różnych wektorach falo¬ 
wych k w jednostce objętości kryształu, £ nk , to 

k 

potrafimy obliczyć też zmianę namagnesowania, która 
wynosi: 

M 0 —M = gfts £ n k . ( 45) 

k 


Jak już mówiliśmy, magnony można traktować po¬ 
dobnie jak elektrony czy fonony, tzn. jako cząstki 
obdarzone pewną energią i pędem. Średnia liczba 
cząstek o danej energii zależy od temperatury, przy 
czym zależność ta opisywana jest przez wzory staty¬ 
styczne, które w zależności od rodzaju cząstek przyj¬ 
mują jedną z poniższych postaci: 


lub 


/ik 


_ 1 _ 

exp(/m>*/kz? T) +1 


_ 1 _ 

Q\p(ha)kfkBT)—i 


(46) 

(47) 


gdzie k B jest stałą Boltzmanna, T — temperaturą 
bezwzględną, zaś fwk jest energią cząstki o wektorze 


falowym k. 

O cząstkach, do których stosuje się wzór (46) po¬ 
wiadamy, że podlegają statystyce Fermiego-Diraca. 
Cząstki te nazywamy fermionami. Przykładem fer¬ 
mionów są np. elektrony. 

Cząstki, do których stosuje się wzór (47), podlegają 
statystyce Bosego-Einsteina i noszą nazw^ę bozonów. 
Do bozonów zaliczamy zarówno fonony, jak i ma¬ 
gnony. Rozkład Bosego stosuje się wtedy, gdy wszy¬ 
stkie stany kwantowe układu można obsadzać danymi 
cząstkami bez ograniczeń. Natomiast rozkład Fer¬ 
miego stosuje się do takich cząstek, które w danym 
układzie muszą znajdować się w różnych stanach 
kwantowych. Inaczej mówiąc do fermionów stosuje 
się zakaz Pauliego. 

Korzystając ze wzoru (47) można obliczyć liczbę 
magnonów wzbudzonych w danej temperaturze 


2 


Tik — N- 


0,0587 1/cbTY 12 
b \ 2/5 / ’ 


(48) 


gdzie b — 1, 2, 4 odpowiednio dla sieci regularnej 
prymitywnej, regularnej centrowanej przestrzennie 
i regularnej płasko centrowanej. Ze związków (45) 
i (48), jak też na podstawie zależności M 0 — M( 0) = 
= NguBS dostajemy ostatecznie: 


M(T) = Af(0) 


r 0,0587j 


L 1 AS 1 

[2 isj J 


(49) 
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Jest to tzw. „prawo 3 / 2 Blocha 1 ’ dobrze opisujące 
zależność namagnesowania od temperatury w zakre¬ 
sie niskich temperatur. 

W podobny sposób można znaleźć energię układu 
związaną ze wzbudzonymi falami spinowymi. Jak 
wynika z mechaniki kwantowej, energia ta jest wyra¬ 
żona wzorem: 

U M = JT Tikhcok. (50) 

ciepło k 

właściwe Można stąd obliczyć ciepło właściwe przy stałym 
ferromagne- namagnesowaniu, C M , które jest pochodną U M po 
tyków temperaturze: 



Powyższe wzory odnoszą się do ferromagnetyków. 
Stosują się one jednak również do ferrimagnetyków. 
ferrimagne- Wprawdzie w ferrimagnetykach występują dwa ro- 
tyki dzaje fal spinowych (rys. 12), jednakże fale spinowe 
o dużej energii (nie dążącej do zera przy k -> 0) nie 
są właściwie wzbudzane aż do temperatury około 
10 K. W związku z tym do odchylenia namagnesowa¬ 
nia od maksymalnej wartości M 0 przyczyniają się 
głównie fale spinowe o zależności dyspersyjnej ana¬ 
logicznej do zależności charakteryzującej ferromag- 
netyk, tj. fale spinowe o energii proporcjonalnej do 
k 2 (wzór 39). 

antyferro- Obliczenia dla antyferromagnetyków są znacznie 
magnetyki bardziej skomplikowane z uwagi na duży zazwyczaj 
wkład anizotropii magnetokrystalicznej do wyraże¬ 
nia określającego energię fal spinowych. Jeśli jednak 
pominąć anizotropię, to okazuje się, że zmiana na¬ 
magnesowania wraz z temperaturą dana jest przez 
poniższe wyrażenie: 

M(T) = M 0 (l-AT*). (52) 

Prawo 3 / 2 Blocha nie stosuje się zatem do antyferro¬ 
magnetyków. W dodatku obliczenia ciepła właści¬ 
wego prowadzą do wniosku, że zmienia się ono pro¬ 
porcjonalnie do T 3 (a nie do T 3/2 , jak we wzorze 51). 
Jest to wynikiem proporcjonalności energii fal spi¬ 
nowych do pierwszej potęgi k , a nie do k 2 , jak to 
miało miejsce w ferromagnetykach. 

Zależność częstości fal spinowych od ich wektora 
falowego wyznacza się m.in. za pomocą niespręży- 
stego rozpraszania neutronów. Neutrony zostają roz¬ 
proszone przez strukturę magnetyczną wraz z jed¬ 
noczesną kreacją lub anihilacją magnonu. Znając 
energię i pęd padających i rozproszonych neutronów 
można wyznaczyć na tej podstawie zależność dysper¬ 
syjną dla magnonów. 


Poznanie właściwości fal spinowych pozwala zro¬ 
zumieć wiele zjawisk obserwowanych doświadczalnie 
w ciałach magnetycznych. Teoria fal spinowych sta¬ 
nowi jednocześnie opartą na mechanice kwantowej 
metodę opisu podstawowych właściwości tych ciał. stosowały 
Stosuje się ją z dobrymi wynikami w zakresie stosun- ność teorii fal 
kowo niskich temperatur, rzędu Vio temperatury spinowych 
Curie. W wyższych temperaturach liczba magnonów 
staje się na tyle duża, że założenie o niezależności fal 
spinowych przestaje być słuszne. Należy uwzględniać 
wtedy również oddziaływania pomiędzy falami spi¬ 
nowymi. Przy dostatecznie dużej liczbie wzbudzeń 
fale spinowe zaczynają rozpraszać się na falach spi¬ 
nowych, przy czym to rozpraszanie może znacznie 
zmieniać ich energię. W rezultacie wprowadzonych 
poprawek można przedłużyć zakres stosowalności 
metody fal spinowych do temperatur przewyższają¬ 
cych 1 !z temperatury Curie. W temperaturach jeszcze 
wyższych należy stosować już inne metody opisu. 

Przedstawiony tu zarys teorii magnetyzmu zawiera 
jedynie jej podstawowe elementy. Prezentowane wy¬ 
niki słuszne są dla stosunkowo prostych, modelo¬ 
wych przypadków. Bogactwo form, w jakich przeja¬ 
wia się przyroda, powoduje, że teoria dająca dobry 
opis rzeczywistych układów fizycznych jest znacznie 
bardziej złożona, szczególnie pod względem matema¬ 
tycznym. Prezentowane przykładowo, na rys. 4, typy 
uporządkowania magnetycznego są najprostszymi 
z możliwych. Wiele magnetyków wykazuje bardziej 
złożone uporządkowanie, wymagające np. wprowa¬ 
dzenia do modelowego przedstawienia więcej niż 
dwu podsieci. Omówione bezpośrednie oddziaływa¬ 
nie wymienne dwóch sąsiednich atomów magnetycz¬ 
nych również nie jest jedynym możliwym. W przy¬ 
padku wielu rzeczywistych, niemetalicznych magnety¬ 
ków, aby opisać prawidłowo oddziaływanie wymien¬ 
ne, należy uwzględnić wpływ atomów niemagnetycz¬ 
nych, zajmujących miejsca między atomami magne¬ 
tycznymi w sieci krystalicznej. Atomy niemagnetycz- 
ne uczestniczą w oddziaływaniach wymiennych ato- r ? la atomów 
mów magnetycznych będąc pewnego rodzaju „prze- niemagne- 
kaźnikami” tych oddziaływań. Kwantowy opis po- tycznych 
średniego oddziaływania wymiennego jest oczywi¬ 
ście bardziej złożony. Czytelnika głębiej interesują¬ 
cego się teorią magnetyzmu odsyłamy do specjali¬ 
stycznej literatury podanej niżej. 

Teoria magnetyzmu jest jedną z trudniejszych teorii 
fizycznych, ciągle się jeszcze rozwijającą. 

C. Kittel Wstęp do fizyki ciała stałego, Warszawa 1974; 

D. H. Martin Magnetism in solids , London 1967; A. H. Morrish 
Fizyczne podstawy magnetyzmu. Warszawa 1970; J.S. Smart 
Effccthe Field Theories of Magnetism, Philadclphia 1966 (ros. 

Moskwa 1968). 


Struktura domenowa i procesy 
magnesowania 

Henryk Szymczak i Rita Szymczak 


Zagadnienie domen należy do głównych zagadnień 
w fizyce materiałów magnetycznych. Poznanie wła¬ 
sności statycznych i dynamicznych domen jest klu¬ 
czem do wyjaśnienia mechanizmów określających 
podstawowe parametry techniczne materiału magne¬ 
tycznego. Badanie domen jest pomostem pomiędzy 
badaniami technicznymi a badaniami o charakterze 
czysto poznawczym, gdyż struktura domenowa zde¬ 
terminowana jest z kolei oddziaływaniami o charak¬ 
terze kwantowym. Do opisu własności domen sto¬ 
suje się zarówno formalizm kwantowy jak i fenome¬ 
nologiczny. Do swego rodzaju paradoksu urasta fakt, 
że własności domen cylindrycznych zostały opisane 
przez ich odkrywcę (A. H. Bobeck, 1967) za pomocą 
aparatu matematycznego jedynie z zakresu szkoły 
średniej. Tematyce domen cylindrycznych poświęca 


się obecnie najwięcej prac (spośród prac poświęco¬ 
nych fizyce magnetyków) i nic nie wskazuje na to, by 
zainteresowanie tym tematem miało maleć. A prze¬ 
cież problem domen jest jednym z najstarszych pro¬ 
blemów badawczych. Hipotezę o istnieniu domen wy¬ 
sunął już w 1907 r. P. Weiss jednocześnie z hipotezą 
pola molekularnego (zwanego również polem Weissa), pole moleku- 
Hipoteza o istnieniu wewnętrznych, bardzo silnych | arne 
(często rzędu 10 8 A/m) pól magnetycznych potrzebna (Weissa) 
była Weissowi do wyjaśnienia zjawiska spontanicz¬ 
nego uporządkowania. Weiss nie wyjaśnił natury tego 
pola. Według współczesnych poglądów pole moleku¬ 
larne jest efektywnym polem opisującym oddziały¬ 
wania wymienne między jonami magnetycznymi 
(tzn. jonami o różnym od zera momencie magnetycz¬ 
nym). Ma więc ono naturę kwantową. Przyjęcie hi- 

585 




potezy pola molekularnego (-> Teoria magnetyzmu) 
wyjaśnia wiele podstawowych własności kryształów 
magnetycznych (zależność namagnesowania od tem¬ 
peratury, istnienie temperatury Curie itp.), nie wy¬ 
jaśnia jednak faktu, że kryształy ferromagnetyczne 
są najczęściej obserwowane w stanie o zerowym wy¬ 
padkowym namagnesowaniu. To właśnie doprowa- 
domeny dziło Weissa do postawienia drugiej hipotezy — hi- 
msgnetyczne potezy o istnieniu domen. Według tej hipotezy dome- 
— obszary ny magnetyczne (zwane również obszarami Weissa) 
Weissa są mikroobszarami, w których namagnesowanie jest 
jednorodne (zarówno ze względu na kierunek jak 
i amplitudę). Tak więc w obszarze domeny mamy do 
czynienia z pełnym (maksymalnym) namagnesowa¬ 
niem. Gdy kryształ znajduje się w stanie rozmagneso¬ 
wania, kierunki namagnesowania w różnych dome¬ 
nach rozrzucone są przypadkowo tak, że wypadkowy 
moment magnetyczny w dowolnym kierunku jest 
równy zeru. Tu dochodzimy do najbardziej, jak się 
wydaje, frapującej i zagadkowej własności materia¬ 
łów ferromagnetycznych. Wiadomo oczywiście, że 
materiały ferromagnetyczne mogą być trwale namag¬ 
nesowane. O wiele bardziej intrygujący jest jednak 
fakt, że namagnesowanie ich może być zmieniane 
przy użyciu stosunkowo niewielkich pól magnetycz¬ 
nych. Pola rzędu 80 A/m są często wystarczające do 
nasycenia lub do zmiany kierunku namagnesowania 
w krysztale, chociaż jak już wspomniano, pole mo¬ 
lekularne ma natężenie 10 7 -10 8 A/m. Ten zadziwia¬ 
jący fakt hipoteza Weissa tłumaczy bardzo prosto 
w następujący sposób: efektem przyłożenia zewnętrz¬ 
nego pola magnetycznego nie są zmiany na poziomie 
atomowym (chyba, że natężenie tego pola jest porów¬ 
nywalne z natężeniem pola molekularnego), ale usta¬ 
wienie się wektorów namagnesowania poszczegól¬ 
nych domen w kierunku pola bądź to w rezultacie 
obrotu tych wektorów, bądź też zmiany kształtu 
i wielkości poszczególnych domen. Weiss nie był w sta¬ 
nie wyjaśnić, w jaki sposób powstaje struktura do- 
teoria menowa. Dopiero w 1935 r. L. D. Landau i J. M. Lif- 
Landaua szyć podali teoretyczne uzasadnienie hipotezy Weissa 
i Lifszyca udowadniając, że struktura domenowa powstaje w wy¬ 
niku dążenia układu do stanu o minimalnej energii 
wewnętrznej. Wskutek podziału kryształu na domeny 
zmniejsza się znacznie energia pola rozmagnesowu- 
jącego. Pochodzenia tego pola należy szukać w od¬ 
działywaniu dipolowym, które jest znacznie słabsze 
niż oddziaływania wymienne. Może się wydać rzeczą 
nienormalną, że faworyzowana jest raczej struktura 
domenowa niż stan jednorodnego namagnesowania. 
Przyczyną tego stanu rzeczy jest fakt, że oddziały wa- 
. nia dipolowe są oddziaływaniami dalekiego zasięgu, 
stosunkowo wolno malejącymi z odległością, podczas 
gdy oddziaływania wymienne mają charakter krótko- 
energia zasięgowy i ograniczone są zazwyczaj do najbliższych 
wewnętrzna sąsiadów'. Dlatego nie ma sprzeczności w fakcie istnie- 
struktury nia struktury domenowej w całym krysztale i istnie- 
domenowej nia jednorodnego lub prawie jednorodnego namagne¬ 
sowania na małych odległościach, tzn. wewnątrz 
pojedynczej domeny w krysztale. Energia wewnętrz¬ 
na określająca rozmiary i własności struktury do¬ 
menowej składa się z trzech zasadniczych części: 
energii wymiany, energii anizotropii magnetokry- 
stalicznej i energii magnetostatycznej pola rozmag- 
nesowującego. 


Energia wymiany 

Jest to podstawowy rodzaj energii w krysztale mag¬ 
netycznym, warunkujący powstanie uporządkowania 
magnetycznego. Oddziaływania wymienne określają 
rodzaj uporządkowania magnetycznego (ferro-, anty- 
ferro-, ferrimagnetyczne), zależność namagnesowania 
od temperatury, wpływają też istotnie na inne para¬ 
metry magnetyczne materiału (np. na anizotropię). 
Energię oddziaływania wymiennego (-> Teoria mag¬ 
netyzmu, wzór 16) dwóch jonów /-tego z /-tym, ob¬ 


darzonych spinami Si i Sj , można zapisać w postaci 
klasycznej: 

£uym = — 2.AS' 2 COS9", (1) 

gdzie (p jest kątem pomiędzy sąsiednimi spinami. Za¬ 
kładając, że kąt ten jest mały, można skorzystać 
z przybliżonej zależności cos tp = l — l / 2 <p 2 i wzór ( 1 ) 
zapisać (po pominięciu stałej, niezależnej od <p) w po¬ 
staci: 

E wym = JS 2 <p 2 . (2) 

Analiza powyższego wzoru prowadzi do w-niosku 
o istnieniu obszarów przejściowych między dome- ściany 
nami, zwanych inaczej ścianami domenowymi. Ścia- domenowe 
ną domenową nazywa się warstwę przejściową, która 
oddziela przylegające do siebie domeny namagneso¬ 
wane w różnych kierunkach. Całkowita zmiana kie¬ 
runku spinu (lub momentu magnetycznego) między 
domenami nie zachodzi w postaci nagłego skoku 
w obszarze jednej płaszczyzny atomowej, lecz — w 
sposób stopniowy — na przestrzeni wielu płaszczyzn 
atomowych. Energia wymiany zmniejsza się, gdy 
zmiana kierunku spinów rozkłada się na wiele spinów. 

Aby to zrozumieć załóżmy, że spiny w sąsiednich 
domcnacn skierowane są przeciwnie. Jeżeli całkowita 
zmiana o kąt n zachodzi stopniowo przez N różnych 
przejść, to kąt między sąsiednimi spinami jest równy 
7 t/iV, a więc energia wymiany przypadająca na parę 
sąsiednich jonów jest równa 

£wym = JS 2 (K/N)\ 

Całkowita energia wymiany odpowiadająca łańcu¬ 
chowi złożonemu z N+l jonów wynosi: 

Ewym — JSW/N. (3) 

Tak więc stopniowa zmiana kierunków spinów w ścia¬ 
nce domenowej znacznie zmniejsza energię wymiany. 

Ze wzoru (3) wynika, że ścianka domenowa powinna 
się rozszerzać bez ograniczenia (gdy N -> oo, wtedy 
Ewym —> 0). Byłoby tak, gdyby nie występowały inne 
rodzaje energii, a przede wszystkim energia anizo¬ 
tropii magnetokrystalicznej. 


Energia anizotropii magnetokrystalicznej 

Energia anizotropii magnetokrystalicznej jest tą 

częścią energii kryształu, która zależy od kierunku 

wektora namagnesowania. Anizotropia magneto- 

krystaliczna jest przyczyną występowania kierunków 

łatwego (i trudnego) magnesowania. Przez kierunek kierunek 

łatwego magnesowania rozumie się kierunek, w któ- łatwego 

rym kryształ magnesuje się do nasycenia przy naj- magnesowa- 

mniejszym natężeniu pola magnetycznego. W dal- nia 

szych rozważaniach rozpatrzymy przykład, gdy 

kryształ ma jeden kierunek łatwego magnesowania. 

Z punktu widzenia anizotropii magnetokrystalicznej 
takie kryształy nazywa się jednoosiowymi. Charakter 
anizotropii magnetokrystalicznej, czyli istnienie jed¬ 
nego lub wielu kierunków łatwego magnesowania, 
zależy od symetrii sieci krystalicznej. Kryształy nale¬ 
żące do układu heksagonalnego, tetragonalnego czy 
romboedrycznego są kryształami jednoosiowymi 
(w sensie magnetycznym). Nie zawsze jednak taka ko¬ 
relacja między strukturą krystaliczną i anizotropią 
istnieje. W 1970 r. odkryto, że w niektórych kryszta¬ 
łach o strukturze granatu (a więc w kryształach regu¬ 
larnych) w procesie wzrostu może być indukowana 
jednoosiowa anizotropia. Jeszcze ciekawszy efekt 
zaobserwowano w 1973 r., kiedy to udało się wy¬ 
tworzyć jednoosiową anizotropię w amorficznych 
cienkich warstwach stopów Gd-Co i Gd-Fe. A prze¬ 
cież w materiałach amorficznych trudno wyróżnić 
jakiś kierunek. W obu wypadkach natura anizo¬ 
tropii jednoosiowej nie została jeszcze do końca wy¬ 
jaśniona. Gęstość energii anizotropii magnetokry¬ 
stalicznej (a więc energii na jednostkę objętości) dla 
magnetyków jednoosiowych zapisuje się najczęściej 
w postaci rozwinięcia typu: 

Eun = Ki sin^+Kz sin 4 d(4) 
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gdzie K l9 K 2 są stałymi anizotropii magnetokrysta¬ 
licznej, 0 — kątem pomiędzy wektorem namagneso¬ 
wania i wyróżnioną osią. Do opisu większości ma¬ 
teriałów jednoosiowych wystarcza jedna stała K x . 

Znając wyrażenie opisujące energię anizotropii 
szerokość magnetokrystalicznej można by już przystąpić do 
ścianki obliczenia szerokości ścianki domenowej i energii 
domenowej niezbędnej do jej utworzenia. Nie wiemy jednak, jak 
zmienia się kierunek spinu w ściance (zakładamy jed¬ 
norodny charakter zmian). Dokładnie funkcję opisu¬ 
jącą zmianę kierunku spinu w ściance można obliczyć 
metodami rachunku wariacyjnego. Przy szacunko¬ 
wych obliczeniach przyjmujemy, że w ściance 6 = 
= k/2. Wtedy na podstawie wzoru (4) energia anizo¬ 
tropii na jednostkę powierzchni ścianki wynosi 

ffa n = K y Na> (5) 


gdzie a jest stałą sieci krystalicznej. Całkowita gę- 
gęstośćener- stość energii ścianki domenowej a w zawiera oprócz 
gii ścianki a an jeszcze wyraz opisujący energię wymiany, i:wym/fl 2 , 
domenowej czyli 

= JSW/NcP+^Na. (6) 

Parametr N wyznacza się z warunku, że energia ścian¬ 
ki domenowej powinna osiągać wartość minimalną: 


czyli 


da w 
~dN 


= 0 , 


N = -]/n 2 JS*IK 1 d‘. 


(7) 


Gdy namagnesowanie jest jednorodne i skierowane bieguny 
prostopadle do powierzchni kryształu, wtedy nie poją- powierzeń* 
wiają się oczywiście bieguny objętościowe, natomiast niowe 
łatwo obliczyć gęstość biegunów na powierzchni. 

Wynosi ona q = -HM 1, gdy namagnesowanie skie¬ 
rowane jest ku powierzchni i {? — — IM | — w prze¬ 
ciwnym przypadku. Energię magnetostatyczną obli¬ 
cza się podobnie jak energię oddziaływań ładunków 
elektrycznych: 

(„) 

gKHo v V r 12 

We wzorze (11) całkowanie prowadzi się po obję¬ 
tości kryształu V; r 12 — odległość między punktem 
o* współrzędnych r x i punktem o współrzędnych r 2 . 

Z wyprowadzonych wzorów można korzystać przy 
analizie najprostszych struktur domenowych. 

Strukturę domenową w jednoosiowych magnety¬ 
kach opisuje się zazwyczaj za pomocą jednego z dwu 
modeli: 

1 ) model struktury zamkniętej — zaproponowany 
w 1935 r. przez L. D. Landaua i J. M. Lifszyca (rys. 
la); 

2 ) model struktury otwartej — zaproponowany 
w 1949 r. przez Ch. Kittela (rys. Ib). 

Całkowanie we wzorze (11) znacznie się upraszcza 
jeśli założyć, że kryształ ma kształt płytki o grubości 
/z, nieograniczonej w płaszczyźnie xy. Jak widać 
z rysunków kryształ rozbity jest na bloki prostopa- 
dłościenne o szerokości D (D — szerokQŚć domeny), 



Szerokość ścianki domenowej S — Na y zatem 

S = K}Os 2 /K^a, ( 8 ) 

zaś energia ścianki 

< 7 ** = 2n\/K 1 JS 2 /a. (9) 

Mimo wielu założeń upraszczających, wyrażenia (8) 
i (9) różnią się nieznacznie od wyrażeń dokładnych, 
wyznaczonych na podstawie rachunku wariacyjnego. 
Dla ilustracji oszacujmy wartości S i o™ w żelazie 
przyjmując J = 2,16* 10 -21 J, S = 1, K x = 4,2-10 4 J/m 3 , 
a = 2,86-10" 10 m: 

S = 4,2* 10 -8 m (czyli ok. 150 stałych sieci), 
c w = 1,1 • 10 ~ 3 J/m 2 . 

Jak widać z powyższych obliczeń ścianki domenowe 
są na ogół bardzo wąskie. Dlatego bada się je najczę¬ 
ściej metodami mikroskopii elektronowej. 

Energia mag netosta tyczna pola 
rozmag neso wującego 

Jest to najtrudniejsza do obliczenia część energii 
kryształu zawierającego domeny magnetyczne. Za¬ 
zwyczaj w fenomenologicznym przybliżeniu korzysta 
się z wynikającej z równań Maxwella formalnej ana¬ 
logii między statycznymi polami magnetycznymi 
gęstość bie- i elektrycznymi. Wprowadza się pojęcie gęstości bie¬ 
gunów mag- gunów (lub gęstości ładunków magnetycznych) zde- 
netycznych finiowanej następująco: 

ą = — div M; (10) 

M— wektor namagnesowania. 


wysokości h i długości nieograniczonej. Ścianki do- struktura 
menowe, wychodzące na powierzchnię płytki tworzą domenowa 
układ równoległych linii (stąd inna nazwa omawia- zamknięta 
nych struktur — struktury paskowe). Struktura Lan- (Landaua- 
daua-Lifszyca różni się od struktury Kittela obecno- -Lifszyca) 
ścią przy powierzchni tzw. domen zamykających. 

Domeny te powodują, że namagnesowanie nie ma 
składowej prostopadłej do powierzchni płytki, a więc 
o = 0. Można łatwo obliczyć energię całkowitą (li¬ 
czoną na jednostkę powierzchni) dla modelu Lan- 
daua-Lifszyca. Energia całkowita składa się tu z 2 
części : 

£ll — Ep-\-Ea. i (12) 

Pierwsza część jest energią związaną z obecnością 
ścianek domenowych. Jeżeli rozmiary kryształu 
w kierunkach x i y oznaczymy chwilowo przez L x 
i Ly (pamiętając, że L Xt L y -> oo), to całkowita po¬ 
wierzchnia ścian domenowych (bez domen zamyka¬ 
jących, których wkład można pominąć) wynosi 
hLzLy/D. Stąd 

E p — OtchjD. 

Druga część we wzorze (12) reprezentuje energię ani¬ 
zotropii magnetokrystalicznej związaną z istnieniem 
domen zamykających, w których 6 — n/2; 

E a = KD/2. 

Szerokość domen D wyznacza się z warunku na mi¬ 
nimum energii układu: 

*/£ll _ 

~dD~ ~ ’ 
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stąd 

D = \/2a w hlK , £ i,l = ]/laZKh. ( 13 ) 

struktura W przypadku struktury Kittela całkowita energia 
otwarta również składa się z 2 części: 

(Kittela) E K =E P +E m , (14) 

gdzie E p ma postać identyczną jak w'e wzorze (12), 
a Em reprezentuje energię magnetostatyczną związaną 
z obecnością biegunów na powierzchni płytki- Ko¬ 
rzystając z (11) można otrzymać następujące wyra¬ 
żenie : 

E m = 1,08*10 *M 2 D. 

Z warunku na minimum energii układu otrzymuje się: 


D = J/W/;/1,08 -IOW 2 , 

,_ 05 ) 

Ek = 2 y 1,08 ■10 ! ’M 2 a,oh . 

Porównując Ek i Eu. można ocenić, która z omawia¬ 
nych struktur jest energetycznie korzystniejsza. Łatwo 
pokazać, że gdy 

KIM 2 > 2,16 10 5 , (16) 

wtedy £ll>£k- Spełnienie nierówności (16) jest wa¬ 
runkiem koniecznym (chociaż nie zawsze dostatecz¬ 
nym) istnienia struktury otwartej. 



Ponieważ En jest proporcjonalne do objętości do¬ 
meny (o promieniu r) a E v do jej powierzchni, więc 
£//~r a , a Ep~r. Okazuje się, że E m ~r 2 dla r</r, 
natomiast E m ^r dla r^>h. Rysunek 3 przedstawia za- 



W obecności zewnętrznego pola magnetycznego, 
struktura otwarta może przejść niekiedy w strukturę 
jak na rys. 2. Na rysunku tym widać charakterystycz- 
domeny ne domeny o kształcie cylindrycznym. Są to wspom- 
eylindryczne niane wyżej domeny cylindryczne, odkryte i zbadane 
przez A. H. Bobecka w 1967 r. Zainteresowanie tymi 
domenami wiąże się z ich małymi rozmiarami i moż¬ 
liwością kontrolowanego ich przesuwania, z czego 
wynika, że mogą być one wykorzystane do budowy 
pamięci dla maszyn cyfrowych. 

Początkowo domeny cylindryczne obserwowano 
w ortoferry(ach (kryształach tlenkowych o strukturze 
rombowej, zawierających jony żelaza i lantanowców). 
Średnica domen cylindrycznych w ortoferrytach wy¬ 
nosi ok. 100 pm. W 1970 r. odkryto domeny cylin¬ 
dryczne w granatach (są to kryształy tlenkowe o struk¬ 
turze regularnej, zawierające jony żelaza i lantanow¬ 
ców). W granatach średnica domen cylindrycznych 
zawarta jest w granicach 1-10 pm. Wreszcie w 1973 r. 
odkryto domeny cylindryczne w cienkich warstwach 
amorficznych, takich jak np. stopy Gd-Co czy Gd-Fe. 
Średnica domen cylindrycznych w tych warstwach 
może być znacznie mniejsza od 1 pm. 
energia Przeanalizujmy, od czego zależy energia kryształu 
kryształu zawierającego domeny cylindryczne. Sposób postę- 
z domenami powania nie różni się tu niczym od analizy rozpatry- 
cylindry- wanych już modeli. Oprócz rozpatrywanych poprzed- 
cznymi nio rodzajów energii należy jeszcze uwzględnić ener¬ 
gię oddziaływania domen z zewnętrznym polem mag¬ 
netycznym o natężeniu H\ 

En = ~ f (17) 

V 

W wypadku domen cylindrycznych energia magneto- 
statyczna ma dość skomplikowaną postać (pojawiają 
się tu całki eliptyczne). W zwdązku z tym analizę 
układu przeprowadzimy jakościowo. Energia krysz¬ 
tału zawierającego pojedynczą domenę cylindryczną 
składa się z 3 części: 

E c = Ep -f Em j Eh . (18) 


leżność całkowitej energii E c od promienia domeny r 
(w dowolnych jednostkach). Jak wynika z wykresu, 
gdy H — 0, to E c nie ma minimum (energetycznie wy¬ 
godniejsza jest tu struktura paskowa). Przy pewnym 
natężeniu pola magnetycznego H — H' energia cał¬ 
kowita ma minimum i pojawiają się domeny o pro¬ 
mieniu R '. Ze wzrostem natężenia pola H zmniejsza 
się promień domeny aż do chwili, gdy 

min E C (R) — 0. 

Wtedy domena cylindryczna znika. Ze względu na 
analogię z zapadaniem grawitacyjnym mówi się, że 
domena zapada się. Tak więc domeny cylindryczne 
mogą istnieć tylko w określonym przedziale natężeń 
pól magnesujących. Również promień domeny cylin¬ 
drycznej zmienia się przy zmianie H w- określonym 
przedziale. Przedział ten zależy od stosunku o tc /M 2 . 
W konkretnym materiale magnetycznym nie można 
zatem wytworzyć dowolnie małej domeny. Stąd 
ustawiczne poszukiwania nowych materiałów, w 
których można by wytwarzać domeny mające mniej¬ 
sze rozmiary. 

W urządzeniach wykorzystujących domeny cylin¬ 
dryczne (np. w -> Pamięciach magnetycznych) bu¬ 
duje się specjalne układy do detekcji domen. Działanie 
ich oparte jest na zjawisku zmiany pola rozmagneso- 
wującego w pobliżu domeny cylindrycznej. Na tej za¬ 
sadzie buduje się hallotronowe lub magnetooporowe 
detektory domen. W badaniach własności fizycznych 
domen korzysta się z innych metod. 


Metody obserwacji struktury domenowej 

Istnieje w'iele metod obserwacji struktury domenowej, 
najczęściej jednak stosuje się metodę figur proszko¬ 
wych lub metodę magnetooptyczną. Metoda figur 
proszkowych polega na pokrywaniu powierzchni 
kryształu specjalnym koloidem zawierającym drobny 


zależność 
energii od 
promienia 
domeny 


znikanie do¬ 
meny cylin¬ 
drycznej 
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proszek magnetyczny (np. magnetyt). Proszek ten 
gromadzi się na granicach domen, w miejscach, gdzie 
ścianki domenowe wychodzą na powierzchnię. Me¬ 
toda figur proszkowych daje więc informację jedynie 
o strukturze domenowej na powierzchni kryształu. 
Więcej informacji można uzyskać za pomocą metod 
magnetooptycznych. W metodach tych wykorzystuje 
się fakt, że stan polaryzacji światła odbitego od po¬ 
wierzchni kryształu lub przechodzącego przez krysz¬ 
tał zależy od kierunku wektora namagnesowania. 
Uzyskuje się więc informację nie tylko o rozkładzie 
i kształcie domen, ale również w wielu wypadkach 
o kierunku wektora namagnesowania w poszczegól¬ 
nych domenach. Występowanie określonego zjawi¬ 
ska magnetooptycznego w odbiciu — efektu Kerra 
biegunowego, podłużnego i poprzecznego, w trans¬ 
misji— efektu Faradaya i efektu Cottona-Moutona) 
zależy od geometrii układu, a więc od wzajemnego 
położenia wektora falowego światła, wektora polary¬ 
zacji światła i wektora namagnesowania (—> Magneto¬ 
optyczne zjawiska). Na il. 89-92 (tabl. 23) przedsta¬ 
wiono kilka zdjęć struktury domenowej, uzyskanych 
za pomocą różnych technik badawczych na krysz¬ 
tałach o jednoosiowej anizotropii i to t akich, w któ¬ 
rych występują domeny cylindryczne. We wszystkich 
przypadkach kierunek łatwego magnesowania jest 
prostopadły do płaszczyzny płytki. Ilustracja 90a 
przedstawia zdjęcie struktury domenowej ferrytu ba¬ 
rowego BaFe 12 0 19 uzyskane metodą figur proszko¬ 
wych. Widać, żę powierzchniowa struktura domeno¬ 
wa jest bardzo skomplikowana. Zdjęcie 90b przed¬ 
stawia ten sam obszar kryształu badany metodą Fara¬ 
daya. W przeciwieństwie do struktury powierzchnio¬ 
wej, struktura wewnętrzna jest stosunkowo prosta. 
Można również zauważyć istnienie korelacji między 
strukturą powierzchniową i strukturą wewnętrzną. 
Nie jest to jednak regułą i często struktura powierzch¬ 
niowa nie wykazuje żadnego podobieństwa do struk¬ 
tury wewnętrznej. Wracając do przedstawionych 
zdjęć należy podkreślić, że są one unikalne i to z dwóch 
powodów. Po pierwsze, na zdjęciu 90b widać rzadkie 
zjawisko istnienia obok siebie domen cylindrycznych 
o różnych kierunkach wektora namagnesowania (na 
zdjęciu domeny czarne i białe). Istnieją one bez zew¬ 
nętrznego pola magnetycznego, stabilizowane polem 
rozmagnesowującym. A także dlatego, że wykonane 
zostało na stosunkowo grubym krysztale (ok. 1 mm). 
Kryształy o takiej grubości są całkowicie nieprzezro¬ 
czyste dla światła widzialnego. Dlatego do obserwacji 
domen metodą Faradaya wykorzystano tu podczer¬ 
woną część widma. Technika badania struktury 
domenowej ferrytów heksagonalnych (takich jak 
BaFe 12 0 19 ) rozwinięta została w Instytucie Fizyki 
PAN i pozwoliła na obserwację struktury domeno¬ 
wej w płytkach o rekordowej grubości dochodzącej 
do ok. 0,5 cm. 

Seria zdjęć 89a, b, c i d przedstawia strukturę do¬ 
menową (obserwowaną techniką Faradaya) w cien¬ 
kich warstwach granatu Y^Gdo.sBio.sFes.sCjai^Ois. 
Zdjęcie 89a przedstawia strukturę w zerowym polu 
magnetycznym. Zdjęcia 89b, c i d pokazują ten sam 
odcinek kryształu w polu magnetycznym (skierowa¬ 
nym prostopadle do warstwy) o natężeniu odpowied¬ 
ni© 2170 A/m, 2900 A/m i 3790 A/m). Widać wyraź¬ 
nie, jak jedne domeny (na zdjęciach — białe) rosną 
kosztem domen mających przeciwną polaryzację i jak 
struktura paskowa przechodzi w' strukturę cylin¬ 
dryczną. 

Ilustracja 91 (tabl. 23) przedstawia zdjęcie siatki do¬ 
men cylindrycznych w granacie Y^Gdo^Fe.jGaO^. 
Siatkę taką wytwarza się przykładając prostopadle 
do próbki pulsujące pole magnetyczne o określonym 
natężeniu. Domeny cylindryczne tworzą tu dwuwy¬ 
miarową heksagonalną siatkę. 

Ilustracja 92 (tabl. 23) przedstawia zdjęcie struk¬ 
tury domenowej materiału najbardziej interesują¬ 
cego z punktu widzenia wykorzystania domen cylin¬ 
drycznych w technice — cienkich warstw amorficz¬ 


nych (stop Gd-Co). Ponieważ warstwa jest całkowi¬ 
cie nieprzezroczysta dla światła, do obserwacji struk¬ 
tury wykorzystano tu efekt Kerra (biegunowy). 


Procesy magnesowania 

Obecność struktury domenowej powoduje, że bez 
zewnętrznego pola magnetycznego kryształ jest w za¬ 
sadzie rozmagnesowany, tzn. wypadkowy moment 
magnetyczny jest równy zeru. Przyłożenie zewnętrz¬ 
nego pola magnetycznego powoduje powstanie nie- 
zerowego wypadkowego namagnesowania, które ro¬ 
śnie w miarę zwiększania poła magnetycznego, aż 
osiąga wartość M 0 równą namagnesowaniu jednorod¬ 
nego, bezdomenowego kryształu. Indukcja magne¬ 
tyczna osiąga przy tym wartość B s (rys. 4) — zwaną 
indukcją nasycenia. Cykliczna zmiana pola magne¬ 
tycznego wywołuje zmianę namagnesowania i in¬ 
dukcji po zamkniętej krzywej (krzywa II z rys. 4) 
zwanej pętlą histerezy. Pętlę histerezy charakteryzują 
dwa podstawowe parametry: indukcja szczątkowa 
(lub pozostałość magnetyczna) B T określona jako war- 



Rys. 4. Pętla histerezy indukcji magnetycznej; B s indukcja nasy¬ 
cenia, Br indukcja szczątkowa; H c pole koercji 


tość B w punkcie H = 0; siła koercji H c (lub pole 
koercji, natężenie powściągające) określona jako war¬ 
tość pola H , przy którym B — 0. Z wymienionych 
powyżej parametrów B Sy B r i H c tylko B s jest para¬ 
metrem całkowicie zależnym od materiału. Pozostałe 
parametry zależą od obróbki technologicznej ma¬ 
teriału, od rodzaju i rozkładu defektów, od parame¬ 
trów struktury domenowej itd. Można więc je zmie¬ 
niać. Stąd też podstawowe zadanie teorii procesów 
magnesowania polega na zrozumieniu mechanizmów 
determinujących parametry B r i H c — parametry, 
które mają istotne znaczenie przy praktycznym wy¬ 
korzystaniu materiału magnetycznego. 

Istnieją dwa zasadnicze procesy wpływające na 
kształt krzywiej magnesowania: procesy przesuwania 
ścian domenowych i procesy rotacji wektora namag¬ 
nesowania w domenach. W pierwszym procesie ruch 
ścian domenowych prowadzi do powiększenia obję¬ 
tości domen, w których namagnesowanie skierowane 
jest zgodnie z kierunkiem zewnętrznego pola magne¬ 
tycznego. W drugim procesie nie zachodzi w zasadzie 
zmiana objętości domen, natomiast wektor namagne¬ 
sowania w domenach obraca się w kierunku zewnętrz¬ 
nego pola magnetycznego. Oba procesy mogą zacho¬ 
dzić w sposób odwracalny lub nieodwracalny. 
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materiały Ze względu na charakter procesów magnesowania 
magnetyczne materiały magnetyczne dzielą się na dwie duże grupy: 
miękkie materiały magnetycznie miękkie i materiały magne¬ 
tycznie twarde. Do grupy materiałów magnetycznie 
miękkich zaliczamy ferro- i ferrimagnetyki, których 
magnesowanie lub przemagnesowanie zachodzi w sto¬ 
sunkowo słabych polach magnetycznych. Materiały 
te mają dużą wartość indukcji nasycenia, małe pole 
koercji, dużą przenikalność magnetyczną i małe straty 
na przemagnesowanie. Do podstawowych materia¬ 
łów tej grupy należą: żelazo, stale krzemowe, stopy 
żelaza z niklem, niektóre ferryty. Do grupy raa- 
materialy teriałów magnetycznie twardych zalicza się ferro¬ 
magnetyczne i ferrimagnetyki, w których magnesowanie zachodzi 
twarde w stosunkowo silnych polach magnetycznych. Ma¬ 
teriały te wykorzystywane są najczęściej do wytwa¬ 
rzania magnesów trwałych. Muszą one mieć dużą 
wartość indukcji szczątkowej oraz duże pole koercji. 
W ostatnich latach i w tej grupie materiałów doko¬ 
nano ważnych odkryć. Odkryto nowe, bardzo obie¬ 
cujące materiały do wytwarzania magnesów trwa¬ 
łych. Są to związki międzymetaliczne typu MCo s 
(M — lantanowiec, najczęściej Sm, Pr, La, Nd). 
Związki te swoimi parametrami znacznie przewyż¬ 
szają stosowane dotychczas materiały do wytwarza¬ 
nia magnesów trwałych. Np. dla SmCo 5 pole koercji 
H c = 800 kA/m a B s = 1,0 Vs/m 2 . Tak duże war¬ 
tości H c związane są z gigantyczną anizotropią mag- 
netokrystaliczną (i ewentualnie magnetosprężystą) 
tych materiałów. Natura anizotropii w tych związ¬ 
kach nie została dotychczas w pełni wyjaśniona. Dużą 
wartość H c uzyskuje się po odpowiedniej obróbce 
technologicznej materiału (prasowanie proszków w 
silnych polach magnetycznych). Omawianych związ¬ 
ków używa się do wyrobu miniaturowych magnesów 
trwałych, koniecznych do radykalnego zminiaturyzo- 


Mag netooptyka 

Wiesław Warcłzyński 

Magnetooptyka jest działem nauki o zjawiskach op¬ 
tycznych, zajmującym się wpływem pola magnetycz¬ 
nego na rozchodzenie się promieniowania elektromag¬ 
netycznego w ośrodku. Zjawiska magnetooptyczne 
wiążą się zatem ze wzajemnym oddziaływaniem pro¬ 
mieniowania elektromagnetycznego i materii. Zjawi¬ 
ska te stanowią istotne źródło informacji o oddziały¬ 
waniach promieniowania elektromagnetycznego z ma¬ 
terią, a więc o specyficznych właściwościach tych ciał, 
w których promieniowanie się rozchodzi. 

Z punktu widzenia charakteru promieniowania 
zakresy pro- elektromagnetycznego rozróżniamy zjawiska magne- 
mieniowania tooptyczne w zakresie mikrofal, promieniowania pod¬ 
czerwonego oraz w zakresie światła widzialnego 
i promieniowania pozafioletowego. Różnice w zja¬ 
wiskach magnetooptycznych w tych obszarach pro¬ 
mieniowania wiążą się ze specyficznymi cechami tego 
promieniowania, wynikającymi z częstości drgań, 
a co za tym idzie — energii fotonów. 

Z punktu widzenia ośrodka, w którym rozchodzi 
rodzaje się światło, możemy rozróżniać zjawiska magneto- 
ośrodka optyczne w gazach, cieczach i ciałach stałych. Róż¬ 
nice w zjawiskach magnetooptycznych w tych ośrod¬ 
kach wynikają z ich charakterystycznych cech. Naj¬ 
bardziej interesujące i różnorodne zjawiska magneto¬ 
optyczne obserwuje się w ciałach stałych ze względu 
na ich regularną, krystaliczną budowę oraz różnice 
we właściwościach elektrycznych i magnetycznych, 
które decydują o oddziaływaniu z promieniowaniem 
elektromagnetycznym. Mówiąc o zjawiskach magne¬ 
tooptycznych bardzo często mamy właśnie na myśli 
zjawiska zachodzące w ciałach stałych. 

Fale elektromagnetyczne o określonych często¬ 
ściach przechodząc przez ośrodek mogą być tłumione 
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wania sprzętu radiotechnicznego, elektrotechnicz¬ 
nego itp. 

Większość prac naukowych prowadzonych obecnie 
w zakresie fizyki domen magnetycznych dotyczy, 
obok wspomnianych zagadnień domen cylindrycz¬ 
nych, właśnie problemu procesów magnesowania 
w związkach MCo 6 . Badania te obejmują m.in. ob¬ 
serwacje struktur domenowych w tych materiałach 
i poszukiwanie korelacji między strukturą domeno¬ 
wą, parametrami technicznymi materiału (głównie 
polem koercji) i obróbką technologiczną. Chodzi tu 
również o wyjaśnienie mechanizmów hamowania ro¬ 
tacji wektora namagnesowania w związkach MCo 5 . 

Na zakończenie należy jeszcze raz podkreślić, że 
domeny magnetyczne występują zawsze tam, gdzie 
istnieje możliwość obniżenia energii układu przy 
przechodzeniu od konfiguracji jednorodnego nasyce¬ 
nia z wysoką energią do konfiguracji domenowej 
z niższą energią. A zatem można oczekiwać, że 
struktura domenowa występuje również i w innych 
materiałach. I rzeczywiście, podobne własności do 
domen w magnetykach mają domeny w ferroelektry¬ 
kach. Strukturę domenową obserwuje się w nad¬ 
przewodnikach I rodzaju i w stanie przejściowym przy 
przejściach fazowych I rodzaju. Mechanizm pow¬ 
stawania domen w wymienionych przypadkach jest 
bardzo podobny (w ferroelektrykach — identyczny) 
do opisanego mechanizmu powstawania domen w 
magnetykach. Widzimy więc, że pojęcia domeny nie 
należy wiązać jedynie z materiałami magnetycznymi. 
Ma ono znaczenie o wiele bardziej uniwersalne. 



procesy 
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Domeny cylindryczne , I Szkoła Zimowa ,,Nowe Materiały Mag¬ 
netyczne”, Warszawa 1976; C. Kittel Wstęp do fizyki ciała sta¬ 
łego, Warszawa 1974; A. H. Morrish Fizyczne podstawy magne¬ 
tyzmu, Warszawa 1970; M. Nałęcz (red.) Cylindryczne domeny 
magnetyczne w technice cyfrowej , Warszawa 1973; R. Wadas 
Ferrimagnetyzm , Warszawa 1968. 


(pochłaniane), przy czym stopień tłumienia w ciałach 
krystalicznych zależy od polaryzacji fali. Fale o róż¬ 
nej polaryzacji rozchodząc się w kryształach biegną 
z różnymi prędkościami w określonych kierunkach 
krystalograficznych. Zjawiskami związanymi z roz¬ 
chodzeniem się światła w kryształach zajmuje się od¬ 
rębny dział optyki — zwany optyką kryształów; zna¬ 
jomość tych zjawisk jest niezbędna dla zrozumienia 
zjawisk magnetooptycznych. 

Znamy wiele zjawisk magnetooptycznych wiążą- zjawiska 
cych się z wpływem zewnętrznego pola magnetycz- magneto- 
nego tak na amplitudę drgań fali biegnącej w ośrodku optyczno 
umieszczonym w tym polu, jak i na prędkość rozcho¬ 
dzenia się fali o określonej polaryzacji w takim ośrod¬ 
ku. Pierwsze zjawisko magnetooptyczne odkrył 
w r. 1845 M. Faraday, obserwując skręcenie płasz¬ 
czyzny polaryzacji światła biegnącego w szkle w kie¬ 
runku równoległym do przyłożonego zewnętrznego 
pola magnetycznego. Doświadczenia podobne pow¬ 
tarzane następnie z innymi materiałami, m.in. z ga¬ 
zami, doprowadziły do odkrycia w r. 1896 zjawiska 
Zeemana. Polega ono na zmianach pochłaniania lub 
emisji promieniowania w badanym materiale pod 
wpływem zewnętrznego pola magnetycznego (roz¬ 
szczepienie pod wpływem pola magnetycznego linii 
emisyjnych lub linii absorpcyjnych gazu). Te zjawiska 
magnetooptyczne mogły być opisane i wyjaśnione 
na podstawie klasycznej dynamiki elektronu w polu 
magnetycznym, przy pomocy teorii zjawisk elektro¬ 
magnetycznych sformułowanej przez Maxwella oraz 
teorii dyspersji rozwiniętej przez H. Lorentza, P. Dru- 
dego, W. Voigta i in. w początkach XX w. Dalszy 
istotny postęp w badaniach magnetooptycznych na¬ 
stąpił dopiero v/ latach pięćdziesiątych XX w., kiedy 



polaryzacja 

światła 



Rys. 2. 


to badania objęły materiały o właściwościach przede 
wszystkim półprzewodnikowych, a następnie mag¬ 
netycznych, do interpretacji zaś obserwowanych zja¬ 
wisk użyto kwantowej teorii i wynikającego z niej 
opisu struktury pasmowej materiałów. Od tego też 
czasu magnetooptyka stała się jedną z podstawowych 
metod badawczych struktury elektronowej ciał 
stałych. 

Ponieważ w zjawiskach magnetooptycznych istotną rolę od¬ 
grywa polaryzacja światła, przypomnijmy pokrótce najbardziej 


(tylko drgania wektorów JE). W fali spolaryzowanej kołowo 
(rys. 3b) wektor natężenia pola elektrycznego zmienia kierunek 
wzdłuż drogi, po której się rozchodzi fala, ale jest zawsze pro¬ 
stopadły do kierunku rozchodzenia się fali; koniec -wektora 
porusza się po linii śrubowej. Patrząc wzdłuż kierunku rozcho¬ 
dzenia się fali stwierdzamy, że koniec wektora natężenia pola 
elektrycznego porusza się po obwodzie koła. Ruch ten może 
zachodzić bądź w prawo (zgodnie z ruchem wskazówek zegara), 
bądź w lewo (przeciwnie do ruchu wskazówek zegara). Mówimy 
o fali spolaryzowanej kołowo, w prawo lub w lewo. Każdą falę 
spolaryzowaną liniowo można zastąpić przez dwie fale spolary¬ 
zowane kołowo w prawo i lewo, przy czym fale te mają takie same 
fazy. 
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Rys. 1. Zmiany natężenia pola elektrycznego E i magnetycznego 

Jł\ a) w określonej chwili wzdłuż drogi, po której rozchodzi się 
fala i b) w czasie w określonym miejscu przestrzeni 


istotne wiadomości na ten temat. Fala elektromagnetyczna pole¬ 
ga na rozchodzeniu się periodycznych w czasie i przestrzeni za¬ 
burzeń elektrycznych i magnetycznych w postaci periodycznych 

zmian natężenia pola elektrycznego E i magnetycznego H (wek¬ 
tory E i H są względem siebie prostopadłe). 

Obrazowo falę elektromagnetyczną można przedstawić posłu¬ 
gując się wykresami natężenia pola elektrycznego lub magnetycz¬ 
nego bądź w ustalonym czasie dla różnych punktów drogi, 
wzdłuż której fala się rozchodzi, bądź też w ustalonym punkcie 
przestrzeni w funkcji czasu. Wykresy takie w wypadku fali sprę¬ 
żystej przedstawiają wychylenie z położenia równowagi drgają¬ 
cych cząstek widziane w określonej chwili wzdłuż linii rozcho¬ 
dzenia się fali (periodyczność fali w przestrzeni — przestrzenny 
obraz fali), bądź też wychylenie wybranej cząstki w czasie (perio¬ 
dyczność fali w czasie — czasowy obraz fali). Aby sobie wyobra¬ 
zić zmiany zachodzące przy rozchodzeniu się fali, należy nałożyć 
w wyobraźni na siebie obraz przedstawiający zmiany w czasie 
i obraz zmiany w przestrzeni. Analogia z falą sprężystą może 
być tu pomocna — łatwiej wyobrazić sobie wychylenia cząstek niż 
zmiany pola — należy jednak pamiętać, że jest to tylko analogia. 

Fala spolaryzowana to taka fala, w której drgania za¬ 
chodzą w sposób uporządkowany. Jeśli wektor natężenia pola 
elektrycznego w wiązce światła drga w określonej płaszczyźnie 
(analogia z drganiami cząstek w określonej płaszczyźnie), 
to taką falę świetlną nazywamy falą spolaryzowaną liniowo 
(rys. la, b). 

W wyniku nałożenia się dwóch fal o jednakowych amplitu¬ 
dach, spolaryzowanych liniowo, których wektory elektryczne 
drgają w płaszczyznach wzajemnie prostopadłych, otrzymamy 
falę spolaryzowaną liniowo, kołowo lub eliptycznie, w zależności 
od różnicy faz <5 obydwóch fal. Jeśli różnica faz wynosi 0, n, 
2n ,... (wielokrotność n), wówczas fala wypadkowa jest falą spola¬ 
ryzowaną liniowo, przy czym drgania odbywają się w płaszczyź¬ 
nie tworzącej kąt + 45° lub —45° z płaszczyznami drgania fal 
składowych. Jeśli różnica faz wynosi Vs*. ••• (nieparzysta wie¬ 
lokrotność n/2), wówczas fala jest spolaryzowana kołowo. Przy 
pozostałych różnicach faz mamy falę spolaryzowaną eliptycznie. 
Sytuację przedstawia poglądowo rys. 2, a obraz fali wypadkowej 
spolaryzowanej liniowo, kołowo i eliptycznie — rys. 3abc 



Rys. 3. Fale wypadkow-e powstałe z nałożenia dwóch fa! (o wek¬ 
torach JE X i E z ) spolaryzowanych liniowo: a) fala spolaryzowana 
liniowo, b) fala spolaryzowana kołowo, c) fala spolaryzowana 
eliptycznie 

Zjawiska magnetooptyczne obserwowane są przy konfiguracja 
określonym kierunku rozchodzenia się energii roz- Faradaya 
patrywanej fali w stosunku do kierunku pola magne- i Voigta 
tycznego. Rozróżniamy dwie zasadnicze konfigu¬ 
racje: kierunek rozchodzenia się energii i kierunek 
pola magnetycznego są do siebie równoległe (konfi¬ 
guracja Faradaya, rys. 4a) albo kierunek rozchodze¬ 
nia się energii i kierunek pola magnetycznego są do 
siebie wzajemnie prostopadle (konfiguracja Yoigta, 
rys. 4b). 
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Rys. 4. Schemat układu do obserwacji zjawisk magnetooptycz¬ 
nych: a) konfiguracja Faradaya, b) konfiguracja Voigta 


Rys. 6. 


Zjawisko Faradaya 

Zjawisko Faradaya polega na skręceniu płaszczyzny 
polaryzacji światła spolaryzowanego liniowo, bieg¬ 
nącego w substancji umieszczonej w silnym polu mag¬ 
netycznym, przy czym światło biegnie wzdłuż linii sił 
skręcenie P° la magnetycznego (rys. 5). Kąt skręcenia płasz- 
piaszczyzny czyzny polaryzacji 0 jest proporcjonalny do długości 
polaryzacji dr °gi A którą światło przebiega w ośrodku skręcają¬ 
cym, znajdującym się w polu magnetycznym, oraz do 
natężenia pola magnetycznego H : 

0 = klH. 

Współczynnik k (stała Verdeta) charakteryzuje zdol¬ 
ność danej substancji do skręcania płaszczyzny po¬ 
laryzacji w polu magnetycznym. W materiałach mag¬ 
netycznych występują silne pola wewnętrzne, które 
są tylko porządkowane przez pola zewnętrzne — kąt 
skręcenia zależy w tym wypadku głównie od stopnia 
namagnesowania ciała badanego a nie od pola ze¬ 
wnętrznego. 

Skręcenie płaszczyzny polaryzacji wyjaśniamy w 
sposób następujący: kołowo spolaryzowane fale (na 
które można rozłożyć falę spolaryzowaną liniowo) 
biegną w ośrodku z różnymi prędkościami, wskutek 
czego po wyjściu z ośrodka pojawia się między nimi 
pewna różnica faz, zależna od drogi, jaką światło 
przebyło w rozpatrywanym ośrodku, oraz od różnicy 


magnes nadprzewodnikowy 



spolaryzowanych kołowo po wyjściu z ośrodka otrzy¬ 
mujemy drgania liniowe OC'. Fala spolaryzowana li¬ 
niowo przy wejściu do ośrodka, w której wektor elek¬ 
tryczny drgał wzdłuż OC doznała skręcenia płasz¬ 
czyzny polaryzacji o kąt 0. Jeśli skręcenie płaszczyzny 
polaryzacji (widziane od strony obserwatora, do któ¬ 
rego oka wpada światło) jest zgodne z ruchem wska¬ 
zówek zegara, to przypadek taki nazywamy skręce¬ 
niem prawoskrętnym lub dodatnim. Kierunek skrę¬ 
cenia płaszczyzny polaryzacji jest taki sam jak kieru¬ 
nek obrotów szybszej z dwóch kołowo spolaryzowa¬ 
nych składowych. Różnica faz ó obu fał równa jest 
20. Można ją wyrazić przez różnicę współczynników 
załamania obu fal: 

<5 = 

A 0 

gdzie A 0 jest długością fali w próżni. Tak więc 

. 7C/ 

0 — — (ni—Up). 

Zo 


Zjawisko Faradaya tłumaczy się wpływem pola 
magnetycznego na prędkość rozchodzenia się fali spo¬ 
laryzowanej kołowo w prawo i w lewo w danym 
ośrodku. Wielkość skręcenia magnetycznego zależy 
od długości fali, a więc wykazuje dyspersję. 

Zjawisko magnetycznego skręcenia płaszczyzny po¬ 
laryzacji wywołane jest precesją, jaką wykonują elek¬ 
trony swobodne oraz elektrony wchodzące w skład 
atomów i cząsteczek substancji pod wpływem ze¬ 
wnętrznego pola magnetycznego. W rezultacie takiej 
precesji współczynniki załamania (prędkości) promie¬ 
ni światła spolaryzowanych kołowo w prawo i w lewo 
przyjmują różną wartość. Opis teoretyczny zjawiska 
Faradaya zależy od tego, czy mamy do czynienia ze 
swobodnymi nośnikami prądu (np. w półprzewodni¬ 
kach), czy też z nośnikami związanymi. W pierwszym 
wypadku mówimy o wewnątrzpasmowym zjawisku 
Faradaya, w wypadku drugim —o zjawisku Fara¬ 
daya między pasmowym. 

Magnetyczne skręcenie płaszczyzny polaryzacji po¬ 
jawia się w bardzo krótkim czasie po wytworzeniu 
pola magnetycznego (rzędu 10~* s) i rów-nie szybko 
zanika po usunięciu pola magnetycznego. Obserwacje 
tego zjawiska prowadzi się w konfiguracji Faradaya, 
w obszarach widmowych, dla których ośrodek jest 
przezroczysty. W zależności od materiału obserwuje 
się je głównie w podczerwieni lub obszarze widzial¬ 
nym widma promieniowania elektromagnetycznego. 
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Zjawisko Voigta (Cottona-Moutona) 

Światło, przechodząc przez ośrodek umieszczony 
w zewnętrznym polu magnetycznym o kierunku linii 
sił prostopadłym do kierunku rozchodzenia się świa- 
magnetyczna tła, doznaje podwójnego załamania. Takie magae- 
dwójlomność tyczne podwójne załamanie (magnetyczna dwójłom- 
ność), obserwowane w parach i gazach zostało naz¬ 
wane zjawiskiem Voigta, a identyczne zjawisko ob¬ 
serwowane w cieczach — zjawiskiem Cottona-Mou¬ 
tona. Obecnie największe znaczenie ma badanie tego 
zjawiska w ciałach stałych, zwłaszcza w półprzewod¬ 
nikach i magnetykach. Najczęściej nazywamy je 
w tych materiałach zjawiskiem Voigta. Zjawisko mag¬ 
netycznego podwójnego załamania w parach i ga¬ 
zach ujawnia się dla światła o częstości bliskiej linii 
pochłaniania. Opisowe wyjaśnienie tego zjawiska jest 
następujące. Współczynniki załamania fal liniowo 
spolaryzowanych o polaryzacji równoległej do kie¬ 
runku pola magnetycznego i prostopadłej do tego 
kierunku stają się pod wpływem pola magnetycznego 
różne. (Fala spolaryzowana prostopadle i równolegle 
do kierunku pola magnetycznego rozchodzi się z róż- 
. ną prędkością.) W gazach różnica współczynników 

załamania n^—n ± jest bardzo mała. Po przejściu 
w badanym ośrodku drogi / obie fale zyskują pewną 
różnicę faz, co prowadzi do tego, że fala początkowo 
liniowo spolaryzowana, po wyjściu z ośrodka staje 
się falą spolaryzowaną na ogół eliptycznie. Podobnie 
ciecze pierwotnie optycznie izotropiowe stają się pod 
wpływem pola magnetycznego dwójłomne, przy czym 
zachowują się jak kryształy jednoosiowe o osi op¬ 
tycznej równoległej do pola magnetycznego. Róż¬ 
nice współczynników załamania fali spolaryzowanej 
równolegle i prostopadłe do pola magnetycznego są 
znacznie większe, a fala po przejściu drogi w oma¬ 
wianym ośrodku zyskuje znacznie większą różnicę 
faz aniżeli w gazach. Tak więc po wyjściu z ośrodka 
może być ona spolaryzowana eliptycznie, kołowo lub 
liniowo w zależności od uzyskanej przez obie fale 
różnicy faz. Schemat układu do obserwacji zjawiska 
Voigta przedstawia rys. 7. Światło przechodzi przez 
polaryzator dający falę liniowo spolaryzowaną, przy 



Rys. 7. Schemat układu pozwalającego obserwować zjawisko 
Yoigta 


czym drgania zachodzą w płaszczyźnie tworzącej kąt 
45° z kierunkiem zewnętrznego pola magnetycznego 

H. Następnie światło pada na badany ośrodek umiesz¬ 
czony w polu magnetycznym o kierunku prostopa¬ 
dłym do kierunku rozchodzenia się światła. W ośrodku 
falę rozłożyć można na dwie, z których jedna jest spo¬ 
laryzowana równolegle, a druga — prostopadle do 
kierunku pola magnetycznego. Obie te fale rozchodzą 
się w badanym ośrodku z różną prędkością, co pro¬ 
wadzi do powstania różnicy faz i fala po wyjściu 
z ośrodka ma polaryzację, którą badać można za po¬ 
mocą analizatora. 

zjawisko W kryształach sytuacja jest bardziej skompliko- 
Voigta wana, ponieważ charakter magnetycznego podwój- 
wkryszta- nego załamania zależy od tego, jak przyłożone jest 
łach pole magnetyczne w stosunku do osi krystalograficz¬ 
nych kryształu. W kryształach regularnych, gdy pole 
magnetyczne przyłożone jest równolegle do głównej 
osi krystalograficznej, obserwujemy podwójne zała¬ 


manie, jak w kryształach jednoosiowych. Przy innych 
orientacjach pola magnetycznego kryształ może za¬ 
chowywać się jak kryształ dwuosiowy. Jeśli kryształ 
jest anizotropowy i wykazuje już naturalną dwójłom- 
ność, zjawisko magnetycznej dwójłomności nakłada 
się na tę dwójłomność naturalną. 

Różnica faz obserwowana w zjawisku Voigta jest 
proporcjonalna do długości drogi, którą przebiega 
światło w ośrodku i do kwadratu natężenia pola mag¬ 
netycznego. Zależy również od długości fali promie¬ 
niowania, efekt ten bowiem, podobnie jak efekt Fa¬ 
radaya, wykazuje dyspersję. Obserwuje się to zjawi¬ 
sko w obszarach widmowych, dla których ośrodek 
badany jest przezroczysty. 

Podkreślić należy, że działanie pola magnetycznego 
wywołuje jednocześnie pojawienie się zjawiska skrę¬ 
cenia płaszczyzny polaryzacji, gdy światło biegnie 
w kierunku pola magnetycznego (efekt Faradaya) 
i dwójłomności magnetycznej, gdy światło biegnie 
prostopadle do pola. Czyniąc obserwacje w kierunku 
pola magnetycznego stwierdzamy pojawienie się efektu 
Faradaya; gdy kierunek obserwacji staje się coraz 
bardziej zbliżony do prostopadłego do pola magnetycz¬ 
nego, coraz większą rolę odgrywa dwójłomność wy¬ 
wołana polem magnetycznym. W specjalnych sytu¬ 
acjach możemy pominąć jeden z efektów i brać pod 
uwagę tylko drugi. Ogólnie rzecz biorąc, gdy nie moż¬ 
na pominąć jednego ze zjawisk, efektywna różnica 
faz wynika z nałożenia się obu zjawisk. 

Właściwości optyczne materiału charakteryzuje 
tensor przenikalności elektrycznej. Przyłożenie pola 
magnetycznego modyfikuje ten tensor., Tensor prze¬ 
nikalności elektrycznej przedstawić można za pomocą 
tensora symetrycznego i parzystego ze względu na 
natężenie pola magnetycznego — odpowiedzialnego 
za dwójłomność magnetyczną, oraz tensora antysy- 
metrycznego i nieparzystego ze względu na natężenie 
pola magnetycznego — odpowiedzialnego za skręce¬ 
nie płaszczyzny polaryzacji. Stąd wynika różna za¬ 
leżność obu efektów od natężenia pola magnetycznego. 
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Zjawisko Zeemana 

Zjawisko Zeemana polega na rozszczepieniu linii wid¬ 
mowych w polu magnetycznym. W r. 1896 P. Zeeman 
zauważył, że gdy świecące pary sodu (płomień sodo¬ 
wy) umieści się w silnym polu magnetycznym, wów¬ 
czas żółte linie widmowe, charakterystyczne dla świe¬ 
cących par sodu, ulegają znacznemu poszerzeniu. 
Dalsze badania prowadzone przy użyciu przyrządów 
o dużej zdolności rozszczepiającej wykazały, że linie 
rozszczepiają się w polu magnetycznym na szereg 
składowych. Schemat urządzenia do badania efektu 



Rys. 8. Schemat układu do badania zjawiska Zeemana 
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Zeemana przedstawia rys. 8. Źródło światła umiesz¬ 
czone jest w polu magnetycznym wytworzonym za 
pomocą elektromagnesu. Obserwujemy widmo pro¬ 
mieniowania wysyłanego bądź w kierunku prostopad- 
zjawisko łym do linii sił pola magnetycznego, bądź w kierunku 
Zeemana równoległym do linii sił. Liczba składowych i rodzaj 
normalne ich polaryzacji zależy od kierunku obserwacji. W kie¬ 
runku prostopadłym do linii sił pola magnetycznego 
obserwujemy rozszczepienie na trzy linie, przy czym 
są one spolaryzowane liniowo. W kierunku równoleg¬ 
łym do pola magnetycznego obserwujemy rozszcze¬ 
pienie na dwie linie, przy czym składowe są spolary¬ 
zowane kołowo w kierunkach przeciwnych. Opisane 
rozszczepienie nazywamy normalnym. Zarówno ro¬ 
dzaj rozszczepienia, jak i rodzaj polaryzacji można 
wyjaśnić na gruncie klasycznej teorii elektronów, 
zjawisko Często jednak występuje rozszczepienie na większą 
Zeemana liczbę składowych. Tego rodzaju zjawisko nosi nazwę 
anomalne anomalnego zjawiska Zeemana. Wytłumaczenie ano¬ 
malnego zjawiska Zeemana możliwe jest tylko na 
gruncie teorii kwantowej. Zjawisko rozszczepienia 
linii widmowych pod wpływem pola magnetycznego 
obserwujemy również w widmie pochłaniania, gdy 
ośrodek pochłaniający światło umieszczony jest w po¬ 
lu magnetycznym. Czasami zjawisko to nazywamy 
odwróconym zjawiskiem Zeemana. 

W ciele stałym występuje zjawisko analogiczne do 
rozszczepienia Zeemana — rozszczepienie poziomów 
energetycznych pasm (-> Struktura elektronowa ciał 
stałych) w zewnętrznym polu magnetycznym (tzw. 
poziomy Landaua). Przejścia pomiędzy poziomami 
Landaua pasm walencyjnych i pasma przewodnictwa 
odpowiedzialne są za obserwowane maksima pochła¬ 
niania w pobliżu krawędzi absorpcji. 

W ciałach stałych zarówno w półprzewodnikach 
jak i magnetykach istotne znaczenie mają domieszki. 
Przejścia pomiędzy poziomami domieszek, a także 
pomiędzy poziomami domieszek i poziomami pasm 
prowadzą do pojawienia się określonych linii lub 
pasm pochłaniania, szczególnie w niskich temperatu¬ 
rach. Obserwujemy również w niskich temperaturach 
bogate widma luminescencji związane z przejściami 
pomiędzy takimi poziomami. W polu magnetycznym 
pojawia się rozszczepienie tych linii, co również można 
uznać za odmianę efektu Zeemana w ciałach stałych. 
W celu wyjaśnienia wszystkich tych zjawisk konieczny 
jest opis kwantowy. 

związek Pomiędzy zjawiskiem Faradaya i Voigta a zjawi- 
między skiem Zeemana istnieje ścisły związek, wynikający 
zjawiskiem z relacji dyspersyjnych, wiążących ze sobą zmiany 
Faradaya współczynnika załamania w funkcji długości fali ze 
I zjawiskiem zmianami pochłaniania wraz z długością fali. Innymi 
Zeemana słowy, znając widmo pochłaniania w całym zakresie 
widmowym, a więc w zasadzie dla częstości od zera do 
nieskończoności, możemy (korzystając z zależności 
dyspersyjnych) obliczyć wartość współczynnika za¬ 
łamania dla dowolnych częstości promieniowania. 
W praktyce procedurę opisaną stosować możemy 
przy określonych ograniczeniach dla znacznie węż¬ 
szego obszaru widmowego. Rozpatrzmy najprostszą 
sytuację — pojedynczą linię widmową. Bez pola ma¬ 
gnetycznego występuje pojedyncza linia pochłaniania 
przy częstości v 0 związana z przejściem pomiędzy 
określonymi poziomami w atomie (rys. 9a). W polu 
magnetycznym, przy obserwacji w konfiguracji Fa¬ 
radaya, linia ta rozszczepia się na dwie o częstościach 
v i i v 2 > przy czym jedna spolaryzowana jest kołowo 
w prawo, a druga — w lewo (rys. 9b). Z każdą linią 
pochłaniania zgodnie z relacją dyspersyjną związane 
są zmiany współczynnika załamania m dla linii v l i n p 
dla linii v 2 (rys. 9c). Z różnicą współczynników zała¬ 
mania m — n p wiąże się, jak wiemy, kąt skręcenia 
płaszczyzny polaryzacji 0 (rys. 9d). Przykład ten wy¬ 
raźnie wskazuje, że rozszczepienie linii widmowych 
w polu magnetycznym (efekt Zeemana) prowadzi 
jednocześnie do pojawienia się — dla światła o dłu¬ 
gości fali w pobliżu linii pochłaniania — skręcenia 
płaszczyzny polaryzacji, a więc do efektu Faradaya. 
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W zupełnie analogiczny sposób znajdziemy związek 
między zjawiskiem Zeemana a zjawiskiem Yoigta. 

W ciałach stałych, szczególnie w półprzewodnikach, 
obserwuje się, poza omówionymi, wiele zjawisk mag¬ 
netooptycznych charakterystycznych dla tych materia¬ 
łów. Zwróćmy uwagę na dwa spośród nich. 



Rys. 9. Zależność od częstości: a) pochłaniania bez pola magne¬ 
tycznego, b) pochłaniania w polu magnetycznym (obserwacja 
w konfiguracji Faradaya), c) współczynników załamania fali 
spolaryzowanej kołowo w prawo i w lewo, d) kąta skręcenia 
płaszczyzny polaryzacji 9 (lub różnicy współczynników m—t i„) 

Rezonans cyklotronowy polega na absorpcji pro- rezonans 
mieniowania elektromagnetycznego (z obszaru mikro- cyklotronowy 
fal lub podczerwieni) przez elektrony lub dziury znaj¬ 
dujące się w półprzewodniku, gdy jest on umieszczony 
w polu magnetycznym. 

Według wyobrażeń teorii elektronowej, poruszające 
się ładunki przebiegają określoną drogę między akta¬ 
mi kolejnych zderzeń. W polu magnetycznym ładunki 
zakreślają tory będące odcinkami obwodów kół le¬ 
żących w płaszczyźnie prostopadłej do kierunku pola 
magnetycznego, przy czym tym większą część obwodu 
koła zakreśla ładunek, im rzadziej doznaje rozprosze¬ 
nia. Częstość kołowa, z jaką poruszają się w polu mag¬ 
netycznym ładunki — tzw. częstość cyklotronowa 
o) c zależy od natężenia pola magnetycznego, od masy, 
jaką należy przypisać ładunkom, oraz od wielkości 
ładunku (dla dziur i elektronów będzie to ładunek 
elementarny e odpowiednio ze znakiem + lub —): 

co c =Hefcm* 

(rn* — masa efektywna). 
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W półprzewodnikach zarówno dziurom jak i elek¬ 
tronom przypisać należy masę efektywną m* h lub m\ 
różną od masy swobodnego elektronu i charaktery¬ 
styczną dla danego półprzewodnika (-> Dynamika 
elektronu w ciałach stałych). Kierunek ruchu po ob¬ 
wodzie koła dziur i elektronów jest oczywiście prze¬ 
ciwny. Jeśli ńa półprzewodnik znajdujący się w polu 
magnetycznym pada promieniowanie elektromagne¬ 
tyczne spolaryzowane kołowo (fala mikrofalowa lub 
podczerwona), to gdy częstość tego promieniowania 
zbliża się do częstości cyklotronowej, pochłanianie fali 
elektromagnetycznej gwałtownie rośnie. Maksymalne 
pochłanianie zachodzi w warunkach rezonansu, gdy 
częstość fali elektromagnetycznej jest równa częstości 
cyklotronowej. Tak więc mierząc pochłanianie przy 
różnych częstościach padającego promieniowania mo¬ 
żemy wyznaczyć częstość cyklotronową, a następnie 
obliczyć (znając natężenie pola magnetycznego) masę 
efektywną nośników. Co więcej, wiedząc, jakie pro¬ 
mieniowanie jest pochłaniane: o polaryzacji prawo- 
skrętnej czy lewoskrętnej, możemy ustalić, czy za 
pochłanianie odpowiedzialne są nośniki dodatnie 
(dziury) czy ujemne (elektrony). Efekt cyklotronowy 
obserwować można jednak tylko w stosunkowo czy¬ 
stych (odznaczających się małą koncentracją nośni¬ 
ków) półprzewodnikach i w dostatecznie niskich 
temperaturach. 

W półprzewodnikach o dużej koncentracji nośni¬ 
ków obserwujemy zjawisko odbicia magnetoplazmo- 
wego. Promieniowanie elektromagnetyczne z obszaru 
podczerwieni jest wówczas pochłaniane przez nośniki 
swobodne. Współczynnik odbicia przechodzi przez 
wyraźne minimum, po czym szybko wzrasta tworząc 
tzw. krawędź plazmową. Położenie minimum odbicia 
zależy od koncentracji nośników, a także takich pa¬ 
rametrów półprzewodnika jak masa efektywna. W po- 



Rys. 10. Rozszczepienie krawędzi plazmowej arsenku indu w polu 
magnetycznym 

łu magnetycznym minimum to ulega rozszczepieniu 
na dwa (rys. 10). Odległość między minimami równa 
jest częstości cyklotronowej. Mierząc tę odległość 
natychmiast wyznaczamy masę efektywną. Jest to 
bardzo cenna metoda wyznaczania masy efektywnej 
w silnie domieszkowanym materiale. 


Zastosowanie zjawisk 
magnetooptycznych 
w materiałach magnetycznych 


W materiałach magnetycznych zjawiska magnetoop¬ 
tyczne pozwalają na obserwacje i badanie rozkładu 
przestrzennego namagnesowania w kryształach. Jak 
wiadomo w kryształach takich występują domeny, 
przy czym w obszarze domeny namagnesowanie ma 
określoną wartość i kierunek. Postaramy się obecnie 
pokrótce wyjaśnić, jak wykorzystując omawiane po¬ 


wyżej zjawiska magnetooptyczne, można wyodrębnić 
poszczególne domeny w krysztale. 

Wyobraźmy sobie płytkę krystaliczną zawierającą badanie 
szereg obszarów, w których wektor namagnesowania domen 
jest różnie zorientowany w stosunku do powierzchni 
płytki. Rozważamy tylko najprostsze wypadki, gdy 
wektor ten jest bądź prostopadły do powierzchni płyt¬ 
ki bądź do niej równoległy. Umieśćmy taką płytkę 
między skrzyżowanymi polaryzatorem i analizato¬ 
rem, tak jak na rys. 11. W obszarach A i B wektory 
namagnesowania są prostopadłe do powierzchni 
płytki, lecz przeciwnie skierowane, w obszarach C i D 



płytka 



Rys. U. Schemat doświadczenia umożliwiającego badanie domen 
w krysztale magnetycznym 


wektory te leżą w płaszczyźnie płytki, przy czym w ob¬ 
szarze C wektor namagnesowania jest równoległy do 
kierunku drgań wektora elektrycznego fali świetlnej 
przechodzącej przez polaryzator. W obszarze A wek¬ 
tor namagnesowania skierowany jest zgodnie z kie¬ 
runkiem rozchodzenia się światła i w takim razie 
płaszczyzna polaryzacji światła przechodzącego przez 
ten obszar płytki ulegnie skręceniu o kąt 4* 0. W ob¬ 
szarze B wektor namagnesowania skierowany jest 
przeciwnie do kierunku rozchodzenia się światła 
i w tym obszarze płaszczyzna polaryzacji ulegnie skrę¬ 
ceniu o kąt — 0. Światło rozchodzące się w obszarze 
C drga zgodnie z kierunkiem namagnesowania, nie 
obserwujemy tu zatem ani skręcenia płaszczyzny po¬ 
laryzacji jak w obszarach A i B (efekt Faradaya) ani 
magnetycznej dwójłomności. W obszarze Z), aczkol¬ 
wiek wektor namagnesowania jest prostopadły do 
kierunku rozchodzenia się światła i nie powoduje skrę¬ 
cenia płaszczyzny polaryzacji, to jednak w odróżnie¬ 
niu od obszaru C tworzy pewien kąt z kierunkiem 
drgań wektora elektrycznego fali świetlnej i dzięki 
temu w obszarze tym będziemy mieli do czynienia 
z dwójłomnością magnetyczną. 

Jeśli więc obserwujemy płytkę przez skrzyżowany 
z polaryzatorem analizator, gdy analizator skręcony 
jest od pozycji skrzyżowanej dodatkowo o kąt + 0, 
0, —0, to obszary A> B, C i D uwidocznią się jako 
obszary o różnej jasności (rys. 12). Gdy analizator 
skręcony jest o kąt +0, obszar A jest ciemny — skrę¬ 
ca on bowiem o taki kąt płaszczyznę polaryzacji, ob¬ 
szar i? jest jasny, a obszary C i D wykazują oświetle¬ 
nie pośrednie. Gdy analizator skręcony jest o kąt 
—0, analogicznie obszar B jest ciemny, a obszar A — 
jasny. Gdy analizator ustawiony jest pod kątem 0 — 
obszar C jest ciemny, obszary A i B są jednakowo 
rozjaśnione, natomiast w obszarze D (ze względu na 
dwójłomność magnetyczną) stopień rozjaśnienia (przy 
obserwacji w świetle białym także zabarwienie) za¬ 
leży od grubości płytki i od kąta między wektorem 
namagnesowania w tym obszarze, a kierunkiem drgań 
światła wychodzącego z polaiyzatora. 

Obserwacje omówione powyżej łatwo przeprowa¬ 
dzić za pomocą mikroskopu polaryzacyjnego. Pamię¬ 
tać jednak należy, że także naprężenia prowadzą do 
pojawienia się dwójłomności w kryształach, a zatem 
naprężenia występujące ewentualnie w kryształach 
mogą w istotny sposób zniekształcać obserwowany 
obraz. 




-0 

Rys. 12. 
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Zjawiska magnetooptyczne w materiałach magne¬ 
tycznych wykorzystywane są szeroko przy budowie 
różnego typu urządzeń. Omówimy kilka z nich. 
rotator Rotator (rys. 13) — przyrząd obracający płaszczyz¬ 
nę polaryzacji światła spolaryzowanego liniowo o okre¬ 
ślony kąt. Wektor namagnesowania kryształu jest 
równoległy do kierunku rozchodzenia się światła (lub 
ma różną od zera składową namagnesowania w kie¬ 
runku rozchodzenia się światła). Długość kryształu 
dobiera się tak, aby przy określonej długości fali płasz¬ 
czyzna polaryzacji skręcana była o wymagany kąt. 



polaryzator przezroczysty kryształ 

Rys. I 3. Rotator 


izolator Izolator (lub wentyl, rys. 14) — urządzenie, w któ¬ 
rym światło może przechodzić w jednym kierunku. 
Kryształ skręca płaszczyznę polaryzacji o kąt 45°; 
analizator jest skręcony względem polaryzatora o kąt 
45°. Światło przechodzi z lewa na prawo, nie prze¬ 
chodzi natomiast z prawa na lewo. 


polaryzator 


analizator 



modulator Modulator (rys. 15) — przyrząd zmieniający ampli¬ 
tudę przechodzącego światła za pomocą sterującego 
go sygnału. Zewnętrzne pole magnetyczne solenoidu, 
zasilanego sygnałem sterującym modulator, może 



zmieniać wektor namagnesowaniarM kryształu. Zmia¬ 
na namagnesowania powoduje zmianę skręcenia 
płaszczyzny polaryzacji, analizator przepuszcza więc 
falę o zmiennym — modulowanym natężeniu. 

Przesuwnik fazy (rys. 16) — przyrząd zmieniający przesuwnik 
fazę fali wychodzącej. Spolaryzowane liniowo światło fazy 
wychodzące z polaryzatora jest w ćwierćfalówce 
(płytce krystalicznej dającej różnicę faz między pro¬ 
mieniem zwyczajnym i nadzwyczajnym, odpowiada¬ 
jącą Ż/4;A — długość fali) przekształcane na światło 
spolaryzowane kołowo. Wchodzi ono następnie do 
kryształu. Zmiana wektora namagnesowania kryształu 
powoduje zmianę współczynnika załamania fali spo¬ 
laryzowanej kołowo, a zatem — długości drogi 
optycznej światła w krysztale. Po wyjściu z kryształu 
światło spolaryzowane kołowo może być zamienione 
na światło spolaryzowane liniowo przez drugą ćwierć- 



falówkę. Po wyjściu z ćwierćfalówki faza liniowo spo¬ 
laryzowanej fali zależy od wartości wektora namagne¬ 
sowania kryształu i może być zmieniana sygnałem 
doprowadzonym do solenoidu. 

Domeny cylindryczne , I Szkoła Zimowa „Nowe Materiały 
Magnetyczne”, Warszawa 1976; J. F. Dillon Magnctooptical 
properties of magnetic cristals w Magnetic Properties of Mate¬ 
rials , New York 1971; L. Landau, E. Lifszic Elektrodynamika 
ośrodków ciągłych. Warszawa 1960; J. F. Nye Własności fizyczne 
kryształów w ujęciu tensorowym i macierzowym , Warszawa 1962. 


Pamięć magnetyczna 

Henryk Lachowicz 


Pamięć magnetyczna, podobnie jak i pamięci, w któ¬ 
rych wykorzystuje się inne niż magnetyczne zjawiska 
fizyczne, np. nadprzewodnictwo lub zjawisko piezo¬ 
elektryczne, jest urządzeniem zdolnym do przyjmowa¬ 
nia informacji, ich przechowywania oraz udostępnia¬ 
nia i odtwarzania w postaci nie zmienionej. Pamięć 
magnetyczna jest najstarszą formą pamięci na Ziemi 
(starszą niż pamięć gatunku homo sapiens), choć świa¬ 
domość tego człowiek posiadł bardzo niedawno, bo 
dopiero w dwudziestym stuleciu. Wynikła ona z ba¬ 
dań geofizycznych, zwłaszcza zaś z badań zachowania 
się magnetycznego pola ziemskiego w pradziejach 
naszego globu. Informacje o tym polu uzyskuje się na 
podstawie pomiarów paleomagnetycznych. Okazuje 
się bowiem, że stygnące skały magmowe jak również 
skały osadowe ze względu na to, że zawierają w sobie 
minerały ferromagnetyczne, magnesowały się trwale 
pomiary w czasie stygnięcia lub osadzania w taki sposób, że ich 
paleomagne- namagnesowanie przyjmowało kierunek zgodny z ak- 
tyczne tualnie istniejącym magnetycznym polem ziemskim 


oraz wartość proporcjonalną do wartości tego pola. 
Dzięki temu zjawisku, pomiary namagnesowania pró¬ 
bek skalnych pozwalają wnioskować o wartości i kie¬ 
runku ziemskiego pola magnetycznego w dalekiej 
przeszłości geologicznej. Właśnie na tej podstawie 
odkryto doniosłe, o dużych konsekwencjach, zjawisko 
zmiany biegunowości tego pola, które wystąpiło po 
raz ostatni 700 tys. lat temu. Ta liczba doskonale 
unaocznia wielką trwałość pamięci magnetycznej. 


Pamięć dźwięku i obrazu 

Historia współczesnych pamięci magnetycznych za¬ 
czyna się dopiero w końcu ubiegłego wieku, kiedy to 
O. Smith (1880 r.) wykorzystał do zapisu magnetycz¬ 
nego stalowy drut, co znalazło powszechniejsze zasto¬ 
sowanie przeszło pięćdziesiąt lat później, w radiofonii. 

W pamięciach tych wykorzystywane jest w zasadzie 
to samo zjawisko, które od miliardów lat utrwala nam 
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zapis informacje o zachowaniu się ziemskiego pola magne- 
sygnałów tycznego. W początkowej fazie rozwój magnetycznych 
akustycznych urządzeń pamięciowych koncentrował się na zapisie 
dźwięku i doprowadził do tak doskonałych już kon¬ 
strukcji, jak np. magnetofon stereofoniczny. Zapis 
sygnałów akustycznych, polega w nim na ich odpo¬ 
wiednim odwzorowaniu w postaci dwuwymiarowego 
(w płaszczyźnie taśmy) rozkładu namagnesowania 
szczątkowego warstwy magnetycznej, którą pokryta 
jest taśma magnetofonowa. Wymaga to odpowied¬ 
niego przetworzenia tych sygnałów na zmienne pole 
magnetyczne, proporcjonalne do nich zarówno w czę¬ 
stości jak i amplitudzie. Pole to magnesuje warstwę 
w taśmie przesuwającej się ze stałą prędkością pod 
wytwarzającą je głowicą. Przy odczycie rozproszone 
pole magnetyczne, występujące nad powierzchnią war¬ 
stwy i odwzorowujące istniejący w niej rozkład na¬ 
magnesowania, indukuje w uzwojeniu głowicy (w wy¬ 
niku ruchu taśmy względem głowicy), siłę elektromo¬ 
toryczną proporcjonalną do szybkości zmian tego po¬ 
la, a więc i do zapisanego sygnału akustycznego. Cha¬ 
rakterystyka namagnesowania warstwy nie jest linio¬ 
wa (ma postać pętli histerezy), co prowadzi do znie¬ 
kształceń harmonicznych w czasie zapisu dźwięku. 
W celu wyeliminowania tego efektu jest zwykle sto¬ 
sowane pole podmagnesowania, wytwarzane przez 
prąd zmienny o dużej częstości płynący przez uzwoje¬ 
nie głowicy w trakcie zapisu. Częstość tego prądu musi 
być na tyle duża (40-80 kHz), aby przesuwający się 
pod głowicą odcinek warstwy zdążył się kilkakrotnie 
przemagnesować. W latach pięćdziesiątych naszego 
zapis stulecia pamięć magnetyczną taśmową wykorzystano 
obrazu również do zapisu obrazu zarówno czarno-białego jak 
i kolorowego. Pierwsze urządzenia potocznie zwane 
ampeksami (od nazwy firmy AMPEX), pojawiły się 
w 1956 r. (rys. 1). Sygnał wizyjny niesie znacznie więk¬ 
szą ilość informacji w jednostce czasu aniżeli sygnał 


wynosi 200-240 obr/min (odpowiada to prędkości 
liniowej głowicy względem taśmy do 30 m/s), pręd¬ 
kość przesuwu taśmy 0,4 m/s. Zapis wizji jest doko¬ 
nywany z zachowaniem pewnego marginesu na obyd¬ 
wu brzegach taśmy, co jest niezbędne do wyelimino¬ 
wania zakłóceń powstających w momentach stykania 
się głowicy z taśmą. Margines ten pozwala jednocze¬ 
śnie na zapisywanie dźwięku oraz impulsów synchro¬ 
nizacji na ścieżkach położonych wzdłuż brzegów ta¬ 
śmy. Przy zapisie wizji, obraz jest zwykle analizowa¬ 
ny wg standardowego systemu telewizyjnego, opartego 
na zasadzie rastru (jedna linia rastru zajmuje w opi¬ 
sanym systemie odcinek o długości ok. 0,4 mm ścieżki 
na taśmie). Przy rejestracji obrazu kolorowego zapis 
składa się z 3 ścieżek podstawowych składowych świe¬ 
tlnych sygnału telewizyjnego. Magnetyczny zapis ob¬ 
razu znajduje najszersze zastosowanie w telewizji, 
gdzie ułatwia realizację programu (możliwość mon¬ 
tażu, wznowienia programu, wymiany programów 
czy też otrzymywania wielu kopii przez jednoczesny 
zapis na kilku urządzeniach), bywa również stosowany 
do celów specjalnych np. na sztucznych satelitach, przy 
badaniu powierzchni kuli ziemskiej. 


Pamięci cyfrowe: ferrytowe 
i elektromechaniczne 

Niezwykle dynamiczny rozwój elektronicznych ma¬ 
szyn cyfrowych — EMC (zwanych powszechnie kom¬ 
puterami), który nastąpił po II wojnie światowej, po¬ 
budzał m.in. również i rozwój pamięci magnetycz¬ 
nych, oczywiście przede wszystkim pod kątem ich za¬ 
stosowania w EMC. Historycznie pierwsza EMC o EN!AC — 
nazwie ENIAC (z ang. Electronic Numerical Inte- pierwszy 
grator and Calculator) została uruchomiona w 1947 r. komputer 
w USA i działała z szybkością 5 tys. dodawań na 1 s. 


b) ścieżka dźwiękowa taśma 

/ / 



ścieżka , 
synchro- / d| jo¬ 
nizacji " 

blok głowic 

0.1 2 mm 0.25 mm taśmy 


silnik obracający 
blok głowic 


Rys. 1. Urządzenie do magnetycznego zapisu obrazu (system ampeks): a) mechanizm, b) wirujący blok głowic 


foniczny. Odpowiadające temu widmo częstości za¬ 
wiera się w granicach 50 Hz - 6 MHz (przy zapisie 
dźwięku przenoszone pasmo zwykle nie przekracza 
20 kHz)! Największa częstość, jaką urządzenie jest 
zdolne przenieść, jest m.in. uwarunkowana prędkością 
przesuwu taśmy. Stosując podobne rozwiązanie jak 
przy zapisie fonicznym, prędkość przesuwu taśmy 
musiałaby wynosić ok. 100 m/s, podczas gdy dla dźwię¬ 
ku jest poniżej 1 m/s (np. zapis 10 min audycji tele¬ 
wizyjnej wymagałby aż 60 km taśmy). Trudność tę 
pokonano, stosując zapis poprzeczny (ścieżki dla syg¬ 
nału wizji prostopadłe do długości taśmy), w którym 
dzięki umieszczeniu czterech głowic zamocowanych 
na obracającym się bębnie (rys. Ib), było możliwe 
zwiększenie względnej prędkości nośnika magnetycz¬ 
nego w stosunku do głowic. Prędkość obrotowa bębna 


Zasadnicza różnica w działaniu magnetycznej, jak 
zresztą i każdej innej pamięci cyfrowej, w stosunku 
do urządzeń przeznaczonych do zapisywania dźwięku 
lub obrazu, wynika z faktu, że wszelkie operacje 
w maszynie cyfrowej są dokonywane na liczbach. 

Posługiwanie się systemem dziesiętnym wymagałoby 
umiejętności rozróżniania przez każdy układ maszyny 
dziesięciu stanów odpowiednio przyporządkowa¬ 
nych dziesięciu cyfrom tego systemu (1,2,... 9,0). Wy¬ 
korzystując różne zjawiska fizyczne łatwiej jest bu¬ 
dować układy wykazujące dwa stabilne stany równo¬ 
wagi (np. prąd płynie — prąd nie płynie, świeci — nie 
świeci itp.). Z tych też względów w EMC jest po¬ 
wszechnie stosowany system dwójkowy (binarny), 
w którym każdą cyfrę, a tym samym i liczbę w układzie system 
dziesiętnym, można przedstawić jako ciąg jedynek dwójkowy 
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i zer. System lub kod dwójkowy jest utworzony za 
pomocą dwóch cyfr 0 i 1 umieszczanych na pozycjach, 
którym są przyporządkowane kolejne potęgi liczby 
„dwa”, np. ciąg 1 -2 4 + 0-2 3 -f 0-2 2 -{-l • 2*4-1 -2°, od¬ 
powiadający liczbie 19 w systemie dziesiętnym, jest 
zapisany w systemie dwójkowym jako 10011. Wyma¬ 
ga to od układów pamięci zdolności do rozróżniania 
tylko dwóch informacji elementarnych 0 i 1 (elemen¬ 
tarną jednostkę informacji 0 lub 1 przyjęto nazywać 
w technice cyfrowej bitem — z ang. binary digit — 
cyfra dwójkowa). W pamięciach magnetycznych in¬ 
formacjom tym są zwykle przyporządkowane dwa 
stabilne stany namagnesowania, różniące się zwrotem. 

Z zasadą działania magnetycznej pamięci cyfrowej 
zapoznamy się na przykładzie pamięci ferrytowej, 
w której elementarnymi komórkami pamięciowymi są 
rdzenie ferrytowe w kształcie pierścionków (toroidów) 
o średnicach zewnętrznych wielkości dziesiętnych 
części mm (rys. 2a). Charakterystyka magnesowania 
takiego rdzenia ma postać prostokątnej pętli histerezy 
(rys. 2b). Rdzeń jest tym lepszy do użycia w pamięci, im 


ciwnym zwrocie wytworzonym przez impuls prądu 
(—Im) płynący przez linię słowa na wyjściach linii bito¬ 
wych (1,2, ... n) pojawią się napięcia odpowiadające 
zmianom indukcji magnetycznej w poszczególnych 
rdzeniach zgodnie ze wzorem u(l) = — A dBjdl(A — 
stała). Zmiana indukcji w rdzeniach, które zawierały 
informację 0, jest niewielka (AB 0 — obieg A -> E A) 
i odpowiadające jej napięcie również małe. W rdze¬ 
niach z informacją 1, napięcie jest duże wskutek dużej 
zmiany indukcji (AB 1 —obieg /)->£■-> A). Jak wspo¬ 
minaliśmy, po odczycie wszystkie rdzenie wybranego 
słowa znajdują się w stanie 0, co umożliwia wpisanie 
nowej informacji, lub ponowne wpisanie dopiero co 
odczytanej. Pamięci ferrytowe są powszechnie stoso¬ 
wane w EMC jako pamięci operacyjne (lub wewnętrz- pamięć 
ne), stanowiące podstawową część jednostki central- operacyjna 
nej maszyny cyfrowej. Pojemność pamięci ferrytowych -(wewnętrzna) 
wyrażająca maksymalną liczbę bitów, jaką można 
jednocześnie przechowywać, zawiera się w granicach 
od kilkuset bitów do kilku Mbitów. Uzyskiwany 
w nich czas cyklu, określany czasem, który jest po- 



bliższe jedności są jego współczynniki prostokątności 
i kwadratowości, zdefiniowane stosunkami B r !B m 
i B(—źHm)/B m (w praktyce osiągane są wartości w gra¬ 
nicach 0,9-0,98). W rdzeniu łatwo uzyskać dwa róż¬ 
niące się v zwrotem stabilne stany namagnesowania, od¬ 
powiadające dodatniej i ujemnej pozostałości magne¬ 
tycznej (+i?r i —Br). Stanom tym są przyporządko¬ 
wane odpowiednio cyfry 1 i 0 systemu dwójkowego. 
Zapis, jak również i odczyt informacji, są dokonywane 
za pomocą impulsów prądu, płynących przez uzwoje¬ 
nia i nazywane liniami słów i bitów (słowo jest pod¬ 
stawową jednostką obliczeniową danej maszyny i mo¬ 
że zawierać np. 256 bitów), które przechodzą przez 
rdzeń, tworząc płat pamięciowy (rys. 2c). Zakładając, 
że stan wszystkich rdzeni w wybieranej linii słowa (np. 
w linii 4) odpowiada cyfrze 0 (jak przekonamy się stan 
taki jest rzeczywiście ustalony po każdym odczycie) 
określoną informację (np. liczbę 19= 10011) wpisuje¬ 
my, pobudzając wszystkie rdzenie w tej linii impulsem 
pola o amplitudzie równej połowie amplitudy maksy¬ 
malnej (f Hm) oraz jednocześnie impulsem pola o 
tej samej amplitudzie i zwrocie w tych liniach bito¬ 
wych, w których ma być wpisana cyfra 1. Rdzenie 
pobudzane tylko polem połówkowym, wytworzonym 
przez impuls prądu £ 7 m , przepływający przez linię sło¬ 
wa, są magnesowane zgodnie z obiegiem A -> B -+ A 
na pętli histerezy (rys. 2b) i w chwili zaniku impulsu 
tego pola w rdzeniu ustala się ponownie stan 0. Rdze¬ 
nie pobudzane dwoma, sumującymi się impulsami 
pola, są magnesowane zgodnie z obiegiem A -► B -* 
C-> D — i ustala się w nich stan 1. Pobudzając teraz 
rdzenie impulsem pola o pełnej amplitudzie, lecz prze- 


trzebny do dokonania zapisu słowa, jego odczytu 
i zwykle ponownego wpisania odczytanej informacji 
wynosi od 100 ns do kilku ps. Czas ten decyduje o 
szybkości działania EMC. 

Dużą grupę pamięci magnetycznych stanowią urządzenia 
urządzenia elektromechaniczne, których zasada dzia- elektro- 
łania jest podobna do urządzeń do zapisu dźwięku mechaniczne 
lub obrazu. Informacja cyfrowa jest zapisywana w 
warstwie magnetycznej, stanowiącej powierzchnię 
/ 



Rys. 3. Zasada zapisu informacji binarnej na ruchomym nośniku 
magnetycznym w pamięciach elektromechanicznych 
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taśmy, bębna lub dysku. Zapis, zwykle wielościeżko- 
wy, jest dokonywany za pomocą głowicy, przez której 
uzwojenie przepływają impulsy prądu o polaryzacji 
dodatniej lub ujemnej, zależnie od rodzaju zapisywa¬ 
nej informacji 0 lub 1 (rys. 3). Pole magnetyczne, wy¬ 
twarzane w szczelinie głowicy magnesuje kolejno ob¬ 
szary przesuwającej się warstwy w kierunku zgodnym 
lub przeciwnym do kierunku jej ruchu (na rys. 3 w 
sposób poglądowy przedstawiono zapis liczby 19 = 
= 10011). W czasie odczytu rozproszone pole namag¬ 
nesowanych obszarów, zamykając się w obwodzie 
magnetycznym głowicy, indukuje w jej uzwojeniu 
(w trakcie ich przesuwania się pod szczeliną roboczą) 
siłę elektromotoryczną w postaci ciągu impulsów, 
których polaryzacja jest zależna od zwrotu namagne¬ 
sowania, a tym samym i od rodzaju informacji dwój¬ 
kowej. 

Pamięci elektromechaniczne, taśmowe, bębnowe 
pamięć [ dyskowe są dzisiaj powszechnie stosowane w EMC 
zewnętrzna j a ko urządzenia zewnętrzne, służące do zapamiętywa¬ 
nia tzw. masowej informacji, której zapis wymaga 
bardzo dużej pojemności, ok. 10 10 bitów. Pamięci 
dyskowe i taśmowe mają praktycznie nieograniczoną 
pojemność ze względu na możliwość wymiany pa¬ 
kietów dysków lub krążków taśmy. Poważnym bra¬ 
kiem tych urządzeń jest natomiast ich stosunkowo 
mała szybkość działania. Wadą też jest istnienie w tych 
konstrukcjach dość skomplikowanych zespołów me¬ 
chanicznych, stwarzających spore kłopoty w czasie 
eksploatacji. Pamięci ferrytowe i elektromechaniczne, 
mimo prób wprowadzenia innych pamięci magne¬ 
tycznych, są jednak nadal bezkonkurencyjne i stoso¬ 
wane w najnowszych generacjach EMC. 


Najnowsze konstrukcje pamięci cyfrowych 

Znaczny postęp uzyskany w technice laserowej, a prze¬ 
de wszystkim w konstrukcji laserów półprzewodniko- 
pamięć wych, ponownie skupił uwagę na pamięci termomagne- 
termomag- tooptycznej, której pomysł i pierwszy model zrodził 
netooptyczna s ię już w 1958 r. Nieco później (1967 r.) zwrócono 
uwagę na możliwość wykorzystania cylindrycznych 
domen magnetycznych (-> Struktura domenowa 
i procesy magnesowania) w układach pamięci. Ocze¬ 
kuje się, że pamięci te wyeliminują urządzenia elektro¬ 
mechaniczne głównie ze względu na potencjalną moż¬ 
liwość osiągnięcia w nich bardzo dużych pojemności 
przy małych rozmiarach geometrycznych (gęstość 
upakowania informacji rzędu 10 s bitów/cm 2 powierz¬ 
chni nośnika; dla porównania — gęstość tę w mózgu 
ludzkim ocenia się na 10 10 bitów/cm 3 ). W obydwu ro¬ 
dzajach pamięci jako nośnik informacji jest stosowana 
cienka warstwa (grubości rzędu kilku pm) wykazu¬ 
jąca anizotropię magnetyczną, przy czym kierunek 
stosowane łatwego magnesowania leży w płaszczyźnie warstwy 
materiały lub prostopadle do jej powierzchni. Stosowanymi ma¬ 
teriałami są bizmutek manganu (MnBi), związki eu- 


„ 0 " 


pole 




cewka pola 
agnetycznego 



Rys. 4. Schemat blokowy pamięci termomagnetooptycznej z nie¬ 
ruchomym nośnikiem informacji 


ropu (np. EuS lub EuSe) dla pamięci termomagne- 
tooptycznych oraz proste lub mieszane granaty magne¬ 
tyczne (np. Sm 0( 5 Y 2ł5 Ga 1(2 Fe 3 i8 O 12 ) i warstwy amor¬ 
ficzne stopów metali grupy przejściowej z lantanow- 
cami (np. GdCo) dla obydwu rodzajów pamięci. 
W pamięci termomagnetooptycznej zapis jest doko¬ 
nywany za pomocą silnej wiązki światła laserowego 
(rys. 4), współdziałającej z polem magnetycznym. 
Impuls światła — zwykle o czasie trwania mniejszym 
od 1 jis — pada na wybraną, za pomocą układu od¬ 
chylenia wiązki, elementarną komórkę pamięciową 
w ciągłej warstwie nośnika i powoduje jej lokalne na¬ 
grzanie do temperatury większej od temperatury Curie 
materiału (-> Teoria magnetyzmu), w wyniku czego 
komórka jest termicznie rozmagnesowana. (Powierz¬ 
chnia tej komórki jest określona przez przekrój, w 
płaszczyźnie warstwy, zogniskowanej wiązki światła, 
a uzyskiwane w praktyce wiązki mają średnicę ok. 
2 pm). Do otrzymania takich temperatur (rzędu kil¬ 
kuset °C) używa się zwykle lasera gazowego He-Ne 
o mocy ok. 100 mW. Współdziałające pole magne¬ 
tyczne, synchroniczne z impulsami światła, wymusza 
w czasie stygnięcia materiału w obrębie komórki wy¬ 
magany zwrot namagnesowania. Pole to ma kierunek 
prostopadły do powierzchni warstwy (gdy kierunek 
łatwego magnesowania jest prostopadły do powierz¬ 
chni warstwy) lub równoległy (gdy kierunek łatwego 
magnesowania leży w płaszczyźnie warstwy). Zwrot 
pola jest zależny od rodzaju zapisywanej informacji 
0 lub 1, dzięki czemu, po zaniku impulsów światła 
i pola, namagnesowanie w elementarnej komórce pa¬ 
mięci ma zwrot odpowiadający wpisanej cyfrze dwój¬ 
kowej. Odczyt zapisanej w ten sposób informacji jest 
dokonywany za pomocą tej samej wiązki laserowej 
o świetle liniowo spolaryzowanym, lecz tym razem 
o wielokrotnie niniejszej energii. Zaieżnie od rodzaju 
warstwy magnetycznej, w celu rozróżnienia odczy¬ 
tywanej informacji, wykorzystuje się zjawisko Fara¬ 
daya lub Kerra (->- Magnetooptyka). Zasadę odczytu 



Rys. 5. Zasada odczytu informacji przy wykorzystaniu efektu 
Faradaya 


w wypadku przezroczystej warstwy o prostopadłym 
kierunku łatwego magnesow-ania pokazuje rys. 5. Po 
przejściu przez analizator otrzymuje się wiązki światła 
o różnym natężeniu I x i / 2 . Różnica natężeń wiązek 
jest spowodowana skręceniem płaszczyzny polaryzacji 
światła (zjawisko Faradaya) przechodzącego przez 
obszary warstwy o przeciwnych zwrotach namagne¬ 
sowania, co odpowiada informacjom 0 i 1. 

Padając na fotodetektor (np. fotorezystor lub fo¬ 
todiodę), wiązki I x i / 2 , niosące odpowiednio infor¬ 
mację 0 i 1, generują na wyjściu detektora impulsy 
elektryczne o zróżnicowanej amplitudzie odpowiednio 
do różnicy ich natężeń AL W opisanym rozwiązaniu 
pamięci termomagnetooptycznej największą trudność 
sprawia właściwe ogniskowanie wiązki laserowej oraz 
jej odchylanie. Z tych też względów rozwiązanie to, 
w zasadzie analogiczne do pamięci holograficznej, 
nie znalazło dotąd szerszego zastosowania. 

Większe nadzieje wiąże się z rozwiązaniem (rys. 6), 
w którym nośnik informacji naniesiony na podłoże 
w kształcie dysku obraca się, a informacja jest maga¬ 
zynowana wzdłuż koncentrycznych ścieżek (podobnie 
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informacji 
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jak w pamięciach dyskowych). W tej konstrukcji sto¬ 
sowane są lasery półprzewodnikowe (GaAs), uszere¬ 
gowane w bloku w ten sposób, że jeden laser przypada 
na jedną ścieżkę. Przy odczycie wykorzystuje się wiąz¬ 
kę odbitą (efekt Kerra), w związku z czym w tym 


okresu (rys. 7). Elementy toru mają najczęściej kształt 
liter T, I, X, Y lub krokiewek. Sposób przesuwania 
domen w torze typu T-I, najczęściej stosowany w 
praktyce, przedstawia rys. 8, na którym są widoczne 
kolejne fazy ruchu odpowiadające czterem położe- 
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cylindryczne 
jako nośnik 
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pętle 
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rozwiązaniu stosuje się warstwy o kierunku łatwego 
magnesow-ania leżącym w płaszczyźnie warstwy. Po¬ 
jemność tej pamięci, uwarunkowana głównie precyzją 
zogniskowania światła laserowego (ok. 2 jim) i od¬ 
ległością między sąsiednimi źródłami światła w bloku 
(ok. 50 pm), może być rzędu kilkuset Mbitów/dysk, 
co odpowiada gęstości ok. 200 ścieżek/cm. 

Najnowszym rozwiązaniem pamięci magnetycznej 
jest pamięć cyfrowa, w której nośnikiem informacji są 
magnetyczne domeny cylindryczne wytwarzane w 
epitaksjalnych (-► Mikroelektronika) warstwach gra¬ 
natów lub warstwach amorficznych stopów typu 
Gd-Co. Domenie cylindrycznej występującej w okre¬ 
ślonym miejscu warstwy jest przyporządkowana cyf- 
ra 1, jej brakowi w tym miejscu cyfra 0 (wakansja). 
Odpowiednie ciągi składające się z domen i ich wa- 
kansji tworzą liczby (słowa) w kodzie dwójkowym. 
Domeny cylindryczne mogą się przemieszczać między 
określonymi punktami na powierzchni warstwy, co 
jest równoznaczne z przekazywaniem informacji. 

Najmniejsze średnice domen ok. 0,5 pm uzyskano 
dotychczas w warstwach amorficznych. Ze względu 
na możliwości współczesnych technik fotolitograficz¬ 
nych ocenia się, że średnica ta nie może być jednak 
mniejsza niż 0,1 pm. W pierwszych stosowanych w 
praktyce magnetycznych pamięciach cyfrowych śred¬ 
nica domeny wynosiła 6 urn, w nowszych —3 pm. 
W rozwiązaniach tych z reguły stosuje się epitaksjalne 
warstwy granatów. Warstwy amorficzne nie znalazły 
jednak jeszcze powszechniejszego zastosowania. 

Podstawowym elementem w pamięci magnetycznej 
jest zamknięta pętla pamięciowa — stanowiąca rejestr 
szeregowy — do której informacja jest wpisywana, 
przechowywana i następnie z niej pobierana. Przesu¬ 
wanie ciągów informacyjnych (składających się z do¬ 
men i wakansji) w obrębie pętli, niezbędne do prze¬ 
prowadzania wymienionych operacji, jest realizowane 
za pomocą torów propagacyjnych wykonywanych 
zwykle w postaci cienkowarstwowych struktur per- 
malojowych (stop Ni-Fe), naparowywanych przez 
odpowiednią maskę na warstwę nośnika oraz współ¬ 
pracującego z nimi wirującego w płaszczyźnie war¬ 
stwy pola magnetycznego. Ruch poszczególnych do¬ 
men w ciągu następuje w rezultacie oddziaływań mię¬ 
dzy domeną i biegunami magnetycznymi wytwarza¬ 
nymi w elementach permalojowych toru przez wiru¬ 
jące pole. Źródłem tego pola są sinusoidalne prądy 
elektryczne płynące przez dwa uzwojenia o wzajemnie 
prostopadłych osiach, przesunięte w fazie o ćwierć 
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Rys. 7. Zasada wytwarzania pola wirującego w płaszczyźnie 
warstwy i pola podmagnesowania prostopadłego do tej płasz¬ 
czyzny 

domeny 
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Rys. 8. Sposób przesuwania domen cylindrycznych w torze pro- 
pagacyjnym typu T-I 

niom pola wirującego (rys. 8a, b, c i d). Pełny obrót 
pola odpowiada przesunięciu o jedno położenie w pe¬ 
riodycznej strukturze toru (rys. 8e). Podstawowy układ 
pamięci (rys. 9), zawiera szereg pętli pamięciowych 
(do kilkudziesięciu, każda o pojemności rzędu kilku¬ 
set bitów), sprzężonych przez bramki przepustowe 
z pętlą transportową, która służy do wprowadzania 
lub wyprowadzania informacji z pętli pamięciowych. 
Bramki przepustowe, kierujące ciągi domen w okre¬ 
ślone odgałęzienia torów, są zwykle wykonywane 
również w postaci odpowiednich struktur permalojo¬ 
wych i wbudowanych w nie ścieżek przewodzących, 
w których kierunek płynącego prądu decyduje o kie¬ 
runku otwarcia bramki. W czasie zapisu poszczególne 
bity słowa, wytworzonego przez generator w postaci 
odpowiedniego ciągu domen (np. 10011 jak to poka¬ 
zano dla przykładu na rys. 9), są wprowadzane do 
pętli transportowej i następnie przesunięte w niej w ta- 
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pamiętania. Zasada działania anihilatora jest oparta 
na zjawisku zanikania domeny. 

Pojedyncza płytka pamięciowa zawiera jeden lub 
kilka podstawowych układów. Szereg płytek pamię¬ 
ciowych (do kilkudziesięciu) umieszczonych we wmęt- 
rzu układu wytwarzającego pole wirujące i podmag- 
nesowania tworzy podstawowy moduł pamięci, z któ¬ 
rych można składać układy o wymaganej pojemności. 
Na ii. 98 (tabl. 24) przedstawiono moduł pamięci na 
domenach cylindrycznych. W istniejących rozwiąza¬ 
niach tych pamięci osiągana jest gęstość zapisu 10 5 - 
10 6 bitów/cm 2 , szybkość przekazywania informacji 
10®—10 7 bitów/s oraz pojemności do kilku Mbitów. 

W najnowszym rozwiązaniu pamięci na domenach 
cylindrycznych jest wykorzystywana regularna (hek¬ 
sagonalna) siatka domen, powstająca w sposób natu¬ 
ralny w epitaksjalnej warstwie granatu magnetycz¬ 
nego. Położenia komórek pamięciowych wyznaczają 
same domeny, gęsto upakowane w warstwie; upako¬ 
wanie w siatce domen jest 16-krotnie większe w po¬ 
równaniu z poprzednio omawianym rozwiązaniem, 
w którym ze względu na magnetostatyczne oddziały¬ 
wania odległość między sąsiednimi domenami nie 
może być mniejsza niż cztery średnice domeny. Cy¬ 
from dwójkowym 0 i 1 są przyporządkowane odpo¬ 
wiednio dwa rodzaje domen, różniące się strukturą 
magnetyczną otaczającej je ścianki. W czasie odczytu 
jedne z nich poruszają się pod pewnym kątem w sto¬ 
sunku do gradientu wymuszającego ten ruch pola 
magnetycznego, drugie — równolegle. Pozwala to 
kierować domeny odpowiadające informacjom 0 i 1 
do dwóch, niezależnych torów odczytu. Zapis, pole¬ 
gający na tworzeniu domen o kontrolowanej struk¬ 
turze ścianki, jest dokonywany za pomocą dwóch 
koincydencyjnych pól skierowanych prostopadle 
i równolegle do płaszczyzny warstwy. Najistotniejszą 
zaletą tego rozwiązania jest bardzo duża stabilność 
siatki na zmiany warunków zewnętrznych. 

Wobec niezwykle dynamicznego rozwoju badań 
materiałów magnetycznych w ostatnich latach na 
świecie, nie można wykluczyć i tego, że zanim publi¬ 
kacja ta dotrze do rąk Czytelników, pojawią się pa¬ 
mięci magnetyczne wykorzystujące materiały i zja¬ 
wiska dziś jeszcze nie znane. 

A. J. Meyerhoff (red.) Cyfrowe zastosowania układów magne¬ 
tycznych, Warszawa 1964; M. Nałęcz (red.) Cylindryczne dome¬ 
ny magnetyczne w technice cyfrowej, Warszawa 1973; E. Nowak, 
Z. Sawicki Pamięci maszyn cyfrowych: konstrukcja i techno¬ 
logia, Warszawa 1977; B. Urbański Magnetyczny zapis dźwię¬ 
ków i obrazów. Warszawa 1965. 


Najsilniejsze pola magnetyczne 

Czesław Bazan 

Pole magnetyczne wpływa w zasadzie na wszystkie 
zjawiska fizyczne, jest więc jednym z istotnych czyn¬ 
ników fizycznego poznania świata. Ponieważ na ogół 
działanie pola magnetycznego jest tyrn większe im 
większe jest jego natężenie bądź też można je zaobser¬ 
wować dopiero po przekroczeniu pewnych granicz¬ 
nych wartości, fizycy starają się stosować pola coraz 
silniejsze. 

Wielkość pola określamy podając jego natężenie 
lT^10 6 A/m lub indukcję. Międzynarodowa jednostka natężenia 
pola: amper na metr (A/m) jest zbyt mała dla na¬ 
szych celów. Bardziej odpowiednią jest wielkość 
10 5 A/m = 1 kA/cm. Jednostką indukcji magnetycz¬ 
nej jest tesla (T). W próżni 1 T odpowiada ok. 

10 kA/cm. Dla uproszczenia będziemy się posługiwać 
jednostką indukcji, pisząc krótko: pole 1 T — zamiast 
pole o natężeniu 3 0 kA/cm w powietrzu. 

Człowiek bezpośrednio nie odczuwa obecności, a 
tym bardziej wielkości pola magnetycznego. Dlatego 
przypomnimy dla porównania wartości odpowied¬ 
nich pól magnetycznych: 
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pole między biegunami magnesu podkowiastego — 
około 0,1 T; 

pole magnetyczne Ziemi przy jej powierzchni — 
poniżej 10“ 4 T; 

pola magnetyczne gwiazd — poniżej 5 T. 

Pola magnetyczne powyżej 5 T uważane są za silne. 
Wartości silnych pól magnetycznych spotykanych w 
przyrodzie podano na rys. 1. 

Pola magnetyczne możemy wytwarzać trzema spo¬ 
sobami : a) używając magnesów trwałych; b) wyzysku¬ 
jąc przepływ prądu elektrycznego np. przez przewod¬ 
nik; c) łącząc metody a i b. Ponieważ w metodzie a i c 
stosuje się ferromagnetyki, wartość otrzymywanego 
pola jest ograniczona wartością namagnesowania na¬ 
sycenia. Dalszy wzrost pola można uzyskać przez 
zwiększanie masy magnesu lub rdzenia, przy czym 
wzrost ten jest wykładniczy. Na przykład zwiększeniu 
masy rdzenia z 10 do 100 t odpowiada wzrost pola 
z 3,5 T do 7 T. Największy zbudowany elektromagnes 
rdzeniowy miał 120 t i wytwarzał pole 7 T. Dalszy 
rozwój tego typu źródeł silnych pól magnetycznych 


pętli pamięciowych, których liczba odpowiada w za¬ 
sadzie długości słowa mierzonej w bitach. Poszczegól¬ 
ne bity wpisanego słowa są następnie synchronicznie 
przesuwane w pętlach pamięciowych, krążąc w nich 
do momentu, w którym przechowywana informacja 



Rys. 9. Schemat podstawowego układu cyfrowej pamięci na 
domenach cylindrycznych 


pobieranie ma być odczytana. Pobranie danego słowa przebiega 
informacji w odwrotnej kolejności. Odczyt następuje w detek¬ 
torze (wykorzystującym zjawisko Hal la, zjawisko 
magnetooptyczne lub magnetooporowe), na którego 
wyjściu pojawia się sekwencja impulsów napięcia 
odpowiadająca odczytywanej informacji. Umiesz¬ 
czony w torze replikator pozwala na odtworzenie kie¬ 
rowanego do detektora ciągu informacyjnego, co 
umożliwia dalsze przechowywanie odczytywanej in¬ 
formacji. Sprzężony z pętlą transportową anihilator 
służy z kolei do niszczenia domen w tych ciągach in¬ 
formacyjnych, które nie są przeznaczone do dalszego 
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Ważniejsze osiągnięcia w dziedzinie silnych pól magne¬ 
tycznych 


Rok 

Autor 

Kraj 

Osiągnięcie 

1820 

H. Ch. Ocr- 
sted 

Dania 

odkrycie zjawiska oddzia¬ 
ływania prądu na pole ma¬ 
gnetyczne 

1914 

G. Deslandres, 
A. Per rot 

Fran¬ 

cja 

zbudowanie pierwszego 

elektromagnesu bezrdze- 
niowego, chłodzonego wo¬ 
dą, wytwarzającego pole 
5 T 

1923 

P. L. Kapica 

W. Bry¬ 
tania 

wytworzenie po raz pierw¬ 
szy pola impulsowego 20 T 

1936 

F. Bitter 

USA 

zastosowanie w badaniach 
fizycznych elektromagne¬ 
sów bezrdzeniowych, chło¬ 
dzonych wodą, wytwarza¬ 
jących pola do 10 T 

1956 

A. D. Sacharow 

ZSRR 

otrzymanie pola impulso¬ 
wego 2500 T metodą ści¬ 
skania strumienia magne¬ 
tycznego za pomocą eks¬ 
plozji 

1961 

S. H. Autler, 
R.R. Hake, 
K.M. Olsen 
i in. 

USA 

wykonanie pierwszych 

elektromagnesów nadprze¬ 
wodnikowych, wytwarza¬ 
jących pola powyżej 5 T 

1977 

M. J. Leupold, 

R. J. Wcggel, 

Y. Iwasa 

USA 

uruchomienie elektroma¬ 
gnesu hybrydowego wy¬ 
twarzającego pole stacjo¬ 
narne 30 T (średnica we¬ 
wnętrzna 4,0 cm) 
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Rys. 1. Pola magnetyczne osiągane różnymi metodami i spoty¬ 
kane w przyrodzie. Poszczególne punkty przedstawiają pola 
uzyskiwane doświadczalnie. Linia kreskowana oddziela obszar 
pól dotychczas dostępnych (poniżej krzywej) od obszaru pól 
nieosiągalnych. Na osi poziomej podano czas narastania impulsu 
lub czas możliwej pracy elektromagnesu 


nie miałby już sensu i dlatego do uzyskiwania pól 
powyżej 5 T stosuje się elektromagnesy bezrdzeniowe. 


Do czego mogą służyć silne 
pola magnetyczne 

Zastosowanie silnych pól magnetycznych związane 
jest z podstawowymi przejawami działania pola ma¬ 
gnetycznego przedstawionymi schematycznie na rys. 2. 
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Silne pola magnetyczne stosuje się do formowania dziedziny 
wiązek cząstek (naładowanych), do zmiany toru po- zastosowań 
jedynczych cząstek naładowanych o dużej energii 
(a i d), do utrzymywania plazmy w ograniczonym ob¬ 
szarze i rozdzielania ładunków w generatorach mag- 
netohydrodynamicznych (a), do badania ogólnych 
własności ciała stałego i konkretnych własności ma¬ 
teriałów, a także do obróbki metali (b i c). Zilustru¬ 
jemy rolę silnych pól -najpierw w badaniach ciała sta¬ 
łego. 



Rys. 2. Działanie pola magnetycznego: a) Zakrzywianie torów 
cząstek naładowanych w płaszczyźnie prostopadłej do pola (na 
ruch w kierunku równoległym pole nie działa). Promień krzy¬ 
wizny r = mvlqB , gdzie v prędkość, q ładunek elektryczny, 
m masa, B indukcja magnetyczna, b) Porządkowanie kierunku 
dipoli magnetycznych wzdłuż linii pola. c) Działanie sił wciągają¬ 
cych i wypychających w polu niejednorodnym, d) Przyspieszanie 
ładunków w polu zmiennym rosnącym w czasie 


Nadprzewodniki stosuje się m.in. do budowy elek- w nadprze- 
tromagnesów wytwarzających silne pola magnetyczne, wodnikach 
Z drugiej strony silne pola są niezbędne do określenia 
własności nadprzewodników, przy czym muszą one 
być większe niż pola krytyczne nadprzewodników 
(sięgające 60 T). Fizyków interesują badania takich 
własności nadprzewodników, jak zależność pola kry¬ 
tycznego od temperatury, czy prądu krytycznego od 
pola i temperatury (rys. 3) bądź przebiegi namagneso¬ 
wania, z których można wyciągnąć wnioski o mecha¬ 
nizmie powstawania nadprzewodnictwa, ruchu linii 
strumienia magnetycznego przenikających przez nad¬ 
przewodnik itp. 

Źródłem informacji o strukturze elektronowej me- w metalach 
tali są badania zmian oporu elektrycznego w polu 
magnetycznym. Opór metali rośnie w polu magnetycz¬ 
nym i to tym silniej, im niższy jest opór właściwy me¬ 
talu. Dlatego w badaniach tych stosuje się niskie tem¬ 
peratury i czyste próbki. Niektóre metale wykazują 
silny (liniowy lub kwadratowy) wzrost oporu ze wzro¬ 
stem pola, a inne — po początkowym wzroście — 
wykazują nasycenie. W monokryształach opór w jed¬ 
nych kierunkach może zmieniać się wg jednej zależ¬ 
ności, a w innych — wg drugiej (anizotropia magne- 
tooporu, rys. 4). Zjawiska te mają ścisły związek 
z własnościami gazu elektronowego (z kształtem 
powierzchni Fermiego), a bardziej poglądowo — 
z możliwościami ruchu elektronów w sieci krystalicz¬ 
nej w polu magnetycznym. Wiemy, że pod działaniem 


















































pola magnetycznego elektrony powinny poruszać się 
po okręgach. W sieci krystalicznej natrafiają jednak 
na oddziaływania pól elektrycznych, które pozwalają 
im na ruch po okręgach lub — ogólniej — krzywych 
zamkniętych, albo po krzywych otwartych (np. po 
linii falistej). W pierwszym wypadku opór elektryczny 
w silnym polu nie zmienia się, a w drugim rośnie 
kwadratowo z polem. Czasem w dostatecznie silnym 
przebicie polu następuje przejście z jednego typu zależności 
magnetyczne w drugą, tzw. przebicie magnetyczne. Podobne zja¬ 
wiska zachodzą w półprzewodnikach. Zmiany włas¬ 


ności nośników- prądu w metalach i półprzewodnikach 
rzutują również na własności cieplne i optyczne tych 
substancji. 

W ciałach paramagnetycznych występuje zjawisko 
ustawiania się dipoli magnetycznych w kierunku 
pola. Obserwuje się to jako wzrost namagnesowania 
ciała (tj. paramagnetyk w polu staje się magnesem). 
Stopień uporządkowania zależy od temperatury, 
gdyż ruchy cieplne niszczą uporządkowanie. Aby 
w danej temperaturze uporządkować większość di¬ 
poli, trzeba stosować pole ok. 2 T na każdy stopień 



nadprzewod¬ 
niki „twarde" t A 


o 



temperatura 

Rys. 3. Charakterystyki nadprzewodników ,,twardych’’: a) Za¬ 
leżność natężenia prądu krytycznego od natężenia pola magne¬ 
tycznego w temperaturze 4,2 K; średnica drutów 0,5 mm. b) Za¬ 
leżność natężenia pola krytycznego od temperatury. Linie ciągle 
przedstawiają pomiary w polach stałych, kropki — dane z po¬ 
miarów w polach impulsowych, linie przerywane -—ekstrapolacje 
hipotetyczne. Nadprzewodnik PbMo$S g , o najwyższym polu 
krytycznym, nic jest jeszcze stosowany w praktyce 



pole magnetyczne 

R>s. 4. Typowa zależność oporu elektrycznego od pola magne¬ 
tycznego (monokryształ rutenu; pole magnetyczne skierowane 
prostopadle do dwu różnych osi krystalograficznych; tempera¬ 
tura 4,2 K) 

temperatury w paramagnetykach elektronowych i ok. 
3000 T w paramagnetykach jądrowych. W celu na¬ 
magnesowania tych ostatnich trzeba stosować tem¬ 
peratury poniżej 10“ 2 K. 

W ferromagnetykach, dipole magnetyczne ustawio¬ 
ne są równolegle względem siebie i zwrócone w pe¬ 
wnym wyróżnionym kierunku narzuconym przez 
strukturę krystaliczną, przy czym mniej więcej w po¬ 
łowie objętości materiału zwrot dipoli jest przeciwny 
niż w pozostałej jego części. Wypadkowy moment 
magnetyczny jest równy zeru. Gdy przyłożymy pole 
magnetyczne w tym właśnie kierunku krystalogra¬ 
ficznym, już w stosunkowo słabym polu następu¬ 
je zmiana zwrotu dipoli skierowanych przeciwnie 
(o 180°) i próbka zostaje namagnesowana do nasy¬ 
cenia. Dlatego ten kierunek krystalograficzny na¬ 
zwano kierunkiem łatwego magnesowania. Aby 
próbkę namagnesować w kierunku odmiennym od 
łatwego, trzeba dipole obrócić o określony kąt wzglę¬ 
dem osi łatwego magnesowania, a to wymaga włoże¬ 
nia odpowiedniej pracy w pokonanie energii pola kry¬ 
stalicznego. Całkowite namagnesowanie próbki uzy¬ 
skuje się w polach magnetycznych dużo większych, 
dochodzących np. do 100 T. Wielkość pola magne- 



pole magnetyczne 

Rvs. 5. Krzywe namagnesowania ferromagnetyka (polikryształ 
USbSe) i antyferromagnetyku (monokryształ PrSn 3 ) w- tempera¬ 
turze 4,2 K. Do całkowitego namagnesowania trzeba by zasto¬ 
sować pola rzędu 50 T (a) i 30 T (6) 
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tycznego niezbędnego do całkowitego namagnesowa¬ 
nia próbki jest więc miarą wielkości działających pól 
anizotropii magnetokrystalicznej i charakteryzuje da¬ 
ny materiał (rys. 5, krzywa a). 

Jeszcze ciekawiej wygląda przebieg namagnesowa¬ 
nia antyferromagnetyków (krzywa b). Pola moleku¬ 
larne powodują w nich ustawienie sąsiednich dipoli 
w kierunkach przeciwnych, a anizotropia magneto- 
krystaliczna — wzdłuż określonej osi w krysztale. 
Pole magnetyczne stara się ustawić dipole w swoim 
kierunku i proces namagnesowania zależy od wiel¬ 
kości pola w stosunku do wielkości tych innych od¬ 
działywań i od jego kierunku. Na ogół obserwuje się, 
że w określonym polu namagnesowanie zmienia się 
skokowo. Oznacza to pokonanie bądź pola anizo¬ 
tropii, bądź pola molekularnego (wówczas antyferro¬ 
magnetyk zmienia się w ferromagnetyk). Badania 
w silnych polach pozwalają na określenie wielkości 
tych oddziaływań. 

W miarę zwiększania natężenia pola elektrony 
w metalu krążą (o ile mogą) po okręgach o coraz 
mniejszych promieniach. W polach rzędu 10 tys. T 
(a więc jeszcze nieosiągalnych) rozmiary tych okrę¬ 
gów powinny być zbliżone do rozmiarów orbit ato¬ 
mowych. Również same orbity atomowe ulegną de¬ 
formacji (ściskaniu), co powinno prowadzić do rady¬ 
kalnych zmian własności ciał i atomów. 

Silne pola magnetyczne stosowane są w urządze¬ 
niach fizyki jądrowej do przyspieszania cząstek, wy¬ 
prowadzania ich z obszaru akceleratorów, separacji 
i identyfikacji. Do lat sześćdziesiątych stosowano 
wszędzie w tych wypadkach przestrzennie olbrzymie 
elektromagnesy rdzeniowe, wytwarzające pola tylko 
do ok. 2 T, zasilane mocami rzędu dziesiątków mega¬ 
watów'. Właśnie z tego powodu różnego typu akcele¬ 
ratory (np. synchrotrony) rozrastały się do olbrzy¬ 
mich, kilometrowych rozmiarów. Zwiększenie pola 
w tych urządzeniach np. pięciokrotnie pozwoliłoby na 
porównywalne zmniejszenie wymiarów lub zwiększe¬ 
nie uzyskiw-anej energii. W wielu krajach przygoto¬ 
wuje się projekty zastosowania do tego celu elektro¬ 
magnesów nadprzewodnikowych o indukcji ok. 5 T. 
Pola impulsowe do 30 T w elektromagnesach o sto¬ 
sunkowo dużych średnicach stosuje się do identyfi¬ 
kacji cząstek w komorach pęcherzykowych. 

Podobna sytuacja istnieje w urządzeniach do syn¬ 
tezy termojądrowej. Do utrzymywania plazmy w ko¬ 
morze badawczej stosuje się ,,butelki” lub „zwiercia¬ 
dła” magnetyczne, wytwarzające pola do 20 T. W 
urządzeniach pierścieniowych typu Tokamak energia 
cząstek plazmy zależy od wielkości pola impulsowego 
działającego na cząstki, a z kolei do ich utrzymywania 
w rurze trzeba odpowiednio dużego pola skierowanego 
wzdłuż pierścienia. W urządzeniu Alcator zbudowa¬ 
nym ostatnio w Stanach Zjednoczonych zastosowano 
oba pola po 10 T. 

W magnetohydrodynamicznych generatorach ener¬ 
gii elektrycznej pole magnetyczne służy do rozdziela¬ 
nia ładunków’ w plazmie. Zwiększenie pola przy sto¬ 
sowaniu elektromagnesów nadprzewodnikowych pro¬ 
wadzi tu — tak jak i w akceleratorach — do zmniej¬ 
szenia rozmiarów lub zwiększenia uzyskiwanej energii. 
Obecnie próbuje się stosować elektromagnesy nad¬ 
przewodnikowe wytwarzające pola 5 T zamiast elek¬ 
tromagnesów rdzeniowych. W Japonii zbudowano np. 
elektromagnes nadprzewodnikowy wytwarzający w 
komorze o poprzecznych wymiarach 1,3 x 0,4 m i dłu¬ 
gości 2,8 m pole do 4,5 T. Masa jego przekracza 50 ton. 

Pole magnetyczne może służyć nie tylko do przy¬ 
spieszania cząstek elementarnych. Jeżeli w polu sil¬ 
nego elektromagnesu impulsowego umieścimy meta¬ 
lową kulkę, to prądy indukowane w metalu wytworzą 
własne pola skierowane przeciwnie do pola głównego 
i kulka będzie wypychana z pola na zewnątrz (rys. 2c). 

W doświadczeniach z ciałami o masie ok. 2 g uzyska¬ 
no prędkości powyżej 100 km/s. Podobny efekt — 
wypychanie metalu w polu impulsowym — stosuje się 
w technice do walcow-ania prętów i prasowania nawet 


skomplikowanych kształtek. W ten sposób wytwarza 
się również wysokie ciśnienia stosowane do badań 
fizycznych, a także wysokie ciśnienia w przemyśle do 
kształtowania metali. 


Wytwarzanie silnych pól 
magnetycznych 

Pole magnetyczne wytworzone wokół prostego prze¬ 
wodu z przepływającym prądem jest niedogodne do 
badań, gdyż zmienia się silnie w przestrzeni. Do do¬ 
świadczeń fizycznych potrzebne są pola jednorodne 
w obszarach o rozciągłości od jednego do kilku cen¬ 
tymetrów i większych. Uzyskuje się je najprościej w 
solenoidzie. Jednostką natężenia pola jest A/cm właś¬ 
nie dlatego, że dla wytworzenia pola w solenoidzie 
trzeba przez uzwojenie przepuścić tyle amperów na 
1 cm długości solenoidu, ile ma wynieść natężenie po¬ 
la; np. dla wytworzenia pola o indukcji około 10 T, 
tzn. o natężeniu 10 5 A/cm, przez każdy cm długości 
solenoidu trzeba przepuścić prąd o natężeniu 100 tys. 
amperów (może to być 10 5 A w jednym przewodzie 
lub po 1000 A w stu przewodach). Pole można zwięk¬ 
szyć nakładając solenoidy na siebie, gdyż pola po¬ 
szczególnych solenoidów dodają się. W ten sposób 
otrzymujemy cew'kę cylindryczną z wewnętrznym 
otworem pomiarowym. Natężenie pola w danej cewce 
jest zawsze proporcjonalne do natężenia prądu i licz¬ 
by zwojów, a ponadto zależy od kształtu i wielkości 
cewki oraz rozkładu prądu wewnątrz (w różnych czę¬ 
ściach cewki można przepuszczać prądy o różnych 
natężeniach). Zwoje dalej położone od środka cewki 
wytwarzają pole słabsze, ich działanie jest więc mniej 
skuteczne. 

Elektromagnesy do wytwarzania silnych pól mag¬ 
netycznych nie zawsze mają kształty cylindryczne 
(jak np. solenoid). W wielu doświadczeniach z fizyki 
jądrowej, w- urządzeniach termojądrowych czy w ge¬ 
neratorach magnetohydrodynamicznych stosuje się 
elektromagnesy o nieraz bardzo skomplikowanych 
kształtach, dostosowanych do żądanego przebiegu 
linii sił pola magnetycznego (rys. 6 i il. 61, tabl. 16). 
Pola magnetyczne uzyskiwane różnymi metodami 
mają zawsze ograniczoną wartość, która zależy od 
sposobu uzyskiwania pola. 
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Rys. 6. Elektromagnes typu Bittcra: a) Schemat budowy cewki 
(strzałki oznaczają drogę przepływu prądu). Narysowano tylko 
część otworków tworzących w cewce kanaliki dla przepływu wody 
chłodzącej, b) Wygląd kompletu błach uzwojenia trzyccwko- 
wego elektromagnesu wytwarzającego pole 20 T (Międzynaro¬ 
dowe Laboratorium Silnych Pól Magnetycznych i Niskich Tem¬ 
peratur, Wrocław). Widoczne otworki — to kanaliki chłodzące 


Energia elektryczna doprowadzana do elektromag¬ 
nesu jest potrzebna do wytwarzania pola w czasie 
jego narastania oraz do pokonania oporu elektrycz¬ 
nego stawianego przez przewodnik przy przepływie 
prądu. Zużycie energii na wytworzenie pola odgrywa 
istotną rolę w elektromagnesach impulsowych. Wy- 
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dzielanie ciepła wskutek przepływu prądu zachodzi 
natomiast zarówno w elektromagnesach impulso¬ 
wych, jak i elektromagnesach wytwarzających pola 
stałe. Dlatego najekonomiczniejsze są elektromagnesy 
nadprzewodnikowe. 

elektro- Ze względu na brak oporu elektrycznego prąd może 
magnesy przepływać przez nadprzewodniki bez strat energii, 
nadprze- Wydawałoby się więc, że wystarczy nawinąć cewkę 
wednikowe z nadprzewodnika, zanurzyć w ciekłym helu, prze¬ 
puścić określony prąd i otrzymamy odpowiednie pole. 
Okazuje się jednak, że istnieją tu dwa ograniczenia. 
Zasadnicze polega na tym, że każdy nadprzewodnik 
traci własności nadprzewodzące w polu powyżej pola 
krytycznego (rys. 3). Te szczytowe wartości praktycz¬ 
nie też nie są osiągalne, gdyż w danym polu przez 
nadprzewodnik może płynąć tylko ograniczony prąd. 
Można to skompensować znacznym wzrostem obję¬ 
tości cewki, co jest nieekonomiczne. Dlatego najwyż¬ 
sze pola magnetyczne uzyskiwane w elektromagne¬ 
sach nadprzewodnikowych wynoszą 17,5 T, a projek¬ 
tuje się magnesy na 20 T (mimo że maksymalne pola 
krytyczne stosowanych materiałów wynoszą ok. 
25 T). Tak więc dla uzyskania pól wyższych trzeba 
wydatkować znaczną energię. 

straty Aby zdać sobie sprawę z wielkości strat energii, 
energii zrobimy przykładowe oszacowanie. Wyobraźmy so¬ 
bie, że z pręta miedzianego o grubości 1 cm wykona¬ 
my solenoid o średnicy 4 cm i długości 20 cm. Dla 
uzyskania 10 T musimy przepuścić prąd o natężeniu 
10 5 A. Znając długość pręta (ok. 3 m) i opór właściwy 
miedzi możemy obliczyć opór pręta i wydzieloną moc. 
Wynosi ona aż 6 MW. 

Rzeczywiste elektromagnesy wytwarzające takie 
pola pobierają moc mniejszą, ok. 2 MW. Ponieważ 
moc rośnie proporcjonalnie do kwadratu natężenia 
prądu — rośnie ona z kwadratem pola. Taki sam so¬ 
lenoid na 20 T zużyje już teoretycznie 8 MW. Dla 
porównania: trzydziestotysięczne miasto zużywa dla 
potrzeb gospodarstwa domowego wieczorem ok. 
4 MW. Ta sama moc może ogrzać w ciągu sekundy 
10 kg miedzi do temperatury topnienia. 

Ostatni przykład wskazuje, że gdyby nie przedsię¬ 
wziąć żadnych środków ostrożności, uzwojenie elek¬ 
tromagnesu stopiłoby się w ciągu kilkudziesięciu 
sekund. Dlatego elektromagnesy takie muszą być 
chłodzone, najczęściej wodą o wysokiej czystości 
(dla uniknięcia korozji i elektrolizy), 
elektro- W zakresie mniej więcej do 20 T moc pobierana 
magnesy przez cewki rośnie proporcjonalnie do kwadratu pola, 
dużej mocy potem jednak wzrost staje się coraz szybszy. Tak np. 

dla uzyskania pola 40 T zamiast 2 2 x 8 = 32 MW 
trzeba by dostarczyć około 200 MW. Takie elektro¬ 
magnesy są już projektowane, ale na budowę ich 
mogą sobie pozwolić tylko najbogatsze kraje. Przy¬ 
czyną silnego wzrostu mocy są naprężenia mecha¬ 
niczne w cewkach. 

Wiadomo, że pole magnetyczne działa na przewod¬ 
nik z prądem siłą proporcjonalną do iloczynu natę¬ 
żenia prądu i indukcji pola. Ponieważ zaś samo pole 
jest proporcjonalne do natężenia prądu, siły działające 
na uzwojenie rosną z kwadratem pola. Są to siły ścis¬ 
kające uzwojenie wzdłuż osi i rozrywające je promie¬ 
niście na zewnątrz. W polach ok. 25 T osiąga się 
granicę wytrzymałości miedzi. Należy więc zastąpić 
ją materiałem bardziej wytrzymałym, ale o większym 
oporze właściwym (co daje dodatkową stratę energii), 
albo zmniejszyć natężenie prądu w ośrodku magnesu, 
a to oznacza powiększanie rozmiarów magnesu. Po¬ 
nadto ilość kanałów chłodzących nie może być do¬ 
wolnie duża, np. nie mogą się one z sobą stykać, gdyż 
uniemożliwiłyby przepływ prądu. Wszystko to pro¬ 
wadzi do wzrostu wielkości cewki, przy niezmiennej 
średnicy wewnętrznej, i do lawinowego wzrostu tra¬ 
conej mocy. _ 

Największe pola o mocy do 23 T w magnesach 
chłodzonych wodą otrzymywane są w Laboratorium 
Silnych Pól CNRS w Grenoble i w Narodowym 
Laboratorium Magnetycznym MIT w Cabmridge 


(USA), poza tym istnieje ok. 15 ośrodków dysponu¬ 
jących polami słabszymi. 

W poszukiwaniu sposobów zmniejszenia mocy nie¬ 
zbędnych do zasilania elektromagnesów zwrócono 
uwagę na możliwość zmniejszenia oporu właściwego 
metalu przez obniżenie temperatury. Opór właściwy 
miedzi w ciekłym azocie maleje ok. 6 razy, w ciekłym 
wodorze lub ciekłym helu — kilkaset razy, a opór 
bardzo czystego aluminium — kilka tysięcy razy. 
Z megawatów przechodzimy więc już do kilowatów. 
Jakkolwiek pobór mocy bezpośrednio przez elektro¬ 
magnes odpowiednio maleje, to, jeśli się wliczy koszty 
skraplania, okazuje się, że opłacalna jest tylko praca 
elektromagnesu wykonanego z aluminium chłodzo¬ 
nego ciekłym helem. 

W latach sześćdziesiątych wykonano, głównie w 
Stanach Zjednoczonych, kilka elektromagnesów do 
pracy ciągłej. Nie znalazły one jednak szerszego za¬ 
stosowania ze względu na znaczne ilości zużywanego 
chłodziwa. Dla przykładu: wykonany w Boulder 
elektromagnes na 10 T, o mocy zasilania 5 kW (za¬ 
miast normalnie ok. 3,5 MW), zużywał ok. 600 1 
ciekłego wodoru na godzinę. Toteż obecnie elektro¬ 
magnesy kriogeniczne stosuje się na ogół do pracy 
impulsowej. 

Stosunkowo niedawno (w 1966 r.) wysunięto ideę 
połączenia cech elektromagnesu dużej mocy (wytwa¬ 
rzanie silnych pól) i nadprzewodnikowego (moc zasi¬ 
lania bardzo mała). Nakładając na elektromagnes 
dużej mocy (np. 20 T) elektromagnes nadprzewodni¬ 
kowy na 10 T otrzymamy układ wytwarzający pole 
30 T przy nie zmienionej mocy zasilania. W 1974 r. 
ukończono budowę takich elektromagnesów w dwu 
ośrodkach (IEA w Moskwie i MIT w USA; rys. 7 
i il. 60, tabl. 16). Obecnie na świecie pracują już 4 
magnesy hybrydowe, a najsilniejsze pole wytworzone 
w nich wynosi 30 T. 



Rys. 7. Schemat elektromagnesu hybrydowego wytwarzającego 
pole 25 T, wykonanego w Instytucie Energii Atomowej w Mo¬ 
skwie. Część wewnętrzna chłodzona wodą wytwarza pole 18,4 T 
przy mocy zasilania 5,6 MW, część zewnętrzna, nadprzewodząca, 
wytwarza pole 6,3 T. Elektromagnes nadprzewodnikowy (zanu¬ 
rzony w zbiorniku z ciekłym helem) ma masę ok. 1,5 t i średnicę 
zewnętrzną 70 cm 

Opisane dotychczas elektromagnesy mogą utrzy¬ 
mywać zadaną wartość pola przez czas dostatecznie 
długi, np. kilkadziesiąt minut. Wykorzystuje się je do 
badań wymagających dłuższego czasu lub takich, 
w których stałość pola odgrywa istotną rolę. Prowa¬ 
dzi się więc w nich badania fizyczne ciał stałych, zwła¬ 
szcza metali, opisane w poprzednim rozdziale. Sto¬ 
suje się je również w niektórych urządzeniach fizyki 
jądrowej. 

Pola silniejsze, powyżej 30 T, uzyskuje się metodą 
bardziej oszczędną. Ponieważ pobieranie przez dłuż¬ 
szy czas prądu o mocy dziesiątków lub setek mega- 
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watów jest zbyt kosztowne, doprowadzamy taki prąd 
do elektromagnesów odpowiednio krótkimi impul¬ 
sami, gromadząc energię elektryczną w urządzeniach 
zasilających przez czas stosunkowo długi, w przer¬ 
wach między impulsami. Wówczas średnia moc po¬ 
bierana może być dostatecznie niska. Przykładem 
może być największy elektromagnes chłodzony wodą 
w Canberrze (Australia), zasilany mocą szczytową 
30 MW w ciągu paru sekund, a wytwarzający pole 
30 T. Ogólnie ma tu zastosowanie zasada: silniejsze 
pole — krótszy czas. Dalszym sposobem zmniejszania 
mocy pobieranej jest zmniejszenie średnicy wewnę¬ 
trznej cewki, np. do 1 cm. Cewki są wówczas nawinię¬ 
te z drutu, bądź stanowią jednowarstwowe solenoidy 
(rys. 8), czy wreszcie składają się tylko z jednego 
zwoju. Im mniej zwojów, tym krótszy czas impulsu. 



Rys. S. Schemat jednowarstwowego elektromagnesu impulso¬ 
wego. Pola impulsowe do ok. 50 T wytwarzane są tą metodą 
w Polsce w różnych instytutach Warszawy, Poznania i Wrocławia 


Do zasilania typowych cewek stosuje się na ogół ba¬ 
terie kondensatorów. Tak np. w jednym z najwię¬ 
kszych laboratoriów tego typu w Los Alamos ba¬ 
teria może zmagazynować energię 10 min J. Mini¬ 
malny czas rozładowania wynosi 4 ps. Dzieląc energię 
przez czas otrzymujemy moc rzędu 10 12 W (milion 
megawatów); otrzymywane pola sięgają 400 T. 

Wydawałoby się, że można zwiększać liczbę kon¬ 
densatorów i skracać czas rozładowania. Jednak jest 
to niemożliwe: czas rozładowania ogranicza bowiem 
samoindukcja kondensatorów, a zwiększenie ich licz¬ 
by powiększa samoindukcję obwodu (długość połą¬ 
czeń). 

Cewki elektromagnesów impulsowych na ogół są 
chłodzone cieczami kriogenicznymi w celu obniże¬ 
nia oporu elektrycznego. W trakcie impulsu prądu 
ciepło wydzielane w cewce nie może szybko wy¬ 
dostać się na zewnątrz, a zatem cewka się ogrzewa. 
W wypadku impulsów najkrótszych prąd płynie tylko 
po powierzchni, ponadto pole magnetyczne dyfun- 
dując w głąb solenoidu nadtapia warstwę naskórkową 
metalu. Z tego względu, a także z uwagi na naprężenia 
mechaniczne przekraczające wytrzymałość materiału, 
cewki wytwarzające pola powyżej 100 T ulegają każ¬ 
dorazowo rozerwaniu lub deformacji. 

Do otrzymywania pól jeszcze wyższych stosuje się 
inne metody. Wyobraźmy sobie, że wytworzymy pole 
o indukcji 10 T w cienkościennym cylindrze metalo¬ 
wym o osi skierowanej wzdłuż pola, a następnie bę¬ 
dziemy go szybko ściskać promieniście ku osi. Wsku¬ 


tek tego zmniejszać się będzie przekrój cylindra, za¬ 
chowany natomiast zostanie strumień indukcji mag¬ 
netycznej. Ponieważ strumień magnetyczny jest to 
iloczyn indukcji magnetycznej i powierzchni obejmo¬ 
wanej przez przewodnik (w tym wypadku — pole 
przekroju cylindra), zachowanie stałej wartości stru¬ 
mienia przy /j-krotnym zmniejszeniu powierzchni 
przekroju powoduje / 2 -krotny wzrost indukcji mag¬ 
netycznej. Przy typowych wartościach średnic cy¬ 
lindra: początkowej 10 cm i końcowej 0,5 cm, pole 
przekroju maleje 400 razy; odpowiednio do tego pole 
magnetyczne powinno wzrosnąć z 10 T do 4000 T. zastosowanie 
W rzeczywistości osiąga się wzrost dwustukrotny, z ładunków 
powodu częściowego wypływu strumienia magnetycz- wybucho- 
nego przez ścianki cylindra. Do ściskania cylindra wych 
stosuje się eksplozje ładunków wybuchowych (rys. 9). 

Ograniczeniem tej metody jest wartość ciśnienia 
wytwarzanego przez istniejące materiały wybuchowe, 
wskutek czego pierścieniowi można nadać tylko ogra¬ 
niczone przyspieszenie. Jest ono ograniczone jego 
masą oraz siłami elektrodynamicznymi wynikającymi 
z ruchu przewodnika w polu magnetycznym. W miarę 
wzrostu pola ruch ścianek cylindra jest hamowany 
rosnącym przeciwdziałaniem pola magnetycznego 
(równoważne ciśnieniu 10 12 Pa w polu 1500 T). A więc 
dalszy rozwój wymaga albo stosowania silniejszych 
materiałów wybuchowych, albo nowych metod. Me¬ 
todą ściskania strumienia magnetycznego uzyskuje 
się pola do 1500 T, przy czym rekordowe pole wy¬ 
nosiło 2500 T (rys. 1). 



Rys. 9. Schemat jednego z możliwych urządzeń do uzyskiwania 
najsilniejszych pól magnetycznych metodą ściskania strumienia 
magnctvczncgo. Zużywa się 10-20 kg materiału wybuchowego 


Pola impulsowe stosuje się we wszystkich zagadnie¬ 
niach opisanych w rozdziale o zastosowaniach silnych zastosowa- 
pól magnetycznych, a więc zarówno do badań ciał nie pól im- 
stałych, jak też w fizyce jądrowej czy termojądrowej, pulsowych 
Jednakże długość impulsu pola musi być dostosowana 
do danego zagadnienia fizycznego, a to z kolei ogra¬ 
nicza wielkość stosowanych pól magnetycznych. Moż¬ 
na podać orientacyjnie, że w urządzeniach fizyki ją¬ 
drowej i termojądrowej stosuje się pola do 30 T, 
w badaniach ciał stałych — do kilkuset T. Pola naj¬ 
wyższe, powyżej 1000 T stosuje się w badaniach plaz¬ 
my oraz do wytwarzania dużych ciśnień. 

P. Byszewski, A. Szymborski Ekstremalne pola magnetyczne , 

Problemy nr 1, 334 (1974); D. S. Parasnis Magnetyzm , War¬ 
szawa 1970; J. Szpilecki Megagausowe pola magnetyczne. Post. 

Fiz. 19, 411 (1968); W. Zawadzki O silnych polach magnetycz¬ 
nych, Problemy nr 4, 217 (1964). 
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Co to jest współczesna elektronika 

Jarosław Świderski 


Wydarzenia w kosmosie i w świecie wielkich energii 
fizyki jądrowej usunęły w cień właściwą rewolucję 
techniczną przebiegającą na naszych oczach, rewo¬ 
lucję, bez której te wielkie osiągnięcia naszej doby nie 
byłyby w ogóle możliwe. Mowa — oczywiście — 
o elektronice. Hasło elektronika kojarzy się najczęściej 
z telewizją i radiotechniką, z komputerami (elektro¬ 
nowymi mózgami) i automatyką przemysłową, radio¬ 
lokacją i elektromedycyną. Szybki postęp w rozwoju 
tych urządzeń uświadamiamy sobie, gdy nasze dzieci 
grymaszą, że odbiornik radiowy nie dość łatwo mieści 
im się w kieszonce lub że kolory na pokazie telewi¬ 
zyjnym nie są dość naturalne. Od czasu do czasu 
prasa stara się nas olśnić możliwościami „myślących” 
maszyn, a gdy przypadkiem trafimy pod opiekę me¬ 
dycyny, przerażają nas coraz bardziej wymyślne urzą¬ 
dzenia badające człowieka swymi elektrycznymi 
mackami. 

elektronika U źródeł tego rozwoju stoi skromnie właściwa 
techniczna elektronika, zwana inaczej elektroniką techniczną, 
zajmująca się wytwarzaniem bardzo nieefektownych 
przyrządów, jak lampy elektronowe (w tym lampy 
radiowe) i przyrządy półprzewodnikowe (diody, tran¬ 
zystory, hallotrony i in.). Pierwsze przyrządy elektro¬ 
nowe pojawiły się w początkach naszego stulecia 
i z punktu narzuciły burzliwy rozwój radiotechnice. 
Ale zajmujący się nimi naukowcy niemal od razu 
spostrzegli, że rola ich będzie znacznie większa. Istotą 
działania tych przyrządów było i jest wykorzystanie 
ruchu swobodnych elektronów do wykrywania, se¬ 
lekcjonowania, wzmacniania i przetwarzania dociera¬ 
jących do nich bodźców-sygnałów. A to przecież jest 
istotą działania poszczególnych komórek i całych 
systemów nerwowych, jest istotą procesu myślenia. 

Jak wiadomo, wspaniałe działanie naszego mózgu 
zawdzięczamy ogromnej liczbie elementarnych ko¬ 
mórek mikroskopijnej wielkości. Pierwsze lampy elek¬ 
tronowe miały kilkanaście cm wysokości, toteż zesta¬ 
wienie bodaj kilkuset takich „komórek” stawało się 
dosłownie monstrualnym problemem, 
tranzystor — Zasadnicza zmiana nastąpiła z chwilą, gdy wyna- 
przełom w leziono tranzystor — wzmacniający przyrząd elektro- 
elektronice nowy wykorzystujący ruch elektronów nie w próżni, 
jak to było w lampach, lecz w ciele stałym (a ściślej — 
w półprzewodniku). Szybkość rozwoju produkcji 
tranzystorów, a wraz z nimi innych przyrządów elek¬ 
tronowych, jest czymś, nawet w skali pojęć dwudzies¬ 
towiecznych tak wyjątkowym, że śmiało można mówić 
o „eksplozji” elektroniki. Jeśli się przyjmie, że w 
1950 r. na całym świecie wyprodukowano przyrządów 
elektronowych za sumę ok. 5 mld umownych jedno¬ 


stek monetarnych, to w 1960 r. wyprodukowano ich 
już za 25 mld, a w 1970 — za 48 mld. W 1980 r. war¬ 
tość wyprodukowanych przyrządów elektronowych 
wyniosła już 183 mld takich umownych jednostek. 

Zastosowania przyrządów półprzewodnikowych 
obejmują, jak powódź, coraz to nowe dziedziny, przy 
czym ekspansja techniczna łączy się tu z ekspansją 
ekonomiczną. I tak np. zbudowany w 1966 r. pierw¬ 
szy kalkulator elektroniczny zawierał w sobie pokaźną 
liczbę diod i tranzystorów łącznej wartości 170 dola¬ 
rów. Osiem lat później wewnątrz takiego samego kal¬ 
kulatora jest jeden tylko przyrząd półprzewodniko¬ 
wy— układ scalony wielkiej skali integracji, który 
kosztuje 3,5 dolara; układ ten jest przy tym znacznie 
bardziej niezawodny i eliminuje prawie całkowicie 
czynności montażowe w produkcji kalkulatora. W 
tych warunkach staje się zrozumiałe, że w 1971 r. 
w USA sprzedawano takie kalkulatory na sztuki, 
a dwa lata później, w 1973 r., sprzedano ich ok. 

6,5 min sztuk za 700 min dolarów. Podobnie wygląda 
rynek zegarków elektronicznych. Takie przykłady 
można mnożyć i mnożyć. 

Entuzjaści elektroniki twierdzą, że postęp, który 
wprowadza ona do techniki i w ogóle do ludzkiego 
życia, da się porównać jedynie z postępem, który 
nastąpił po wprowadzeniu metali w miejsce narzędzi 
i przedmiotów użytkowych wykonywanych z kamie¬ 
nia. Możliwe, trzeba jednak pamiętać, że tamten pro¬ 
ces trwał wiele wieków. 

Co da człowiekowi elektronika za następne 50 lat? 

Jak zmieni oblicze naszej planety w XXI wieku? 

Ryzykowna byłaby przepowiednia, zwłaszcza po tym, 
co wyżej powiedziano o czasie minionym. Już w tej 
chwili jest niemal pewne, że następnym krokiem będą 
tzw. przyrządy funkcjonalne. Przebiegające w nich przyrządy 
procesy będą odwzorowaniem fizycznym lub matema- funkcjonalne 
tycznym zjawisk rządzących otaczającym nas świa¬ 
tem. Dzięki takim przyrządom pojedynczy człowiek 
zostanie być może wyposażony w dodatkowy mózg, 

„mózg elektronowy”, który zwielokrotni jego możli¬ 
wości zarówno w dziedzinie ochrony zdrowia, orga¬ 
nizacji pracy i odpoczynku, jak i, miejmy nadzieję, 
w służbie innym ludziom. 


Elektronika półprzewodnikowa 
w zbliżeniu 

Cóż to jest ta elektronika półprzewodnikowa? Według 
definicji jest to dziedzina nauki i techniki zajmująca 
się praktycznym wykorzystaniem zjawisk, w których 
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podstawowe znaczenie ma dający się sterować ruch 
elektronów w półprzewodnikach. Obejmuje ona teo¬ 
rię, konstrukcję i technologię przyrządów półprze¬ 
wodnikowych. Jak niemal każda dziedzina techniki, 
wyrosła na gruncie osiągnięć fizyki, a zwłaszcza fizyki 
ciała stałego. Natomiast w przeciwieństwie do więk¬ 
szości innych dziedzin — elektronika półprzewodni¬ 
ków wykorzystała i wykorzystuje osiągnięcia fizyki 
(odkrycia zjawisk) w bardzo krótkim czasie po ich 
sformułowaniu, a często nawet korzysta ze zjawisk 
będących dopiero przedmiotem badań. Stąd ścisłe 
powiązanie tych dwu gałęzi wiedzy, stąd liczne rzesze 
fizyków pracujących jako elektronicy i na odwrót. 

Elektronika półprzewodników rozpoczęła swój 
niezależny byt od skonstruowania dwóch elementar¬ 
nych przyrządów półprzewodnikowych: diody (po¬ 
czątek naszego stulecia) i tranzystora (1948 r.). Ist¬ 
nienie tych przyrządów stymulowało badania nad 
materiałami półprzewodnikowymi i nad technologią 
struktur półprzewodnikowych. Rozwój tych ostatnich 
doprowadził do wynalezienia kilkudziesięciu innych 
przyrządów, bądź wykorzystujących nowe zjawiska 
w strukturze jedno- lub dwuzłączowej, bądź stano¬ 
wiących zupełnie nowe formy (kombinacja złącz, 
kontaktów i kondensatorów), bądź wreszcie będących 
powieleniem przyrządów klasycznych w monolityczny 
układ scalony. Rozwój technologii doprowadził w la¬ 
tach sześćdziesiątych do nowego skoku jakościowego, 
do technologii epiplanarnej i MOS, umożliwiających 
stosunkowo łatwe i niedrogie (wielkoseryjne) wytwa¬ 
rzanie bardzo skomplikowanych układów. Wówczas 
to wyodrębniono pojęcie mikroelektroniki — tej dzie¬ 
dziny elektroniki półprzewodnikowej, która się zaj¬ 
muje układami scalonymi. Oczywiście metody tech¬ 


nologiczne mikroelektroniki umożliwiają wytwarzanie 
również wielu innych przyrządów półprzewodniko¬ 
wych, przy czym dają możność łączenia ich z gotowy¬ 
mi wzmacniaczami, przetwornikami itp. Można w ten 
sposób skonstruować fotodetektor z układem zasila- 
jąco-detekcyjnym, hallotron ze wzmacniaczem itp. 
Słuszniej byłoby wobec tego mówić dziś o mikro¬ 
elektronice jako dziedzinie podstawowej, a o pozo¬ 
stałych dziedzinach elektroniki półprzewodnikowej — 
jako o częściach czy szczególnych przypadkach mikro¬ 
elektroniki. Tradycyjnie jednak (jeśli można mówić 
o tradycji w dyscyplinie liczącej sobie tak naprawdę 
niespełna 30 lat) dzieli się elektronikę półprzewodni¬ 
kową inaczej, przyjmując za kryterium rodzaj zasto¬ 
sowania. W ten sposób wyodrębniamy: klasyczną 
elektronikę półprzewodników, zajmującą się diodami 
i tranzystorami w postaci dyskretnej (tj. w postaci 
odrębnych przyrządów); mikroelektronikę, zajmującą 
się układami scalonymi; optoelektronikę półprze¬ 
wodnikową, zajmującą się źródłami (diody elektrolu¬ 
minescencyjne, lasery, wskaźniki alfanumeryczne itp.) 
i detektorami promieniowania oraz ich kombinacja¬ 
mi; elektronikę półprzewodnikowych przyrządów 
bezzłączowych (hallotrony, gausotrony, termistory 
itp.); półprzewodnikową elektronikę mikrofalową, 
zajmującą się przyrządami pracującymi w zakresie 
mikrofal. 

W dalszych rozdziałach omówimy dokładniej waż¬ 
niejsze z tych dziedzin. Tu warto sobie jedynie uświa¬ 
domić ogromną różnorodność „elektronicznych dzie¬ 
ci” (il. 8, tabl. 2), by spotykając je dziś w najdziwniej¬ 
szych nieraz postaciach i we wszystkich gałęziach 
ludzkiej działalności, wiedzieć, że pochodzą z jednej 
rodziny. 


Fizyka 

przyrządów półprzewodnikowych 

Stanisław Sikorski 


Podstawę działania przyrządów półprzewodnikowych 
stanowią określone zjawiska fizyczne. Jednym z ta¬ 
kich zjawisk jest zwiększanie się lub zmniejszanie 
koncentracji nośników ładunku, a co za tym idzie — 
możliwość regulacji przewodności właściwej w pół¬ 
przewodnikach. Najprostszym sposobem zmian kon¬ 
centracji jest zmiana temperatury materiału, jej pod¬ 
wyższenie powoduje w półprzewodnikach wzrost 
koncentracji nośników (-> Półprzewodniki). Zjawisko 
to zostało wykorzystane przy konstrukcji termisto- 
rów, tj. przyrządów stosowanych m.in. w układach 
do pomiaru temperatury. 

Istnieje jednak możliwość regulowania przewod¬ 
nictwa w stałej temperaturze, „na zimno” (co jest 
wykorzystywane w większości przyrządów półprze¬ 
wodnikowych). Dodatkowe nośniki ładunku, które 
powodują zmianę przewodnictwa bez podwyższania 
temperatury, nazywamy nadmiarowymi. 


Nośniki nadmiarowe 

Znane są dwa zjawiska fizyczne powodujące wystę¬ 
powanie nośników nadmiarowych: zjawisko fotoelek- 
tryczne wewnętrzne i wstrzykiwanie nośników wy¬ 
stępujące w złączach p-n. 

W 1873 r. W. Smith zaobserwował silny wpływ 
światła na przewodnictwo selenu. Nie znano wtedy 
kwantowego charakteru tego zjawiska. Obecnie dzię¬ 
ki teorii pasmowej (-► Struktura elektronowa ciał 
stałych) opis jest jasny. Rzucając strumień światła na 
półprzewodnik, wprowadzamy do jego wnętrza kwan¬ 
ty światła, fotony, o energii hv {h — stała Plancka, 


v — częstość drgań fali świetlnej). Energetyczny obraz 
zjawiska przedstawia rys. 1. Wewnątrz półprzewod¬ 
nika w paśmie przewodnictwa pojawia się dodatkowy 
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Rys. 1. Przejścia elektronów przez pasmo zabronione: a) zja¬ 
wisko fotoelektryczne wewnętrzne —generacja pary dziura-elek- 
tron, b) rekombinacja bezpośrednia — promienista, c) rekombi¬ 
nacja pośrednia — przez centrum rekombinacji 


elektron, a w paśmie podstawowym (walencyjnym) — 
puste miejsce po wyrwanym elektronie, dziura, która 
stanowi dodatni nośnik ładunku. Następuje więc ge¬ 
neracja pary dziura-elektron. Powstałe pary nośników 
o różnych znakach tworzą pewien nadmiar koncen¬ 
tracji w stosunku do koncentracji wynikającej z po¬ 
budzenia cieplnego, dlatego nośniki te nazywamy 
nadmiarowymi. Koncentrację nadmiarową dziur 
oznaczamy Ap, elektronów An, przy czym: 

Ap = An, (1) 

gdyż generacja odbywa się parami. Korzystając z ogól- 
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nego wzoru na elektryczną przewodność właściwą a 
półprzewodnika ( a = en/n t e — ładunek elektryczny, 
n — koncentracja nośników, p — ruchliwość; -> 
Półprzewodniki) i z powyższej zależności, możemy 
łatwo obliczyć przyrost przewodności właściwej wy¬ 
wołanej oddziaływaniem światła: 

Ao = e(jLt n An+p p Ap) = e(Mn+t*p)dp, (2) 

gdzie fi p i ii n — to odpowiednio ruchliwość dziur 
i elektronów,. Przyrost przewodności właściwej pod 
wpływem światła nosi nazwę fotoprzewodnictwa. 
Zjawisko to wykorzystuje się w przyrządach półprze¬ 
wodnikowych — fotoopomikach (fotorezystorach), 
używanych do wykrywania strumienia świetlnego 
i pomiaru jego natężenia. 

W zjawisku fotoprzewodnictwa bardzo duże zna¬ 
czenie ma fakt, że istnieją nośniki ładunku dodatniego 
i ujemnego (dwunośnikowy mechanizm przewodzenia 
prądu). Pozwala to na wytwarzanie dużych koncentra¬ 
cji nadmiarowych nośników ładunku i zachowanie 
jednocześnie wypadkowej neutralności elektrycznej 
nie tylko w całości układu, ale i lokalnie (warto tu 
zwrócić uwagę, że zjawisko fotoprzewodnictwa nie 
występuje w metalach, w których jest tylko jeden ro¬ 
dzaj nośników ładunku elektrycznego). 

Po wyłączeniu światła fotoprzewodnictwo nie za¬ 
nika natychmiast (rys. 2), lecz stopniowo, a zanik ma 
rekombinacja charakter wykładniczy, podobnie jak np. rozpad pro¬ 
mieniotwórczy. Zjawisko zaniku nośników nadmiaro¬ 
wych nazywa się rekombinacją. Czas t, po upływie 


światło 



Rys. 2. Zanik fotoprzewodnictwa po wyłączeniu oświetlenia: 
a) oświetlona próbka półprzewodnikowa; b) zależność natężenia 
strumienia świetlnego <P od czasu /, c) zależność fotoprzewod- 
ności Jor od czasu t 

czas życia którego Aa zmniejszy się e = 2,72 raza, nosi nazwę 
czasu życia nośników nadmiarowych. Czasy życia 
nośników nadmiarowych mogą być bardzo różne; 
r = 10~ 8 s uznajemy za krótki, t = 10" 3 s — za bar¬ 
dzo długi. 

rekombinacja Rekombinacja może następować wskutek samo- 
promienista rzutnych przejść elektronów z pasma przewodnictwa 
do pasma walencyjnego (rys. Ib). Wytwarzającą się 
przy tym energię przejmuje powstający foton o ener¬ 
gii hv, równej przerwie energetycznej E g . Ten rodzaj 
rekombinacji nazywamy rekombinacją bezpośrednią 
lub promienistą. Ma ona bardzo duże znaczenie jako 
podstawa działania przyrządów optoelektronicznych 
(-*• Optoelektronika półprzewodnikowa). 

W krzemie i germanie stwierdzono bardzo słabe 
promieniowanie rekombinacyjne. W tych półprze¬ 
wodnikach występuje więc inny sposób rekombinacji. 


tzw. rekombinacja pośrednia (rys. lc). W przerwie rekombinacja 
energetycznej oprócz poziomów lokalnych, położo- pośrednia 
nych w pobliżu pasma przewodnictwa czy pasma wa¬ 
lencyjnego (poziomy donorowe i akceptorowe), po¬ 
wstają poziomy pochodzące od defektów sieci krysta¬ 
licznej lub atomów domieszkowych niektórych pier¬ 
wiastków (np. miedzi), stanowiących centra rekom¬ 
binacji. Poziomy te są zlokalizowane w pobliżu środka 
przerwy energetycznej. Elektrony nie przechodzą bez¬ 
pośrednio do pasma podstawowego, lecz najpierw 
spadają na poziom energetyczny centrum rekombi¬ 
nacji, a stamtąd — prawie natychmiast — do pasma 
podstawowego, zajmując poziom energetyczny dziury. 

W rezultacie znika elektron w paśmie przewodnictwa 
i dziura w paśmie podstawowym. Szereg pierwiastków 
wprowadzonych do materiału półprzewodnikowego 
powoduje znaczną rekombinację. Tak np. miedź przy 
koncentracji 4-10 14 atomów w i cm 3 kryształu germa¬ 
nu sprawia, że r jest rzędu 10" 5 s. Ponieważ 1 cm 3 
germanu zawiera 4-10 22 atomów, zatem wystarczy 
zaledwie 1 atom miedzi na 10 8 atomów germanu, 
ażeby wywierać decydujący wpływ na rekombinację. 

Zwiększenie koncentracji takiej domieszki zmniejsza, 
oczywiście, proporcjonalnie czas życia. Ta sama kon¬ 
centracja miedzi w krzemie daje dziesięciokrotnie 
większy skutek, a więc wymagania co do czystości są 
jeszcze większe. 

Jak już powiedzieliśmy, nośniki nadmiarowe od¬ 
grywają ogromną rolę w pracy przyrządów półprze¬ 
wodnikowych, dlatego to wielkość czasu życia r 
w danym materiale ma duże znaczenie praktyczne. 

Ten parametr materiału jest bardzo istotny także 
i dlatego, że dostarcza cennych informacji o rodzaju 
domieszek i defektów. Warto zwrócić uwagę, że jest 
to parametr niezależny od przewodności właściwej er, 
ponieważ inne domieszki decydują zazwyczaj o czasie 
życia, a inne o przewodności. 

Czas zaniku fotoprzewodnictwa w oświetlanych 
próbkach nie zależy od kształtu próbek i elektrod, wpływ 
natomiast jest w znacznym stopniu zależny od stanu powierzchni 
powierzchni (-► Stany powierzchniowe w ciałach sta¬ 
łych). Jeśli zatem chcemy poznać własności rekom¬ 
binacyjne całej objętości kryształu, musimy zredu¬ 
kować wpływ powierzchni. Kiedy dokonamy bardzo 
starannej obróbki powierzchni (polerowanie, trawie¬ 
nie chemiczne itp.), czas zaniku fotoprzewodnictwa 
próbki jako całości będzie równy czasowi życia r 
nośników nadmiarowych. Źle obrobiona powierzch¬ 
nia płytki półprzewodnikowej zawiera ogromne za¬ 
gęszczenie zakłóceń sieci krystalicznej, działających 
jako powierzchniowe centra rekombinacji, niezależnie 
od centrów rekombinacji wewnątrz próbki. Czas za¬ 
niku fotoprzewodnictwa jest wówczas dużo mniejszy 
niż czas życia objętościowy. Jest to tzw. efektywny 
czas życia. 

Parametrem określającym rekombinacyjne wła- rekombinacja 
sności powierzchni jest szybkość rekombinacji po- po wierzch- 
wierzchniowej S mierzona w cm/s Gest to szybkość niowa 
dopływu strumienia nośników nadmiarowych rekom- 
binujących na powierzchni). Jeśli powierzchnia jest 
dobrze przygotowana (gładka i oczyszczona), S — 

= 100 cm/s, jeśli chropowata, S może dochodzić do 
10 5 cm/s. 

Rekombinacja powierzchniowa zależy nie tylko od 
samej obróbki, ale także od stanu otaczającej atmo¬ 
sfery (temperatury, wilgotności i innych czynników), 
a ponadto zmienia się z upływem dni. Ma to ogromne 
znaczenie dla pracy przyrządów półprzewodnikowych. 

Wskutek różnych, mniej lub bardziej skutecznych 
zabiegów technologicznych uzyskuje się powierzchnie 
*o dobrych właściwościach, a przede wszystkim dopro¬ 
wadza się do stabilizacji tych właściwości, do których 
należy w pierwszym rzędzie szybkość rekombinacji 
powierzchniowej. Wielkim osiągnięciem nowoczesnej 
technologii półprzewodników stało się wykorzystanie 
specjalnie wytwarzanej na płytkach krzemu warstwy 
tlenku krzemu, która trwale zabezpiecza powierzch¬ 
nię i świetnie stabilizuje jej własności fizyczne. 
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Dyfuzja i droga dyfuzji nośników 
nadmiarowych 

Rozważając własności i znaczenie nośników nadmia¬ 
rowych, nie zajmowaliśmy się ich rozkładem prze¬ 
strzennym. Ważna była ich ogólna liczba w próbce, 
ona bowiem decydowała o ogólnym foto przewodnict¬ 
wie. Ponadto wychodziliśmy z założenia (rys. 2a), że 
próbka jest przeniknięta strumieniem świetlnym wy¬ 
twarzającym równomierny rozkład nośników nad¬ 
miarowych i że oświetlamy całą próbkę. A przecież 
w wielu wypadkach może być oświetlona tylko część 
próbki, przy czym jeśli nawet oświetlimy całą próbkę, 
światło nierównomiernie dociera do wszystkich punk¬ 
tów w jej głębi. Co więcej, bardzo często światło 
wnika na głębokość dużo mniejszą niż grubość próbki. 
Wtedy nadmiarowe elektrony i dziury są generowane 
tuż pod powierzchnią. Jednakże nie wszystkie nośniki 
nadmiarowe są skupione tam, gdzie dociera światło — 
mają one możliwość przemieszczania się dzięki dy¬ 
fuzji. 

Matematycznym wyrazem dyfuzji jest prawo 
Ficka, stwierdzające, że gęstość strumienia nośników 
jest proporcjonalna do przestrzennego spadku kon¬ 
centracji nośników (pochodna względem współrzęd¬ 
nej ze znakiem minus). Przepływ nośników odbywa się 
więc w kierunku od większych koncentracji do mniej¬ 
szych koncentracji. 

Przypuśćmy, że dziury są rozłożone w ten sposób, 
że spadek koncentracji występuje tylko w kierunku 
osi x. Przepływ nośników ładunku dodatniego stano¬ 
wi jednocześnie pewien prąd elektryczny o tym sa¬ 
mym zwrocie, a zatem na mocy prawa Ficka gęstość 
prądu dyfuzyjnego dziur: 

J p d = —eD p , O) 

dx 

gdzie D p jest stałą dyfuzji dziur, dp/dx — przyrostem 
ich koncentracji. 



Rys. 3. Dyfuzja nośników nadmiarowych w głąb półprzewodnika 


Podobnie dyfuzji elektronów towarzyszy prąd elek¬ 
tryczny o gęstości : 

dn 

JnD — Ą-eDn-j — 9 
dx 

gdzie D n — stała dyfuzji elektronów. 
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Znając ruchliwości p P i fi n nośników, można obli¬ 
czyć stałe dyfuzji D p i D n z zależności Einsteina-Smo- 
luchowskiego: 

^ kT kT , A , 

Dp - Pp y Dn - f*n (4/ 

e e 

(kTje — 0,026 V w temperaturze pokojowej). Stałe 
dyfuzji nie są równe, gdyż ruchliwości elektronów 
[in i dziur [t p nie są równe (zależą od masy efektywnej; 
-* Dynamika elektronu w ciałach stałych). Nośniki 
bardziej ruchliwe mają więc większą stałą dyfuzji. 

Wskutek dyfuzji nośniki nadmiarowe generowane 
tuż pod powierzchnią próbki półprzewodnikowej 
przemieszczają się w głąb półprzewodnika, dążąc do 
wypełnienia całej objętości. Jednakże po drodze na¬ 
potykają centra rekombinacji i ulegają zanikowi. 
Im więcej ich przybywa do danego miejsca, tym szyb¬ 
sza jest rekombinacja. Po pewnym czasie (kilkakrotna 
wartość t) ustala się w każdym punkcie próbki stan 
równowagi: tyle nośników dopływa, ile ich rekombi- 
nuje. Równowagowy rozkład koncentracji nośników 
nadmiarowych pokazany jest na rys. 3 zarówno w 
sposób poglądowy, jak i na wykresie (rys. 3b). Przy 
powierzchni jest najwięcej nośników, w miarę odda¬ 
lania się w głąb koncentracja ich maleje w sposób 
wykładniczy. Średnią odległość, którą nośniki prze¬ 
bywają od powierzchni w głąb w czasie swego życia, 
nazywamy drogą dyfuzji i oznaczamy symbolem Lu. 
Jest to odległość, na której koncentracja początkowa 
(dp 0 — dziur, czy dn 0 — elektronów) zmniejsza się 
e « 2,72 raza. Droga dyfuzji jest tym większa, im 
większa jest stała dyfuzji oraz czas życia r nośników 
nadmiarowych. Wielkość ta wyraża się wzorami: 

dla półprzewodników o przewodnictwie dziurowym 

(typ P) - - 

Ld =yD n r ; 

dla półprzewodników o przewodnictwie elektrono¬ 
wym (typ n) _ 

Ld = yDpz. 

Z tych wzorów wynika, że o drodze dyfuzji nośników 
nadmiarowych decyduje stała dyfuzja nośników mniej¬ 
szościowych. Przy wartościach granicznych r = 10~ a - 
-10 -3 s droga dyfuzji nośników nadmiarowych za¬ 
wiera się w granicach 0,01-1 mm. 

Opisane wyżej dyfuzyjne wnikanie w głąb materia¬ 
łu nośników nadmiarowych połączone z ich jedno¬ 
czesną rekombinacją odgrywa dużą rolę w pracy 
przyrządów półprzewodnikowych, w szczególności 
w złączu p-n. 


Złącze p-n 

Dotychczas rozważaliśmy przepływ prądu przez prób¬ 
ki półprzewodnikowe jednorodne. Oznacza to, że roz¬ 
mieszczenie domieszek donorowych lub akceptoro¬ 
wych, a co za tym idzie — koncentracje nośników są 
jednakowe we wszystkich miejscach próbki. 

Najprostszym rodzajem półprzewodnika niejedno¬ 
rodnie domieszkowanego, zwanego strukturą pół¬ 
przewodnikową, jest bryła półprzewodnikowa, w któ¬ 
rej wytworzono dwa sąsiadujące ze sobą obszary 
o różnym typie przewodnictwa (obszar typu p i obszar 
typu /i), czyli złącze p-n. Model złącza p-n przed¬ 
stawiono na rys. 4a. Do obydwu części, p i n , bryły 
półprzewodnika dołączono elektrody dla umożliwie¬ 
nia przepuszczania prądu przez złącze. W konkret¬ 
nym przyrządzie półprzewodnikowym może występo¬ 
wać jedno lub więcej takich złącz. 

Niemożliwe jest oczywiście uzyskanie złącza przez 
zwykłe zetknięcie dwóch bryłek o różnym typie prze¬ 
wodnictwa. Możemy jednak wykonać taki ekspery¬ 
ment myślowo, łącząc płaszczyznami dwie jednorodne 
płytki półprzewodnikowe typu n oraz typu p . Kon¬ 
centracje, a właściwie ładunki elektryczne dziur i elek¬ 
tronów przed ścisłym zetknięciem obu obszarów. 
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Rys. 4. Powstawanie bariery potencjału w złączu p-n: a) model 
przestrzenny, b) rozkład ładunku dziur przed połączeniem obsza¬ 
rów p i n, c) rozkład ładunku elektronów przed połączeniem ob¬ 
szarów pin, d) rozkład ładunku dziur po połączeniu obszarów 
p i n, e) rozkład ładunku elektronów po połączeniu obszarów 
p i n, f) rozkład gęstości ładunku przestrzennego p w warstwie 
podwójnej, g) przebieg pasm energii elektronów w złączu p-n 
bez przepływu prądu 


przedstawiają rys. 4b i c. Po połączeniu obszarów 
n i p, umożliwiającym przepływ nośników ładunku, 
taki rozkład koncentracji nie utrzymuje się i dziury 
z obszaru p , gdzie ich jest bardzo dużo, dyfundują 
do obszaru n , gdzie jest ich bardzo mało. Rekombi- 
nują tam z elektronami, ponieważ nośniki nadmiaro¬ 
we zakłócają równowagę termodynamiczną. W rezul¬ 
tacie — w obszarze n przybywa niewiele dziur, nato¬ 
miast ubywa ich w obszarze p, a więc nośniki więk¬ 
szościowe odsuwają się niejako od płaszczyzny roz¬ 
graniczającej obszar p od obszaru n , zostawiając po 
sobie warstwę zubożoną, tzn. obszar o znacznie 
przestrzenny zmniejszonej koncentracji nośników większościowych 
ładunek przy niewiele zmienionej koncentracji nośników 
ujemny mniejszościowych. Dziury, cofając się w obszar p , 
zostawiają po sobie nieruchome zjonizowane akcep¬ 
tory. Powstaje więc obszar przestrzennego ładunku 
ujemnego (zaznaczony na rys. 4d kolorem niebieskim), 
wzrastającego w miarę pogrubiania się warstwy zubo¬ 
żonej. Ładunek ten wytwarza bardzo silne pole elek¬ 
tryczne, przeciwdziałające dyfuzji dziur. Grubość 
warstwy zubożonej W p zależy od stałej dyfuzji noś¬ 
ników ładunku oraz od własności dielektrycznych pół¬ 
przewodników. Warstwa Wp w półprzewodnikach 


o oporze właściwym ok. 1 D cm wynosi mniej niż 
1 jim = 10~ 6 m. Jest to wielkość do tysiąca razy 
mniejsza niż droga dyfuzji nośników nadmiarowych 
(0,01-1 mm). 

Podobnie zachowują się elektrony w obszarze n . 
Tam także powstaje warstwa przestrzennego ładunku 
elektrycznego, ale dodatniego (rys. 4e), ponieważ co¬ 
fające się elektrony zostawiają po sobie dodatnio 
zjonizowane donory. W rezultacie — po jednej stro¬ 
nie powierzchni granicznej p-n powstaje warstwa 
ładunków ujemnych, po drugiej — dodatnich. Wy¬ 
twarza się więc układ ładunków taki jak w nałado¬ 
wanym kondensatorze, gdzie na jednej okładce wy¬ 
stępuje warstwa ładunków dodatnich, na drugiej zaś 
ujemnych. Naładowanie kondensatora powoduje po¬ 
wstanie napięcia elektrycznego pomiędzy ładunkami 
okładek. Oznacza to, że energie potencjalne ładunków 
jednej i drugiej warstwy są różne. Analogiczna sytu¬ 
acja zachodzi w złączu p-n : wytworzenie się pola 
elektrycznego w obszarze między warstwami ładun¬ 
ków i powstanie różnicy energii potencjalnych nośni¬ 
ków ładunku między jedną a drugą stroną złącza. 
Energia potencjalna elektronów jako nośników ła¬ 
dunku ujemnego jest wyższa po stronie warstwy nała¬ 
dowanej dodatnio. Przebieg tej energii odwzorowują 
poziomy energii pasm — powstaje w ten sposób ba¬ 
riera energetyczna złącza p-n przedstawiona na rys. 
4g. Jeśli przez złącze nie przepływa prąd, wysokość 
bariery jest nieco mniejsza od wielkości przerwy 
energetycznej E g . Jeśli do elektrod złącza przykłada¬ 
my napięcie ze źródła prądu (tzw. napięcie polary¬ 
zacji), następuje podwyższenie lub obniżenie bariery. 
Ma to miejsce, gdy do obszaru p przykładamy dodat¬ 
ni, a do obszaru n ujemny biegun źródła. Dziury 
z obszaru p przepływają wtedy do obszaru n , czyli 
powstaje prąd dziurowy. Elektrony poruszają się w 
stronę przeciwną, tworząc prąd o zwrocie zgodnym 
z prądem dziurowym (ponieważ znak ich ładunku 
jest przeciwny). Dzięki obniżeniu bariery prądy te 
osiągają znaczne wartości, w związku z czym kierunek 
od p do n nazywamy kierunkiem przewodzenia. 

Wskutek dyfuzji nośników większościowych z jed¬ 
nego obszaru do drugiego w sąsiadujących ze sobą 
obszarach o przeciwnym typie przewodnictwa, po 
obu stronach powierzchni granicznej powstają ob¬ 
szary o nierównowagowej koncentracji nośników, 
wnikające na głębokości równe drogom dyfuzji Ld 
nośników nadmiarowych. Jest to zjawisko analogicz¬ 
ne do zjawiska powstawania nośników nadmiarowych 
pod wpływem światła, a następnie ich dyfuzji w głąb 
półprzewodnika na głębokość właśnie równą Lj>. 
Teraz jednak nośniki nadmiarowe powstają wskutek 
przepływu prądu przez złącze, są więc niejako „wstrzy¬ 
kiwane” zarówno z obszaru p do «, jak z n do p. 
Zjawisko to ma ogromne znaczenie w przyrządach 
półprzewodnikowych (np. diodach elektrolumine- 
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Rys. 5. Rozkład wstrzykiwanych nośników nadmiarowych 
w złączu p-n spolaryzowanym w kierunku przewodzenia 
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scencyjnych, tranzystorach) i nosi nazwę wstrzyki¬ 
wania nośników nadmiarowych. Przykładowy roz¬ 
kład nośników nadmiarowych w złączu pracującym 
w kierunku przewodzenia przedstawia rys. 5. Kon¬ 
centracja nośników nadmiarowych zależy wykładni¬ 
czo od napięcia polaryzacji U, a ściśle — od energii 
nośników eU dzielonej przez kT. Wyraża to funkcja 
eeu!kT m Gęstość prądu dyfuzji nośników większoś¬ 
ciowych Ja jest więc proporcjonalna do funkcji 
wykładniczej: 

Ja = JsWUt, (5) 

przy czym współczynnikiem proporcjonalności jest 
pewna wartość gęstości prądu J s . W temperaturze 
pokojowej (290 K): 

Jd = J s e*°u = J s .\0^r<u, (6) 


Podwyższenie napięcia polaryzacji U zaledwie o 0,06 V 
powoduje dziesięciokrotny wzrost natężenia prądu. 
Jednakże wzór ten można stosować tylko do wartości 
eU mniejszych od wartości energii wzbronionej E g , 
w przeciwnym bowiem razie bariera znika i prąd pod¬ 
lega prawu Ohma, jeśli w ogóle złącze nie ulegnie 
zniszczeniu wskutek przegrzania. 

Jeżeli przyłączymy zewnętrzne napięcie polaryzacji 
złącza w kierunku przeciwnym niż w dotychczasowym 
rozważaniu, a więc w ten sposób, że do elektrody 
części p złącza dołączony będzie ujemny biegun źródła 
prądu, to taką polaryzację nazwiemy wsteczną *lub 
zaporową. Dyfuzja nośników większościowych już 
przy niewielkich napięciach wstecznych będzie cał¬ 
kowicie zahamowana przez silne pole elektryczne. 
Ponadto dziury w części p zostaną przyciągnięte do 
elektrody ujemnej, elektrony zaś w części n — do 
elektrody dodatniej, tak że nośniki większościowe 
obu znaków cofną się znacznie bardziej w głąb swoich 
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Rys. 6. Podwyższenie bariery potencjału w złączu p-n spolaryzo¬ 
wanym wstecznie: a) model przestrzenny, b) rozkład ładunku 
dziur, c) rozkład ładunku elektronów, d) rozkład gęstości ładunku 
przestrzennego p w warstwie podwójnej, e) przebieg pasm energii 
elektronów 
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obszarów niż w warunkach równowagi. Zostawią one 
po sobie, jak to przedstawia rys. 6, obszary naładowa¬ 
ne dodatnio po stronie n , ujemnie zaś po stronie p. 

W ten sposób ładunek przestrzenny po obu stronach 
warstwy podwójnej będzie znacznie zwiększony 
i wniknie na duże głębokości w obszary p i n. Bariera 
potencjału, którą wytworzy taka warstwa podwójna, 
będzie więc wyższa niż w warunkach równowagi, 
a wielkość jej podwyższenia będzie równa przyłożo¬ 
nemu napięciu polaryzacji wstecznej. W kierunku za¬ 
porowym można przykładać bardzo duże napięcie — 
w odpowiednio wykonanych złączach przekraczające 
1000 V. Można uważać, że złącze spolaryzowane 
w kierunku wstecznym składa się z przewodzących 
obszarów p i n przedzielonych warstwą izolatora gru- warstwa 
bości fV n +fVp, zwaną warstwą zaporową, ponieważ zaporowa 
w tym obszarze, pozbawionym prawie nośników, 
półprzewodnik ma właściwości izolatora. W ten spo¬ 
sób złącze p-n jest kondensatorem i to takim, w któ¬ 
rym możemy zmieniać grubość warstwy izolatora, 
a więc o zmiennej pojemności. Zjawisko to ma za¬ 
stosowanie w tzw. waraktorach. 

W miarę wzrostu napięcia wstecznego wzrasta na¬ 
tężenie pola elektrycznego wewnątrz warstwy zapo¬ 
rowej. Gdy osiąga ono pewną wartość, następuje tzw. przebicie 
lawinowe przebicie złącza, połączone z gwałtownym lawinowe 
wzrostem prądu. Jeśli się nie przekroczy pewnych 
wartości prądu, złącze nie ulegnie zniszczeniu. Zja¬ 
wisko to jest wykorzystywane w diodach lawinowych. 

Mimo że warstwa zaporowa ma — wskutek zaha¬ 
mowania dyfuzji nośników większościowych — wła¬ 
sności izolacyjne, przepływa przez nią prąd dyfuzji prąd 
nośników mniejszościowych, zwany prądem nasycę- nasycenia 
nia. Prąd ten jest niezależny od przyłożonego napięcia 
(zarówno w kierunku zaporowym, jak i przewodze¬ 
nia), stanowi stałą wartość na tle prądu przewodzenia, 
a przy tym ma zwrot przeciwny, należy więc jego war¬ 
tość odjąć od wartości prądu określonej wzorem (5). 

Ponieważ wypadkowy prąd płynący przez złącze przy 
napięciu U = 0 winien być równy zeru, przeto war¬ 
tość gęstości prądu nasycenia musi być równa J s . 

Zatem gęstość wypadkowego prądu płynącego przez 
złącze wynosi: 

J = J sC eU!kT-J $ = J s ( C eUlkT- 1 ). (7) 

Widać, że spełniony jest warunek równowagi złącza 
przy braku zewnętrznego napięcia: gdy U — 0, to 
J — 0. Powyższy wzór określa zależność natężenia 
przepływającego prądu od napięcia przyłożonego do 
złącza, zilustrowaną na wykresie (rys. 7). 



Rys. 7. Charakterystyka prądowo-napięciowa idealnego złącza 
p-n w temperaturze T = 290 K 


Prąd nasycenia o gęstości J s zależy od właściwości 
obu materiałów pin w sposób następujący: 

j _ eDpjjp ^ eD n pn ^g^ 

L>p Ln 

gdzie np jest koncentracją nośników mniejszościowych 
(elektronów) w obszarze p, p n — koncentracją dziur 
w obszarze w, a L Pt L n — drogi dyfuzji nośników 
mniejszościowych odpowiednio w obszarze p i n . 
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Aby złącze przepuszczało mały prąd w kierunku 
wstecznym, prąd nasycenia musi być również mały. 
Drogi dyfuzji L v i L*, a co za tym idzie — czasy 
życia r p i r n nośników mniejszościowych muszą więc 
być duże. Można to uzyskać przez ograniczenie re¬ 
kombinacji w obszarze złącza dzięki dobrze opraco¬ 
wanej technologii, przy której struktura kryształu 
jest jak najmniej naruszona i nie wprowadza się 
niepożądanych domieszek. Fakt, że opór złącza 
w kierunku przewodzenia jest mały, a w kierunku 
zaporowym bardzo duży, jest podstawą jednego 
z ważniejszych rodzajów zastosowania złącz p-n, a 
mianowicie prostowania prądu zmiennego (—► Przy¬ 
rządy półprzewodnikowe dyskretne). 


Oddziaływanie nośników nadmiarowych 
na złącze p-n. Zjawisko tranzystorowe 

Spolaryzowanie złącza w kierunku przewodzenia po¬ 
ciągało za sobą zjawisko wstrzykiwania nośników 
nadmiarowych do obu części złącza (wskutek obniże¬ 
nia się jego bariery potencjału). Okazuje się, co po¬ 
twierdza teoria i doświadczenie, że występuje też 
zjawisko odwrotne: obniżanie się bariery potencjału 
pod wpływem wytworzonych w obszarze złącza noś¬ 
ników nadmiarowych. Oznacza to pojawienie się na¬ 
pięcia polaryzacji na elektrodach złącza nie dołączo¬ 
nego do źródła energii elektrycznej. Nośniki nad- 
złączowe miarowe mogą powstawać np. pod wpływam światła, 
zjawisko a na elektrodach złącza pojawia się wówczas napięcie 
fotowol- elektryczne. Jest to złączowe zjawisko fotowoltaiczne. 
taiczne Znajduje ono zastosowanie w przyrządach do pomiaru 
natężenia światła oraz do przetwarzania energii świetl¬ 
nej w energię elektryczną, np. w bateriach słonecznych 
wykonywanych z krzemu, których sprawność ener¬ 
getyczna przekracza 10%; jest to osiągnięcie o dużym 
znaczeniu praktycznym. 

Do oświetlonego złącza można przyłożyć napięcie. 
Każdemu napięciu polaryzacji będzie odpowiadać 
pewne natężenie prądu, inne niż w złączu nie oświet¬ 
lonym. Wszystkie pary dziura-elektron generowane 
strumieniem świetlnym w odległości mniejszej niż ich 
droga dyfuzji dotrą do złącza, gdzie ulegną rozdzie¬ 
leniu pod wpływem pola. Elektrony będą się poruszać 
polaryzacja od obszaru p do obszaru n złącza, dziury zaś w kie- 
złącza runku przeciwnym. Towarzyszące ruchom obu ro- 
oświetlonego dzajów nośników prądy elektryczne sumują się ze 
względu na różnicę znaków ładunku. Wypadkowy 
prąd ma zwrot zgodny z ruchem dziur od n do p. 
Jest to zwrot prądu wstecznego, a więc nośniki nad¬ 
miarowe zwiększają (co do bezwzględnej wartości) 
prąd wsteczny, co psuje własności złącza jako pro¬ 
stownika. Urządzenie, w którym jeden obszar złącza 


p-n może być oświetlony, zostało zastosowane jako fotodioda 
przyrząd zwany fotodiodą (-* Optoelektronika pół¬ 
przewodnikowa). 

W fotodiodzie wykorzystane jest oddziaływanie 
nośników nadmiarowych wytworzonych za pomocą 
światła na wstecznie spolaryzowane złącze p-n. Za¬ 
miast wytwarzania nośników nadmiarowych za po¬ 
mocą światła można wykorzystać zjawisko ich wstrzy¬ 
kiwania. W tym celu należy w pobliżu wstecznie spo¬ 
laryzowanego złącza p-n umieścić złącze n-p i spola¬ 
ryzować je w kierunku przewodzenia. Powstanie 
w ten sposób struktura pokazana na rys. 8. Obszarp, 


emiter baza kolektor 



wspólny dla obu złącz, jest zaopatrzony w osobną zjawisko 
elektrodę i nosi nazwę bazy. Obszar n spolaryzowany tranzysto- 
zaporowo w stosunku do bazy nazywa się kolektorem rowe 
(łac. colligere 'zbierać'), natomiast przeciwległy ob¬ 
szar «, spolaryzowany w kierunku przewodzenia, 
nazywa się emiterem (łac. emittere 'wysłać'). Prąd 
przepływający przez złącza emitera wstrzykuje do ob¬ 
szaru p nośniki nadmiarowe, które docierają do złą¬ 
cza kolektora, powodując przepływ dużego prądu 
przez to złącze (spolaryzowane w kierunku zaporo¬ 
wym). Jest to zjawisko tranzystorowe, odkryte w 
1948 r. przez Bardeena i Brattaina. Stało się ono 
punktem zwrotnym w ogromnym i szybkim rozwoju 
elektroniki półprzewodników. Najważniejszym zasto¬ 
sowaniem zjawiska tranzystorowego jest wzmacnianie 
sygnałów elektrycznych. Napięcie między emiterem 
i bazą wynosi ułamek wolta, a między kolektorem 
i emiterem może wynosić od kilku do kilkuset wol¬ 
tów. Jednocześnie prąd płynący między kolektorem 
a emiterem jest dużo większy niż prąd między bazą 
i emiterem. Dzięki temu sygnał elektryczny małej 
mocy wprowadzony do obwodu baza-emiter powo¬ 
duje pojawienie się sygnału elektrycznego większej 
mocy w obwodzie kolektor-emiter. 

A. K. JoNSCfHTER Podstawy działania przyrządów półprzewodni¬ 
kowych , Warszawa 1962; 1. J. Kampel Półprzewodniki. Teoria 
i zastosowanie , Warszawa 1974; A. Świt, J. Pultorak Przyrządy 
półprzewodnikowe, Warszawa 1976. 


Przyrządy 

półprzewodnikowe dyskretne 

Jarosław Świderski 

Od „kryształka" do kryształka 

Elektronika zajmuje się przekształcaniem sygnałów 
elektrycznych przez wpływanie bezpośrednio na ruch 
elektronów. Początkowo operacje takie najłatwiej 
było przeprowadzać w próżni, działając na strumień 
elektronów polem elektrycznym i magnetycznym ste¬ 
rowanym „makroskopowo” przez regulację wytwa¬ 
rzającego je prądu elektrycznego (elektronika próż¬ 
niowa — lampy elektronowe). 

W siedemdziesiątych latach ubiegłego stulecia od¬ 
kryto, że styk metalu z półprzewodnikiem ma wlaści- 
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wości prostujące. Fakt ten umożliwił wytworzenie kryształki 
prymitywnych elementów półprzewodnikowych, tzw. prostujące 
kryształków, i budowanie przy ich użyciu kryształko¬ 
wych radiodobiomików. Kryształki te to nic innego 
jak pierwsze diody półprzewodnikowe, w których się 
wykorzystuje odpowiednią konfigurację ciał krysta¬ 
licznych dla formowania wiązki (strumienia) elektro¬ 
nów płynących przez ciało stałe. Ponieważ w diodzie 
półprzewodnikowej ruch elektronów odbywa się 
w obszarze znacznie mniejszym niż w analogicznych 
przyrządach elektroniki próżniowej, pierwsze poważ¬ 
niejsze zastosowanie półprzewodników związane było 



























z techniką wielkich częstości (np. radiolokacja), gdzie 
konieczne jest uzyskanie jak najmniejszych pojem¬ 
ności i indukcyjności czynnego elementu. Drugą cechą 
szczególną przyrządów półprzewodnikowych, dającą 
im przewagę nad próżniowymi, było wykorzystywanie 
ruchu elektronów w ich jak gdyby naturalnym środo¬ 
wisku. Aby sterować elektronami w próżni, trzeba je 
tam wprowadzić, np. przez termoemisję z rozgrzanego 
do wysokiej temperatury drutu wolframowego (stąd 
świecenie katod w lampach radiowych). Swobodne 
elektrony w półprzewodniku egzystują w normalnej 
temperaturze w dostatecznej dla „elektronicznych” 
celów liczbie bez ingerencji człowieka, a więc przy¬ 
rządy półprzewodnikowe nie wymagają skompliko¬ 
wanych, energochłonnych i nietrwałych urządzeń 
zmuszających elektrony do akcji (na przykład ukła¬ 
dów zasilających żarzenie katod w lampach radio¬ 
wych). 

Dalszy rozwój elektroniki półprzewodnikowej to 
już jedno pasmo triumfów technologii. Niepewne, nie 
zastosowanie zawsze powtarzalne styki metal-półprzewodnik zastą- 
monokrysz- piono monokrystalicznym materiałem półprzewodni- 
tafów kowym, w którym minimalne ilości obcych atomów 
zmieniają typ przewodnictwa w części obszaru czyn¬ 
nego z elektronowego ( n ) na dziurowy ( p ) lub od¬ 
wrotnie (-*■ Fizyka przyrządów półprzewodnikowych). 
Rolę prostownika przejęła powierzchnia graniczna 
między obszarami o różnym typie przewodnictwa. 
Granice te, czyli złącza p-n , można dziś rozmieszczać 
w materiale półprzewodnikowym z dokładnością do 
dziesiątych części mikrometra, a odpowiednio je do¬ 
bierając — tworzyć struktury dowolnie niemal skom¬ 
plikowanych przyrządów (—► Mikroelektronika). Z hi¬ 
storycznego „kryształka”, który był zlepkiem poli¬ 
krystalicznych ziaren dociskanych metalową igłą, po¬ 
została tylko, i to już coraz rzadziej używana, nazwa: 
kryształek, czyli kawałeczek (wymiary od dziesiątych 
części do pojedynczych milimetrów) półprzewodniko¬ 
wego monokryształu z wbudowanymi złączami p-n 
i metalowymi (najczęściej napylonymi) elektrodami. 
Ale i ta nazwa ustępuje nowszym: półprzewodnikowa 
struktura lub z angielska — czip. 


Diody i tranzystory 

Właściwości prostujące złącza p-n lub złącza metal- 
półprzewodnik wykorzystano w diodzie półprzewodni- 
funkcje kowej, przejmującej wszystkie funkcje spełniane po- 
diody przednio przez diody próżniowe: prostowanie prądów 
próżniowej zmiennych, ich generację, wykrywanie (detekcja) 
sygnałów elektromagnetycznych, „mieszanie” sygna¬ 
łów o różnych częstościach itp. Pojedyncze złącze p-n 
znalazło też zastosowanie jako detektor lub emiter 
energii promienistej, kondensator o regulowanej po- 



Rys. 1. Przykładowa charakterystyka prądowo-napięciowa diody 
półprzewodnikowej 
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jemności, detektor naprężeń mechanicznych, ogra¬ 
nicznik napięcia, skomplikowany przetwornik funkcji 
matematycznych itd. Niektóre z tych przyrządów 
zostały szerzej opisane w rozdziałach poświęconych 
mikroelektronice, optoelektronice czy elektronice 
mikrofalowej. Jak z tego widać, pojęcie diody i jej za¬ 
kres zastosowania są bardzo szerokie. Zawsze jednak 
jest to dwuelekirodowy przyrząd półprzewodnikowy 
o nieliniowej charakterystyce prądowo-napięciowej 
(rys. 1), tj. o takiej zależności prądu płynącego przez 
diodę od przyłożonego napięcia, że można rozróż¬ 
nić kierunek przewodzenia i kierunek wsteczny (zapo¬ 
rowy). Jeśli do diody półprzewodnikowej przyłożone 
jest napięcie w ten sposób, że dodatni potencjał znaj¬ 
duje się na elektrodzie połączonej z obszarem typu /r, 
mówimy o spolaryzowaniu jej w kierunku zaporowym, 
tj. w kierunku, w którym ma większy opór elektrycz¬ 
ny. Przez diodę płynie wtedy prąd zaporowy (inaczej 
wsteczny), składający się z prądu ładunków mniej¬ 
szościowych, powstających pod wpływem generacji 
termicznej, i z prądu upływu. Pierwszy nie zależy od 
przyłożonego napięcia, a jedynie od temperatury 
i parametrów rekombinacyjnych, drugi, proporcjo¬ 
nalny do przyłożonego napięcia, „kryje” w sobie nie¬ 
doskonałości złącza. W pierwszym przybliżeniu moż¬ 
na sobie diodę spolaryzowaną zaporowo wyobrazić 
jako równoległe połączenie diody idealnej (przez 
którą płynie prąd zaporowy) i opornika (przez który 
płynie prąd upływu). 

Przy dostatecznie dużym napięciu (tzw. napięciu 
przebicia) prąd zaporowy zaczyna szybko rosnąć 
wskutek generacji par elektron-dziura, spowodowanej 
zerwaniem pewnych wiązań kowalencyjnych między 
sąsiednimi atomami i tunelowym przenikaniem elek¬ 
tronów walencyjnych przez pasmo wzbronione (tzw. 
zjawisko Zenera), oraz wskutek powielania lawino¬ 
wego (generacji par elektron-dziura pod wpływem 
dostatecznie „rozpędzonych” elektronów). Napięcie 
przebicia związane ze zjawiskiem Zenera maleje ze 
wzrostem temperatury, a związane ze zjawiskiem po¬ 
wielania — rośnie. 

Przez diodę spolaryzowaną w kierunku przewodze¬ 
nia, tj. w kierunku, w którym ma ona mniejszy opór, 
płynie prąd zależny od napięcia początkowo wykład¬ 
niczo, a następnie liniowo, gdyż dioda zaczyna się 
wówczas zachowywać jako opornik. 

Bardziej złożone struktury, zawierające co najmniej 
dwa złącza p-n, złącze i dwa kontakty omowe (nie 
prostujące styki metal-półprzewodnik) lub kombi¬ 
nację złącz p-n , kontaktów i kondensatorów, umożli¬ 
wiają wzmacnianie sygnałów elektrycznych lub ich 
przełączanie. 

Trójelektrodowy przyrząd półprzewodnikowy zwa¬ 
ny tranzystorem (triodą półprzewodnikową) jest dru¬ 
gim, obok diody, podstawowym przyrządem współ¬ 
czesnej elektroniki, elementarnym składnikiem przy¬ 
gniatającej większości układów scalonych (mikro¬ 
układów). Najpopularniejsze obecnie rozwiązania — 
to tranzystor bipolarny o dwóch złączach p-n 
i tranzystor połowy MOS, w którym przepływ ładun¬ 
ków elektrycznych jest sterowany polem kondensa¬ 
tora. Tranzystor bipolarny zbudowany jest z płytki 
półprzewodnikowej zawierającej trzy obszary (emiter, 
baza, kolektor; rys. 2) o kolejno zmieniającym się ty¬ 
pie przewodnictwa ( p-n-p lub n-p-n). Prąd płynący 



emiter [baza kolektor 

Rys. 2. Tranzystor p-n-p 


przez spolaryzowaną wstecznie diodę kolektor-baza 
jest sterowany przez prąd spolaryzowanej w kierunku 
przewodzenia diody emiter-baza, gdyż nośniki wpro¬ 
wadzane z obszaru emitera dyfundują (lub w szczegól¬ 
nym wypadku są unoszone polem) przez obszar bazy 


dioda pół¬ 
przewodni¬ 
kowa 


zjawisko 

Zenera 


tranzystor 

bipolarny 











i zwiększają, jako dodatkowe nośniki mniejszościowe, 
prąd wsteczny płynący z kolektora. Obwód diody 
emiter-baza (spolaryzowanej w kierunku przewodze¬ 
nia) odznacza się oczywiście małym oporem, w prze¬ 
ciwieństwie do obwodu z diodą kclektor-baza. 
tranzystor Tranzystor połowy (rys. 3) wykonany jest w zasa- 
polowy dzie z krzemu. Nazwa MOS pochodzi od skrótu an¬ 
gielskich słów metal-tlenek-półprzewodnik. Używa 
się też czasem nazwy MIS, w której słowo tlenek zo¬ 
stało zastąpione bardziej ogólnym — izolator. Ozna¬ 
czenie p + stosuje się do półprzewodnika o przewod¬ 
nictwie typu p silnie domieszkowanego. Prąd płynący 
między elektrodami a i c (czyli między dwoma obsza¬ 



rami /> + ) w wąskiej, przypowierzchniowej warstewce 
obszaru n (tzw. kanałem) jest sterowany potencjałem 
przyłożonym do elektrody b (bramki), która wraz 
z bardzo cienką (ułamek jim) warstwą tlenku i po¬ 
wierzchnią półprzewodnika stanowi kondensator 
o małej stratności. Tranzystory MOS pracują przy 
niższych częstościach niż tranzystory bipolarne, ich 
wytwarzanie jest jednak znacznie łatwiejsze, a ponadto 
sterowanie kondensatorowe zużywa znacznie mniej 
energii. Stąd ich główne zastosowanie w monolitycz¬ 
nych układach scalonych wielkiej skali integracji 
(-*» Mikroelektronika). 

przyrządy Tranzystory i diody stanowią elementy podstawowe 
wieloelektro- układów bardziej złożonych, same również przybierają 
dowe n * eraz skomplikowane formy wieloelektrodowe. Moż¬ 
na tu wymienić np. tranzystor tyratronowy, czyli tyry¬ 
stor, spełniający funkcję sterowanego zaworu (dwu¬ 
stanowego elementu przełączającego). Składa się on 
z czterech obszarów o kolejno zmieniających się ty¬ 
pach przewodności: p-n-p-n , i ma charakterystykę 
prądowo-napięciową podobną nieco (rys. 4) do cha- 



Rys. 4. Charakterystyka prądowo-napięciowa tyrystora 


rakterystyki diody — z tą różnicą, że przełączenie go 
w stan przewodzenia wymaga przyłożenia odpowied¬ 
niego napięcia, tzw. napięcia przeskoku (U P \ niższego 
od napięcia przebicia i dającego się sterować za po¬ 
mocą prądu bazy. 

Miniaturyzacja, mikrominiaturyzacja 
i co dalej? 

Zwiększenie liczby złącz, kontaktów, kondensatorów 
itp. prowadzi do tworzenia skomplikowanych ukła¬ 
dów indywidualnych, a następnie do układów scalo¬ 
nych. Zmniejszanie wymiarówelementów czynnych już 
jest celem dość atrakcyjnym, a łączy się z tym prawie 
zawsze zmniejszenie ciężaru, zasilania i przede wszyst¬ 


kim zwiększenie niezawodności. Skok jakościowy 
spowodowany wprowadzeniem elementów półprze¬ 
wodnikowych można obrazowo przedstawić modnym 
w pierwszych latach „panowania’* półprzewodników 
porównaniem: „Gdyby w czasie lądowania aliantów 
w Normandii w 1944 r. były już znane i stosowane 
tranzystory, ciężar przerzucanego na francuski brzeg 
ekwipunku przypadającego na jednego żołnierza zma¬ 
lałby w przybliżeniu o jedną tonę”. 

Wprowadzenie technologii epiplanarnej umożliwiło 
następny skok jakościowy. Zamiast wycinania z mo¬ 
nokryształów jak najcieńszych płytek, co zawsze na¬ 
ruszało strukturę krystaliczną czynnych obszarów 
półprzewodnika, zastosowano tzw. warstwy epitak- warstwy 
sjalne, tj. bardzo cienkie (od pół do kilkunastu mikro- epitaksjalne 
metrów) monokrystaliczne warstwy, narastające w od¬ 
powiednio sterowanym procesie na podłożu dającym 
wytrzymałość mechaniczną i (przeważnie) orientację 
krystalograficzną. Płytki te (w technologii epiplanar¬ 
nej stosuje się przede wszystkim krzem) pokrywa się 
jeszcze o rząd cieńszymi warstewkami świetnego izo¬ 
latora, jakim jest tlenek krzemu; odgrywa on zarówno 
rolę ochrony przed atmosferą, jak i maski (otwory 
wytrawiane po odpowiednim naświetleniu specjalnej 
emulsji — stąd precyzja, na jaką stać tylko optykę), 
przez którą się dozuje domieszki dające odpowiedni 
typ przewodnictwa. Te dwa elementy technologicz¬ 
ne— epitaksja i pokrycie krzemu jego tlenkami, 
czyli pasywacja — przyniosły rewolucję, powstały pasywacja 
diody i tranzystory, w których problem wymiarów 
sprowadzał się do problemu dotarcia do samej struk¬ 
tury (czipu). Najcieńsze druty były grubsze od nie¬ 
których czynnych obszarów, nie mówiąc już o ogra¬ 
niczeniach wymiarów narzucanych przez możliwości 
manipulowania oprawkami. Doszły też nowe proble¬ 
my, które poprzednio ledwo dawały o sobie znać: 
układowe i materiałowe. Do pierwszych należy sprawa 
iloczynu maksymalnej mocy, jaka może być tracona 
w danym elemencie (diodzie, tranzystorze itp.), i ma¬ 
ksymalnej częstości sygnału, przy jakiej ten element 
zachowuje jeszcze swoje właściwości. Oczywiście — 
im mniejszy element, tym łatwiej zachować np. dosta¬ 
tecznie małe pojemności potrzebne przy dużych czę¬ 
stościach. Ale jednocześnie przy tym samym prądzie 
mniejszy element bardziej się nagrzewa i zmienia 
swoje właściwości z przyczyn natury termicznej. 

Stąd tendencja do budowania elementów o wielu od¬ 
powiednio połączonych obszarach stanowiących je¬ 
den przyrząd. I tak np. nowoczesny tranzystor dużej 
mocy i dużej częstości, tzw. overlay y składa się z kilku¬ 
dziesięciu elementów, co czyni go podobnym raczej 
do układu scalonego, i to średniej skali integracji 
(rys. 5). 

Ogromne znaczenie w całej elektronice półprze¬ 
wodników mają problemy materiałowe. Wielka czyś- problemy 
tość pierwiastków i związków półprzewodnikowych, materiałowe 
której nie można określić nawet najczulszymi me¬ 
todami chemicznymi, doskonałość sieci krystalicznej 
półprzewodników, jednorodność parametrów elek¬ 
trycznych — oto wymagania, jakich nie stawia żadna 
inna gałąź techniki. Miniaturyzacja potęguje te wy¬ 
magania w sposób oczywisty; niejednorodność np. 
występująca na powierzchni 1 jim 2 mogła być do¬ 
puszczalna w złączu o powierzchni 10 mm 2 , ale dys¬ 
kwalifikuje ona złącze o powierzchni milion jazy 
mniejszej. Mikrominiaturyzacja, w ślad za którą idzie 
tworzenie struktur wielozłączowych, narzuca waru¬ 
nek, by taka niejednorodność nie występowała w żad¬ 
nym złączu wchodzącym w skład danego przyrządu, 
gdyż zdyskwalifikuje to całą strukturę. Powyższe wy¬ 
magania skierowały znaczne potencjały badawcze na 
zagadnienia związane z pomiarami parametrów elek¬ 
trycznych i strukturalnych materiałów półprzewod¬ 
nikowych. Wyposażenie laboratoriów pomiarowych 
stanowi dziś najpoważniejszą pozycję zarówno 
w budżecie instytutów, jak zakładów przemysłowych 
działających w dziedzinie elektroniki półprzewod¬ 
nikowej. 
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Rys. 5. Struktury tranzystorów: a) i b) tranzystory impulsowe, 
c) tranzystor overlay, <ł) tranzystor typu metal-tlenek-półprze- 
wodnik (MOS) 


Rozważmy np. zagadnienie tzw. mikroniejednorod- 
ności półprzewodników. Otóż wzrost monokryszta¬ 
łów z fazy ciekłej nie odbywa się w sposób ciągły, ale 
jak gdyby drobnymi skokami, co powoduje także sko¬ 
kowy (periodycznie zmieniający się) rozkład domie¬ 
szek, a więc i większości parametrów elektrycznych 
półprzewodnika. Rysunek 6 ukazuje zmiany napięcia 
fotoelektrycznego wzdłuż monokryształu krzemu wy- 
mikroniejed- wołane mikroniejednorodnościami. Oczywiście w 
norodnośct punktach największych odchyleń od średniej koncen¬ 
tracji domieszek oraz w punktach najsilniejszych 
zmian tych koncentracji (największe „wbudowane” 
pola elektryczne) najczęściej występują defekty ele¬ 
mentów półprzewodnikowych. Wprawdzie mikro- 
niejednorodność przeważnie nie pojawia się w trakcie 
monokrystalizacji z fazy gazowej, a więc w trakcie 
większości procesów dających warstwy epitaksjalne, 
ale ponieważ warstwy te są zwykle nakładane na 
podłoże wycięte z monokryształów wyrosłych z fazy 



odległość 
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Rys. 6. Rozkład napięcia fotoelektrycznego związany z mikro- 
nicjednorodnością, zmierzony wzdłuż monokryształu krzemu 



b) 



ciekłej — domieszki dyfundują z tych ostatnich do 
obszaru czynnego i wytwarzają w nim mikroniejed- 
norodność analogiczną do istniejącej w podłożu. Sama 
istota powstawania mikroniejednorodności nie jest 
zbyt dobrze zbadana. Dotychczas udało się uzyskać 
monokryształy wolne od mikroniejednorodności 
jedynie w warunkach kosmicznych, w stanie nie¬ 
ważkości (badania nad tym problemem wchodzi¬ 
ły między innymi w skład programu pierwszego 
wspólnego lotu kosmonautów amerykańskich i ra¬ 
dzieckich). 

Diody półprzewodnikowe i tranzystory umożliwiły miniatury- 
miniaturyzację układów. Skonstruowano miniaturowe zacja 
odbiorniki radiowe, a przenośne stacje radionadaw- 
cze, niegdyś potężne „maszynerie” montowane na 
ciężarówkach, zmieniły się w chowane w dłoniach 
pudełka. Powstało wiele miniaturowych urządzeń 
automatyki przemysłowej. 

Dalszy postęp w dziedzinie miniaturyzacji — mi- mikrominia- 
krominiaturyzacja — przyniósł ogromny rozwój elek- turyzacja 
tronicznych maszyn matematycznych, popularnie 
zwanych komputerami. Wprowadzenie technologii 
epiplanamej (i związanej z nią technologii MOS) 
stworzyło realne szanse budowania komputerów 
o wymiarach i niezawodności umożliwiających ich 
obecne rozpowszechnienie, mimo iż nowoczesny 
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komputer zawiera wiele milionów czynnych elemen¬ 
tów. Tradycyjny tranzystor miał wymiary czipu 
mierzone w milimetrach, a do tego dochodziła spora 
oprawka z doprowadzeniami. Układ scalony wielkiej 
skali integracji w strukturze o wymiarach 5 x 5 x 0,2 
mm mieści kilkanaście tysięcy tranzystorów. Czy tech¬ 


nika, wspierana przez fizykę, pójdzie w tym kierunku 
jeszcze dalej? Na pewno tak. 

W. Marciniak Przyrządy półprzewodnikowe i układy scalone. 
Warszawa 1979; W. Rosiński Zasady działania tranzystorów , 
Warszawa 1977; J. Świderski Techniczne badania właściwości 
materiałów i struktur półprzewodnikowych , Warszawa 1975; A. 
Świt, J. Pultorak Przyrządy półprzewodnikowe , Warszawa 1976. 


Optoelektronika półprzewodnikowa 

Marian A. Herman 


Optoelektroniką nazywa się dział elektroniki, którego 
przedmiotem jest łączne wykorzystanie optycznego 
jak i elektrycznego sposobu przetwarzania i przekazy¬ 
wania sygnałów. Podstawą optoelektroniki są fizyczne 
procesy warunkujące przetwarzanie sygnałów elek¬ 
trycznych na optyczne i sygnałów optycznych na elek¬ 
tryczne oraz procesy wytwarzania, przesyłania, prze¬ 
twarzania i magazynowania informacji niesionych 
przez światło. Ogólny schemat układu optoelektroni- 
nicznego przedstawia rys. 1. 
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Rys. 1. Schemat układu optoelektronicznego 


kanał Zaletą wykorzystania kanału optycznego do prze- 
optycz y syłania, przetwarzania i magazynowania informacji 
jest to, że występujące w tym kanale nośniki infor¬ 
macji (fotony) są pozbawione ładunku elektrycznego. 
Ponieważ czynnikami sterującymi procesem przekazy¬ 
wania lub przetwarzania informacji są w tym wypad¬ 
ku układy wieloatomowe (kryształy lub ciecze, któ¬ 
rych atomy są naładowane elektrycznie lub wykazują 
silne właściwości magnetyczne) oddziaływające z foto¬ 
nami niezbyt silnie (zwłaszcza przy małych natęże¬ 
niach światła nie wywołujących efektów nieliniowych), 
to niesiona przez te fotony w kanale optycznym infor¬ 
macja nie ulega niezamierzonym zniekształceniom. 
Kanał elektryczny szeroko stosowany w klasycznej 
elektronice, w którym nośniki informacji (elektrony) 
i czynniki sterujące (pole elektryczne czy pole magne¬ 
tyczne) oddziałują ze sobą bardzo silnie, jest znacznie 
bardziej podatny na wszelkiego rodzaju zniekształce¬ 
nia przesyłanej, przetwarzanej czy magazynowanej 
informacji. Inną zaletą kanału optycznego jest to, że 
wysoka częstość sygnałów optycznych (10 14 -10 15 Hz) 
zwiększa o około 10* razy pojemność informatyczną 
tego kanału w stosunku do pojemności kanału elek¬ 
trycznego. Kanał optyczny zapewnia ponadto dosko¬ 
nałą izolację galwaniczną zacisków wyjściowych, 
z których odbierana jest informacja, od zacisków 
wejściowych, do których informacja ta zostaje do¬ 
prowadzona. 

Od dawna już znane są takie elementy układów 
optoelektronicznych, jak różnego rodzaju lampy elek¬ 
tryczne, żarowe czy gazowe, które są sterowanymi 
elementy elektrycznie źródłami światła, różne materiały dielek- 
ukladów tryczne ciekłe, szklane czy krystaliczne będące ośrod- 
optoelektro- kami, w których światło się rozchodzi lub jest prze- 
nicznych twarzane, oraz takie jak fotokomórka czy fotopowie- 
lacz, które są detektorami światła. Zastosowanie tych 
elementów oraz zbudowanych przy ich użyciu ukła¬ 
dów było i jest nadal ogromne, zwłaszcza w automa¬ 
tyce czy technice pomiarowej. Duże wymiary wymie¬ 
nionych elementów, a w konsekwencji i duże wymiary 
całych układów optoelektronicznych, jak i niedosko¬ 
nałość fizyczna (niespójność) światła używanego jako 
nośnika nformacji uniemożliwiały jednak realizację 


w kanale optoelektronicznym tych wszystkich funkcji, 
które do niedawna realizować można było przy użyciu 
elektrycznego kanału przekazywania i przetwarzania 
informacji. Trudno byłoby sobie np. wyobrazić radar 
optyczny czy telefon optyczny z żarówką lub zwykłą 
lampą jarzeniową. Dopiero odkrycie na początku lat 
sześćdziesiątych laserów oraz zastosowanie półprze¬ 
wodników spowodowało, że optoelektronika zaczęła 
skutecznie konkurować z klasyczną elektroniką czy 
telekomunikacją. Wiele danych wskazuje już obecnie 
na to, że w niedalekiej przyszłości może ona w pew¬ 
nych wypadkach zastąpić z powodzeniem obie te 
dziedziny techniki. 

Dział optoelektroniki, w którym do realizacji pro¬ 
cesów optoelektronicznych wykorzystuje się półprze¬ 
wodniki, nosi nazwę optoelektroniki półprzewodni- optoelektro- 
kowej. Znane obecnie półprzewodnikowe przyrządy nika półprze- 
. optoelektroniczne mają takie parametry techniczne, wodnikowa 
że można je stosować w układzie optoelektronicznym 
w każdym z przedstawionych na rys. 1 bloków funk¬ 
cjonalnych (źródło, ośrodek, detektor). Z materiałów 
półprzewodnikowych można wykonać źródła światła 
sterowane elektrycznie oraz detektory przetwarzające 
sygnał świetlny na sygnał elektryczny. Materiały^ te 
mogą też stanowić ośrodek optyczny, przez który 
światło jest przekazywane lub, w którym jest ono 
przetwarzane na światło o innych właściwościach 
fizycznych. Największe znaczenie spośród wymienio¬ 
nych półprzewodnikowych przyrządów optoelektro¬ 
nicznych mają źródła i detektory, gdyż mogą one speł¬ 
niać samodzielnie różne funkcje bez konieczności łą¬ 
czenia ich ze sobą w jeden złożony układ optoelektro¬ 
niczny. 


Półprzewodnikowe źródła światła 


Rozwój półprzewodnikowych źródeł światła wiąże 
się z odkryciem zjawisk katodoluminescencji i elektro- 
luminescencji półprzewodników. Katodoluminescen- 
c j a — to świecenie (luminescencja) półprzewodnika 
wywołane napromienieniem go strumieniem elektro¬ 
nów. Elektroluminescencja jest natomiast świeceniem 
półprzewodnika pod wpływem prądu elektrycznego, 
który przez niego przepływa. Katodoluminescencja 
półprzewodników znalazła zastosowanie np. w lampie 
kineskopowej, która jest nieodłączną częścią składo¬ 
wą każdego telewizora. Wykorzystanie tego zjawiska 
w konstrukcji lampy oscyloskopowej stało się pod¬ 
stawą budowy oscylografu, przyrządu, bez którego 
trudno byłoby sobie wyobrazić współczesną elektro¬ 
niczną technikę pomiarową. 

Katodoluminescencyjne źródła światła nie znajdują 
jednak, jak do tej pory, szerszego zastosowania w 
układach optoelektronicznych. Jest to związane z ich 
dużymi wymiarami oraz z tym, że do skutecznego 
bombardowania półprzewodnika strumieniem elek¬ 
tronów potrzebne jest wytworzenie wysokiej próżni, 
w której elektrony te mogłyby się poruszać i byłyby 
odpowiednio przyspieszane. 

Znacznie szersze zastosowanie w półprzewodniko¬ 
wych układach optoelektronicznych znalazły elektro¬ 
luminescencyjne źródła światła. Gdy źródłem światła 
jest półprzewodnik polikrystaliczny o jednym typie 


katodolumi- 

nescencyjne 

źródła 

światła 


elektrolumi¬ 

nescencyjne 

źródła 
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przewodnictwa, osadzony w postaci cienkich warstw 
na odpowiednich elektrodach metalowych i świecący 
pod wpływem przepływającego przezeń stałego lub 
zmiennego prądu elektrycznego (efekt Destriau), to 
mamy do czynienia z tak zwaną komórką elektrolumi¬ 
nescencyjną lub panelem elektroluminescencyjnym. 
Gdy natomiast źródłem światła jest półprzewodniko¬ 
we złącze p-n (—> Fizyka przyrządów półprzewodniko¬ 
wych) wytworzone w materiale monokrystalicznym 
i świecące pod wpływem stałego prądu elektrycznego 
przepływającego przez złącze w kierunku przewodze¬ 
nia (efekt Łosiewa), to mamy do czynienia z diodą 
świecącą lub ze złączowym źródłem światła. W zależ¬ 
ności od konstrukcji diody oraz od natężenia prądu 
elektrycznego płynącego przez złącze p-n, promienio¬ 
wanie świetlne emitowane przez źródło złączowe jest 
albo niespójne — mamy wówczas do czynienia z dio¬ 
dą elektroluminescencyjną (DEL), albo jest ono 
spójne — źródło jest wówczas laserem złączowym. 
Diody elektroluminescencyjne i lasery złączowe są 
obecnie najczęściej stosowane jako źródła światła 
w układach optoelektronicznych. 

DEL składa się z małego kawałka monokrystalicz- 
nego półprzewodnika, w którym wytworzono złącze 
p-n, przymocowanego za pomocą odpowiedniego 
spoiwa do podstawki metalowej, oraz z osłony ota¬ 
czającej i hermetyzującej ten półprzewodnik, wyko¬ 
nanej najczęściej z barwionej żywicy (rys. 2, il. 6 na 
tabl. 2). Najważniejszym elementem DEL jest złącze 



Rys. 2. DEL zamocowana na podstawce tranzystorowej i zanu¬ 
rzona w przezroczystej żywicy 


P-n. Gdy zostanie ono spolaryzowane elektrycznie 
w kierunku przewodzenia, to w obszarze typu p , w 
warstwie o grubości rzędu 1 pm, wytwarza się stan 
inwersji obsadzeń poziomów energetycznych. Więcej 
elektronów znajduje się wówczas w paśmie przewod¬ 
nictwa (o większej energii) niż na górnych poziomach 
pasma walencyjnego (o mniejszej energii). Oznacza to, 
że elektrony mogą przejść na puste poziomy pasma 
walencyjnego i rekombinować z dziurami znajdujący¬ 
mi się po stronie p złącza p-n. Gdy rekombinacji tej 
towarzyszy emisja promieniowania elektromagnetycz¬ 
nego, mówimy o rekombinacji promienistej dziur 
i elektronów w złączu p-n. Gdy energia rekombinacji 
nośników ładunku przekazywana jest sieci krystalicz¬ 
nej półprzewodnika, mówimy o rekombinacji niepro- 
mienistej. Podstawowym kryterium wyboru materia¬ 
łów do produkcji DEL jest stosunek prawdopodo¬ 
bieństw wystąpienia w danym półprzewodniku re¬ 
kombinacji promienistej i rekombinacji niepromieni- 
stej. Im większe jest prawdopodobieństwo rekombina¬ 
cji promienistej w stosunku do prawdopodobieństwa 
rekombinacji niepromienistej, tym bardziej dany ma¬ 
teriał półprzewodnikowy nadaje się do produkcji 
DEL. Jeśli jest to materiał o przerwie energetycznej 
dostatecznie dużej (większej niż 1,7 eV), to emitowane 
promieniowanie elektromagnetyczne jest promienio¬ 
waniem widzialnym. Materiałami używanymi obecnie 
do produkcji DEL są półprzewodnikowe związki galu 
z arsenem lub z fosforem. Arsenek galu (GaAs) do¬ 
mieszkowany krzemem emituje promieniowanie pod- 
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czerwone o długości fali około 0,97 pm. Fosforek galu materiały do 
(GaP) domieszkowany w obszarze p cynkiem i tlenem, produkcji 
a w obszarze n tellurem emituje promieniowanie DEL 
czerwone. GaP domieszkowany w obszarze p cynkiem 
i azotem, a w obszarze n siarką i azotem emituje pro¬ 
mieniowanie zielone. Diody z GaP mogą być wyko¬ 
nane również w taki sposób, że ich barwa świecenia 
zmienia się w funkcji natężenia przepływającego przez 
nie prądu. Jest to związane z tym, że mechanizmy 
rekombinacji promienistej w DEL czerwonych z GaP 
i w DEL zielonych z GaP są inne. Rekombinacja 
promienista warunkująca świecenie czerwone jest 
związana z przejściami między poziomami domiesz¬ 
kowymi donorów i akceptorów. Dlatego też, gdy 
rośnie prąd płynący przez złącze, następuje zjawisko 
nasycenia natężenia świecenia, wynikające ze skoń¬ 
czonej liczby centrów rekombinacyjnych (par donor- 
akceptor). Rekombinacja warunkująca świecenie zie¬ 
lone związana jest z przejściami z płytkiego poziomu 
domieszkowego azotu do pasma walencyjnego. Po¬ 
nieważ nie ma tu ograniczenia liczby centrów rekom¬ 
binacyjnych nie obserwujemy też zjawiska nasycenia 
natężenia luminescencji wraz ze wzrostem prądu pły¬ 
nącego przez złącze. Ponadto czerwone świecenie wy¬ 
stępuje tylko po stronie p złącza p-n zaś zielone świe¬ 
cenie występuje po obu stronach złącza p-n. Gdy więc 
obszar n DEL z GaP jest domieszkowany siarką 
i azotem (świecenie zielone), zaś obszar p cynkiem 
i tlenem (świecenie czerwone), barwa świecenia diody 
zależy od natężenia płynącego przez nią prądu. Przy 
małym natężeniu prądu DEL świeci intensywnie 
światłem czerwonym a słabo światłem zielonym. Gdy 
natężenie prądu wzrasta, rośnie też natężenie światła 
zielonego, natomiast natężenie światła czerwonego 
nie zmienia się. W wyniku tego następuje zmiana bar¬ 
wy emitowanego światła — przez pomarańczową, 
żółtą aż do zielonej. Do produkcji DEL emitujących 
światło widzialne stosuje się też często związek mie¬ 
szany GaAs x _xPar, z odpowiednimi domieszkami. 

DEL są źródłami światła niespójnego. Półprzewod¬ 
nik z wytworzonym w nim złączem p-n zdolnym emi¬ 
tować promieniowanie elektromagnetyczne, można 
ukształtować tak, by powstał rezonator optyczny, 
tzn. układ, w którym promieniowanie elektromagne¬ 
tyczne tworzy fale stojące. Gdy tak ukształtowany 
półprzewodnik pobudzimy znacznie silniejszym prą¬ 
dem elektrycznym niż DEL, to może powstać w nim 
proces laserowy, tzn. proces generacji spójnego pro¬ 
mieniowania elektromagnetycznego w wyniku wymu¬ 
szonych przejść elektronów z pasma przewodnictwa dioda 
do pasma walencyjnego (-* Lasery — podstawy dzia- laserowa 
łania). W najprostszym przypadku półprzewodnik ma 
kształt rezonatora Fabry’ego-Perota tzn. jest prosto¬ 
padłościanem, którego boki prostopadłe do płasz¬ 
czyzny złącza p-n tworzą zwierciadła rezonatora. Pro¬ 
mieniowanie wytworzone w tym rezonatorze może 
zostać rozproszone w półprzewodniku, nie dając 
wkładu do tworzącej się w nim fali stojącej. Może ono 
zostać zaabsorbowane, może być niedokładnie odbite 
na zwierciadłach rezonatora lub też może się wydo¬ 
stać z półprzewodnika jako promieniowanie niespój¬ 
ne. Powstające straty promieniowania stwarzają ko¬ 
nieczność wstrzyknięcia przez złącze tak dużej liczby 
elektronów, by zagwarantowana została przewaga 
aktów wytwarzania promieniowania nad aktami jego 
rozpraszania. Zatem dopiero po przekroczeniu pew¬ 
nej progowej wartości natężenia prądu płynącego 
przez złącze p-n diody laserowej emituje ona promie¬ 
niowanie spójne i monochromatyczne. Najlepsze la¬ 
sery złączowe pracujące w temperaturze pokojowej 
wymagają prądów o natężeniach rzędu kilkudziesię¬ 
ciu mA, co odpowiada progowej gęstości prądu rzędu 
kilkuset A/cm 2 . Przy wartościach natężenia prądu 
mniejszych od wartości progowej laser jest zwykłą 
DEL. Emituje on wówczas promieniowanie niespójne 
o dość szerokiej linii widmowej i znacznie mniejszym 
natężeniu. Ten dwustanowy charakter pracy jest bar¬ 
dzo ważną cechą laserów złączowych wykorzystaną 
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czowy 


w układach do przetwarzania danych. Wartość pro¬ 
gowego natężenia prądu lasera złączowego lub, co 
znacznie częściej się podaje, wartość progowej gęstości 
prądu, jest istotnym parametrem eksploatacyjnym 
tego przyrządu. Przy zbyt wysokich wartościach prą¬ 
dów progowych lasery złączowe mogą bowiem praco¬ 
wać tylko impulsowo, gdyż występujące wówczas 
efekty cieplne uniemożliwiają pracę ciągłą (przy zasi¬ 
laniu prądem stałym). 

Najprostszy a zarazem najbardziej do niedawna 
rozpowszechniony typ lasera złączowego, tzw. laser 
homozłączowy, ma postać przedstawioną schema¬ 
tycznie na rys. 3, Akcja laserowa występuje w cienkim 
obszarze (obszar aktywny) przylegającym do złącza 
p-n y wytworzonego w jednego rodzaju materiale pół¬ 
przewodnikowym, a wiązka promieniowania lasero¬ 
wego jest skierowana prostopadle do pary doskonale 
gładkich płaszczyzn półprzewodnika odgrywających 
rolę zwierciadeł rezonatora Fabry’ego-Pćrota. Lasery 
homozłączowe są najczęściej wykonane z GaAs, mają 
bardzo duże progowe gęstości prądów (rzędu 10 4 -10* 
A/cm 2 ), wskutek czego w temperaturze pokojowej 
mogą pracować tylko impulsowo. 
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Rys. 3. Najprostszy laser złączowy (laser homozłączowy) z re¬ 
zonatorem Fabry*ego-Pćrota oraz jego struktura pasmowa, 
współczynnik załamania i rozkład promieniowania w obszarze 
aktywnym; na dole przykład konstrukcji z rezonatorem zmonto¬ 
wanym na sześciokątnym korpusie z gwintem 
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Rys. 4. Laser heterozłączowy: a) schemat budowy lasera z pa¬ 
skową geometrią kontaktu omowego, b) struktura pasmowa 
i rozkład promieniowania lasera monoheterozłączowego, c) struk¬ 
tura pasmowa i rozkład promieniowania lasera bihetorozłączo- 
wego 
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Dokładne badania przeprowadzone w ostatnich la¬ 
tach doprowadziły do odkrycia, że dostatecznie niskie 
wartości prądów progowych można uzyskać tylko w 
półprzewodnikach o złożonej strukturze składu che¬ 
micznego. Najlepsze rezultaty uzyskano w strukturach 
złożonych z warstwy GaAs oraz z dwóch warstw, 
w których część atomów Ga zastępują atomy Al, przez 
co powstaje związek trójskładnikowy Al^Ga^As. 
Złącza powstałe na styku dwóch warstw o różnym 
składzie chemicznym nazywa się heterozłączami. Po¬ 
nieważ przerwy energetyczne w GaAs i w Al^Ga^As 
mają różne wartości, to w heterozłączu utworzonym 
z tych materiałów powstają znacznie wyższe bariery 
energetyczne (potencjału) dla elektronów niż w złączu 
p-n wytworzonym w materiale jednego rodzaju, np. 
w GaAs. Powoduje to, że elektrony wstrzyknięte przez 
złącze p-n w GaAs do obszaru p tego materiału zostają 
odbite od bariery energetycznej występującej na hetero¬ 
złączu GaAs-Al^Ga^As ograniczającym grubość 
obszaru p w GaAs (rys. 4). Rozkład przestrzenny 
elektronów w strukturze warstwowej lasera hetero- 
złączowego zostaje więc ograniczony do obszaru znaj¬ 
dującego się między heterozłączami tej struktury. 
Różnice występujące we współczynnikach załamania 
między GaAs i Al^Ga^^As powodują, że i światło od¬ 
bija się od heterozłącza między tymi dwoma związka¬ 
mi półprzewodnikowymi. W strukturze warstwowej 
z dwoma heterozłączami zostaje więc ograniczony 
rozkład przestrzenny zarówno elektronów wstrzyk¬ 
niętych do obszaru p przez złącze jak i promieniowania 
elektromagnetycznego wytworzonego w wyniku wy¬ 
muszonych przejść emisyjnych tych elektronów. Te 
dwa ograniczenia przestrzenne, równoznaczne ze 
zmniejszeniem strat optycznych w laserze, prowadzą 
do uzyskania wartości progowej gęstości prądu rzędu 
kilkuset A/cm 2 , co umożliwia ciągłą pracę lasera hete- 
rozłączowego w temperaturze pokojowej. 

Złączowe elektroluminescencyjne źródła promie¬ 
niowania elektromagnetycznego wyróżniają następu¬ 
jące właściwości: 1) duża sprawność przemiany 
energii elektrycznej w energię promienistą — w naj¬ 
lepszych laserach złączowych sięga ona 40%, w DEL 
świecących zielono skuteczność świetlna może osią¬ 
gać granicę teoretycznie możliwą 680 Im/W; 2) czas 
pracy użytecznej (tzn. okres, po upływie którego na¬ 
tężenie świecenia maleje do połowy swej wartości po¬ 
czątkowej) w najlepszych obecnie egzemplarzach la¬ 
serów złączowych jest rzędu 10 000 godzin (pracy nie¬ 
przerwanej), w DEL zaś aż do ok. 20 lat (DEL są 
ponadto odporne na wstrząsy i warunki atmosferycz¬ 
ne); 3) mały pobór mocy ze źródła zasilania (kilka¬ 
naście lub kilkadziesiąt mW); 4) duża sprawność 
i łatwość modulacji emitowanego promieniowania 
z częstościami sięgającymi wartości 10 9 Hz — modu¬ 
lacja jest realizowana bezpośrednio przez zmianę 
prądu płynącego przez diodę; 5) małe wymiary—pół¬ 
przewodnik z wytworzonym w nim złączem ma zwykle 
kształt prostopadłościanu o bokach 0,2 mm, 0,5 mm, 
0,5 mm. 


Półprzewodnikowe detektory 
promieniowania elektromagnetycznego 


przewodnika podczas procesu jonizacji atomów w 
krysztale, wystarcza na to, by elektron pokonał siły 
wiążące go wewnątrz półprzewodnika i opuścił na¬ 
promieniony półprzewodnik, mamy do czynienia 
ze zjawiskiem fotoelektrycznym zewnętrznym. Zja¬ 
wisko to jest wykorzystywane we wszelkiego rodzaju 
fotokomórkach, czy fotopowielaczach. Powstawanie 
pod wpływem napromienienia swobodnych nośników 
ładunku wewnątrz półprzewodnika nazywa się nato¬ 
miast zjawiskiem fotoelektrycznym wewnętrznym. 
Różne są skutki zjawiska fotoelektrycznego wewnętrz¬ 
nego w półprzewodniku. Zależą one przy tym od 
struktury półprzewodnika, od obecności w nim okreś¬ 
lonych domieszek, jak też od występowania w pół¬ 
przewodniku wewnętrznych pól elektrycznych. Zja¬ 
wisko fotoelektryczne wewnętrzne wywołuje obniże¬ 
nie oporu elektrycznego jednorodnego półprzewod¬ 
nika w postaci płytki lub warstwy napylonej na jakiś 
inny materiał. W półprzewodniku z wytworzonym 
złączem p-n, nie spolaryzowanym zewnętrznym na¬ 
pięciem elektrycznym, zjawisko to wywołuje pojawie¬ 
nie się na złączu stałego napięcia fotoelektrycznego 
(efekt fotowoltaiczny). Gdy natomiast złącze p-n 
zostanie spolaryzowane wstępnie w kierunku zapo¬ 
rowym, to zjawisko fotoelektryczne wewnętrzne po¬ 
woduje zmianę nieliniowego oporu złącza. Fotode¬ 
tektory półprzewodnikowe, w których wykorzystano 
opisane skutki wewnętrznego zjawiska fotoelektrycz¬ 
nego noszą odpowiednio nazwy: fotoopornik (foto- 
rezystor), fotoogniwo (bateria słoneczna) oraz foto¬ 
dioda. W takich fotodetektorach zawsze występują 
następujące procesy fizyczne: wytworzenie nośników 
ładunku przez promieniowanie elektromagnetyczne 
padające na półprzewodnik, przeniesienie (transport) 
tych nośników przez obszar półprzewodnika do kon¬ 
taktów metalowych łączących ten półprzewodnik 
z zewnętrznym obwodem elektrycznym, oraz oddzia¬ 
ływanie fotoprądu dopływającego do kontaktów z ze¬ 
wnętrznym obwodem elektrycznym. Charakter wy¬ 
mienionych procesów jest zwykle różny w różnych 
typach fotodetektorów półprzewodnikowych. Warun¬ 
kuje on parametry eksploatacyjne tych fotodetektorów 
oraz określa możliwości ich zastosowań. 

Najprostszym typem fotodetektora jest fotoopor¬ 
nik. Jest to przyrząd złożony z płytki półprzewodni- 



zjawiska 
wywołane 
przez pro¬ 
mieniowanie 


Promieniowanie elektromagnetyczne padające na ja¬ 
kąś substancję może zostać odbite, zaabsorbowane 
lub też może przejść przez tę substancję z pewnym nie¬ 
wielkim tylko osłabieniem jego natężenia. Detektory 
promieniowania elektromagnetycznego konstruuje 
się w taki sposób, by maksymalna część padającego 
na nie promieniowania została w nich zaabsorbowana. 
Ta zasada jest ogólna dla wszystkich rodzajów detek¬ 
torów, a więc i dla detektorów półprzewodnikowych. 
Różne są zjawiska, które zachodzą w półprzewodniku 
pod wpływem padającego nań promieniowania elek¬ 
tromagnetycznego i różne są też rodzaje detektorów 
półprzewodnikowych. Gdy energia, którą przekazuje 
promieniowanie elektromagnetyczne elektronom pół- 
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Rys. 5. Fotooporniki: 
a) w postaci płytki pół¬ 
przewodnikowej, b) w 
postaci warstwy prze¬ 
wodnikowej napylonej 
na płytkę szklaną 


fotodetektory 

półprze¬ 

wodnikowe 


fotoopornik 






fotoogniwo 


fotodioda 


kowej lub z warstwy półprzewodnikowej napylonej 
na płytkę szklaną. Na przeciwległych końcach tej war¬ 
stwy lub płytki wykonane są liniowe (nieprostujące) 
kontakty metalowe (rys. 5). W czasie padania na po¬ 
wierzchnię fotoopornika promieniowania elektro¬ 
magnetycznego zmniejsza się jego opór elektryczny. 
Pochłonięte promieniowanie wytwarza w nim nośniki 
ładunku albo w wyniku przejść międzypasmowych, 
albo w wyniku przejść z udziałem poziomów energe¬ 
tycznych domieszkowych leżących w przerwie energe¬ 
tycznej półprzewodnika. Fotoprzewodmctwo w tego 
typu fotodetektorach może się pojawić jednak tylko 
wtedy, gdy energia pochłoniętych fotonów jest równa 
lub większa od energii oddzielającej poziom domiesz¬ 
kowy leżący w przerwie energetycznej od krawędzi 
pasma przewodnictwa lub pasma walencyjnego, albo 
też jest co najmniej równa przerwie energetycznej 
półprzewodnika. Ten fakt określa tzw. długofalową 
granicę pracy fotoopornika. . 

Fotoogniwo jest przyrządem o stosunkowo dużej 
powierzchni oświetlonej. Złącze p-n znajduje się w bez¬ 
pośrednim sąsiedztwie (na głębokości rzędu 1 pm) 
oświetlanej powierzchni. Padające na złącze fotony 
o energii większej od szerokości przerwy energetycz¬ 
nej półprzewodnika powodują powstanie, w miejscu 
gdzie są pochłaniane, par elektron-dziura. Pole elek¬ 
tryczne wewnątrz półprzewodnika, związane z obec¬ 
nością złącza p-n, przesuwa nośniki różnych rodzajów 
w różne strony. Elektrony trafiają do obszaru n, 
dziury zaś do obszaru p. Rozdzielenie nośników ładun¬ 
ku w złączu powoduje powstanie na nim zewnętrzne¬ 
go napięcia elektrycznego. Ponieważ rozdzielone noś¬ 
niki są nośnikami nadmiarowymi (mają nieskończony 
czas życia), a napięcie na złączu p-n jest stałe, oświe¬ 
tlone złącze działa jako ogniwo elektryczne. 

Fotodioda jest również elementem półprzewodni¬ 
kowym ze złączem p-n. Teraz jednak złącze jest spola¬ 
ryzowane wstępnie w kierunku zaporowym. Wskutek 
oświetlenia prąd zaporowy złącza jest modulowany 
przez powstające w złączu pary elektron-dziura, co 


z punktowymi kontaktami metalicznymi oraz diody fotodioda 
lawinowe. Wszystkie te fotodiody mają duże i różno- lawinowa 
rodne zastosowania praktyczne. Jednak fotodiody 
lawinowe, które odznaczają się silnym wewnętrznym 
wzmocnieniem fotoprądu mają przed sobą, jak się 
wydaje, największe perspektywy zastosowań, zwłasz¬ 
cza w układach komunikacji optycznej. Fotodioda 
lawinow-a pracuje przy dużych napięciach zaporo¬ 
wych, przy których oświetlenie złącza p-n powoduje 
przebicie lawinowe. Jeżeli wytworzony przez pochło¬ 
nięty foton nośnik mniejszościowy, np. elektron, zo¬ 
stanie przyspieszony w polu elektrycznym spolaryzo¬ 
wanego zaporow-o złącza p-n do energii kinetycznej 
większej ok. 1,5 raza od energii równej przerwie 
energetycznej półprzewodnika, to może on w wyniku 
zderzenia niesprężystego przekazać część swej energii 
elektronowi z pasma walencyjnego powodując jego 
przejście do pasma przewodnictwa. W ten sposób na¬ 
stępuje generacja pary elektron-dziura, kosztem pew¬ 
nego obniżenia energii elektronu pierwotnego, który 
jednak nadal pozostaje w paśmie przewodnictwa. 

Powstaje układ dwóch elektronów przewodnictwa 
i jednej dziury, które to nośniki ponownie mogą na¬ 
bywać energię kinetyczną w polu złącza p-n. Po 
osiągnięciu energii większej od przerwy energetycznej, 
każdy z tych ładunków może wytworzyć następną 
parę elektron-dziura. Proces ten powtarza się wielo¬ 
krotnie w sposób lawinowy, dając na kontaktach me- t 
talicznych takiej diody silny sygnał elektryczny. Prze¬ 
bicie lawinowe bywa często zlokalizowane w kuku 
obszarach, w których tworzą się tzw. mikroplazmy. 

Aby uzyskać w diodzie lawinowej duże w-zmocnieme uzyskiwanie 
fotoprądu, konieczne jest takie wykonanie złącza dużego ^ 
p-n, aby przebicie to zachodziło jednocześnie w całym wzmocnienia 
obszarze złącza oraz by efekty brzegowe w miejscu 
wyjścia złącza na powierzchnię półprzewodnika me 
spowodowały prądów upływowych. Wymaga to do¬ 
brania materiału o małej ilości wtrąceń i dużej dosko¬ 
nałości sieci krystalicznej (małej ilości dyslokacji) oraz 
zastosowania pierścienia ochronnego (rys. 7). 


promieniowanie promieniowanie 



Rys. 6. Fotodiody: a) selenowa, b) krzemowa, c) germanowa 

powoduje odpowiednie zmiany nieliniowego oporu 
tego złącza. Konstrukcje kilku rodzajów fotodiod 
przedstawiono na rys. 6. Rodzina fotodiod jest bardzo 
duża. Zaliczają się do niej diody typu p-i-n, diody 
z barierą Schottky’ego, diody z heterozłączami, diody 


Zastosowania półprzewodnikowych źródeł 
i detektorów promieniowania 
elektromagnetycznego 

Półprzewodnikowe źródła i detektory promieniowa¬ 
nia elektromagnetycznego znajdują różnorodne za¬ 
stosowania. DEL emitujące światło widzialne stosuje 
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lampki syg- się jako miniaturowe lampki sygnalizacyjne małej 
nalizacyjne mocy o barwach świecenia czerwonej, żółtej czy zielo¬ 
nej w różnego rodzaju aparaturze elektronicznej, 
zwłaszcza przenośnej. DEL mogą wskazywać, że zo¬ 
stało włączone napięcie w aparaturze, mogą pod¬ 
świetlać przezroczyste klawisze z określonymi napi¬ 
sami, np. w aparatach telefonicznych, mogą być 
oświetlaczami przyrządów wskazujących poziom pa¬ 
liwa w baku samochodowym czy szybkość samocho¬ 
du, mogą też być źródłem promieniowania w prze¬ 
nośnych dalmierzach optycznych. DEL są również 
stosowane we wskaźnikach alfanumerycznych. Diody 
te, połączone w jedną mozaikę świecącą i sterowane 
przez sygnały elektryczne trafiają na specjalny układ 
kodujący, pozwalają wyświetlać dowolną cyfrę od 
zera do dziewięciu lub dowolną literę alfabetu. 
Układy takich wskaźników mogą tworzyć albo swois¬ 
tą tablicę świetlną, albo układ wielocyfrowy stosowa¬ 
ny np. w woltomierzach cyfrowych, w kalkulatorach 
elektronicznych czy w zegarkach elektronicznych. Po¬ 
jedynczą mozaikę złożoną z 35 DEL przedstawia 
rys. 8, natomiast całą tablicę świetlną rys. 9. 

DEL emitujące promieniowanie podczerwone słabo 
tłumione przez atmosferę (długość fali ). « 0,9 pm) 
są stosowane jako źródła promieniowania podczer¬ 
wonego, m.in. w dalmierzach optycznych, w prze- 


linijka z DEL 
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alfanume¬ 

ryczne 


Rys. 8. Wskaźnik literowy złożony z trzech 35-eIementowych 
mozaik DEL oraz litery wyświetlane przez ten wskaźnik 



czytniki 

taśmy 

perforowanej 


Rys. 9. Tablica świetlna wykonana z DEL 

nośnych telefonach optycznych krótkiego zasięgu 
(bez połączenia kablowego) czy też w czytnikach taś¬ 
my perforowanej w maszynach matematycznych (rys. 
10). Możliwość szerokiego zastosowania tych źródeł 
promieniowania wiąże się również z przyrządami 
zwanymi transoptorami lub optronami. Są to umiesz¬ 
czone w jednej obudowie i izolowane elektrycznie od 
siebie dwa elementy układu optoelektronicznego — 
źródło i detektor promieniowania elektromagnetycz¬ 
nego (rys. 11). W urządzeniach tych źródłem jest DEL 
(zwykle wykonana z GaAs) emitująca promieniowa¬ 
nie podczerwone, a detektorem — fotodioda (wyko¬ 
nana z krzemu), której czułość widmowa jest prawie 
transoptory maksymalna dla emitowanej fali. Transoptor jest pod¬ 
stawowym elementem strukturalnym układów opto¬ 
elektronicznych mogącym realizować różne funkcje 
obwodowe, takie jak np. wzmacnianie, generacja, 
przełączanie czy formowanie sygnałów. Może być 
ponadto używany jako transformator prądu stałego 
lub jako przekaźnik. Transoptory są szczególnie przy¬ 
datne tam, gdzie występuje styk dwóch różnych sieci 
elektrycznych, np. wysokiego i niskiego napięcia, wy¬ 
magających zastosowania galwanicznej separacji 
między nimi. Są więc stosowane w układach kontroli 
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Rys. 10. Schemat czytnika taśmy perforowanej. Taśma perforo¬ 
wana przechodząca pomiędzy linijką wykonaną z 12 DEL a ukła¬ 
dem fotodetektorów, powoduje pojawienie się sygnału elektrycz¬ 
nego tylko z tej fotodiody, która znajduje się bezpośrednio pod 
otworem w taśmie (tylko wówczas światło z DEL dochodzi do 
fotodiody). Sygnały elektryczne odbierane z układu fotodiod 
odtwarzają rozmieszczenie otworów na taśmie 



wysokiego napięcia, w aparaturze medycznej, która 
musi być izolowana od pacjenta, w układach za¬ 
bezpieczających maszyny górnicze przed iskrzeniem 
czy też urządzeniach zabezpieczających przed prze¬ 
ciążeniami prądowymi. 

Lasery złączowe nie mają, jak do tej pory, tak ma¬ 
sowego zastosowania jak DEL. Zarysowują się jednak 
już na obecnym etapie rozwoju trzy główne kierunki 
zastosowania tych przyrządów. Dwustanowy charakter 
pracy umożliwia ich zastosowanie w układach do prze¬ 
twarzania danych, wykonujących określone operacje 
logiczne. Przełączenie ze stanu pracy „off” (DEL) do 
stanu pracy „on” (laser) może się odbywać nie tylko 
za pomocą elektrycznych sygnałów. Okazuje się, że 
można też laser przełączyć z jednego stanu w drugi za 
pomocą sygnału świetlnego, emitowanego z drugiego 
lasera złączowego. Fakt ten umożliwił skonstruowanie 
laserów sprzężonych optycznie. Lasery sprzężone 
optycznie są wykonywane zwykle w ten sposób, że 
w jednej monokrystalicznej płytce GaAs wytwarza się 
dwa laserujące złącza p-n. Aby zwiększyć sprzężenie 
optyczne między laserami, oba złącza umieszcza się 
w tej samej płaszczyźnie, a ponadto tylko strony p 
złącz są od siebie oddzielone elektrycznie (przez od¬ 
powiednie wdyfundowanie domieszek akceptorowych 
do płytki GaAs). Oba złącza mają różną długość, zaś 
ścianki boczne płytki, prostopadłe do osi optycznej 
układu, są dodatkowo zmatowione w obszarze złącza 
dłuższego. W obszarze złącza krótszego ścianki boczne 
mają gładkość lustrzaną. Zapobiega to możliwości 
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lasery generacji światła w kierunku prostopadłym do osi 
sprzężone układu w laserze dłuższym. Gdy gęstosc prądu prze- 
»ntvcznie pływającego przez laser krótszy (obszar / na rys. 2) 
optycznie P^« c2 8 nie P większa od gęs , 0 ści prądu płynącego 

przez laser dłuższy (A > A), to akcja laserowa wy¬ 
stępuję tylko w laserze krótszym i to w kierunku 
poprzecznym. Dzieje się tak dlatego, ze w aserze 
dłuższym, pracującym wówczas poniżej progu lasero- 


ściu pojawia się silny laserowy sygnał optycy C. 
Poziom zasilania części środkowej jest tak dobrany, 
by sygnał laserowy na wyjściu C pojawił się tylko 
wtedy, gdy sygnały A i B trafiają na układ jednocześ¬ 
nie. Przy jednym sygnale A lub B układ pracuje jako 
DEL. W podobny sposób jest realizowana w laserze 
z dwiema odizolowanymi elektrycznie częściami ope¬ 
racja „lub” (rys. 13b). 
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Rys. 12. Układ przełączający zbudowany na 
laserach złączowych sprzężonych optycznie 
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weco, promieniowanie wychodzące z lasera krótszego 
w kierunku równoległym do osi układu jest silnie 
absorbowane. Jeżeli jednak gęstość prądu w obszarze 
złącza dłuższego (obszar II) wzrasta do wartości pro¬ 
gowej akcji laserowej w tym złączu (ji ~h\ to pro¬ 
mieniowanie tego złącza spowoduje zmniejszenie in¬ 
wersji obsadzeń w obszarze złącza krótszego, a w 
konsekwencji wygaszenie procesu laserowego w^ kie¬ 
runku poprzecznym do osi optycznej układu. Układ 
będzie teraz emitował promieniowanie jedynie w kie¬ 
runku równoległym do osi układu. Jak widać, zmie¬ 
niając gęstość prądów zasilających każde ze złączy 
p-n układu, można przełączać promieniowanie łagro¬ 
we na wyjściu z kierunku prostopadłego do osi układu 
na kierunek równoległy do tej osi. 

Na tej zasadzie można konstruować układy^ reali¬ 
zujące różne operacje logiczne, np. operacje „i oraz 
operację „lub”. Operację „i” (rys. 13a) realizuje laser 
z trzema elektrycznie odizolowanymi częściami znaj¬ 
dującymi się w jednym wspólnym rezonatorze. Stały 
prąd trafia na część środkową X, co powoduje pro¬ 
mieniowanie układu jako DEL. Dwie pozostałe części 
układu spełniają rolę elementów pochłaniających pro¬ 
mieniowanie w rezonatorze — me doprowadza się bo- 
wiem do nich prądu. Gdy na układ trafiają sygnały 
optyczne A i B, to wskutek działania ich energii pro¬ 
mienistej na złącza p-n absorbentów maleje współ¬ 
czynnik absorpcji w tych obszarach, w wyniku czego 
w rezonatorze wzbudza się akcja laserowa, a na wyj- 


DJ 

Rys. 13. Przykłady laserowych układów logicznych 

Małe wymiary i mała masa oraz dostatecznie duża 
moc emitowanego promieniowania (które z łatwością 
można modulować), umożliwiają zastosowanie lase¬ 
rów złączowych połączonych ze światłowodem, np. 
z włóknem szklanym lub ze światłowodem z tworzy- 
wa sztucznego (rys. 14), zarówno jako nadajnika syg¬ 
nałów optycznych jak i stacji przekaźnikowej (wzmac- 
niającej i retransmitującej sygnały optyczne) do celów 
telekomunikacji optycznej. Perspektywa tego zasto¬ 
sowania laserów złączowych może bardzo poszerzyć 
możliwości zastosowania tych przyrządów, rewolu¬ 
cjonizując jednocześnie telekomunikację. 

Trzecim wreszcie kierunkiem zastosowania laserów 
złączowych jest zastosowanie o bardziej specjalnym 
przeznaczeniu. Lasery te mogą być np. stosowane 
jako głowice lokacyjne w radarach optycznych 
umieszczonych w samolotach odrzutowych, mogą tez 
być zapalnikami pocisków balistycznych, mogą wresz¬ 
cie służyć jako miniaturowe czytniki hologramów 
i stanowić elementy holograficznych układów pamię¬ 
ciowych w maszynach matematycznych 

Jeszcze szersze zastosowanie niż źródła promienio¬ 
wania elektromagnetycznego mają półprzewodnikowe 
detektory tego promieniowania. Są one obecnie stoso¬ 
wane niemal w każdej dziedzinie techniki. W regulacji 
automatycznej stosuje się je jako różnego rodzaju re¬ 
ceptory selektywne, reagujące tylko na promienio¬ 
wanie o określonej długości fali, oraz meselektywne 
reagujące na promieniowanie o różnych długościach 
fal. W technice pomiarowej znajdują zastosowanie 
jako mierniki natężenia sygnałów optycznych nato¬ 
miast w kosmonautyce wykorzystuje się je jako ba¬ 
terie słoneczne, tzn. jako przetworniki energii pro¬ 
mieniowania słonecznego w energię elektryczną zasi¬ 
lającą aparaturę znajdującą się w pojezdzie kosmicz¬ 
nym. Wieloelementowe mozaiki zawierające od kilku 
do kilkunastu tysięcy światłoczułych elementów są 
stosowane jako przetworniki obrazow w kamerach 
telewizyjnych. Mogą one też być zastosowane do 
przetwarzania obrazu optycznego na bodźce czucio- 
we stając się wówczas częścią składową urządzeń 
zastępujących niewidomym wzrok. Szerokie zastoso- 
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J 4 ' sprzęzema śwjatfa emitowanego przez iasei 

złączowy (z lewej) i DEL (z prawej) z włóknem szklanym, b) lasen 
heterozłączowe połączone ze światłowodem wykonanym z wł6 
kna z tworzywa sztucznego (średnica światłowodu ok. 2 mm) 


wanie fotodetektorów (głównie krzemowych) wiąże 
się również ze wspomnianymi już wyżej transoptora- 
mi czy czytnikami taśmy perforowanej, w których 
współpracują one ściśle z półprzewodnikowymi 
źródłami promieniowania elektromagnetycznego, 
noktowizja Ważne zastosowanie znalazły też pólprzewodniko- 
termografia we detektory promieniowania podczerwonego o dłu¬ 
gości fali równej kilka lub kilkanaście pm. Są one 
stosowane w noktowizji (yyidzenie w ciemności na 
podstawie rejestracji promieniowania podczerwone¬ 
go emitowanego przez różne ciała lub obiekty i prze¬ 
tworzenia go na promieniowanie widzialne) oraz w 
termografii (rejestracja rozkładu temperatury na po¬ 
wierzchni rozgrzanego obiektu na podstawie rejestra¬ 
cji natężenia promieniowania podczerwonego emito¬ 
wanego przez elementy powierzchni tego obiektu). 

Zakres zastosowań półprzewodnikowych elemen¬ 
tów optoelektronicznych jest ogromny i przytoczone 
powyżej przykłady nie wyczerpują wszystkich możli¬ 
wości. 


Kierunki rozwoju optoelektroniki 
półprzewodnikowej 


Rozwój optoelektroniki półprzewodnikowej jest sty¬ 
mulowany z jednej strony nowymi zastosowaniami 
przyrządów i układów optoelektronicznych w róż¬ 
nych dziedzinach techniki, z drugiej zaś strony rozwo¬ 
jem innych gałęzi elektroniki, np. automatyki, infor¬ 
matyki czy telekomunikacji, które wykorzystują 
przyrządy optoelektroniczne i narzucają odpowiednie 
wymagania w odniesieniu do niezawodności, spraw¬ 
ności energetycznej, miniaturyzacji czy funkcjonal¬ 


ności tych urządzeń. Rozwój mikroelektroniki (-* Mi¬ 
kroelektronika) spowodował np. konieczność opraco¬ 
wania zminiaturyzowanego i niezawodnego źródła 
światła, by wskaźniki świetlne stosowane w układach 
mikroelektronicznych były porównywalne swymi wy¬ 
miarami i niezawodnością z tymi układami. Dopro¬ 
wadziło to do konstrukcji pierwszych DEL. 

Różne są tendencje rozwojowe poszczególnych ro¬ 
dzajów przyrządów optoelektronicznych. W zakresie 
półprzewodnikowych źródeł promieniowania elektro- zwiększenie 
magnetycznego można przewidywać rozwój w kierun- zakresu wid- 
ku rozszerzenia zakresu widmowego emitowanych mowego 
fal i to zarowno w stronę ultrafioletu, jak i w stronę 
podczerwieni (bardzo dalekiej), w kierunku zwiększe¬ 
nia mocy emitowanego promieniowania oraz zwięk¬ 
szenia sprawności energetycznej procesu emisji pro¬ 
mieniowania. Innym kierunkiem rozwoju źródeł jest 
tworzenie dużych matryc świecących, zmieniających 
od punktu do punktu swą barwę i natężenie pod wpły¬ 
wem sterujących sygnałów elektrycznych. Matryce rhatryce 
akie mogą znaleźć zastosowanie jako duże, płaskie świecące 
ekrany telewizji kolorowej, zawieszane na ścianie. 

Jeśli chodzi o półprzewodnikowe detektory pro¬ 
mieniowania elektromagnetycznego, to dąży się za¬ 
równo do znacznego zwiększenia ich czułości energe¬ 
tycznej i widmowej, jak też do tworzenia matryc 
i mozaik o bardzo dużym upakowaniu elementów de¬ 
tekcyjnych, co umożliwi skonstruowanie urządzeń 
do rozpoznawania druku, obrazów barwnych i przed- rozpoznawa- 
miotow. Ważnym kierunkiem rozwoju detektorów nie druku, 
^ędzie tez prawdopodobnie trójwymiarowy zapis in- obrazów 
formacji optycznej (w całej objętości kryształu) jak barwnych itp. 
i przetwarzanie energii promieniowania słonecznego 
w energię elektryczną za pomocą dużych powierzchni 
światłoczułych. 




wielce z oj^iuciCMzuiiiKą poiprze- uKcaay 
wodnikową w zakresie konstrukcji układów parnię- pamięciowe 
ci owych maszyn matematycznych przewidując możli¬ 
wość budowy systemów o bardzo szybkim dostępie 
i pojemności większej niż 10 12 bitów na cm 2 . Wynika 
to z jednej strony z faktu, że teoretyczna granica 
gęstości upakowania bitów informacji jest usta¬ 
lona przez długość fali, na jakiej jest ta informacja 
zapisywana, z drugiej zaś strony przez możliwość wy¬ 
korzystania zalet techniki holograficznej. 

Innym kierunkiem rozwoju optoelektroniki pół¬ 
przewodnikowej jest tzw. monolityczna optyka zinte- monolitycz- 
growana (scalona). Jest to dziedzina zajmująca się na optyka 
mikrominiaturyzacją układów' optoelektronicznych zintegrowa¬ 
na zasadzie analogicznej jak w obwodach scalonych, na 
Dąży się tu do skonstruowania całego układu opto¬ 
elektronicznego, tj. źródła, elementu przetwarzającego 
lub przesyłającego oraz detektora w postaci jednego 
monolitycznego elementu krystalicznego o wymia¬ 
rach rzędu ułamka milimetra. Rozwój tej dziedziny 
może doprowadzić do nowych, trudnych jeszcze do 
przewidzenia zastosowań układów optoelektronicz¬ 
nych. 

P*nkove Zjaw/sAa optyczne >v półprzewodnikach , War¬ 
szawa 1974; C. H. Gooch Przyrządy elektroluminescencyjne ze 
złączem p-n, Warszawa 1977. 
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Mikroelektronika 

Andrzej Zawadzki 

W ciągu zaledwie kilkunastu lat prawie we wszystkich 
dziedzinach elektroniki zastąpiono lampy elektrono¬ 
we elementami półprzewodnikowymi: diodami, tran¬ 
zystorami, tyrystorami (tzw. dyskretnymi elementami 
półprzewodnikowymi). Mają one znacznie mniejsze 
rozmiary, większą niezawodność, zużywają mniej 
energii oraz są tańsze dzięki zastosowaniu w dużym 
stopniu zautomatyzowanych metod produkcji. 

Początkowo stosowano proste, pojedyncze tranzy¬ 
story i diody. Następnie opracowano elementy pół¬ 
przewodnikowe spełniające inne funkcje (jak np. ty¬ 
rystory), a tranzystory i diody wyspecjalizowano w 
najróżnorodniejsze typy — mocy, wielkiej częstości, 
przełączające, mikrofalowe itp. Szybko jednak osiąg¬ 
nięty został kres miniaturyzacji i niezawodności ukła¬ 
dów elektronicznych zbudowanych z dyskretnych 
elementów półprzewodnikowych, bowiem muszą one 
mieć wymiary umożliwiające montaż, a duża liczba 
połączeń określa pewien poziom niezawodności tych 
układów, który trudno zwiększyć. Na przykład, wg 
danych statystycznych, przy 1000 połączeń przynaj¬ 
mniej jedno zawodzi raz na 5 godzin pracy układu. 

Tymczasem rozwój pewnych dziedzin elektroniki 
uzależniony był od dalszego radykalnego postępu 
miniatury- w dziedzinie. miniaturyzacji, zmniejszenia zużycia 
zacja energii oraz zwiększenia niezawodności układów 
elektronicznych. Takimi dziedzinami były przede 
wszystkim informatyka, telekomunikacja satelitarna 
i automatyka. 

Potrzeba opracowania nowej koncepcji konstrukcji 
układów elektronicznych pojawiła się w sytuacji, gdy 
istniały już możliwości techniczne realizacji takiej 
koncepcji. Mianowicie doprowadzona była do per¬ 
fekcji technologia planarna, służąca do wytwarzania 
większości tranzystorów, diod i tyrystorów półprze¬ 
wodnikowych. Technologia ta polega na wytwarzaniu 
złącz p-n lub n-p w płytce monokrystalicznej przez 
kolejne stosowanie takich procesów jak dyfuzja i epi- 
taksja. Na płytce o średnicy ok. 5 cm, wyciętej z mo¬ 
nokryształu krzemu, wytwarza się jednocześnie (gru¬ 
powo) wiele setek lub nawet tysięcy np. tranzystorów 
o praktycznie identycznych właściwościach (il. 101, 
tabl. 25). 

technologia Technologia planarna jest bardzo szybka i ekono- 
planarna miczna. Doskonaląc ją osiągano coraz lepsze para¬ 
metry wytwarzanych elementów i coraz większą ich 
różnorodność. Dalszym krokiem było przejście do 
wytwarzania na ciągłym podłożu zespołów elementów 
elektronicznych wraz z połączeniami tak, aby tworzyły 
gotowe miniaturowe układy — tzw. układy scalone. 
Nie trzeba wówczas zaopatrywać poszczególnych ele¬ 
mentów w wyprowadzenia, a następnie łączyć wy¬ 
prowadzeń ze sobą. Odpowiednio zaprojektowane 
układy można wytwarzać grupowo—jak pojedyn¬ 
cze elementy. Tak narodziła się mikroelektronika, 
czyli technika projektowania i wytwarzania układów 
scalonych. Obecnie produkowane są układy scalone 
zawierające na kawałku krzemu o wymiarach rzędu 
5x5 mm obwody elektroniczne zawierające kilka¬ 
dziesiąt tysięcy tranzystorów, diod i oporników, 
układ scalony W skład układu scalonego wchodzą elementy czyn¬ 
ne, czyli tranzystory, oraz bierne, jak diody, oporniki 
i kondensatory, które nie mają właściwości przekształ¬ 
cania sygnałów elektrycznych. Elementy czynne, 
a więc tranzystory, są w układzie scalonym (tak jak 
i w każdym układzie elektronicznym) wzmacniaczami 
prądu lub napięcia sygnałów elektrycznych, wzmac¬ 
niaczami mocy, detektorami, dyskryminatorami czy 
też generatorami sygnałów o określonym kształcie 
i częstości. Elementy czynne mają wiele parametrów 
elementy opisujących ich właściwości, jak np. współczynniki 
czynne wzmocnienia, przebieg zależności prądu płynącego 
i bierne przez ten element od przyłożonego napięcia (zależno¬ 
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ści te mają charakter nieliniowy), czy też częstości, 
z jaką dany element może pracować itp. W odróżnie¬ 
niu od elementów czynnych, elementy bierne są w za¬ 
sadzie opisywane przez jedną cechę —jeden parametr 
(np. oporniki — przez wartość oporu elektrycznego, 
kondensatory — przez wartość pojemności). 

Stopień złożoności układów scalonych określany 
jest mianem skali integracji. Pierwsze układy scalone 
wyprodukowane w USA na początku lat sześćdzie¬ 
siątych spełniały proste funkcje i zawierały kilka 
fub kilkanaście tranzystorów i oporników. Były to 
układy małej skali integracji — SSI (ang. Smali Scalę 
Integratioń). 

Następnym krokiem w historycznym rozwoju tech¬ 
niki układów scalonych były układy wykonujące kilka 
funkcji, jak np. wzmacniacz pośredniej częstotliwości 
i detektor FM (modulacji częstotliwości) mające za¬ 
stosowanie w odbiornikach radiowych, czy np. układy 
cyfrowe stosowane w technice maszyn i urządzeń cy¬ 
frowych. Układy takie, zawierające powyżej 100 tran¬ 
zystorów oraz podobną liczbę oporników i diod, są 
nazywane układami średniej skali integracji MSI 
(ang. Medium Scalę Integratioń). 

W ostatnich latach rozpoczęto wytwarzanie ukła¬ 
dów wielkiej skali integracji (ang. Large Scalę Inte¬ 
gratioń), to znaczy scalonych układów ..spełniających 
określone funkcje. Są to układy zawierające wiele 
tysięcy tranzystorów i elementów biernych. Produkuje 
się w ten sposób np. pamięci o pojemności od 64 do 
16 384 bitów, a firma IBM wyposaża swoje komputery 
w pamięci centralne, zbudowane z układów scalonych 
o pojemności ponad 60 000 bitów. Trzeba przy tym 
pamiętać, że jesteśmy dopiero na początku tej drogi, 
pamięci półprzewodnikowe produkuje się zaledwie 
od kilku lat i wielu ekspertów twierdzi, że w niedługiej 
przyszłości stosowane będą wyłącznie pamięci pół¬ 
przewodnikowe. 

Innymi układami wielkiej i bardzo wielkiej skali 
integracji są układy stosowane np. w kieszonkowych 
i stołowych kalkulatorach, minikomputerach, syste¬ 
mach telefonicznych i telekomunikacyjnych, syste¬ 
mach informatycznych i automatyki. Najnowszym 
osiągnięciem techniki cyfrowych układów scalonych 
wielkiej skali integracji są mikroprocesory, to znaczy 
układy scalone o możliwościach obliczeniowych 
małych maszyn matematycznych. Wiele firm, w 
szczególności amerykańskich, jak Motorola, Intel, 
Fairchild, Texas Instruments, produkuje zestawy mi¬ 
krokomputerów składające się z kilku układów scalo¬ 
nych (mikroprocesorów, pamięci, układów wejścio¬ 
wych i wyjściowych), do których dołącza instrukcje 
programowania. Użytkownik według tych instrukcji 
może tak zaprogramować zestaw, aby spełniał on sa¬ 
modzielne zadania obliczeniowo-sterujące, jak stero¬ 
wanie ruchem ulicznym, obliczanie ceny sprzedawa¬ 
nego towaru i wydawanie reszty, sterowanie procesa¬ 
mi technologicznymi itp. 


Projektowanie układów scalonych 

Projektowanie układów wymaga zastosowania kom¬ 
puterów, gdyż inaczej czas zaprojektowania układu 
scalonego byłby niewyobrażalnie długi lub wręcz by¬ 
łoby to niemożliwe do wykonania. Oczywiście właści¬ 
wym projektantem układu scalonego jest człowiek — 
konstruktor. Opracowano wiele różnych programów 
obliczeniowych, które pozwalają ocenić, czy zaprojek¬ 
towany układ będzie spełniał swoją funkcję zgodnie 
z założonymi parametrami, uwzględniając rozrzut 
właściwości układu wynikający z warunków produk¬ 
cji, wpływu temperatury i np. warunków pracy ukła¬ 
du. Inne programy pozwalają zaprojektować roz- 
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mieszczenie elementów w układzie scalonym tak, aby 
zajmowały one jak najmniejszą powierzchnię, dawały 
się połączyć jedną warstwą metalizacji (chociaż znane. 
są sposoby wykonywania połączeń skrzyżowanych) 
i aby połączenia pomiędzy elementami układu były 
jak najkrótsze. Przy projektowaniu układów scalo¬ 
nych wykorzystuje się następujące zalety technologii 
tych układów: 

— połączenia o bardzo dużej niezawodności. 

— taka sama zależność parametrów od warunków 
pracy elementów, 

— możliwość dobierania elementów o takich właś¬ 
ciwościach i parametrach, jakie są potrzebne. 

Istnieją także ograniczenia, które konstruktor musi 
uwzględnić w swoim projekcie, a mianowicie: 

— ograniczenie maksymalnych wartości oporów 
i pojemności, 

— trudności w uzyskaniu tranzystorów p-n-p o pa¬ 
rametrach zbliżonych do tranzystorów n-p-n, 

— występowanie pasożytniczych pojemności oraz 
tranzystorów p-n-p (rys. 1) ograniczających częstość 
pracy układu, 

— brak możliwości wykonywania elementów in¬ 
dukcyjnych w układzie scalonym wynikający z nie¬ 
możności uzyskania elementów magazynujących pole 
magnetyczne w półprzewodniku. 

Niektóre z tych ograniczeń są już usuwane. Stoso¬ 
wanie np. izolacji dielektrycznej (oddzielenie wysp 
elementów dwutlenkiem krzemu lub przerwą po¬ 
wietrzną) pozwala na znaczne zredukowanie pojem¬ 
ności pasożytniczych, a co za tym idzie — osiągnięcie 
wyższych częstości pracy układu. Znane są także takie 
układy, które mogą zastąpić elementy indukcyjne wy¬ 
twarzając określone przesunięcie fazowe prądu i na¬ 
pięcia. Do takich układów należą żyratory oraz układy 
o sprzężeniu fazowym. 


Wytwarzanie układów scalonych 

Istnieje kilka zasadniczych technik wytwarzania 
układów scalonych. Ogromną większość produko¬ 
wanych na świecie układów scalonych stanowią ukła¬ 
dy monolityczne, czyli takie, w których wszystkie 
elementy są wykonane w jednym kryształku krzemu 
zwanym strukturą, o rozmiarach rzędu kilku mili¬ 
metrów kwadratowych. W układach monolitycznych 
osiągane jest największe zagęszczenie (tzw. gęstość 
upakowania) elementów elektronicznych — obecnie 
na kryształku o wymiarach ok.5x5mm można zmieś¬ 
cić ponad 60 000 tranzystorów tworzących określony 
układ elektroniczny. Układy wielkiej skali integracji, 
szczególnie zouaowane z tranzystorów MOS, zawie¬ 
rają prawie wyłącznie elementy czynne (np. oporniki 
zajmują zbyt dużą powierzchnię krzemu, szczególnie 
te, które mają wartość powyżej 10 kD). 

Poza układami monolitycznymi, produkuje się 
w dość ograniczonym zakresie układy scalone cienko- 
i grubowarstwowe oraz hybrydowe. Układy cienko¬ 
warstwowe wytwarza się przez naparowanie elemen¬ 
tów oraz połączeń między nimi w odpowiednich 
miejscach podłoża (szklana lub ceramiczna płytka) 
w postaci cienkich warstw różnych materiałów (nie- 
półprzewodników). Układy grubowarstwowe wyko¬ 
nuje się przy użyciu past przewodzących metodą dru¬ 
ku sitowego. Układy hybrydowe stanowią połączenie 
techniki monolitycznej i warstwowej, gdyż składają się 
z dyskretnych półprzewodnikowych elementów czyn¬ 
nych, a nawet układów mikroelektronicznych doluto- 
wanych do połączeń będących ścieżkami cienkich 
warstw metalu naparowanych na ceramicznym po¬ 
dłożu. Oporniki i kondensatory w układach hybrydo¬ 
wych są wytworzone, podobnie jak połączenia, w po¬ 
staci cienkich warstewek odpowiedniego materiału, 
naparowanych na podłoże. 

Układy hybrydowe stanowią niewielki procent 
wszystkich produkowanych na świecie układów scalo¬ 
nych. Stosowane są one jako wzmacniacze dużych 
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mocy do 100 W, przetworniki analogowo-cyfrowe 
i cyfrowo-analogowe o dużej dokładności. Wytwarza 
się je na specjalne zamówienia. Układy warstwowe 
mają dziś znaczenie raczej historyczne i stanowią jedy¬ 
nie niewiele znaczący margines. 

Monolityczne układy scalone podzielić można ogól¬ 
nie na wytwarzane techniką elementów bipolarnych 
oraz elementów unipolarnych, przy czym ostatnio 
zaznacza się tendencja do łączenia tych technik. 


Układy scalone bipolarne 

Elementami czynnymi w scalonych układach bipo¬ 
larnych są tranzystory bipolarne, tzn. dwuzłączowe 
elementy n-p-n (rzadziej p-n-p), których nazwa zwią¬ 
zana jest z faktem, że udział w przewodzeniu prądu 
biorą nośniki ładunku obu rodzajów, tj. elektrony 
i dziury. Przekrój przez strukturę typowego tranzy¬ 
stora n-p-n w układzie scalonym ukazuje rys. 1. 


warstwa epitaksjalna 

izolacja \ emiter baza 


kolektor 

Al / Si0 2 



poęlłoźe 


warstwa pod kolektorowa 
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Rys. 1. Tranzystor n-p-n w układzie scalonym 


Przykładowy proces wytwarzania płytek z układami 
scalonymi przebiega następująco: płytka krzemu 
monokrystalicznego o przewodnictwie typu p (płytka 
podłożowa) jest szlifowana, polerowana i trawiona 
chemicznie w celu usunięcia wszelkich nierówności 
powierzchni, oczyszczenia jej i nadania idealnej gład¬ 
kości i równoległości płaszczyzn. Następnie cała po¬ 
wierzchnia płytki zostaje utleniona w celu wytworze¬ 
nia tzw. maski tlenkowej. Taka warstwa tlenku (ma- maska 
ska) skutecznie zapobiega przedostawaniu się atomów 
pierwiastka użytego jako domieszka w procesie dy¬ 
fuzji do obszaru krzemu znajdującego się pod nią. 

Obszary krzemu, do których chcemy wprowadzić daną 
domieszkę, zostają odsłonięte w procesie trawienia 
fotolitograficznego. 

Na płytkę krzemu nakłada się emulsję światłoczułą, 
przesłania się ją maską w postaci szklanej płytki po- proces foto- 
krytej czarną emulsją, na której • wytworzone są litograficzny 
w skali 1:1 wzory geometryczne stanowiące topogra¬ 
fię struktury układu scalonego i się ją naświetla. Na¬ 
stępnie się emulsję światłoczułą wywołuje. Z miejsc 
nie naświetlonych emulsję, wraz ze znajdującym się 
pod nią tlenkiem, usuwa się za pomocą odpowiednich 
rozpuszczalników. Opis powyższy dotyczy tzw. emul¬ 
sji negatywowej. Stosowana jest także emulsja pozy¬ 
tywowa, przy użyciu której warstwa tlenku zostaje 
usunięta z obszarów naświetlonych. Każdy z tych 
rodzajów emulsji ma swoje określone cechy i wybór 
jednej z nich podyktowany jest określonymi wymaga¬ 
niami technologicznymi. 

Opisana powyżej technika trawienia fotolitograficz¬ 
nego stosowana jest przy wytwarzaniu wszystkich 
obszarów dyfuzyjnych w krzemie (w strukturze). Jako wytwarzanie 
pierwsze wytwarzane są tzw. warstwy podkolektoro- warstw 
we (zagrzebane, ang. Buried Layer). podkolekto- 

Obszary warstw podkolektorowych, a także obsza- rowych 
ry baz i emiterów tranzystorów, oraz obszary izolują- 
ce poszczególne elementy układu, są wytwarzane za j ^ - J 
pomocą procesu dyfuzji w ciele stałym. Płytki umiesz- 
czone zostają w piecu o specjalnej konstrukcji, utrzy¬ 
mującym temperaturę rzędu 1000°C z dokładnością 
do 0,5°C. Do pojemnika zawierającego płytki wpro¬ 
wadza się w odpowiedni sposób gaz (wodór lub azot) 
unoszący atomy odpowiedniego pierwiastka chemicz¬ 
nego, stanowiącego domieszkę dla materiału półprze- 
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wodnikowego, jakim jest krzem. W celu wytworzenia 
obszarów o typie przewodnictwa n stosuje się w tech¬ 
nologii układów scalonych arsen, antymon i fosfor; 
natomiast do wytworzenia obszarów o typie przewod¬ 
nictwa p stosuje się bor. Atomy pierwiastka domiesz¬ 
kującego osiadają na płytkach i wnikają w krzem 
w miejscach odsłoniętych (tzw. okna tlenkowe) w pro¬ 
cesie trawienia fotolitograficznego, tworząc obszary 
o wymaganym typie przewodnictwa, a pomiędzy nimi 
złącza p-n. Oczywiście wprowadzone atomy domieszki 
nie naruszają budowy krystalicznej półprzewodnika. 

Warstwy podkolektorowe są obszarami o przewod¬ 
nictwie typu n t silnie domieszkowanymi, a więc mają¬ 
cymi niski opór. Wytwarzane są one w takich miej¬ 
scach, że obszary baz tranzystorów n-p-n znajdą się 
dokładnie nad nimi. Zadaniem warstw podkolektoro- 
wych jest usprawnienie transportu nośników prądu 
(zmniejszenie oporu obszaru łączącego). Uzyskane 
dzięki temu zmniejszenie oporu kolektorów powoduje 
polepszenie wzmacniających właściwości tranzystora, 
zmniejszenie napięcia nasycenia tranzystora, zmniej¬ 
szenie pasożytniczej pojemności pomiędzy kolektorem 
a podłożem, czyli „masą” układu, ograniczającej 
częstość pracy układu. 

Po wytworzeniu warstw podkolektorowych usu¬ 
nięty zostaje tlenek z całej powierzchni płytki i zostaje 
ona przygotowana do następnego procesu technolo¬ 
gicznego, to jest do osadzania warstwy epitaksjalnej. 
Proces epitaksji polega na takim osadzaniu atomów 
(krzemu) z fazy gazowej na monokrystalicznym podło¬ 
żu struktury, aby powstająca warstwa wiernie i bez 
zniekształceń zachowała budowę krystaliczną podło¬ 
ża. Podwyższona temperatura procesu (rzędu 1200°C) 
nadaje atomom osiadającym na podłożu pewną zdol¬ 
ność przemieszczania się, co ułatwia im zajmowanie 
miejsc określonych przez budowę krystaliczną krze¬ 
mu, a więc umożliwia wytworzenie warstwy będącej 
kopią podłoża. Wysoka temperatura procesu epi¬ 
taksji powoduje także ruch atomów domieszkujących 
warstwę podkolektorową, co w efekcie daje wybrzu¬ 
szenie w głąb warstwy epitaksjalnej. 

W wytworzonej warstwie epitaksjalnej znajdować 
się będą wszystkie elementy czynne i bierne układu, 
zachodzi więc konieczność wzajemnego ich odseparo¬ 
wania. W tym celu odsłonięte za pomocą procesu 
fotolitograficznego obszary warstwy epitaksjalnej do¬ 
mieszkuje się dyfuzyjnie tak, aby wytworzyły się 
obszary izolacyjne o przewodnictwie typu p łączące 
się z podłożem. Pozostałe obszary — o typie n — 
mają wtedy kształt odizolowanych wysp. W gotowym 
układzie scalonym obszary izolujące zostają przyłą¬ 
czone do najniższego potencjału, zaś obszary wysp — 
do potencjału najwyższego. W ten sposób poszczegól¬ 
ne wyspy zostają wzajemnie oddzielone przez zapo¬ 
rowo spolaryzowane złącza p-n. Ze względu na rodzaj 
zastosowanej izolacji układy takie nazywane są ukła¬ 
dami z izolacją złączową. Nie jest to optymalny rodzaj 
izolacji zarówno ze względu na zajmowaną powierzch¬ 
nię płytki, jak i na jej jakość (prądy upływu, napięcie 
przebicia, pojemności pasożytnicze); jednakże z po¬ 
wodu najłatwiejszego wytwarzania jest on w chwili 
obecnej powszechnie stosowany. 

Po otrzymaniu odseparowanych obszarów, następ¬ 
nym krokiem prowadzącym do otrzymania układu 
scalonego jest wytworzenie poszczególnych jego ele¬ 
mentów. W tym celu po otwarciu odpowiednich okien 
tlenkowych do obszaru warstwy epitaksjalnej wpro¬ 
wadza się dyfuzyjnie taką domieszkę, aby część tych 
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Rys. 2. Opornik w układzie scalonym 


obszarów zmieniła typ przewodnictwa na p 9 tworząc 
w ten sposób bazy tranzystorów n-p-n. Jednocześnie 
w tym samym procesie wytwarza się oporniki w po¬ 
staci pojedynczych pasków o określonej szerokości 
i długości (rys. 2). 

Emitery tranzystorów powstają przez wytworzenie 
w części obszarów baz obszarów o przewodnictwie mnr j 

typu n . Obszar emitera jest domieszkowany silniej od \\J ^ w 
obszaru bazy dla uzyskania większego wzmocnienia j j 

prądowego tranzystora, ma więc znacznie niższy opór. 

Właściwość tę czasem wykorzystuje się do otrzymy¬ 
wania oporników o małych wartościach oporu. 

W tym samym procesie powstaje silnie domieszkowa¬ 
ny obszar typu n w miejscu, gdzie następnie będzie 
wykonany kontakt kolektorowy do warstwy epitak¬ 
sjalnej. Poprawia to znacznie właściwości kontaktu. 

W układzie monolitycznym można wytworzyć dwa 
rodzaje tranzystorów p-n-p: tzw. tranzystor boczny, 
czyli lateralny, oraz tranzystor podłożowy, czyli wer¬ 
tykalny. Tranzystor boczny, pokazany na rys. 3a, 
wytwarzany jest w ten sposób, że jego emiter i kolek¬ 
tor wykonuje się jednocześnie z bazami tranzystorów 
n-p-n, w związku z czym bazę takiego tranzystora 
stanowi warstwa epitaksjalna, a oba złącza, kolekto¬ 
rowe i emiterowe, mają tę samą głębokość. W tran¬ 
zystorach tych, podobnie jak w wypadku kolektora 
tranzystora n-p-n wytwarza się silnie domieszkowany 


wytwarzanie 

emiterów 


4- 1 


tranzystor 

boczny 

(lateralny) 


warstwa epitaksjalna 



Rys. 3. Tranzystor p-n-p w układzie scalonym: a) boczny, b) po¬ 
dłożowy 


obszar dyfuzyjny typu n y ułatwiający kontakt do war¬ 
stwy epitaksjalnej — bazy. W takim tranzystorze 
przepływ nośników w obszarze bazy odbywa się w 
kierunku równoległym do powierzchni struktury. 

Współczynnik wzmocnienia prądowego takiego tran¬ 
zystora oraz maksymalna częstość jego pracy są 
znacznie mniejsze niż dla tranzystora n-p-n. 

Nieco lepsze parametry mają tranzystory podłożowe tranzystor 
(rys. 3b), które powstają z pasożytniczego tranzystora podłożowy 
p-n-p , składającego się z emitera (obszar typu p 9 (wertykalny) 
w którym dodatkowo wytwarza się obszar typu n , 
silnie domieszkowany), obszaru n warstwy epitak¬ 
sjalnej oraz podłoża (typu p) będącego kolektorem 
tranzystora. Tranzystory podłożowe mogą pracować 
tylko w układzie ze wspólnym kolektorem, co stanowi 
poważne ograniczenie ich zastosowania. 

Diody w układzie scalonym są uzyskiwane przez wytwarzanie 
wykorzystanie złącza p-n pomiędzy obszarami baz diod i kon- 
i emiterów (złącze emiter-baza ma lepszą charakte- densatorów 
rystykę w kierunku przewodzenia od złącza kolek- 
tor-baza). Natomiast kondensatory w układzie scalo¬ 
nym można otrzymywać wykorzystując pojemność 
złącza p-n lub też jako struktury MOS, gdzie jedną 
okładkę kondensatora stanowi np. dyfuzyjna war¬ 
stwa o przewodnictwie typu n (emiter), drugą okład¬ 
kę — warstwa aluminiowa, zaś dielektrykiem jest 
warstwa tlenku krzemu Si0 2 . 
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Jak widać z powyższego przeglądu, technologia 
planarna umożliwia uzyskanie następujących ele¬ 
mentów układu scalonego: 1) tranzystorów n-p-n 
cechujących się w zależności od potrzeb częstością 
maksymalną pracy rzędu 500 MHz lub mocą rzędu 
kilku watów, 2) diod, 3) oporników o oporze od kil¬ 
kudziesięciu Q do kilkuset kQ, 4) kondensatorów 
o wartościach rzędu kilkudziesięciu pF, 5) tranzy¬ 
storów p-n-p o współczynnikach wzmocnienia prą¬ 
dowego rzędu 10 i częstościach granicznych rzędu 
kilku MHz. 

Gdy wszystkie elementy układu scalonego są już 
wytworzone, należy wykonać odpowiednią sieć po¬ 
łączeń elektrycznych pomiędzy nimi. Cała płytka zo¬ 
staje przykryta warstwą tlenku. W procesie fotolito¬ 
graficznym zostają wytworzone okna tlenkowe 
w miejscach, gdzie mają powstać kontakty elektrycz¬ 
ne. Następnie na całą płytkę zostaje nałożona war¬ 
stwa aluminium, z której po nowym procesie fotoli¬ 
tograficznym pozostają tylko ścieżki metaliczne sta¬ 
nowiące połączenia pomiędzy poszczególnymi ele¬ 
mentami układu. 

Dalsze etapy otrzymywania bipolarnych układów 
scalonych, tzn. sprawdzanie i obudowa są podobne, 
jak w wypadku niżej opisanych unipolarnych ukła¬ 
dów scalonych. 


Układy unipołarne 

Funkcję analogiczną do tej, jaką w bipolarnych ukła¬ 
dach scalonych spełniają tranzystory n-p-n, w ukła¬ 
dach unipolarnych pełnią tranzystory połowę typu 
MOS (metal-tlenek-półprzewodnik, ang. Metal- 
Oxide-Semi-Conductor Field-Effect-Trcmsistor, MOS- 
FET). Proces technologiczny produkcji układów 
scalonych typu MOS jest zasadniczo identyczny 
z opisanym poprzednio procesem technologii planar¬ 
nej scalonych układów bipolarnych, z tą różnicą, że 
potrzebny jest tylko jeden proces dyfuzji, w którym 
wykonywane są zarówno źródło jak i dren (rys. 4) 
tranzystora MOS. 
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Rys. 4. Tranzystor MOS w układzie scalonym: a) tranzystor 
z bramką metalową, b) tranzystor z bramką krzemową 


Powierzchnię odpowiednio przygotowanej płytki 
monokrystalicznego krzemu utlenia się. Następnie 
w procesie fotolitograficznym odsłania się obszary, 
w których mają być tranzystory MOS. Po czym na¬ 
kłada się na część tych obszarów nową warstwę tlen¬ 
ku, ale znacznie cieńszą od pierwotnej. Cienkie war¬ 
stwy tlenku pokrywa się z kolei polikrystalicznym 
krzemem odpowiednio domieszkowanym w celu 
uzyskania dobrej przewodności elektrycznej. W ten 
sposób uzyskuje się bramki tranzystorów MOS. 
Przykładane do bramki napięcie wywołuje w obszarze 
pod nią (w tzw. kanale) pole elektryczne, którym 
można wpływać na prąd elektryczny płynący przez 
tranzystor MOS. 

Bramka jest więc elektrodą sterującą i spełnia 
funkcję analogiczną do tej, którą w lampie próżnio¬ 
wej spełnia siatka sterująca. Istnieje kilka typów 


tranzystorów MOS, różniących się między sobą spo¬ 
sobem wytwarzania bramki. 

W następnym etapie procesu wytwarzania tranzy¬ 
storów MOS w układzie scalonym uzyskana bramka 
krzemowa służy jako maska osłaniająca kanał. Za¬ 
letą takiej technologii jest znaczne zmniejszenie po¬ 
jemności pasożytniczych, a także ułatwienie procesu 
fotolitograficznego. Bramki z polikrystalicznego 
krzemu można także wykorzystać jako dodatkowe 
połączenia elementów układu scalonego (szczególnie 
przydatne, gdy trzeba stosować połączenia skrzyżo¬ 
wane). Niekiedy wykonuje się bramki z trudno topli- 
wego metalu, jak molibden lub tytan, co polepsza 
pewne właściwości tranzystorów MOS, lecz technolo¬ 
gia ta jest znacznie kosztowniejsza. 

Nie przesłonięte bramką obszary tranzystora, tzw. 
źródło i dren, domieszkuje się w jednym procesie 
dyfuzji, a więc mają one taki sam typ przewodnictwa. 

W pojedynczym tranzystorze MOS w zależności 
od przyłożonego napięcia źródło nośników ładunku 
może być drenem, czyli ujściem prądu, natomiast 
w układzie scalonym zawsze spełnia tę samą funkcję. 

Standardowe tranzystory MOS z bramką metalową 
wykonuje się najczęściej z aluminium, ale wtedy ulega 
zmianie, ze względu na niską temperaturę topnienia 
aluminium, kolejność wykonywania elementów. Naj¬ 
pierw w procesach fotolitograficznym i dyfuzyjnym 
otrzymuje się dreny i źródła, a następnie na cienką 
warstwę tlenku nakłada się warstwę aluminium (zob. 
il. 102, tabl. 25). 

Rozróżniamy dwa rodzaje tranzystorów MOS 
z kanałem typu n i z kanałem typu p. W tranzystorze 
z kanałem n nośnikami ładunku są elektrony, nato¬ 
miast w kanale p — dziury. W jednym układzie sca¬ 
lonym można wytwarzać oba rodzaje tranzystorów 
MOS. Układy takie, zwane komplementarnymi ukła¬ 
dami MOS (COS/MOS lub CMOS) mają wiele zalet, 
jak np. większą szybkość działania niż w zwykłych 
układach MOS, zmniejszone zużycie mocy, co jest 
szczególnie ważne w wypadku układów wielkiej skali 
integracji. 

W porównaniu z układami bipolarnymi, układy 
MOS mają mniejsze wymiary elementów czynnych 
i nie mają izolacji pomiędzy nimi, a więc są znacznie 
mniejsze. Wadami układów unipolarnych są: wol¬ 
niejsze działanie (pracują na niższych częstościach) 
i stosunkowo nieduża wartość prądów wyjściowych, 
co jest poważną wadą w dużych systemach cyfro¬ 
wych. 

W układach MOS praktycznie nie ma elementów 
biernych, w razie potrzeby mogą być wytworzone 
w identyczny sposób jak w układach unipolarnych. 
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Montaż i pomiary układów scalonych 

Z chwilą ukończenia procesów technologicznych 
wytwarzających układy scalone (unipolarne lub bipo¬ 
larne) w płytce półprzewodnikowej rozpoczyna się 
proces montażu. Jest on poprzedzony pomiarami 
parametrów elektrycznych każdego poszczególnego 
układu. 

Do odpowiednich punktów metalizacji doprowa¬ 
dzone są cienkie igły stanowiące część skomplikowa¬ 
nego systemu pomiarowego złożonego z zasilaczy 
prądowych i napięciowych oraz przyrządów pomia- program 
rowych, sterowanych określonym programem pomia- pomiarowy 
rowym. Program taki, złożony z wielu testów para¬ 
metrów prądowych i funkcjonalnych, jest tak ułożo¬ 
ny, że spełnienie wszystkich jego wymagań przez dany 
układ scalony daje duży stopień pewności, że układ 
taki po zamknięciu w obudowie będzie działał pra¬ 
widłowo. Układy nie spełniające wymagań programu 
są odpowiednio znakowane i odrzucane po podzie¬ 
leniu płytki. 

Sprawdzone układy scalone zamyka się w obudo¬ 
wach w celu mechanicznego zabezpieczenia, zapewnie¬ 
nia niezawodności działania i umożliwienia zainsta- 
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lowania ich w urządzeniach. Przedtem odpowiednie 
punkty metalizacji łączy się za pomocą złotych dru¬ 
cików o grubości 0,025 mm z zewnętrznymi wyprowa¬ 
dzeniami obudowy (il. 100, tabl, 25). Obudowane 
układy scalone podlegają dokładnej kontroli para¬ 
metrów układu; są to tzw. badania niezawodnościo¬ 
we, do których należy także np. sprawdzenie, jak 
działają układy po wygrzewaniu w temperaturze 
100°C przez 1000 godzin w czasie zasilania ich ener¬ 
gią elektryczną. 


Zastosowania układów scalonych 

Największe zastosowanie mają układy scalone 
komputery w komputerach, których rozwój stał się możliwy 
właśnie dzięki pojawieniu się układów scalonych. 
Cyfrowe układy scalone, głównie typu MOS, mogą 
być układami logicznymi, arytmetycznymi, procesora¬ 
mi, pamięciami, układami sterującymi urządzeniami 
peryferyjnymi (jak drukarki, dziurkarki, czytniki 
itp.). Układy scalone są podstawą działania kompu¬ 
terów, minikomputerów, mikrokomputerów, kalkula¬ 
torów i in. Kalkulator kieszonkowy firmy amerykań¬ 
skiej Hewlett-Packard, mający układ scalony (mikro¬ 
komputer) o wymiarach rzędu kilku mm 2 , wykonuje 
86 różnych operacji matematycznych, ma możliwość 
zapamiętania dowolnego programu obliczeniowego 
składającego się z 49 operacji. Ilustracja 9 (tabl. 3) 
mikrokom- przedstawia w powiększeniu strukturę obwodu scalo- 
putery nego mikrokomputera. Układy scalone znalazły też 
zastosowanie w centralach telefonicznych, maszynach 
do księgowania i operacji bankowych, w systemach 
sterowania produkcją, w kontroli przebiegu procesów 
chemicznych, w diagnostyce medycznej, w przyrzą¬ 
dach pomiarowych itp. 

Mikrokomputery, czyli miniaturowe maszyny ma¬ 
tematyczne, znajdują coraz szersze zastosowania tam, 
gdzie jeszcze kilka lat temu nie myślano o używaniu 
komputerów. Mikrokomputer sterujący sygnalizacją 
świetlną ruchu ulicznego będzie uwzględniał cha¬ 
rakterystykę poszczególnych skrzyżowań, lokalne 
przepisy, a także stale zmieniające się czynniki, 
jak natężenie ruchu, pora dnia i roku. Mikrokompu¬ 
tery stosowane w samochodach kontrolować będą: 
światła samochodu, stan hamulców i akumulatora, 
zapięcie pasów bezpieczeństwa przez jadących, sy¬ 
stem przeciwpoślizgowy, sterowanie zapłonem, regu¬ 
lację mieszanki paliwowej, zawartość szkodliwych 
telekomuni- składników w spalinach oraz zużycie paliwa. Rozwój 
kacja telekomunikacji, a szczególnie komunikacji satelitar¬ 
nej, nie byłby możliwy bez pojawienia się małych, 
niezawodnych, zużywających znikome ilości energii 
układów przetwarzających sygnały W sprzęcie woj¬ 
skowym, aparaturze samolotowej i kosmicznej ukła¬ 
dy scalone są coraz powszechniej stosowane ze wzglę¬ 
du na swą niezawodność i wykonywanie skompli¬ 
kowanych funkcji przy bardzo małym zużyciu 
mocy. 

przedmioty Także w sprzęcie przeznaczonym do powszechnego 
powszechne- użytku, jak radioodbiorniki, telewizory, magneto- 
go użytku fony, gramofony, bliski jest moment, gdy wszystkie 
funkcje elektroniczne przejęte zostaną przez wielo¬ 
funkcyjne układy scalone. Przykład zastosowania 
układów scalonych w sprzęcie radiowo-telewizyjnym 
ukazuje il. 97 (tabl. 24). Dzięki układom scalonym 
możliwa stała się produkcja zegarków elektronicz¬ 
nych niezwykle dokładnych (il. 10, tabl. 3), wyświetla¬ 
jących w postaci cyfr i liter godziny, minuty, sekundy, 
dzień tygodnia, miesiąc, a nawet różnicę stref czaso¬ 
wych i lata przestępne (zob. też il. 11, tabl. 3). 
wzmacniacze Istnieją także układy scalone, tzw. wzmacniacze 
operacyjne operacyjne, mogące wykonywać oprócz funkcji 
wzmacniania sygnałów, operacje matematyczne jak 
logarytmowanie, całkowanie, różniczkowanie. Można 
je zastosować jako części składowe złożonych, czułych 
systemów pomiarowych, przetwarzania sygnałów, 
analogowych maszyn matematycznych itp. 


Przyszłość układów scalonych 

Prace nad doskonaleniem układów scalonych prowa¬ 
dzone są wielokierunkowo. Ulepsza się istniejące 
technologie w celu podniesienia wydajności i obni- ulepszanie 
żenią cen układów scalonych. Uzyskuje się to głów- technologii 
nie przez stosowanie coraz większych płytek krzemo¬ 
wych (na których można zmieścić większą liczbę ukła¬ 
dów scalonych), powiększanie skali integracji, 
zmniejszenie obszarów poszczególnych elementów w 
układzie scalonym, zmniejszanie oddziaływań pasoży¬ 
tniczych, itp. Prowadzone są prace nad nowymi tech¬ 
nologiami otrzymywania układów scalonych, jak np. 
implantacja jonów, polegająca na wytwarzaniu żąda¬ 
nych obszarów w strukturze przez wprowadzenie ato¬ 
mów domieszek w głąb materiału za pomocą bombar¬ 
dowania jonami o dużej energii. Ogromne znaczenie 
ma rozwój nowych technik fotolitograficznych, po¬ 
zwalających na uzyskiwanie elementów o coraz mniej¬ 
szych rozmiarach, porównywalnych z długością fali 
światła widzialnego (np. opracowuje się procesy che¬ 
micznego trawienia plazmowego, pozwalające na 
zmniejszenie rozmiarów elementów poniżej 1 ^m). 

Prowadzone są też badania nad zastosowaniem pro¬ 
mieniowania rentgenowskiego lub wiązki elektronów 
do wytwarzania pożądanej topografii układu w mas¬ 
kach tlenowych. 

Oprócz prac zmierzających do opracowania 
ulepszonych bądź nowych procesów technologicznych, 
które mogą być wykorzystywane do wytwarzania 
układów scalonych w obecnej postaęi, trwają prace 
mające przynieść zupełnie nowe koncepcje konstruk¬ 
cyjne. Prace z dziedziny mikroelektroniki mają na celu układy 
budowę coraz bardziej złożonych układów scalonych, bardzie] 
spełniających coraz bardziej skomplikowane funkcje, złożone 
Układy takie muszą zawierać coraz więcej elementów 
i coraz poważniejszym ograniczeniem staje się ko¬ 
nieczność izolacji poszczególnych elementów układu 
scalonego rozpatrywanego jako zbiór tranzystorów, 
diod, oporników. Obecnie mj^śli się o wytwarzaniu 
takich układów, w których odpowiednie funkcje 
byłyby realizowane przez nośniki ładunku przepływa¬ 
jące w materiale półprzewodnikowym nie podzielo¬ 
nym na poszczególne obszary typu p i n, tworzące trady¬ 
cyjnie pojmowane tranzystory i diody. Przepływ ładu¬ 
nków elektrycznych byłby w odpowiedni spesób kon¬ 
trolowany przez przykładane potencjały elektryczne. 

Zwiastunem tej tendencji są układy o sprzężeniu układy 
ładunkowym (CCD, ang. Charge Coupled Devices\ CCD 
w których sygnał jest przenoszony przez ruch nośni¬ 
ków ładunku odpowiednio sterowanych oddziaływa¬ 
niem zewnętrznym w ciągłym ośrodku półprzewod¬ 
nikowym, bez wyraźnie określonych elementów czyn¬ 
nych. Już w tej chwili produkowane są pamięci o du¬ 
żej pojemności (16 kilobitów) w technice CCD. 

Układy takie otwierają niewątpliwie drogę nowej ro¬ 
dzinie przyrządów półprzewodnikowych — rodzinie 
bloków funkcjonalnych. 

W ten niezwykle szeroki zakres prac naukowo-ba¬ 
dawczych są zaangażowane wielkie zespoły naukow¬ 
ców i inżynierów dysponujących najnowocześniejszy¬ 
mi osiągnięciami elektroniki, fizyki, chemii i inżynierii 
materiałowej. W połowie lat osiemdziesiątych mają 
zostać wprowadzone do produkcji układy o bardzo 
wielkiej skali integracji (VLSI od ang. Very-Large układy 
Scalę Integra!ion) zawierające powyżej miliona ele- VLSI 
mentów czynnych, a zapowiedzią tego, co przyniosą 
najbliższe lata, może być fakt wyprodukowania 
w 1979 r. w laboratoriach firm japońskich pamięci pół¬ 
przewodnikowej o pojemności 1 Mb (1 milion bitów). 

A. Ambroziak Półprzewodnikowe układy scalone. Warszawa 
1966; K. Badźmirowski, J. Pieńkos, W. Piestrzyński Cyfrowe 
układy MOS-LSI, Warszawa 1979; M. Białko Układy mikro- 
elektroniczne , Warszawa 1969; J. Eimbinder Zastosowania linio¬ 
wych układów scalonych , Warszawa 1974; A. Filipkowski Mikro- 
elektroniczne układy scalone , Warszawa 1966; E. Keonjian 
Mikroelektronika , Warszawa 1967; Z. Kulka, M. Nadachow- 
ski Liniowe układy scalone i ich zastosowanie , Warszawa 1975; 

W. Marciniak Przyrządy półprzewodnikowe i układy scalone. 

Warszawa 1979; J. Millman, C. Halkias Układy scalone analo¬ 
gowe i cyfrowe, Warszawa 1976. 


629 




Generacja mikrofal 

Janusz Konopka 


Oddziaływanie promieniowania elektromagnetycz¬ 
nego z ośrodkami materialnymi jest jednym z podsta¬ 
wowych narzędzi badawczych fizyki. Spośród różnych 
zakresów widmowych mikrofale, a zwłaszcza fale 
milimetrowe i submilimetrowe (tzn. zakres fal od 
1 cm do 0,1 mm) były najdłużej niedostępne dla ba¬ 
dań — głównie z powodu trudności technicznych 
w ich wytwarzaniu. 

Prawdziwy rozwój techniki generacji fal centyme¬ 
trowych i milimetrowych nastąpił dopiero w ostatnim 
trzydziestoleciu, w ostatnim zaś dziesięcioleciu 
opanowano dziedzinę wytwarzania fal submilime- 
trowych, w ten sposób została wypełniona jedna z 
ostatnich „dziur” w paśmie generowanych spójnie fal 
od drgań podakustycznych do fal świetlnych. Należy 
podkreślić, że głównym stymulatorem rozwoju techni¬ 
ki mikrofal był radar i systemy radiokomunikacyjne. 

Ostatnie lata przyniosły również zasadnicze zmia¬ 
ny w sposobie generacji mikrofal. Poprzednio wszyst¬ 
kie typy oscylatorów mikrofalowych wykorzystywa¬ 
ły oddziaływanie wiązki elektronów w próżni z mikro¬ 
falowymi obwodami rezonansowymi (tzw. rezona¬ 
torami wnękowymi) przy ewentualnym dodatkowym 
przyłożeniu stałego pola magnetycznego. W 1963 r. — 
dzięki odkryciu J. B. Gunna — okazało się, że spójne 
drgania elektryczne w zakresie mikrofal mogą być 
emitowane przez pewne kryształy półprzewodnikowe, 
źródła W chwili obecnej do najważniejszych źródeł mikro- 
mikrofał fal zaliczyć należy ciągle jeszcze stosowane lampy 
mikrofalowe: klistrony, karcinotrony (lampy z falą 
wsteczną) i magnetrony, urządzenia półprzewodni¬ 
kowe: oscylator Gunna, zwany inaczej generatorem 
z przeniesieniem elektronów, oraz różne konstrukcje 
półprzewodnikowych diod lawinowych, a ostatnio 
także tranzystory bipolarne i tranzystory połowę. 

Artykuł niniejszy stawia sobie za cel omówienie 
zasad generacji mikrofal za pomocą najbardziej dziś 
popularnych i mających duże znaczenie praktycz¬ 
ne urządzeń, jakimi są klistron refleksowy i generator 
Gunna zbudowany na krysztale arsenku galu. 


Klistron refleksowy 

Próby podwyższenia częstości generacji oscylato¬ 
rów zbudowanych przy użyciu lamp elektronowych 
(triody i tetrody) wykazują, że istnieje pewna częstość 
graniczna, której nie można przekroczyć zmieniając 
konstrukcję czy też zmniejszając wymiary lamp. 
ograniczenia Jedną z przyczyn jest fakt, że powiększenie często- 
tamp elektro- ści rezonansowej obwodu oscylatora wiąże się ze 
nowych zmniejszaniem jego indukcyjności lub pojemności. 

Pojemność jednak nie może być mniejsza niż pojem¬ 
ność międzyelektrodowa lampy, graniczna zaś indu- 
kcyjność sprowadza się do indukcyjności doprowa¬ 
dzeń lampy plus indukcyjności najkrótszych połączeń 
między końcówkami elektrod. Drugą podstawową 
przyczyną istnienia częstości granicznej jest skoń¬ 
czony czas przelotu elektronów od katody do anody. 
Oscylatory triodowe nie mogą sprawnie pracować, 
jeśli ten czas przelotu przekracza choćby tylko małą 
część, np. 7io okresu oscylacji, niezależnie od tego, ja¬ 
kie się poczyni modyfikacje w elementach czy dostro¬ 
jeniu obwodu rezonansowego. 

Wymienione trudności nie występują w innego typu 
lampach, tzw. klistronach. Cechą wyróżniającą kli¬ 
strony spośród pozostałych lamp elektronowych jest 
specjalna metoda, za pomocą której napięcie wej¬ 
ściowe kontroluje ruch elektronów w lampie. W od¬ 
różnieniu od zwyczajnych lamp, w których elektroda 
sterująca (siatka) określa liczbę elektronów przelatu¬ 
jących od katody do anody w jednostce czasu, na¬ 
pięcie wejściowe w klistronie oddziałuje jedynie na 


prędkość lotu elektronów przy niezmienionej ich 
liczbie. Z tego względu klistrony nazywane są lampami 
z modulowaną prędkością. 

Istnieje wiele typów klistronów w zależności od ich 
przeznaczenia, zakresu częstości i dostarczanej mocy. 

Do najbardziej znanych należą: klistron dwuwnęko- 
wy, stosowany na ogół jako wzmacniacz i generator 
wielkich mocy, oraz najpopularniejszy dotychczas 
generator mikrofal, klistron refleksowy. budowa 

Klistron refleksowy przedstawiony jest schematycz- klistronu 
nie na rys. 1. Jak widać, przestrzeń katoda-siatka, 
która w zwyczajnych lampach elektronowych kontro- 



Rys. 1. Klistron refleksowy w przedstawieniu schematycznym. 
W obszarze niebieskim panuje próżnia typowa dla lamp elek¬ 
tronowych (10~* Pa). Zasilacz rezonatora dostarcza napięcia 
przyspieszającego elektrony. Napięcie to musi być stabilne i za¬ 
wiera się w granicach od 300 do 5000 V przy prądach od 10 mA 
wzwyż, zależnie od typu klistronu. Zasilacz reflektora wytwarza 
pole elektrostatyczne hamujące elektrony. Zasilacz pracuje bez- 
prądowo przy napięciach od 100 do 1000 V zależnie od typu 
klistronu. Musi on być niezwykle stabilny, gdyż decyduje o sta¬ 
bilności częstości drgań mikrofalowych wytwarzanych przez kli¬ 
stron. Napięcie żarzenia wynosi na ogół 6,3 V przy prądach od 
0,6 do 3 A 

luje prąd anodowy, została tu zastąpiona przez trzy 
oddzielne obszary. Każdy z obszarów pełni inną funk¬ 
cję, można więc mówić o swoistym podziale pracy. 
Obszar pierwszy, rozciągający się od katody do rezo¬ 
natora wnękowego, wykorzystywany jest do nadania 
elektronom pełnego przyspieszenia w stałym polu elek¬ 
trycznym o natężeniu E rzędu wielu tysięcy woltów 
na metr. Drugi obszar stanowi przewężenie cylin¬ 
drycznego lub toroidalnego rezonatora wnękowego 
i jest przysłonięty najczęściej metalową siatką, przez 
którą mogą swobodnie przelatywać elektrony. Obszar 
ten nazywamy szczeliną rezonatora lub szczeliną w.cz. 
(wielkiej częstości). Nie ma tutaj pól stałych, jest na¬ 
tomiast zmienne pole elektryczne o częstości własnej 
rezonatora wnękowego. 

Tu można sobie zadać pytanie, skąd się bierze pole 
wielkiej częstości w rezonatorze? Jaki jest początek 
procesu generacji mikrofal? Odpowiedź na to pytanie 
trudno jest znaleźć w podręczniku czy monografii 
traktującej opisywany w tym rozdziale temat. Wy¬ 
nika to zapewne z faktu, że za istotne uważa się za¬ 
zwyczaj to, co się dzieje w tzw. stanie ustalonym. 
Trwa on poniżej 1 jis i jest bardzo trudny do zaobser¬ 
wowania. 
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Proces narastania pola elektromagnetycznego w re¬ 
zonatorze klistronu, jeśli pominąć pole szumów ter¬ 
micznych, związany jest z przelotem przezeń pierw¬ 
szych ładunków elektrycznych, które zdąży wyemi¬ 
tować katoda. Szybko poruszający się elektron sta¬ 
nowi impuls prądu elektrycznego o czasie trwania 
równym czasowi przelotu przez szczelinę rezonatora. 
Energia takiego impulsu jest sumą energii drgań 
o wielu częstościach. Im krótszy impuls, tym wyższe 
częstości są w nim zawarte (lub jak się czasem mówi — 
tym szersze jest jego widmo fourierowskie). Łatwo 
więc znaleźć w tym widmie również częstości własne 
rezonatora. Wiemy następnie, że rezonator raz po¬ 
budzony wykonuje, jak potrącona palcem struna, 
wiele okresów drgań. W ten sposób powstaje pole elek¬ 
tromagnetyczne, które może wpływać na ruch elek¬ 
tronów przelatujących przez rezonator w czasie 
późniejszym, jak to opisano w dalszej części tego roz¬ 
działu. Pole eletromagnetyczne zmienia kierunek co 
pół okresu drgań rezonatora, może więc przyspieszać 
bądź opóźniać elektrony. W obszarze tym mamy za¬ 
tem do czynienia z modulacją prędkości elektronów. 
Szerokość szczeliny jest bardzo mała, na ogół nie prze¬ 
kracza 100 pm. 

Trzeci obszar, rozciągający się od zewnętrznej 
okładziny rezonatora do tzw. reflektora, zwany jest 
obszarem unoszenia lub przestrzenią odbijającą. 
Sam reflektor jest elektrodą w postaci metalowego 
krążka i połączony jest ze źródłem napięcia ujemnego 
w stosunku do katody. Wytwarza więc pole elektrycz¬ 
ne silnie hamujące elektrony. Z reguły elektrony 
zawracają w kierunku szczeliny wielkiej częstości nie 
osiągnąwszy elektrody reflektora. W obszarze tym nie 
ma pól zmiennych i na wszystkie elektrony — nie¬ 
zależnie od prędkości, jaką mają przy wejściu do ob¬ 
szaru unoszenia — działa jednakowa siła, równa co 
do wielkości iloczynowi ładunku i natężenia pola, eE. 
Ponieważ prędkości elektronów przy wejściu w prze¬ 
strzeń odbijającą są różne, występuje efekt grupowania 
czy też paczkowania elektronów. Proces ten, zasadni¬ 
czy dla pracy klistronu, wymaga bliższego omówienia. 

Elektrony o największej prędkości dolatują naj¬ 
bliżej reflektora i potrzebują najdłuższego czasu, 
aby powrócić do szczeliny rezonatora. Odwrotnie 
jest z elektronami wchodzącymi w obszar unoszenia 
z prędkością najmniejszą. W ten sposób paczka tworzy 
się wokół elektronu przechodzącego przez szczelinę 
rezonatora w chwili, gdy pole w.cz. zmienia się z przy¬ 
spieszonego na opóźniające. 

Ruch elektronów jest analogiczny do ruchu kul 
wyrzuconych w górę przeciw siłom ziemskiego pola 
grawitacyjnego. Kula wyrzucona z dużą prędkością 
wzniesie się wyżej niż kula wyrzucona z prędkością 
mniejszą i będzie potrzebować dłuższego czasu, aby 
dotknąć z powrotem powierzchni Ziemi. W ten spo¬ 
sób kilka kul wyrzuconych w różnych momentach 
z różnymi prędkościami może upaść równocześnie na 
Ziemię. 

Przy pierwszym przejściu przez szczelinę rezonatora 
liczba elektronów przyspieszanych, tzn. pobierają¬ 
cych energię od pola w.cz., jest średnio taka sama jak 
liczba elektronów opóźnionych, tzn. oddających ener¬ 
gię polu w.cz. Bilans energetyczny jest więc równy 
zeru. Przy powrocie do szczeliny rezonatora, tzn. po 
procesie paczkowania, bilans energetyczny może być 
dodatni lub ujemny, zależnie od tego, czy paczka bę¬ 
dzie spowolniona czy przyspieszona przez pole. Oczy¬ 
wiście największy zysk energii oscylacyjnej, a tym 
samym maksimum generowanej przez klistron mocy 
mikrofalowej, wystąpi, gdy środek paczki przecho¬ 
dzić będzie przez szczelinę w momencie największego 
spowolnienia. 

Łatwo wykazać, że maksima mocy mikrofal gene¬ 
rowanej przez klistron wystąpią wówczas, gdy czas 
przebywania elektronów w przestrzeni odbijającej 
wynosić będzie n+ z U okresu drgań rezonatora. Wy- 
dedukować to można również dla n — 0 na podsta¬ 
wie rys. 2. 



Rys. 2. Wykresy obrazujące proces grupowania się elektronów 
w klistronie refleksowym. Dolny wykres obrazuje prędkość po¬ 
numerowanych elektronów (/, 2, J, ...) w czasie opuszczania 
szczeliny rezonatora, tj. przy wejściu w obszar unoszenia. Wy¬ 
kres górny pokazuje lot tych samych elektronów w obszarze uno¬ 
szenia w funkcji czasu, aż do powrotu do szczeliny rezonatora. 
Elektron 4, nie przyspieszany przez pole w.cz., powraca razem 
z elektronami 3 i 5 po upływie około 3 / 4 okresu drgań rezonatora. 
Elektrony te są silnie spowalniane przez pole w.cz., a tracona 
przez nie energia kinetyczna przemienia się w energię oscylacji 
mikrofalowych 


Czas przebywania elektronów w przestrzeni odbi¬ 
jającej regulować można bezpośrednio, za pomocą 
zmian napięcia reflektora, lub pośrednio — przez 
zmianę napięcia przyspieszającego. 

Chociaż spełnienie warunku na czas przejścia jest 
konieczne do uzyskania oscylacji, nie oznacza to, że 
warunek ten jest dostateczny. Jeśli liczba elektronów 
przelatujących przez szczelinę w jednostce czasu, czyli 
inaczej mówiąc — prąd wiązki elektronów jest zbyt 
mały, energia dostarczana przez „małe” paczki elek¬ 
tronów może nie być dostateczna do przezwyciężenia 
strat energii w samym obwodzie rezonatora i strat 
wynikających ze sprzężenia rezonatora ze światem 
zewnętrznym (obciążeniem). Zatem przekroczenie 
pewnego minimum prądu wiązki jest drugim koniecz¬ 
nym warunkiem otrzymania oscylacji. Gdy obydwa 
warunki są spełnione, klistron dostarcza energii mi¬ 
krofal do obciążenia. 

Czas przejścia elektronów przez obszar unoszenia czas^ 
zależy, jak już wspomniano, od napięcia reflektora przejścia 
Kri napięcia przyspieszającego V 0 . Oscylacje powstaną elektronów 
przy pewnych przedziałach wartości tych parame¬ 
trów. Przedziałom tym można przypisać określoną 
liczbę całkowitą n, która jest miarą czasu przebywa¬ 
nia elektronów w przestrzeni odbijającej, liczonego 
w okresach drgań własnych rezonatora. Oscylacje od¬ 
powiadające różnym n zwane są modami, trybami 
lub rodzajami pracy klistronu (nie należy ich mylić 
z rodzajami drgań występujących we wnękach rezo¬ 
nansowych). 
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mody pracy Mody pracy typowego klistronu refleksowego ge- 
kfistronu nerującego falę długości 1 cm przedstawione są na 
rys. 3. Należy dodać, że rozkład i szerokość poszcze¬ 
gólnych modów zależy również od konstrukcji kli¬ 
stronu (geometrii szczeliny rezonatora i przestrzeni 
odbijającej oraz od częstości). Z rys. 4 widać, że za¬ 
równo moc, jak i częstość w dużym stopniu zależy 
od napięcia reflektora. Na rys. 5 przedstawiono spo¬ 
soby modulacji mikrofal generowanych przez kli- 
stron w granicach pojedynczego modu — pokazano 
zarówno modulację amplitudy (AM), jak i modulację 
częstości (FM). Możliwość łatwej modulacji ma za¬ 
sadnicze znaczenie przy zastosowaniu klistronów. 



napięcie przyspieszające U 0 

Rys. 3. Wykres modów pracy typowego klistronu refleksowego 
na zakres fal 1 cm. Obszary szare odpowiadają przedziałom 
oscylacji dla poszczególnych modów n od 4 do 11. (Praca urzą¬ 
dzenia w obszarze poniżej linii przerywanej prowadziłaby do 
uszkodzenia reflektora przez bombardujące elektrony) 
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Rys. 4. Wykresy mocy generowanej przez klistron dla modów 
4, 5, 6, 7 z rys. 3 przy ustalonym napięciu przyspieszającym 
1000 V. Na dole— odchylenie (dewiacja) częstości generowanej 
od częstości odpowiadającej maksimum mocy dla danego modu 
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Rys. 5. "Sposoby modulacji mikrofal generowanych przez klistron 
refleksowy: a) modulacja amplitudy (AM) przy ustalonej czę¬ 
stości/możliwa jest tylko za pomocą fali prostokątnej; b) mo¬ 
dulacja częstości (FM). Gdy dewiacja jest niewielka (rzędu kilku 
MHz) częstość / jest proporcjonalna do napięcia modulującego 
przy prawie stałej mocy P 
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Moc mikrofal generowanych przez klistron w ra¬ 
mach danego modu zależy również w znacznym stop¬ 
niu od sprzężenia z obwodami zewnętrznymi, czyli 
z obciążeniem. Wpływ obciążenia na kształt modu 
ilustruje rys. 6. Przy słabym sprzężeniu (obciążeniu) 



Rys. 6. Wpływ obciążenia na kształt modu klistronu refleksowego 
i dewiację częstości dla punktów połowy mocy: a) obciążenie 
zbyt wielkie; b) obciążenie optymalne; c) obciążenie za małe 


rezonator klistronu ma większą dobroć, mod jest 
szeroki, a zmiany częstości przy zmianach V r są 
w okolicy maksimum mocy nieznaczne. Oczywiście 
moc dostarczana przez klistron jest wówczas również 
mała. Przy zwiększaniu sprzężenia przechodzi się 
przez obszar, gdzie mod jest jeszcze dość szeroki, 
a dostarczana moc — duża. Dalsze zwiększanie sprzę¬ 
żenia z rezonatorem prowadzi do spadku mocy 
i znacznego zwężenia modu przy dużych niestabil- 
nościach częstości, wynikających przede wszystkim 
z małej dobroci silnie obciążonego rezonatora. 

Rozważania powyższe obrazuje prosta zależność 
ilościowa, wiążąca zmiany częstości pracy klistronu 
z odchyleniami fazy <p paczki elektronów powracają¬ 
cych do szczeliny rezonatora od fazy optymalnej 
<p = 0 dla mocy maksymalnej oraz z dobrocią rezo¬ 
natora Q (czyli stosunkiem energii elektromagnetycz¬ 
nej w nim nagromadzonej do sumy energii strat): 
4/7/ = tg<p/2Q . 

Klistron refleksowy ma stosunkowo małą sprawność 
przetwarzania energii prądu stałego na energię mi¬ 
krofal. Sprawność ta nie przekracza na ogół kilku % 
i jest mniejsza dla klistronów małej mocy. Zależy ona 
od napięć zasilających i częstości oraz od ukształto¬ 
wania geometrycznego klistronu. Sprawność klistro¬ 
nów na fale milimetrowe nie sięga zazwyczaj 1%. 

Do dziś nie powiedziano jeszcze ostatniego słowa, 
jak krótkie fale może generować klistron refleksowy. 
Modele wytwarzane seryjnie generują fale ok. 1 mm 
przy mocach kilku miliwatów. Największą wadą kli¬ 
stronów refleksowych jest wąski zakres przestrąjania 
mechanicznego i elektronicznego (na ogół nie prze¬ 
kracza kilkunastu procent). Dużą niedogodnością 
jest również konieczność stosowania skomplikowa¬ 
nych zasilaczy, dostarczających trzech stabilnych na¬ 
pięć. Napięcie przyspieszające, które w klistronach 
na fale milimetrowe jest rzędu kilku kV, i napięcie 
reflektoia muszą być bardzo dokładnie stabilizowane. 

W zakresie fal poniżej 1 mm jedynymi lampami 
mikrofalowymi mającymi znaczenie praktyczne są 
tzw. lampy z falą wsteczną, zwane inaczej karcino- 
tronami. Dzięki nim osiągnięto zawrotną granicę ge¬ 
neracji fali ok. 0,3 mm długości, a więc zbliżoną do 
częstości pracy lasera cyjanowodorowego (HCN). 


Generator Gunna 

Jeszcze przed kilku laty wykorzystanie tranzystorów 
do generacji mikrofal ograniczone było do zakresu 
poniżej 1 GHz. Obecnie w układach tranzystorowych 
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osiąga się częstość generacji ok. 30 GHz, a przy 
10 GHz uzyskuje się moce rzędu 100 mW, a więc 
w wielu wypadkach wystarczające. W mikrofalowych 
generatorach tranzystorowych wykorzystuje się jako 
element sprzężenia zwrotnego zewnętrzne rezonatory 
generatory wnękowe lub paskowe i w swej zasadzie działania ge- 
tranzysto neratory te nie różnią się zasadniczo od generatorów 
rowe stosowanych na niższych częstościach. € 

Oprócz generatorów tranzystorowych istnieje cała 
klasa generatorów półprzewodnikowych działających 
na zasadzie wytwarzania w płytce półprzewodnikowej 
tzw. oporu ujemnego. Należą do niej różne typy diod 
lawinowych, które mogą współpracować z obwodami 
mikrofalowymi aż do częstości ok. 100 GHz, oraz 
tzw. generatory Gunna. Te, choć oferują mniejsze 
generatory moce i mniejsze sprawności przetwarzania energii niż 
z oporem diody lawinowe, pozwalają na uzyskiwanie bezkon- 
ujemnym kurencyjnej (w porównaniu z innymi generatorami 
półprzewodnikowymi) czystości spektralnej wytwa¬ 
rzanego promieniowania (szerokość linii poniżej 
1 kHz przy częstości 10 GHz). 

Niezwykle interesująca zasada działania generato¬ 
rów Gunna, jedynych urządzeń półprzewodnikowych 
generujących mikrofale, a nie zawierających złącz 
p-ti, związana jest ze specyficzną strukturą pasmową 
niektórych półprzewodników 2-i 3-składnikowych. 

Jak klistron wyróżnia się oryginalnością swej za¬ 
sady działania wśród lamp elektronowych — modu¬ 
lacją prędkości .i grupowaniem elektronów w prze¬ 
strzeni unoszenia, tak generator Gunna wyróżnia się 
spośród urządzeń półprzewodnikowych przenosze¬ 
niem elektronów z niższego do wyższego minimum 
pasma przewodnictwa (gorące elektrony) i tworze¬ 
niem się ruchomych domen bardzo silnego pola elek¬ 
trycznego wewnątrz półprzewodnika. 

Jest rzeczą wiadomą, że jeśli w jakimś obwodzie 
elektrycznym znajduje się element o oporze ujemnym, 
to w obwodzie tym mogą się wzbudzić oscylacje. Opór 
ujemny nie jest cechą powszechnie spotykaną w 
przyrodzie. Najczęściej (można tu przytoczyć jako 
przykład wszystkie metale) prąd płynący przez ma¬ 
teriał jest proporcjonalny do przyłożonego napięcia, 
jak to widać na rys. 7a. Spełnione jest wtedy po¬ 
wszechnie znane prawo Ohma. W pewnych materia- 




a) b) 

Rys. 7. Opór dodatni i ujemny. Normalny przewodnik elektrycz¬ 
ności ma opór dodatni w tym sensie, że prąd rośnie ze wzrostem 
napięcia (a); opór R — tg<?+ > 0. W pewnych materiałach moż¬ 
liwa jest sytuacja taka, że ze wzrostem napięcia prąd najpierw 
rośnie, a potem maleje, aby przy dalszym wzroście napięcia znów 
zacząć wzrastać (b). Obszar (niebieski), w którym prąd maleje 
przy rosnącym napięciu zwany jest obszarem różniczkowego 
oporu ujemnego; w tym obszarze opór R — tg <p_ < 0 

opór łach możliwy jest jednak inny przebieg; ze wzrostem 
ujemny napięcia prąd najpierw rośnie, a następnie maleje 
pomimo dalszego wzrostu napięcia. Gdy napięcie 
rośnie jeszcze bardziej, prąd ponownie zaczyna ro¬ 
snąć, jak to przedstawiono na rys. 7b. Obszar, w któ¬ 
rym prąd maleje przy wzroście napięcia, nazywamy 
obszarem ujemnego oporu lub ściślej — różniczko¬ 
wego oporu ujemnego (dV/dI<0). 

Krzywą z rys. 7b udałoby się uzyskać, gdyby przy¬ 
spieszając elektrony w półprzewodniku przez przyło¬ 
żenie pola elektrycznego, można było jakimś sposo¬ 


bem wycofać je z procesu przewodnictwa (np. gdy 
osiągną pewną energię kinetyczną). Taką możli¬ 
wość daje użycie arsenku galu (GaAs). Płytka z tego 
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Rys. 8. Zasadniczy element generatora Gunna: płytka mono* 
krystalicznego arsenku galu. Na kryształ naniesione są kontakty 
omowe, do których zamocowane są elektrody. Napięcie V musi 
być dostatecznie duże (5-15 V), aby spowodować w półprzewod¬ 
niku powstanie obszaru o różniczkowym oporze ujemnym 

materiału stanowi podstawowy element generatora 
Gunna (rys. 8). Struktura pasmowa arsenku galu (-► 
Półprzewodniki str. 533) jest następująca: ponad nor¬ 
malnie zajętym pasmem przewodnictwa, w którym użycie 
elektrony są bardzo ruchliwe, znajduje się inne pasmo, arsenku 
w którym elektrony nie dają się łatwo przyspieszać, galu 
(Ściśle rzecz biorąc, mamy do czynienia z jednym 
pasmem, które ma dwa minima dla różnych wartości 

wektora falowego przedzielone lokalnym maksi¬ 
mum). W porównaniu z elektronami w paśmie niż¬ 
szym są one właściwie nieruchome. Ich wkład do 
prądu (/ = e Enm) płynącego przez półprzewodnik 

jest minimalny — właśnie ze względu na małą pręd¬ 
kość v. W ten sposób, jeśli zwiększymy napięcie przy¬ 
łożone do płytki arsenku galu, prąd wzrośnie i dziać 
się tak będzie aż do momentu, w którym energia elek¬ 
tronów osiągnie taką wartość, że będą się one mogły 
przedostać do pasma wyższego. Przy dalszym wzro¬ 
ście pola elektrony w paśmie podstawowym poruszać 
się będą coraz prędzej, podczas gdy elektrony pobu¬ 
dzone do wyższego pasma wypadną z procesu prze¬ 
wodzenia prądu. Jeśli liczba elektronów przecho¬ 
dzących do górnego pasma będzie duża, prąd zmaleje 
pomimo dalszego wzrostu napięcia. 

Oprócz arsenku galu jest jeszcze kilka związków 
półprzewodnikowych o strukturze pasmowej odpo¬ 
wiedniej do tego, by mógł w nich wystąpić efekt oporu 
ujemnego. Z badań optycznych wiadomo, że wyższe 
pasmo, w którym elektrony są bardzo mało ruchliwe, 
występuje na ogół w odległości ok. 1 /z eV od normal¬ 
nego pasma przewodnictwa (lub wyżej). Z prostych 
obliczeń wynika, że pole elektryczne potrzebne do 
spowodowania znacznego przepływu elektronów do 
górnego pasma musiałoby być bardzo duże tak 
duże, że wskutek strat na ciepło Joule’a mogłoby wy¬ 
stąpić silne przegrzanie, a nawet stopienie materiału. 

Generatory Gunna działają w sposób stabilny i dłu¬ 
gotrwały dzięki pewnemu faktowi wynikającemu 
wprost z zasad elektromagnetyzmu. W krysztale 
w którym w jakimś miejscu wytwarza się obszar o opo¬ 
rze ujemnym, rozkład pola staje się natychmiast nie- domeny 
jednorodny. W szczególności w płytce półprzewodni- poSa eiek- 
kowej wytwarza się mały obszar zwany domeną, w trycznego 
którym pole jest dostatecznie silne, aby przenieść 
elektrony do górnego pasma, podczas gdy w pozosta¬ 
łej części płytki, poza domeną, pole jest małe. Dome¬ 
na nie jest tworem przestrzennie stabilnym. Pchana 
siłami zewnętrznego pola elektrycznego przemieszcza 
się przez półprzewodnik od elektrody ujemnej do do¬ 
datniej, gdzie znika, a na jej miejsce tworzy się nowa 
domena, na ogół w pobliżu elektrody ujemnej. Pro¬ 
ces ten się powtarza, dopóki do półprzewodnika przy¬ 
łożone jest odpowiedniej wielkości napięcie. 

Określenie rozkładu pola elektrycznego wewnątrz 
płytki półprzewodnikowej jest jednym z głównych 
problemów teorii oscylatorów Gunna. Przyczyny two¬ 
rzenia się ruchomych domen można w sposób bardzo 
uproszczony wyjaśnić następująco: W materiale o do¬ 
datnim oporze różniczkowym mamy do czynienia 
z odpychaniem się ładunków jednoimiennych (elek- 
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tronów). Każde zaburzenie w postaci zagęszczenia 
ładunku przestrzennego zanika wykładniczo ze stałą 
czasu równą czasowi tzw. relaksacji dielektrycznej: 
r r = ejenfi, gdzie e jest przenikalnością elektryczną, 
n — koncentracją nośników ładunku, p — ich ruch¬ 
liwością. 

Tworzenie się w jakimś miejscu półprzewodnika 
obszaru o różniczkowym oporze ujemnym powoduje 
zagęszczanie elektronów w tym obszarze. Czas re¬ 
laksacji dielektrycznej staje się ujemny, ładunek zaś 
przestrzenny rośnie w czasie z prędkością e f ' Tr 
Pole elektryczne związane z rosnącym ładunkiem 
przestrzennym jest skomplikowaną funkcją czasu i po¬ 
łożenia wewnątrz półprzewodnika, którą obliczyć 
można jedynie za pomocą maszyn cyfrowych. Przy¬ 
kład rozkładu pola elektrycznego dla polaryzacji pod- 
krytycznej (różniczkowy opór dodatni) i polaryzacji 
nadkrytycznej (różniczkowy opór ujemny) podają 
rys. 9a i 9b. kierunek ruchu 




Rys. 9. Pole elektryczne w arsenku galu przy polaryzacji: a) pod- 
krytycznej, b) nadkrytycznej, gdy zaczyna się tworzyć obszar 
o oporze ujemnym. Rysunek pokazuje prawdopodobny kształt 
domeny pola elektrycznego; domena porusza się przez kryształ 
z prędkością zbliżoną do prędkości unoszenia elektronów. Li¬ 
niami przerywanymi oznaczono położenie elektrod 


Dla lepszego wyjaśnienia, jak powstaje niejednorodny rozkład 
pola elektrycznego w półprzewodniku, podać można przykład 
z dziedziny pokrewnej. W półprzewodniku lub np. w gazie może 
się pojawić opór ujemny, jeśli przez przyspieszenie elektronów do 
bardzo wysokiej energii, w czasie zderzeń tych elektronów z ato¬ 
mami wystąpi jonizacja atomów, czyli nagły wzrost liczby elek¬ 
tronów (powielanie). Gdy efekt ten nastąpi, napięcie potrzebne 
do przepływu prądu określonej wielkości zmaleje. (Efekt ten na¬ 
zywany jest w różnych kontekstach przebiciem elektrycznym lub 
przebiciem lawinowym). Charakterystyka prądowo-napięciowa 
w tym wypadku ma również obszar oporu ujemnego, z tym za¬ 
strzeżeniem że tym razem prąd jest wielowartościową funkcją 
napięcia (pola elektrycznego) — w odróżnieniu od charaktery¬ 
styki z rys. 7, gdzie napięcie było wielowartościową funkcją prądu. 

Podczas jonizacji lawinowej czy przebicia różne obszary pół¬ 
przewodnika przenoszą różne prądy, tworzą się jakby włókna 
prądowe. Krańcowym tego przykładem jest wyładowanie elek¬ 
tryczne (iskrzenie) w gazie lub uderzenie pioruna, stanowiące 
wąskie włókna przewodzące niemal cały prąd, podczas gdy po¬ 
została objętość gazu przewodzi prąd bardzo mały. Iskra elek¬ 
tryczna jest w pewnym sensie domeną prądową w odróżnieniu 
od domeny pola elektrycznego występującej w oscylatorze Gunna. 


i zanikania domen. Powstawanie i wzrost domen moż¬ 
na kontrolować przez odpowiednie kształtowanie 
rozkładu pola mikrofalowego wewnątrz kryształu. 
W krańcowym wypadku doprowadzić można w ten 
sposób do ograniczenia natężenia pola elektrycznego 
(wysokości domen) do określonej wielkości. Taki ro¬ 
dzaj pracy nazywa się rodzajem LSA (Limited Space- 
Charge Accumulation) i odznacza się znacznie wyższą 
sprawnością. Tak np. przy częstości rzędu 5 GHz 
dochodzi ona do 15%, podczas gdy zwykłe generatory 
Gunna przetwarzają energię ze sprawnością kilku 
procent. 

Jeśli chodzi o fluktuacje amplitudy i częstości, to 
już dziś oscylator Gunna konkuruje z powodzeniem 
z klistronem refleksowym. Produkowane seryjnie ge¬ 
neratory Gunna mogą dostarczać mocy rzędu setek 
miliwatów przy pracy ciągłej i rzędu pojedynczych 
kilowatów przy pracy impulsowej i częstości kilku 
GHz. Górna granica częstości generowanych mikro¬ 
fal jest, jak dotychczas, jeszcze niższa niż klistronów, 
lecz uzyskano już moc ok. 20 mW na częstości 100 
GHz. Moc otrzymywaną z generatorów Gunna ogra¬ 
nicza przede wszystkim konieczność odprowadzania 
ciepła od elementu półprzewodnikowego. Generator 



Opisana zasada działania generatora Gunna jest 
dziś powszechnie akceptowana, potwierdziło ją wiele 
dodatkowych doświadczeń. Oscylacje są mało zależne 
od zmian temperatury kryształu, zewnętrznego pola 
magnetycznego czy sposobu zamocowania kontak¬ 
tów. Oscylator ma w pewnym sensie własną częstość 
rezonansową, związaną z czasem przejścia domeny 
przez kryształ, a tym samym — z wymiarami płytki 
półprzewodnika. W grubych próbkach GaAs obser¬ 
wowano generację równocześnie na kilku częstościach, 
co jest niewątpliwie związane z jednoczesnym istnie¬ 
niem kilku domen w różnych miejscach kryształu. 
Częstość generacji jest oczywiście zależna od natęże¬ 
nia pola elektrycznego, a więc od napięcia przyłożo¬ 
nego do kryształu. Stwarza to możliwość łatwego 
przestrajania czy modulacji generatora. 

W używanych w praktyce oscylatorach Gunna sto¬ 
suje się zewnętrzny rezonator mikrofalowy o znacznej 
dobroci; polepsza on znakomicie czystość spektralną 
generowanych mikrofal i stwarza możliwość prze¬ 
strajania mechanicznego. Jest to związane z wekto¬ 
rowym dodawaniem się pól zmiennych o znacznej 
amplitudzie do stałego pola elektrycznego, a tym sa¬ 
mym — z wpływaniem na czas i miejsce powstawania 



Rys. 10. Porównanie konstrukcji klistronu refleksowego na. 
pasmo 8 mm (36 GHz) i generatora Gunna na ten sam zakres 
częstości. Generator Gunna jest niemal 20-krotnie mniejszy niż 
klistron refleksowy. Jego małe wymiary powodują duże trudności 
w odprowadzaniu ciepła. Lepsze odprowadzanie ciepła umożliwia 
zastosowanie dużych elektrod miedzianych (radiatorów) 
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Gunna jest tzw. dwójnikiem, tj. ma tylko dwie koń¬ 
cówki. Prostota strukturalna dwójników implikuje 
prostotę zasilania generatora Gunna (tylko jeden za¬ 
silacz niskonapięciowy) i prostotę współpracujących 
z nim obwodów elektrycznych. 

Porównanie konstrukcji generatora Gunna z kli- 
stronem obrazuje rys. 10. Należy podkreślić, że mało 
złożona konstrukcja generatora półprzewodnikowego 
technologia kryje w sobie wyrafinowaną technologię wytwarzania, 
wytwarzania Sam arsenek galu musi być niezwykle czysty i jedno- 
generatorów rodny, z minimalną ilością defektów strukturalnych. 

Gunna Kontakty omowe do próbki kryształu czynnego mu¬ 
szą mieć bardzo mały opór i są naparowywane z re¬ 
guły na cienką warstwę powierzchniową silnie do¬ 
mieszkowaną tzw. płytkimi domieszkami. Techno¬ 
logia wytwarzania generatorów Gunna może być 
w znacznym stopniu zautomatyzowana (wzrost mono¬ 
kryształu GaAs z fazy gazowej lub ciekłej, implantacja 
domieszek w okolicach kontaktów, naparowywanie 


kontaktów i mocowanie elektrod). Cały proces pro¬ 
dukcyjny odbywa się przy zachowaniu warunków 
niezwykłej czystości. 

Wskutek kosztownej technologii wytwarzania, ge¬ 
neratory półprzewodnikowe nie są — wbrew prze¬ 
widywaniom — wielokrotnie tańsze od klistronów. 
Sytuacja jednak może się radykalnie zmienić wobec 
ciągle rozszerzającego się kręgu zastosowania mikro¬ 
fal i potanienia technologii wytwarzania generatorów 
Gunna w związku z ich masową produkcją. Dalszy 
rozwój generatorów półprzewodnikowych doprowa¬ 
dzi niewątpliwie w najbliższych latach do rewolucji 
w technice mikrofalowej podobnej do tej, która się 
już dokonała w elektronice niższych częstości przez 
kolejne wprowadzenie tranzystorów i układów sca¬ 
lonych. , „ 

B. G. Bosch, R. W. H. Engelmann "Przyrządy półprzewodni¬ 
kowe z efektem Gunna , Warszawa 1980; R. Litwin, M. Suski 
Technika mikrofalowa , Warszawa 1972; A. Smoliński Mikrofa¬ 
lowa elektronika ciała stałe go, Wrocław 1973. 


Komputer jako narzędzie pracy fizyka 


Wojciech Wójcik 

Elektroniczne maszyny matematyczne są jednym 
z symboli obecnej epoki rozwoju techniki. Rozwój 
ich był i jest nadal niezwykle szybki, nieomal każdy 
miesiąc przynosi nowe, ciekawe rozwiązania tech¬ 
niczne i technologiczne w tej dziedzinie. 

Elektroniczne maszyny matematyczne możemy po¬ 
dzielić na cyfrowe, analogowe i hybrydowe. Maszyny 
cyfrowe pozwalają na operacje na liczbach zapisanych 
w postaci skończonych ciągów cyfr, w odróżnieniu 
od maszyn analogowych, które operują na wielko¬ 
ściach mających charakter ciągły. Najczęściej przy¬ 
kłada się na wejście maszyny analogowej napięcie 
elektryczne. Maszyny hybrydowe posiadają cechy 
obu wymienionych typów maszyn. W dalszej części 
zajmiemy się wyłącznie omówieniem maszyn cyfro¬ 
wych, jako maszyn matematycznych najczęściej w fi¬ 
zyce stosowanych. Coraz szerzej przyjmuje się obec- 
komputery nie nazwa „komputer”, która oznacza elektroniczną 
maszynę cyfrową; w takim znaczeniu używać bę¬ 
dziemy dalej tego terminu. 

Szybki rozwój informatyki sprawił, że komputer 
stał się dziś powszechnie stosowanym narzędziem 
pracy w wielu gałęziach gospodarki narodowej, nauki 
i techniki. Fizyk wykorzystuje wszystkie najistotniej¬ 
sze własności komputera, poczynając od jego zdol¬ 
ności rozwiązywania zadań numerycznych, a kończąc 
na możliwości przetwarzania danych, modelowania 
czy statystycznej analizy wyników pomiarów. Bardzo 
często doświadczenie wymaga użycia komputera jako 
urządzenia sterującego i jednocześnie analizującego 
wyniki pośrednie. Jest to tzw. technika pracy w czasie 
rzeczywistym lub na „linii” (on-line). Tak szeroki za¬ 
kres zastosowania komputerów w fizyce stwarza ko¬ 
nieczność posługiwania się różnymi typami kompute¬ 
rami- rów, o różnych parametrach technicznych. Skonstruo- 
komputery wano całą nową klasę tzw. mini-komputerów, głównie 
z myślą o obsłudze procesów sterowania w czasie rze¬ 
czywistym do zadań wymagających czasochłonnych 
obliczeń numerycznych stosuje się duże komputery* 
dysponujące odpowiednio pojemną pamięcią we- 
nętrzną i umożliwiające wykonywanie 1-2 milionów 
operacji arytmetycznych w ciągu sekundy. Rozwią¬ 
zanie układu 100 równań liniowych ze 100 niewiado¬ 
mymi trwa wówczas kilka sekund. To samo zadanie 
zajęłoby rachmistrzowi posługującemu się zwykłym 
arytmometrem kilka lat. Współczesne systemy kom¬ 
puterowe umożliwiają rozwiązywanie zadań, których 
ze względu na dużą liczbę parametrów nie można roz¬ 
wiązać w inny sposób. Warto jednak pamiętać, że 
komputer jest jedynie zautomatyzowanym arytmo¬ 
metrem, umożliwiającym wykonywanie operacji aryt¬ 


metycznych i logicznych z olbrzymią szybkością. 

O tym, czy przy użyciu komputera rozwiązane zo¬ 
stanie zadanie obliczeniowe, decyduje wiedza i do¬ 
świadczenie programisty, który musi opracować pro¬ 
cedurę prowadzącą do rozwiązania problemu (tzw. 
algorytm), a następnie przetłumaczyć ją na ciąg in- algorytm 
strukcji (rozkazów) zrozumiałych dla komputera. 
Umiejętność programowania znacznie ułatwia korzy¬ 
stanie z komputera i przyspiesza uzyskiwanie wyni¬ 
ków, nie trzeba bowiem korzystać z pośrednictwa za¬ 
wodowych programistów. Wprowadzenie do po¬ 
wszechnego użytku tzw. języków algorytmicznych 
znacznie ułatwiło opanowanie sztuki programowania. 
Powszechnie używa się również gotowych algoryt¬ 
mów i programów standardowych przygotowanych 
z myślą o szerokim kręgu użytkowników. O przydat¬ 
ności komputera decydują nie tylko jego parametry 
techniczne, ale również zestaw standardowych prog¬ 
ramów (biblioteka programów). 


Rozwój techniki obliczeniowej — od liczydła 
do komputera 

Najstarszym i najwcześniej używanym przez ludzkość 
liczydłem są palce (fakt, że się obecnie posługujemy 
układem dziesiętnym jest potwierdzeniem tej tezy). 

Na tej samej zasadzie odliczania oparta jest konstruk¬ 
cja liczydeł, których wiele odmian przetrwało do dnia 
dzisiejszego. Istotnym krokiem naprzód w konstrukcji 
maszyn liczących była maszyna matematyczna 
(il. 103, tabl. 26), zbudowana w 1652 r. przez B. Pascala. 

Przy jej konstrukcji Pascal wykorzystał fakt, że sy¬ 
stem dziesiętny jest systemem pozycyjnym. Podobnie 

jak wszystkim późniejszym arytmometrom mechani- arytmometr 
cznym, maszynie Pascala brakło pamięci wewnętrznej mechaniczny 
dla przechowywania wyników pośrednich. Aby wy¬ 
konać ciąg działań: 

2,5-3,55+5,2-3,5+ 1,5-2,1 = 30,225, 

nieodzowne było użycie ołówka i papieru dla zapamię¬ 
tania wyników pośrednich, czyli wyników poszczegól¬ 
nych mnożeń, a dopiero potem można było wykonać 
dodawanie. Cechą charakterystyczną omawianej 
techniki obliczeniowej jest duża strata czasu, związana 
z ręcznym wprowadzaniem liczb do maszyny oraz za¬ 
pisywaniem wyników pośrednich i końcowych. Praw¬ 
dziwą rewolucją w dziedzinie automatyzacji obli¬ 
czeń było wykorzystanie elektroniki do konstrukcji arytmome r 
arytmometru. Pierwsze elektroniczne arytmometry elektroniczny 
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(„Mark I” i „Eniac”) zbudowano w Stanach Zjedno¬ 
czonych w latach 1944-45. Posiadały one urządzenie 
wczytujące instrukcje przygotowane uprzednio na per¬ 
forowanych taśmach papierowych. Wykonywanie in¬ 
strukcji odbywało się sekwencyjnie, w miarę ich wczy¬ 
tywania. Istotnym krokiem naprzód w automatyzacji 
obliczeń było wprowadzenie przez amerykańskiego 
matematyka, J. von Neumanna, cyfrowego sposobu 
przedstawiania rozkazów i umieszczenie ich bezpo- 
aSektroniczna średnio w pamięci maszyny. W ten sposób powstało 
maszyna pojęcie programowanej elektronicznej maszyny cy- 
cyfrowa frowej — komputera. Wzbogacenie zestawu rozka¬ 
zów przez wprowadzenie instrukcji skoku (bezwarun¬ 
kowego i warunkowego) stworzyło możliwość korzy¬ 
stania z komputera jako uniwersalnego narzędzia do 
prowadzenia obliczeń numerycznych. Wprowadzenie 
operacji logicznych umożliwiło jego zastosowanie do 
przetwarzania danych. 


Elementy składowe współczesnego 
komputera 

Na ii. 104 (tabl. 26) przedstawiono typowy komputer 
średniej klasy. Składa się on z wielu elementów, z któ- 
jednostka rych najważniejszym jest tzw. jednostka centralna, 
centralna Zawiera ona arytmometr, pamięć wewnętrzną, układ 
sterowania, rejestry pamięciowe, adresowe i modyfi*- 
kacyjne. W arytmometrze wykonywane są operacje 
arytmetyczne (dodawanie, odejmowanie, mnożenie 
i dzielenie), operacje logiczne (negacja, alternatywa, 
koniunkcja) oraz tzw. operacje przesuwania, 
pamięć W pamięci wewnętrznej przechowywane są rozkazy 
wewnętrzna (program) oraz liczby (dane). Pamięć zbudowana 
jest z układu elementów ferromagnetycznych, z któ¬ 
rych każdy może się znajdować w jednym z dwu sta¬ 
bilnych stanów namagnesowania. Przypisując stanom 
tym odpowiednio wartości 0 i 1, można stosować 
dwójkowy (binarny) zapis liczb. Zaletą tego typu pa¬ 
mięci jest krótki czas odczytu i zapisu informacji 
(rzędu 1 ps) oraz możliwość dosyć ścisłego upako¬ 
wania rdzeni ferrytowych. Warto wspomnieć, że obec¬ 
nie pracuje się intensywnie nad wprowadzeniem do 
masowej produkcji nowych typów pamięci, np. pa¬ 
mięci półprzewodnikowych lub laserowych. Zaletą 
pamięci półprzewodnikowych jest możliwość uzyska¬ 
nia krótszych czasów odczytu i zapisu informacji oraz 
zwiększona odporność na uszkodzenia mechaniczne. 
Jest to ważne w dziedzinie mini-komputerów, szcze¬ 
gólnie — instalowanych w samolotach, satelitach i in¬ 
nych urządzeniach narażonych na wstrząsy. Pamięci 
laserowe nie wyszły obecnie poza stadium badań la¬ 
boratoryjnych. 

Układ sterowania koordynuje działanie jednostki 
centralnej przez realizację rozkazów pobieranych z pa¬ 
mięci wewnętrznej komputera. Rejestry pamięciowe 
służą do przekazywania informacji z pamięci wewnę¬ 
trznej do arytmometru i z arytmometru do pamięci 
wewnętrznej, rejestry adresowe i modyfikacyjne służą 
do wyznaczania adresu informacji zawartej w pamięci 
wewnętrznej. 

Oprócz jednostki centralnej komputer musi być 
pamięć wyposażony w urządzenia peryferyjne i pamięci ma- 
zewnętrzna sowę, czyli zewnętrzne pamięci o dużej pojemności. 

Są to urządzenia elektroniczno-mechaniczne, umożli¬ 
wiające wprowadzenie danych, wprowadzenie wyni¬ 
ków oraz przechowywanie dużych zbiorów danych. 
Na il. 104 (tabl. 26) widzimy również konsolę opera¬ 
torską z monitorem ekranowym, na którym operator 
obserwuje pracę całego systemu i w razie konieczności 
wprowadza zmiany i poprawki. 


Programowanie, czyli wykorzystanie 
możliwości komputera 

Korzystanie z komputera wymaga przygotowania ze¬ 
stawu danych oraz programu, czyli zbioru instrukcji 
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zrozumiałych dla układu sterowania komputera. Na języki 
ogół programy przygotowuje się w jednym z języ- algorytmicz- 
ków algorytmicznych, takich jak fortran, algol, cobol, ne 
apl/I. Ułatwiają one posługiwanie się komputerem 
niezawodowym programistom, niepotrzebna jest bo¬ 
wiem wówczas szczegółowa znajomość budowy i za¬ 
sady działania konkretnego typu komputera. V/ ję¬ 
zykach algorytmicznych zapis operacji arytmetycz¬ 
nych nie różni się praktycznie od zapisu algebraicz¬ 
nego; ułatwia to nie tylko programowanie, ale rów¬ 
nież publikowanie algorytmów w postaci gotowej do 
wprowadzenia do komputera, a jednocześnie bardzo 
przejrzystej i czytelnej dla użytkownika. Program, 
wprowadzony do komputera w języku algorytmicz¬ 
nym, jest następnie tłumaczony przez specjalny pro- translator 
gram, zwany translatorem, na ciąg instrukcji pod¬ 
stawowych, czyli na język wewnętrzny komputera. 

W języku tym każda instrukcja składa się z części 
operacyjnej i adresowej. W części operacyjnej zawarta język 
jest informacja o tym, jaka operacja i jakiego typu wewnętrzny 
modyfikacje mają być wykonane, natomiast część 
adresowa określa komórki, na których* zawartości 
ma być dokonana operacja. Formą pośrednią po¬ 
między językiem wewnętrznym a językami algoryt- język 
micznymi jest tzw. język symboliczny. Pozwala on na symboliczny 
wygodny zapis instrukcji podstawowych komputera 
przez użycie skrótów mnemotechnicznych na ozna¬ 
czenie nazw operacji oraz symboli alfanumerycznych 
na określenie adresów. Wyznaczanie wartości adre¬ 
sów dokonywane jest automatycznie w czasie wpro¬ 
wadzania programu do pamięci komputera, przez co 
unika się wielu niedogodności programowania w ję¬ 
zyku wewnętrznym, a korzysta się ze wszystkich zalet 
tego języka. 


Zastosowanie komputerów w fizyce 

Numeryczne rozwiązywanie równań fizyki umożliwia 
szybkie uzyskanie odpowiedzi na podstawowe dla 
fizyka pytanie, czy rozwiązanie zgodne jest z obser¬ 
wacją. Do rozwiązywania tego typu zagadnień stosuje 
się klasyczne metody numeryczne, a bardzo często 
łączy się je z zagadnieniami modelowania i symulacji. 

Na rys. 1 przedstawiono przykład modelowania 
procesu ewolucji galaktyki. Problem polegał na roz¬ 
wiązaniu równań ruchu zespołu 50 000 gwiazd, roz- modelowanie 
mieszczonych w postaci wirującego dysku o stałej 
gęstości gwiazd. Początkowo układ ten znajdował się 
w równowadze radialnej, lecz z biegiem czasu poja¬ 
wiała się wyraźna anizotropia układu (rys. 1). Porów¬ 
nanie wyników tego modelowania z obserwacjami 
galaktyk przedstawiono na il. 106 i 107 (tabl. 26). 

Przykład ten stanowi doskonałą ilustrację zastosowa¬ 
nia komputera do rozwiązania problemu, którego nie 
można było rozwiązać w inny sposób. Podobne za¬ 
gadnienia spotykamy w hydrodynamice (rys. 2), aero¬ 
dynamice czy mechanice ośrodków ciągłych. Rysu¬ 
nek 3 przedstawia modelowanie dyfrakcji fali uderze¬ 
niowej i wytwarzanie się stanu ustalonego. Zagadnie¬ 
nie to ma swoje praktyczne zastosowanie m.in. w ba¬ 
daniach z dziedziny astronautyki, pozwala bowiem 
przewidzieć jak się zachowa kabina statku kosmicz¬ 
nego przy wejściu w górną warstwę atmosfery. 

Metoda Monte Carlo (metoda prób losowych) metoda 
służy do analizy procesów przypadkowych (stochas- Monte Carlo 
tycznych). Pozwala ona symulować zachowanie się 
układu zależnego od zespołu parametrów, których 
wartości podlegają postulowanym funkcjom rozkładu. 

Metoda Monte Carlo stosowana była od dawna 
i szczególnie często cytowany jest przykład jej zasto¬ 
sowania do wyznaczania wartości liczby n. Procedura 
polegała na rzucaniu igły na odpowiednio polinio¬ 
wany stół. Jeśli odległości pomiędzy kolejnymi linia¬ 
mi równe były długości igły, to stosunek liczby rzu¬ 
tów, przy których igła przecinała którąkolwiek 
linię, do liczby wszystkich rzutów dążył do wartości n 
w miarę wzrostu liczby rzutów. Wprowadzenie kom- 
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Rys. 1. Modelowanie procesu ewolucji galaktyki. Symulowany układ zawiera 50 000 gwiazd, rozmieszczonych w postaci wirującego dy¬ 
sku o stałej gęstości gwiazd. Jednostką czasu jest okres obrotu 


puterów przekształciło metodę Monte Carlo z cieka¬ 
wego zastosowania praw statystyki matematycznej 
w potężne narzędzie badań naukowych w wielu dy- 

a) 



scyplinach wiedzy. Komputer bowiem pozwolił na 
zautomatyzowanie procesu otrzymywania liczb loso¬ 
wych oraz umożliwił wykonanie skomplikowanych 
obliczeń wymaganych przez tę metodę. Olbrzymi 
wzrost zainteresowania metodą Monte Carlo datuje 
się od czasu zastosowania jej do badań reakcji roz¬ 
szczepienia ciężkich jąder. Wymienić w tym miejscu 
należy prace nad konstrukcją pierwszej bomby ato¬ 
mowej w USA oraz nad konstrukcją pierwszego reak¬ 
tora jądrowego. Wprowadzone wówczas przez von 
Neumanna i Ulama metody są obecnie uważane za 
podstawowe w tej dziedzinie. 

Obecnie zakres zastosowania metody Monte Carlo 
w fizyce jest niezwykle szeroki, od wyznaczania war- 



Rys. 2. Przykład modelowania cyfrowego spadającej kropli na 
powierzchnię cieczy: a) kolejne fazy tego procesu, b) fotografia 
rzeczywistego procesu 
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Rys. 3. Modelowanie procesu dyfrakcji fali uderzeniowej i wy¬ 
tworzenia się stanu stacjonarnego przy wejściu stożka o kącie 
rozwarcia 30° do jednorodnego ośrodka gazowego z prędkością 
ponaddżwiękową 


statystyczna 

analiza 

danych 

doświad¬ 

czalnych 


tości całek wielokrotnych — po symulacyjne metody 
badania przebiegu procesów fizycznych o charakterze 
stochastycznym. Dziś nie sposób sobie wyobrazić 
projektu układu doświadczalnego, którego podsta¬ 
wowe parametry nie byłyby przebadane metodą sy¬ 
mulacji rzeczywistych procesów fizycznych. Dzięki 
temu odpada konieczność przeprowadzania prób 
i konstruowania modeli i prototypów, a koszty kon¬ 
strukcji aparatury ulegają znacznej obniżce. 

W fizyce doświadczalnej często występuje koniecz¬ 
ność przeprowadzania statystycznej analizy wyników 
doświadczenia. Wyniki pomiarów (kompletny ma¬ 
teriał statystyczny) zapisywane są w postaci dużych 
zbiorów informacji przechowywanych w pamięciach 
masowych. Analiza polega na obliczaniu dla każdego 
indywidualnego pomiaru interesującej nas wielkości, 
a następnie — na sporządzeniu dla niej rozkładu gę¬ 
stości prawdopodobieństwa. Parametry określające 
ten rozkład (wartość średnia, dyspersja itp.) związane 
są na ogół z wielkościami fizycznymi lub poszukiwa¬ 
nymi parametrami. Porównując uzyskane wyniki 
z przewidywanymi teoretycznymi, możemy weryfi¬ 
kować hipotezy stosując znane testy statystyczne. 



Rys. 4. Przykład dopasowania metodą najmniejszych kwadratów 
krzywej rezonansowej (typu Brcita-Wiegnera) do danych do¬ 
świadczalnych, przy założeniu istnienia tła nie rezonansowego 


Weryfikacja hipotez może polegać również na dobra¬ 
niu takich wartości parametrów, przy których wyniki 
teoretyczne najlepiej opisują istniejącą sytuację do¬ 
świadczalną. Do rozwiązania tego typu problemów 
stosuje się metody optymalizacji nieliniowej. Rozwią¬ 
zanie problemu sprowadza się wówczas do znalezie¬ 
nia minimum pewnego funkcjonału. Przykład zagad¬ 
nienia dopasowania krzywej (hipoteza) do danych 
doświadczalnych przedstawiono na rys. 4. 


Automatyzacja pomiarów i praca w czasie 
rzeczywistym 

Zastosowanie komputerów umożliwiło automatyzację 
pomiarów parametrów torów cząstek elementarnych 
ze zdjęć z komór śladowych. Na il. 105 (tabl. 26) przed¬ 
stawiono automat pomiarowy „Polly”, zbudowany 
w Stanach Zjednoczonych. Proces pomiaru sterowa¬ 
ny jest przez komputer i tylko wówczas, gdy kompu¬ 
ter nie może przeprowadzić analizy kształtu toru i do¬ 
konać obliczenia, żąda on dodatkowych informacji 
od operatora. Istnieje wiele aparatów pomiarowych, 
a zasady ich działania są bardzo podobne. Na ogół 
są to urządzenia prototypowe lub — ze względu na 
swoje specyficzne zastosowanie — produkowane w 
małych seriach. 

W fizyce jądrowej i fizyce cząstek elementarnych 
łączy się obecnie coraz częściej technikę licznikową 
z techniką cyfrową, przy czym komputer wprowadza 
się jako element sterujący całością doświadczenia. 
Sprawdza on wówczas działanie wszystkich elemen¬ 
tów układu liczników, steruje pracą tego układu, do¬ 
bierając optymalne parametry, oraz przeprowadza 
analizę danych na bieżąco, w trakcie trwania do¬ 
świadczenia. Stosowanie komputerów do sterowania 
układami licznikowymi stało się tak powszechne, że 
powstała cała rodzina wyspecjalizowanych kompute¬ 
rów (tzw. mini-komputerów), szczególnie nadających 
się do tego celu. 


Sieci abonenckie 

Coraz powszechniej stosuje się obecnie duże zestawy 
komputerowe, które wraz z końcówkami abonencki¬ 
mi i siecią łączności tworzą tzw. sieci abonenckie. 
Końcówki abonenckie służą do wprowadzania pro¬ 
gramów i danych oraz do drukowania wyników obli¬ 
czeń. Sieci abonenckie pozwalają najefektywniej wy¬ 
korzystać zespół komputerów i mogą obsługiwać 
wielu użytkowników. Stosuje się różnego typu koń¬ 
cówki abonenckie, ale najwygodniejszą formą prowa¬ 
dzenia obliczeń jest korzystanie z systemów inter¬ 
akcyjnych. Pozwalają one na natychmiastową reali¬ 
zację programu (dialog: człowiek-maszyna) i uzy¬ 
skanie odpowiedzi w postaci wykresu lub tabeli na 
monitorze ekranowym (tabl. 26, il. 108). Jeśli w prog¬ 
ramie jest błąd, programista ma możliwość zrobienia 
poprawki i posłania ponownie programu do wyko¬ 
nania. Na ogół połączenia komputerów z końcówkami 
abonenckimi dokonywane są przy użyciu łączy tele¬ 
komunikacyjnych. Istnieją systemy umożliwiające 
wykorzystanie do tych celów normalnej sieci telefo¬ 
nicznej. Aby się połączyć z komputerem, wystarczy 
wykręcić odpowiedni numer i po uzyskaniu połącze¬ 
nia rozpocząć pracę w trybie interakcyjnym. Być może 
w niedalekiej przyszłości spełni się marzenie niektó¬ 
rych fizyków, by przy pomocy miniaturowych koń¬ 
cówek abonenckich można było każdej chwili ko¬ 
rzystać z systemów komputerowych. 

N. P. Buslenko i in. Metoda Monte Carlo, Warszawa 1967; 
D. Potter Metody obliczeniowe fizyki. Warszawa 1977. 
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AKUSTYKA 

Przedmiot i zakres akustyki Badanie ośrodków za pomocą 
ultradźwięków Akustyczne fale powierzchniowe i ich zastoso¬ 
wanie Holografia akustyczna Akustyczne zjawiska kwantowe • 
Modelowanie obiektów akustycznych • Fale uderzeniowe Hałas 


Przedmiot i zakres akustyki 


Dziedzina zjawisk fizycznych, którą obejmuje współ¬ 
czesna akustyka jest niewspółmiernie szeroka w po¬ 
równaniu z tym, co znane było jako dział akustyki 
klasycznej fizyki w końcu XIX i początku XX w. 
a ograniczało się do fal sprężystych słyszalnych (gr. 
akustikos — dotyczący słuchu). Obecnie przedmio¬ 
tem akustyki są wszystkie zjawiska związane z roz¬ 
chodzeniem się fal sprężystych w różnych ośrodkach, 
we wszystkich stanach skupienia materii, w pełnym 
zakresie częstości drgań możliwych w przyrodzie. 
Zakres ten obejmuje infradźwięki (poniżej słyszalności 
od ułamków herca do 16 Hz), dźwięki (słyszalne — 
od 16 Hz do 16 kHz), ultradźwięki (powyżej słyszal¬ 
ności — od 16 kHz-10 9 Hz) oraz hiperdźwięki (po¬ 
wyżej 10* Hz aż do częstości granicznej wyznaczonej 
przez nieciągłą strukturę atomową materii rzędu 
10 13 -10 14 Hz). 

Opis zjawisk akustycznych w tak szerokim zakre¬ 
sie częstości nie może być jednolity; mimo tej samej 
natury fal sprężystych w całym zakresie, różnią się 
one jednak długością fali. Przy opisie wielu procesów 
akustycznych, ośrodek, w którym rozchodzą się fale 
sprężyste może być traktowany jako ciągły. Opis taki 
nazywa się klasycznym. W wielu jednak wypadkach 
założenie ciągłości ośrodka nie może być spełnione, 
np. wtedy, gdy własności molekularne (nieciągłe) 
ośrodka mają istotne znaczenie (—► Akustyczne 
zjawiska kwantowe). 

Klasyczny opis wielu zagadnień akustyki można 
jedynie traktować jako dostateczne przybliżenie, 
szczególnie w zakresie dźwięków słyszalnych, jest on 
jednak niewystarczający dla ultradźwięków o dużych 
częstościach i hiperdźwięków, gdzie musi być brana 
pod uwagę nieciągła struktura ośrodka (-* Wzbu¬ 
dzenia elementarne w ciałach stałych). Mówiąc do¬ 
kładniej, taki przybliżony opis jest niewystarczający 
wówczas, gdy droga swobodna drobin staje się po¬ 
równywalna z długością fali (np. w bardzo rozrzedzo¬ 
nych gazach), albo gdy odstępy międzymolekularne 
czy międzyatomowe stają się porównywalne z długo¬ 
ścią fali, jak np. przy rozchodzeniu się hiperdźwięków 
w ciałach stałych (-*• Akustyczne zjawiska kwantowe). 

W akustyce klasycznej opartej na teorii ośrodków 
ciągłych wiele zagadnień można rozwiązać za pomocą 
liniowych równań różniczkowych o pochodnych 
cząstkowych, niektóre jednak problemy wymagają 
bardziej skomplikowanego opisu matematycznego. 
Ścisłe równania mechaniki ośrodków ciągłych (w tym 
akustyki) są nieliniowe a ich rozwiązanie przedstawia 
tak duże trudności matematyczne, że mimo wielu wy¬ 
siłków nie udało się, jak dotąd, uzyskać pełnych wy¬ 
ników. Na ogół trzeba zadowolić się teoriami przy¬ 


bliżonymi. Z tego powodu rozwój współczesnych za¬ 
gadnień akustyki możliwy jest w ścisłym związku z doś¬ 
wiadczeniem, które w ostatnich latach, szczególnie 
w odniesieniu do akustycznych zjawisk o dużej ener¬ 
gii (jak np. fale uderzeniowe) pozwala na konfron¬ 
tację, uzasadnienie i uzupełnienie wyników tych 
przybliżonych obliczeń. 

W wielu współczesnych laboratoriach fizycznych 
na świecie prowadzi się intensywne badania akustycz¬ 
nych zjawisk o dużej energii (zjawisk nieliniowych) 
i wyznacza się wielkości charakteryzujące nieliniowe 
własności ośrodków gazowych, ciekłych i stałych. 

Warto zauważyć, że wiele rozwiązań teoretycznych, 
szczególnie w zakresie nieliniowym, wykorzystywa¬ 
nych od lat na potrzeby akustyki, przenosi się ostatnio 
do zagadnień optyki nieliniowej (-*» Optyka nieli¬ 
niowa), które pojawiły się w ostatnim 10-leciu dzięki 
wynalezieniu źródeł światła o bardzo dużej (gigan¬ 
tycznej) mocy i użyciu ich do badania materii. 

Relatywistyczne ujęcie teorii ośrodków ciągłych 
znajduje zastosowanie w zagadnieniach astrofizycz¬ 
nych, np. w badaniach atmosfer gwiazdowych, w 
szczególności Słońca, i wiąże się z zagadnieniem pro¬ 
mieniowania elektromagnetycznego tych obiektów. 
W warunkach ziemskich ujęcie takie stosuje się do 
opisu niektórych zagadnień plazmy. 

Teoria ośrodków ciągłych w zastosowaniu do hy¬ 
drodynamiki tzw. „dwuprędkościowej” (pierwsza 
i druga prędkość dźwięku) daje makroskopowy opis 
ruchu cieczy nadciekłej, jaką jest np. ciekły hel w tem¬ 
peraturach bliskich 0 K (-*• Nadpłynność). 

Przy rozpatrywaniu fal sprężystych rozróżnia się 
ośrodek idealny (bezstratny czyli niedysypatyw- 
ny), w którym fale sprężyste nie ulegają tłumieniu, 
oraz ośrodek rzeczywisty (stratny czyli dysypatywny), 
w którym falc zanikają (ulegają tłumieniu) w miarę 
rozchodzenia się. Ośrodki rzeczywiste można trakto 
wać jako idealne (szczególnie w wypadku fal spręży¬ 
stych o małych częstościach) z dobrym dla pra¬ 
ktycznych celów przybliżeniem (np. dźwięki słyszal¬ 
ne w powietrzu na odległościach kilkunastu me¬ 
trów). 

Teoria ośrodków ciągłych i faie 
sprężyste 

Antoni Śliwiński 

Tradycyjnie do teorii ośrodków ciągłych zalicza się 
mechanikę płynów (cieczy i gazów) czyli hydrodyna¬ 
mikę, teorię sprężystości i plastyczności ciał stałych 
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oraz inne dyscypliny szczegółowe przyjmujące za 
punkt wyjścia założenie, że mikroskopowe nieciągłości 
materii nie mają wpływu na rozpatrywane zjawiska 
fizyczne w skali makroskopowej. Do takich szczegó¬ 
łowych dyscyplin należy również tzw. akustyka kla¬ 
syczna, która w sposób fenomenologiczny opisuje 
mechanizm rozchodzenia się fal sprężystych w ośrod¬ 
kach ciągłych. U podstaw tej teorii leży traktowanie 
materii jako środowiska ciągłego bez wnikania w jej 
rzeczywistą budowę nieciągłą (atomy, cząsteczki), 
cząstka Wyrazem ciągłości ośrodka jest to, że możemy go 
ośrodka w myśli podzielić na dowolnie małe elementy obję- 



Rys. 1. Taki element objętości nazywamy cząstką ośrodka lub 
cząstką akustyczną. Jest to jej położenie równowagi. Przy zabu¬ 
rzeniu cząstka przesuwa się w miejsce x = ar + f 


max. amplituda drgań 



max. amplitudy min. amplitudy 



ruchu tłoka 



c) Rys. 2. Sprężysta fala podłużna: a) wykres zmian ciśnienia fali 

rozchodzącej się w rurze, b) schematyczny rozkład ciśnienia 
zgęszczeń i rozrzedzeń lub sprężeń i rozprężeń ośrodka w rurze, 
c) fotografia cieniowa fali ultradźwiękowej w dużej objętości 
cieczy 
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tości o takich samych własnościach, jak cała rozważa - 
na jego objętość. Taki mały element objętości oś¬ 
rodka stanowi elementarny obiekt podlegający pra¬ 
wom mechaniki i termodynamiki, musi więc być na 
tyle duży, aby mieściło się w nim wiele molekuł czy 
atomów, dla których wewnątrz niego spełnione by¬ 
łyby prawa statystyczne (-> Fizyka statystyczna), aby 
słuszne były prawa termodynamiki, oraz na tyle mały, 
aby można go potraktować jako nieskończenie mały 
z punktu widzenia opisywanych zjawisk. W rozwa¬ 
żaniach zjawisk fizycznych taki element objętości na¬ 
zywamy cząstką ośrodka (rys. 1), a przy rozpatrywa¬ 
niu fal sprężystych — cząstką akustyczną. Analiza 
ruchu cząstki ośrodka pod wpływem działających na 
nią sił pozwala opisać zjawiska odkształceń dyna¬ 
micznych, w szczególności przepływów ośrodków 
(płynnych) i rozchodzenia się fal sprężystych. 

Istotą ruchu falowego jest zależność czasowo-prze- 
strzenna przemieszczania się zaburzenia przez ośro¬ 
dek. Zaburzenie rozchodzi się tak, że każda z cząste¬ 
czek ośrodka wykonuje ruch dookoła położenia 
równowagi, przekazując energię sąsiednim cząstkom 
zajmującym inne położenia w przestrzeni i drgającym 
w odpowiednio przesuniętych w czasie chwilach na¬ 
stępnych. Stany ruchu powtarzają się okresowo 
w przestrzeni (co długość fali X) oraz w czasie (co 
okres T) — rys. 2, przy czym X = cT\ gdzie c — 
prędkość rozchodzenia się zaburzenia czyli prędkość 
fazowa. 

Źródłem fal sprężystych w ośrodkach ciągłych są 
mechaniczne układy drgające umieszczone w nich. 
Energia drgań tych układów zostaje zamieniona na 
energię fali akustycznej. Przykładem drgającego 
układu generującego falę sprężystą może być wspom¬ 
niana już wyżej kula pulsująca (rys. 3) otoczona 
ciągłym ośrodkiem sprężystym. Układ taki jest rów¬ 
noważny z układem hipotetycznym, tzw. źródłem 
punktowym, które można sobie wyobrazić jako gra¬ 
nicznie małą kulę pulsującą dla r -> 0, gdzie r — pro¬ 
mień kuli. 



Rys. 3. Poglądowe przedstawienie kuli pulsującej jako źródła 
kulistej fali sprężystej 

Drgania kuli pulsującej odbywają się w ten sposób, 
że jej promień zmienia się okresowo z częstością v, 
przy czym środek kuli pozostaje nieruchomy. Po¬ 
glądowo można sobie wyobrazić kulę pulsującą jako 
gumowy pęcherzyk napełniony powietrzem, który na 
skutek np. periodycznych wahań temperatury 
w pierwszym półokresie rozszerza się, równomiernie 
pęcznieje, a w drugim półokresie kurczy się. 

Fale sprężyste w ośrodku opisuje równanie falowe, 
które wyprowadza się z podstawowych równań teorii 
ośrodków ciągłych. Są to: równania ruchu (we współ¬ 
rzędnych Eulera lub Lagrange’a) dla cząstki aku¬ 
stycznej pobudzonej do drgań przez siły wywołane 
zaburzeniem ośrodka, równanie ciągłości ośrodka 
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(lub inaczej równanie zachowania masy) oraz równa¬ 
nie stanu termodynamicznego (najczęściej równanie 
adiabaty). 

Najogólniejszą formę tych równań wyprowadza się 
dla ośrodka stałego anizotropowego, przyjmując za 
podstawę ogólne prawo Hooke ł a, które wyraża linio¬ 
wą zależność odkształceń od naprężeń. W ciałach 
stałych anizotropowych własności sprężyste zależą od 
kierunku. Jest to charakterystyczne szczególnie dla 
monokryształów, w których decydującą rolę odgrywa 
stopień regularności sieci krystalicznej. Im bardziej 
uboga symetria danego kryształu, tym więcej wyróż¬ 
nionych kierunków, dla których własności sprężyste 
(stałe sprężyste, a co za tym idzie i prędkości dźwięku) 


są różne. Własności sprężyste izotropowych ciał sta¬ 
łych są jednakowe dla różnych kierunków. Ciała izo¬ 
tropowe mogą być albo amorficzne, których struktu¬ 
ra sieci przestrzennej jest przypadkowa — podobnie 
jak w cieczy, albo polikrystaliczne, w których istnieje 
duża ilość przypadkowo zorientowanych ziaren kry¬ 
stalicznych, czyli krystalitów. W teorii ośrodków 
ciągłych zakładamy, że rozmiary tych krystalitów, jak 
również komórek elementarnych w monokryształach 
są małe w porównaniu z cząstką akustyczną. 

W najprostszym przypadku zagadnienie rozchodzę- rozchodzenie 
nia się fal sprężystych w ośrodku rozpatruje się je- się fal 
dnowymiarowo zakładając, że czoło fali jest nieogra- sprężystych 
niczone. Zaburzenie ośrodka przedstawia w-tedy falę 



a) 



b) 




kierunek wychylenia x 


-► x d) kierunek rozchodzenia się fali 

kierunek rozchodzenia się fali 

Rys. 4. Poglądowe przedstawienie przesunięcia cząstek akustycznych (a, b) oraz atomów w nieograniczonym ośrodku stałym (c, d) 
w przypadku fali podłużnej (a, c) i fali poprzecznej (b, d) o odległość równą jednej długości fali 
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41 - Encyklopedia fizyki współczesnej 




























































































































































































przesunięcie 


płaską. Czoło fali przesuwa się w jednym kierunku, 
np. x (rys. 4) tak, że dla każdej wartości współrzędnej 
x wszystkie ruchy cząstek akustycznych względem 
pozostałych współrzędnych y i z są te same. W nieo¬ 
graniczonej przestrzeni trójwymiarowej rozpatruje 
się jako najprostsze fale kuliste (czołem fali jest po¬ 
wierzchnia kulista) (rys. 3). 

W czasie rozchodzenia się fali sprężystej cząstki 
ośrodka wykonują ruch drgający względem swych 
położeń równowagi. Jeżeli ruch ten odbywa się w tym 
fale samym kierunku, w jakim rozchodzi się fala, to falę 
podłużne nazywamy podłużną (rys. 4a), a jeśli odbywa się pro¬ 
stopadle do kierunku fali, to nazywamy ją poprzecz¬ 
ną (rys. 4b). Fale sprężyste w płynach są najczęściej 
falami podłużnymi. Fale poprzeczne występują 
głównie w ciałach stałych, choć mogą istnieć w bardzo 
lepkich cieczach (są jednak silnie tłumione), 
współrzędne Do opisu ruchu fali podłużnej rozpatrywanej 
Lagrange'a w ośrodku płynnym można podejść dwojako. Albo 
i Eulera rozpatrujemy przesunięcie określonej cząstki z jej po¬ 
łożenia równowagi badając dalej jej prędkość i przy¬ 
spieszenie, albo obserwujemy własności ośrodka 
w wybranym punkcie określając przesunięcie, pręd¬ 
kość i przyspieszenie płynu w tym punkcie, bez wzglę¬ 
du na to, które cząstki przechodzą przez punkt roz¬ 
patrywany w różnych czasach obserwacji. W zależ¬ 
ności od tego którą koncepcję przyjmiemy za punkt 
wyjścia, w pierwszym przypadku mamy do czynienia 
ze współrzędnymi Lagrange’a lub tzw. współrzędnymi 
materialnymi (współrzędne związane z daną cząstką), 
w drugim przypadku (rys. 5) ze współrzędnymi Eulera 
lub tzw. przesti cennymi (współrzędne związane 
z punktem przestrzeni). 
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Rys. 5. Porównanie współrzędnych Lagrange’a i Eulera: a) wy¬ 
kres przesunięcia cząstki ośrodka we współrzędnych Lagrange’a 
a oraz współrzędnych Eulera x t b) jednowymiarowa deformacja 
elementu objętości we współrzędnych Lagrange’a i Eulera 


Różnica wynikająca z tych dwóch sformułowań 
odgrywa istotną rolę dopiero przy bardzo dużych na¬ 
tężeniach fal (np. fal o amplitudzie skończonej oma¬ 
wianych w akustyce nieliniowej) nie ma natomiast 
znaczenia przy małych natężeniach (fal o małej ampli¬ 
tudzie omawianych w akustyce liniowej). 

Rozważmy element ośrodka (cząstkę akustyczną) 
w spoczynku — położenie równowagi określa współ¬ 
rzędna a (rys. 1, 5, 6). Gdy pojawi się w ośrodku za¬ 
burzenie (fala sprężysta), cząstka zmieni swoje po¬ 


łożenie na x , przy czym x — o-f gdzie £ oznacza 
przesunięcie cząstki. 

Prędkość cząstki we współrzędnych Lagrange’a 
u L (q , t ) możemy więc wyrazić następująco: 


L dx 

"<*’'> = aT~7T’ 

a z kolei przyspieszenie jako 
du L 

8( ~ 8t 2 * 

położenie równowagi 

^ do 

sita Y — -1 x ' 

wymuszająca = 0 k k k 
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i i ! i 
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ośrodek zaburzony 
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rozprężenie ośrodka 


Rys. 6. Schemat przesunięć cząstek akustycznych w fali podłużnej 
i przedstawienie tego za pomocą modelu składającego się z jed¬ 
nakowych mas związanych jednakowymi sprężynkami o współ¬ 
czynnikach sprężystości k: a) w równowadze, b) w fazie zgęsz- 
czenia, c) wykres zmian przesunięcia w czasie, d) w fazie rozrze¬ 
dzenia 
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Przyjmując, że £ jest wielkością małą, dowolną 
współrzędną Lagrange’a q L można rozwinąć w szereg 
i wyrazić przez współrzędne Eulera q E 


q L (a, t ) = < 7 * 0 , t) 


O 


+ 


z-a+t(z,t) 

8q B O, /) 




£(*, o+... 


W szeregu tym napisaliśmy tylko dwa pierwsze wy¬ 
razy (kreska z podaną u dołu wartością x oznacza, że 
chodzi o wartość q B przy ;c równym podanej war¬ 
tości). 

Podobnie można wyrazić współrzędne Eulera q 
przez współrzędne Lagrange*a q L : 






= ? Ł o.o 


5^ Ł (a, /) 




l(tf> 0 + 


Widzimy, że przesunięcie £, występuje w obydwu ukła¬ 
dach współrzędnych. We współrzędnych Lagrange’a 
jest ono rozumiane jako przesunięcie cząstki począt¬ 
kowo umieszczonej w a i dlatego jest funkcją a i t. 
We współrzędnych Eulera £ jest przesunięciem chwi¬ 
lowym dowolnej cząstki umieszczonej w miejscu 
tutaj £ jest funkcją x i t. 

Rozważmy sytuację dynamiczną. Rys. 6a przedsta¬ 
wia element objętości ośrodka dadydz w spoczynku. 
Załóżmy, że fala płaska przesuwa się w prawo po¬ 
przez ośrodek tak, że w danej chwili cząstki, znajdu¬ 
jące się początkowo w spoczynku w miejscu a prze¬ 
suwają się na odległość £, a cząstki znajdujące się po¬ 
czątkowo w spoczynku w miejscu a-{-da przesuwają 
się o odległość £-{-</£. Ponieważ nowe położenia ścia¬ 
nek elementu ośrodka mogą być zapisane jako x L 
i x L +dx L , więc objętość elementu dV można wyrazić 
jako dV = dx L dy dz (ponieważ nie ma ruchu w kie¬ 
runku y i z, to nie ma potrzeby rozróżnienia dla tych 
kierunków współrzędnych Lagrange’a od Eulera). 
Całkowita masa płynu w objętości dV jest ta sama 
w obydwu wypadkach, czyli 


q 0 da dy dz = Q L dx L dy dz y 

gdzie q 0 oznacza gęstość ośrodka w spoczynku, 
a q l — gęstość płynu przesuniętego. Stąd wynika 
równanie ciągłości w postaci następującej: 


e Ł = co 


da 

dx L 


lub — uwzględniając związek x L — <z+£ — 



Sformułowanie Lagrange’a pozwala bardzo łatwo 
napisać równanie ruchu. Jeśli po lewej stronie ele¬ 
mentu działa ciśnienie p L > a po prawej stronie p L + 
+(cp L ldx L )dx L y wówczas siła wypadkowa działająca 
na cząstkę akustyczną (element płynu) wynosi 
(— dp L jdx L )dx L dy dz (jest skierowana w prawo) i rów¬ 
nanie ruchu ma postać: 


dpi d~$ 

— ~^—dx L dydz = Q 0 dadydz-^- 


lub — 


dp L 

dx L 


exL 

da 


ć 2 £ 


dp L 

da 


gdzie q 0 da dy dz jest masą cząstki akustycznej. 

Z doświadczenia wynika, że proces zmian ciśnienia 
i gęstości w fali akustycznej jest z punktu widzenia ter¬ 


modynamiki procesem adiabatycznym, jak to wykazał 
P.S. Laplace w 1816 r.; do tego czasu, począwszy od 
I. Newtona (1687 r.), uważano falę dźwiękową za 
proces izotermiczny. Prędkość dźwięku dla procesu 
adiabatycznego c 2 = (dp L ldg L ) ad. 

Ponieważ dla gazu równanie adiabaty ma postać 
p = /? 0 (e/(?o) v > gdzie y = C P /CV, Cv — ciepło właściwe 
przy stałej objętości, C P — ciepło właściwe przy sta¬ 
łym ciśnieniu, więc 

2 = ( epL \ - VPo ( g r- yp ° 1 _ 

\će L /ad Qo \Qol Qo I d£ \ y l = 

da) 



Równanie ruchu przekształcimy następująco: 




gdzie c 0 = j /ypjoo — prędkość rozchodzenia się fali 
o małej amplitudzie (w przypadku liniowym). 

Jeżeli w mianowniku pominiemy pochodną d$/da 
jako małą w porównaniu z 1, np. w powietrzu przy 
głośnej rozmowie dę/da jest rzędu 10 -3 , to równanie 
(3) staje się zwykłym równaniem falowym 


a 2 £ _ 2 a 2 £ 

dl 2 C ° ca 2 ' 


(4) 


Rozwiązaniem tego równania jest funkcja £ = 
= £ 0 sin(o>r— ka) y gdzie co — częstość kołowa, k — 
stała propagacji, przy czym co = 2nv oraz k = 2n /A, 
gdzie v — częstość drgań fali, l — długość fali. 

Wykresem tego wzoru na wychylenie jest sinusoida 
przedstawiona na rys. 6d oraz 2a. 

Wyraz d$\da można pominąć, gdy \d£lda\ 1, co 
oznacza że u 0 /c 0 < 1, gdzie u 0 = ct>£ 0 — amplituda 
prędkości cząstki akustycznej i to jest równoważne 
warunkowi |{| < X (por. akustyczne zjawiska linio¬ 
we). Te ostatnie związki wynikają z przeliczeń, jeśli 
£ = £ 0 sin(w/— ka). 

Jeżeli ten rozważany warunek jest spełniony, to nie 
ma potrzeby odróżniać współrzędnych Lagrange'a 
od współrzędnych Eulera i można zmienną a zastąpić 
przez x. W zakresie tego przybliżenia zjawiska aku¬ 
styczne są liniowe, a wówczas gdy wyrazu d$/da nie 
można pominąć w porównaniu z 1, zjawiska przebie¬ 
gają nieliniowo. 

Zjawiska falowe w ośrodkach ciągłych ograniczo¬ 
nych przebiegają inaczej niż w ośrodkach nieograni¬ 
czonych, zwłaszcza gdy rozmiary ograniczonego 
ośrodka stają się porównywalne z długością fali. 
Szczególnie wyraźnie występuje to w odniesieniu do 
ciał stałych, kiedy istnienie ograniczenia prowadzi do 
nowych typów fal sprężystych. Na przykład w ośrod¬ 
ku, którym jest długi pręt, powstają fale dylatacyjne 
(rys. 7), fale skrętne (rys. 8) i fale giętne (rys. 9). Innym 
przykładem fal w ośrodku ograniczonym są fale po¬ 
wierzchniowe (-*• Akustyczne fale powierzchniowa 
i ich zastosowania), z których najbardziej znanymi są 
tzw. fale Rayleigha (na powierzchni granicznej ośrod¬ 
ka stałego lub ciekłego i powietrza). Fale Stonleya 
(na pow-ierzchni rozdzielającej dwa ośrodki stałe), fale 
Lamba zwane również płytowymi (powstają w bla¬ 
chach, niegrubych płytach, powłokach itp. o gru¬ 
bościach porównywalnych z długością fali). Fale po¬ 
wierzchniowa, szczególnie w zakresie mikrofalowym, 
w ostatnich latach często są stosowane w takich urzą- 


643 


przypadek 

I bllda\ < 1 


wpływ ogra¬ 
niczenia 
ośrodka 




















dzeniach, jak ultradźwiękowe linie opóźniające, de- 
flektory i modulatory optyczne (-> Akustyczne zja¬ 
wiska kwantowe). 


IM® 



Rys. 7. Fale dylatacyjne w pręcie: a) rozkład chwilowy defor¬ 
macji, b) schemat rozkładu naprężeń 



Rys. 8. Fale skrętne w pręcie 



Rys. 9. Fale giętne w pręcie: a) chwilowy rozkład deformacji 
b) schematyczny rozkład naprężeń 


się w liniowym przybliżeniu uzyskując zadowalającą 
zgodność z doświadczeniem. Zakłada się, że wielkości 
charakteryzujące pole akustyczne są wzajemnie do 
siebie proporcjonalne, a własności ośrodka opisane 
są przez współczynniki stałe niezależnie od wielkości 
zaburzenia. Takie założenie jest tym dokładniej speł¬ 
nione, im mniejsze są zaburzenia sprężyste ośrodka, 
mówi się więc często o akustycznych zjawiskach linio¬ 
wych jako o falach o małej amplitudzie (lub amplitu¬ 
dzie nieskończenie małej) w przeciwieństwie do fal 
o dużej amplitudzie (lub amplitudzie skończonej) 
w akustycznych zjawiskach nieliniowych. 

Amplitudy przesunięcia cząstki akustycznej w po¬ 
wietrzu w zakresie dźwięków słyszalnych są stosun¬ 
kowo małe i wahają się od rzędu dziesiętnych części 
milimetra dla subiektywnie dużych natężeń, do rzędu 
miliardowych części milimetra dla natężeń ledwie 
dostrzegalnych przez ucho. Na przykład gwizd loko¬ 
motywy wywołujący uczucie bólu w uszach (próg bó¬ 
lu, częstość ok. 1000 Hz) powoduje przesunięcie czą¬ 
stki akustycznej w powietrzu o ok. 10“ 3 mm. Fala 
o tej samej częstości, która jest zaledwie słyszalna 
(próg słyszalności) ma amplitudę przesunięcia rzędu 
10~ 9 mm. Na rys. 10 podane są przykładowo wartości 
ciśnień akustycznych p oraz natężeń dźwięku / w po¬ 
wietrzu w całym zakresie słyszalnym (od progu sły¬ 
szalności do progu bólu) dla częstości 1000 Hz. Wiel¬ 
kości te wyrażone są również (środkowy słupek) w po¬ 
wszechnie używanej w akustyce skali logarytmicznej 
(decybelowej). Za pomocą tej skali określa się względ¬ 
ne wartości ciśnień, czy natężeń jako tzw. poziom 
L(dB) ciśnienia lub natężenia dźwięku, zgodnie z re¬ 
lacjami ; 

U dB) = 10lg/// 0 = 10 ]g(ptp 0 ) 2 = 20\gp/p 0 , 

gdzie dla fali płaskiej / = p 2 fqc y q — gęstość, c — 
prędkość dźwięku, I 0 = 10“ 12 W/m 2 oraz p 0 = 2*10“ 5 
N/m 2 odpowiadają wartościom progu słyszalności. 
Dla poziomów powyżej 100 dB efekty nieliniowe stają 
się już mierzalne. 


Ograniczenia ośrodków powodują poza tym po¬ 
wstawanie odbić lub załamań fal sprężystych na tych 
granicach. W płynach zjawiska te przebiegają w spo¬ 
sób dość prosty, w ciałach stałych są bardziej złożone. 

Ilustracja 151 (tabl. 41) przedstawia fotografię fali 
ultradźwiękowej ulegającej załamaniu przy przejściu 
z jednego ośrodka ciekłego do drugiego, il. 154 (tabl. 
41) natomiast falę ulegającą załamaniu i odbiciu przy 
przejściu przez płytkę mosiężną zanurzoną w wodzie. 
W pierwszym przypadku mamy pojedynczą falę pa¬ 
dającą i pojedynczą falę załamaną. W drugim przy¬ 
padku podłużna fala padająca na płytkę pod wybra¬ 
nym kątem wzbudza w niej falę Lamba, która z kolei 
wypromieniowuje falę wtórną na swej drodze, 
dyfrakcja na Wystąpienie w ośrodku ciągłym obszarów nie- 
przeszkodach ciągłych porównywalnych z długością fali prowadzi 
do zjawiska dyfrakcji (ugięcia) fal sprężystych. Przy¬ 
kład dyfrakcji fali ultradźwiękowej na przeszkodzie 
walcowej przedstawia il. 152 (tabl. 41). 
powstawanie Bardzo często fale akustyczne w ośrodkach płyn- 
dźwięku w nych powstają przy przepływie. Szczególnie silnym 
wirach źródłem fal dźwiękowych są zawirowania strumienia 
ośrodka (turbulencja). W zakresie słyszalnym wiele 
hałasów jest tego pochodzenia. Na il. 153 (tabl. 41) po¬ 
kazano przykładowo powstawanie fal akustycznych 
w wirach strumienia powietrza wypływającego z dyszy. 


Akustyczne zjawiska liniowe 

Antoni Śliwiński 

Zjawiska związane z rozchodzeniem się fal spręży¬ 
stych w ośrodkach ciągłych, gdy zaburzenia (zmiany 
ciśnienia, gęstości) są małe, w porównaniu z wiel¬ 
kościami określającymi stany równowagi, rozpatruje 
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Rys. 10. Porównanie wartości ciśnienia akustycznego i natężenia 
dźwięku I wyrażonych w skali liniowej i w skali decybelowej lo¬ 
garytmicznej (L) 


Pojęcie wielkości amplitudy określamy względem 
długości fali akustycznej i zjawiska akustyczne mo¬ 
żemy uważać za liniowe, jeżeli amplituda przesunię¬ 
cia £ jest znacznie mniejsza od długości fali |£| < I. 
Wtedy procesy rozchodzenia się fal sprężystych 
w ośrodku opisuje równanie falowe: 

ć 2 £ _ 2 ć 2 £ 

St* C 8y ł ’ 

którego rozwiązaniem dla przypadku jednowymiaro¬ 
wego jest fala płaska (tabl. 155, ił. 41): 

£ = £ 0 sma>(f—^-j. 
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Natomiast dla przypadku trójwymiarowego rozwią¬ 
zaniem jest fala kulista 



gdzie r — promień fali, £' — przesunięcie cząstki dla 
fali kulistej. Amplituda fali kulistej Yjr zależy od¬ 
wrotnie proporcjonalnie od odległości od źródła, 
gdzie — amplituda na powierzchni źródła (kuli 
pulsującej) dla r = r 0 . 

Istotne dla zjawisk liniowych w polu akustycznym 
fali płaskiej jest to, że pomiędzy wielkościami charak¬ 
teryzującymi pole akustyczne: przesunięciem cząstki 
I, prędkością cząstki di/c/ł, względnymi zmianami 
gęstości S = Jg/g i ciśnieniem akustycznym p zacho¬ 
dzą związki: 

dQ I x\ ds © / x\ 

W = = -5-cos.^— T j. 

<5 = <$ 0 cosco|/—yj, p =/? 0 cosco|/ — 

gdzie ę 0 a> = d^ 0 ldt — amplituda prędkości cząstki 
akustycznej, S 0 — amplituda względnych zmian 
gęstości, po — amplituda zmian ciśnienia akustycz¬ 
nego. 

Stosunek ciśnienia akustycznego p do prędkości 
cząstki d$fdt jest wielkością stałą dla fali płaskiej 
i charakterystyczną dla danego ośrodka; nazywa się 
oporem akustycznym właściwym ośrodka i wynosi 

gdzie o 0 — gęstość ośrodka w równowadze (niezabu- 
rzonego). 

Charakterystyczne dla zjawisk liniowych jest to, że 
kształt fali nie zależy od odległości od źródła. Ośro¬ 
dek, w którym to zachodzi, nazywa się akustycznym 
ośrodkiem liniowym. Zakłada się, że taki ośrodek jest 
ośrodkiem idealnym, tzn. z jednej strony jest zdolny 
odkształcać się, aby przenieść zaburzenie, zaś z dru¬ 
giej strony jego własności przy deformacjach nie ule¬ 
gają zmianie, co oznacza, że np. 

Q 0 Z°o+Óq, p^pĄ-dp, 

czyli zmieniona wielkość prawie nie różni się od wiel¬ 
kości przy równowadze, przed zaburzeniem. Konsek¬ 
wencją tych założeń jest to, że matematyczny opis 
zjawisk jest taki sam zarówno we współrzędnych 
Lagrange ł a jak i we współrzędnych Eulera. 

W stosunku do akustycznych zjawisk liniowych 
obowiązuje zasada tzw. superpozycji liniowej, co 
oznacza, że przy spotkaniu się kilku fal, fala wypad¬ 
kowa jest sumą fal składowych. Spotykające się fale 
interferują między sobą (nakładają się) w obszarze 
wzajemnego przenikania się, jednak nie powstają 
żadne fale dodatkowe w wyniku tego wzajemnego od¬ 
działywania (oddziaływania fonon-fonon). Interferen¬ 
cja fal jest typowym zjawiskiem liniowym (il. 156, 
tabl. 41) (—► Holografia akustyczna). 

Przy analizie zjawisk dyfrakcyjnych (ugięcia fal)zwy- 
kle zakłada się, że spełniona jest zasada superpozycji 
liniowej (zasada Huygensa) i pole dyfrakcyjne jest 
wynikiem nałożenia na siebie fal, które na skutek ugię¬ 
cia zmieniły kierunek rozchodzenia się (ii. 157, tabl. 
41). Falę złożoną (wypadkową) można wyrazić jako 
sumę składowych o różnych częstościach niezależnych 
od siebie (rys. 11). 

W odniesieniu do źródeł akustycznych (układów 
drgających) jak również przetworników akustycznych 
(układów przetwarzających energię akustyczną na 
inne rodzaje energii) mówimy, że są liniowe, jeśli pro¬ 
cesy w nich zachodzące nie zależą od amplitudy drgań 
lub amplitudy sygnałów przenoszonych. Własności 




Rys. 11. Przykład fali złożonej z dwóch składowych o różnych 
częstościach: a) schemat superpozycji, b) widmo prążkowe 


takich układów można opisać za pomocą współczyn¬ 
ników stałych (rys. 12). 

W układach liniowych: 

— drgania okresowe są stabilne (tzn., że małe dzia¬ 
łania na układ powodują małe zmiany jego ruchu), 

— drgania swobodne układów tłumionych gasną, 

— w układzie o n stopniach swobody istnieje tylko 
n częstości własnych (rezonansowych), 

— częstości własne układu zależą tylko od współ¬ 
czynników charakteryzujących układ. 

Przykładem liniowego układu akustycznego jest 
tzw. rezonator Helmholtza (rys. 13); drgania po¬ 
wietrza w szyjce rezonatora zależą tylko od masy 
akustycznej m a = QqI/s 9 podatności akustycznej c a = 
= Yo/yPo i oporu akustycznego r a = r/s 2 , gdzie q 0 — 
gęstość, / — długość szyjki rezonatora, s — po¬ 
wierzchnia przekroju szyjki, r — opór mechaniczny 




Rys. 12. Liniowy 
mechaniczny układ 
drgający o jednym 
stopniu swobody; 
k — współczynnik 
sprężystości — sprę¬ 
żyny, r opór me¬ 
chaniczny 


rezonator 

Helmholtza 



Rys. 13. Liniowy akustyczny układ drgający (rezonator Hełm- 
holtza): a) schemat budowy; V 0 objętość, l długość szyjki, s po¬ 
wierzchnia przekroju szyjki ,p ciśnienie; b) drgania tłumione takie¬ 
go układu 


p-sygnał wejściowy 

.. ■ r 

sygnał wyjściowy (napięcie U) 

(ciśnienie akustyczne p 0 ) 

* 

U - Sp Q 


przetwornik 
liniowy (mikrofon) 

Rys. 14. Przykład mikrofonu jako przetwornika liniowego 
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Rys. 15. Odebrany mikrofonem czysty ton w powietrzu w dwóch 
odległościach od źródła: a) 0,5 m, b) 5 m 



tarcia wprowadzający tłumienie, V 0 — objętość rezo¬ 
natora, p 0 — ciśnienie w równowadze, 
mikrofony Przykładem liniowych przetworników akustycznych 
głośniki mogą być dobre (nie zniekształcające) mikrofony lub 
głośniki, których stosunek sygnału odbieranego do 
przekazywanego jest wielkością stałą niezależną od 
wielkości tego sygnału (rys. 14). 

U/p = S = const; 

S — nazywa się skutecznością (lub czułością) mikro¬ 
fonu i nie zależy od wielkości sygnału. 
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Na rys. 15 przedstawiono przykład pomiaru po¬ 
jedynczego tonu o częstości 1000 Hz w powietrzu za 
pomocą mikrofonu i oscyloskopu (układ liniowy) 
przy dwóch różnych odległościach od źródła. Jak 
widać, na skutek zwiększenia odległości od źródła 
dźwięku zmniejszyła się tylko amplituda dźwięku, 
a sinusowa postać sygnału nie uległa zniekształceniu. 
W przypadku tego słabego sygnału powietrze można 
uważać za ośrodek liniowy. Na rys. 16 przestawiony 
jest podobny pomiar dla dźwięku złożonego, którego 
charakter widma również nie ulega zmianie przy zmia¬ 
nie odległości. 


Akustyczne zjawiska nieliniowe 

Antoni Śliwiński 

Zjawiska akustyczne nie przebiegają liniowo, gdy 
zaburzenie sprężyste ośrodka jest duże w porównaniu 
z wielkościami określającymi jego stan równowagi. 
W zjawiskach nieliniowych nie można przyjąć zało¬ 
żenia, że amplituda wychylenia cząstki akustycznej 
w fali sprężystej jest bardzo mała w porównaniu z dłu¬ 
gością fali (|£| # Ż). W zjawiskach nieliniowych 
mamy do czynienia z tzw. falami o amplitudzie skoń¬ 
czonej, w przeciwieństwie do fal o amplitudzie nie¬ 
skończenie małej, w zjawiskach liniowych, a opis 
matematyczny ich rozchodzenia się uzyskuje się 
jako rozwiązanie nieliniowych równań różniczko¬ 
wych. Istotą akustycznych zjawisk nieliniowych 
jest to, że stosunki pomiędzy wielkościami cha¬ 
rakteryzującymi pole akustyczne nie są stałe, 
lecz zależą od wielkości zaburzenia. Im wię¬ 
ksze zaburzenie, tym większe są efekty nieliniowe. 

Typowymi akustycznymi zjawiskami nieliniowymi 
są: zniekształcenia frontu falowego w miarę przebiegu 
przez ośrodek (rys. 17) oraz występowanie ciśnienia 
promieniowania fali (ciśnienia wywieranego przez 
czoło fali na ośrodek) powodującego stały przepływ 
ośrodka w kierunku rozchodzenia się fali sprężystej 
tzw. „wiatr akustyczny” (il. 163, tabl. 42). Do aku¬ 
stycznych zjawisk nieliniowych należą również takie 
zjawiska jak kawitacja ultradźwiękowa, fale uderze¬ 
niowe, oddziaływania dźwięku z dźwiękiem (oddzia¬ 
ływania fonon-fonon), przy których zasada superpo¬ 
zycji nie jest spełniona. 

W zakresie dźwięków słyszalnych efekty nieliniowe 
są bardzo rzadko brane pod uwagę. Są one mierzalne 
dopiero przy poziomach natężeń dźwięku powyżej 
100 dB i występują np. przy przelotach samolotów 
odrzutowych, szczególnie przy przekroczeniu bariery 
dźwięku, gdy powstaje fala uderzeniowa (ang. boom 
lub franc. bang, rys. 18), przy wybuchach i innych sil¬ 
nych a krótkotrwałych (impulsowych lub udarowych) 
zjawiskach akustycznych. 

Zjawiska nieliniowe stają się szczególnie wyraźne 
w zakresie ultradźwięków, ponieważ w miarę wzrostu 
częstości, a więc zmniejszenia się długości fali, uzy¬ 
skanie dużych amplitud w porówaniu z długością 
fali jest stosunkowo coraz łatwiejsze. 

Uwzględnienie efektów nieliniowych w matema¬ 
tycznym opisie fal sprężystych wymaga wyrazów 
wyższych rzędów i opis wyraźnie zależy od tego czy 
używamy podejścia Lagrange’a, czy też Eulera. 
W odniesieniu do gazów równanie falowe z uwzględ¬ 
nieniem efektów nieliniowych we współrzędnych 


Lagrange’a ma postać (równanie 3): 

równanie fal 

S*i cl S‘i 

sprężystych 

St* i Si \ v+l Sa * ' 

( l+ ar) 

w gazach 


W przypadku cieczy równanie stanu p == p(q> S ), 
gdzie p — ciśnienie, q — gęstość, S — entropia, przyj¬ 
muje się w postaci rozwinięcia w.szereg Taylora: 









Rys. 17. Postępujące zniekształcenie fali w przypadku dużej 
amplitudy, a) Schemat: 1 — blisko źródła — kształt sinusoidalny; 
2 — w pewnej odległości od źródła — kształt piłowaty ale jeszcze 
ciągły; 3 — w odległości krytycznej jL* — fala stała się nieciągła, 
b) Odebrany mikrofonem sygnał L — 130 dB czystego tonu 
(1000 Hz) w powietrzu i jego zniekształcenie: lb w odległości 
0,5 m od źródła; 2b w odległości 2,5 m od źródła; 3b w odległości 
5 m od źródła 


wirialne 

równanie 

stanu 


(£) 

2 \ Bq z )s,p~p 0 


P = Po + 

+ 


£o) + 
(Q-Qo) 2 + , 


co można przy pominięciu wyrazów wyższego rzędu 
niż drugi zapisać jako 




Rys. 18. Fala uderzeniowa. Źródło dźwięku (zaburzenia) porusza 
się szybciej niż dźwięk: a) fotografia cieniowa poruszającej się 
kuli karabinowej: b) schemat rozchodzenia się fal dźwiękowych 
(kulistych) i tworzenie się frontów fali uderzeniowej, gdy źródło 
porusza się z prędkością większą od prędkości dźwięku 


A y B — nazywają się pierwszym i drugim współczyn¬ 
nikiem wirialnym i zależą od temperatury, p 0 i go od¬ 
powiadają równowadze ośrodka. A = Q 0 cl, natomiast 

/ dp \ m 

B/A = 2 e 0 c 0 (dc/cp)s,p-p 0 , gdzie c = ^ —jest 

prędkością dźwięku. Stosunek B/A jest miarą efektów 
nieliniowych w cieczach. Wprowadzenie go do rów¬ 
nania falowego ( B/A = y— 1) prowadzi do równania 



Rozwiązanie tego równania daje wzór na prędkość 
rozchodzenia się fali sprężystej o skończonej ampli¬ 
tudzie 

c = cj[ 1 + (B/2A) («/c 0 )j, 


co oznacza, że zależy ona od prędkości cząstki aku¬ 
stycznej u = d£/dt. Prędkość cząstki akustycznej u 
jest wielkością okresowo zmienną i zmienia fazę co 
pół okresu fali (rys. 17a (2)) przyjmując odpowiednio 
wartości +u w fazie zagęszczenia i —w w fazie roz¬ 
rzedzenia (dla fali podłużnej). Z powyższego wzoru 
wynika, że fala porusza się w fazie zgęszczenia z pręd¬ 
kością c = c 0 (l-\-bu), a więc szybciej, natomiast 
w fazie rozrzedzenia z prędkością c = c 0 ( 1 — bu), 
a więc wolniej (w tych wzorach przyjęto b — B/2Ac 0 ). 
Prowadzi to do deformacji kształtu fali wraz z odle¬ 
głością przebywaną przez falę, przy czym deformacja 
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fala 

uderzeniowa 


równanie fal 
sprężystych 
w cieczach 


zniekształ¬ 
cenia frontu 
falowego 




















ta narasta do pewnej odległości krytycznej, przy której 
fala przyjmuje kształt przedstawiony na rys. 17a(3), 
odpowiadający doścignięciu rozrzedzenia przez zgę- 
szczenie. W rzeczywistości efekt wyprzedzania nie 
może zachodzić dalej, gdyż istnieje skok od zgęszcze- 
nia do rozrzedzenia i równowaga możliwa jest tylko 
jako nieciągłość ośrodka w tym miejscu — tworzy się 
fala uderzeniowa (udarowa). Odległość krytyczna dla 
utworzenia takiego frontu udarowego wynosi 



gdzie X — długość fali, p a — amplituda ciśnienia aku¬ 
stycznego przy źródle. Zniekształcenie frontu falowe¬ 
go jest wyrazem powstawania wyższych harmonicz¬ 
nych rozchodzącej się fali. Istnienie składowych har¬ 
monicznych można wykazać przez ich odfiltrowanie 
z fali głównej. Michajłow i Szutiłow (wg których jest 
analiza 160 z tabl. 42) byli pierwszymi, którzy zastosowali 
zniekształceń meto ^ optyczną do analizy nieliniowych zniekształ¬ 
ceń fal ultradźwiękowych. Zasadę takiej analizy wy¬ 
jaśnia poglądowo rys. 19. W przypadku fali akustycz¬ 
nej o małym natężeniu (rys. 19a) jej kształt jest sinu¬ 
soidalny i wtedy rozkład natężeń światła ugiętego jest 
symetryczny względem wiązki nieugiętej, natomiast 
w przypadku fali akustycznej o dużym natężeniu 


się w ostatnich latach bardzo wiele uwagi. Większość 
prac dotyczy wyznaczania stałych elastycznych wyż¬ 
szych rzędów oraz analizy niedoskonałości siatki 
krystalicznej (-► Wzbudzenia elementarne w ciałach 
stałych). Zjawisko powstawania wyższych harmonicz¬ 
nych przy rozchodzeniu się fali ultradźwiękowej 
w ciałach stałych zostało wykorzystane do parame¬ 
trycznego wzmacniania fal ultradźwiękowych. 


Akustyczne procesy molekularne 

Antoni Śliwiński 

Akustyczne procesy molekularne występują jako od¬ 
działywanie fali sprężystej przechodzącej przez ośro¬ 
dek z jego drobinami. Oddziaływanie to polega na 
wymianie energii pomiędzy falą a poszczególnymi 
stopniami swobody drobin (rys. 20). W zależności 
od częstości fali sprężystej oddziaływanie może być 
procesem bardziej lub mniej nieodwracalnym z punktu 
widzenia przenoszenia energii przez falę, dlatego 
w różnych zakresach częstości procesy molekularne 
w różnym stopniu wpływają na tłumienie (absorpcję) 
fali akustycznej. W niektórych zakresach częstości 
wpływ ten jest bardzo duży i jego wynikiem jest wy¬ 
stępowanie charakterystycznego dla danego ośrodka 




kształt fali 
ultradźwiękowej 

kształt fali 
świetlnej 



rozkład natężeń 
w obrazie ugięciowym 


ciśnienie 

promienio¬ 

wania 


(rys. 19b) jej kształt jest zdeformowany, piłokształtny 
i rozkład natężeń światła ugiętego jest niesymetryczny 
(por. il. 160, tabl. 42). 

Działanie ciśnienia promieniowania, które powo¬ 
duje przepływ ośrodka (il. 163, tabl. 42) w kierunku 
fali, ma specyficzny charakter na granicy dwóch oś¬ 
rodków. W szczególności na granicy ciecz-powietrze, 
gdy falę ultradźwiękową dużej mocy promieniuje się 
pionowo do góry (il. 162, tabl. 42), powstaje nad swo¬ 
bodną powierzchnią cieczy charakterystyczna fon¬ 
tanna. Wytrysk fontanny następuje wtedy, gdy siły 
pochodzące od ciśnienia promieniowania przewyższą 
siły napięcia powierzchniowego. Wysokość fontanny 
jest tym większa, im większe jest natężenie fali ultra¬ 
dźwiękowej. Kierunek działania siły na granicy dwóch 
ośrodków zależy od stosunku wartości gęstości ener¬ 
gii akustycznej w tych ośrodkach. Gdy W x > W z 
{W 1 — gęstość energii w ośrodku, w którym znajduje 
się źródło fali, W 2 — gęstość energii w drugim ośrod¬ 
ku), to siła wywołująca fontannę działa zgodnie 
z biegiem fali, natomiast gdy W z < W u to siła ma 
zwrot przeciwny do biegu fali. W przypadku szcze¬ 
gólnym, gdy fala ultradźwiękowa przechodzi przez 
granicę ośrodków bez odbicia, to natężenia fali 
w obydwu ośrodkach są sobie równe i zachodzi zwią¬ 
zek 

W x c x = W 2 c 2y 


gdzie Cjl i c 2 — prędkość rozchodzenia się dźwięku 
odpowiednio w ośrodku pierwszym i drugim. Wynika 
stąd, że dla c x > c 2 będzie W 2 > W x (siła ciśnienia 
promieniowania przeciwna do biegu fali), a dla c x < c 2 
będzie W 2 < W x (siła zgodna z biegiem fali). Gdy gra¬ 
niczą ze sobą dwa ośrodki ciekłe nie mieszające się ze 
sobą, to w zależności od rodzaju ośrodka mogą za¬ 
chodzić obydwa przypadki (il. 161, tabl. 42). 

Efektom nieliniowym w ciałach stałych poświęca 
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Rys. 19. Schematyczne 
przedstawienie kształ¬ 
tu fal przy dyfrakcji 
światła na fali ultra¬ 
dźwiękowej: a) przy 
małym natężeniu fa¬ 
li ultradźwiękowej, b) 
przy dużym natężeniu 
fali ultradźwikowej 


fala akustyczna 



fala akustyczna 
o zmniejszonej energii 


energia zostaje odebrana 
przez wewnętrzne stopnie; 

swobody cząsteczek 
(oscylacyjne i rotacyjne) 


Rys. 20. Schemat procesu tłumienia fali akustycznej przez pro¬ 
cesy molekularne w ośrodku 


maksimum tłumienia. Zwykle towarzyszy temu poja¬ 
wienie się dyspersji prędkości rozchodzenia się fali, 
czyli jej zależności od częstości. 

W klasycznym opisie zjawisk akustycznych nie 
bierze się pod uwagę procesów molekularnych, które 
zachodzą przy zmianach stanu ośrodka, gdy prze¬ 
chodzi przez niego fala sprężysta. 

Tłumienie fal dźwiękowych w ośrodku opisuje się 
za pomocą tzw. amplitudowego współczynnika tłu¬ 
mienia a, który wyraża względny zanik amplitudy na 
jednostkę przebytej przez falę drogi: 


gdzie: A — amplituda fali sprężystej, dA — zmiana 
amplitudy na drodze dx y minus oznacza, że amplituda 
maleje, lub za pomocą tzw. energetycznego współ¬ 
czynnika tłumienia y, przy czym y = 2a, gdyż przyj¬ 
muje się (w zakresie akustycznych zjawisk liniowych), 
że natężenie fali, równe liczbowo energii przepływa¬ 
jącej przez jednostkę przekroju w jednostce czasu, 
jest proporcjonalne do kwadratu amplitudy. 


efekty 
nieliniowe 
w ciałach 
stałych 


amplitudowy 
i energetycz¬ 
ny współ¬ 
czynnik 
tłumienia 















klasyczny 

współczynnik 

tłumienia 


W ujęciu klasycznym przyjmuje się, że jedynymi 
czynnikami wpływającymi na tłumienie dźwięku są 
lepkość (tarcie wewnętrzne) ośrodka oraz przewod¬ 
nictwo cieplne (w mniejszym stopniu promieniowanie 
cieplne). Zgodnie z obliczeniami przeprowadzonymi 
przez Stokesa oraz Kirchhoffa tzw. klasyczny współ¬ 
czynnik tłumienia dźwięku powinien być wprost pro¬ 
porcjonalny do kwadratu częstości fali akustycznej 
zgodnie z wzorem 




gdzie: v jest częstością fali dźwiękowej, t] — współ¬ 
czynnikiem lepkości stycznej, q — gęstością, c — 
prędkością dźwięku, * = Cp/cv y c p jest ciepłem właści¬ 
wym przy stałym ciśnieniu, cv — ciepłem właściwym 
przy stałej objętości. Zatem a/v z = a' powinno być 
niezależne od częstości fali, ale już stosunkowo dawno 
stwierdzono (Nieklapajew i Lebiediew w 1911 r.), że 
współczynnik tłumienia a' w niektórych gazach a tak¬ 
że i cieczach wykazuje odstępstwa od wzoru. Rysunek 
21 pokazuje takie odstępstwo w C0 2 w temperaturze 
pokojowej. Absorpcję dźwięku inną niż przewiduje 
to akustyka klasyczna można w zadowalający spo¬ 
sób wyjaśnić za pomocą molekularnej (relaksacyjnej) 
teorii absorpcji dźwięku. 



r p Rys. 21. Porównanie wartości doświadczalnych (kropki) współ¬ 
czynnika tłumienia dźwięku n — ccX w dwutlenku węgla z wyni¬ 
kami obliczeń na podstawie wzoru klasycznego (krzywa przery¬ 
wana) i wzoru relaksacyjnego (krzywa ciągła) 






Współczynnik tłumienia fal sprężystych a oraz 
prędkość rozchodzenia się dźwięku c w danym oś¬ 
rodku są wielkościami dla niego charakterystycznymi. 
W ujęciu klasycznym nie tylko a' = a/v 2 , ale również 
c nie powinno zależeć od częstości. Jeżeli w ośrod¬ 
kach rzeczywistych pojawia się zależność od częstości, 
to możemy wyciągnąć wniosek, że jest to wynik mole¬ 
kularnych oddziaływań ośrodka z falą sprężystą. 
Akustyczne procesy molekularne są różne w zależ¬ 
ności od reakcji ośrodka na pobudzenie energią fali 
akustycznej. W cieczach i gazach spotykamy głównie 
relaksację termiczną i strukturalną, zwaną inaczej 
objętościową. 

relaksacja W pierwszym przypadku są to procesy związane 
termiczna z wymianą energii pomiędzy falą a poszczególnymi 
stopniami swobody ruchu cząsteczek (zewnętrzny¬ 
mi — translacyjnymi, wewnętrznymi — rotacyjnymi 
i oscylacyjnymi). Są one analogiczne do procesów 
aktywacji termicznej tych stopni swobody, polegają¬ 
cych na uzyskiwaniu przyrostów energii kinetycznej 
poszczególnych cząsteczek na skutek zmian tempera¬ 
tury. 

relaksacja W drugim przypadku są to procesy związane z wy- 
strukturalna mianą energii pomiędzy falą a cząsteczkami lub zespo¬ 
łami cząsteczek (asocjatami) w taki sposób, że nastę¬ 
puje zmiana struktury molekularnej, np. jest to prze¬ 
chodzenie jednych struktur w drugie (przegrupowania 
atomów), albo dysocjacja czyli rozpad cząsteczek lub 
ich zespołów, a czasami jest to proces odwrotny, czyli 
asocjacja (łączenie). 


Procesy relaksacji polegają na opóźnieniu reakcji 
zaburzonego ośrodka (odchylonego od stanu równo¬ 
wagi) względem samego zaburzenia (fali sprężystej), 
o pewien czas r zwany czasem relaksacji potrzebnym 
na powrót do równowagi. Wynikiem tego opóźnienia 
jest przesunięcie fazowe powstające między falą (ciś¬ 
nieniem akustycznym) a reakcją ośrodka, a więc zmia¬ 
nami temperatury, zmianami ruchu wewnętrznych 
stopni swobody, zmianami struktury itp. Konsekwen¬ 
cją tego opóźnienia fazowego jest dodatkowe tłumie¬ 
nie fali akustycznej; energia, która wzbudziła układ 
molekularny i jest z opóźnieniem przez niego odda¬ 
wana (w innej fazie) nie może być z powrotem przez 
falę przejęta. 

Tej absorpcji relaksacyjnej równolegle towarzyszy 
dyspersja prędkości dźwięku, tj. jej zależność od czę¬ 
stości fali. Jest ona wynikiem tego, że dla różnych czę¬ 
stości omówione wyżej przesunięcia fazowe są różne. 

W przypadku relaksacji strukturalnej (przy tworze¬ 
niu się i rozpadaniu asocjatów np. za pośrednictwem 
wiązania wodorowego w wodzie, alkoholach i wielu 
innych cieczach, w polimerach, przy przejściach fazo¬ 
wych itd.) obserwuje się stosunkowo dużą dyspersję 
dźwięku, natomiast przy relaksacji termicznej (np. 
przy wzbudzaniu rotacyjnych stopni swobody cząste¬ 
czek związków organicznych w różnych stanach izo¬ 
merycznych) dyspersja prędkości dźwięku jest mała, 
niekiedy zupełnie niemierzalna. 

Wyrażenie na współczynnik tłumienia a' z uwzględ¬ 
nieniem określonego procesu molekularnego zależ¬ 
nego od częstości można przedstawić następująco: 



dyspersja 

prędkości 

dźwięku 


współczynnik 

tłumienia 

relaksacyj¬ 

nego 


gdzie stała B — odpowiada klasycznej części tłumie¬ 
nia, natomiast drugi składnik zdaje sprawę z dodat¬ 
kowego tłumienia molekularnego (relaksacyjnego) 
a re i/v 2 , A — stała, v — częstość fali akustycznej, v m — 
tzw. częstość relaksacji, przy której występuje maksi¬ 
mum tłumienia relaksacyjnego, przy czym 


Vm = 


1 cv 

llZT Ca ’ 


r — czas relaksacji, który określa czas powrotu sta¬ 
nu zaburzonego do stanu równowagi, cv — ciepło 
właściwe przy stałej objętości, c a — część ciepła właści¬ 
wego przy stałej objętości związana z wewnętrznymi 
stopniami swobody cząsteczki, która absorbuje i od¬ 
daje (wypromieniowuje z pewnym opóźnieniem) 
energię fali akustycznej. 

Często wprowadza się współczynnik tłumienia 
(bezwymiarowy) odniesiony do długości fali X: 





(c — prędkość dźwięku). Wówczas w obszarze rela¬ 
ksacji 


JMrel — CC rei X — AcVn 


V/V m 


i+(v/v m y 


vlVm 

l +(ylvm) 2 ' 


( 6 ) 


/Wc — Acv m /2 dla v = v«, czyli dla 2kvt ~ 1. 


Prędkość dźwięku w obszarze relaksacji określa na¬ 
stępujący wzór dyspersyjny 


c 

Co 



CO 2 T 2 
1 +C0 2 T 2 



(7) 


wzór 

dyspersyjny 


gdzie co = 2nv, e = l-d/c%, c 0 jest prędkością 
dźwięku dla małych częstości (co -► 0) poniżej obsza¬ 
ru dyspersji, a c <*, jest prędkościądźwięku dla bar¬ 
dzo wysokich częstości (c -► oo) powyżej obszaru 
dyspersji. 
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współczynnik tłumienia dźwięku // 


Na rys. 22 pokazane są przykładowe zależności 
ol — a/v 2 , yUrei = ocrei A i c/c 0 jako funkcje częstości 
v w obszarze relaksacji zgodnie z równaniami (2-7). 

Dla pojedynczych procesów molekularnych (o jed¬ 
nym czasie relaksacji), np. w układzie z dwoma sta¬ 
nami konfiguracji izomerowej znajomość y max oraz 
Vm wystarcza do scharakteryzowania procesu. // m ax 
zależy tylko od wielkości termodynamicznych, nato- 



częstość r 

Rys. 22. Zależność wielkości a/w 2 , tx = aX oraz c/c 0 od częstości 
określone przez równania (5), (6) i (7) dla pojedynczego procesu 
relaksacji; v m &x — 50 MHz, c 0 = 1,2* 10* ems' 1 , A = 
= 524-10- ł7 s*/cm, B = 70-10- l7 s J /cm (wg J. Lamba) 


miast v m określone jest przez kinetykę procesu. Na 
przykład w układzie złożonym z dwóch rodzajów izo¬ 
merów /Umax związane jest z różnicą energii pomiędzy 
dwoma stanami odpowiadającymi równowadze kon¬ 
figuracyjnej, zaś v m określa wysokość bariery poten¬ 
cjału dla wewnętrznej rotacji drobiny, /w* oraz 
podstawy v m są przedmiotem wielu eksperymentalnych pomia- 
spektresko- rów, w szczególności ,bada się ich zależność od tem- 
pii ultra- peratury i ciśnienia. Zależności doświadczalne pozwa- 
dźwiękowej łają wyznaczać energię aktywacji oraz parametry ki¬ 
netyczne procesów molekularnych. Takie postępo¬ 
wanie leży u podstaw spektroskopii ultradźwięko¬ 
wej. Powyższy opis procesu o jednym czasie relaksacji 
można rozszerzyć na przypadek, gdy istnieje więcej 
niż jeden obszar relaksacji, tzn. odnieść również do 
procesów o wielu czasach relaksacji. 

Na rys. 23 podany jest schematyczny spektrogram 
dla bromku izobutylowego, który pokazuje różne 
procesy relaksacyjne w odpowiednich obszarach 



częstość r 

Rys. 23. Zależność współczynnika tłumienia fi = aX dla bromku 
izobutylowego od częstości v dla dwóch temperatur: — I40°C 
i 0°C. Pionowe linie odpowiadają częstościom relaksacyjnym 
vm i tłumieniom // m *x dla każdego z procesów relaksacyjnych. 
Linie przerywane przedstawiają schematycznie przebiegi tłu¬ 
mienia fi w różnych zakresach częstości, w których dominują 
procesy relaksacyjne związane z wymianą energii fali z różnymi 
stopniami swobody cząsteczki. Niektóre obszary zachodzą na 
siebie, dają się jednak rozdzielić przy obniżeniu temperatury 
(wg Litovitza i Dayisa) 
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częstości. Porównanie górnego (dla temperatury 
— 140°C) i dolnego (dla temperatury 0°C) rysunku 
pozwala zauważyć, jak przesuwają się zakresy relak¬ 
sacyjne w zależności od temperatury. W praktyce za¬ 
kres pomiarowy jest w skali częstości ograniczony; 
zmiany temperaturowe pozwalają więc odpowiednio 
przesuwać położenie na skali częstości. Zmiany ciś¬ 
nienia w gazach wywołują również przesunięcie ob¬ 
szarów relaksacyjnych. Bada się wtedy y w zależności 
od stosunku v/p , gdzie p — ciśnienie gazu. 

Zjawiska relaksacji strukturalnej odgrywają dużą 
rolę przy rozchodzeniu się ultradźwięków w układach 
niejednorodnych, np. w pobliżu przejść fazowych, 
gdzie obserwuje się występowanie ostrego maksimum 
tłumienia dźwięku oraz charakterystycznego mini¬ 
mum dla prędkości rozchodzenia się dźwięku (rys. 24 
i 25). 


10 17 s 2 /cm 



Rys. 24. Zależność od temperatury współczynnika tłumienia 
a(v 2 i prędkości rozchodzenia się c fali ultradźwiękowej o czę¬ 
stości 2 MHz w alkoholu etylowym C 2 H 5 OH w pobliżu punktu 
krytycznego (/* = 243,1°C) (przejścia ciccz-para); wg N.F. Noz- 
driewa 



temperatura 

Rys. 25. Zależność prędkości rozchodzenia się podłużnej fali 
sprężystej rozchodzącej się w kierunku [100] w NH 4 CI w pobliżu 
punktu przejścia fazowego ,,porządek”-, .nieporządek” (wg 
P.D. Lazaya) 

Bardzo interesująco przebiegają akustyczne pro¬ 
cesy molekularne w ciekłym helu szczególnie w po¬ 
bliżu punktu A, poniżej którego (w helu II) występuje 
zjawisko nadpłynności (—► Nadpłynność). W ostatnich 
doniesieniach w literaturze spotyka się prace doty¬ 
czące dalszych faz helu — helu III i helu IV. Tłuma- 
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czy się je zwykle za pomocą tzw. modelu dwucieczo- 
wego, w myśl którego hel II jest mieszaniną dwu cie¬ 
czy nie oddziałujących na siebie: jednej normalnej 
a drugiej kwantowej. W myśl tego modelu w helu II 
powstają dwie fale akustyczne odpowiadające tym 
dwu cieczom. Jedna z nich o prędkości c x — (dpjdę)* 
zwana dźwiękiem normalnymi ub „pierwszym dźwię¬ 
kiem”, oraz druga o prędkości c 2 = (j?«/e«) S*(dTldS) P , 
zwana „drugim dźwiękiem” (lub naddźwiękiem), 
gdzie p — ciśnienie, q — gęstość, przy czym q = Qn + 
-f (Qn — gęstość składowej normalnej, g s — gęstość 
składowej nadciekłej), S — entropia, T — tempera¬ 
tura. 

dźwięk „Pierwszy dźwięk” jest zwyczajną falą sprężystą, 
„pierwszy" w której obydwa składniki helu II poruszają się ra¬ 
zem i wykazują periodyczne zmiany ciśnienia i gę¬ 
stości (rys. 26a). „Drugi dźwięk” co do swej natury 
nie jest falą dźwiękową w sensie zmian gęstości i ciś¬ 
nienia, jest to natomiast fala zmian temperatury 
i entropii przy stałej gęstości, gdy obydwa składniki 
poruszają się względem siebie (rys. 26b). 




Rys. 26. Schemat ułożenia cząstek przy rozchodzeniu się w helu 
II dźwięku pierwszego (a) i drugiego (b). Punkty niebieskie 
i czarne oznaczają odpowiednio cząstki akustyczne cieczy nor¬ 
malnej i nadpłynnej 

dźwięk Rozchodzenie się „drugiego dźwięku” w He II zo- 
„drugi" stało po raz pierwszy zaobserwowane przez Pieszko¬ 
wa w 1944 r. Wytwarzał on zmienną temperaturę za 
pomocą zanurzonego w He II drucika, przez który 
płynął prąd zmienny o częstości kilku kHz i odbierał 
falę „drugiego dźwięku” za pomocą termopary z fo- 
sforo-brązu. 

Rysunek 27 przedstawia wynik pomiaru absorpcji 
„pierwszego dźwięku” w ciekłym helu (He) fali ultra- 



temperatura 

Rys. 27. Tłumienie dźwięku pierwszego o częstości 12 MHz 
w ciekłym helu w pobliżu punktu przemiany X. Linia przerywana 
(pozioma) oznacza tłumienie obliczone w oparciu o teorię kla¬ 
syczną (wg Atkinsona) 


dźwiękowej o częstości 12 MHz. Powyżej punktu X 
w helu I tłumienie przebiega zgodnie z teorią kla¬ 
syczną. W okolicy punktu X tłumienie silnie i anormal¬ 
nie wzrasta, w okolicy temperatury 1 K występuje 
bardzo regularne maximum tłumienia. Tego rodzaju 
tłumienie dźwięku w ciekłym helu zostało wyjaśnione 
przez Landaua i Kalatnikowa na gruncie kwantowym 
jako występowanie dwóch procesów rozpraszania 
fononów na fononach (proces pięciofononowy) oraz 
fononów z rotonami (kwanty energii rotacyjnej). 
Każdemu z tych procesów odpowiada określony czas 
relaksacji: r ff oraz T /r . 

Relaksacyjnemu tłumieniu w pobliżu punktu /. od¬ 
powiada również wyraźna dyspersja fal ultradźwię¬ 
kowych (rys. 28). 



nych pomiarów (wg Atkinsona) 


Z uwagi na duże analogie przejścia fazowego X 
w ciekłym helu do przejścia ze stanu przewodnictwa 
do nadprzewodnictwa w metalach (-* Nadprzewod¬ 
nictwo) przeprowadza się również w niektórych labo¬ 
ratoriach na świecie badania tych przejść metodami 
ultradźwiękowymi. Ostatnio analogię tę przeniesiono 
(de Genne) na przejście fazowe smektyk A-nema- 
tyk w ciekłych kryształach (-► Ciekłe kryształy). 
Ultradźwiękowe badania tego przejścia w ciekłym 
krysztale CBOOA (N-/>-cyjanobenzilideno-i?-/i-ok- 
tylooksyanilina) wykazały występowanie maksimum 
tłumienia fal ultradźwiękowych, którego charakter 
odpowiada przejściu typu X (rys. 29). 

Badania akustycznych procesów molekularnych są 
tym ciekawsze, im większe są częstości stosowanych 



Rys. 29. Tłumienie fali ultradźwiękowej o częstości 5 MHz 
w pobliżu temperatury tk przejścia smektyk A-ncmatyk, 
w ciekłym krysztale CBOOA (wg R. Bartolino, F. Scudieri, 
D. Sctte i A, Śliwiński) 


tłumienie 
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fa! sprężystych, gdy długość fali staje się bardziej 
współmierna z rozmiarami molekularnymi, rozwijają 
się więc szczególnie w zakresie hiperdźwiękowym. 

W ciałach stałych odpowiednikiem akustycznych 
procesów molekularnych są oddziaływania fali sprę¬ 
żystej z atomami sieci krystalicznej (-► Wzbudzenia 
elementarne w ciałach stałych) i jej defektami oraz 
swobodnymi nośnikami ładunku. 

Akustyka molekularna jak i kwantowa bardzo się 
w ostatnich latach rozwinęły dzięki coraz to większym 
możliwościom eksperymentalnych badań ultradźwię¬ 
kowych i hiperdźwiękowych w pełnym zakresie 
widma częstości fal sprężystych. W wielu laborato¬ 
riach na świecie (również w Polsce) prowadzi się 
obecnie badania akustycznych procesów molekular¬ 
nych a wyniki wykorzystuje się np. w chemii, biologii, 
czy materiałoznawstwie. 


Ultradźwięki i hiperdźwięki 

Antoni Śliwiński 

Fale sprężyste o częstościach powyżej słyszalnych to 
jest powyżej 16 kHz — częstość taką przyjmuje się 
jako granicę słyszalności, nazywa się ultradźwiękami 
(naddźwiękami), przy czym terminem tym obejmuje 
się zjawiska do częstości 10® Hz. Fale sprężyste, któ¬ 
rych częstość przewyższa 10® Hz, nazywa się hiper- 
dźwiękami. Hiperdźwiękowy zakres zjawisk spręży¬ 
stych kończy się od góry naturalną granicą wyzna- 
gramce czoną dla danego ośrodka przez częstość odpowia- 
częstości dającą długości fali porównywalnej z odstępami mię- 
hiper- dzyatomowymi. Fale sprężyste o mniejszych dłu- 
dźwięków gościach nie mogą powstać, gdy znikają warunki ko¬ 
nieczne dla ich rozprzestrzeniania się (to jest znika 
możliwość przekazania zaburzenia sprężystego jako 
energii mechanicznej pomiędzy atomami w drodze 
bezpośredniej). W kryształach te graniczne częstości 
przypadają w zakresie 10 12 -10 13 Hz. W powietrzu 
pod normalnym ciśnieniem hiperdźwięki właściwie 
nie mogą się rozchodzić, gdyż już przy częstości 
10® Hz długość fali staje się porównywalna ze średnią 
drogą swobodną cząsteczek. W cieczach hiperdźwię¬ 
ki wytwarzane są przez cieplne fluktuacje gęstości 
i teoretyczną górną granicą jest tutaj 10 u Hz. 

Hiperdźwięki zostały wydzielone w osobną grupę, 
której dolną granicą jest 109 Hz, ponieważ dotych¬ 
czasowe metody eksperymentalne nie pozwalały 
wytwarzać i następnie odbierać fal sprężystych w oś¬ 
rodkach o częstościach większych niż 10® Hz. Gra¬ 
nica ta jednak przesuwa się coraz wyżej (w mono¬ 
kryształach udało się wzbudzić i odbierać fale sprę¬ 
żyste, których częstość wynosiła 8-10 13 Hz). Z dru¬ 
giej strony częstości fal sprężystych wzbudzonych 
przez cieplne drgania atomów w sieci krystalicznej, 
ruchy oscylacyjne cząsteczek, jak również cieplne 
fluktuacje gęstości w cieczach obejmują zakres czę¬ 
stości powyżej 10® Hz. 

własności W przeciwieństwie do ultradźwięków, które wy- 
ultradźwię- twarzamy i odbieramy jako koherentne (spójne) wiąz- 
ków i hiper- ki fal sprężystych, hiperdźwiękowe fale cieplne (tzw. 
dźwięków debayowskie) stanowią zbiór fal niekoherentnych 
rozchodzących się we wszystkich możliwych kierun¬ 
kach wewnątrz ciała, które rejestrujemy tylko pośred¬ 
nimi metodami wykorzystując zjawiska akustoop- 
tyczne (-> Akustyczne zjawiska kwantowe). 

Ultradźwięki, a tym bardziej hiperdźwięki, odzna¬ 
czają się małymi długościami fal, np. przy częstości 
16 kHz długość fali w powietrzu wypada ok. 2 cm, 
w cieczach ok. 8 cm, w ciałach stałych ok. 30 cm, 
natomiast przy 10® Hz długość fali w powietrzu byłaby 
ok. 3 10“ 4 cm, w cieczy rzędu 1,2-10" 4 i w ciele 
stałym 4-10“ 4 cm. W zakresie hiperdźwiękowym dłu¬ 
gości fal sprężystych stają się porównywalne z dłu¬ 
gościami światła widzialnego (400-800 nm), w gra¬ 
nicznym przypadku w ciałach stałych przy częstości 
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10 l2 -10 13 Hz długości fal sprężystych wynoszą od 
5-0,5 nm. 

Niewątpliwie małe długości fal ultra- i hiperdźwię¬ 
kowych zadecydowały o specjalnym ich zastosowaniu. 

Dzięki małym długościom fal ultradźwięki można 
wizualizować za pomocą światła (zjawiska akusto- 
optyczne), można je ogniskować i kształtować w wiąz¬ 
ki o dobrej kierunkowości (-> Akustyka morza, 

—> Holografia akustyczna) i można mówić z dobrym 
przybliżeniem o promieniach ultradźwiękowych. zastoso- 

Dzięki małym długościom fal a wysokim często- wanie ultra- 
ciom (natężenie jest proporcjonalne do kwadratu czę- dźwięków 
stości) można stosunkowo łatwo otrzymywać ultra¬ 
dźwięki o dużym natężeniu (dziesiątki W/cm 2 ), przy 
którym pojawiają się zjawiska nieliniowe nie wystę¬ 
pujące przy falach o małej amplitudzie. 

Jeśli długości fał ultradźwiękowych stają się porów¬ 
nywalne z wielkością niejednorodności lub ziarnisto¬ 
ści ośrodka, w szczególności z rozmiarami określają¬ 
cymi jego strukturę molekularną, wtedy charakter 
rozchodzenia się tych fal zależy wyraźnie od własności 
ośrodka. Badając prędkość rozchodzenia się i tłumie¬ 
nia fal ultradźwiękowych możemy określać procesy 
molekularne w różnych ośrodkach (-*■ Badanie oś¬ 
rodków za pomocą ultradźwięków). Oddziaływa¬ 
nie fal ultradźwiękowych o dużych częstościach 
ze strukturą ośrodka prowadzi do wystąpienia zja¬ 
wisk, które wykazują kwantowy charakter tych pro¬ 
cesów. 

Do wytwarzania i odbioru ultradźwięków stosuje przetworniki 
się różne urządzenia zwane przetwornikami ultra- ultradźwię- 
dźwiękowymi. Przetwarzają one energię określonego ko we 



Rys. 30. Generator Hartmanna — źródło periodycznych zmian 
ciśnienia z częstością ultradźwiękową: a) schemat, b) fotografia 
cieniowa wytwarzanej fali. Gaz wypływa z dyszy z prędkością 
naddźwiękową. Naprzeciwko dyszy ustawiony jest rezonator, 
który powoduje wzmocnienie ciśnienia akustycznego: a) schemat, 
b) fotografia wytworzonej przez niego fali 





Rys. 31. Piszczałka Pohlmana-Jankowskiego. Wypływająca 
z dyszy D ciecz wzbudza drgania rezonansowe płytki P o czę¬ 
stości ultradźwiękowej; A > B — węzły drgań płytki 






















układu nieakustycznego, drgającego z częstością ultra¬ 
dźwiękową, w energię akustyczną (przetworniki na¬ 
dawcze — generatory ultradźwiękowe) lub odwrot¬ 
nie — energię akustyczną w energię innego rodzaju 
(przetworniki odbiorcze). W zależności od rodzaju 
energii, która jest przetwarzana na akustyczną lub od¬ 
wrotnie, rozróżniamy generatory lub odbiorniki ultra¬ 
dźwiękowe mechaniczne, elektryczne, magnetyczne, 
cieplne, chemiczne i optyczne. Przetwornikami odwra¬ 
calnymi nazywają się takie, które działają w obydwu 
kierunkach z równymi sprawnościami. Różne rodzaje 
przetworników ultradźwiękowych dzieli się na grupy 
biorąc za podstawę zasadę działania wykorzystującą 
określone zjawisko fizyczne, w którym zachodzi prze¬ 
twarzanie jednej energii w drugą. 

przetworniki Przetworniki mechaniczne stanowiące czyste oscy- 

mechaniczne latory mechaniczne jak piszczałki, syreny (generatory) 
i radiometry (odbiorniki) są w większości przypadków 
nieodwracalne, czyli używane albo jako nadajnik albo 
jako odbiornik. Układy takie służą najczęściej do wy¬ 
twarzania i odbioru ultradźwięków dużej mocy w za¬ 
kresie częstości rzadko kiedy przekraczającym 50kHz. 
Generatory tego typu mają duże zastosowanie w oś¬ 
rodkach gazowych (np. syrena, generator Hartmanna 
widoczny na rys. 30 do koagulacji dymów) i rzadziej 
ciekłych (np. piszczałka Pohlmana-Jankowskiego 
widoczny na rys. 31 do tworzenia emulsji, np. homo¬ 
genizacji śmietanki). 

Szczególną rolę spełniają przetworniki umożliwia¬ 
jące wizualizację pola ultradźwiękowego stosowa¬ 
ne w optosonice (-►Akustyczne zjawiska kwan¬ 
towe) i w holografii akustycznej (-► Holografia akus¬ 
tyczna). 

Radiometry ultradźwiękowe służą do pomiaru na¬ 
tężenia fal ultradźwiękowych wykorzystując ciśnienie 
promieniowania wywierane przez falę ultradźwiękową 
na powierzchnię prostopadłą do kierunku rozchodze¬ 
nia się (rys. 32). 

Przetworniki piezoelektryczne i elektrostrykcyjne 
działają na zasadzie zjawiska piezoelektrycznego (wy¬ 
stępującego w monokryształach piezoelektrycznych) 
i elektrostrykcyjnego (występującego w polikryszta- 
łach piezoelektrycznych), które polegają na powsta¬ 
waniu deformacji sprężystych w wyniku przyłożenia 
pola elektrycznego. Efekty te są odwracalne i wykorzy- 
tuje się je w nadajnikach i odbiornikach ultradźwięko¬ 
wych w zakresie częstości od 20 kHz do 10 GHz. Tego 
rodzaju przetworniki zadecydowały w ciągu ostatnich 
50 lat o olbrzymim rozwoju ultradźwięków. Rysunki 
33 i 34 ilustrują zastosowanie płytki piezoelektrycznej 



piezoelektrycznej i posrebrzona po obu płaskich stro- przetworniki 
nach) jako nadajnik i jako odbiornik. Zwykle tak piezoelektry- 
dobiera się grubość płytki, aby wzbudzane drgania czne 
mechaniczne odpowiadały jej drganiom rezonanso¬ 
wym (gdy d — 2/2). Istnieje więc odwrotna proporcjo¬ 
nalność pomiędzy grubością płytki d a częstością 



-1- odbiornik 

piezoelektryczny (efekt 
«- + * y* +■*■ piezoelektryczny prosty) 
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— ) *a MBSHH j piezoelektryczny 

G c O c (efekt piezoelektry- 

wzrost zmniejszenie czny odwrotny) 

grubości grubości 

cl d) 

Rys. 33. Wykorzystanie efektu piezoelektrycznego w ultradźwię¬ 
kowym przetworniku fal podłużnych (w przypadku kwarcu 
o cięciu X): jako odbiornika (a i b) oraz nadajnika (c i d). Roz¬ 
kład ładunku powstającego na elektrodach przy ściskaniu (a) 
oraz przy rozciąganiu (b). Zwiększenie grubości płytki (c) oraz 
zmniejszenie grubości płytki (d) wywołane przez przykładane 
napięcie 
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Rys. 34. Wykorzystanie efektu piezoelektrycznego w ultradźwię¬ 
kowym przetworniku fal poprzecznych (w przypadku kwarcu 
o cięciu Y ): jako odbiornika (a) i (b) oraz nadajnika (c) i (d). 
Rozkład ładunku przy ścinającym odkształceniu: dodatnim (a) 
oraz ujemnym (b). Odkształcenie ścinające ujemne (c) oraz do¬ 
datnie (d) wywołane przez przykładane napięcie 


drgań rezonansowych v: d = c/2v, gdzie c — pręd¬ 
kość dźwięku w płytce. Rysunek 35 pokazuje przy¬ 
kład sprzężenia płytki piezoelektrycznej z ośrodkiem. 



celem lepszego dopasowania, u oznacza napięcie zmienne, d — 
grubość płytki równą A/2 oraz la — średnica płytki (zwykle kilka 
centymetrów) 

do którego wprowadzamy (lub z którego odbieramy) 
drgania ultradźwiękowe. przetworniki 

Przetworniki magnetostrykcyjne oparte są na zja- magneto- 
wisku magnetostrykcji, czyli zmian objętości pod strykcyjne 
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wpływem pola magnetycznego; budowane są z ma¬ 
teriałów ferromagnetycznych (metali ferromagnetycz¬ 
nych lub ferrytów). W większości wypadków są one 
używane w zakresie częstości do 40 kHz, chociaż moż¬ 
na je także stosować w zakresie wyższych częstości. 
Niekiedy przetworniki magnetostrykcyjne stosuje się 
w zakresie megaherców, a nawet gigaherców. Na rys. 
36 przedstawiony jest prętowy przetwornik magneto- 


milimetrowej do określania rozkładu pola ultradźwię¬ 
kowego w cieczach (-** Fizyka morza) pracujący do 
częstości ok. 30 MHz. 

Do wytwarzania i odbioru fal ultradźwiękowych 
i hiperdźwiękowych (o częstościach aż do 10 10 Hz) 
stosuje się specjalne techniki, które rozwinęły się w 
ostatnich latach i ciągle są ulepszane. Osiągnięciem 
w tej dziedzinie było opracowanie w 1958 r. metody 


prętowy 

przetwornik 

magneto- 

strykcyjny 



Rys. 36. Schemat działania prętowego przetwornika magneto- 
strykcyjnego. Stałe pole magnetyczne o indukcji B 0 wprowadza 
magnetyczną polaryzację materiału, zmienne pole magnetyczne 
o indukcji Bi powoduje okresowe wydłużenie się i kurczenie pręta 


strykcyjny pobudzany elektromagnesem w warunkach 
rezonansu. 

Istnieje jeszcze wiele innych rodzajów przetworni¬ 
ków ultradźwiękowych opartych na przykład na efek¬ 
tach termicznych, używanych zwłaszcza do pomiarów 
natężenia fal ultradźwiękowych, lub — na efektach 
chemicznych, służących do określania na przykład wy¬ 
dajności ultradźwiękowych procesów chemicznych. 

W zakresie mniejszych częstości stosowane są rów- 



Rys. 37. Ultradźwiękowy 
miniaturowy mikrofon ty- 
taniano-barowy do po¬ 
miaru rozkładu pola ultra¬ 
dźwiękowego o rozmia¬ 
rach kilku milimetrów 


wytwarzania podłużnych i poprzecznych fal w pręcie 
kwarcowym przez umieszczenie go w rezonatorze mi¬ 
krofalowym (rys. 38). Koniec pręta kwarcowego (lub 
innego kryształu piezoelektrycznego) umieszcza się 
we wnęce rezonatora mikrofalowego, tak jak to po¬ 
kazuje rys. 38b. Energia elektromagnetyczna zostaje 
doprowadzona do rezonatora za pomocą falowodu 
mikrofalowego. Zmienne pole elektryczne wywołuje 
odkształcenie piezoelektryczne w objętym przez sie¬ 
bie obszarze. Fale akustyczne generowane są tylko 
w tym obszarze, a więc w powierzchniowej warstwie 



do termometru pręt kwarcowy 


generacja 
we wnęce 
mikrofalowej 


odbiorniki Odbiorniki ultradźwiękowe można podzielić na 
wiązek dwie grupy: na duże w porównaniu z długością fali, 
i sondy które służą zwykle do odbioru całej wiązki ultra¬ 
dźwiękowej (wtedy są większe od jej przekroju — re¬ 
jestrują wartość sygnału uśrednioną na całą po¬ 
wierzchnię, rys. 32), i na bardzo małe w porównaniu 
z długością fali (np. mniejsze od 0,U), i które działają 
jak sonda i służą do określania wartości pola ultra¬ 
dźwiękowego (ciśnienie akustyczne, prędkość cząstki 
lub natężenie) w danym punkcie. Rysunek 37 przed¬ 
stawia piezoelektryczny mikrofon-sondę o średnicy 


Rys. 38. Metoda wytwarzania hiperdźwięków we wnęce mikro¬ 
falowej: a) sprzężenie pręta piezoelektrycznego z polem elek¬ 
trycznym w rezonatorze mikrofalowym, b) kompletny układ na¬ 
dawczo-odbiorczy 


poprzecznej pręta na lewym jego końcu, rozchodzą 
się wzdłuż niego i odbijają od drugiego końca. W do¬ 
świadczeniu przedstawionym na rys. 38b prawy ko¬ 
niec pręta umieszczony jest w bliźniaczej wnęce rezo¬ 
nansowej i fala akustyczna na końcu pręta wzbudza 
drgania mikrofalowe, czyli zostaje odebrana i zareje¬ 
strowana w układzie odbiorczym. Porównanie sygna- 
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łu odebranego z sygnałem nadanym pozwala wyzna¬ 
czyć tłumienie fali akustycznej i jej prędkość w próbce. 
W innych rozwiązaniach opartych na metodzie im¬ 
pulsowej rejestruje się sygnał odbity za pomocą tego 
samego falowodu. 

Metoda generacji fal hiperdźwiękowych w pręcie 
piezoelektrycznym umieszczonym w rezonatorze mi¬ 
krofalowym ograniczona jest do badania rozchodze¬ 
nia się ich w tym samym pręcie. Przekazanie fali do 
innej próbki wiąże się z dużymi stratami, które po¬ 
wstają na granicy zetknięcia pręta piezoelektrycznego 
z próbką, nawet przy bardzo dokładnym doszlifowa¬ 
niu obydwu powierzchni, czy też stosowaniu odpo¬ 
wiednich warstewek sprzęgających. Problem genera¬ 
cji hiperdźwięków w próbkach z dowolnego materiału 
przetworniki został rozwiązany głównie przez zastosowanie cien- 
cienko- kich warstw magnetostrykcyjnych lub piezoelektrycz- 
warstwowe nych, które osadza się bezpośrednio (metodą napyla¬ 
nia katodowego, naparowania lub elektrolitycznie) 
na powierzchni próbki. 

Aby materiał mógł stanowić cienkowarstwowy 
przetwornik piezoelektryczny powinien mieć nastę¬ 
pujące własności: duży opór elektryczny, duży stopień 
orientacji krystalograficznej przy osadzaniu, łatwość 
osadzania, dużą wartość współczynnika sprzężenia 
elektromechanicznego (kwadrat tego współczynnika 
jest równy stosunkowi otrzymanej energii mechanicz¬ 
nej drgań do wprowadzonej energii elektrycznej). Ta¬ 
kim materiałem okazał się siarczek kadmu i chociaż 
jego współczynnik sprzężenia elektromechanicznego 
nie jest szczególnie duży w porównaniu z innymi ma¬ 
teriałami, jednak dzięki stosunkowo dużej łatwości 
osadzania, zyskał największą popularność (rys. 39). 
Warstewki monokrystaliczne mają grubości rzędu 
0,3-3 pm, co odpowiada podstawowym częstościom 
własnym (grubość równa A/2) rzędu 10 9 -10 10 Hz. 



pręt z Al 2 0 3 


Rys. 39. Przykład wzajemnej orientacji kierunków krystalogra¬ 
ficznych warstewki piezoelektrycznej CdS łub ZnS oraz jej 
podłoża — pręta Al 2 O a (wg J. de Klerka) 


Rysunek 40 przedstawia przykład pobudzenia cien¬ 
kowarstwowego przetwornika piezoelektrycznego w 
mikrofalowej wnęce rezonansowej do drgań podłuż¬ 
nych (rys. 40a). Rysunek 40b przedstawia fotografie 
mikrofalowych rezonatorów wnękowych rozłożonych 
na części. Przedstawiony tu układ jest nadawczo-od¬ 
biorczy, składa się więc z dwóch identycznych wnęk 
połączonych ze sobą poprzez badaną próbkę; jest to 
metoda przepuszczania. Sygnał wejściowy doprowa¬ 
dza się jednym falowodem, a wyjściowy odprowadza 
się drugim. 

przetworniki Specjalny rodzaj przetworników cienkowarstwo- 
z warstwą wych stanowią układy piezoelektryczne półprzewod- 
zaporową nikowe z warstwą zaporową. Warstwa zaporowa 
powstaje przy zetknięciu metalu i półprzewodnika 
(rys. 41) albo dwóch półprzewodników typu p i n. Po¬ 
nieważ poziomy Fermiego (poziomy energetyczne, dla 
których prawdopodobieństwo obsadzeń elektronów 
w atomach siatki jest 50%) (— Wzbudzenia elemen¬ 
tarne w ciałach stałych) w metalu i w półprzewodniku 
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Rys. 40. Podwójny rezonator wnękowy z próbką i warstewkami 
nadawczą i odbiorczą dla pobudzenia drgań podłużnych — polo 
E s : a) schemat,b) fotografia rezonatora (wg J. de Klerka) 
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Rys. 41. Tworzenie się warstewki zaporowej na powierzchni 
zetknięcia metalu i półprzewodnika (wg Bcechama): a) płytka 
metalu i płytka półprzewodnika o różnych poziomach Fermiego, 
b) wyrównanie poziomów Fermiego, c) przebieg charakterystyki 
prądowo-napięciowej, d) schemat przetwornika z warstwą za¬ 
porową, e) schemat przetwornika z warstwą dyfuzyjną 
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zastosowanie 
złącza nad¬ 
przewodzą¬ 
cego 
do generacji 
i detekcji 


różnią się między sobą, powstaje po zetknięciu płytek 
napięcie kontaktowe, które jest wynikiem wyrówna¬ 
nia tych poziomów. Warstwa zaporowa stanowi prze¬ 
strzeń wolną od ładunku, który zostaje przesunięty 
poza nią, dzięki temu wytwarza się różnica potencja¬ 
łów; jfest ona rzędu 1 V dla przeciętnych układów 
metal-półprzewodnik (np. arsenek galu-złoto). Wiel¬ 
kość napięcia kontaktowego (Kd) jest wprost propor¬ 
cjonalna do różnicy pracy wyjścia z metalu (& m ) i pra¬ 
cy wyjścia z półprzewodnika (0 P ): 


gdzie ą — ładunek elementarny elektronu. Warstwa 
ta jest bardzo cienka i ma duży opór elektryczny, przy 
czym jej otoczenie jest przewodzące. Przyłożenie ze¬ 
wnętrznego pola elektrycznego do warstwy zaporo¬ 
wej zmienia jej grubość. 

Jeżeli użyty półprzewodnik jest piezoelektrykiem, 
to efekt piezoelektryczny będzie możliwy tylko we¬ 
wnątrz warstwy zaporowej, a poza nią — gdzie prób¬ 
ka przewodzi — nie będzie występował (zwarcie). Gdy 
do warstwy przyłożymy zmienne napięcie elektryczne, 
dzięki efektowi piezoelektrycznemu będzie ona drgać 
generując w próbce falę sprężystą. Fala sprężysta prze¬ 
chodząc z warstwy zaporowej do próbki półprzewod¬ 
nika napotyka ten sam opór akustyczny, gdyż własno¬ 
ści mechaniczne warstwy zaporowej i próbki półprze¬ 
wodnika są takie same (ten sam ośrodek). Dopaso¬ 
wanie jest więc doskonałe. 

Przetworniki piezoelektryczne z warstwą zaporową 
są stosowane często w układach impulsowych; wtedy 
zewnętrzne pole stałe przykłada się też tylko impul¬ 
sowo, aby nie przegrzewać układu. 

Interesujące są też możliwości wykorzystania złą¬ 
cza nadprzewodzącego (-* Zjawiska tunelowe w nad¬ 
przewodnikach) do generacji i detekcji fal hiperdźwię- 
kowych. Pozytywne rezultaty w tym zakresie uzyskali 
po raz pierwszy Eisenmenger i Dayem w 1966 r. 

Zjawisko Josephsona polega na tym, że jeżeli dwa 
ciała nadprzewodzące zbliżyć do siebie zachowując 
między nimi przerwę izolacyjną rzędu kilku nanome¬ 
trów, to przez tę przerwę może płynąć prąd w wyniku 
tunelowego przejścia elektronów (zjawiska tunelowa¬ 
nia) przez przerwę złącza. Mogą wystąpić dwie skła¬ 
dowe prądu tunelowego: stała i zmienna. Zjawisku 
tunelowego przejścia niesparowanych elektronów 
przez warstwę izolującą (przerwę energetyczną) mię¬ 
dzy dwoma nadprzewodnikami towarzyszy dwustop¬ 
niowa emisja fononów relaksacyjnych — w rezultacie 
zmiany poziomów energetycznych elektronów, które 
uległy tunelowaniu, i rekombinacyjnych — w rezulta¬ 
cie łączenia się elektronów w pary (pary Coopera). 
Emitowane fonony tworzą falę hiperdźwiękową. Uży¬ 
wa się tutaj złączy z nadprzewodników o grubościach 
rzędu 100 nm oddzielonych przerwą rzędu 1 nm i po¬ 
wierzchni generującej ok. 1 mm 2 . 

Do uzyskania zjawiska tunelowania niesparowa¬ 
nych elektronów konieczna jest wstępna polaryzacja 
elektryczna złącza nadprzewodzącego takim napię¬ 
ciem, aby odpowiadało ono szerokości przerwy ener¬ 
getycznej (rys. 42a), to znaczy żeby był spełniony wa¬ 
runek V ^ 2 A/e, gdzie V — napięcie przyłożone, A — 
szerokość przerwy energetycznej, e — ładunek elek¬ 
tronu. Przy przerwach energetycznych rzędu 1 MeV 
występujących w znanych nadprzewodnikach uzysku¬ 
je się fale hiperdźwiękowe o częstościach od 100 GHz 
do 1 THz. 

Jeżeli napięcie V < 2J/e, to takie samo złącze może 
służyć do detekcji fal hiperdźwiękowych (rys. 42). 
Wtedy absorpcja fononów wywołuje wzbudzenie elek¬ 
tronów przechodzących (dzięki zjawisku tunelowa¬ 
nia) przez przerwę tworząc prąd, który jest proporcjo¬ 
nalny do ilości fononów czyli natężenia fali hiper- 
dźwiękowej. 

Dzięki zastosowanym metodom superdużych czę¬ 
stości bardzo rozwinęły się w ostatnich latach badania 
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ciała stałego metodami akustycznymi (-► Akustyczne 
zjawiska kwantowe). 

Ultradźwięki w całym zakresie częstości mają ol¬ 
brzymie zastosowanie techniczne, każdy jednak rodzaj 



Rys. 42. Półprzewodnikowy model poziomow energetycznych dla 
złącza utworzonego z dwóch identycznych nadprzewodników: 
a) Generacja fononów, cV ^ 2J; energia Ei tunelujących elek¬ 
tronów jest zawarta w przedziale A ^ Et ^ e V- 2A. Maksymalne 
energie emitowanych fononów relaksacyjnych (£> m »x) i fono¬ 
nów rekombinacyjnych (2J) są zaznaczone przy odpowiednich 
wężykowatych strzałkach oznaczających poglądowo akty emisji 
fononów; b) Detekcja fononów,0 < eV < 2J; energia absorbo¬ 
wanego fononu (strzałka wężykowata) przechodzi w energię 
wzbudzenia tunelowego elektronu 


zastosowań związany jest z określonym obszarem czę¬ 
stości. 

Zastosowanie ultradźwięków może być czynne 
i bierne. Zastosowanie czynne polega na stosowaniu 
średnich i dużych natężeń powodujących zmiany nie¬ 
odwracalne lub częściowo nieodwracalne w nadżwię- 
kawianym ośrodku. Zastosowanie bierne polega na 
używaniu tak słabych wiązek, że nie wpływają one de¬ 
strukcyjnie na ośrodek, w którym się rozchodzą, na¬ 
tomiast pozwalają badać jego własności. W czynnych 
zastosowaniach zmiany w ośrodku związane są też ze 
zjawiskami nieliniowymi, z których najistotniejsze 
znaczenie mają kawitacja ultradźwiękowa i przepły¬ 
wy akustyczne. 

Powstającej w silnym polu ultradźwiękowym kawi¬ 
tacji polegającej na tworzeniu się i zapadaniu pęche¬ 
rzyków (il. 158, tabl. 42) towarzyszy wiele efektów 
wtórnych: procesy chemiczne, luminescencja ultra¬ 
dźwiękowa czyli tzw. sonoluminescencja (il. 159, tabl. 
42), procesy biologiczne i inne. 

Użycie ultradźwięków dużej mocy pozwala przepro¬ 
wadzać procesy technologiczne, które innymi meto¬ 
dami są niewykonalne lub bardzo skomplikowane, jak 
np. obróbka twardych i kruchych materiałów, spawa¬ 
nie materiałów różniących się bardzo własnościami 
(metale, plastyki), otrzymywanie stopów ze składni¬ 
ków różniących się znacznie temperaturami topnienia 
i gęstościami itp. Ultradźwięki przyspieszają i polep¬ 
szają takie procesy, jak oczyszczanie, trawienie po¬ 
wierzchni, otrzymywanie zawiesin oraz otrzymywanie 
emulsji i areozoli. 

Osobną grupę stanowi zastosowanie ultradźwięków 
w medycynie i biologii. W tej dziedzinie zastosowanie 
również może być czynne (działanie na tkanki i orga¬ 
nizmy żywe, przy czym dzięki możliwościom ognisko¬ 
wania ultradźwięków działanie takie można precyzyj¬ 
nie lokalizować), jak i bierne — do celów diagno¬ 
stycznych. Terapia i diagnostyka ultradźwiękowa 
uczyniła w ostatnich kilku latach bardzo duże postępy 
i bardzo rozpowszechnia się jej zastosowanie. Na ilu¬ 
stracji 180 (tabl. 46) podana jest fotografia ultradźwię¬ 
kowego przyrządu do diagnostyki oka (oftalmografu) 
polskiej konstrukcji. Na ilustracji 181 (tabl. 46) po¬ 
kazany jest obraz ultradźwiękowy płodu w łonie matki. 

Stosunkowo niedawno (od kilku lat) w medycynie 
zaczęto stosować z dużym powodzeniem urządzenia 
oparte na zasadzie Dopplera do obserwacji elemen¬ 
tów ruchomych w organizmie. Tą metodą określa się 
przepływ krwi w naczyniach krwionośnych, określa 
i wizualizuje ruchy zastawek serca itp. 

W zastosowaniu biernym oprócz badań nieniszczą¬ 
cych (-* Badania ośrodków za pomocą ultradźwię- 
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rów) mających na celu określenie struktury ośrodka 
lub jego defektów istotne jest określenie własności 
lepkosprężystych wielu materiałów. Do tego celu ko¬ 
nieczne jest wykonanie precyzyjnych pomiarów współ¬ 
czynnika tłumienia a i prędkości rozchodzenia się 
dźwięku c. Na il. 164 (tabl. 43) mamy np. zestaw po¬ 
miarowy do wyznaczania prędkości i tłumienia ultra¬ 
dźwięków w cieczach w zakresie częstości 1-60 MHz. 
Pomiary tłumienia i prędkości dźwięku ważne są w 
pełnym zakresie częstości od najniższych do najwyż¬ 
szych. W zakresie hiperdźwiękowym np. (powyżej 
osiągalnej eksperymentalnie granicy 10 10 Hz dla gene¬ 
racji i odbioru koherentnych fal sprężystych) tłumie¬ 
nie i prędkość wyznacza się metodami pośrednimi, 
np. przez zjawisko rozpraszania światła Mandelszta- 
ma-Brillouina (-> Akustyczne zjawiska kwantowe). 
Metody te m.in. pozwoliły zaobserwować dyspersje 
prędkości dźwięku w cieczach w zakresie częstości 
lO^-lO 11 Hz i uzupełniły w decydujący sposób wy¬ 
obrażenia fizyków o stanie ciekłym materii, który 
jak dotąd mniej jest poznany niż stan gazowy i ciało 
stałe (kryształy). 


Infradźwięki 

Ignacy Małecki 

lnfradźwiękami nazywamy drgania ośrodka gazowe¬ 
go lub ciekłego o częstościach poniżej słyszalnej. 
Zwykle przyjmuje się umownie jako zakres infradźwię¬ 
ków pasmo o częstości 0,1-20 Hz. W ostatnich latach 
zainteresowanie tego typu drganiami bardzo wzrosło, 
gdyż w środowisku współczesnego człowieka stano¬ 
wią one ważny czynnik zakłócający, 
szkodliwe Fale infradźwiękowe działają na cały organizm 
działanie ludzki. Wywołują one drgania rezonansowe klatki 
infradźwię- piersiowej, przepony brzusznej i organów trawienia, 
ków Schemat zastępczy ciała człowieka pokazuje rys. 43. 
Powoduje to zaburzenia systemu oddychania, a przy 
dłuższym działaniu prowadzi do chorób układu tra¬ 
wienia. Infradźwięki mogą też powodować zakłócenia 
organu równowagi i zmniejszenie ostrości widzenia. 
Istnieje pewna analogia i addytywność działania infra- 



Rys. 43. Schemat zastępczy ciała człowieka jako organu drgają¬ 
cego: 1 odpowiada głowie, 2 tchawicy, 3 klatce piersiowej, 
4 brzuchowi, 5 kręgosłupowi, 6 miednicy, 7 nogom; F ,F 2 ozna¬ 
czają siły działające w pozycji siedzącej i stojącej 


<42 - Encyklopedia fizyki współczesnej 


dźwięków i alkoholu, objawiająca się zmniejszeniem odczuwanie 
szybkości reakcji nerwowych. ^ infradzwię- 

Granicę bólu i próg odczuwania wrażeń pochodzą- ków 
cych od infradźwięków określa się podobnie, jak dla 
dźwięków słyszalnych. Im niższa częstość, tym bar¬ 
dziej te dwie granice do siebie się zbliżają, widać to na 
rys. 44. Ogólnie można rozróżnić następujące zakresy 
oddziaływania infradźwięków na organizm ludzki. 



Rys. 44. Krzywe równei intensywności odczuwania infradźwię¬ 
ków w skali względnej od I do 5 (wg Stevensa) 

Poniżej 120 dB. W tym zakresie krótkie działanie 
infradźwięków nie wywołuje wrażeń przykrych i nie 
jest szkodliwe. Przy dłuższym działaniu wystąpić 
mogą jeszcze mało zbadane ujemne skutki infra¬ 
dźwięków. 

Między 120-140 dB. Przebywanie w polu infra¬ 
dźwiękowym powodować może lekkie zakłócenie pro¬ 
cesów fizjologicznych i uczucie nadmiernego zmęcze- 

nia. . . . . 

Między 140-160 dB. Już przy krótkim (2 mm) dzia¬ 
łaniu infradźwięki powodują nieprzyjemne objawy 
fizjologiczne (zakłócenie zmysłu równowagi, wymio¬ 
ty). Dłuższe działanie spowodować może trwałe usz¬ 
kodzenie organiczne. 

Powyżej 170 dB. Stwierdzono na zwierzętach śmier¬ 
telne działanie infradźwięków, spowodowane prze¬ 
ważnie przekrwieniem płuc. „ , .. . 4 

Źródła infradźwięków podzielić możemy na natu- zroaia imra 
ralne i sztuczne. W naturze główną przyczyną powsta- dźwięków 
wania infradźwięków są ruchy powietrza i wody. Falo¬ 
wanie powierzchni mórz i oceanów i prądy podwodne 
wytwarzają szumy o maksimach leżących w widmie 
dźwięków słyszalnych, ale wchodzących również w za¬ 
kres infradźwiękowy. Prócz tego falująca powierzch¬ 
nia morza jest źródłem fal infradźwiękowych o bar¬ 
dzo niskich częstotliwościach (rzędu 0,2 Hz) rozcho¬ 
dzących się w atmosferze. Inny jest mechanizm po¬ 
wstawania infradźwięków w wodospadach, gdzie re¬ 
zonans obszaru między skałą a płaszczem wodnym 
daje czasem wyraźne maksima szumu w zakresie in¬ 
fradźwiękowym. . 

Ruchy górnych warstw atmosfery powodują odbi¬ 
cia fal powstających na powierzchni morza. Wyłado¬ 
wania atmosferyczne są źródłem fali infradźwiękowej 
towarzyszącej grzmotowi. Wiatr opływający wysokie 
budynki także generuje fale infradźwiękowe o natęże¬ 
niu mogącym przekraczać 100 dB. 

Wśród źródeł sztucznych najsilniejszymi są wybu¬ 
chy atomowe lub termojądrowe. Typowy przebieg 
zmian ciśnienia wywołanych wybuchem atomowym 
pokazano na rys. 45. Z natężenia fali infradźwiękowej 
wywołanej wybuchem wnioskować można o wielkości 
ładunku wybuchowego. . r . „ . r ,, . 

Najgroźniejszym w przyszłości źródłem infradźwię¬ 
ków może stać się transport lotniczy. W lotnictwie 
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infradźwięki poddźwiękowym najhałaśliwsze są helikoptery dające 
w lotnictwie infradźwięki zawierające wyraźne maksima o często¬ 
ściach odpowiadających liczbie obrotów śmigieł. Sa¬ 
moloty naddźwiękowe przy przekraczaniu bariery 
dźwięku wytwarzają falę uderzeniową o bardzo dużej 
amplitudzie. Maksimum przenoszonej energii zależy 
od wielkości samolotu — pościgowce dają fale o mak¬ 
simum przy 20 Hz, gdy dla ciężkich samolotów typu 
Concorde maksimum to przypada przy ok. 2 Hz. Sil¬ 
na fala uderzeniowa powodowana jest również wy¬ 
strzeleniem ciężkich rakiet. Obserwowano, że przy 




Badanie ośrodków 
ultradźwięków 

Ultradźwięki umożliwiają nieniszczące badanie ma¬ 
teriałów'. Badaniem makrostruktury materiałów zaj¬ 
muje się defektoskopia, mikrostrukturę bada się ko¬ 
rzystając z metod spektroskopii ultradźwiękowej i mi- 
krodefektoskopi i. 


Spektroskopia ultradźwiękowa 

Jerzy Wehr 

Termin spektroskopia przyjął się od dawna w akusty¬ 
ce w odniesieniu do widmowej analizy dźwięków (ba¬ 
danie zależności natężenia od częstości) i do badania 
z tego punktu widzenia ich źródeł lub kanałów prze¬ 
noszenia. Termin spektroskopia ultradźwiękowa jest 
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nie sprzyjającym rozkładzie gradientu temperatur 
w atmosferze, fala podmuchu od rakiety uszkodzić 
może budynki. Na rys. 46 pokazano widmo fali po¬ 
wstałej przy odpaleniu rakiety Saturn V. Pociągi i ruch 
drogowy dają lokalne pole infradźwiękowe w pasie 
ok. 200 m wokół trasy przejazdów. 

Na statkach, zwłaszcza na szybkich jednostkach, 
nieprzyjemne są drgania o częstości infradźwiękowej 
przenoszone od silników Diesla poprzez konstrukcję 
statku. 

W przemyśle jednym z głównych źródeł infradźwię- infradźwięki 
ków są szybkie przepływy gazów, np. w dmuchawach w przemyśle 
wielkopiecowych osiągają one poziom 120 dB. Szcze¬ 
gólnie uciążliwe mogą być drgania rezonansowe kana¬ 
łów wentylacyjnych. 

Narzędzia udarowe, jak nitownice, młoty pneuma¬ 
tyczne i inne wytwarzają jednocześnie infradźwięki 
i drgania przenoszące się na ręce robotników. Stwier¬ 
dzono, że przyspieszenia przekraczają w tych przypad¬ 
kach wielokrotnie przyspieszenie ziemskie i działają 
szkodliwie na organizm. 

Systematyczne badania źródeł fal infradźwiękowych 
i ich działania na żywe organizmy datują się zaledwie 
od kilku lat, toteż wielu zjawisk nie wyjaśniono do 
końca. 

Akustyka molekularna i nieliniowa, Warszawa 1965; R. T. 

Beyer, S. V. Letcher Physical Ultrasonics, New York 1969; 

J. Burz Fundamentals of Ultrasonics, London 1967; G. H. A. Cole 
Dynamika płynów. Warszawa 1964; Colioąue International sur 
Irfrasons, Paris 1973; I. E. Elpiner Ultradźwięki, działanie 
fizykochemiczne i biologiczne. Warszawa 1968; F. G. Graw- 
ford Fale, Warszawa 1973; W. A. Krasilnikow Zwukowyje 
i ultrazwukowyje wolny, Moskwa 1960; M. Kwiek Akustyka la- 
borytoryjna, cz. I, Poznań 1968; M. Kwiek i in. Akustyka labo¬ 
ratoryjna, cz. 2, Poznań 1971; L. Landau, E. Lifszic Mechanika 
ośrodków ciągłych. Warszawa 1958; I. Małecki Podstawy teo¬ 
retyczne akustyki kwantowej. Warszawa 1972; I. Małecki Teoria 
oirodtców ciągłych. Warszawa 1958; I. Małecki Teoria fal 
i układów akustycznych. Warszawa 1964; W. P. Mason Physical 
Acoustics, vol. 1-12, New York 1964-1976 (ros. t. 1-7, Moskwa 
1967-1974), I. G. Michauow i in. Osnowy molekularnoj akustiki, 

Moskwa 1964; W. F. Nozdriew Primienienije ultraakustiki 
k issledowaniju wieszczestwa, Moskwa 1958; A. Piotrowska i in. 

Ultradźwięki w chemii. Warszawa 1968; Proceeding of Interna¬ 
tional Conference on Public Mcalth Aspects of Noise, Dubrownik 
1973; C. Puzyna Kryteria oceny i niektóre sposoby zmniejszania 
szkodliwego działania drgań na człowieka; A. Śliwiński, K. Ozi¬ 
mek Akustyka laboratoryjna, cz. 3, Warszawa 1974; A. ŚLIWIŃSKI 
Chemical Aspects of Ultrasonics w Acoustics and Yibration Pro¬ 
gress, voI. 1 (eds. R. W. B. Stcphensa i H. G. Leventhall), London 
1974 ; R. Truell i in. Ultrasonics Methods on Solid State Physics, 

New York 1969; J. Wehr Pomiary prędkości i tłumienia fal 
ultradźwiękowych. Warszawa 1972; R. Wyrzykowski Liniowa 
teoria pola akustycznego ośrodków gazowych, Rzeszów 1972; 

L. K. Zaremro, W. A. Krasilnikow Wwiedienije w nieliniejnuiu 
akustiku, Moskwa 1966. 


za pomocą 


stosunkowo nowy w fizyce. Nadaje mu się przeważnie analogia ze 
inne znaczenie, a mianowicie znaczenie analizy zależ- spektrosko- 
ności współczynnika tłumienia i prędkości fal ultra- pią absorp- 
dźwiękowych od częstości drgań lub innej wielkości cyjną 
równoważnej. Tak rozumiana spektroskopia jest ana¬ 
logiczna do różnych rodzajów spektroskopii absorp¬ 
cyjnej w dziedzinie promieniowania elektromagne¬ 
tycznego. 

Tłumienie i prędkość rozchodzenia się fal akustycz¬ 
nych o różnych częstościach, m.in. ultradźwięko¬ 
wych, zależą od procesów zachodzących w skali ato¬ 
mowej i cząsteczkowej (—> Przedmiot i zakres akusty¬ 
ki, rozdział Akustyczne procesy molekularne) i tym 
samym mogą informować o ich przebiegu. Mianowi¬ 
cie wystąpienie maksimum tłumienia przy określonej 
częstości Iud wystąpienie obszaru dyspersji prędkości 
dźwięku (zależności prędkości od częstości drgań) jest 
wynikiem procesów relaksacyjnych związanych ze 








współczynnik tłumienia^,* 10 


zmianami poziomów energetycznych układów mole¬ 
kularnych. 

czas Układ (np. zespół atomów w molekule) może 
relaksacji zostać wytrącony z równowagi przez biegnącą falę 
ultradźwiękową w ten sposób, że odbiera on od fali 
energię (absorbuje) przechodząc w stan wzbudzony. 
Powrót układu do poprzedniego stanu równowagi wy¬ 
maga określonego czasu (czas relaksacji), który cha¬ 
rakteryzuje dany układ. Energia wzbudzenia oddawa¬ 
na jest przy powrocie do stanu równowagi w postaci 
ciepła. 

W ośrodku złożonym z wielu molekuł takich proce¬ 
sów pojawia się wiele, a jeśli przy tym są to molekuły 
jednakowe, to wszystkie te procesy mają ten sam czas 
relaksacji. Wypadkowy wynik oddziaływania z falą 
ultradźwiękową objawia się więc dużym selektywnym 
ubytkiem energii fali i wystąpieniem maksimum 
współczynnika tłumienia ju mSLX (/ijest bezwymiarowym 
współczynnikiem tłumienia) dla określonej częstości 
(rys. 1). Częstość odpowiadająca temu maksimum vv. 



ciśnienia fali akustycznej 

zwana częstością relaksacji, wyznacza czas relaksacji 
zgodnie z wzorem v r ~ 1/t, gdzie r—czas relaksacji. 
Częstość v r pokrywa się zwykle z częstością odpowia¬ 
dającą środkowi obszaru dyspersji prędkości dźwięku 
(rys. 2). . . 

Przebieg zależności współczynnika tłumienia od 
częstości fi (v) jest symetryczny w funkcji In (v/v r ) 
i stosunek częstości, leżących powyżej i poniżej czę¬ 
stości relaksacji v r , dla których= 0,5iUmax, wynosi 
dla prostego procesu relaksacyjnego ok. 13,9. 



Rys. 2. Dyspersja prędkości c (c*— prędkość dźwięku dla bardzo 
małych częstości) i tłumienie relaksacyjne w różnych tempera¬ 
turach 


Pomiary widm relaksacyjnych w funkcji częstości 
drgań wymagają więc pokrycia bardzo szerokich za¬ 
kresów częstości, co związane jest z dużymi trudnoś¬ 
ciami aparaturowymi. 

Częstość relaksacji ośrodka gazowego jest funkcją 
gęstości i temperatury. Gdy gaz stosuje się do prawa 
gazów doskonałych, zależność od gęstości można za¬ 
stąpić zależnością od ciśnienia. W spektroskopii ultra¬ 
dźwiękowej stosuje się więc często metodę zmiennego 
ciśnienia przy ustalonej częstości i z kolei skalę ciśnie¬ 
nia przelicza się na skalę częstości (rys. 1). 

Jeżeli procesy relaksacyjne są aktywowane cieplnie, 
tj. jeżeli drgania cieplne powodują fluktuacje pozio¬ 
mów energetycznych danych konfiguracji mikrostruk¬ 
tury, można zależność od częstości drgań zastąpić 
zależnością od temperatury T. Najczęściej przyjmuje równanie 
się w tym celu, że częstość v r spełnia równanie Arrhe- Arrheniusa 
niusa: 

v r = v 0 e~ W{kT , 

gdzie v 0 jest częstością drgań cieplnych, W — energią 
aktywacji procesu relaksacyjnego, k — stałą Boltz- 
manna. 

Pomiary współczynnika tłumienia max w funkcji 
temperatury i częstości pozwalają na wyznaczenie 
energii aktywacji W. 

W ciałach stałych realizuje się najczęściej pomiary 
współczynnika tłumienia t* w funkcji temperatury dla 
niewielu ustalonych częstości drgań. W cieczach po¬ 
miary ił w funkcji temperatury są ograniczone wą¬ 
skim temperaturowym zakresem ciekłego stanu sku¬ 
pienia i typowe są pomiary jł w funkcji częstości przy 
ustalonych temperaturach, nie przekraczających tem¬ 
peratur krzepnięcia i parowania. 

Rysunek 3 przedstawia przykład przesuwania się 
maksimum tłumienia na skutek zmian temperatury. 

Przy wzroście temperatury maksimum przesuwa się 



Rys. 3. Tłumienie relaksacyjne uwarunkowane izomerią obro¬ 
tową w 1,1,2-trójchloroetanie 


w stronę wyższych częstości. Obliczenie z tego prze¬ 
sunięcia energii aktywacji oparte na wzorze Arrhe¬ 
niusa pozwoliło ustalić, że wykryty tutaj eksperymen¬ 
talnie proces relaksacji w 1,1,2-trójchloroetanie jest 
związany z przechodzeniem molekuł z jednego stanu 
izomerycznego (o niższej energii) w drugi (o wyższej 
energii). 

Jeżeli bezwymiarowy współczynnik tłumienia fal 
akustycznych fi rośnie w funkcji częstości v wolniej niż 
pierwsza potęga v (szybszy wzrost fi (v) zdarza się 
przeważnie w wypadku rozproszenia fal na wtrące¬ 
niach, granicach ziaren itp.), to tłumienie można in¬ 
terpretować jako skutek procesów relaksacyjnych 
w badanym ośrodku i można zaproponować dyskret¬ 
ny lub ciągły model (widmo) takich czasów relaksacji 
i takich stratności materiału, który zgadza się z wyni- 
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stratność kami pomiarów (stratność materiału e = p/n = Q _1 , 
materiału gdzie Q jest współczynnikiem dobroci materiału). Na¬ 
leży jednak podkreślić, że — po pierwsze — taki model 
odnosi się tylko do zakresu częstości objętego pomia¬ 
rami, a po drugie — może istnieć często wiele różnych 
widm relaksacyjnych odpowiadających tym samym 
wynikom pomiarów. Odtworzenie widma relaksacyj¬ 
nego ośrodka z pomiarów propagacji fal ultradźwię¬ 
kowych w ośrodku jest więc niezupełne, a gdy widma 
są bardziej złożone (gęste) —jest też niejednoznaczne. 
Modele widm relaksacyjnych łatwiej jest tworzyć, 
jeśli przebieg p w funkcji v/p (gdzie p — ciśnienie) czy 
T dzieli się na wyraźne maksima (rys. 2). W wyborze 
modelu własności relaksacyjnych są pomocne, oprócz 
pomiarów tłumienia, również pomiary prędkości pro¬ 
pagacji fal ultradźwiękowych c. Dla prostego procesu 
relaksacyjnego blisko maksimum p leży punkt prze¬ 
gięcia (środek obszaru dyspersji) prędkości fazowej 
i ekstremum prędkości grupowej. Obserwacja cha¬ 
rakterystycznych punktów przebiegów prędkości po¬ 
maga rozdzielić dyskretne widmo relaksacyjne na 
właściwą liczbę składników. 



Rys. 4. Wpływ wyżarzenia na widmo relaksacyjne polikrystalicz¬ 
nego niobu 


zastosowania Przykładami zastosowań spektroskopii ultradźwię¬ 
kowej ciał stałych są: badania dyfuzji atomów gazu 
w metalach, wyznaczanie gęstości dyslokacji i średniej 



- wartości przewidywane 

xx-wyniki otrzymane doświadczalnie 

Rys. 5. Pochłanianie ultrakrótkich fal przez monokryształ oło¬ 
wiu w zależności od temperatury 
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długości pętli dyslokacyjnych, badanie koncentracji 
defektów punktowych i domieszek w sieci krystalicz¬ 
nej (rys. 4). Spektroskopię ultradźwiękową stosuje się 
również do badania obszaru przejścia fazowego od 
stanu normalnego do stanu nadprzewodzącego (rys. 
5). Tego rodzaju zmiany obserwuje się wyraźnie tylko 
w bardzo czystych materiałach. Typowymi zastoso¬ 
waniami w badaniach cieczy i gazów są: badanie izo¬ 
merii (rys. 3), badanie przejść monomer-dimer, po¬ 
miary małych koncentracji domieszek i składu mie¬ 
szanin, wyznaczenie prędkości reakcji chemicznych, 
badanie dysocjacji roztworów. Niekiedy celowe jest 
łączenie metod spektroskopii ultradźwiękowej z in¬ 
nymi metodami spektroskopii, np. z metodą jądro¬ 
wego rezonansu magnetycznego czy elektronowego 
rezonansu spinowego (-»- Akustyczne zjawiska kwan¬ 
towe). 


Defektoskopia i mikrodefekto- 
skopia ultradźwiękowa 

Bogumił Linde 

W defektoskopii i mikrodefektoskopii wykorzystuje się badanie ma- 
wpływ niejednorodności materiału na prędkość i tłu- krostruktury 
mienie rozchodzących się w nim ultradźwięków. Bada- i mikrostruk- 
nie materiału polega na wprowadzeniu do niego fali tury 
ultradźwiękowej i na jej odebraniu. Do wytwarzania 
i rejestrowania ultradźwięków służą przetworniki 
piezoelektryczne (wielkie częstości) oraz magneto- 
strykcyjne (małe częstości). Z czasu przelotu fali w ma¬ 
teriale i z jej tłumienia lub wzmocnienia można wnio¬ 
skować o rozmieszczeniu i wielkości niejednorodno¬ 
ści. Od częstości użytej fali zależy, jakiej wielkości de¬ 
fekty można w ten sposób wykrywać. Np. rozmiary 
ziaren można badać stosując fale o wielkich często¬ 
ściach, gdyż ich tłumienie zależy bardzo silnie od wiel¬ 
kości ziaren. JDo badania makrostruktury materia¬ 
łów, tj. niejednorodności, pęknięć, wytrzymałości, 
twardości itp. stosuje się fale ultradźwiękowe o czę¬ 
stości 10 5 -10 8 Hz. Do badań mikrostruktury, tj. de¬ 
fektów punktowych sieci krystalicznej, rozmiarów 
ziaren, dyslokacji, załamania lub przesunięcia płasz¬ 
czyzn sieci itp. stosuje się ultradźwięki i hiperdźwięki 
o częstości 10 7 -10 u Hz. 

Istnieją trzy podstawowe metody badań stosowane metoda 
zarówno w defektoskopii jak i mikrodefektoskopii. echa 
Najbardziej rozpowszechniona jest metoda echa. Po¬ 
lega ona na nadawaniu krótkich impulsów ultradźwię¬ 
kowych i ich odbiorze po odbiciu od niejednorodno¬ 
ści w badanej próbce. Odległość defektu określa czas 
liczony od chwili nadania impulsu dojego powrotu po 
odbiciu (rys. 6), zaś wielkość tego defektu obrazuje 
amplituda impulsu odbitego. Impulsy obserwuje się 



Rys. 6. Metoda echa: a) badana próbka z głowicą nadawczo-od¬ 
biorczą Gno % x oznacza odległość wady od powierzchni; b) oscy- 
logram, 1 impuls nadany, 2 impuls odbity od wady, 3 impuls 
odbity od końca próbki 

zwykle na ekranie lampy oscyloskopowej, znając zaś 
jej podstawę czasu można odczytać odległość czasową 
impulsu nadanego i odbitego, a stąd znaleźć odległość 
wady od powierzchni z prostego wzoru: 2x — ct, 
gdzie x jest odległością wady od powierzchni, c — 
prędkością ultradźwięków w badanym materiale, 
t — czasem przelotu. 
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Metoda cienia (przepuszczenia) polega na pomiarze 
amplitudy fali ultradźwiękowej za wadą po przejściu 
przez badany materiał (rys. 7). Używa się w niej dwóch 
głowic — nadawczej i odbiorczej. Niejednorodności 
w badanym materiale powodują osłabienie energii fal 
docierających do głowicy odbiorczej. Z różnicy ampli¬ 
tudy impulsu nadanego i odebranego wnioskuje się 
o wielkości wady. Metodę cienia jak i metodę echa 


Przy zastosowaniu prezentacji C (rys. 9) pręd¬ 
kość ruchu plamki podstawy czasu na ekranie jest 
proporcjonalna do prędkości ruchu głowicy po przed¬ 
miocie. Plamka świeci tylko w miejscach wykrytych 
wad. Przy zastosowaniu odpowiedniej lampy oscylo¬ 
skopowej obraz może być utrzymany na ekranie do¬ 
wolnie długo. Pozwala to na dokładną ocenę wad. 



Rys. 7. Metoda cienia: a) próbka bez wady. b) badana próbka 
z wadą; Gs głowica nadawcza. Go głowica odbiorcza, c) oscy- 
logramy z zaznaczoną różnicą amplitud AA 


Metoda rezonansowa polega na znalezieniu kolej¬ 
nych częstości rezonansowych badanego elementu. 
Zjawisko rezonansu zachodzi wtedy, gdy grubość G 
badanego przedmiotu jest wielokrotnością połowy 
długości fali; wówczas G = cjlAf,\ gdzie d/jest różni¬ 
cą dwóch kolejnych częstości rezonansowych. Metodę 
tę stosuje się w pierwszym rzędzie do pomiaru grubo¬ 
ści, można ją też stosować do wykrywania rozwar¬ 
stwień, braków przyczepności w połączeniach spawa¬ 
nych, lutowanych, klejonych, a także istnienia ko¬ 
rozji. 

Prócz wymienionych są jeszcze dwie metody defek¬ 
toskopii stosowane rzadziej. Metoda drgań własnych 
opiera się na badaniu i analizie drgań własnych ukła¬ 
du w-zbudzonego uderzeniem; stosuje się ją do bada¬ 
nia układów wielowarstwowych (wad samych warstw 
i połączeń sztywnych między warstwowych). 

W metodzie impedancji wykorzystuje się zależność 
akustycznego oporu (impedancji) wejściowego układu 
od obciążenia na jego końcach. Za pomocą tej meto¬ 
dy można wykrywać zakłócenia w sztywnych połą¬ 
czeniach cienkiej osłony z masywnym podłożem. Bez¬ 
pośrednią miarą zakłóceń jest zmiana sił reakcji bada¬ 
nego urządzenia, kóre wzbudzają w czujniku drgania 
giętne o częstości dźwiękowej. 

Obecnie rozwijają się metody umożliwiające bez¬ 
pośrednią obserwację badanych wad. Znajdują przy 
tym zastosowanie wskaźniki oscyloskopowe (rys. 8), 
za pomocą których można otrzymać prezentacje A, B 
(dokładniej omówione w paragrafie Badanie ośrod¬ 
ków biologicznych za pomocą metody echa) oraz C. 



Rys. 8. Wizualizacja wad za pomocą prezentacji B: a) badana 
próbka z głowicą nadawczo-odbiorczą Gso, b) ekran lampy oscy¬ 
loskopowej, c) obraz jak w metodzie echa 


Warunki rozchodzenia się fal ultradźwiękowych oraz 
zjawiska, które ich rozchodzeniu się towarzyszą, za¬ 
leżą od takich makro- i mikroskopowych właściwości 
ośrodków, jak sprężystość, gęstość, rozciągłość, nie¬ 
jednorodność, anizotropia, budowa molekularna, 
a w przypadku ruchu ośrodka zależą od jego prędko¬ 
ści. Stąd też wynikają możliwości zastosowania fal 
ultradźwiękowych jako narzędzia badawczego pozwa¬ 
lającego na uzyskanie o własnościach materii martwej 
i żywej oraz ojej ruchu cennych informacji, które win¬ 
ny sposób zdobyć bardzo trudno, a niekiedy w ogóle 
nie można. W przypadku ośrodków biologicznych 
ultradźwięki umożliwiają nawet wizualizację wnętrza 
niedostępnego dla oka bez dokonywania krwawego 
zabiegu, a także — co jest szczególnie cenne — bez 
żadnych szkodliwych skutków ubocznych. 

Dzięki temu ultradźwięki znalazły obecnie szerokie 
zastosowanie diagnostyczne w medycynie, w takich jej 
dziedzinach jak położnictwo, kardiologia, okulistyka, 
neurologia, onkologia, chirurgia naczyniowa itp. 

Te wielkie możliwości stosowania ultradźwięków 
w diagnostyce medycznej wynikają z bardzo korzyst¬ 
nych warunków rozchodzenia się fal ultradźwiękowych 
w tkankach miękkich. Tłumienie fal ultradźwięko¬ 
wych w tych tkankach jest przeważnie wprost propor¬ 
cjonalne do częstości w dolnym jej zakresie aż do 
100 MHz, podczas gdy w innych ośrodkach występuje 
szybszy wzrost tłumienia z częstością. Przy częstości 
1 MHz współczynnik tłumienia zawiera się w grani¬ 
cach od 0,1 dB/cm (w ciałku szklistym oka) do 3,3 
dB/cm (w tkance mięśniowej w poprzek włókien). 
Z tego to względu do badań jamy brzusznej, gdzie głę¬ 
bokość penetracji dochodzi do 30 cm, stosuje się fale 
ultradźwiękowe o częstości ok. 2 MHz, natomiast do 
badania oczu, gdzie głębokość penetracji wynosi ok. 
3 cm, stosowane są częstości wyższe, dochodzące do 
20 MHz. 

W tkankach miękkich rozchodzą się praktycznie 
jedynie podłużne fale ultradźwiękowe, fale poprzeczne 
są bardzo silnie tłumione; w tkance kostnej mogą się 
rozchodzić również inne typy fal ultradźwiękowych — 
poprzeczne, giętne itp. Ponieważ prędkość rozchodze¬ 
nia się fał ultradźwiękowych w tkankach miękkich 
wynosi ok. 1500 m/s zatem w podanym wyżej zakresie 
częstości długości fal ultradźwiękowych wynoszą od¬ 
powiednio 0,75-0,075 mm, czyli przekraczają zaled¬ 
wie o trzy lub dwa rzędy wielkości długość fal świetl¬ 
nych. Tak krótkie fale można łatwo formować w rów¬ 
noległe lub skupione wiązki, których wyjniary po¬ 
przeczne są rzędu 1 mm; zapewnia to rozdzielczość 
wystarczającą do celów diagnostycznych. 

W ostatnich latach w mikroskopie ultradźwięko- 
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wym zastosowano częstości 100 MHz i większe, i uzy¬ 
skano rozdzielczość odpowiadającą minimalnej od¬ 
ległości 25 pm. Jednakże bardzo duże tłumienie ogra¬ 
nicza możliwość badania w ten sposób tkanek do gru¬ 
bości zaledwie kilku mm. 

Następnym bardzo korzystnym czynnikiem, który 
umożliwia zastosowanie ultradźwięków w diagnostyce 
medycznej, jest fakt, że opór akustyczny właściwy 
(równy iloczynowi gęstości ośrodka i prędkości roz¬ 
chodzenia się fali) różnych tkanek miękkich niewiele 
się różni. Wskutek tego fala ultradźwiękowa padająca 
prostopadle na granicę dwóch tkanek prawie całkowi¬ 
cie przez nią przenika, zaledwie ok. 1 % energii fali pa¬ 
dającej odbija się od granicy. 

Jeśli się stosuje impulsy fali ultradźwiękowej, to po¬ 
wstaje niewielkie echo, które jest jednak wystarczają¬ 
co duże, by po wzmocnieniu w układach elektronicz¬ 
nych można je było zarejestrować na ekranie lampy 
oscyloskopowej. Większość energii fali ultradźwięko¬ 
wej przenika coraz dalej w głąb ośrodka biologiczne¬ 
go z niewielką stratą energii i daje echa od każdej na¬ 
potkanej na swej drodze granicy tkanek. Dzięki temu 
mamy możliwość wykrycia granic wielu różnych, po¬ 
łożonych kolejno za sobą tkanek miękkich. 

Przeszkodą nie do przeniknięcia są dla fal ultra¬ 
dźwiękowych wszelkie obszary wypełnione gazami. 
Opór akustyczny właściwy gazów jest bowiem o kilka 
rzędów wielkości mniejszy niż tkanek miękkich, i dla¬ 
tego na granicy tkanka miękka-gaz następuje prawie 
całkowite odbicie fali ultradźwiękowej. Podobne zja¬ 
wisko, choć w mniejszym stopniu, zachodzi na granicy 
tkanek miękkich i kostnych, a znaczna absorpcja fal 
ultradźwiękowych w tkankach kostnych utrudnia ich 
badanie. 

Informacje zawarte w falach ultradźwiękowych 
o spenetrowanym ośrodku biologicznym są zakodo¬ 
wane w czasie ich przejścia, amplitudzie, częstości 
i fazie. Metoda echa, w której się stosuje impulsy fal 
ultradźwiękowych, pierwsza dała pozytywne wyniki 
w diagnostyce ultradźwiękowej. Czas przejścia fali 
i amplituda są podstawowymi parametrami, z których 
się uzyskuje informacje o ośrodku badanym metodą 
echa. W ultradźwiękowych metodach dopplerowskich 
źródłem informacji jest częstość fali, a w ultradźwię¬ 
kowych układach holograficznych — faza fali. 
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Badanie ośrodków biologicznych za pomocą 
metody echa 

Informacje uzyskane w postaci echa impulsów fal 
ultradźwiękowych odbitych od granic tkanek można 
przedstawić na ekranie oscyloskopowym w różnych 
prezentacjach. Najprostsza jest prezentacja A (rys. 
lOc), w której impulsy ultradźwiękowe (ściślej — ich 
obwiednie) odpowiednio przetworzone elektronicznie, 
przedstawiane są na podstawie czasu, odpowiadają¬ 
cej głębokości ciała. 

Bardziej złożoną prezentacją, dającą obraz rozkła¬ 
du anatomicznego tkanek, jest prezentacja B. W tym 
wypadku sygnały odbite wewnątrz badanego ciała 
modulują jasność lampy oscyloskopowej; natomiast 
podstawa czasu wykonuje zazwyczaj złożone ruchy 
obrotowo-postępowe, analogiczne do ruchów wiązki 
ultradźwiękowej przeszukującej wnętrze ciała pacjen¬ 
ta. Echa rozjaśniające ekran oscyloskopowy tworzą 
wówczas rysunek złożonego układu anatomicznego 
tkanek. 

Na rys. IOd przedstawiono zasadę prezentacji £, 
w zastosowaniu do badania struktur biologicznych 
a na il. 181 (tabl. 46) — przykład jej zastosowania. 
Obraz oscyloskopowy badanego narządu ciała po¬ 
wstaje stopniowo w miarę przesuwania przetwornika 
piezoelektrycznego po powierzchni ciała (trwa to za¬ 
zwyczaj kilkanaście sekund). Dzięki zastosowaniu 
ekranu oscyloskopowego z długim czasem poświaty 
albo zastosowaniu układów pamięciowych obraz 
utrzymuje się wystarczająco długo, by móc postawić 


diagnozę (w celu uzyskania dokumentacji badania 
można go również fotografować). 

Odmianą prezentacji B jest wizualizacja w czasie 
rzeczywistym: wiązka ultradźwiękowa wykonuje ru¬ 
chy obrotowe lub postępowe przeszukujące wnętrze 
badanego ciała z szybkością kilkunastu razy na se¬ 
kundę. Jest to niezbędne w celu wizualizacji struktur 
ruchomych serca lub innych narządów. Innym ty¬ 
pem prezentacji umożliwiającym rejestrastrację ruchu 
struktur ruchomych serca jest prezentacja M, wyka¬ 
zująca zarówno pewne cechy prezentacji A, jak i B. 

Dopplerowskie metody badania biologicznych 
struktur ruchomych 

Drugą grupę metod ultradźwiękowych w diagnostyce 
medycznej stanowią metody oparte na zjawisku Dop¬ 
plera. Fale ultradźwiękowe padając na ruchome struk¬ 
tury biologiczne (jak np. bijące serce płodu lub płyną¬ 
ce ciałka krwi), ulegają odbiciu względnie rozprosze¬ 
niu i zmieniają swą częstość. Zmianę częstości można 
przetworzyć elektronicznie na zakres słyszalny (po¬ 
zwala to usłyszeć np. tętno bijącego płodu w łonie 
matki) lub też można zmierzyć ją (a na tej podstawie 
wyznaczyć np. prędkość krwi przepływającej w naczy¬ 
niu krwionośnym). 

Dwie odmiany metod dopplerowskich znalazły 
obecnie szerokie zastosowanie. W pierwszej z nich — 
w metodzie fali ciągłej — przetwornik piezoelektrycz¬ 
ny wytwarza falę ciągłą; w drugiej —- zwanej metodą 
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impulsową — wytwarza impulsy fal. Metoda fali ciąg¬ 
łej dostarcza łączną informację o wszystkich struktu¬ 
rach ruchomych leżących na drodze wiązki ultra¬ 
dźwiękowej; powoduje to pewne trudności interpre¬ 
tacyjne, wtedy gdy wiązka ultradźwiękowa trafia jed¬ 
nocześnie np. na tętnicę i leżącą głębiej żyłę. Wady tej 
nie wykazuje bardziej złożona metoda impulsowa, 
która umożliwia np. pomiar prędkości krwi w wybra- 
branym zakresie głębokości. Dopplerowska metoda 
impulsowa dostarcza ponadto informacji o, czasie 
przejścia imdulsów ultradźwiękowych w ośrodku, 
przez co umożliwia jednoczesne dokonywanie pomia¬ 
rów średnicy naczynia krwionośnego i rozkładu pręd¬ 
kości krwi wewnątrz naczynia. Umożliwia to wyzna¬ 
czanie prędkości objętościowej krwi (wydatku) w du¬ 
żych naczyniach krwionośnych. Istnieją również moż¬ 


liwości zastosowania tej metody do badania przepły¬ 
wu krwi wewnątrz serca. 

Poważną zaletą ultradźwiękowych metod dopple- 
rowskich jest możliwość dokonywania pomiarów 
prędkości krwi z powierzchni ciała, bez konieczności 
dokonywania krwawego zabiegu, choć metody te 
mogą być również stosowane podczas operacji na od¬ 
krytych naczyniach krwionośnych. 

Diagnostyka ultradźwiękowa w położnictwie i chorobach ko - 
biecych, L. Filipczyński i I. Roszkowski (red.). Warszawa 1977; 
L. Filipczyński i in. Przepływy krwi. Zarys hemodynamiki 
i ultradźwiękowe metody dopplerowskie , Warszawa 1980; L. Fi- 
lipczyński i in. Ultradźwiękowe metody badań materiałów t 
Warszawa 1963; I. Małecki Fizyczne podstawy akustyki tech¬ 
nicznej , Warszawa 1964, W. F. Nozdriew, N. W. Fedorosz- 
czenko Moliekulamaja akustika, Moskwa 1974; Z. Pawłowski 
Badania nieniszczące , cz. 1, Warszawa 1975; W.P. Mason Phy - 
sical AcousticSy vol'. 21, part A, New York 1965. 


Akustyczne fale powierzchniowe 
i ich zastosowanie 

Antoni Śliwiński 


Fale powierzchniowe są to fale sprężyste, rozchodzące 
się na powierzchni ograniczającej ośrodek, który po¬ 
za tą powierzchnią traktować można jako nieogra¬ 
niczony. 

W zależności od charakteru ograniczenia mogą po¬ 
wstawać różne fale powierzchniowe. Wyróżnia się 
cztery ich rodzaje: fale Rayleigha, Stonleya, Lamba 
i Love’a. Najbardziej znane z nich są fale Rayleigha 
i mówiąc o falach powierzchniowych często je właśnie 


wierzchni ciała i normalne do niej (głębokościowe). 
Składowe głębokościowe przesunięć szybko zanikają 
i nie sięgają głębiej jak na trochę więcej niż jedna dłu¬ 
gość fali. Poglądowe przedstawienie współdziałania 
tych dwóch składowych w powierzchniowej fali Ray¬ 
leigha zaznaczone jest na rys. 2. Większą amplitudę 
ma składowa poprzeczna o drganiach prostopadłych 
do powierzchni. Składowa podłużna jest równoległa 
do powierzchni i jej drgania odbywają się równolegle 



kołowe tory cząs 
akustycznych 


Rys. 1. Poglądowy rozkład drgań cząsteczek ośrodka w powierzchniowej fali Rayleigha na zakłóconej powierzchni wody 
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Rys. 2. Modelowe przedstawienie deformacji ośrodka w fali 
Rayleigha na powierzchni ciała stałego 


ma się na myśli. Są to fale rozchodzące się na swo¬ 
bodnej powierzchni cieczy lub ciała stałego graniczą¬ 
cego z próżnią lub gazem — takie jak np. na zakłóco¬ 
nej powierzchni wody (rys. 1) lub na powierzchni ciała 
stałego (rys. 2). Drgania punktów odpowiadają ru¬ 
chom po torach eliptycznych (w przybliżeniu koło¬ 
wych) w płaszczyźnie pionowej, równoległej do kie¬ 
runku rozchodzenia się fali. W ciałach izotropowych 
ruch ten można rozłożyć na dwie pary składowych: 
podłużne i poprzeczne (ścinania) równolegle do po- 



Rys. 3. Przesunięcie poprzeczne i podłużne cząstki akustycznej 
w fali Rayleigha jako funkcja głębokości z i odległości wzdłuż 
kierunku rozchodzenia się x. Jako jednostkę przyjęto długość 
fali 


składowa 
poprzeczna 
i podłużna 
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do kierunku rozchodzenia się. Składowe poprzeczna 
i podłużna są zawsze przesunięte w fazie o 90°. Ten 
stosunkowo skomplikowany układ przesunięć w for¬ 
mie przestrzennego wykresu przedstawia rys. 3. 

fale Falami Stonleya nazywa się fale, które powstają na 
Stonleya powierzchni rozdzielającej dwa ośrodki stałe. Mogą 
one rozchodzić się tylko przy ściśle określonych sto¬ 
sunkach oporów właściwych (—► Przedmiot i zakres 
akustyki, rozdz. Teoria ośrodków ciągłych i fal sprę¬ 
żystych) obydwu ośrodków. Fale te są bardzo podob¬ 
ne do fal Rayleigha co do rozkładu na składowe pod¬ 
łużną i poprzeczną oraz charakteru ich wnikania 
w ośrodki po obu stronach powierzchni rozdzielają¬ 
cej te ośrodki. 

fale Fale Lamba, które często nazywa się płytowymi, 
Larnba powstają w ośrodku stałym ograniczonym dwiema 
równoległymi powierzchniami (np. w blachach, nie- 
grubych płytach, powłokach itp.), których odległość 
wzajemna jest porównywalna z długością fali, a nie 
przekracza kilku długości fali. Przesunięcia cząstek są 
wynikiem nakładania się na siebie dwóch fal Ray¬ 
leigha biegnących na obydwu powierzchniach w tym 
samym kierunku. Fale Lamba rozłożyć można na dwa 
podstawowe typy: o postaci symetrycznej i antysyme- 
trycznej (rys. 4). W płycie o danej i stałej grubości, 
której powierzchnie ograniczające są płaszczyznami. 
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Rys. 4. Falc Lamba: a) postać symetryczna, b) postać antysyme- 
tryczna (roz rozrzedzenie, zg zgęszczenie) 


może powstać wiele fal o określonych postaciach (pod¬ 
stawowe i wyższe harmoniczne), przy czym o powsta¬ 
niu danej postaci (sposobu drgań, czyli modu) fali 
decyduje stosunek grubości płyty do długości fali po¬ 
przecznej lub podłużnej. Fale Lamba są falami dys¬ 
persyjnymi, to znaczy, że ich prędkość fazowa zależy 
od częstości. 

fal© Fale Love ł a są falami poprzecznymi rozchodzący - 
Love'a mi się w układach warstwowych. Cząstki akustyczne 
drgają w nich równolegle do powierzchni warstwy 
i prostopadle do kierunku rozchodzenia się. Są to 
więc fale sprężyste spolaryzowane w płaszczyźnie wy¬ 
znaczonej przez ograniczenie warstwy. Schematyczny 
rysunek fali Love*a w cienkiej warstwie spoczywają- 
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cej na grubszym podłożu (rola podłoża jest tylko po¬ 
mocnicza — utrzymuje ono warstwę w pozycji pozio¬ 
mej) pokazuje rys. 5. Fale Love’a są silnie dyspersyjne. 



Rys. 5. Fala Love’a w cienkiej warstwie umieszczonej na grubym 
podłożu 


Chociaż znane w fizyce od dawna, akustyczne fale 
powierzchniowe stały się w ostatnim dziesięcioleciu, 
szczególnie fale o wielkich częstościach, przedmiotem 
intensywnych badań, ponieważ znalazły zastosowanie 
w wielu dziedzinach. Stosuje się różne metody wytwa¬ 
rzania takich fal, w zależności od tego, gdzie mają być 
zastosowane. Fale powierzchniowe o częstościach 
mikrofalowych zostały wykorzystane w nowej techno¬ 
logii elektronicznej, której rozwój opiera się na ukła¬ 
dach scalonych (—► Mikroelektronika), w takich urzą¬ 
dzeniach jak np. linie opóźniające dla sygnałów elek¬ 
trycznych, filtry z programowanym przesuwaniem 
fazy, modulatory, układy do kompresji sygnałów, 
układy wytwarzające splot dwóch sygnałów (fizyczny 
odpowiednik splotu w sensie matematycznym), de- 
flektory i modulatory światła (-* Akustyczne zjawiska 
kwantowe). 

Do rozwoju technologii akustycznych fal po¬ 
wierzchniowych przyczyniło się opanowanie kon¬ 
strukcji przetworników elektro-akustycznych (nadaj¬ 
ników i odbiorników fal powierzchniowych) dla du¬ 
żych częstotliwości. 

W jednym ze sposobów wytwarzania fal Rayleigha fale 
wykorzystuje się zjawisko piezoelektryczne polegające Rayleigha 
na tym, że w wyniku działania pola elektrycznego na na powierz 
powierzchni kryształu piezoelektrycznego powstają chniach pie 
naprężenia mechaniczne. Pobudza się elektrycznie zoelektrycz 
powierzchnie piezoelektryczne tak, aby wytworzyć nych 
jednocześnie dwie składowe — poprzeczną i podłuż¬ 
ną, przesunięte względem siebie w fazie o 90° (rys. 3). 

Warunki takie można stworzyć na powierzchni płytki 
piezoelektrycznej odpowiednio wyciętej w stosunku 
do osi krystalograficznych, przykładając w specjalny 
sposób pole elektryczne. 

Odpowiednio zmienne odkształcenia na powierzch¬ 
ni piezoelektryka wytwarza się za pomocą zmian pola 
elektrycznego w układzie elektrod (rys. 6) osadzonych 
na powierzchni kryształu w formie dwóch grzebienio¬ 
wych, wzajemnie się przenikających układów palcza- 
stych. Położenie tych elektrod należy tak dobrać, aby 
powstające na powierzchni piezoelektryka naprężenia 
odpowiadały kierunkom tych modułów piezoelek¬ 
trycznych, które decydują o sprzężeniu elektromecha¬ 
nicznym przy generacji fali powierzchniowej Ray¬ 
leigha w odpowiednim kierunku. Dla danego kryszta¬ 
łu jest to kierunek ściśle określony. Istotne przy wy¬ 
tworzeniu fal powierzchniowych są: składowa E z pro¬ 
stopadła do powierzchni i składowa E z równoległa 
do powierzchni. Z rys. 6 widać, że maksimum pola E 2 
pojawia się na samych palcach elektrod grzebienio¬ 
wych, podczas gdy maksimum pola E 3 — pomiędzy 
nimi. Ponieważ kierunki składowych pola elektrycz¬ 
nego E 2 i E 3 zmieniają się pomiędzy przyległymi para¬ 
mi palców elektrod, powstające składowe deformacji 
także się zmieniają; przechodzą na przemian od zgęsz- 
czeń do rozrzedzeń pomiędzy kolejnymi parami pal¬ 
ców elektrod i od poprzecznych drgań skrętnych prze¬ 
ciwnych do ruchu wskazówek zegara do drgań zgod¬ 
nych z ruchem wskazówek zegara na kolejnych parach 
palców elektrod. 




















warunek 

rezonansu 


Pewien dodatkowy przyczynek do procesu genera¬ 
cji fal powierzchniowych Rayleigha w materiałach 
ferroelektrycznych (a takim jest właśnie LiNb0 3 ) dają 
efekty elektrostrykcyjne wynikające z istniejących sil¬ 
nych wewnętrznych pól elektrycznych, spowodowa¬ 
nych polaryzacją spontaniczną. Pola te są modulowa¬ 
ne przez przyłożone pole elektryczne i wypadkowe 
naprężenia są wynikiem nałożenia się na siebie efek¬ 
tów piezoelektrycznych i elektrostrykcyjnych. Zja¬ 
wisko elektrostrykcyjne polega na objętościowym od¬ 
kształceniu dielektryków w zewnętrznym polu elek¬ 
trycznym; powstające naprężenia są proporcjonalne 
do kwadratu natężenia zewnętrznego pola elektrycz¬ 
nego, podczas gdy w zjawisku piezoelektrycznym na¬ 
prężenia są wprost proporcjonalne do natężenia pola 
elektrycznego. 

W rozpatrywanym układzie generującym po¬ 
wierzchniowe fale Rayleigha można uzyskać rezo¬ 
nans przy takiej częstości, przy której odległość d (rys. 
6b) pomiędzy środkami przyległych palców elektrod 
staje się równa połówce długości sprężystej fali po¬ 
wierzchniowej, to jest przy: 



gdzie vr — prędkość rozchodzenia się fali Rayleigha. 

W warunkach rezonansu składowe odkształceń 
w kierunku oznaczonym w krystalografii jako [2 3] 
oraz w kierunku [3 3] rozchodzą się jako fale po¬ 
wierzchniowe z prędkością vr od każdego palca elek¬ 
trody w obydwu kierunkach i docierają do następnych 
przyległych palców elektrod dokładnie w czasie po¬ 
trzebnym na zmianę kierunku pól elektrycznych E t 
i E & . W tych więc warunkach składowe odkształceń 
propagują się w fazie ze zmianami pól elektrycznych 
i wytwarzają falę powierzchniową w obydwu kierun¬ 
kach do palców elektrod. Pozostałe składowe defor¬ 
macji niepożądane dla generacji fal powierzchniowych 
propagują się niezależnie od częstości i stąd w warun- 




Rys. 6. Metoda wytwarzania fal Rayleigha na powierzchni ma¬ 
teriału piezoelektrycznego (LiNb0 3 ) za pomocą elektrod grze¬ 
bieniowych (palczastych): a) rozkład naprężeń (Ej) i wartości 
modułów piezoelektrycznych (i/o) w krysztale dla generacji fal 
Rayleigha w’ kierunku x 9 , b) rozkład pola elektrycznego na po¬ 
wierzchni kryształu LiNbÓ 3 


kach rezonansu są znacznie słabsze, tym niemniej wy¬ 
raźnie występują. 

W większości przetworników powierzchniowych dla 
fal Rayleigha szerokość elektrod palczastych (poje¬ 
dynczych palców) jest rzędu 1 / i długości fali A. Gdy 
częstości są mniejsze niż 300 MHz, długość fali dla 
zwykle stosowanych materiałów jest większa niż 10 pm 
i elektrody wykonuje się konwencjonalnymi metoda¬ 
mi fotoakwaforty (połączenie techniki fotograficz¬ 
nej z techniką akwaforty). Przy częstościach wyż¬ 
szych (przy 1 GHz, A ^ 3 pm) — technika nakłada¬ 
nia elektrod jest już specjalna i odbywa się elektro¬ 
nicznie. 

Za pomocą opisanej metody można generować fale 
Rayleigha o częstościach dochodzących do 2 GHz. 

Fale powierzchniowe można generować również wy¬ 
korzystując zjawisko magnet ostry kej i na powierzchni 
materiałów magnetycznych, takich jak np. granat itru 
lub stosując cienkie warstwy magnetyczne na podło¬ 
żach niemagnetycznych. (Zjawisko magnetostrykcji 
polega na zmianie kształtu i wymiarów magnetyka 
podczas magnesowania). 

Fale Rayleigha można także wytworzyć w podłożu przetworniki 
niepiezoelektrycznym (np. na szkle) pobudzając po- ctenkowar- 
lem elektrycznym za pomocą elektrody palczastej stwowe 
(rys. 7) cienką warstwę piezoelektryczną, napyloną na 
powierzchnię podłoża. 


Rys. 7. Cienko¬ 
warstwowy piezoele¬ 
ktryczny przetwornik 
fal powierzchniowych 
Reyleigha (wg J. de 
Klerka) 



Dzięki odpowiedniej konstrukcji przetworników generacja fal 
powierzchniowych można generować fale Love’a i fale Lamba 
Lamba. Jako przykład na rys. 8 przedstawiony jest 
układ do generacji warstwowej symetrycznej fali 
Lamba. Palczaste elektrody umieszczone są we wnę¬ 
trzu (w płaszczyźnie środkowej) naparowanej war¬ 
stwy piezoelektrycznej. Przyłożenie pola elektryczne¬ 
go wywołuje symetryczne deformacje warstwy, któ¬ 
rych rozkład jest zaznaczony na rysunku. 


elektroda palczasta 


warstwa piezoelektryczna 



Rys. 8. Przetwornik wytwarzający fałe warstwowe Lamba 


Jako jeden z wielu możliwych przykładów zastoso¬ 
wań fal powierzchniowych do formowania sygnałów 
w układach współczesnej elektroniki przedstawiono 
na rys. 9 filtr dopasowany do sygnału modulowanego 
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Rys. 9. Filtr dopasowany do sygnału modulowanego częściowo 
wykorzystujący fale powierzchniowe: a) zasada konstrukcji i dzia¬ 
łania, b) fotografia filtru dopasowanego do sygnału modulowa¬ 
nego częstościowo z jednym przetwornikiem. Prążki przedsta¬ 
wiają pary elektrod palczastych napylonych na podłożu kwarco¬ 
wym. Filtr taki używany jest w układach radarowych. Skala jest 
w centymetrach, c) odpowiedź filtru na dopasowany sygnał. 
Skala 2 jis na podziałkę 


filtry częstościowo. Filtr taki działa na zasadzie linii opóź- 
dyspersyjne niającej, za pomocą której, dzięki odpowiedniemu za¬ 
gęszczeniu palców elektrody grzebieniowej, prze¬ 
kształca się np. elektryczny impuls prostokątny (tak 
jak to pokazano na rys. 9a) na modulowany często¬ 
ściowo o prawie stałej amplitudzie. Sygnał elektrycz¬ 
ny za pomocą pierwszego przetwornika zostaje zamie¬ 
niony na akustyczną falę powierzchniową, która bieg¬ 
nie z prędkością dźwięku, to jest ok. 10 5 razy wolniej 
niż sygnał elektryczny biegnący z prędkością światła 
i zostaje odebrany przez przetwornik drugi, zamienia¬ 
jący go znów na sygnał elektryczny w postaci odpo¬ 
wiednio zmienionej w procesie przetwarzania. Dzięki 
różnym możliwościom konstrukcyjnym za pomocą 
takich filtrów (zwanych dyspersyjnymi) można „obra¬ 



biać” sygnały elektryczne na wiele bardzo przydat¬ 
nych w praktyce sposobów, nieosiągalnych innymi 
metodami. Przykładami zastosowania takiej obróbki 
sygnałów może być kompresja łub rozszerzenie impul¬ 
sów w dziedzinie czasu i w dziedzinie częstości, jak 
również konwolucja czyli uzyskiwanie splotu sygna¬ 
łów, przekształcanie impulsów z jednej postaci w dru¬ 
gą, kodowanie sygnałów za pomocą impulsów i wiele 
innych. 


E. Dieulesaint, P. H artman n Acoustic surface wave fil ters, 
Ultrasonics, 11, 24 (1973); S. Kaliski Drgania i fale w ciałach 
stałych , Warszawa 1966; D. P. Morgan Surface acoustic wave 
devices ancł applications r Ultrasonics 11, 121, 211, 255 (1973); 
A. Śliwiński, E. Ozimek Akustyka laboratoryjna , cz. 3, Warszawa 
1974; L. A. Viktorov Rayleigh and Lamb Waves, New York 
1967. 


Holografia akustyczna 

Iwona Wojciechowska 


Pod koniec lat 60-ych XX w. powstała nowa metoda 
przestrzennej wizualizacji wnętrza nieprzezroczystych 
dla światła obiektów nazwana holografią akustyczną 
(od greckich słów hólos — 'cały’, graphd — 'piszę’, 
oraz przymiotnika akustyczny, określającego typ fal 
służących do tego zapisu). 

Podstawowymi zjawiskami fizycznymi, wykorzysty¬ 
wanymi w tej metodzie są, tak jak w holografii 
optycznej (-► Holografia), dyfrakcja i interferencja. 
Zasada otrzymywania hologramów jest podobna w 
obu przypadkach, z tym że zamiast rozkładu natęże¬ 
nia światła w wyniku interferencji, mamy do czynienia 
w holografii akustycznej z rozkładem natężenia fali 
dźwiękowej. W holografii akustycznej fale akustyczne 
akustyczny wykorzystywane są tylko w pierwszym procesie — 
zapis, tworzenia hologramu, natomiast odtwarzanie odbywa 
optyczne się za pomocą fal świetlnych. Hologram otrzymany 
odtwarzanie w wyniku interferencji dwóch wiązek — przedmioto¬ 
wej i odniesienia (rys. 1), zapisany jest w ośrodku 
czułym na zmiany amplitudy lub natężenia fali akus¬ 
tycznej. Aby obraz akustyczny stał się widzialny, 
odtwarzanie musi się odbywać za pomocą fal świetl¬ 
nych. Techniczne rozwiązanie procesów rejestracji 
i odtwarzania w holografii akustycznej polega na od¬ 
powiednim wykorzystaniu i dopasowaniu zjawisk od¬ 
działywania ośrodków i światła z falami akustycznymi. 

Ze względu na możliwości odtwarzania wnętrza 
nieprzezroczystych dla światła przedmiotów oraz 
przedmiotów w nieprzezroczystych ośrodkach, jakie 


daje holografia akustyczna, zastosowanie jej w róż¬ 
nych dziedzinach, takich jak medycyna, biologia, geo¬ 
logia, geofizyka, oceanologia, hydrolokacja itcL, da¬ 
wałoby szerokie możliwości poznawcze. Przy pomocy 
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możliwości holografii akustycznej istnieje możliwość badania 
zastosowania przedmiotów i struktur o różnej wielkości; zdolność 
rozdzielcza metody zależy bowiem przede wszystkim 
od długości fali rejestrującej, a fale akustyczne posia¬ 
dają długości od metrowych do mikronowych. Dłu¬ 
gość fali rejestrującej musi być odpowiednio dobrana 
do rozmiarów obiektu i interesujących w tym obiek¬ 
cie szczegółów. Im większy obiekt tym większą można 
stosować długość fali. Najbardziej obiecującą dziedzi¬ 
ną zastosowania holografii akustycznej jest diagnosty¬ 
ka medyczna, np. wykrywanie ognisk raka w miękkich 
tkankach ciała ludzkiego nie osłoniętych przez kości. 
Poza tym holografia akustyczna znajduje zastosowanie 
w defektoskopii ultradźwiękowej umożliwiającej nie¬ 
niszczące badania wewnętrznej budowy różnych ciał. 
Opierając się na zasadach holografii konstruuje się 
specjalne urządzenia do podwodnego widzenia, co 
w przyszłości może znacznie zwiększyć stopień wy¬ 
korzystania bogactw mórz i oceanów. 

Bardzo ważne jest to, że źródła spójnych fal aku¬ 
stycznych znane są i stosowane od dawna, a właśnie 
od spójności fali przedmiotowej i fali odniesienia za¬ 
leży wierność odtwarzania w holografii. Fale te nie 
muszą nawet pochodzić z tych samych źródeł, bo ge¬ 
neratory fal akustycznych mogą pracować niezwykle 
stabilnie. Jak widać, zastosowanie fal akustycznych 
w holografii ma duże zalety, ale są też poważne trud¬ 
ności polegające na dobraniu odpowiedniego ośrodka 
rejestracja rejestrującego rozkład ciśnienia akustycznego i układu 
fal przetwarzającego obraz akustyczny na optyczny. Od 
akustycz- wielu lat bada się oddziaływania fal akustycznych na 
nych różne ośrodki — znane są chemiczne, mechaniczne 
i elektryczne zjawiska zachodzące w materii pod wpły¬ 
wem fal dźwiękowych (szczególnie ultradźwięko¬ 
wych). Od lat 30-ych XX w. bada się oddziaływanie 
światła i ultradźwięków (-> Akustyczne zjawiska 
kwantowe). 

Istnieją różne detektory rozkładów pola akustycz¬ 
nego i można je podzielić w zależności od rodzaju 
zjawisk jakie wywołują w ośrodkach fale akustyczne. 


Metody rejestracji pola akustycznego 


Metoda 

Czułość 
progowa 
W/m 1 -10- 4 

Metody chemiczne: 
bezpośrednie oddziaływanie na 
błonę fotograficzną 

1-5 

papier światłoczuły 
w wywoływaczu 

1,0 

Metody termiczne: 
zmiana stałej fosforescencji 

0,05-0,1 

zmiana fotoemisji 

0,1 

termoczułe barwniki 

l 

10-10 

ciekłe kryształy 

Metody mechaniczne i optyczne 
deformacja powierzchni cieczy 

+ przetwarzanie światłem spójnym 

10- 3 -10- s 

deformacja powierzchni ciała stałego 

10-* 

Metody elektronowe: 

przetworniki piezoelektryczne ułożone w mo¬ 
zaikę lub pojedynczy śledzący pole 

10- u 

elektronowe śledzenie przetwornika piezoelek¬ 
trycznego (np. kamera Sokołowa) 

10- T 


Bardzo ważną cechą detektorów jest czułość progowa, 
czyli minimalne natężenie ultradźwięków potrzebne 
do rejestracji obrazu. Poszczególne metody rejestracji 
mają bardzo różną czułość (tabela). Jak wynika 
z tabeli największą czułość wykazują metody elektro¬ 
nowe oraz przetworniki akustooptyczne z ciekłym 
kryształem. Metody elektronowe stosowane są obec¬ 
nie najczęściej. Trwają natomiast prace nad prze¬ 
twornikami ciekłokrystalicznymi, które nie mają 
jeszcze konstrukcji technicznej całkowicie rozwiązanej. 

Ogólna zasada rejestracji metodami termicznymi 
termiczne polega na tym, że niektóre substancje organiczne są 
metody bardzo czułe na niewielkie zmiany temperatury. Gdy 
rejestracji do ośrodka wprowadza się falę ultradźwiękową, to 
na skutek pochłaniania energii akustycznej występują 


lokalne zmiany temperatury proporcjonalne do natę¬ 
żenia ultradźwięków. Wraz ze zmianami temperatury 
zmieniają się lokalnie niektóre własności ośrodków, 
jak np. zdolność do fotoemisji światła (zmiana barwy 
przepuszczalnego światła np. w ciekłych kryształach 
cholesterycznych). 

Już wcześniej stosowane były metody mechaniczne mechaniczne 
wykorzystujące fakt, że fale akustyczne powodują de- i optyczne 
formację powierzchni cieczy, wywierając ciśnienie na metody 
tę powierzchnię. Schemat układu holograficznego rejestracji 
opartego na tym zjawisku przedstawia rys. 2. Rozkład 
i wysokość zmarszczek na powierzchni cieczy odpo¬ 
wiada rozkładowi natężenia I pola ultradźwiękowego 
wytworzonego na skutek interferencji wiązki przed¬ 
miotowej i wiązki odniesienia. Odległość między 
zmarszczkami d = /f/2sin0, a ich wysokość 




A jest długością fali świetlnej 
.1 jest długością fali akustycznej 

Rys. 3. Schemat wyjaśniający odtwarzanie hologramu akustycz¬ 
nego w metodzie deformacji powierzchni cieczy 


h = / c /27u 2 y/*sin*d, gdzie A y ż, c są długością, częstotli¬ 
wością i prędkością propagacji fali akustycznej, y — 
współczynnik napięcia powierzchniowego, B — kąt 
między normalną do powierzchni cieczy a kierunkiem 
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padania wiązki przedmiotowej i odniesienia (rys. 3). 
Drgająca i zmodulowana powierzchnia cieczy oświet¬ 
lana jest światłem spójnym, które po ugięciu na po¬ 
wierzchni cieczy i przejściu przez odpowiedni układ 
optyczny (rys. 2) odtwarza obraz przedmiotu. Sprzę¬ 
żenia układu optycznego z monitorem TV umożliwia 
osiągnięcie lepszej jakości obrazów oraz badania 
w tzw. czasie rzeczywistym (tzn., że odtwarzanie obra¬ 
zu odbywa się równocześnie z rejestracją), co ma 
ogromne znaczenie m.in. w medycynie, 
elektronowe Metody elektronowe mają największą czułość 
metody spośród wszystkich obecnie stosowanych metod reje- 
rejestracji stracji i przetwarzania obrazu akustycznego. W tych 
metodach stosuje się jeden przetwornik śledzący roz¬ 
kład pola akustycznego lub mozaikę małych prze¬ 
tworników elektroakustycznych (piezoelektrycznych. 


monitor wzmacniacz 



Rys. 4. Kamera ultradźwiękowa Sokołowa: 1 przetwornik pie¬ 
zoelektryczny, 2 przedmiot, 3 soczewka akustyczna, 4 wiązka 
elektronów, 5 powielacz elektronów, 6 płyta piezoelektryczna, 
7 układ formujący wiązkę elektronów 


elektrostrykcyjnych itp.). Przetworniki zamieniają 
sygnał akustyczny na elektryczny, sygnał elektryczny 
przetwarzany jest dalej na optyczny. Jednym z roz¬ 
wiązań jest kamera Sokołowa (rys. 4). Fala ultra- kamera 
dźwiękowa po przejściu przez przedmiot pada na Sokołowa 
płytę piezoelektryczną, indukując na niej rozkład 
ładunków, których wartości odpowiadają rozkładowi 
amplitudy fali. Rozkład ładunków moduluje natęże¬ 
nie śledzącej wiązki elektronowej, zmodulowany sy¬ 
gnał elektronowy po przejściu prze 2 powielacz prze¬ 
kazywany jest na monitor. Czułość większą od kamery 
Sokołowa posiada układ mozaikowy przetworników, 
na których napięcia tworzą matryce sygnałów elek¬ 
trycznych. Ta z kolei przetwarzana jest na matrycę 
sygnałów optycznych. Urządzenia takie są bardzo 
złożone pod względem elektronicznym. 

W ciągu ostatnich kilku lat w holografii akustycz¬ 
nej został dokonany ogromny postęp dzięki minia¬ 
turyzacji obwodów elektronicznych i jest nadzieja, 
że holografia akustyczna jako narzędzie badawcze 
i diagnostyczne wkroczy do nauki i techniki już za 
kilka lat. Na ii. 166 i 167 (tabl. 43) przedstawione są 
obrazy przedmiotów otrzymane z hologramów aku¬ 
stycznych. 

W chwili, gdy czytelnik czyta ten skrótowy opis 
i ogląda wyniki uzyskiwane za pomocą holografii 
akustycznej, zapewne w którymś z ośrodków nauko¬ 
wych powstają już znacznie lepsze obrazy od przed¬ 
stawionych tutaj. Postęp w tej dziedzinie jest bardzo 
duży i należy się spodziewać szybkiego udoskonalenia 
metody. 

Akusticzeskaja goło gra fi ja, red. W. G. Prochorowa (tłum. 
z jęz. ang.) Leningrad 1975; P. Alais Imagerie et holographie 
ultrasonores , Rev. de Phys. Appl., suppl. J. de Phys., 11, 559 (1976); 

A.F. Metherell i in. Acoustical Hołography, New York 1969. 


Akustyczne zjawiska kwantowe 


akustyka Akustyka kwantowa jest bardzo młodym działem 
kwantowa akustyki. Chociaż idea kwantowego przedstawienia 
energii fali akustycznej jest dosyć dawna, sięga lat 
trzydziestych (wprowadzenie pojęcia fononu przez 
J. Frenkla w 1932 r.), to dopiero od mniej więcej 
15 lat stanowi ona wydzieloną jednoznacznie dziedzi¬ 
nę. Zdecydowały o tym odkrycia bezpośrednich od¬ 
działywań akustoelektronowych (foton-elektron) 
i akustomagnetycznych (fonon-spin, zjawiska aku¬ 
stycznego rezonansu magnetycznego), których wy¬ 
jaśnienie wymagało posłużenia się opisem mechaniki 
kwantowej. Okazało się, że język kwantowy konieczny 
jest do opisu rozchodzenia się zaburzeń sprężystych 
w ciekłym helu (akustyczne procesy molekularne), 
a później w wielu innych procesach, jak np. oddziały¬ 
wanie fonon-foton czy fonon-fonon. Oddziaływania 
te są przyczyną powstawania akustycznych procesów 
nieliniowych (-►Przedmiot i zakres akustyki). 

Opis kwantowy jest szczególnie przydatny do wy¬ 
jaśnienia mechanizmu rozchodzenia się fal spręży¬ 
stych w ciałach stałych (-► Dynamika sieci krystalicz- 
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nej). W modelu klasycznym ciała stałego węzły sieci 
(atomy) są traktowane jako oscylatory sprzężone 
(można je sobie wyobrazić jako drgające kulki połą¬ 
czone sprężynami; rys. 1, między którymi energia 
przekazywana jest w sposób ciągły. Model ten jednak 
okazał się niewystarczający, gdyż w wielu procesach 
(o których wspomniano wyżej), szczególnie w niższych 
temperaturach, energia przekazywana oscylatorom 
ma charakter kwantowy, czyli odpowiada określonym 
kwantom (porcjom) energii sprężystej. 

W modelu kwantowym ciała stałego poszczególne 
oscylatory klasyczne zastępuje się kwantowymi, tj. 
takimi, które mogą być wzbudzone przez dostarczone 
im kwanty energii. Obrazem sieci krystalicznej z drga¬ 
jącymi atomami jest zbiór takich indywidualnych 
oscylatorów, w którym ich poszczególne stany wzbu¬ 
dzone są sobie wzajemnie przekazywane jako stru¬ 
mień kwantów energii (fononów). Zbiór tych kwan¬ 
tów, poruszających się swobodnie .w sieci krystalicz¬ 
nej, stanowi tzw. gaz fononowy (analogia do gazu 
elektronowego w przewodnikach). 

Leżące u podstaw akustyki kwantowej pojęcie fo- fonon — 
nonu jako kwantu energii fali sprężystej jest analo- kwant 
giczne do pojęcia fotonu jako kwantu energii fali energii 
elektromagnetycznej. Jednak foton uważa się za sprężystej 
cząstkę elementarną swobodną, natomiast fonon jest 
tzw. kwazicząstką, czyli przedstawia wzbudzenie ele¬ 
mentarne ściśle związane z układem wielu cząstek 
(np. węzłów sieci krystalicznej, zderzających się czą¬ 
steczek cieczy czy gazu). Kwazicząstkę można tylko 
w przybliżeniu traktować jako swobodną. 

Fononowi, podobnie jak fotonowi, przypisuje się 
energię E = hv , gdzie fi — stała Plancka, v — częstość 
drgań, przy czym oba te rodzaje cząstek mają spin 
całkowity i podlegają statystyce Bosego-Einsteina. 































fala 
akustyczna 
— strumień 
fononów 


własności 

piezo¬ 

elektryczne 


Jest jednak istotna różnica, polegająca na tym, że fo¬ 
tony mają dwie wartości własne spinu odpowiadające 
dwom stanom polaryzacji (skrętność ±1), natomiast 
spin fononów może przybierać wartości —1, 0, +1, 
co odpowiada dwom sposobom drgań poprzecznych 
o dwóch stanach polaryzacji (skrętność ±1) oraz 
drganiom podłużnym (polaryzacja 0). 

Fononowi przypisuje się także pęd, który może być 
określony ściśle jedynie dla węzłów sieci krystalicz¬ 
nej, a traci sens fizyczny dla „pustych” przestrzeni 
między węzłami sieci. Dlatego traktując fonon jako 
swobodny, mówimy o kwazipędzie fononu. 

Rozchodzącą się falę akustyczną w modelu kwan¬ 
towym przedstawiamy jako strumień fononów, stąd 
więc gęstość energii fali E wyrazić można: E = Nhv — 
= NhcOy a następnie natężenie fali J — ~Ec — Nhooc, 
gdzie N — liczba fononów w jednostce objętości, 
h — hl2K,co — częstość kołowa, c — prędkość rozcho¬ 
dzenia się dźwięku. 

Akustyczne efekty kwantowe występują wyraźnie 
w wielu oddziaływaniach, jeżeli energia fononów jest 
porównywalna z energią innych kwantów, przekazy¬ 
wanych np. przez elektrony, magnony, fotony czy 
neutrony w procesach zderzeń. 

W oddziaływaniach fonon-fonon oddziaływanie 
jest silniejsze, gdy długość fali akustycznej staje się 
porównywalna z odległością między węzłami sieci. 
Warunki takie zachodzą przy bardzo wysokich czę¬ 
stościach, rzędu gigaherców (GHz, powyżej 10° Hz), 
tj. w zakresie hiperdźwiękowym. 

Właściwe rozumienie procesów oddziaływań fal 
akustycznych (zwłaszcza wysokich częstości) z innymi 
mikroskopowymi obiektami fizycznymi na podstawie 
akustyki kwantowej umożliwiło wykorzystanie tych 
oddziaływań. Na przykład oddziaływania fonon-ele- 
ktron wykorzystuje się w akustoelektronice do bez¬ 
pośredniego wzmacniania ultradźwięków, oddziały¬ 
wania fonon-foton w układach pamięciowych, liniach 
opóźniających (-► Akustyczne fale powierzchniowe 
i ich zastosowanie), faserach kwantowych. 


Oddziaływania fonon-elektron 

Antoni Śliwiński 

Wzajemne oddziaływania fali sprężystej z polem elek¬ 
trycznym zachodzą głównie w ośrodkach posiadają¬ 
cych własności piezoelektryczne. Tego rodzaju włas¬ 
ności wykazują kryształy nie mające środka symetrii 
(należące do niecentrosymetrycznych klas krystalo¬ 
graficznych), lecz posiadające oś biegunową, zwaną 
osią piezoelektryczną. W takich kryształach może za¬ 
chodzić zjawisko piezoelektryczne polegające na tym, 
że deformacje mechaniczne, zwłaszcza wywołane 
wzdłuż osi biegunowej, powodują powstawanie wol¬ 
nych ładunków elektrycznych polaryzujących krysz¬ 
tał. Jest to tzw. proste zjawisko piezoelektrycz¬ 
ne— w odróżnieniu od odwrotnego zjawiska piezo¬ 
elektrycznego, polegającego na wystąpieniu defor¬ 
macji kryształu pod wpływem zewnętrznego pola 
elektrycznego przyłożonego wzdłuż osi biegunowej. 
Zjawisko piezoelektryczności jest liniowe i charak¬ 
teryzują je moduły piezoelektryczne, które są okreś¬ 
lone jako współczynniki proporcjonalności pomiędzy 
odkształceniem a powstałym natężeniem pola elek¬ 
trycznego. 

Fala ultradźwiękowa rozchodząca się w krysztale 
piezoelektrycznym w kierunku, w którym moduł pie¬ 
zoelektryczny jest różny od zera, powoduje powsta¬ 
wanie wewnętrznych zmiennych pól elektrycznych. 
Jeżeli materiał piezoelektryczny jest jednocześnie 
przewodnikiem lub półprzewodnikiem elektrycznym, 
to istniejące w nim swobodne nośniki ładunku (np. 
elektrony lub dziury) podlegają silnemu działaniu 
tych zmiennych pól elektrycznych (rys. 2). 

W dobrym przewodniku nośniki ładunku reagują 


na działanie pól piezoelektrycznych natychmiast i zu¬ 
pełnie je kompensują. Warunki takie zachodzą wów¬ 
czas, gdy co* > co, gdzie co — częstość zmian pola 
piezoelektrycznego (równa częstości fali ultradźwię¬ 
kowej), aa><r = ofe, gdzie <r— współczynnik przewód- 




Rys. 2. Poglądowe przedstawienie mechanizmu oddziaływania 
fali sprężystej z nośnikami ładunku w piezoelektryku: a) przy 
braku sprzężenia, b) przy silnym sprzężeniu i małej prędkości 
vd dryfu nośników w polu elektrycznym, c) przy silnym sprzę¬ 
żeniu i prędkości v<t dryfu nośników równej prędkości fali sprę¬ 
żystej c, d) przy silnym sprzężeniu i prędkości Vd dryfu nośników 
większej od prędkości fali sprężystej c 

nictwa elektrycznego, e — przenikalność elektryczna 
materiału; można wtedy oczywiście powiedzieć, że 
materiał jest efektywnie niepiezoelektryczny. Jeżeli 
jednak w piezoelektrycznym materiale przewodzą¬ 
cym będzie spełniony warunek: o a < co, to reakcja 
nośników ładunku na zmienne pole piezoelektryczne 
będzie znacznie wolniejsza. Taki stan rzeczy bywa 
często w piezoelektrycznych półprzewodnikach (typu 
GdS, ZnS) w zakresie wyższych częstości ultradźwię¬ 
kowych. Wtedy pomiędzy falą ultradźwiękową (stru¬ 
mieniem fononów) a nośnikami ładunków występuje 
bardzo silne sprzężenie. Jeśli tymi nośnikami są elek¬ 
trony, to mają one tendencję do gromadzenia się 
w miejscach, gdzie potencjał elektryczny pola posiada 
minimum i dzięki temu fala sprężysta może pociągnąć 
je za sobą (rys. 2b). Jeżeli próbkę umieści się w sta¬ 
łym polu elektrycznym o kierunku zgodnym z kie¬ 
runkiem rozchodzenia się fali sprężystej, to elektrony 
zaczną dryfować w tym polu i zmieni się sprzężenie 
pomiędzy nimi a falą sprężystą. W ten sposób ze¬ 
wnętrzne pole elektryczne pomaga nośnikom podążać 
za falą, przez co biegnąca fala ulega mniejszemu tłu¬ 
mieniu — traci mniej energii na oddziaływania z elek¬ 
tronami (rys. 2c). Inaczej można powiedzieć, że 
energia pola zewnętrznego za pośrednictwem nośni¬ 
ków ładunku zostaje przekazana fali akustycznej. Przy 
odpowiednio dużej wartości zewnętrznego pola elek¬ 
trycznego może nastąpić nie tylko skompensowanie 
tłumienia, ale nawet wzmocnienie biegnącej fali ultra¬ 
dźwiękowej kosztem energii zewnętrznego pola elek¬ 
trycznego (rys. 2d). 

Oddziaływanie fali ultradźwiękowej z elektronami 
(lub z innymi nośnikami ładunku) możemy rozpatry¬ 
wać jako proces zderzeń fononów i elektronów (lub 
innych nośników ładunku). Rozpatrzmy najpierw 
sytuację, w której ośrodek jest półprzewodnikiem i nie 
ma zewnętrznego pola elektrycznego. Zderzenia są 
niesprężyste,co oznacza, że przy zderzeniu cała ener- 
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współczynnik gia fononu zostaje przekazana elektronowi. Z zasady 
tłumienia zachowania pędu można obliczyć zmiany prędkości 
elektronów wynikłe ze zderzeń z fononami; są one 
równoznaczne z pojawieniem się w półprzewodniku 
dodatkowego prądu, zwanego akustoelektrycznym. 
Ubytek energii fononów zużytych na wytworzenie 
tego prądu objawia się jako tłumienie biegnącej fali 
sprężystej, co można scharakteryzować za pomocą 
współczynnika tłumienia a. 

Jeżeli z kolei rozpatrzymy sytuację, w której zostało 
przyłożone pole elektryczne E o kierunku zgodnym 
z biegiem fali, to stwierdzimy, że na swobodne elek¬ 
trony w półprzewodniku działa dodatkowa siła, która 
je wprawia w ruch (dryfowanie) z prędkością propor¬ 
cjonalną do natężenia pola w kierunku jego działania 
i wynoszącą: 

Vd = 

gdzie fi jest ruchliwością elektronów, przy czym 
jn — (efm)r t gdzie e — ładunek elektronu, m — masa 
elektronu, t — średni czas życia elektronów między 
zderzeniami. 

Współczynnik tłumienia fali sprężystej w obecności 
pola oce ma inną wartość niż bez pola. Zależność tłu¬ 
mienia fali ultradźwiękowej od poła elektrycznego 
w procesie oddziaływań fonon-elektron opisuje 
wzór: 

CLE — Oc(l —Vd/c) t 

gdzie c jest prędkością fali ultradźwiękowej w półprze¬ 
wodniku. Z tego wzoru wynika, że współczynnik tłu¬ 
mienia w obecności pola elektrycznego cle może być: 

dodatni cle > 0 , gdy v& < c , (rys. Ib) 

równy zeru cle — 0, gdy v<t = c 9 (rys. lc) 

ujemny cle < 0, gdy va > c. (rys. Id) 


wzmocnienie W tym ostatnim przypadku ujemny współczynnik 
fali tłumienia oznacza wzmocnienie fali sprężystej kosz- 
sprężystej tern energii zewnętrznego pola elektrycznego. Aby 
wzmocnienie nastąpiło, pole musi przekroczyć pewną 
wartość krytyczną E = £* odpowiadającą v d = c, 
żeby prędkość dryfu elektronów przekroczyła pręd¬ 
kość fononów c. Na rys. 3 podany jest wykres zależ¬ 
ności cle od y = 1 —(vd/c). 



Rys. 3. Zależność współczynnika tłumienia ultradźwięków a b 
od wartości dryfowania y 


Pierwsze doświadczenia, w których uzyskano bez¬ 
pośrednio wzmocnienie fal ultradźwiękowych na wy¬ 
żej opisanej zasadzie, przeprowadzili w 1961 r. 
A. R. Hutson, J. H. McFee i D. L. White w krysztale 
siarczku kadmu (CdS). Ich układ pomiarowy przed¬ 
stawia rys. 4. 

Przetworzony przez przetwornik T, sygnał ultra¬ 
dźwiękowy, którego amplitudę można regulować 
potencjometrem decybelowym (attenuatorem A t ), 
przechodzi przez pręt buforowy do kryształu CdS. 
Sygnał jest odbierany przez przetwornik r 2 , przy 
czym jego wzmocnienie można również regulować, 
attenuatorem A 2 . Na powierzchniach kryształu CdS 
znajdują się elektrody, pozwalające na przykładanie 
zewnętrznego pola elektrycznego E. Kryształ CdS 
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Rys. 4. Schemat układu do obserwacji wzmocnienia fal ultradźwię¬ 
kowych w CdS zastosowany przez A. R. Hutsona, J. H. McFee 
i D. L. White’a 

jest fotoczuły, co można dodatkowo wykorzystać do 
regulacji stężenia nośników ładunku w krysztale oś¬ 
wietlając go światłem o różnym natężeniu. Można 
więc regulować współczynnik przewodnictwa a. 

Na rys. 5 podana jest zależność (uzyskana przez przykład - 
wyżej wspomnianych autorów) względnego osłabienia absorpcja 
poziomu amplitudy sygnału (w dB), który przeszedł w CdS 
przez próbkę CdS, od przyłożonego pola elektrycz¬ 
nego E (pola powodującego dryf elektronów). Po¬ 
ziomem odniesienia krzywych przedstawionych na 
rysunku są wartości, jakie się uzyskuje dla kryształu 
nie oświetlonego (gdy co a = <r/e = 0). Widać, że gdy 
E < 700 V/cm, absorpcja jest dodatnia i wzrasta ze 
wzrostem pola do momentu, w którym prędkość 
dryfu elektronów vd staje się porównywalna z pręd¬ 
kością fali ultradźwiękowej (E cz 700 V/cm). Wtedy 
absorpcja maleje, staje się równa zeru i zmienia znak 
na przeciwny. Gdy E > 700 V/cm, absorpcja jest 
ujemna, czyli fala ultradźwiękowa ulega wzmocnieniu. 

Na rys. 6 jest zapis sygnału, jaki można uzyskać 
w układzie z rys. 4 po stronie odbiorczej, gdy w nie¬ 
obecności fali ultradźwiękowej przyłoży się krótko¬ 
trwały impuls pola elektrycznego E > Ek . W rezul¬ 
tacie oddziaływania elektronów z fononami termicz¬ 
nymi powstanie strumień fononów (koherentnych), 
które tworzą hiperdźwiękową falę sprężystą. 


A B iC 



Rys. 5. Zależność absorpcji fal ultradźwiękowych (osłabienie po¬ 
ziomu amplitudy sygnału w dB względem wartości odpowiada¬ 
jącej próbce nieoświetlonej) w CdS od natężenia pola dryfują¬ 
cego: krzywa A dla w a l<o — 1,2 i częstości 15 MHz, krzywa B 
dla o)al(o = 0,24 i częstości 45 MHz, krzywa C dla cotr(o) = 0.21 
i częstości 45 MHz 
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Rys. 6. Powstanie spontanicznego impulsu akustycznego w CdS 
po przyłożeniu impulsu pola elektrycznego przekraczającego war¬ 
tość progową; górny przebieg — impuls pola, dolny przebieg — 
sygnał odebrany przez przetwornik o częstotliwości własnej 
15 MHz (przebiegi zaobserwowano na ekranie oscyloskopu) 


Zjawiska oddziaływania fonon-elektron stały się 
od kilkunastu lat przedmiotem wielu badań i zasto¬ 
sowań w układach akustoelektronicznych o wzmoc¬ 
nieniu bezpośrednim (—► Akustyczne fale powierzch¬ 
niowe i ich zastosowanie). Badania są szeroko rozwi¬ 
jane również w Polsce, gdzie zostały opracowane 
teoretycznie i skonstruowane urządzenia nazwane 
faserami. Wcześniej były skonstruowane masery, w 
których zostało wykorzystane zarówno zjawisko 
akustomagnetyczne, jak i oddziaływanie fonon- 
elektron. 


Oddziaływania fonon-fonon 

Antoni Śliwiński 

Zjawisko wzajemnego oddziaływania dwóch fal aku¬ 
stycznych (dwóch wiązek fononów) nie występuje 
przy akustycznych zjawiskach liniowych, przy któ¬ 
rych obowiązuje zasada superpozycji; przenikające 
przez siebie fale nie wytwarzają żadnego dodatkowe¬ 
go zaburzenia, które by wychodziło poza obszar 
wzajemnego przenikania (w tym obszarze może za¬ 
chodzić interferencja; rys. 7a). Do oddziaływania 
powstawanie dochodzi przy zjawiskach nieliniowych, gdy się spo- 
fal rozpro- tykają fale o odpowiednio dużej amplitudzie. Wtedy 
szonych w wyniku oddziaływania pojawiają się fale rozpro¬ 
szone (rys. 7b), ich częstości są sumą lub różnicą 
częstości fal pierwotnych, które się spotykały. Od- 



Rys. 7. Poglądowe przedstawienie oddziaływania fonon-fonon, 
czyli rozproszenia dźwięku na dźwięku: a) przenikanie bez wza¬ 
jemnego oddziaływania, b) przenikanie i wzajemne oddziały¬ 
wanie — powstaje fala rozproszona 


działywanie jest tym silniejsze, im większa jest energia, 
a więc im wyższa częstość spotykających się fal sprę¬ 
żystych. Przy wyższej energii mogą powstawać także 
wyższe harmoniczne takich fal kombinacyjnych. 

W akustyce kwantowej energię fali akustycznej 
wyrażamy jako sumę energii fononów, zatem wymie¬ 
nione wyżej procesy możemy rozważać jako wiele 
aktów elementarnych zderzeń (rozproszeń) fononów 


jednej fali z fononami drugiej fali. Schematycznie od¬ 
działywania fonon-fonon można przedstawić jak na 
rys. 8. W zależności od warunków, w których następuje 
swobodne zderzenie fononów, są dwie możliwości: 
albo nowy fonon, który powstaje, będzie miał energię 
równą energii fononów przed zderzeniem, albo równą 
różnicy ich energii. W procesie oddziaływania musi 
być spełniona nie tylko zasada zachowania energii, 
ale również zasada zachowania pędu (pęd fononu 

P — gdzie wektor falowy |?| = 2k/A , A — długość 

fali, h = h/ln, h — stała Plancka, p nie jest pędem 
w ścisłym sensie, ale tzw. pseudopędem lub kwazi- 
pędem, bo określony jest jedynie z dokładnością do 
wektora sieci odwrotnej pomnożonego przez h. Fono¬ 
ny swobodne traktujemy jak cząstki prawdziwe, cho¬ 
ciaż są to kwazicząstki, a więc związane z określo¬ 
nym układem — zdefiniowane jako wzbudzenia drgań 
węzłów sieci krystalicznej). Spełnienie zasad zachowa¬ 
nia wymaga, aby: 

hv x +hv z = hv 3 (zasada zachowania energii) 
oraz — 

hq x +hq z = hq z (zasada zachowania pędu), (1) 

gdzie q u q 2 , q z są wektorami falowymi odpowiednich 
fononów. Powstający w wyniku oddziaływania fonon 
będzie miał ściśle określony kierunek. W odniesieniu 
do tych dwu przykładów pokazanych na rys. 8 można 
powiedzieć, że w pierwszym nastąpiło zwiększenie 
energii pierwszego fononu o energię drugiego (wzmoc¬ 
nienie fali), natomiast w drugim — zmniejszenie 
energii pierwszego fononu o energię drugiego (absor¬ 
pcja, a w następstwie tłumienie fali). Opisany tu 
proces oddziaływania fonon-fonon nazywa się pro¬ 
cesem normalnym (procesem N) lub trójfononowym 



Rys. 8. Oddziaływanie fonon-fonon: a) fonon rozproszony zwięk¬ 
szył energię, b) fonon rozproszony zmniejszył energię 


W sieci krystalicznej ciała stałego proces oddzia¬ 
ływania fonon-fonon wymaga przy powstaniu nowe¬ 
go fononu uwzględnienia — w myśl zasady zachowa¬ 
nia pędu — rekacji kryształu (odrzutu przy wypro- 
mieniowaniu fononu), wobec czego trzeba napisać: 

łjq 1 +ftq 2 = hq z +hG , gdzie hG oznacza pęd krysz¬ 
tału jako całości; jest to proces czterofononowy 
zwany procesem U (niem. Umklapp ‘nakładanie’, co 
w tym wypadku odnosi się do dodania, dołożenia 

pędu hG). Spełnienie zasady zachowania pędu wy¬ 
maga, aby wypadkowy pęd hq+hG nie wychodził 
poza pierwszą strefę Brillouina, tj. poza ten obszar 
w przestrzeni wektora falowego, w którym energia 
zmienia się w sposób kwasi-ciągły (na granicach tej 
strefy zmienia się ona skokowo). Strefa Brillouina 
wiąże się ściśle z odstępami atomowymi w sieci kry¬ 
stalicznej i określona jest przez składowe wektora G, 
Które np. w wypadku struktury regularnej wynoszą: 

Gx = ± —, Gy — ± — , Gz = ±—,gdzieś — stała 
a a a 

sieci (—► Wzbudzenia elementarne w ciałach stałych). 

Jeżeli wiązka fal sprężystych pochodzi z jednego 
źródła, to zwykle stanowi zbiór fononów koherent¬ 
nych (jest spójna). Przykładem niespójnej wiązki fo¬ 
nonów jest strumień ciepła (zbiór fononów termicz¬ 
nych, zwanych też debayowskimi). 

Efekty rozpraszania ultradźwięków na ultradźwię¬ 
kach (fononów koherentnych na fononach koherent- 
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rozpraszanie nych) w ciele stałym zaobserwowali Su-Fen, L. K. Za* 
fononów rembo i W. A. Krasilnikow w 1962 r., badając po- 
koherentnych wstawanie fali rozproszonej o częstości sumacyjnej. 

na fononach Rysunek 9 przedstawia blokowy schemat doświad- 
koherentnych czenia. Dwa nadajniki ultradźwiękowe T x i T 2 pobu¬ 
dzane do drgań z generatorów G x i G z promieniują 
fale ultradźwiękow-e o częstościach v x i v 2 , które się 
przenikają w walcowym bloku ciała stałego (alumi¬ 
nium) pod kątem a. Rozproszoną pod kątem y falę 
o częstości kombinacyjnej rejestruje rezonansowy 
odbiornik R. Odebrany sygnał elektryczny — po 
przejściu przez filtry F x i F 2 i rezonansowy wzmac¬ 
niacz W —rejestruje się na oscylografie, którego 
podstawa czasu jest zsynchronizowana za pomocą 
modulatora A/, sterującego również generator G x . 
Jeżeli generatory G x i C 2 pracują impulsowo, trzeba 
zagwarantować takie warunki, aby wysłane impulsy 
spotkały się ze sobą. Wygodniej jest więc pracować 
z jedną falą ciągłą (jak to zaznaczono na rys. 9), 



Rys. 9. Schemat układu do obserwacji rozproszenia dźwięku na 
dźwięku. C, i C 2 generatory drgań, T x i T 2 nadajniki ultradźwię¬ 
ków, V x i V 2 mierniki napięcia, /?,, R t i R rezonansowe odbiorni¬ 
ki F x i F 2 filtry, W wzmacniacz, O oscylograf, M modulator 

a drugą impulsową. Sygnał rozproszony będzie też 
impulsowy. Do bloku aluminiowego wprowadzono 
dwie fale poprzeczne T(v) o równych częstościach 
i w wyniku ich oddziaływania odebrano jako falę 
rozproszoną falę podłużną L(2v) o częstości dwu¬ 
krotnie wyższej, zgodnie ze schematem: 

T{v) + T(y) - L(2v), (2) 

odpowiadającym procesowi trój fononowemu okre¬ 
ślonemu równaniami (I). Na oscylogramie (rys. 10) 
widać kolejne impulsy sygnałów fali rozproszonej. 

Na podstawie zjawisk oddziaływania fonon-fonon, 
szczególnie w teorii ciała stałego, wyjaśnia się wiele 
zjawisk fizycznych—jak rozszerzalność cieplna, 
oporność termiczna sieci, utrzymywanie się równo¬ 
wagi termicznej — przy czym jest to możliwe tylko 
wtedy, gdy fale sprężyste (fonony termiczne) wytwa¬ 
rzane przez drgania sieci zachowują się nieliniowo, 
anharmonicz- Cecha ta nazywa s/ę anharmonicznością sieci i może 
ność sieci być wyrażona przez zależność prędkości dźwięku od 
naprężeń, co jest równoważne z zależnością częstości 

drgań fononu ą o danej polaryzacji (sposobie drgań) 
od naprężeń (—► Wzbudzenia elementarne w ciałach 
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Rys. 10. Oscylogramy drugiej harmonicznej powstałej w wyniku 
rozproszenia impulsu poprzecznej fali ultradźwiękowej o czę¬ 
stości 3 M Hz na ciągłej fali ultradźwiękowej o takiej samej czę¬ 
stości zgodnie z relacją (2). S x , S t kolejne impulsy fali roz¬ 
proszonej, M sygnał odniesienia 

stałych). Mówiąc bardziej obrazowo, im wyższa tem¬ 
peratura, tym bardziej wzrasta amplituda drgań sieci, 
a przy dużej amplitudzie drgania przestają być har¬ 
moniczne i przechodzą w anharmoniczne, czyli takie, 
w których siły działające przestają być wprost pro¬ 
porcjonalne do wychylenia, a zależą od wyższych jego 
potęg (są to akustyczne zjawiska nieliniowe). 

Anharmoniczne oddziaływania pomiędzy fononami rozpraszanie 
w ciałach stałych powodują pochłanianie fal ultra- fali ultra¬ 
dźwiękowych (rozpraszanie fononów fali ultradźwię- dźwiękowej 
kow-ej — koherentnych, na fononach termicznych— na fononach 
niekoherentnych) we wszystkich ciałach stałych, termicznych 
a szczególnie w izolatorach, gdzie nie ma absorpcji 
pochodzącej od swobodnych elektronów, czyli od¬ 
działywania fonon-elektron. 

Rysunek 11 przedstawia typowy wykres tłumienia 
fali ultradźwiękowej w zależności od temperatury, 
tłumienia spowodowanego rozproszeniem na fono¬ 
nach termicznych w ciele stałym. Mechanizm roz¬ 
praszania fali ultradźwiękowej na fononach termicz¬ 
nych zależy od stosunku ich średniej drogi swobod¬ 
nej do długości fali ultradźwiękowej. Gdy droga swo¬ 
bodna i fononu jest mała w porównaniu z długością 
fali, / X (rys. 12a), a vr t ^ 1 , to na fonony wpły- 



Rys. 11. Zależność tłumienia ultradźwięków o częstości rzędu 
GHz w rubinie (A! a O s ) od temperatury r Obszar A — efekt roz¬ 
proszenia na fononach termicznych jest do pominięcia; obszar 
B — tłumienie rośnie jak T 9 ; obszar C — tłumienie prawie nie 
zależy od temperatury, T x , T t fale poprzeczne, L fala podłużna 






























wa tylko niewielki gradient naprężenia spowodowany 
falą ultradźwiękową. I odwrotnie, gdy / A (rys. 12b), 
vT t > 1, należy wyobrazić sobie falę ultradźwiękową 
jako strumień fononów, które biegną razem z fono¬ 
nami termicznymi, przy czym jedyne oddziaływanie 
polega na zderzeniach. Średnia droga swobodna 
fononów określona przez zderzenia fonon-fonon jest 
bardzo silnie malejącą funkcją temperatury przy 
niskich temperaturach. 





Kys. 12. Stosunki pomiędzy drogą swobodną fononu termicznego 
I i długością fali ultradźwiękowej A, która ulega tłumieniu: 
a) / < A, b) / > A, c) / = A 

Istnieje taki obszar temperatur, gdzie / ^ A (rys. 
12c), a vr t X 1 , i wtedy oddziaływania stają się bar¬ 
dzo silne, zderzenia bardzo częste, przy czym procesy 
zderzeń mają charakter relaksacyjny. 

Obszar vr t < 1 nazywamy albo obszarem termo- 
elastycznym, albo obszarem Akhiesera, albo obszarem 
lepkości fononowej, natomiast obszar, gdzie vx t > 1, 
nazywa się obszarem Landaua-Rumera. Obszary te 
rozgranicza obszar pośredni, gdy vx t ^ 1. 


Oddziaływania foton-fonon 

Marek Kosmal 

Dział fizyki obejmujący zjawiska związane z oddzia¬ 
ływaniami fotonów z fononami, czyli oddziaływaniem 
fal świetlnych z falami ultra- i hiperdźwiękowymi, 
nosi nazwę akustooptyki. Praktycznym zastosowa¬ 
niem efektów akustooptycznych zajmuje się optoso- 
nika. 

akustooptyka Oddziaływanie fali świetlnej z falą akustyczną roz- 
i optosonika chodzącą się w ośrodku sprężystym może prowadzić 
do zjawisk, które nie tylko zależą od rodzaju i cech 
użytego światła i fal akustycznych (moncchromatycz- 
ność, zakres częstości, natężenie wiązki, polaryzacja 
itp.), ale także od rodzaju środowiska (ciała izotopo¬ 
we, kryształy) i geometrii eksperymentu, 
dyfrakcja 1 tak n P* akustyczna rozchodząca się w ośrod- 
Ramana- ku powoduje jego sprężyste odkształcenie, a pod 
-Natha wpływem powstałych naprężeń ośrodek ten się zmie¬ 
nia, pojawia się dodatkowa anizotropia (zjawisko 
fotosprężystości lub efekt elastooptyczny). Na przy¬ 


kład w kryształach normalnie nieczynnych optycznie 
pojawia się dwójłomność wymuszona. Światło roz¬ 
chodzące się w płaszczyźnie prostopadłej do wymu¬ 
szonej osi optycznej kryształu ulega podwójnemu za¬ 
łamaniu i zmienia charakter polaryzacji. Fala aku¬ 
styczna. rozchodząc się w ośrodku, powoduje poja¬ 
wienie się okresowego (z okresem tej fali) przestrzen¬ 
nego rozkładu współczynnika załamania światła. Fala 
świetlna, przechodząc przez taki ośrodek prostopadle 
lub pod małym kątem do fali akustycznej (rys. 13a), 
ulega dyfrakcji analogicznie jak na optycznej siatce 
dyfrakcyjnej; powstaje symetryczny obraz dyfrakcyj¬ 
ny składający się z szeregu maksimów interferencyj¬ 
nych. 

Analogia do optycznej płaskiej siatki dyfrakcyjnej 
nie jest jednak pełna, gdyż rozkład natężeń w poszcze¬ 
gólnych prążkach światła ugiętego zależy od natężenia 
fali akustycznej; dodatkowo światło ugięte ma zmie¬ 
nioną częstość w wyniku efektu Dopplera. Zjawisko 
to obserwuje się, gdy długość fal akustycznych jest 
dużo większa niż długość fal świetlnych; nosi ono 
nazwę dyfrakcji Ramana-Natha. 



Rys. 13. Schemat ugięcia światła na fali ultradźwiękowej: a) ugię¬ 
cie typu Ramana-Natha, b) ugięcie typu Bragga 


Przy użyciu silnych monochromatycznych wiązek 
światła (np. promieniowania laserów) na powyższy 
efekt nakładają się nieliniowe efekty optyczne, pro¬ 
wadzące np. do wytwarzania wyższych harmonicz¬ 
nych światła. W rezultacie ulega zmianie uzyskany 
obraz dyfrakcyjny — pojawiają się dodatkowe mak¬ 
sima interferencyjne. Przy przejściu fali świetlnej 
przez pole akustyczne o wysokiej częstości skierowane 
pod pewnym kątem (kąt Bragga) do fali świetlnej 
obserwuje się obraz dyfrakcyjny składający się tylko 
z jednego prążka dyfrakcyjnego. Zjawisko to nosi 
nazwę akustooptycznej dyfrakcji Bragga (rys.l3b). 

Monochromatyczna wiązka światła, przechodząc 
przez ośrodek, może także ulec rozproszeniu na nie¬ 
jednorodnościach wywołanych termicznymi fluktu¬ 
acjami gęstości (cieplne fale akustyczne o częstościach 
hiperdźwiękowych — fonony termiczne). W zjawisku 
tym obserwujemy zmianę kierunku rozchodzenia się 
światła pod kątem Bragga z jednoczesną zmianą 
częstości (składowa stokesowska i antystokesowska). 
Zjawisko rozproszenia na fononach akustycznych- 
jest analogiczne do znanego z optyki rozpraszania 
ramanowskiego na fononach optycznych (-* Wzbu¬ 
dzenia elementarne w ciałach stałych). Natężenie 
światła rozproszonego jest proporcjonalne do natę¬ 
żenia światła padającego. Rozproszenie tego typu 
nosi nazwę rozproszenia Mandelsztama-Brillouina 
(rys. 14). 

Jeśli się stosuje bardzo silne wiązki światła mono¬ 
chromatycznego (np. promieniowania laserów im¬ 
pulsowych), rozproszenie światła na fononach ter¬ 
micznych ma nieco inny charakter. W świetle roz¬ 
proszonym obserwuje się tylko składową stokesow- 
ską, której natężenie nie jest liniową funkcją natężenia 
fali padającej, a jednocześnie obserwuje się powsta¬ 
wanie fali o częstości hiperdźwiękowej. Fala hiper- 
dźwiękowa powstaje kosztem energii fali świetlnej. 
Efekt ten nosi nazwę wymuszonego rozproszenia 
Mandelsztama-Brillouina. 
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Rys. 14. Rozproszenie Mandelsztama-Brillouina: a) typowy zestaw doświadczalny służący do obserwacji, b) fotografia światła rozpro¬ 
szonego otrzymanego przy użyciu interferrometru Fabry’ego-Perota, c) schemat analizy częstościowej; B — składowa Brillouinowska, 
C — składowa centralna 


Optosonika 

Iwona Wojciechowska 

Powstanie tej nowej dziedziny (ok. 1960 r.), wykorzy¬ 
stującej zjawiska akustoopyczne, związane jest z roz¬ 
wojem techniki wytwarzania różnego typu fal aku¬ 
stycznych, rozszerzeniem zakresu częstotliwości w 
kierunku MHz i GHz oraz powstaniem źródeł światła 
spójnego. 

Dzięki efektom akustycznym można uzyskać am¬ 
plitudową, fazową oraz przestrzenną (lub ich kom¬ 
binację) modulację wiązki laserowej. Metody modu¬ 
lacji i odpowiednio zmodulowane światło spójne zna¬ 
lazły już szerokie zastosowanie w badaniach mikro- 
i makrostruktury materii, w nowoczesnej elektronice, 
przy formowaniu impulsów świetlnych, w komuni¬ 
kacji laserowej (-> Lasery — zastosowanie. Opto¬ 
elektronika półprzewodnikowa), w mikroskopach 
ultradźwiękowych, holografii akustycznej, rejestracji 
i odczycie danych pamięci cyfrowych i in. Wyko¬ 
rzystanie zjawisk akustooptycznych do badania ma¬ 
terii umożliwia wyznaczenie: stałych fotosprężystych, 
współczynników sprężystości, lepkości, energetycz¬ 
nych poziomów wzbudzenia termicznego, własności 
elektrycznych i magnetycznych drobin ośrodka i in. 
Omówimy teraz przykładowo niektóre sposoby zasto¬ 
sowania zjawisk akustooptycznych. 

Współczesne zainteresowanie zastosowaniem świa¬ 
tła laserowego skierowało uwagę uczonych na sprawę 
migawka wytwarzania impulsów świetlnych o wielkiej mocy 
ultradźwię- i krótkim czasie trwania (—> Ultrakrótkie impulsy 
kowa świetlne). Jednym z układów stosowanych do wytwa¬ 
rzania impulsów świetlnych jest migawka ultradźwię¬ 
kowa, której działanie przedstawiają rys. 15 i 16. 


Układ ten jest bardziej efektywny i prostszy od roz¬ 
wiązań mechanicznych, a czas trwania i częstość im¬ 
pulsów laserowych można regulować częstotliwością 
ultradźwięków. 
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Rys. 15. Refrakcja wiązki świetlnej na fali ultradźwiękowej o dłu¬ 
gości większej od średnicy wiązki światła d < A. Sinus kąta re¬ 
frakcji wynosi sinfo « (2nnlj A) cos cot, gdzie n jest maksymalną 
zmianą współczynnika załamania ośrodka co — częstość kołowa 
fali ultradźwiękowej 


Metoda oparta na zjawisku rozpraszania światła 
laserowego na akustycznych falach powierzchnio¬ 
wych jest bardzo efektywną metodą pomiaru stałych 
propagacji fal powierzchniowych w różnych warun¬ 
kach (różne parametry ośrodka, inny typ przetworni¬ 
ków elektroakustycznych itp.). Podstawowy schemat 
tej metody przedstawiony jest na rys. 17. Pomiar 
ogranicza się do dokładnego wyznaczenia kątów 6 m 
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Rys. 16. Schemat układu doświadczalnego — laser rubinowy 
z migawką ultradźwiękową 



Rys. 17. Badanie fał powierzchniowych; sin 8 m = sin 0 O + 
+my!As, m « 0 , ±1, ±2, ... rząd dyfrakcji, A długość fali 
świetlnej, As długość fali powierzchniowej. Jeżeli — 0 Ol to 
aresin y{2A s = (Oa kąt Bragga) 
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i rozkładu natężenia rozproszonego światła, z tych 
wielkości wyznacza się np. prędkość propagacji 
i tłumienie. 

Stałe sprężysto-optyczne ośrodków można mierzyć 
wykorzystując dyfrakcję światła na falach objęto¬ 
ściowych. W tym celu stosuje się zarów-no dyfrakcję 
Ramana-Natha, jak i dyfrakcję Bragga. 

Rysunek 18 przedstawia schemat układu służącego 
do pomiaru stałych sprężysto-optycznych ciała sta¬ 
łego. Mierzy się kąt dyfrakcji, na podstawie którego 
można wyliczyć długość fali ultradźwiękowej, z tego 
prędkość propagacji, a następnie odpowiednie wiel¬ 
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Rys. 18. Schemat układu do pomiaru wielkości sprężysto-optycz¬ 
nych ciała stałego 


kości charakteryzujące ośrodek (np. moduły sprę¬ 
żystości, przeniicalność elektryczną itd.). Tłumienie 
fali ultradźwiękowej wyznacza się z rozkładu natęże¬ 
nia światła przed i za komorą ultradźwiękową; 
można w ten sposób otrzymać informacje o wewnętrz¬ 
nej strukturze ośrodka i o procesach zachodzących 
w ośrodku (-> Badania ośrodków za pomocą ultra¬ 
dźwięków). 

Zalety optosonicznych metod badania materii: 
badania te nie niszczą materiału badanego; dają moż¬ 
liwość stosowania niewielkich próbek; śledzenie za¬ 
chowania się wąskiej wiązki światła umożliwia otrzy¬ 
manie rozkładów punktowych i badanie nieliniowych 
własności ośrodków. 

Zastosowanie odwrotne (tzn. do znanych ośrodków) 
w ; yżej opisanych układów daje możliwość dowolnej 
modulacji i odchylania wiązki światła (defiektory 
światła). Modulatory ultradźwiękowe są w nowo¬ 
czesnej elektronice stosowane do formowania sygna¬ 
łów elektrycznych pośrednio, poprzez formowanie 
sygnałów optycznych. Defiektory i modulatory zna¬ 
lazły zastosowanie w optycznych pamięciach maszyn 
cyfrowych. Pojemność pamięci optycznych (hologra¬ 
ficznych) z ultradźwiękowymi deflektorami jest zbli¬ 
żona do pojemności pamięci innych typów, a pręd¬ 
kość rejestracji i odtwarzania danych jest w nich 
większa (odpada bezwładność układów mechanicz¬ 
nych). Na rys. 19 przedstawiony jest układ pamięci 
holograficznej z ultradźwiękowymi modulatorami 
i deflektorami, służącymi do nadania żądanego prze¬ 
biegu czasowo-przestrzennego wiązki laserowej. In¬ 
formacja (obraz przedmiotu) zostaje zarejestrowana 
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Rys. 19. Układ pamięci holograficznej z modulatorami i deflek¬ 
torami akusto-optycznymi 


na materiale światłoczułym lub termoplastycznym, 
powstaje mikrohologram. Zapisem lub odczytem 
żądanej informacji kieruje układ kontrolny za po¬ 
średnictwem odpowiednich deflektorów, odchylają¬ 
cych w żądany sposób wiązkę przedmiotową i (lub) 
odniesienia. 

Bardzo ważna jest możliwość wizualizacji nie¬ 
przezroczystych dla światła przedmiotów za pomocą 
fal akustycznych. Stosuje się do tego metodę dyfrakcji 
Bragga. 

Przedstawiony na rys. 20 układ akustooptyczny 
służy do otrzymywania obrazów przedmiotów nie¬ 
przezroczystych „oświetlanych” ultradźwiękami o wy¬ 
sokiej częstotliwości. Rozkład natężenia światła w 
ugiętej wiązce, po wyjściu z komory ultradźwiękowej 
rejestrowany na monitorze TV, odpowiada rozkłado¬ 
wi pola akustycznego rozproszonego na przedmiocie. 
Na ekranie powstaje optyczny obraz przedmiotu. 
Układ ten, dostosowany do fal ultradźwiękowych. 
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Rys. 20. Układ do wizualizacji nieprzezroczystych przedmiotów 
metodą dyfrakcji Bragga 
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jest jednym z rozwiązań przetwarzania obrazu aku¬ 
stycznego na optyczny w mikroskopach ultradźwię¬ 
kowych. Zdolność rozdzielcza mikroskopu ultra¬ 
dźwiękowego i jakość otrzymywanych z niego obra¬ 
zów jest prawie taka jak obrazów uzyskiwanych za 
pomocą mikroskopów świetlnych (ii. 165, tabl. 43). 
Przytoczone przyldady nie obejmują wszystkich mo¬ 
żliwych rodzajów zastosowania optosoniki. 


Zjawiska akustomagnetyczne 

Czesław Lewa 

zjawiska Do zjawisk akustomagnetycznych zalicza się zjawi- 
magneto- ska fizyczne polegające na zmianie magnetycznych 
strykcji własności substancji pod wpływem zmiennej w czasie 
deformacji mechanicznej, jak również zjawiska od¬ 
wrotne, zwane magnetostrykcją, polegające na zmia¬ 
nie kształtu i wymiarów materiałów magnetycznych 
podczas ich magnesowania. Zjawiska te wykorzystu¬ 
je się np. w przetwornikach magnetostrykcyjnych. 



Rys. 21. Zależność tłumienia ultradźwięków w niklu od indukcji 
magnetycznej 


Z mikroskopowego punktu widzenia deformacja 
mechaniczna może wpływać na zachowanie się mo¬ 
mentów magnetycznych całych domen magnetycz¬ 
nych w ferromagnetykach, ponieważ powoduje ona 
przemieszczanie ścian domenowych, co z kolei zmienia 
podatność magnetyczną materiałów. Ruch ten jest 
przyczyną zwiększonego tłumienia fal akustycznych 
w materiałach ferromagnetycznych oraz zależności 
tłumienia i prędkości rozchodzenia się fal akustycz¬ 
nych w tych materiałach od indukcji magnetycznej 
(rys. 21). Deformacja mechaniczna może również 
wpływać na zachowanie się momentów magnetycz¬ 
nych cząsteczek lub atomów, jak i momentów magne¬ 
tycznych jąder atomowych (-* Teoria magnetyzmu). 

Zmiany własności magnetycznych wywołane defor¬ 
macją mechaniczną w materiałach magnetycznych 
powodują — na skutek zjawiska magnetostrykcji — 
dodatkową deformację sprężystą tych materiałów. 
Zjawisko to nosi nazwę mechanostrykcji. Fale aku¬ 
styczne wywołują więc w środowisku magnetycznym, 
nawet w nieobecności zewnętrznego pola magnetycz¬ 
nego, zmianę kierunków i wartości spontanicznego 
namagnesowania domen. Towarzyszą temu zmiany 
wymiarów materiału. W materiałach magnetycznych 
mechanostrykcja może powodować odchylenia od 
prawa Hooke*a. Ze zjawiskiem mechanostrykcji wiąże 
się również wiele innych zjawisk fizycznych zachodzą¬ 
cych w magnetykach, np. zmiana modułu sprężystości 
pod wpływem pola magnetycznego, wpływ naprężeń 
na magnetostrykcję. 

Do zjawisk akustomagnetycznych należy również 
grupa zjawisk giromagnetycznych, w których się 
obserwuje zależność między momentem pędu i mo¬ 
mentem magnetycznym atomów, np. zjawisko Bar- 
netta — polegające na magnesowaniu się ferroma- 
gnetyków poddanych ruchowi obrotowemu, zjawisko 
Einsteina-de Hassa-Richarda, w. którym się obser¬ 
wuje obrót namagnesowanego ciała wokół osi po¬ 
krywającej się z kierunkiem pola magnetycznego. 
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Akustyczny rezonans 
magnetyczny 

Czesław Lewa 

Niektóre substancje umieszczone w stałym polu ma¬ 
gnetycznym pochłaniają selektywnie (rezonansowo) 
energię pola akustycznego. 
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własności Wiele mikroelementów materii ma własności pa- 
paramagne- ramagnetyczne (para- i diamagnetyki). Takimi ele- 
tycznemikro- mentami są: 

obiektów — atomy lub molekuły posiadające pewną liczbę 
nie sparowanych elektronów, np. molekuły Ó 2 , NO, 

no 2 , 

— defekty sieci w kryształach, 

— swobodne rodniki chemiczne, 

— atomy i jony o nie sparowanych wewnętrznych 
powłokach elektronowych, np. Fe, Ni, Co, Cr, Mn, 
Cu, Ti, V, pierwiastki ziem rzadkich, 

a więc elementy, których własności paramagnetyczne 
wynikają z odpowiedniego stanu powłok elektrono¬ 
wych, oraz 

— jądra atomowe o nieparzystej liczbie protonów 
i neutronów (kwantowa liczba spinowa / przybiera 
wówczas wartości całkowite od 1 do 6) lub nieparzy¬ 
stej liczbie nukleonów (/ przybiera wartości połówko¬ 
we od V* do 9 / 2 ), 

a więc elementy, których własności paramagnetyczne 
wynikają z odpowiedniej struktury i stanu jąder ato¬ 
mowych. 

Umieszczenie takich elementów w polu magnetycz¬ 
nym (np. w polu ziemskim albo w polu wytworzonym 
przez nabiegunniki magnesu lub przez sąsiadujące 
elementy materii o własnościach paramagnetycznych) 
wymusza na nich przyjęcie określonych orientacji 
względem tego pola. Należy uwzględnić również mo¬ 
ment pędu, którym są obdarzone paramagnetyczne 
mikroelementy, w wyniku czego ich zachowanie w 
polu magnetycznym podobne jest do zachowania bąka 
w polu grawitacyjnym (rys. 22). Moment pary sił, od¬ 



działywania momentu magnetycznego rozważanych 
elementów z polem magnetycznym, wprawia je w 
precesja ruch precesyjny (zwany precesją Larmora) o prędkości 
Larmora kątowej proporcjonalnej do natężenia pola magne¬ 
tycznego H (rys. 23): 

col = yH t 

gdzie y jest współczynnikiem geomagnetycznym cha¬ 
rakteryzującym rozważany rodzaj elementów. 

Z praw mechaniki kwantowej wynika, że elementy 
paramagnetyczne mogą przyjmować tylko takie orien¬ 
tacje względem kierunku pola magnetycznego, przy 
jakich energia ich oddziaływania z tym polem jest 
całkowitą wielokrotnością ftcoL, tzn. 

E = —mcDi/iy 

gdzie m to magnetyczna liczba kwantowa, ft — stała 


Plancka dzielona przez 2k. Liczba m może przybie¬ 
rać wartości od —/do -f-/. Oznacza to, że każdy 
element paramagnetyczny może przyjąć jedną z 
(2/4-1) orientacji, tzn. może się znaleźć w jednym z 
(2/4-1) stanów energetycznych (zwanych poziomami 
zeemanowskimi). 

W próbce zawierającej wiele elementów paramag¬ 
netycznych umieszczonej w polu magnetycznym wy¬ 
stępują wszystkie możliwe orientacje, tzn. zajęte są 
wszystkie poziomy zeemanowskie. W stanie równo¬ 
wagi termicznej najwięcej momentów magnetycznych 
przyjmuje orientację o najniższej energii £min, tzn. 
równoległą do kierunku pola magnetycznego, naj¬ 
mniej zaś — o najwyższej energii tzn. anty- 

równoległą do pola magnetycznego (rys. 24). 

^2 —T- - £max 
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Rys. 24. Zeemanowskie 
poziomy energetyczne 
elementów paramagne¬ 
tycznych (/ = */a) prób¬ 
ki w zewnętrznym polu 
magnetycznym n i 


^min 


Zmiana orientacji może zachodzić tylko skokowa, 
z zachowaniem reguł zwanych w mechanice kwanto¬ 
wej regułami wyboru. Według nich możliwe są tylko 
takie zmiany orientacji, podczas których m zmienia 
się o Am = ±1, tzn. zmiany prowadzące do przy¬ 
jęcia orientacji bezpośrednio sąsiadującej z poprzed¬ 
nią. Inaczej mówiąc — energia danego elementu mo¬ 
że ulec zmianie tylko o 

AE = E(m)-E{m±\) = ±ftco L = ftyH . 

Przejście elementu paramagnetycznego z jednego sta¬ 
nu energetycznego do sąsiedniego może nastąpić w wy¬ 
niku absorpcji lub emisji kwantu energii colIi- 

Absorpcja energii przy przejściach między zee¬ 
manowskimi poziomami mikroelementów paramag¬ 
netycznych stanowi istotę rezonansu paramagnetycz¬ 
nego. Prawdopodobieństwo emisji energii zależy głów¬ 
nie od oddziaływań między rozważanym elementem 
paramagnetycznym i pozostałymi elementami ma¬ 
terii w próbce. 

Zależnie od tego, czy własności paramagnetyczne 
rozważanych elementów są pochodzenia elektrono¬ 
wego czy jądrowego, wprowadza się podział na dwie 
metody: elektronowego rezonansu paramagnetycz¬ 
nego ERP (skrót ang. EPR — electronic paramagne - 
tic rezonance) i jądrowego rezonansu magnetycznego 
JRM (skrót ang. NMR — nuclear magnetic rezo¬ 
nance). Podział ten, choć z punktu widzenia przebiegu 
zjawiska jest czysto formalny, znajduje uzasadnienie 
techniczne (różne są zakresy częstości vl = colI2k 
precesji Larmora mimo zastosowania takich samych 
natężeń pól magnetycznych) i naukowo-poznawcze 
(obie metody mają różne zastosowania i dostarczają 
różnych, często uzupełniających się tylko informacji 
naukowych). 

Porcje energii odpowiadające rezonansowym przej¬ 
ściom między zeemanowskimi poziomami energe¬ 
tycznymi dostarczać można do próbki zawierającej 
omawiane elementy paramagnetyczne w postaci 
kwantów ftco promieniowania elektromagnetycznego 
lub fononów ftco promieniowania mechanicznego 
(ultradźwiękowego). Metody, w których się wykorzy¬ 
stuje rezonansową absorpcję fononów, noszą odpo- 
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wiednio nazwy: akustycznego elektronowego rezonan¬ 
su paramagnetycznego (AERP) i akustycznego jądro¬ 
wego rezonansu magnetycznego (AJRM). 

Przekazanie energii fal ultradźwiękowych układowi 
elementów paramagnetycznych zachodzi wówczas, 
gdy w substancji występuje wewnętrzne oddziaływa¬ 
nie między tymi elementami a elementami materii 
wprawionymi w ruch drgający przez falę ultradźwię¬ 
kową, tzn. gdy występuje sprzężenie spin-sieć. Uwa¬ 
żając energię drgań sieci za zbiór fononów, możemy 
proces przekazywania energii traktować jako zbiór 
elementarnych oddziaływań fonon-spin. Akustyczne 
drgania wprawiają w ruch ładunki elektryczne oraz 
dipole magnetyczne zawarte w substancji, w wyniku 
czego zostaje w niej wytworzone zmienne pole elek¬ 
tromagnetyczne o częstości równej częstości drgań 
akustycznych. Gdy częstość drgań v równa się czę¬ 
stości precesji Larmora vl, wytworzone pole elektro¬ 
magnetyczne wywołuje przejścia pomiędzy pozio¬ 
mami zeemanowskimi elementów paramagnetycz¬ 
nych. Prawdopodobieństwa absorpcji i emisji energii 
w przeliczeniu na jeden element paramagnetyczny są 
jednakowe. W równowadze termicznej zbioru ele¬ 
mentów paramagnetycznych zawartych w próbce 
liczba obsadzeń niższych poziomów zeemanowskich 
jest wyższa. Wystąpi więc rezonansowe pochłanianie 
fali akustycznej o częstości v = vl, prowadzące do 
wzrostu liczby obsadzeń wyższych poziomów zce- 
manowskich, a tym samym do obniżenia absorpcji 
fali akustycznej. 

Oddziaływanie fonon-spin jest również odpowie¬ 
dzialne za proces odwrotny — przekazywanie energii 
od zbioru elementów paramagnetycznych do sieci, 
tzn. za proces relaksacji spin-sieć charakteryzowany 
czasem relaksacji spin-sieć 7\. Szybkość tego pro¬ 
cesu zależy od struktury i dynamiki molekularnej 
w materii. Pomiary czasów relaksacji dostarczają więc 
cennych informacji o strukturze i mikroskopowych 
procesach molekularnych zachodzących w badanej 
substancji w różnych stanach skupienia. 

Możliwość wzbudzenia układu spinów przez fo¬ 
nony o częstości rezonansowej przewidzieli niezależnie 
od siebie A. J. Kastler (w 1952 r.) i S. A. Altshuler 
(w 1955 r.). 

W pierwszych doświadczeniach, wykonanych przez 
W. G. Proctora i jego współpracowników w 1956 r., 
obserwowano absorpcję fononów przez zmianę róż¬ 
nicy obsadzeń poziomów zeemanowskich w próbce 
nadźwiękawianej rezonansową falą ultradźwiękową, 
tzn. metodą akustycznego nasycenia. Absorpcję fo¬ 
nonów określano ze zmian absorpcji sygnału elek¬ 
tromagnetycznego w obecności pola ultradźwięko¬ 
wego i bez niego. Fonony rezonansowe fali ultra¬ 
dźwiękowej, wzbudzając elementy paramagnetyczne 
do wyższych poziomów energetycznych, powodują 
częściowe nasycenie układu i obniżenie absorpcji 
sygnału elektromagnetycznego. Tak w opisywanym 
eksperymencie, jak i w późniejszych badaniach, naj- 



Rys. 25. Schemat układu impulsowego do obserwacji AJRM 
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częściej do tego celu stosowano tradycyjne urządze¬ 
nia do JRM i ERP z wbudowanym nadajnikiem ultra¬ 
dźwiękowym. 

Pierwsze obserwacje absorpcji fali akustycznej 
przez jony paramagnetyczne wykonywane były w 
1959 r. przez E. H. Jacobsena i współpracowników. 

Na rys. 25 przedstawiono schemat układu impul¬ 
sowego do obserwacji AJRM. Silne pole magnetyczne 
H ma kierunek prostopadły do płaszczyzny rysunku. 
Impuls elektromagnetyczny o częstości vl jest po¬ 
dawany przez cewki nadajnika. Nadźwiękowienie 
próbki uzyskuje się z przetwornika ultradźwiękowego. 
Za pomocą cewki odbiorczej, nawiniętej na próbce, 
rejestruje się wymuszony w próbce impuls i jego zani¬ 
kający transjent. Amplituda tego impulsu (zwanego 
sygnałem precesji swobodnej) jest proporcjonalna do 
różnicy obsadzeń poziomów zeemanowskich. Ma¬ 
leje ona po nadźwiękowieniu próbki falą o częstości 
rezonansowej. Na rys. 26 pokazano sekwencję im¬ 
pulsów' stosowaną w doświadczeniu Proctora. Po 
przyłożeniu impulsu elektromagnetycznego a i zare¬ 
jestrowaniu sygnału precesji swobodnej o amplitudzie 


a _ a 



1 

włączony 




_L 

sygnał 


J 


\ ^0 

ultradźwiękowy 


N 4 


1 ' czas 

Rys. 26. Impulsy elektromagnetyczne a i sygnały precesji swobod¬ 
nej dla próbki nie nadźwiękowioncj A 0 i nadźwiękowionej A 


A 0 przykładano impuls ultradźw'iękow'y. Absorpcja 
energii akustycznej przez elementy paramagnetyczne 
przeszkadza ich powrotowi do stanu równow-agi. Po 
wyłączeniu sygnału ultradźwiękowego mierzy się 
amplitudę sygnału precesji swobodnej A , uzyskanego 
przez wprowadzenie kolejnego impulsu elektro¬ 
magnetycznego. Stosunek amplitud sygnału precesji 
swobodnej następującego po sygnale ultradźwięko¬ 
wym A do amplitudy sygnału, gdy nie ma ultradźwię¬ 
ków A 0 , jest miarą stosunku obsadzeń poziomów 
zeemanowskich w tych dwu wypadkach. 

Metody AJRM i AERP są szeroko stosowane w ba¬ 
daniach materiałów krystalicznych, natomiast nie 
udało się dotychczas osiągnąć powodzenia w zasto¬ 
sowaniu ich do cieczy i ciał amorficznch. 

Metoda AERP została również zastosowana w- fa- 
serach kwantowych. 

Fasery 

IVIje czysta w Szu sta ko wski 

Faserami nazywa się układy generujące dźwięki wy¬ 
sokich częstości — hiperdźwięki. Nazw-a faser została 
wprowadzona przez polskiego uczonego S. Kaliskie¬ 
go w 1969 r. i utworzona z pierwszych liter wyrazów’ 
angielskich określających zasadę działania kwanto¬ 
wych generatorów hiperdźwięków — Fonon Ampcali- 
fitionby Stimufated Emission of Radiation. 

Rozróżnia się dwa rodzaje faserów: fasery aku- 
stoelektryczne, w których wykorzystuje się oddziały¬ 
wanie fonon-elektron, i fasery kwantowe, często zwa¬ 
ne maserami fononowymi albo akustycznymi, w któ¬ 
rych wykorzystuje się oddziaływanie fonon-spin. 


Fasery akustoelektryczne 

W faserach akustoelektrycznych generacja drgań na¬ 
stępuje w wyniku wzmocnienia spontanicznych drgań 
sieci (fononów termicznych) przez dryfujący strumień 
elektronów w kryształach piezopółprzewodnikowych. 

Podstawowym elementem fasera akustoelektrycz- 
nego jest płytka piezopółprzew'odnikowego kryształu 
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budowa ( n P- CdS, CdSe, ZnO) o powierzchni kilku mm 2 i gru- 
fasera bości ułamka mm. Oś c (oś heksagonalna) kryształu 
akusto- skierowana jest prostopadle do powierzchni płytki, 
clektrycz- Dokładnie wypolerowane równoległe boki płytki po- 
nego kr yte s 3 c * enk 3: warstwą metalu (rys. 27a). Warstwy 
metaliczne tworzą kontakty omowe z kryształem 
i umożliwiają doprowadzanie stałego pola elektrycz¬ 
nego E zwanego napięciem dryfu. Napięcie to powo¬ 
duje ruch elektronów, a efekt piezoelektryczny sprzę¬ 
ga dryfujący strumień elektronów ze spontanicznie 
drgającą siecią kryształu. Gdy napięcie dryfu prze¬ 
kroczy wartość progową E>E Py przy której prędkość 
elektronów osiąga prędkość równą prędkości fal aku¬ 
stycznych w krysztale, amplituda drgań atomów sieci, 
których kierunek ruchu jest zgodny z kierunkiem dry¬ 
fu elektronów, będzie narastać (przebieg tego procesu 



piczopółprzcwodnikowy, 2 warstwa metalu, 3 kontakty omowe, 
b) narastanie amplitudy fali akustycznej w zależności od kierunku 
ruchu fali względem kierunku dryfu elektronów 

został już dokładnie omówiony w rozdziale pt. Od¬ 
działywania fonon-elektron). W ten sposób z nieupo¬ 
rządkowanych, termicznych drgań sieci ^staje wy¬ 
generowana podłużna fala akustyczna (a w wypadku 
impulsowego napięcia dryfu — paczka falowa), która 
po dojściu do ścianki kryształu z dodatnią elektrodą 
odbija się i biegnie w kierunku przeciwnym do dryfu 
elektronów, jak na rys. 27b. Amplituda fali akustycz¬ 
nej biegnącej w kierunku przeciwnym do strumienia 
elektronów jest tłumiona, ale znacznie słabiej niż jest 
wzmacniana, gdy biegnie w kierunku elektrody do¬ 
datniej, czyli oddziaływanie fonon-elektron nie jest 
symetryczne względem kierunku ich wzajemnego ru¬ 
chu. Nicsymetryczność oddziaływania powoduje, że 
amplituda wielokrotnie odbitej fali akustycznej rośnie 
i dopiero, gdy zaczynają występować efekty nieliniowe 
uruchamiające dodatkowe mechanizmy tłumienia, 
osiąga poziom nasycenia, tzn. ustala się stan równo¬ 
wagi między wzmocnieniem i tłumieniem fali aku¬ 
stycznej. Narastanie amplitudy (wzmocnienie dry- 
fowe) obejmuje tylko te drgania, których częstość ko¬ 
łowa co spełnia warunek rezonansu określony przez od¬ 
ległość L między ściankami płytki: 

warunek -+ = 2rc//, 

rezonansu ' Vp v ° > 

gdzie: /: = 1, 2, 3..., v p , v 0 oznacza prędkości fali aku¬ 
stycznej zgodnej i przeciwnej do kierunku dryfu, ę — 
różnicę faz powstałą przy odbiciu, 
mody Faser generuje ciąg drgań akustycznych zwanych 
draań ° częstości równej wielokrotności częstości 

podstawowej (częstość podstawowa przy n = 1). 
Wzbudzonym drganiom akustycznym w piezopół- 
przewodzącym ośrodku towarzyszy pole elektryczne 
o tej samej częstości wywołane efektem piezoelek¬ 
trycznym. Dlatego ze ścianki kryształu prostopadłej 
do kierunku drgań akustycznych możemy wyprowa¬ 
dzić drgania w postaci fal akustycznych przy obcią¬ 
żeniu fasera falowodem akustycznym lub w postaci 
drgań elektrycznych przy obciążeniu obwodem elek¬ 
trycznym. 



Rys. 28. Oscylogram widma drgań fasera akustoelcktrycznego: 
a) drgania jednomodow-e, b) drgania wielomodowc 


Rysunek 28 przedstawia zdjęcie z oscyloskopu ana- przykład 
lizatora widma drgań fasera skonstruowanego na faser 
bazie kryształu CdS. Dobierając odpowiednie na- na CdS 
pięcie pola dryfu i rozmiary próbki można uzyskać 
jednomodową pracę na częstości podstawowej (rys. 

28a) lub pracę wielomodową (rys. 28b). Piki napięcia 
na rys. 29b odpowiadają różnym częstościom drgań — 
modom. 

Kryształy CdS, CdSe są fotoczułe, tzn. że gęstość 
dryfującego w nich strumienia elektronów (przewod¬ 
ność) można regulować za pomocą oświetlenia. Przy 
oświetleniu światłem o długości fali bliskiej krawędzi 
absorpcji (np. dla CdS X = 520-530 nm) światło wni¬ 
ka tylko na głębokość kilkudziesięciu mikrometrów, 
i wytwarza przypowierzchniową warstwę przewo- 
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dzącą. Przyłożenie do tak oświetlonej płytki napięcia 
dryfu powoduje powstanie fal powierzchniowych. Są 
to poprzeczne fale akustyczne o amplitudzie zanika¬ 
jącej z głębokością od powierzchni oświetlonej, których 
wychylenia cząstek (polaryzacja drgań) są równoległe 
do tej powierzchni (-► Akustyczne fale powierzchnio¬ 
we i ich zastosowanie). 

pierwsze Pierwsze modele faserów zostały opracowane w la- 
modele tach 1969-72. Schemat modelu fasera opracowanego 
faserów w Polsce w 1970 r. przedstawia rys. 29. Podstawowe 
parametry tego fasera akustoelektrycznego są nastę¬ 
pujące: kryształ CdS o wymiarach 0,66 x 1,67 x 
X 1,70 mm, częstość pracy 21703048 Hz, napięcie 
wyjściowe 0,2 mV, napięcie dryfu 80 V, prąd dryfu 



barwny, 7 oświetlacz z żarówką, 8 okno do oświetlenia kryształu 

0,3 mA, stałość częstości Afjf— 4-lO -6 na godzinę, 
czas ustalania się częstości przy oświetlonym krysztale 
ok. 1 h. Fasery akustoelektryczne nie znalazły jednak 
szerszego zastosowania w technice z powodu małej 
stabilności termicznej częstości drgań oraz koniecz¬ 
ności chłodzenia ich i oświetlenia. 


Fasery kwantowe 

generacja W faserach kwantowych generacja hiperdźwięków 
hi per- następuje w wyniku emisji fononów przy przejściach 
dźwięków na niższe poziomy energetyczne mikroelementów pa¬ 
ramagnetycznych. Faser kwantowy działa na zasa¬ 
dzie podobnej jak maser (-► Spektroskopia mikrofa¬ 
lowego rezonansu rotacyjnego) z tą tylko różnicą, że 
funkcję fotonów w maserze spełniają w faserze fono¬ 
ny, dzięki czemu zostaje wygenerowaną fala akusty¬ 
czna zamiast fali elektromagnetycznej, która powsta¬ 
je w maserze. 

budowa Podstawowym elementem fasera kwantowego jest 
fasera paramagnetyczny kryształ, w którego dielektrycznej 
kwantowego osnowie umieszczone są jony pierwiastków przejścio¬ 
wych (około 0,05%) z niesparowanym spinem elektro¬ 
nowym np. Al 2 0 3 Cr +3 . W zewnętrznym polu magne¬ 
tycznym momenty magnetyczne jonów przyjmują 
tylko określone kierunki orientacji względem pola 
magnetycznego, co odpowiada różnym dyskretnym 
poziomom energii. Zmiana kierunku orientacji spinu 
odpowiadająca przejściu z niższego poziomu na wyż¬ 
szy wymaga dostarczenia energii równej różnicy 
poziomów, (Ea—Eb), natomiast w sytuacji odwrotnej 
uzyskuje się kwant energii o częstości kołowej co — 
= (E a —Eb)h. Uzyskane w ten sposób kwanty energii 
mogą być wyemitowane w postaci fotonów — wów¬ 
czas mówimy o efekcie maserowym, lub fononów — 
efekt faserowy (oddziaływanie akustomagnetyczne). 

Faser kwantowy został opracowany przez uczonych 
amerykańskich na początku lat 60. Możliwość gene¬ 
racji fononów za pomocą oddziaływania spin-fonon 


w paramagnetycznych kryształach przewidział w 
swych pracach w 1961 r. C. Kittel, później w 1963 r. 

E. B. Tucker uzyskał eksperymentalne potwierdzenie 
tego efektu. Do budowy fasera kwantowego Tucker faser 
użył monokryształu Al 2 Ó 3 Cr 3+ . Dolne poziomy ener- Tuckera 
getyczne jonów Cr 3+ w rubinie są dubletami Cramersa 
rozdzielonymi w zerowym polu magnetycznym przer¬ 
wą energetyczną ok. 38,6 m -1 . W polu magnetycznym 
H dublety rozszczepiają się tworząc cztery poziomy 
energetyczne. Przy orientacji pola pod kątem 54°44' 
do osi c rubinu (trygonalna oś) rozszczepienia pozio¬ 
mów przyjmują postać jak na rys. 30. Różnice energii 



między poziomami 1-2 i 3-4 są jednakowe. W stanie 
równowagi termodynamicznej największa liczba jo¬ 
nów zajmuje najniższe poziomy energetyczne. Zmianę 
gęstości obsadzeń poziomów, czyli tzw. inwersję ob¬ 
sadzeń niezbędną dla uzyskania akcji faserowej, 
otrzymał Tucker za pomocą pola elektromagnetycz¬ 
nego (pola pompującego) o częstości 24 GHz od¬ 
powiadającej różnicy poziomów energetycznych 1-2 
i 3-4. Schemat ideowy fasera kwantowego konstrukcji 
Tuckera przedstawia rys. 31. Do czoła rubinowego 
walca pi^klejony był przetwornik piezoelektryczny 
mający formę płytki kwarcowej milimetrowej gru¬ 
bości. Przetwornik służył do detekcji pola akustycz¬ 
nego i był umieszczony w rezonatorze mikrofalowym. 


pompa 



Rys. 31. Schemat głowicy fasera kwantowego Tuckera 


Cały układ badawczy został zanurzony w ciekłym 
helu o temperaturze 4,2 K. Najpierw badano oddzia¬ 
ływanie pola akustycznego z układem spinów, na- 
dźwiękawiając kryształ paramagnetyczny podłużną falą 
akustyczną. Zaobserwowano wzmocnienie fali aku¬ 
stycznej rzędu 10% na częstości 9,3 GHz. Na tejże 
częstości otrzymano generację podłużnych fal aku¬ 
stycznych o odebranej mocy elektromagnetycznej 
10“ 11 W, co odpowiada mocy akustycznej rzędu 
10“ 7 W lub amplitudzie deformacji rzędu 10“ 8 . Wzbu- 
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dzające pole elektromagnetyczne (pole pompujące) 
miało moc 40 mW, a temperatura kryształu była po¬ 
niżej 4,2 K. 

Na podstawie częstości otrzymanych drgań stwierdzo¬ 
no, że efekt generacji fononów otrzymuje się w wy¬ 
niku przejść między poziomami 3-2. Przejścia te są 
indukowane przez termiczne drgania sieci o częstości 
odpowiadającej różnicy energii między poziomami 
3-2 , co interpretuje się jako wzmocnienie drgań sieci 
o tej częstości. Podobnie jak w faserze akustoelek- 
trycznym wzmocnieniu ulegają te rodzaje fal aku¬ 
stycznych, dla których długość pręta paramagnetycz¬ 
nego jest całkowitą wielokrotnością połowy długości 
fali akustycznej. Generator kwantowy generuje wiele 



Rys. 32. Oscylogram pokazujący drgania na wyjściu fasera kwan¬ 
towego: a) drgania w stanie przejściowym po włączeniu pola 
pompy, b) zdudnienia dwóch sąsiednich rodzajów (modów) 
drgań, częstość dudnień 240 kHz 

mody rodzajów (modów) drgań, a różnica częstości między 
fasera sąsiednimi modami wynosi Af = v/2L. Przy prędkości 
kwantowego v — 1,2 10 6 m/sek i długości L = 0,0254 m różnica 
częstości w faserze Tuckera wynosiła 236 kHz. Na 
oscylogramie rys. 33b zarejestrowano częstość zdud- 
nień dwóch sąsiednich modów, która wynosiła 
240 kHz. Za pomocą odbiornika heterodynowego 


stwierdzono, że pasmo generacji fasera kwantowego 
wynosiło 11,4 MHz. Na oscylogramie rys. 32 poka¬ 
zano typową dla fasera fluktuację wyjściowego sygna¬ 
łu związaną z początkiem generacji. Fluktuacja sygna¬ 
łu poprzedza ustalenie się stanu stacjonarnej generacji 
pokazanego na rys. 32b. Nowsze opracowanie modelu faser Gana- 
fasera przedstawił w 1974 r. E. M. Ganapolski. Faser polskiego 
Ganapolskiego zbudowany jest również na rubinie 
(Al £ 0 3 Cr 3+ ) o podobnych parametrach i orientacji 
co faser Tuckera. Innowacją jest rozwiązanie technicz¬ 
ne układu wzbudzania ośrodka paramagnetycznego 
(rezonatora pola pompującego) i detekcji (lub genera¬ 
cji) drgań akustycznych. Jako detektora drgań użyto 
cienkowarstwowego przetwornika piezoelektrycznego 
z ZnO napylonego bezpośrednio na kryształ rubinu. 

Ganapolski wykorzystywał faser do badania wzmoc¬ 
nienia podłużnych fa! akustycznych pobudzanych 
przetwornikiem ZnO na częstości 9,3 GHz. Częstość 
pola pompy wynosiła 23,4 GHz. Otrzymane wzmoc¬ 
nienie fal akustycznych wynosiło 0,9 dB/cm przy tem¬ 
peraturze 1,7 Ki koncentracji chromu Cr 34 * 0,028%. 

Natomiast przy koncentracji chromu 0,05% wzmoc¬ 
nienie wynosiło tylko 0,4 dB/cm. W swych badaniach 
Ganapolski stwierdził zależność oddziaływania fo- 
non-spin od koncentracji jonów parametrycznych, 
kąta orientacji kryształu względem pola magnetycz¬ 
nego, mocy pompy i temperatury. 

Prace badawcze nad faserami kwantowymi trwają 
nadal. Obecnie dąży się do uzyskania akcji faserowej 
w kryształach piezoelektrycznych, np. w LiNbO a : 

C f 3+(Fe 3+ ). W tym wypadku drgania akustyczne moż¬ 
na będzie odbierać bezpośrednio z kryształu para¬ 
magnetycznego pomijając stosowanie dodatkowych 
przetworników, które na częstościach gigahercowych 
powodują duże straty akustycznej energii fasera. 

Fasery kwantowe a szczególnie zjawisko oddziały¬ 
wania fonon-spin są wykorzystywane w badaniach 
akustoelektronowego rezonansu paramagnetycznego AERP 
(AERP). 

Acouslic Surface Wave and Acousto-optic Devices T.Kallard 
(ed.), New York 1971; R. T. Beyer, S. V. Letcher Physical 
Ultrasonics, New York 1969; I. Małecki Podstawy teoretyczne 
akustyki kwantowe] , Warszawa 1972; W. P. Mason Physical 
Acoustics, vol. 1-12, New York 1964-76; A. Śliwiński, E. Ozi¬ 
mek Akustyka laboratoryjna , cz. 3, Warszawa 1974; R. Truell 
i in. Ultrasonics Methods in Solid State Physics, New York 1969; 

J. W. Tucker, V. W. Rampton Microwave Ultrasonics in Solid 
State Physics , Amsterdam 1972 (tłum. ros. Moskwa 1975). 


Modelowanie obiektów 
akustycznych 

Stefan Czarnecki 


W badaniach akustycznych szeroko stosuje się me¬ 
todę doświadczalna zwaną modelowaniem obiektów 
akustycznych. Polega ona na zastąpieniu badanych 
obiektów przez inne, których parametry można łatwo 
zmieniać w celu poszukiwania rozwiązań optymal¬ 
nych. Metoda ta rozpowszechniona jest w pracach 
badawczych, jak również w pracach projektowych. 

Badany obiekt można odwzorowywać za pomocą 
modeli cyfrowych lub analogowych, 
modele Modele cyfrowe wymagają pełnego opisu matema- 
cyfrowe tycznego badanego obiektu, w celu odpowiedniego 
zaprogramowania komputera. Szeroko stosowana 
technika komputerowa zapewnia uniwersalność mo¬ 
delowania oraz możliwość automatycznego poszuki¬ 
wania rozwiązań optymalnych przez zastosowanie 
odpowiednich kryteriów optymalizacji. Wadą mode¬ 
lowania cyfrowegojest mały kontakt człowieka z kom¬ 
puterem, co utrudnia proces śledzenia toku procesu 
modelowania. 

modele Kontakt człowieka z komputerem jest znacznie 
analogowe większy w wypadku modelowania analogowego, któ¬ 


rego dodatkową zaletą jest możliwość analizy badane¬ 
go obiektu bez znajomości jego pełnego opisu mate¬ 
matycznego. 

Modelowanie obiektów akustycznych metodami 
analogowymi realizowane jest najczęściej za pomocą 
maszyn analogowych lub hybrydowych, względnie 
za pomocą modeli geometrycznych. 

Model analogowy jest odwzorowaniem badanego 
obiektu w postaci układu zastępczego, opisywanego 
takimi samymi zależnościami matematycznymi co 
rzeczywiste układy modelowe i o parametrach wza¬ 
jemnie proporcjonalnych. Modele te mają duże zna¬ 
czenie dydaktyczne, gdyż dają proste, syntetyczne 
spojrzenie na rozpatrywany obiekt, a dzięki odpo¬ 
wiedniemu doborowi układu zastępczego lub jego 
modyfikacji umożliwiają polepszenie cech obiektu 
badanego. 

Często stosowanym modelem analogowym jest mo- model goo- 
del geometryczny. Model geometryczny przedstawia metryczny 
badany obiekt w zmienionej skali (najczęściej zmniej¬ 
szonej), przy czym, żeby był spełniony warunek wza- 
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jemnej proporcjonalności parametrów, musi być 
spełniona zależność: 

ft = IJIm — Vmfv 0 , 

gdzie n jest współczynnikiem skali, l 0 i l m — odpo¬ 
wiednio liniowym wymiarem obiektu i modelu, v m 
i v 0 — częstością pomiarową obiektu i modelu. Ba¬ 
danie modelowe obiektu w funkcji częstości pociąga 
za sobą konieczność odwzorowania charakterystyk 
częstościowych właściwości akustycznych materiałów 
(np. -współczynnika pochłaniania) lub właściwości 
ośrodka (współczynnika tłumienia fali akustycznej 
przez powietrze), co jest dosyć trudne zwłaszcza przy 
dużych współczynnikach skali. Warunkiem efektyw¬ 
nego korzystania z modeli geometrycznych, jest ich 
bardzo precyzyjne wykonanie, co pociąga za sobą 
dość duże koszty. 

Wymienione powyżej wady i zalety poszczególnych 
modeli sprawiają, że każdy z nich może być stosowany 
do odmiennych celów. 

zastosowanie Modelowanie cyfrowe stosowane jest np. do obli- 
modeli czeń tłumików hałasu metodą elementu skończonego. 

Badany tłumik dzielony jest na obszary o znanych 
lub nie znanych warunkach brzegowych, w wyniku 
czego otrzymujemy rozwiązanie układu kilkudzie¬ 
sięciu równań algebraicznych. Modelowanie analo¬ 
gowa przydatne bywa przy modelowaniu przetworni¬ 
ków elektroakustycznych (głośników, mikrofonów, 
czujników) lub filtrów akustycznych używanych w 
tłumikach hałasu. Do analizy tych urządzeń wyko¬ 
rzystywane są również elektryczne modele analogowe. 

Modelowanie geometryczne stosowane jest przede 
wszystkim do badania sal, badania wnętrz urbani¬ 
stycznych oraz badania przegród izolacyjnych (-* 
Hałas). 

Do badania sal wykonuje się model w zmniejszonej 
skali i stosuje się sygnał o odpowiednio wyższej czę¬ 
stości; bada się w ten sposób rozkład fal odbitych 
w zależności od kształtu sali jak i rozłożenia materia¬ 
łów dźwiękochłonnych. 

Szeroko rozpowszechnione są badania techniką 
impulsową, która umożliwia określenie nie tylko roz¬ 
kładu fal odbitych, lecz również odstępów czasu do¬ 
chodzenia kolejnych fal odbitych, co ma bardzo duże 
znaczenie dla akustyki wnętrz. 

modele Wygodną metodą jakościową badania sal (ilościową 
optyczne n ie, g( jyż n ie ma proporcjonalności parametrów) 
mogą być realizowane za pomocą modelu optycznego, 
którego kształt odpowiada kształtowi sali. Własności 
odbijające ścian odwzorowane są za pomocą po¬ 
wierzchni lustrzanych, natomiast własności pochła¬ 
niające — za pomocą powierzchni matowych. Wiązki 
fal akustycznych zastąpione są wiązkami świetlnymi 
wychodzącymi z punktowego źródła światła. Foto¬ 
grafia uzyskanego rozkładu fal odbitych (zob. obok) 



Fotografia rozkładu fai odbitych uzyskanego w modelu optycz¬ 
nym 


umożliwia znalezienie obszarów zagęszczenia i roz¬ 
rzedzenia energii fal odbitych, co można korygować 
poprzez zmianę kształtu modelu lub zmianę roz¬ 
mieszczenia powierzchni matowych. 

Modele urbanistyczne przedstawiają w zmniejszo¬ 
nej skali wycinek wnętrza urbanistycznego złożonego 
z arterii komunikacyjnych i zabudowy oraz odpo¬ 
wiednio odwzorowują źródła hałasu z uwzględnieniem 
zarówno ich rozmiarów, jak i zakresu częstości. Celem 
badań jest projektowanie takiej lokalizacji budynków 
mieszkalnych i budynków ekranujących, by hałas 
arterii komunikacyjnych dochodzący do wnętrza 
budynków mieszkalnych był jak najmniejszy. Badania 
te utrudnia konieczność stosowania dużego współ¬ 
czynnika skali, co przesuwa znacznie zakres częstości 
w modelu i w dużym stopniu uniemożliwia odwzoro¬ 
wanie współczynnika tłumienia powietrza, który 
zmienia się wraz z częstością. 

Badania modelowe własności izolacyjnych przegród 
i osłon przeciwdźwiękowych nie wymagają tak dużej 
zmiany skali częstości, gdyż nie jest konieczne sto¬ 
sowanie dużych współczynników skali. Utrudnieniem 
w tego rodzaju badaniach powodującym to, że wyniki 
mają charakter przybliżony stanowi nieharmonicz- 
ność rozkładu częstości drgań własnych płyt i jego 
zależności od sposobu zamocowania, wskutek czego 
zmiana wymiarów badanego obiektu nie zmienia 
proporcjonalnie częstości rezonansowych. Dlatego 
też — szczególnie w wypadku osłon — badania mo¬ 
delowe są przydatne w stosunku do materiałów i obiek¬ 
tów silnie tłumionych, dla których wpływ częstości 
rezonansowych odgrywa mniejszą rolę. 


modele 

urbani¬ 

styczne 


badania 
modelowe 
przegród 
i osłon 


Fale uderzeniowe 

Wiktor Jungowski 

Fala uderzeniowa jest frontem gwałtownego wzro¬ 
stu ciśnienia, temperatury, gęstości i prędkości ośrod¬ 
ka ciągłego, którym może być gaz, ciecz lub ciało 
stałe. Gwałtowność tego wzrostu powoduje nieod¬ 
wracalność przemiany przy sprężaniu ośrodka przez 
falę uderzeniową. Oznacza to, że ośrodek rozprężony 
z powrotem do ciśnienia początkowego ma tempera¬ 
turę wyższą od początkowej. Wzrost wymienionych 
wyżej wielkości nie pociąga za sobą nieodzownie ich 
obniżenia, tak jak w fali akustycznej lub fali na po¬ 
wierzchni cieczy, kiedy to ośrodek zostaje przemiesz- 
fale ciśnie- czony względem stałego średniego położenia. W tzw. 
niowe falach ciśnieniowych nawet znaczne sprężanie lub 
rozprężanie ośrodka odbywa się stopniowo i prze¬ 
miany są odwracalne. W falach akustycznych przy- 
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rosty ciśnienia są bardzo małe a prędkość stała (za¬ 
leżna od ściśliwości ośrodka). 

W falach ciśnieniowych zgęszczeniowych i w falach 
uderzeniowych wyróżniamy czoło fali, tzn. stronę, 
od której rozpoczyna się wzrost ciśnienia, i tył fali — 
miejsce, w którym wzrost ten się kończy. Analogicz¬ 
nie czołu rozrzedzeniowej fali ciśnieniowej odpo¬ 
wiada początek spadku ciśnienia, a tyłowi — koniec. 

Prędkość fali uderzeniowej względem ośrodka jest prędkość 
zawsze większa od prędkości dźwięku i rośnie z jej ude- ^ 
natężeniem, określonym stosunkiem przyrostu ciśnie- rzeniowej 
nia do ciśnienia przed falą. W gazach prędkość ta 
może przekraczać wielokrotnie prędkość dźwięku, 
w cieczach i ciałach stałych, nawet jeśli fale mają 
bardzo duże natężenie, jest z nią porównywalna. 











liczba 

Macha 


źródła fal 
uderzenio¬ 
wych 


znaczenie fal 
uderzenio¬ 
wych 


zastosowanie 
fa! ude¬ 
rzeniowych 


Prędkość dźwięku w gazach o umiarkowanej tem¬ 
peraturze jest na ogół mniejsza, a w cieczach większa 
od 1 km/s, natomiast w ciałach stałych osiąga kilka 
km/s. Na przykład prędkość dźwięku przy tempera¬ 
turze 20°C wynosi w powietrzu 0,34 km/s, w wodzie 
1,46 km/s i w stali 4,99 km/s. Stosunek prędkości fali 
uderzeniowej do prędkości dźwięku przed nią jest 
nazywany liczbą Macha M s . W wypadku jądrowej 
eksplozji w powietrzu M s ma wartość ponad 3000, 
co odpowiada prędkości fali ok. 1000 km/s. Ze wzro¬ 
stem natężenia fali uderzeniowej rośnie temperatura 
za jej czołem i w gazach może wynosić od kilkuset 
do milionów K. Dolnej granicy odpowiada fala poru¬ 
szająca się przed kulą karabinową, a górnej — fala 
wywołana wspomnianą wyżej eksplozją jądrową. 

Fale uderzeniowe powstają na skutek gwałtownego 
wyzwolenia energii, no. przy eksplozji materiału wy¬ 
buchowego lub eksplozji jądrowej, pęknięciu zbior¬ 
nika z parą lub gazem o wysokim ciśnieniu, wyłado¬ 
waniu elektrycznym, wybuchu wulkanu, wypływie 
gazu łub pary z prędkością naddźwiękową. Ciała po¬ 
ruszające się z prędkością nadźwiękową względem 
ośrodka, takie jak meteoryty, pojazdy kosmiczne, 
pociski lub samoloty, są również źródłem fal uderze¬ 
niowych. Fala uderzeniowa jest wtedy wywołana 
ruchem ciała w ośrodku stawiającym opór. W wyniku 
tego ciało albo zmniejsza prędkość, tak np. jak kabina 
pojazdu kosmicznego w atmosferze (energia kine¬ 
tyczna kabiny zamienia się w fali uderzeniowej na 
ciepło), albo porusza się ze stałą prędkością, tak jak 
samolot napędzany silnikami. Wówczas siła oporu 
jest pokonywana kosztem energii wyzwolonej z pa¬ 
liwa. Zawsze jednak powstanie lub istnienie fali ude¬ 
rzeniowej musi mieć źródło energii. W pobliżu źródła 
fale mogą być bardzo silne, ale rozprzestrzeniając się 
zmniejszają swoje natężenie (i prędkość) i stopniowo 
zanikają, przeradzając się w słabe zaburzenia aku¬ 
styczne. Proces zanikania dokonuje się na najdłuższej 
drodze w gazach, na krótszej w cieczach i najkrótszej 
w ośrodkach stałych. 

Zjawisko fizyczne, jakim jest fala uderzeniowa, 
ma dla człowieka różnorodne znaczenie. Jako nie¬ 
kontrolowana siła przyrody fala uderzeniowa może 
stanowić zagrożenie. Można tu wymienić fale ude¬ 
rzeniowe spowodowane wyładowaniem energii elek¬ 
trycznej w atmosferze (uderzenie pioruna), ruchem 
meteorytu w pobliżu powierzchni Ziemi z prędkością 
naddźwiękową i jego upadkiem oraz wypływem ga¬ 
zów i lawy podczas wybuchu wulkanów. Takimi nie¬ 
kontrolowanymi zjawiskami przyrody są również 
trzęsienia Ziemi wywołujące fale typu fali uderzenio¬ 
wej biegnące w płaszczu i skorupie ziemskiej lub fale 
powodujące ruch olbrzymich mas wody w oceanach 
(fale tsunami), a także huragany lub tajfuny powodu¬ 
jące powstawanie na powierzchniach mórz i oceanów 
stromych fal podobnych do fali przypływu. Kontro¬ 
lowane przez człowieka fale uderzeniowe mogą być 
środkiem niszczenia, bądź pomocą w kształtowaniu 
terenu, zarówno na powierzchni Ziemi jak i w jej 
wnętrzu, czy też na dnie zbiorników wodnych. 

Możliwość wytwarzania wysokich ciśnień i tempe¬ 
ratur za pomocą fal uderzeniowych znalazła wiele 
zastosowań. Na pierwszym miejscu należy wymienić 
instalacje badawcze: rury uderzeniowe, niektóre tu¬ 
nele aerodynamiczne i wyrzutniki, służące do badań 
opływu ciał z dużymi prędkościami, badań własności 
gazów itp. Bezpośrednie praktyczne zastosowanie 
znalazły fale uderzeniowe w instalacjach zapłonowych, 
w których wytwarzają wysoką temperaturę gazu, jako 
źródła dźwięku o bardzo wysokim poziomie (uzyski¬ 
wane za pomocą oscylujących fal uderzeniowych), w 
badaniach geologicznych (rejestracja ruchu fal w 
gruncie wywołanych wybuchami w różnych punktach 
badanego terenu), przy produkcji diamentów z gra¬ 
fitu przez poddawanie go bardzo wysokiemu ciśnie¬ 
niu, w tłoczeniu blach (poddawanych działaniu fal 
uderzeniow-ych wytworzonych w wodzie przy wy¬ 
buchu), w wykonywaniu otworów (impulsowym 


strumieniem cieczy o bardzo dużej prędkości) oraz 
w wytwarzaniu silnych wibracji elementów mechanicz¬ 
nych. 

Ze względu na liczbę współrzędnych opisujących 
ruch fali względem ośrodka można rozróżnić fale 
jedno-, dwu- i trójwymiarowe. Fale jednowymiarowe 
— to fale płaskie, cylindryczne i kuliste (rys. 1). Wy¬ 
kresy na rys. 1 przedstawiają zmianę położenia x fali 
w czasie /, poczynając od chwili początkowej t — 0 
do t — t\ inaczej mówiąc — linię ruchu fali. Rysunki linia ruchu 
pod wykresami uwidoczniają tylko położenia po- fali 
czątkowe i końcowe faii uderzeniowej. Można wyka¬ 
zać, pomijając tłumiące działanie lepkości gazu, że 
prędkość fali płaskiej jest stała, a cylindrycznej i ku¬ 
listej maleje w miarę oddalania się od punktu wyjścio¬ 
wego. Wszystkie te fale napotykając obiekt, który 
powoduje ich odbicie i dyfrakcję, mogą się przero¬ 
dzić w fale dwu- lub trójwymiarowe. 



Rys. 1. Linie ruchu fal uderzeniowych (wykresy x~i ) obrazujące 
położenie w czasie: a) fali płaskiej, b) cylindrycznej, c) kulistej. 
Kolorem niebieskim zaznaczono obszary wysokiego ciśnienia 


W odniesieniu do fal uderzeniowych występują- fale o małym 
cych w gazie nasuwa się podział na fale o małym na- natężeniu 
tężeniu, w których temperatura pozostaje na umiarko¬ 
wanym poziomie i odgrywają rolę tylko stopnie swo¬ 
body związane z przesunięciami i obrotami molekuł, 
oraz na fale o dużym natężeniu, w których tempera¬ 
tura jest na tyle wysoka, że zostają wzbudzone stop¬ 
nie swobody związane z drganiami atomów w mole¬ 
kule, dysocjacją, wzbudzeniem atomu i jonizacją. 

W pierwszym wypadku do osiągnięcia przez gaz sta¬ 
nu równowagi termodynamicznej wystarcza, kilka 
zderzeń. Grubość fali (Li na rys. 2) jest wówczas 
rzędu drogi swobodnej molekuły (w w-a runkach at¬ 
mosferycznych L x js 0,02 pm). W drugim wypadku 
natomiast osiągnięcie stanu równowagi po wzbudzę- fale o dużym 
niu wymaga liczby zderzeń większej o kilka rzędów natężeniu 
wielkości i wówczas za warstwą znajduje się znacz¬ 
nie grubsza strefa L 2 , w której parametry gazu ulegają 
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dalszej zmianie, aż do osiągnięcia przez gaz stanu rów¬ 
nowagi termodynamicznej. 

Podobną strukturę ma fala detonacyjna, w której 
za warstwą L x występuje strefa spalania, a więc strefa 
reakcji chemicznej. Jeżeli ogrzany gaz za falą uderze¬ 
niową silnie promieniuje, to parametry gazu przed 
falą zmieniają się w miarę jej zbliżania, w wyniku 
ogrzewania się gazu. W plazmie mogą pojawić się 
także fale uderzeniowe, w których poza ciśnieniem 



Rys. 2. Zmiana parame¬ 
trów gazu (ciśnienia, gę¬ 
stości, temperatury i pręd¬ 
kości) w fali uderzeniowej 
o małym natężeniu (krzy¬ 
wa niebieska) i fali uderze¬ 
niowej o dużym natężeniu 
(krzywa czarna), biegną¬ 
cych w dodatnim kierun¬ 
ku osi x ; Li grubość fali 
o małym natężeniu, L t + L t 
grubość fali o dużym na¬ 
tężeniu 


gazu odgrywają rolę siły wywołane obecnością pola 
magnetycznego, zależne od przenikalności magnetycz¬ 
nej plazmy, natężenia przepływającego w niej prądu 
elektrycznego i natężenia pola magnetycznego, 
fale W przestrzeni kosmicznej wiatr słoneczny, będący 
uderzeniowe strumieniem cząstek wyrzuconych przez Słońce i po- 
w przestrzeni ruszających się z prędkością naddźwiękową (ok. 400 
kosmicznej km/s), przy zetknięciu z ziemskim polem magnetycz¬ 
nym powoduje powstanie fali uderzeniowej. W istnie¬ 
jących tam warunkach silnego rozrzedzenia cząstek, 
fala uderzeniowa wożę mieć grubość tysięcy kilome¬ 
trów. Fala taka powstaje nie w wyniku zderzeń czą¬ 
stek, lecz jedynie w wyniku oddziaływań elektromag¬ 
netycznych. Oddziaływania te powodują, że tempera¬ 
tura za frontem fali jest co najmniej dziesięciokrotnie 
wyższa niż w wietrze słonecznym przed nim. Powsta¬ 
nie fali uderzeniowej zmienia strukturę magnetosfery 
w sposób mogący ulegać fluktuacjom w czasie, ponie¬ 
waż własności wiatru słonecznego zależą od aktywno¬ 
ści Słońca. Jest to przyczyną zjawisk obserwowanych 
bezpośrednio na Ziemi, takich jak burze magnetyczne 
czy zorze polarne. Źródłem fal uderzeniowych w prze¬ 
strzeni kosmicznej są również wybuchy słoneczne. 

Rozpatrując fale uderzeniowe w układzie odnie¬ 
sienia związanym z obiektem, na który oddziałują, 
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rozróżniamy fale biegnące, stacjonarne i oscylujące. 
Oczywiście układ odniesienia nie zmienia własności 
fal ani związków między parametrami ośrodka przed 
i za falą. Zależą one od względnej prędkości fali 
i ośrodka. Natomiast dla obiektu, na który działa 
fala, jest istotne, czy przemieszcza się ona względem 
niego czy też nie. 


Fale biegnące 

Jeżeli gaz o wysokim ciśnieniu (obszary niebieskie na 
rys. 1) jest oddzielony ścianką od otoczenia, to pęk¬ 
nięcie ścianki powoduje wypływ gazu i utworzenie się 
fali uderzeniowej. Ilustracja 170 (tabl. 45) przedstawia 
obraz przepływu, odpowiadający rys. Ic, otrzymany 
metodą smug (nazywaną również metodą Teplera, 
w której wykorzystuje się zależność kąta odchylenia 
promienia świetlnego od pierwszej pochodnej gęstości 
gazu), po upływie 150 ps od pęknięcia szklanej kuli 
o średnicy 5 cm. Kula była wypełniona powietrzem 
i pękła przy ciśnieniu 3,6 MPa. Na zdjęciu widzimy 
kulistą falę uderzeniową S, front C wypływającego 
z kuli powietrza i popękaną ściankę G kuli. Przepływ 
powietrza wydostającego się pomiędzy fragmentami 
ścianki z wnętrza kuli jest silnie burzliwy, w odróż¬ 
nieniu od przepływu powietrza otaczającego kulę 
i wprawianego w ruch przez falę uderzeniową. Frag¬ 
menty ścianki kuli, z powodu swojej bezwładności, 
są niewiele przesunięte względem początkowego po¬ 
łożenia. 

Podobne zjawiska występują przy przerwaniu prze¬ 
pony w rurze uderzeniowej — urządzeniu służącym 
m.in. do wytwarzania i badania fal uderzeniowych. 
Wzdłuż rury przemieszcza się wtedy płaska fala ude¬ 
rzeniowa (rys. la). Źródłem fali uderzeniowej jest 
również gwałtowne otwarcie zaworu oddzielającego 
gaz o różnych ciśnieniach. Wypływ gazów procho¬ 
wych, po opuszczeniu lufy przez pocisk, wywołuje 
silną falę uderzeniową S 2 (il. 174, tabl. 45). Pocisk jest 
słabo widoczny w ciemnych gazach prochowych, jego 
wierzchołek znajduje się blisko fali S 2 . Fala uderze¬ 
niowa S x powstała wcześniej i jest wynikiem dyfrakcji 




Rys. 3. Powstawanie fali uderzeniowej wskutek ruchu tłoka (a) 
i przebiegi w czasie ciśnień (b) mierzonych przetwornikami a i b 
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prostopadłej fali uderzeniowej wytworzonej w lufie 
przed pociskiem. Obie fale i ich odbicia od Ziemi oraz 
otaczających obiektów są głównymi źródłami sły¬ 
szanego przy wystrzale huku. 

Mechanizm generowania fali uderzeniowej przez 
poruszający się w przewodzie pocisk lub tłok jest 
następujący. Tłok, znajdujący się w chwili początko¬ 
wej w spoczynku, zostaje wprawiony w ruch działającą 
nań różnicą ciśnień i gwałtownie przyspiesza. Po¬ 
pychając stykający się z nim gaz wytwarza on słabe 
zaburzenia zgęszczeniowe biegnące wzdłuż przewodu. 
Zastępując ciągły przyrost prędkości tłoka przyro¬ 
stami skończonymi możemy przedstawić jego linię 
ruchu i przemieszczanie się zaburzeń w sposób poka¬ 
zany na rys. 3a. Prędkość zaburzeń względem prze¬ 
wodu jest sumą prędkości gazu i prędkości dźwięku 
w gazie. Ponieważ w miarę rozpędzania się tłoka ro¬ 
sną obie prędkości (prędkość dźwięku na skutek 
podwyższania się temperatury sprężanego gazu), to 
zaburzenia wytworzone później doganiają wcześniej¬ 
sze, i czoło fali ciśnieniowej staje się coraz bardziej 
strome tworząc falę uderzeniową. Znajdujące się w 
ściance przewodu przetworniki ciśnienia a i b umoż¬ 
liwiają zarejestrowanie na ekranie oscyloskopu prze¬ 
biegów ciśnienia w czasie (rys. 3b). Jak widać, dla 
danej prędkości tłoka przyrost ciśnienia w fali ude¬ 
rzeniowej jest mniejszy niż w izentropowej fali ciśnie¬ 
niowej (pQ<Pi), co powoduje powstanie zaburzeń 
rozrzedzeniowych (rys. 3a). Przyczyną tego jest wzrost 
entropii, wynikający z nieodwracalnej zamiany części 
energii mechanicznej na cieplną w fali uderzeniowej. 

Płaska fala uderzeniowa, biegnąca wzdłuż przewo¬ 
du o stałym przekroju, zmniejsza stopniowo swoje 
natężenie na skutek tarcia gazu o ściankę. Gdy fala 
biegnie wzdłuż przewodu o perforowanej ściance (np. 
w tłumiku hałasu wylotowego gazu o wysokim ciśnie¬ 
niu lub w tłumiku odrzutu lufy działa), to ulega ona 
osłabieniu także z powodu wypływu gazu do otocze¬ 
nia. Na zdjęciu (il. 168, tabl. 44) przepływu perforowa¬ 
ną rurą z szybami optycznymi w części centralnej są 
widoczne: płaska fala uderzeniowa S Q w przewodzie, 
front C gazu wypływającego przez otwory z prędkością 
krytyczną (czyli równą prędkości dźwięku), wywo¬ 
łane tym zaburzenia akustyczne W sięgające do zakrzy¬ 
wionej fali uderzeniowej poruszającej się na zewnątrz 
przewodu. 

Płaska fala uderzeniowa trafiając na zmianę prze¬ 
kroju przewodu lub inną przeszkodę ulega odbiciu 
i dyfrakcji, powstaje złożony układ fal. Na zdjęciu 
(il. 169, tabl. 44) wykonanym metodą cieni (wykorzy¬ 
stuje się zależność kąta odchylenia promienia świetl¬ 
nego od drugiej pochodnej gęstości gazu) jest widocz¬ 
ny fragment pola przepływu w kanale o przekroju 
prostokątnym, którego ściany boczne wykonano ze 
szkła optycznego. Można wyróżnić: płaską falę ude¬ 
rzeniową S 0 biegnącą wzdłuż kanału ponad pionowo 
ustawionym klinem, odbitą od pochyłej ścianki klina 
falę S 2 i powstałą w wyniku dyfrakcji fali płaskiej za¬ 
krzywioną falę S x . Z linii (na zdjęciu punkt) przecię¬ 
cia tych fal wychodzi powierzchnia (na zdjęciu krzy¬ 
wa) C nieciągłości temperatury i gęstości gazu, która 
łączy się z wirem V przy ostrzu klina. Ponadto słabo 
widoczne jest czoło fali rozrzedzeniowej R , biegną¬ 
cej pod prąd pomiędzy pochyłą ścianką klina a falą 
uderzeniową S 2 . 

Przejście fali uderzeniowej przez kanał może sta¬ 
nowić fazę początkową ustalania się przepływu. Na¬ 
stępuje to wówczas, gdy są utrzymywane stałe warun¬ 
ki zasilania. Na il. 175 (tabl. 45) są widoczne kolejne 
zmiany struktury przepływu za płaską falą uderze¬ 
niową, prowadzące do utworzenia stacjonarnych, 
skośnych fal uderzeniowych w początkowym odcinku 
kanału. Ich obecność wskazuje, że przepływ jest nad- 
dźwiękowy. Prędkość fali płaskiej na wejściu do ka¬ 
nału jest rzędu 1 km/s. Na ostatnim zdjęciu widać 
dyfrakcję fali po wyjściu z kanału. 

Samolot lecący z prędkością naddźwiękową wy¬ 
twarza układ fal uderzeniowych i rozrzedzeniowych. 


które w wyniku wzajemnego oddziaływania docierają 
do powierzchni Ziemi jako tzw. fala N, o dwóch fala IM 
skokowych przyrostach ciśnienia odbieranych przez 
ucho ludzkie jako dwa odgłosy (rys. 4) z przerwą ?. 
wynoszącą dla samolotu myśliwskiego 0,1 s a dla 
dużego samolotu transportowego 0,35 s. Wielkość 
przyrostu ciśnienia i poziom wytwarzanego dźwięku 
zależą od wielu czynników, np. od ciężaru i wymia¬ 
rów samolotu, wysokości i prędkości lotu, rozkładu 
temperatury w atmosferze, turbulencji powietrza, 



Rys. 4. Fala ciśnieniowa N wytwarzana przez samolot lecący 
z prędkością naddźwiękową 


przyspieszenia samolotu i ukształtowania powierzch¬ 
ni Ziemi. Dodatni przyrost ciśnienia w fali N może 
w szczególnych wypadkach być równoważny nisz¬ 
czącemu działaniu huraganu (o prędkości ok. 35 m/s) 
na ludzi, pojazdy, budynki i środowisko naturalne. 

Za tolerow-ane obciążenia uważa się obciążenia od¬ 
powiadające silnemu wiatrowi (prędkość 12 m/s). 

Jeżeli występują one jednak często, np. w rejonach 
lotnisk, to mogą przyspieszać starzenie się budynków, 
a ponadto przez nagłe pojawianie się powodować wy¬ 
padki pojazdów oraz, ze względu na hałas, wywoły¬ 
wać u ludzi nerwice i choroby serca. Aby zapewnić 
bezpieczne warunki życia na Ziemi wprowadza się 
różne ograniczenia dotyczące lotów samolotów nad- 
dźwiękowych. 

Istotne jest określenie parametrów gazu za falą parametry 
uderzeniową: prędkości, temperatury, ciśnienia i gę- gazu za falą 
stości. Natężenie fali uderzeniowej zależy od prędkości uderzeniową 
jej ruchu względem gazu. Jeśli ruch fali uderzeniowej 
będziemy rozpatrywać względem nieruchomego u- 
kładu odniesienia (rys. 5a), to jej prędkość można wy¬ 
razić przez sumę prędkości gazu przed falą i prędkości 
fali względem gazu (u x -rłV). Wyróżnimy obszar 1 
przed falą i obszar 2 za falą. W obszarze 1 prędkość 
gazu oznaczymy przez u x i prędkość dźwięku przez a u 
a w obszarze 2 — przez u z i a 2y przy czym w 2 >"i 
i a 2 >a x . Jak już wspominaliśmy prędkość fali uderze¬ 
niowej względem gazu przed jej czołem jest zawsze 
naddźwiękową, czyli W>a ly a więc 

u 1 +W>Ui+<h- 
Można również wykazać, że 

u 1 +W< u 2 +a 2 . 

Z nierówności tych wynika, że fala uderzeniowa doga¬ 
nia zaburzenia akustyczne biegnące przed nią i jest 
doganiana przez biegnące za nią, co oznacza wchła¬ 
nianie przez falę zaburzeń biegnących w jej otoczeniu. 

Zwiążmy teraz układ odniesienia z ruchomą falą; 
w układzie tym nich gazu jest ustalony (jak w wy¬ 
padku fali stacjonarnej) a jego prędkość jest równa 
-W w obszarze I i w 2 - (u x + W) w obszarze // (rys. 
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Rys. 5. Ruch fali uderzeniowej i gazu: a) w układzie nieruchomym, 
b) w układzie związanym z falą 


5b). Stosując do gazu przepływającego przez falę ude¬ 
rzeniową zasady zachowania masy, pędu i energii 
otrzymamy następujące równania: 

o x W = Qi [W±(u 1 -u,)\, (1) 

Pi+C!iW 2 = Pt+Q i [lV±(u 1 -u ł )]*, (2) 

ję. + ^mo^L +km (3) 

w których q jest gęstością gazu, p — ciśnieniem, 
a h — entalpią (h — e+ip/g), gdzie e — energia we¬ 
wnętrzna). Znak plus odnosi się do fali biegnącej 
w dodatnim kierunku osi x, jak na rys. 5a, natomiast 
minus — do fali biegnącej w kierunku przeciwnym, 
parametry W wypadku słabych fal uderzeniowych (o rnałym na- 
gazu — fale tężeniu), tzn. w zakresie ciśnień i temperatur, przy 
słabe których wartości ciepła właściwego (przy stałym ciś¬ 
nieniu i przy stałej objętości) i ich stosunek *j można 
przyjąć za stałe dla danego gazu, z powyższych rów¬ 
nań uzyskuje się zależności wyznaczające: przyrost 
prędkości gazu 


Kg-"i 


= ± 


*5+1 


(»-+ 


(4) 


stosunki temperatur bezwzględnych (T = 273+/°C) 


H+ 


= 1 - 


2(*-l) 


(* + l) 2 
stosunki ciśnień 


(5 ) 
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gdzie M s = Wia^ jest liczbą Macha fali uderzeniowej. 
Wyrażenia (4)-(7) są słuszne dla fali płaskiej, cylin¬ 
drycznej i kulistej. 

Obliczmy na przykład parametry gazu za falą i po 
jej odbiciu od przeszkody, tzn. za falą odbitą, w wy¬ 
padku fali o M s — 2 (wywołanej pęknięciem zbiornika 
z gazem będącym pod ciśnieniem kilku MPa lub eks¬ 
plozją bomby czy pocisku), biegnącej w nierucho¬ 
mym (u x = 0) powietrzu (*r =1,4) o temperaturze 
t x = 15°C (a x = 340 m/s) i ciśnieniu 0,1 MPa. Z zależ¬ 
ności (4M6) mamy u 2 — 425 m/s, / 2 = 213°C i p 2 = 
= 0,45 MPa. Fala trafiająca na przeszkodę ulega od¬ 
biciu, a prędkość przepływu za nią maleje do zera 
(rys. 6). Wykorzystując warunek = 0, z (4) możemy 
obliczyć M s fali odbitej, a z (5) i (6) znaleźć odpo¬ 
wiednio / 3 = 446°C i p s — 1,5 MPa. Otrzymane war¬ 
tości wskazują, że nawet fala uderzeniowa o małym 
natężeniu stwarza poważne obciążenia obiektów sto¬ 
jących na jej drodze; w rozpatrywanym przykładzie 
obciążenie 153 t/m 2 ściany jest obciążeniem niszczą¬ 
cym każdy budynek. 



Rys. 6. Odbicie płaskiej fali - 

uderzeniowej od ściany x 

W wypadku fal uderzeniowych o dużym natęże¬ 
niu, gdy wartości ciepła właściwego zmieniają się 
wraz z ciśnieniem i temperaturą, parametry gazu za 
falą możemy wyznaczyć bezpośrednio z równań 
(1)—(3), wykorzystując tablice lub wykresy podające 
zależności entalpii od gęstości i ciśnienia dla danego 
gazu. 


Fale stacjonarne (nieruchome) 

W strumieniu gazu wypływającym z dyszy i rozpędzo¬ 
nym do prędkości naddźwiękowej mogą powstawać 
stacjonarne fale uderzeniowe o różnych kształtach — 
zależnie od stosunku ciśnienia zasilania do ciśnienia 
otoczenia. Na il. 173 (tabl. 45) jest widoczny strumień 
gazu wypływający z prędkością krytyczną z dyszy 
zbieżnej o przekroju kołowym i osiągający dalej 
prędkość naddźwiękową (stosunek ciśnień 7,5). W po¬ 
bliżu dyszy powstaje baryłkowata fala uderzeniowa 
zakończona płaską falą uderzeniową, zwaną dyskiem 
Macha. Przy wypływie do kanału z dyszy zbieżnej 
o przekroju prostokątnym powstaje układ skośnych 
fal uderzeniowych (il. 171, tabl. 45), rozpoczynający 
się od miejsca, w którym granica strumienia styka się 
ze ścianką kanału (lewa strona fotografii). Prążki 
oznaczają linie stałej gęstości gazu; ich zagęszczenie 
świadczy o dużej zmianie gęstości. Obraz prążków 
w otoczeniu wylotu dyszy D wskazuje na malejącą gę¬ 
stość rozprężającego się gazu, a ich zagęszczenie na li¬ 
niach skośnych — na wzrost gęstości gazu przy prze¬ 
pływie przez falę uderzeniową. 

Ruch bryły ze stałą prędkością naddźwiękową 
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w nieruchomym gazie powoduje utworzenie fali ude¬ 
rzeniowej, stacjonarnej względem bryły. Identyczna 
sytuacja ma miejsce, gdy nieruchoma bryła jest opły¬ 
wana przez gaz. Takie fale są widoczne na il. 177, 178, 
172,176 (tabl. 45 i 46). Przed kulą (il. 177), poruszają¬ 
cą się z prędkością nieco większą od prędkości dźwię¬ 
ku, w odległości trochę większej od jej średpicy po¬ 
wstaje zakrzywiona i odsunięta fala uderzeniowa S&, 
a na kuli następuje oderwanie warstwy przyściennej 
gazu i tworzy się silnie burzliwy obszar zastoju W. Za 
odsuniętą falą uderzeniową przepływ względem kuli 
jest poddźwiękowy, ale przy opływie kuli prędkość 
wzrasta ponownie do naddźwiękowej. Fakt ten i wy¬ 
chylenie granicy obszaru zastoju na zewnątrz powodu¬ 
je powstanie stożkowej fali uderzeniowej S t . Zakrzy¬ 
wiona i odsunięta fala uderzeniowa £& powstaje rów¬ 
nież przed zaokrąglonym stożkiem (il. 178) poruszają¬ 
cym się w powietrzu z prędkością naddźwiękową. 
Fata ta znajduje się blisko stożka. Ponadto są widocz¬ 
ne: fala rozrzedzeniowa R przy podstawie stożka, 
burzliwy obszar zastoju T , stożkowa fala uderzeniowa 
S t wywołana zakrzywieniem się granicy śladu aerody¬ 
namicznego oraz fale akustyczne W spowodowane 
burzliwością w tym śladzie. 

Ilustracja 172 przedstawia opływ kabiny kosmicznej 
z hiperdźwiękową prędkością (badanie modelowe 
prowadzone w tunelu aerodynamicznym). Za odsu¬ 
niętą falą uderzeniową jest widoczny jarzący się gaz 
o wysokiej temperaturze (5000°C). 

Fale uderzeniowe powstające przy płaskim opływie 
romboidalnego profilu (kąt ostry wynosi 14°) z nad¬ 
dźwiękową prędkością widoczne są na il. 176. Z czoło¬ 
wej krawędzi wychodzą skośne fale uderzeniowe, 
a w rejonie krawędzi bocznych widać fale rozrzedzę- 
niowe. 

Parametry prostopadłej fali uderzeniowej można 
wyznaczyć w prosty sposób w nieruchomym układzie 
odniesienia (rys. 5b). Równania zachowania w tym u- 
kładzie są następujące: 


QlUi = QUUlU 

(la) 

Pl-{-QlUi — pll~\-QllUiu 

(2a) 

(utlD+hi = (uh/iy+kn; 

(3a) 


ui i uu — prędkości gazu za i przed falą. Z powyższych 
równań zamiast wzoru (4) wyznaczamy związeK mię¬ 
dzy liczbami Macha przed i za falą 



Do określenia stosunków temperatur, ciśnień i gęs¬ 
tości wykorzystujemy zależność (5), (6) i (7) podsta¬ 
wiając do nich M s = Mi. 

Ze wzoru (8) wynika, że Mu — Mi t gdy Mi — 1, 
co oznacza, że przy przepływie z prędkością dźwięku 
nie powstaje stacjonarna fala uderzeniowa, podob¬ 
nie jak przy M — 1 ruchoma fala uderzeniowa staje 
się zaburzeniem akustycznym. Gdy Mi -> oo, to Mu -> 
-> p/(«—1)/2*, co przy x = 1,4 daje Mn -> 0,378. 
A więc zakresowi 1 < M < oo odpowiada zakres 
1 > Mn > 0,378. Ze wzorów (6) i (7) wynika, że 
Pu!pi -> co, lecz qii/qi ->(*-bl)/(*— 1) a przy * = 1,4 
qu!qi -> 6. Z powyższych rozważań wynika, że 
przepływ przed prostopadłą falą uderzeniową jest 
zawsze naddźwiękowy (Mi > 1), a za nią poddźwię¬ 
kowy (Mn < 1) oraz, że adiabatyczne sprężanie gazu 
w fali uderzeniowej może zwiększyć gęstość tylko 
w ograniczonym zakresie w odróżnieniu od sprężania 
izentropowego, przy którym wzrost gęstości nie jest 
ograniczony. 

Wykorzystując równania zachowania w odniesieniu 
do skośnej fali uderzeniowej wywołanej zmianą kie¬ 
runku płaskiego przepływu o kąt 0 (rys. 7) można 
wykazać, że zależności między parametrami gazu 
przed i za falą są identyczne jak dla fali prostopadłej, 
jeżeli się rozpatruje składowe prędkości w kierunku 
prostopadłym do fali skośnej. Możliwość występo- 


wania skośnej fali uderzeniowej jest ograniczona za¬ 
kresem wartości M x i 0. Z równań zachowania wynika 
równanie rodziny krzywych, z których każda odpo¬ 
wiada określonej prędkości gazu przed skośną falą biegunowe 
uderzeniową, a opisuje wektor prędkości gazu za falą skośnej fali _ 
w zależności od kąta 0. Krzywe te, nazywane biegu- uderzeniowej 



x 

Rys. 7. Skośna fala uderzeniowa przy opływie klina 


nowymi skośnej fali uderzeniowej, przedstawia się 
na ogół w układzie współrzędnych u i v będących 
składowymi w kierunku odpowiednio x i y prędkości 

gazu K lub w układzie współrzędnych bezwymiaro¬ 
wych u = u/a * i v = vja*. (a* krytyczna prędkość 
dźwięku, tzn. prędkość odpowiadająca liczbie Ma¬ 
cha M = 1). Równanie biegunowej w tym układzie ma 


postać: 


(oi-m 2 ) 2 (mi«2-0 

2 -> - - ,i ’ 


(9) 


równanie 

biegunowej 


Parametrem jest tu u x równe V u ponieważ kierunek 
przepływu niezakłóconego pokrywa się z osią *, a więc 
v x = 0. Na rys. 8 przedstawiono biegunową fali u- 
derzeniowej opisaną wzorem (9). Przy danej wartości 



V u w zakresie 0 < 0 < 0max, istnieją dwa rozwią¬ 
zania określone np. punktami 2' i 2". Pierwsze z nich 
odpowiada mniejszej zmianie prędkości niż drugie, 
a więc słabszej fali uderzeniowej. Jak wynika z rysun¬ 
ku, za słabszą falą przepływ jest nadal naddźwiękowy 
(Vi > 1), a za silniejszą — poddźwiękowy (Vz < 1). 
Jeżeli 0 = 0 ma x, istnieje tylko jedno rozwiązanie, 
a dla 6 > 0 ma x nie ma rozwiązania dla skośnej fali 
uderzeniowej. Stwierdzono doświadczalnie, że przy 


Rys. 9. Odsunięta fala 
uderzeniowa przy opły¬ 
wie klina 



opływie klina swobodnym strumieniem występuje opływ klina 
tylko słaba fala, natomiast w kanale zamkniętym, 
jeśli się wytworzy odpowiedni poziom ciśnienia za 
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falą uderzeniową, można wymusić pojawienie się 
silniejszej fali. Gdy 6 > 0 max występuje fala odsunię¬ 
ta (rys. 9), jak przed bryłą tępą (il. 172, 177, 178) 
a prędkość v7 gazu za nią, w miejscu gdzie jest ona 
prostopadła, określa punkt 2"' (rys. 8). 

Skośna fala uderzeniowa ulega odbiciu od ściany 
narzucającej kierunek przepływu (rys. 10). Prędkość 
V 3 za falą odbitą zależy od V z i odchylenia strug 
z powrotem o kąt 6. Gdy biegunowa wychodząca 
z punktu 2 (rys. lOb) nie przecina osi odciętych, to 
odbicie nie jest możliwe odbicie fali skośnej i wówczas pow- 
IV! acha staje tzw. odbicie Macha (porównaj dysk Macha na 



stwę laminarną (czyli uwarstwioną, nieburzliwą) pod 
prąd powodując wzrost jej grubości, a nawet oderwa¬ 
nie od ściany i utworzenie obszaru wypełnionego wi¬ 
rami. Pogrubianie warstwy poddźwiękowej działa na 
przepływ naddźwiękowy jak zakrzywienie ściany wy¬ 
twarzając falę zgęszczeniową, która w pewnej odleg¬ 
łości przeradza się w falę uderzeniową A. Fala padają¬ 
ca docierając do oderwanej w-arstwy poddźwiękowej 
powoduje z kolei jej odchylenie w kierunku ściany, co 
jest przyczyną powstawania fali rozrzedzeniowej. 
Zetknięcie się warstwy ze ścianą generuje falę zgęsz¬ 
czeniową, która przeradza się w falę uderzeniową B. 
W wyniku tych wszystkich procesów poddźwiękowa 
warstwa staje się grubsza i burzliwa.. Ostatecznie 
w stosunkowo niewielkiej odległości od ściany fale 
uderzeniowe A i B oraz znajdująca się między nimi fala 
rozrzedzeniowa spotykają się i tworzą pojedynczą, 
odbitą falę uderzeniową. 


Fale oscylujące 


Rys. 10. Odbicie skośnej fali uderzeniowej (a) i odpowiednie 
biegunowe (b) 


ii. 173, tabl. 45) składające się z trzech fal uderzenio¬ 
wych A, B, C i powierzchni N nieciągłości prędkości, 
gęstości i temperatury gazu (rys. 11). Prędkość V 2 jest 
w tym wypadku zbyt mała, aby przy danym kącie 6 
mogła utworzyć się odbita skośnie fala uderzeniowa. 
Podobnie przy wypływie z dyszy nie jest możliwe od¬ 
bicie stożkowej fali uderzeniowej w osi symetrii i po 
obu jej stronach powstają struktury przepływu (il. 173) 
odpowiadające schematowi na rys. 11. 


N 


Rys. 11. Odbicie Macha; A t B, C fa¬ 
le uderzeniowe, N powierzchnia nie¬ 
ciągłości prędkości, gęstości i tempe¬ 
ratury gazu 

wpływ Rozpatrując fale uderzeniowe występujące w po- 
warstwy bliżu opływanych powierzchni nie zawsze można po- 
przyściennej mijać obecność warstwy przyściennej wywołanej lep¬ 
kością gazu, tzn. cienkiej warstwy, w której prędkość 
przepływu rośnie gwałtownie (od zera na powierzchni) 
w miarę oddalania się od niej. Wskutek obecności 
warstwy przyściennej, odbicie skośnej fali uderzenio¬ 
wej od ciała przebiega w nieco inny sposób niż to 
pokazano na rys. 10. Gdy warstwa ta jest bardzo 
cienka, to można jej wpływu nie uwzględniać. Jak już 
wiadomo, stacjonarna fala uderzeniowa pojawia się 
tylko w przepływie naddźwiękowym (M > 1), a więc 
musi się kończyć na granicy warstwy (rys. 12), w któ¬ 
rej gaz porusza się z prędkością poddźwiękową (M < 
< 1). Wskutek tego wzrost ciśnienia występujący za 
falą uderzeniową przenika przez poddźwiękową war- 




Rys. 12. Współoddziaływanie skośnej fali uderzeniowej z war¬ 
stwą przyścienną 
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Stacjonarne fale uderzeniowe występujące w prze¬ 
pływie burzliwym nie są nigdy idealnie nieruchome. 
Wskutek pulsacji prędkości związanej z burzliwością 
drgają one ze znaczną częstością, ale z bardzo małą 
amplitudą. W pewnych jednak wypadkach w stacjo¬ 
narnym naddźwiękowym przepływie mogą pojawić się 
silne oscylacje fał uderzeniowych, przy których wy¬ 
stępują duże zmiany położenia oraz natężenia fal, 
a czasem nawet ich chwilowy zanik. 

Ilustracja 179 (tabl. 46) ukazuje zmiany (w czasie 
jednego okresu) struktury przepływu w kanale o prze¬ 
kroju prostokątnym zasilanym w sposób ciągły przez 
dyszę zbieżną. Gdy ciśnienie w obszarze zastoju tuż 
przy dyszy jest małe, to w strumieniu występuje poje¬ 
dyncza zakrzywiona fala uderzeniowa (il. 179a). Na¬ 
stępnie strumień odrywa się od ściany kanału (il. 
179b), ciśnienie rośnie, a fala zanika. Stopniowo two¬ 
rzy się struktura komórkowa (il. 179c, d), która w mia- 




Rys. 13. Przykłady przepływu pulsującego z oscylującymi falami 
uderzeniowymi: a) opływ profilu lotniczego z prędkością około- 
dżwiękcwą, b) opływ cylindra z iglicą z prędkością hiperdżwię- 
kową, c) wypływ z prędkością naddźwiękową z dyszy na cylinder, 
d) przepływ dyszą zbieżno-rozbieżną 


pulsacje fal 
stacjonar¬ 
nych 


struktura 

komórkowa 





























rę spadku ciśnienia przeradza się z powrotem w falę 
uderzeniową (il. 179e, f, g) i cykl się powtarza. W tym 
wypadku pulsacja przepływu przejawia się zasadniczy¬ 
mi zmianami jego struktury oraz silną oscylacją ciś¬ 
nienia w całym kanale. 

mechanizm Mechanizm opisanej pulsacji przepływu jest praw- 
pulsacji dopodobnie następujący. Przy pewnej wartości sto- 
przepływu sunku ciśnienia zasilania do ciśnienia w obszarze 
zastoju przy dyszy, rejon przyklejenia strumienia 
do ścianki kanału powinien znajdować się w okreś¬ 
lonym miejscu zapewniającym stałość ilości gazu 
w obszarze zastoju. Inaczej mówiąc, ilość gazu wy¬ 
pływająca wskutek mieszania z obszaru zastoju musi 
być równa ilości dopływającej z powrotem z rejonu 
przyklejenia. Odpowiadająca wspomnianemu stosun¬ 
kowi ciśnień struktura strumienia jest jednak niesta¬ 
bilna i wskutek wzajemnego oddziaływania może 
tworzyć się tzw. pętla sprzężenia zwrotnego między 
ciśnieniem w obszarze zastoju, strukturą strumienia 
i położeniem rejonu przyklejania. Przypadkowe za¬ 
burzenie obniżające ciśnienie w obszarze zastoju 
zwiększa rozprężanie strumienia przy dyszy i odpływ 
gazu z tego obszaru, co z kolei pogłębia dalej ob¬ 
niżenie ciśnienia. W rezultacie rejon przyklejenia 
i związana z nim fala uderzeniowa przesuwa się pod 
prąd w kierunku dyszy. Ciśnienie za falą uderzenio¬ 
wą rośnie na tyle, że poddźwiękowa warstwa odrywa 
się od ściany i pojawia się silny powrotny przepływ 
do obszaru zastoju, powodujący wzrost ciśnienia. 
W rezultacie strumień przy dyszy zwęża się, a rejon 
przyklejenia oddala od niej. Stopniowo wskutek 
wzrostu ciśnienia prędkość przepływu w kanale roś- 


Hałas 

Stefan Czarnecki 

Hałasem jest każdy dźwięk, który działa ujemnie 
na człowieka. Oddziaływanie to może mieć charakter 
przeszkadzający, uciążliwy lub szkodliwy, co zale¬ 
ży przede wszystkim od natężenia hałasu oraz czasu 
jego oddziaływania na człowieka. 

Hałasy przeszkadzające powodują zmęczenie, u- 
tudniają wypoczynek, rozpraszają uwagę, zmniej¬ 
szają zrozumiałość mowy, a także u niektórych ludzi 
mogą działać ujemnie na psychikę. Hałasy uciążliwe 
o większym natężeniu lub działające w sposób długo¬ 
trwały— oprócz wymienionych wyżej skutków są 
przyczyną okresowego, odwracalnego przytępienia 
słuchu, a także stają się źródłem schorzeń o pod¬ 
łożu nerwicowym. Hałasy szkodliwe prowadzą do cał¬ 
kowitej głuchoty i wywołują poważne schorzenia 
o podłożu nerwicowym. Ponadto prawie całkowicie 
uniemożliwiają ustne porozumienie się. 

Ze względu na charakter przebiegu ciśnienia aku¬ 
stycznego w funkcji czasu (rys. 1) hałasy można po¬ 
dzielić na: periodyczne i nieperiodyczne — w za¬ 
leżności od tego, czy w przebiegu ciśnienia akustycz- 
75-85 nego występują lub nie występują regularne powta¬ 
rzalności, na: stacjonarne i niestacjonarne — w zależ¬ 
ności od tego, czy poziom hałasu jest stały lub zmienny 
oraz na hałas ciągły i przerywany — w zależności od 
tego, czy hałas jest długotrwały, czy też występuje tyl¬ 
ko w pewnych przedziałach czasu. Jeśli przedziały 
te są bardzo krótkie (poniżej 1 s), wówczas hałas 
nosi nazwę hałasu impulsowego. 

Hałasy nie są przebiegami sinusoidalnymi (tona¬ 
mi), lecz wykazują strukturę złożoną. Każdy hałas 
stacjonarny można poddać analizie Fouriera i przed¬ 
stawić w postaci rozkładu poziomu ciśnienia akus¬ 
tycznego w funkcji częstości, czyli w postaci widma 
częstości. W przypadku przebiegów periodycznych 
jest to rozkład amplitud o określonych częstościach 
tworzący widmo prążkowe; w przypadku przebiegów 
80-90 nieperiodycznych jest to widmo ciągłe (rys. 2), uzyska¬ 


nie, a odpływ z obszaru zastoju zwiększa się, to z kolei 
powoduje obniżenie się ciśnienia i cykl się powtarza. 

Przy danym stosunku przekroju dyszy do przekroju 
kanału pulsacja przepływu ma pewne pasmo częstości 
ale największe amplitudy oscylacji ciśnienia i fal 
uderzeniowych występują przy określonej długości 
kanału, który odgrywa rolę rezonatora. 

Podobnego typu oscylacje fal uderzeniowych są występo- 
obserwowane np. przy okctfodźwiękowym (M nieco wanie 
większe od jedności) opływie profilu lotniczego (rys. fal oscylują- 
13a), przy hiperdźwiękowym (M > 1) opływie ciała cych 
tępego z iglicą (rys. 13b), przy napływie strumienia 
naddźwiękowego na przeszkodę (rys. 13c) bądź przy 
wypływie z dyszy zbieżno-rozbieżnej, tzw. dyszy La- 
vala. Wszystkie te przypadki odznaczają się: niesta¬ 
bilnymi w danych warunkach strukturami fal uderze¬ 
niowych, oddzielających obszar naddźwiękowy od 
poddźwiękowego, obecnością warstwy mieszania na 
granicy obszaru oderwania (rys. 13a, b, d) lub na gra¬ 
nicy strumienia (rys. 13c) oraz wzmożonym wytwa¬ 
rzaniem hałasu o dyskretnych częstościach. Regularne 
i silne pulsacje przepływu występują wtedy, gdy istnie¬ 
je sprzężenie zwrotne między poszczególnymi obsza¬ 
rami przepływu, z wystarczającym wzmocnieniem od¬ 
działywań. Zakresy częstości oscylacji fal są zależne od 
wymiarów geometrycznych ciał i parametrów prze¬ 
pływającego gazu. 

1.1. Glass Fale uderzeniowe i człowiek , Warszawa 1980; W. M. 

Jungowski Some sclf induced super sonie flow oscillations, J. Próg. 

Aerospace Sci. 18, 151 (1978); A.H. Shapiro The Dynamics and 
Thermodynamics of Compressible Fluid Flow f New York 1953-54; 

J. B. Zieldowicz, J. P. Rajzer Fizyka udarnych wołn i wysoko - 
ticmpieraturnych gidrod i na m iczesk ich jawłenij, Moskwa 1966. 


ne przez obliczenie wartości poziomu ciśnienia aku¬ 
stycznego w odpowiednich przedziałach (pasmach) 
częstości Af. Przy Af-> 0 rozkład poziomu ciśnienia 
akustycznego nazywa się gęstością widma. Przykładem 
hałasów periodycznych jest gwizd lokomotywy, pisk 
hamulców; przykładem hałasów nieperiodycznych — 
szum płynącej wody, syk pary, hałas silnika odrzu¬ 
towego. 

Widmo częstości hałasów niestacjonarnych lub 
impulsowych zmienia się w funkcji czasu, co prowa¬ 
dzi do konieczności analizy hałasu zarówno w zależ¬ 
ności od częstości jak i czasu. 


Ocena i pomiar hałasu 

Ocena hałasu za pomocą wielkości fizycznych nie 
pokrywa się z odczuciem subiektywnym przez człowie¬ 
ka. Stąd też wynika konieczność stosowania dwóch 
rodzajów kryteriów oceny hałasu: obiektywnej — po¬ 
legającej na pomiarze parametrów fizycznych hałasu, 
oraz subiektywnej — prowadzącej do oceny hałasu za 
pomocą jednej wielkości, która przy równoczesnym 
uwzględnieniu kilku czynników odzwierciedlałaby 
w przybliżeniu wrażenia psychoakustyczne. Kryteria 
subiektywne określa się przez uśrednienie wyników 
badań wielu ludzi. 

Podstawową wielkością określającą subiektywne 
odczucie dokuczliwości hałasu jest hałaśliwość wy¬ 
rażana w noysach. Zróżnicowanie odczucia stopnia 
hałasu przy różnych częstościach obrazują krzywe 
jednakowej hałaśliwości (rys. 3). Można z nich odczy¬ 
tać wartości natężenia dźwięku lub ciśnienia akustycz¬ 
nego, przy których hałasy o różnych częstościach są 
jednakowo dokuczliwe. 

Częściej stosowaną wielkością określającą su¬ 
biektywne odczucie dźwięków jest głośność. Zmiany 
w odczuciu głośności są proporcjonalne w przybli- 95-105 
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44 - Encyklopedia fizyki współczesnej 








A/ 

p 

H /f \ Ł 

w 

>eriodyczny 

Am 

|J Ur 

nie 

4,MUli|/ 

ItJWr * 

^periodyczny » 

i 

w iiiAJ, 

rlrfl " 

łacjonarny 

/ / U A Alm AM/ 

f |W 

/ nie 

4LiI Jul 

1 y /Ff w ™ v t 

stacjonarny 

h/W M/U JIM JmM w 

/JrP/p/ 

1 i 

V 

(W r JWf™ T 


przerywany 


Rys. 1. Rodzaje hałasu 




Rys. 2. Rodzaje widm częstości hałasu 


żeniu do ilorazu natężeń dźwięku, a nie do ich różnic, 
dlatego głośność wyraża się w skali logarytmicznej 
(tak jak i wielkości fizyczne — natężenie dźwięku 
i ciśnienie akustyczne; —► Przedmiot i zakres aku¬ 
styki). 

Poziom głośności dźwięku L s określony jest na¬ 
stępująco : 

Ls = 10 lg A 

ho 


gdzie I 8 i /,.— subiektywnie odczuwane natężenie 
dźwięku i subiektywnie odczuwana wartość progo¬ 
wa (granica słyszalności). Poziom głośności czys¬ 
tych tonów (dźwięków sinusoidalnych) lub dźwięków 
wąskopasmowych określa się w fonach za pomocą 



Rys. 3. Krzywe jednakowej hałaśliwości 



Rys. 4. Krzywe jednakowego poziomu głośności 


krzywych jednakowego poziomu głośności, tzw. krzy¬ 
wych izofonicznych (rys. 4). Interpretuje się je ^ w 
sposób analogiczny jak krzywe jednakowej hałaśli¬ 
wości. 

Do oceny hałasów niestacjonarnych lub przerywa¬ 
nych stosuje się pojęcie poziomu ekwiwalentnego 
wyrażonego zależnością: 


n 



100-110 


gdzie ti jest czasem oddziaływania hałasu o poziomie 
L{, T —całkowitym czasem oddziaływania hałasu, 
ą — współczynnikiem zależności od charakteru ha¬ 
łasu (ą = 3-4). Do pomiaru poziomu ekwiwalentnego 
używa się dozymetrów hałasu umożliwiających o- 
kreślenie czasu, po którym przekroczony jest poziom 
dopuszczalny. 
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Poziom głośności hałasu nazywany jest zazwyczaj 
poziomem hałasu. Metody pomiaru hałasu, które 
dawałyby wyniki odpowiadające jego odczuciu su¬ 
biektywnemu można podzielić na metody bezpo¬ 
średnie, polegające na stosowaniu przyrządu z wbudo¬ 
wanym układem korekcyjnym uwzględniającym wła¬ 
sności słuchu, oraz metody pośrednie polegające na 
pomiarze wielkości fizycznych z zastosowaniem od¬ 
powiedniej interpretacji wyników. 

W obu metodach podstawowymi elementami przy¬ 
rządu pomiarowego są: mikrofon, który daje na wyj¬ 
ściu wielkości elektryczne proporcjonalne do ciśnienia 
akustycznego, wzmacniacz, dzielnik zakresów wyce- 
chowany w decybelach oraz przyrząd wskazówkowy. 

Do określenia krzywych korekcyjnych dla metod 
bezpośrednich korzysta się z krzywych jednakowego 
poziomu głośności. Jak wynika z rys. 4 krzywe te 
nie przebiegają równolegle, co powoduje, że krzywe 
korekcyjne filtru uwzględniające zmiany czułości 
słuchu w funkcji częstości powinny mieć różny 
kształt przy różnych wartościach poziomu głośności. 
Dla uproszczenia stosuje się jedną uniwersalną krzy¬ 
wą korekcyjną, tzw, krzywą A (rys. 5). Zastosowanie 
w przyrządzie pomiarowym filtru korekcyjnego o po¬ 
wyższej charakterystyce powoduje mniejsze wzmoc¬ 
nienie w zakresie częstości niskich, a tym samym daje 
wynik pomiaru zbliżony do subiektywnej oceny po¬ 
ziomu głośności. Dla podkreślenia, że pomiar został 
wykonany przy użyciu filtru korekcyjnego A uzyskane 
wyniki podawane są w dB (A). Oprócz krzywej A sto¬ 
sowane są również inne krzywe korekcyjne, z których 
najnowsza jest krzywa D (rys. 5) uwzględniająca krzy¬ 
we jednakowej hałaśliwości. 



Rys: 5. Krzywe korekcyjne dla poziomów głośności hałasu 
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Najprostszą metodą pośrednią oceny hałasu jest 
metoda liczb W (rys. 6). Metoda ta wymaga zmierze¬ 
nia widma częstości hałasu, które przy zastosowaniu 
tej samej skali decybelowej nanosi się na krzywe N. 
Widmo częstości mierzy się w pasmach oktawowych, 
tzn. takich, których szerokość pasma przepuszczania 
filtru A~/ 2 wyrażona jest stosunkiem fjf t = 2, lub 
w pasmach 73-oktawowych, którym odpowiada sto¬ 
sunek częstości skrajnych filtru f x !f % = f/2. Pomiar 
polega na przełączaniu kolejnych filtrów i odczyty¬ 
waniu wartości poziomu ciśnienia akustycznego dla 
poszczególnych pasm częstości, reprezentowanych 
przez częstość zawartą w środku pasma. 

Liczbę N mierzonego hałasu wyznacza się z prze¬ 
cięcia jego widma częstości z najwyżej położną 
krzywą N. Przykład dwóch widm częstości naniesiony 
na rys. 6 wskazuje, że dla hałasu reprezentowanego 
przez widmo I (krzywa przerywana) otrzymamy liczbę 
N wynoszącą 95 dB (N 95). Dla hałasu reprezentowa¬ 
nego przez widmo II (krzywa ciągła) otrzymamy N 
100. Wynika stąd, że subiektywnie hałas II jest głoś¬ 
niejszy od hałasu I, mimo że maksymalna wartość 
poziomu ciśnienia akustycznego widma hałasu II 
jest o 11 dB niższa od wartości maksymalnej widma 
hałasu I. 



Rys. 6. Krzywe ;V oceny hałasu z naniesionymi z wiamami hała¬ 
sów I i II 


Podstawową zaletą skali dB(/4) jest prostota po¬ 
miaru. Z wyników pomiaru hałasu w dB(/4) nie wynika 
jednak, w jakim zakresie częstości hałas jest subiek¬ 
tywnie najgłośniejszy. Informacja ta, bardzo istotna 
dla wstępnej oceny metod zmniejszenia hałasu, za¬ 
warta jest pośrednio w liczbach N. Dlatego też skalę 
dB(^4) stosuje się powszechnie przy ocenie hałasu, 
natomiast skalę liczb N —przy opracowywaniu 
koncepcji wyboru metod zabezpieczeń przeciw- 
dźwięfcowych. Między poziomem hałasu L wyrażonym 
w dB (A) i wyrażonym w liczbach AT istnieje związek 

Ln x LdB(A) —5 dB. 

W celu uwzględnienia dodatkowych czynników, od 
których zależy subiektywne odczucie hałasu, do oceny 
hałasu w liczbach W stosuje się odpowiednie poprawki 
zestawione w tabeli. 

Osoby narażone na długotrwałe działanie hałasów 
są poddawane co jakiś czas kontrolom jakości słuchu. 


Poprawki AL do dopuszczalnych wartości liczb N oceny 
hałasu 


Warunki 

Poprawka AL 

Pora _ 

6-22 h 

0 

dnia 

22-6 h 

-10 

Czas działania hałasu 

powyżej 50% 

0 

(% doby) 

12-50% 

+ 5 


3-12% 

+ 12 
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Są to tzw. pomiary audiometryczne polegające na wy¬ 
znaczaniu różnicy między progiem słyszalności osoby 
badanej a uśrednionym progiem słyszalności ósób 
o normalnym słuchu. Sygnały testujące o różnych czę¬ 
stościach i różnych poziomach doprowadzane są za 
80-95 pomocą słuchawek osobno do ucha prawego i lewego. 

Zadaniem osoby badanej jest zasygnalizowanie mo¬ 
mentu usłyszenia dźwięku. Na rys. 7 pokazane są 
przykładowo trzy krzywe audiometryczne otrzymane 
po przebadaniu osób o normalnym słuchu (krzywa A) 
oraz o małym (krzywa B ) i dużym (krzywa Q uszko¬ 
dzeniu słuchu. Krzywe B i C obrazują najczęstsze 
przypadki uszkodzenia słuchu wywołanego działaniem 



Rys. 7. Przykłady krzywych audiometrycznych; A — osoby o nor¬ 
malnym słuchu, B — osoby o małym uszkodzeniu słuchu, C — 
osoby o dużym uszkodzeniu słuchu. L jest różnicą między pro¬ 
giem słyszalności osoby badanej a uśrednionym progiem słyszal¬ 
ności osób o normalnym słuchu 

hałasu. Jest to tzw. trauma, która objawia się selek¬ 
tywnym ubytkiem słuchu w zakresie częstości ok. 
4000 Hz. Ponieważ próg słyszalności osób zdrowych 
zmienia się z wiekiem, dlatego jako odniesienie przy 
pomiarach audiometrycznych stosowane są krzywe 
odpowiednio skorygowane do wieku osoby ba¬ 
danej. 

Jednym ze skutków ujemnego działania hałasu na 
człowieka jest utrudnienie zrozumiałości mowy ludz¬ 
kiej wpływające w zasadniczy sposób na ogranicze¬ 
nie możliwości porozumienia się, co w efekcie prowa¬ 
dzi do zmniejszenia wydajności pracy. 



Zrozumiałość mowy Z, wyrażona przez stosunek 
liczby jednostek fonetycznych odebranych prawidło¬ 
wo do całkowitej liczby jednostek ocenianych, zależy 
bardzo silnie od różnicy poziomu mowy L m i poziomu 
szumu Lsz , co ilustruje rys. 8. 
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Źródła hałasu 

Źródła hałasu można podzielić na dwie podstawo¬ 
we grupy: hałasy pochodzenia mechanicznego, wy¬ 
wołane drganiami mechanicznymi, i hałasy pocho¬ 
dzenia przepływowego (aerodynamiczne lub hydro¬ 
dynamiczne), wywołane nieregułarnościami przepły¬ 
wającej strugi. Nieregułarnościami tymi mogą być wiry 
powstające przy przepływie burzliwym (turbulent- 
nym) lub pulsacje ciśnienia występujące np. przy prze¬ 
pływach naddźwiękowych lub w procesie spalania. 

Przykładem hałasów pochodzenia mechanicznego 85-95 
może być stuk maszyny do pisania, skrzypienie drzwi, 
audycja z głośnika, przykładem hałasów przepływo¬ 
wych— syk pary, hałasy instalacji wodociągowych, 
odgłos strzału. W praktyce występują często hała¬ 
sy pochodzenia mieszanego, wywołane zarówno dzia¬ 
łaniem drgań mechanicznych jak i przepływem, np. 
hałas samochodu, odkurzacza czy piły tarczowej. 

W procesie powstawania hałasu dużą rolę odgry¬ 
wają układy rezonansowe, które w przypadku bezpo¬ 
średniego sprzężenia ze źródłem mogą — w zależnoś¬ 
ci od warunków współdziałania — siłnie wzmacniać 
lub tłumić składowe pewnych częstości odpowiadają¬ 
ce częstościom rezonansowym rezonatorów. W przy¬ 
padku wzmocnienia — powstają w widmie częstości 
wyraźne maksima, które spowodować mogą znaczny 
wzrost głośności hałasu. 

W zależności od źródła i wpływu układów rezo¬ 
nansowych widmo częstości hałasu może być różne. 

Widmo hałasu mechanicznego kształtowane jest 
przez charakter drgań elementów mechanicznych jak 
również przez warunki jego promieniowania, czyli 
zamiany energii mechanicznej na energię akustyczną. 

Ostrość występujących maksimów w widmie częstości 
zależy od stopnia tłumienia układów rezonansowych. 

Im tłumienie jest większe, tym maksima mniej ostre. 

Gdy przepływ strugi odbywa się w warunkach ruchu 
turbulentnego (przy przekroczeniu liczby Reynoldsa), 
wytwarzany hałas ma charakter szumu, czyli nie wy¬ 
kazuje wyraźnych maksimów w widmie częstości. Jed¬ 
nak w widmie częstości hałasu aerodynamicznego wy¬ 
stępują często ostre maksima, wywołane bądź włas¬ 
nościami rezonansowymi układu przepływowego (re¬ 
zonans rur i komór), bądź wzajemnym oddziaływa¬ 
niem pola aerodynamicznego z polem akustycznym. 
Oddziaływanie to prowadzi do akustycznego sprzęże¬ 
nia zwrotnego, które przy zgodności faz powoduje 
tworzenie się regularnych wirów, będących źródłem 
hałasu o odpowiedniej częstości. Jednym z częściej 
występujących wypadków generacji tego typu hałasu 
jest przepływ powietrza w rurociągu, wewnątrz któ¬ 
rego znajduje się ostrze. Wówczas na tle szumu wy¬ 
nikającego z przepływu pojawia się wyraźne mak¬ 
simum, którego częstość można wyliczyć ze wzoru 



gdzie Sh jest liczbą Strouhala, która dla prędkości 
przepływu v p < 50 m/s zawiera się w granicach 0,15- 
0,3, zaś a — wymiarem poprzecznym przeszkody. 

Ostre maksima w widmie częstości występują tak¬ 
że przy wpływie z przewodu, gdy wypływający gaz 
gwałtownie się rozpręża. Powstaje wówczas struktu¬ 
ra komórkowa strumienia na zewnątrz przewodu (H. 
179, tabl. 46), która powoduje generację hałasu z wy¬ 
raźnym maksimum przy jednej częstości wyrażonej 
zależnością: c 

V ~~ 2>d\/p-pk 9 

gdzie c jest prędkością rozchodzenia się dźwięku, 
d — średnicą wylotu rurociągu, p — stosunkiem 
ciśnienia występującego przy wylocie rurociągu do 
ciśnienia panującego na zewnątrz, pic = 1,89 jest 
wartością krytyczną tego stosunku, przy której dla 
powietrza w temperaturze 20°C prędkość przepływu 
równa jest prędkości rozchodzenia się dźwięku. 
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Hałas, jak każdy dźwięk, rozchodzi się w ośrod¬ 
kach płynnych (w gazach i cieczach) w postaci fal 
podłużnych oraz w ciałach stałych w postaci fal 
podłużnych lub poprzecznych. Hałasy rozchodzące 
się w ciałach stałych zwane dźwiękami materiałowy¬ 
mi przenoszą się dość łatwo przez sztywne konstruk¬ 
cje i w efekcie zmniejszają skuteczność działania 
przegród ograniczających propagację dźwięków po¬ 
wietrznych. Przykładem wpływu propagacji dźwięków 
materiałowych jest przenoszenie się drgań silników 
od wind przez konstrukcję budynku, przenoszenie się 
drgań silnika autobusu przez karoserię. Ponieważ 
tłumienie dźwięków materiałowych wzrasta propor¬ 
cjonalnie do częstości, największy ich wpływ występuje 
w zakresie częstości niskich, a szczególnie infra¬ 
dźwięków. 


Środowisko akustyczne 
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W zależności od warunków w jakich przebywa czło¬ 
wiek narażony na działanie hałasu, hałasy dzieli się 
na: przemysłowe,komunikacyjne i mieszkaniowe. Po¬ 
ziomy hałasów wytwarzanych przez niektóre urządze¬ 
nia przemysłowe i przez środki komunikacji oraz po¬ 
ziomy hałasów mieszkaniowych zaznaczone są (w 
decybelach) przy odpowiednich rysuneczkach na mar¬ 
ginesach. 

Część społeczeństwa narażona jest w sposób sy¬ 
stematyczny w warunkach pracy na działanie hałasów 
przemysłowych; charakteryzuje je na ogół duże natę¬ 
żenie i długotrwałe działanie. Są one często przy¬ 
czyną trwałych ubytków słuchu i poważnych schorzeń. 
Na podstawie badań przyjęto, że największą dopusz¬ 
czalną wartością poziomu hałasu stacjonarnego dzia¬ 
łającego na człowieka w sposób długotrwały jest 90 
dB(/0 lub N 85. Poziom hałasów trwających krócej 
może przykraczać te wartości (rys. 9). 



Rys. 9. Zależność dopuszczalnych wartości poziomów hałasu od 
czasu jego trwania 
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Obecnie, coraz większy problem stanowią hałasy 
komunikacyjne, gdyż działają na ludność w sposób 
masowy. Do hałasów komunikacyjnych należą ha¬ 
łasy wewnętrzne — działające na obsługę pojazdu i pa¬ 
sażerów, i hałasy zewnętrzne, szczególnie uciążliwe 
w aglomeracjach miejskich. 

Bardzo uciążliwe są hałasy odczuwane w mieszka¬ 
niach, zakłócające spokojny tryb życia mieszkańców 
zarówno w dzień jak i w nocy. Poziom hałasów miesz¬ 
kaniowych nie powinien przekraczać w dzień 40 
dB(/4), natomiast w nocy 30 dB(/4). W pewnych sy¬ 
tuacjach dopuszcza się poziom o 5 dB wyższy. 

Głównymi źródłami hałasów mieszkaniowych są ha¬ 
łasy komunikacyjne, hałasy przemysłowe oraz hałasy 
wewnątrzbudynkowe (hałasy instalacji wodnej i cen¬ 
tralnego ogrzewania, windy, zsypu na śmieci, hała¬ 
sy pochodzące od sąsiadów i punktów usługowych jak 
warsztaty, restauracje, sklepy). 


Tłumienie hałasu 

Zmniejszenie hałasu oddziałującego na aparat słucho¬ 
wy człowieka można uzyskać następującymi sposoba¬ 
mi: ograniczając generacje hałasu, ograniczając pro¬ 


pagacje hałasu, stosując indywidualne zabezpieczenia 
aparatu słuchowego. 

Ograniczenie generacji hałasu uzyskuje się dzię¬ 
ki konstruowaniu urządzeń cichobieżnych, co stano¬ 
wi najbardziej skuteczny sposób zmniejszenia od¬ 
działywania hałasu na człowieka. 

Zmniejszenie hałasu mechanicznego uzyskuje się 
dzięki odpowiednim konstrukcjom i tolerancji wyko¬ 
nania. Ponadto hałas zmniejsza się ograniczając po¬ 
wierzchnie promieniujące fale akustyczne, stosując ma¬ 
teriały o dużym tłumieniu wewnętrznym, w celu ogra¬ 
niczenia przenoszenia się dźwięków materiałowych 
oraz dąży się do zmniejszenia ujemnego wpływu rezo¬ 
nansów. 

Zmniejszenie hałasu aerodynamicznego można 
uzyskać przez zmniejszenie prędkości przepływu oraz 
ograniczenie dużych zmian ciśnienia. Wymagania te 
prowadzą jednak często do zmniejszenia sprawności 
urządzeń przepływowych, co ogranicza ich stosowa¬ 
nie. Dlatego też stosuje się również inne środki pole¬ 
gające na doborze kształtu elementów wirujących 
i kanałów przepływowych, a przede wszystkim na uni¬ 
kaniu ostrych krawędzi i załamań. Przez dobór odpo¬ 
wiedniego kształtu urządzenia lub jego elementów 
można uzyskać ograniczenie wpływu częstości rezo¬ 
nansowych jak również zmniejszenie skuteczności pro¬ 
mieniowania hałasu. 

W celu ograniczenia propagacji hałasu stosuje się 
przegrody przeciwdźwiękowe. W przemyśle są to 
zazwyczaj ekrany, obudowy maszyn i urządzeń lub ka¬ 
biny przeciwdźwiękowe dla personelu. W budownic¬ 
twie przegrodami izolacyjnymi są ściany, stropy, okna 
i drzwi. Przegrody izolacyjne muszą zapewniać od¬ 
powiednią izolacyjność dla dźwięków powietrznych 
i dla dźwięków materiałowych. 

Izolacyjność dla dźwięków powietrznych przegród 
jednorodnych wyrażona w decybelach jest proporcjo¬ 
nalna do częstości, a także do masy przegrody na 
jednostkę powierzchni. Stawia to wymagania stoso¬ 
wania przegród ciężkich. Lekkie konstrukcje o dobrych 
własnościach izolacyjnych można uzyskać stosując 
przegrody wielowarstwowe. 

W celu polepszenia izolacyjności dla dźwięków ma¬ 
teriałowych unika się sztywnych połączeń konstruk¬ 
cyjnych, które tworzą tzw. mostki akustyczne. W tym 
celu maszyny i urządzenia instaluje się na podkła¬ 
dach antywibracyjnych lub amortyzatorach. W bu¬ 
downictwie stosowane są specjalne konstrukcje, 
wśród których bardzo dobre własności wykazują tzw. 
pływające podłogi. 

Ograniczenie propagacji hałasu uzyskuje się rów¬ 
nież stosując ekrany przeciwdźwiękowe. Ekranem na¬ 
zywamy umieszczoną na drodze fali cienką przeszko- 
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Rys. 10. Ekran przeciwdźwiękowy zastosowany na szosie w Szwaj¬ 
carii 
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dę o wymiarach większych od długości fali, za którą 
powstaje cień akustyczny. Efektywność cienia aku¬ 
stycznego jest zmniejszona wskutek ugięcia fal, 
które docierają za przeszkodę. Wielkością charakte¬ 
ryzującą działanie ekranu jest jego efektywność wy¬ 
rażona zależnością: 

IL = 10 Ig (EJ Eu) dB, 

gdzie E u jest energią akustyczną docierającą do wy¬ 
branego punktu położonego za ekranem po jego za¬ 
instalowaniu, E 0 — energią docierającą do tego sa¬ 
mego punktu przed zainstalowaniem ekranu. Ponie¬ 
waż skuteczność IL ekranu wyrażona w decybelach 
jest proporcjonalna do częstości, działanie ekranów 
jest tym skuteczniejsze, im wyższa jest częstość fal 
akustycznych. 

Ekrany są stosowane w halach przemysłowych 
w pobliżu źródeł dźwięku lub w pobliżu stanowisk 
pracy, a także w pobliżu tras komunikacyjnych w 
celu zmniejszenia poziomu hałasu docierającego do 
budynków (rys. 13). Efektywność działania jest rzę¬ 
du 5-15 dB. 

W przestrzeni ograniczonej lub w pomieszczeniach 
zamkniętych fale akustyczne trafiające na powierzch¬ 
nie ograniczające odbijają się powiększając tym samym 
energię akustyczną we wnętrzu. Według teorii po¬ 


głosowej Sabine’a natężenie dźwięku fal odbitych 
w pomieszczeniu wyrażone jest zależnością: 


1 = 


4 W 

CtśrS 


(1 -aśr). 


gdzie «śr jest średnim współczynnikiem pochłaniania 
powierzchni ograniczającej pomieszczenie, V —jego 
objętością, S — całkowitym polem powierzchni o- 
graniczających. W celu obniżenia wpływu fal odbitych 
wprowadza się do pomieszczenia materiały dźwięko¬ 
chłonne, które powiększają wartości aś r . Materiały 
te bywają mocowane na suficie i na ścianach lub za¬ 
wieszane w postaci tzw. pochłaniaczy przestrzennych. 
W praktyce powyższą metodą uzyskuje się obniżenie 
poziomu hałasu o 5-10 dB. 

Gdy nie jest możliwe dostateczne obniżenie hałasu 
przez ograniczenie jego generacji i propagacji, za¬ 
chodzi konieczność chronienia słuchu przez stoso¬ 
wanie indywidualnych wkładek do uszu lub stosowa¬ 
nie słuchawek przeciwdźwiękowych. Urządzenia te 
wykazują lepsze własności dla zakresu częstości wy¬ 
sokich, przy których mogą obniżać poziom hałasu 
działającego na aparat słuchowy człowieka w grani¬ 
cach 20-30 dB. Należy jednak pamiętać, że hałas 
szczególnie w zakresie niskich częstości, oddziałuje 
na cały organizm, w związku z tym stosowanie za¬ 
bezpieczeń indywidualnych jest tylko półśrodkiem. 
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Przedmiot i problemy biofizyki 
molekularnej 

Kazimierz Wierzchowski 


Szybki rozwój nauk przyrodniczych w minionym 
ćwierćwieczu doprowadził do uformowania się mole¬ 
kularnego nurtu badań w biologii (biologia moleku¬ 
larna), wyłaniając w naturalny sposób pytanie, czy 
fizyka jako nauka o formach materii, ich ruchu i wza¬ 
jemnym oddziaływaniu może również wyjaśnić wła¬ 
ściwości biologicznej formy istnienia materii i tym 
samym przyczynić się do wyjaśnienia zjawiska życia. 
Opis budowy i organizacji procesów życiowych ko¬ 
mórki (-► Organizacja procesów życiowych komór¬ 
ki), stworzony przez nauki biologiczne pokazuje, że 
forma, w jakiej występuje materia w układach biolo¬ 
gicznych, radykalnie różni się wieloma swoistymi 
cechami od form materii nieożywionej. 

Z punktu widzenia budowy chemicznej komórka 
jest wysoce niejednorodnym układem złożonym 
z kwazikrystalicznych ciał zbudo wanych z liniowych 
makrocząsteczek organicznych oraz z cieczy stano¬ 
wiącej roztwór wodny związków organicznych i nie¬ 
organicznych. W układzie tym zachodzą zorganizo¬ 
wane w przestrzeni i czasie setki reakcji chemicznych, 
katalizowanych swoiście przez zespoły katalizato¬ 
rów — białek enzymatycznych. Ich ostatecznym wy¬ 
nikiem jest cykliczna reprodukcja całego układu wg 
własnego planu genetycznego zakodowanego w struk¬ 
turze DNA. Procesy te mogą przebiegać tylko w wa- 
b komórka runkach ciągłej wymiany materii i energii z otocze- 
jako układ niem. Komórka jest więc — z termodynamicznego 
otwarty punktu widzenia — układem otwartym, przy tym 
samosterowanym i samoreprodukującym się. Pewne 
odchylenia od planu genetycznego spowodowane 
spontanicznymi fluktuacjami regulacji aparatu ge¬ 
netycznego lub jego uszkodzeniami przez czynniki 
zewnętrzne mogą prowadzić do pojawienia się ko¬ 
mórek o zmienionych nieco właściwościach (mutan¬ 
ty). Lepsze przystosowanie mutantów do warunków 
środowiska może z kolei być przyczyną dodatniej 
selekcji wyróżniających je cech w populacji. Istotną 
cechą elementarnej formy istnienia materii ożywionej, 
jaką jest komórka biologiczna, jest więc również 
zdolność do ewolucji. 

Z fizycznego punktu widzenia komórka stanowi 
zatem układ otwarty złożony z dużej liczby wzajem¬ 
nie oddziałujących różnych klas elementów, spośród 
których wiele reprezentowanych jest przez stosunko¬ 
wo małą ich liczbę. Oddziaływanie elementów zbio¬ 
ru prowadzi do ich uporządkowania, tj. do organi¬ 


zacji w przestrzeni i czasie. Zachowanie się takiego 
układu niewątpliwie podlega prawom dynamiki. 

Fizyka nie dysponuje dotychczas metodami pozwala¬ 
jącymi na ilościowy (matematyczny) opis zachowania 
się takich układów i na przewidywanie właściwości 
makroskopowych układu oparte na znajomości jego 
budowy mikroskopowej. Uważa się, że jedynie na 
gruncie termodynamiki procesów nieodwracalnych, 
rozpatrującej zachowanie się układów otwartych 
w stanie odbiegającym od stanu równowagi, można 
przewidywać warunki powstania organizacji czaso- 
wo-przestrzennej reagujących ze sobą chemicznie 
cząsteczek, a więc uzyskiwać pewien wgląd w po¬ 
wiązania molekularnego i makroskopowego poziomu 
organizacji układów i mechanizm ewolucji makro¬ 
cząsteczkowych układów chemicznych w samorepro- 
dukujące się układy prekomórkowe. Wskazują na to 
teoretyczne badania M. Eigena oraz I. Prigogine’a, 
wyróżnione nagrodą Nobla (1977 r.) 

W ogólnym opisie budowy molekularnej i funkcjo¬ 
nowania komórki stworzonym przez nauki biolo¬ 
giczne, cechy samosterowności, samoreprodukcji 
i zdolności do ewolucji związane są w dużym stopniu 
z właściwościami chemicznymi i fizycznymi kilku klas 
liniowych polimerów stanowiących podstawowe 
elementy budowy komórek: białek, kwasów nuklei¬ 
nowych, fosfolipidów i polisacharydów. W środowisku 
wodnym cząsteczki ich mają zdolność do samoorga¬ 
nizacji w uporządkowane przestrzennie formy konfor- 
macyjne i supercząsteczkowe układy zw. organellami organelle 
komórkowymi oraz do specyficznych oddziaływań komórkowe 
fizycznych ze związkami nieorganicznymi i organi¬ 
cznymi uczestniczącymi pośrednio lub bezpośrednio 
w reakcjach biochemicznych. 

Wyjaśnienie tych szczególnych właściwości biopo¬ 
limerów z punktu widzenia ich budowy chemicznej 
stanowi niewątpliwie klucz do poznania molekular¬ 
nych mechanizmów procesów komórkowych prze¬ 
biegających przy ich udziale. Dzięki metodom fizycz¬ 
nym możliwy był szybki rozwój biologii molekular¬ 
nej : wyjaśnienie na początku lat 50-ych zasady prze¬ 
strzennej organizacji białek (L. Pauling, nagroda 
Nobla w 1954 r.) i DNA (F. Crick, i J. Watson, na¬ 
groda Nobla 1962 r.). Fizyka w coraz większym stop¬ 
niu uczestniczy w badaniach z tego zakresu. W ten 
sposób wyodrębnia się i kształtuje biofizyka moleku- biofizyka 
lama, nauka opisująca doświadczalnie i teoretycznie molekularna 
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strukturę i właściwości makrocząsteczek biopolime¬ 
rów w nieuporządkowanym i w różnych uporządko¬ 
wanych konformacyjnie stanach termodynamicznych, 
przejścia między stanami, wzajemne oddziaływania 
i oddziaływania z małocząsteczkowymi składnikami 
środowiska wodnego komórki oraz organizację 
w supercząsteczkowe organelle komórkowe. Na tej 
podstawie poszukuje się wyjaśnienia elementarnych 
mechanizmów funkcji spełnianych przez biopolimery 
oraz procesów ich regulacji. 

W dalszym ciągu artykułu przedstawimy podsta¬ 
wowe zagadnienia i problemy badawcze tak rozumia¬ 
nej biofizyki molekularnej. 


Stan nieuporządkowany 
makrocząsteczek w roztworach 


zmiany długości wiązań i wielkości kątów między ni- konfiguracja 
mi (kątów torsyjnych). Drgania skrętne wywołujące i konformacja 
zmianę względnego położenia grup atomów połączo¬ 
nych wiązaniem pojedynczym, czyli zmianę konfor¬ 
macji cząsteczki, przedstawia się jako zmiany kąta 
torsyjnego (inaczej kąta dwuściennego, wewnętrznej 
rotacji, konformacyjnego). Nie zachodzą one swobod¬ 
nie, ponieważ między nie związanymi bezpośrednio 
atomami obu grup występują oddziaływania typu van 
der Waalsa i oddziaływanie elektrostatyczne, których 
charakter (przyciągające lub odpychające) i energia 
zależy od efektywnego promienia, odległości i rodzaju 
atomów. W rezultacie cząsteczka może przyjmować 
izomeryczne postacie przestrzenne (konformacje) od¬ 
powiadające minimom funkcji energii opisującej ob¬ 
rót. Izomerię rotacyjną najprostszych cząsteczek wę¬ 
glowodorów: etanu i n-butanu ilustruje rys. 1. Jeżeli 
energie poszczególnych trwałych izomerów są takie 


Stan nieuporządkowany makrocząsteczek w roztwo¬ 
rach cechuje zdolność zmian organizacji przestrzen¬ 
nej tworzących je łańcuchów pod wpływem czynni¬ 
ków zmieniających ich energię wewnętrzną. Makro¬ 
skopowe cechy ich budowy: wielkość i kształt, są 
więc miarą tej organizacji oraz zachodzących w niej 
zmian pod wpływem czynników zewnętrznych. 


Badania kształtu makrocząsteczek 

Informacji o wielkości i kształcie makrocząsteczek 
w roztworach dostarczają: badania makroskopowych 
badania właściwości roztworów, zależnych od parametrów 
roztworów budowy znajdujących się w nich cząsteczek, np. bada¬ 
nie lepkości lub ciśnienia osmotycznego; bezpośred¬ 
nie pomiary wielkości charakteryzujących procesy 
transportu cząsteczek: swobodną dyfuzję i sedymen¬ 
tację w polu sił odśrodkowych; badania rozpraszania 
światła w szerokim zakresie kątów obserwacji oraz 
rozpraszania promieniowania rentgenowskiego pod 
małymi kątami. Zależność mierzonych wielkości 
od parametrów kształtu makrocząsteczek jest na 
ogół bardzo złożona. W rezultacie opisujące te za¬ 
leżności funkcje można otrzymać w postaci analitycz¬ 
nej tylko dla uproszczonych modeli cząsteczek. Naj¬ 
częściej stosowane przybliżenia sprowadzają kształt 
makrocząsteczek do sferoid o różnych promieniach 
obrotu i stosunkach osi, jak kula, elipsoidy obrotowe 
o różnym stosunku osi oraz sferoidy o trzech różnych 
osiach. 

Kształt makrocząsteczek łańcuchowych w roztwo¬ 
rach, w warunkach, w których nie przyjmują one 
rozmiary uporządkowanych konformacji, jest zbliżony do bez- 
kłębka ładnie zwiniętego kłębka nici. Rozmiary jego zależą 
od budowy chemicznej polimeru, rodzaju rozpusz¬ 
czalnika i temperatury. W roztworach wodnych poli¬ 
merów biologicznych, takich jak białka i kwasy nu¬ 
kleinowe, które mają budowę polielektrolitów, roz¬ 
miary cząsteczek zależą również od stężenia jonów 
wodorowych i stężenia elektrolitu (od siły jonowej 
roztworu). Badania zmian rozmiarów kłębka w zależ¬ 
ności od tych czynników wskazują na jego luźną or¬ 
ganizację i dużą giętkość łańcucha. 


Giętkość łańcuchów polimerów liniowych 

Giętkość liniowych cząsteczek polimerów wynika 
z ich budowy chemicznej, umożliwiającej przyjmowa¬ 
nie przez nie wielu różniących się geometrią form 
izomerycznych (giętkość termodynamiczna), które 
mogą przechodzić szybko jedna w drugą pod wpły¬ 
wem drgań cieplnych (giętkość kinetyczna). Cząstecz¬ 
ka chemiczna nie jest układem sztywnym. Zachodzą 
w niej różnego rodzaju drgania atomów lub grup 
atomów bez zmiany jej zasadniczej budowy elektro¬ 
nowej, tzn. konfiguracji. Towarzyszą im niewielkie 
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Rys. !. Izomery rotacyjne: a) Względne położenie wiązań C—H 
obu grup CH* etanu CH*—CH, (rzut na płaszczyznę prostopadłą 
do wiązania C—Q w izomerach trans ( I), cis (//) i skręconym 
(///); cząsteczka etanu posiada trójkrotną oś symetrii wzdłuż 
wiązania C—C, tak więc pełny obrót grupy CH* generuje na 
przemian trzy izomery trans o najniższej energii oraz trzy izo¬ 
mery cis o najwyższej energii, b) Funkcja potencjalna opisująca 
obrót ma postać U = l /tU 0 (1—cos 3 <p), gdzie C/ 0 jest to bez¬ 
względna wysokość bariery energetycznej oddzielającej stany 
trans. Dla etanu wysokość bariery między izomerami cis i trans 
wynosi 12 kJ/mol. c) Izomeria rotacyjna n-butanu; wysokość 
bariery między izomerami trans i skręconym wynosi 3,7 kJ/mol. 
Grupa CH, oznaczona jest na rzucie kropką 


same (jak w przypadku etanu), występują one oczy¬ 
wiście z jednakowym prawdopodobieństwem. W przy¬ 
padku w-butanu energie izomerów trans i skręconego 
są różne i ich udział w populacji cząsteczek określony 
jest różnicą ich energii AE. Wysokość bariery energe¬ 
tycznej AE oddzielającej sąsiadujące stany konforma- 
cyjne determinuje szybkość procesu zmiany konfor¬ 
macji. 

W wypadku obrotów wokół pojedynczych wiązań 
AE jest rzędu kilkunastu J/mol. Wówczas zgodnie 
z przewidywaniami teorii reakcji chemicznych czas izomery 
trwania procesu zmiany konformacji jest rzędu 10“ 10 s. geometrycz- 
Podobnie drgania skrętne polimeru liniowego wywo- ne 
łują izomeryzację geometryczną jego łańcucha. Ze 
względu na dużą liczbę rotacyjnych stopni swobody 
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łańcuch główny polimeru może przyjąć ogromną licz¬ 
bę różnych przypadkowych ułożeń w przestrzeni od¬ 
powiadających różnym jego izomerom geometrycz¬ 
nym (konformerom), z których żaden nie jest szcze¬ 
gólnie uprzywilejowany. Na przykład cząsteczka poli¬ 
etylenu CH 3 (CH 2 ) n CH 3 złożona z n = 100 merów ma 
3 100 możliwych izomerów geometrycznych, ponieważ 
obrót wokół każdego z wiązań C—C prowadzi do 
powstania trzech izomerów. Oczywiście w wypadku 
makrocząsteczek białek (—► Białka) czy kwasów nukle¬ 
inowych (-> Kwasy nukleinowe), o bardziej złożonej 
budowie niż polietylen, liczba wiązań przypadających 
na jedno ogniwo łańcucha, wokół których mogą 
występować obroty, jest znacznie większa. Reszta 
peptydowa może przyjmować w zależności od budowy 
chemicznej do 30, a reszta nukleotydowa — aż do 
200 różnych izomerycznych konformacji. Zwiększa to 
radykalnie liczbę teoretycznie możliwych form izo¬ 
merycznych łańcucha w porównaniu z polimerami 
syntetycznymi o prostej na ogół budowie chemicznej. 
Formy te różnią się jednak znacznie energią, tak 
że tylko niektóre z nich realizują się w normalnych 
warunkach w roztworach wodnych polipeptydów i po- 
linukleotydów. 


Statystyczny opis kształtu makrocząsteczek 

Rozróżnienie tak dużej liczby izomerów makro¬ 
cząsteczek metodami doświadczalnymi nie jest możli¬ 
we. Pozwalają one tylko na określenie średniego 
kształtu cząsteczki. Zatem opis właściwości konforma- 
cyjnych nieuporządkowanych polimerów liniowych 
wymaga zastosowania metod statystycznych. Roz¬ 
ważenie procesu izomeryzacji polietylenu (rys. 2) 
wyjaśnia dążność cząsteczki do zwijania się w tzw. 
kłębek statystyczny. W roztworze pod wpływem sił 
osmozy kłębek ulega rozwinięciu w stosunku do 
stanu, jaki osiągnąłby w próżni. Miarą stopnia roz¬ 
winięcia kłębka, a więc jego rozmiarów, może być 
średnia odległość h między końcami zwiniętego łań¬ 
cucha, tj. między pierwszym i ostatnim jego atomem. 
W statystycznej teorii izomerii geometrycznej poli¬ 
merów jest ona określona za pomocą funkcji roz¬ 
kładu W(h)dh t równej prawdopodobieństwu znale¬ 
zienia odległości między końcami łańcucha w prze- 

00 

dziale h i h + dh; oczywiście jW(Ji)dh = 1. Sredn 

o 

kwadrat odległości h y równy iloczynowi liczby ogniw 
łańcucha n i kwadratu długości b ogniwa: < h z ) = 
= nb z y jest proporcjonalny do wyznaczonego doś¬ 
wiadczalnie (np. na podstawie pomiaru lepkości lub 
badania rozproszenia światła) średniego kwadratu 
promienia obrotu całej cząsteczki. W wypadku „ideal¬ 
nego” polimeru, mającego swobodę obrotów (tzn. 
obroty mogą występować bez zmian energii) funkcja 
W(h) ma postać zbliżoną do funkcji Gaussa. Rozkład 
ogniw jego łańcucha jest początkowo sferycznie sy¬ 
metryczny, jednakże bardzo szybko przyjmuje po¬ 
stać zbliżoną do sferoidy o trzech różnych osiach 
bezwładności. 

W polimerach rzeczywistych obroty są oczywiście 
zahamowane przez oddziaływania wewnątrzcząstecz- 
kowe. Oddziaływania te są również przyczyną korela¬ 
cji kątów rotacyjnych sąsiadujących i blisko położo¬ 
nych ogniw, czyli mają charakter oddziaływań koope¬ 
ratywnych. W zwiniętej nici polimeru występują także 
oddziaływania dalekiego zasięgu między ogniwami 
odległych części łańcucha. W rezultacie część prze¬ 
strzeni w obrębie kłębka zajęta przez dane ogniwo 
jest niedostępna dla pozostałych ogniw łańcucha. 
Jest to tzw. objętość wyłączona, zwiększająca oczy¬ 
wiście rozmiary rzeczywistego kłębka w stosunku do 
kłębka „idealnego”. W polielektrolitach odpychanie 
elektrostatyczne ładunków jednoimiennych wywołuje 
dodatkowe zwiększenie objętości kłębka. Uwzględnie¬ 
nie w funkcji W(H) tych czynników jest konieczne 
do poprawnego opisu jego konformacji. 


Zaproponowanie fizycznego modelu zachowania 
się rzeczywistego polimeru wymaga oczywiście zna¬ 
jomości geometrii budowy jego ogniw (długości 
wiązań, kątów walencyjnych), a także znajomości 
energii potencjalnej jako funkcji obrotów ogniw 
wokół łączących je wiązań oraz energii oddziaływań 
elektrostatycznych zarówno wewnątrz łańcucha, jak 
i z otaczającymi go jonami elektrolitu obecnego w roz¬ 
tworze. Parametry geometrii ogniw łańcucha określa 
się na podstawie wartości odpowiednich parametrów 
cząsteczek monomerów lub ich analogów, wyznacza¬ 
nych w kryształach tych związków metodą rentgeno- 
grafii strukturalnej. Zakres zmienności kątów rota¬ 
cyjnych w pobliżu ich najbardziej prawdopodobnych 
wartości, względne energie poszczególnych konfor¬ 
macji oraz bariery energetyczne obrotów określa się 
badając zależne od konformacji właściwości spek¬ 
troskopowe takich modelowych cząsteczek w funkcji 
temperatury. 

Można je również oszacować teoretycznie oblicza¬ 
jąc energie całkowite różnych konformacji obracające¬ 
go się ogniwa polimeru przy użyciu półempirycznych 
metod mechaniki kwantowej (-► Chemia kwantowa). 
Punktem wyjściowym do obliczenia energii oddziały¬ 
wań elektrostatycznych wewnątrz łańcucha oraz od¬ 
działywań z chmurą otaczających go w roztworze ła¬ 
dunków jest teoria elektrolitów Debye*a-Huckla, 




Rys. 2. Izomeryzacja rotacyjna polietylenu CH 3 (CH s ) n CH,: 
a) rotacja wokćł wiązania —C< 3 > kolejnego wiązania CW— 

—C<*>; przy ustalonym położeniu wiązań —CW i CW—C( 3 > 

trzecie wiązanie CW—O 4 * może przyjąć dowolne położenie na 
powierzchni stożka o kącie rozwarcia 29 (n—O — kąt walencyjny 
między wiązaniami C—C bliski tetraedryczpemu, tj. 109°28'). 
Czwarte z kolei wiązanie O 4 *—może przyjąć dowolne poło¬ 
żenie na powierzchni stożków opisanych wokół każdego z poło¬ 
żeń wiązania trzeciego. Tak więc w miarę oddalania się wiązań 
wzdłuż łańcucha polietylenu rośnie dowolność orientacji jego 
wiązań w przestrzeni. Liniowy łańcuch dąży do przyjęcia postaci 
kłębka statystycznego, bezładnie zwiniętego (zobacz rys. b), które¬ 
go rozmiary można wyrazić za pomocą odległości h między jego 
końcami 


model 

budowy 

polimeru 


polietylen — 
przykład 
izomeryzacji 
rotacyjnej 
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oparta na liniowym przybliżeniu rozkładu gęstości ła- 
ładunku. Gęstość powierzchniowa ładunku elektro¬ 
statycznego na cząsteczkach silnie zjonizowanych po- 
1 {elektrolitów jest jednak często tak duża, że wystę¬ 
pują efekty nieliniowe, których uwzględnienie jest 
bardzo trudne. Teoria roztworów wodnych stężonych 
elektrolitów i polielektrolitów nie jest jeszcze dosta¬ 
tecznie rozwinięta. 

teoria Dotychczas opracowano kilka statystyczno-termo- 
F lory'ego dynamicznych i statystyczno-mechanicznych teorii 
właściw-ości nieuporządkowanych makrocząsteczek 
w roztworach rozcieńczonych (w roztworach rozcień¬ 
czonych można pominąć oddziaływania międzyczą- 
steczkowe) — interpretują one poprawnie wyniki ba¬ 
dań doświadczalnych. 

Bardzo wiele wniosły badania P. J. Flory ł ego wyróż¬ 
nione w 1974 r. nagrodą Nobla. W teorii Flory’ego 
przyjmuje się, że łańcuch rzeczywistego polimeru jest 
złożony z segmentów o wirtualnej długości /, obejmu¬ 
jących dwa lub więcej sąsiadujących ogniw, między 
którymi zachodzą oddziaływania kooperatywne. 
Względne obroty tak zdefiniowanych N segmentów 
traktuje się jako swobodne, czyli średni kwadrat odle¬ 
głości h równa się: 

<* 2 > = a *M 2 . 

Współczynnik a w tym wyrażeniu opisuje efekt obję¬ 
tości wyłącznej. W odpowiednio dobranym rozpu¬ 
szczalniku, sprzyjającym wystąpieniu oddziaływań da¬ 
lekiego zasięgu, i w odpowiedniej temperaturze wzmo¬ 
żone oddziaływania wewnątrzcząsteczkowe kompen¬ 
sują efekt objętości wyłączonej. W warunkach tych, 
w tzw. punkcie 0, współczynnik a jest równy. Inny¬ 
mi słowy, drugi współczynnik wirialny ciśnienia osmo- 
tycznego jest wówczas równy zeru, roztwór zacho¬ 
wuje się jak roztwór idealny i ciśnienie osmotyczne 
jest opisywane przez równanie Van’t Hoffa. Wystę¬ 
puje więc tutaj analogia do punktu Boyle’a dla ga¬ 
zów rzeczywistych. Wyniki teoretycznych obliczeń na¬ 
leży zatem porównywać z wynikami doświadczalny¬ 
mi otrzymanymi w punkcie 0. Teoretyczne oblicze¬ 
nie współczynnika a jest bardzo trudne. Przybliżone 
metody jego wyznaczania pozwalają na sprowadzenie 
wyników otrzymanych dla roztworów nieidealnych 
do warunków w punkcie d. 

przejście Podstawowym problemem fizyki roztworów biopo- 
cząsteczek w Umerów jest wyjaśnienie, w jaki sposób ich cząstecz- 
konformacje ki przechodzą ze stanu kłębka statystycznego w wy- 
kwazikrysta- soce uporządkowane kw'azikrystaliczne konformacje 

liczne właściwe ich funkcjonalnemu stanowi in vivo. Do¬ 
tyczy to zarówno układów in \itro jak i przebiegu 
tego procesu w komórce równolegle z syntezą łań¬ 
cuchów. Cząsteczki w postaci kłębka statystycznego 
nie mogą krystalizować. Muszą przyjąć przedtem 
jedną z dostępnych im s n konformacji o najniższej 
w danych warunkach energii swobodnej (s — liczba 
możliwych izomerów geometrycznych pojedynczego 
ogniwa, n — liczba ogniw). Osiągnięcie przez którąś 
z cząsteczek w roztworze w sposób przypadkowy 
konformacji zbliżonej geometrycznie do jej konfor¬ 
macji obserwowanej w krysztale nie oznacza bynaj¬ 
mniej, że konformacja ta wyróżnia się niższą energią 
swobodną. Dopiero w warunkach sprzyjających od¬ 
powiedniej organizacji cząsteczek rozpuszczalnika 
w warstwie solwatacyjnej (warstwie częściowo upo¬ 
rządkowanego rozpuszczalnika wokół cząsteczki 
związku rozpuszczonego) i wystąpieniu silniejszych, 
a także ukierunkowanych oddziaływań wewnątrz- 
cząsteczkowych między sąsiadującymi ogniwami łań¬ 
cucha, następuje termodynamiczna stabilizacja takiej 
konformacji. 

Problemy te nie mieszczą się już w teorii izomerii 
geometrycznej polimerów. Próby opisu tych proble¬ 
mów wymagają znajomości konformacji łańcuchów 
w stanach uporządkowanych makrocząsteczek oraz 
uwzględnienia energii i kicrunkowości oddziaływań 
międzycząsteczkowych, a także kinetyki izomeryzacji 
łańcuchów. 
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Stan uporządkowany 
makrocząsteczek 


Badanie struktury metodami dyfrakcji 
promieniowania rentgenowskiego 

Zdolność cząsteczek białek, kwasów nukleinowych 
i polisacharydów do krystalizacji z roztworów wod¬ 
nych lub skupiania się w parakrystaliczne silnie 
uwodnione włókniste formy stwarza możliwość bada¬ 
nia ich przestrzennie uporządkowanych konformacji 
metodami dyfrakcji promieniowania rentgenowskie¬ 
go (-►Badanie struktury kryształów). Wyznaczenie 
na tej drodze współrzędnych atomów tworzących ma¬ 
krocząsteczkę jest jednak znacznie bardziej złożonym 
zadaniem niż w przypadku małych cząsteczek 
(-> Osiągnięcia krystalografii białek). Z analizy dy- 
fraktogramów można otrzymać uproszczoną funkcję 
rozkładu gęstości elektronowej w przestrzeni trój¬ 
wymiarowej, która posiada maksima w miejscach 
znajdowania się atomów tworzących cząsteczkę (z wy¬ 
jątkiem atomów wodoru, których zdolność rozpra- wyznaczanie 
szająca jest zbyt niska). Metoda wyznaczania para- geometrii 
metrów geometrii makrocząsteczki polega na porów- makro- 
nywaniu doświadczalnego rozkładu gęstości elektro- cząsteczki 
nowej z rozkładami obliczonymi na podstawie szeregu 
kolejno uściślanych modeli jej budowy aż do uzyska¬ 
nia dostatecznie dobrej zgodności między obu roz¬ 
kładami. Wyznaczenie współrzędnych atomów czą¬ 
steczki możliwe jest więc tylko wówczas, gdy można 
zbudować jej model, czyli gdy znana jest jej budowa 
chemiczna (rodzaj i kolejność występowania poszcze¬ 
gólnych ogniw w łańcuchu), kąty konformacyjne 
i długości wiązań łańcucha głównego i łańcuchów 
bocznych poszczególnych ogniw oraz struktura pod- 
jednostkowa (w białkach złożonych i w wielołańcu- 
chowych formach włóknistych). W przypadku, gdy 
nie jest znana kolejność występowania (sekwencja) 
ogniw w łańcuchu polimeru, udaje się tylko określić 
zasadnicze cechy przestrzennego rozkładu atomów 
w makrocząsteczce: jego symetrię oraz ułożenie prze¬ 
strzenne łańcucha głównego. 

Przykładem takiego postępowania była analiza analiza dy- 
dyfraktogramów DNA wówczas, gdy nieznana była fraktogra- 
jeszcze sekwencja występowania zasad we włóknach m ó w DNA 
tego związku. Zaproponowany na podstawie takiej 
analizy w 1951 r. przez dwóch uczonych F. Cricka i J. 

Watsona i obowiązujący po dzień dzisiejszy model 
organizacji przestrzennej cząsteczki DNA w postaci 
podwójnego heliksu (-► Kwasy nukleinowe) najbar¬ 
dziej odpowiadał symetrii i gęstości doświadczalnego 
rozkładu elektronów. Model ten znalazł bezpośrednie 
potwierdzenie dopiero po dwudziestu pięciu latach, 
gdy wykazano analogiczne upakowanie i konformację 
cząsteczek dwunukleotydów ApT i GpC w kryształach. 

Analiza rentgenograficzna struktury makrocząste¬ 
czek napotyka również wiele trudności i ograniczeń 
wynikających z ich wielkości. Funkcja rozkładu gę¬ 
stości elektronowej nie odzwierciedla statycznej 
konformacji pojedynczej cząsteczki, lecz jest super¬ 
pozycją rozkładów odpowiadających identycznie 
położonym cząsteczkom w komórce elementarnej 
kryształu. W dużych cząsteczkach interferencja mię¬ 
dzy rozproszonymi wiązkami promieniowania po¬ 
chodzącymi od różnych atomów powoduje spadek 
natężenia refleksów na dyfraktogramach (natężenie 
refleksów jest proporcjonalne do pierwiastka kwadra¬ 
towego z liczby atomów, a nie wprost do ich liczby, 
jak w wypadku małych cząsteczek). Gdy bada się 
cząsteczki o masie M > 10 5 daltonów liczba obser¬ 
wowanych refleksów jest zbyt mała na to, aby z anali¬ 
zy dyfraktogramów określić współrzędne atomów. 

(Dalton — stosowana w biochemii nazwa jednostki (dalton) 
masy atomowej u; lu jest równa */i 2 masy jądra izo¬ 
topu węgla 12 C). Makrocząsteczki w krysztale mogą 
różnić się szczegółami ułożenia łańcuchów na ich 



rozmycie 

obrazów 

dyfrakcyj¬ 

nych 


rola 

ciężkiego 

atomu 


powierzchni w wyniku oddziaływania z innymi czą¬ 
steczkami tworzącymi kryształ, z cząsteczkami wody 
krystalicznej oraz jonami elektrolitu obecnego w roz¬ 
tworach. Powoduje to oczywiście rozmycie obrazów 
dyfrakcyjnych i obniżenie dokładności analizy. In¬ 
nym, istotnym problemem jest wyznaczenie przesunięć 
fazowych między padającą i rozproszonymi wiązkami 
promieniowania; znajomość przesunięć fazowych jest 
konieczna dla wyznaczenia współrzędnych atomów. 
Gdy bada się małe cząsteczki zbudowane z nie więcej 
niż 100 atomów, wówczas określenie przesunięcia 
fazowego polega na wyborze odpowiedniej funkcji 
rozkładu gęstości. Natomiast gdy bada się makro¬ 
cząsteczki zbudowane zazwyczaj z przynajmniej 1000 
atomów, wtedy takie bezpośrednie określenie fazy 
jest niemożliwe. Wprowadzenie do cząsteczki silnie 
rozpraszającego, ciężkiego atomu daje dopiero od¬ 
powiedni punkt odniesienia. W wypadku cząsteczek 
białek zawierających związane strukturalnie atomy 
ciężkich pierwiastków, takich jak żelazo (hemoglobina, 
miogiobina, cytochromy, wiele enzymów utleniająco- 
-redukujących itp.) problem rozwiązany został przez 
przyrodę. Jednakże w wypadku innych białek wpro¬ 
wadzenie takiego atomu w określone miejsce czą¬ 
steczki jest zadaniem niełatwym. 

Badania rentgenograficzne struktury makrocząste¬ 
czek są bardzo trudne i pracochłonne. Nawet po 
wprowadzeniu automatyzacji pomiarów i obliczeń 
za pomocą komputerów rozwiązanie problemu struk¬ 
tury cząsteczki białka średniej wielkości wymaga nie¬ 
jednokrotnie kilkuletniej pracy całego zespołu ba¬ 
daczy. Z tch względów, mimo że rentgenografia stwa¬ 
rza ogromne możliwości poznawcze, nie jest ona 
metodą powszechnie stosowaną do badania struktury 
makrocząsteczek, tym bardziej, że wielu związków nie 
daje się otrzymać w stanie krystalicznym. Dotych¬ 
czas zbadana została struktura tylko kilkudziesięciu 
spośród tysięcy białek występujących w przyrodzie. 
Wśród nich tylko dla kilkunastu, o stosunkowo małej 
masie cząsteczkowej i zawierających na ogół struk- 


się określić współrzędne atomów, dla pozostałych 
białek określono tylko ułożenie łańcucha peptydo- 
wego w przestrzeni. Niemniej jednak wyniki krystalo¬ 
graficznych badań biopolimerów metodami dyfrakcji 
promieniowania rentgenowskiego stanowią zasadni¬ 
cze źródło wiedzy o ich uporządkowanych przestrzen¬ 
nie konformacjach. Zaproponowane na ich podstawie 
modele budowy różnych chemicznie klas liniowych 
makrocząsteczek są powszechnie stosowane jako pod¬ 
stawa interpretacji zachowania się ich w roztworach 
i in vivo. 


Formy przestrzennego uporządkowania 
biopolimerów 

Najbardziej rozpowszechnioną formą uporządkowa- forma 
nia przestrzennego polipeptydów, polinukleotydów heliksu 
i polisacharydów jest ułożenie głównego łańcucha 
polimeru wzdłuż linii śrubowej, tj. w postaci heliksu. 

Wobec ograniczonej swobody konformacyjnej two¬ 
rzących te polimery ogniw zapewnia ona maksymalne 
upakowanie atomów odpowiadające minimum energii 
układu. Łańcuchy boczne zależnie od swojej budowy 
chemicznej, wzajemnych oddziaływań oraz periodycz- 
ności występowania wzdłuż łańcucha głównego mody¬ 
fikują parametry geometryczne heliksu i umożliwia¬ 
ją powstawanie bardziej złożonych form helikalnych, 
takich jak np. podwójny heliks DNA lub miozyny czy 
potrójny heliks kolagenu lub hybrydu DNA-RNA. 

Ogólnie rzecz biorąc łańcuchy przyjmują formy heli- 

kalne w wyniku występowania sił bliskiego zasięgu 

między sąsiadującymi ze sobą ogniwami łańcuchów 

(wiązania wodorowe, oddziaływania van der Waalsa, 

oddziaływania elektrostatyczne polarnych lub zjoni- 

zowanych grup). Natomiast oddziaływania dalszego formy glo- 

zasięgu między odległymi (wzdłuż osi łańcucha) jego bularne 

elementami powodują powstawanie form globular- 

nych białek i kwasów nukleinowych (tRNA, RNA 

fagów, informacyjny RNA — o budowie chemicznej 



kąt konformacyjny V' 

Rys. 3. Rozkład konformacji wiązania peptydowcgo w 15 globularnych białkach otrzymany na podstawie badań krystalograficznych: 

liczba konformacji o danej wartości kątów konformacyjnych (torsyjnych) i y/ w przedziale x = 10°; linie przerywane odpowia¬ 
dają obszarom przestrzeni konformacyjnej, w których nie stwierdzono występowania wiązań peptydowych; maksima na wykresie od¬ 
powiadają konformacjom typu heliksu a (wg F. M. Pohl, Chemistry of Macromołecules, London 1974) 
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łańcucha nie sprzyjającej przyjęciu przez niego regu¬ 
larnej formy helikalnej). W cząsteczkach globulamych 
łańcuchy mogą przyjmować na pewnych odcinkach 
helikalne lub inne właściwe danej klasie makroczą¬ 
steczek konformacje (np. w przypadku cząsteczek bia¬ 
łek poza formami helikalnymi, czyli strukturami a, 
struktury /? są to struktury /?). Wiązania wodorowe i jonowe do¬ 
datkowo spinają lokalnie uporządkowaną globulę 
i w ten sposób przyjmuje ona kształt właściwy dla łań¬ 
cucha (łańcuchów) o danej budowie chemicznej. In¬ 
nymi słowy — indywidualną cząsteczkę cechuje okre¬ 
ślony zespół kątów konformacyjnych (współrzędnych) 
odpowiadających jednemu punktowi wielowymiaro¬ 
wej przestrzeni konformacyjnej. W danej klasie poli¬ 
merów odchylenia od najbardziej prawdopodobnych 
wartości kątów konformacyjnych wałściwych budowie 
poszczególnych ich ogniw są jednak stosunkowo nie¬ 
wielkie. Ilustruje to rys. 3, na którym przedstawiony 
jest rozkład kątów konformacyjnych <p i y łańcucha 
polipeptydowego znalezionych w kryształach 15 
białek globulamych. 


Teoretyczne badania konformacji 

Doświadczalnym badaniom struktury cząsteczek 
biopolimerów w kryształach towarzyszą szybko roz¬ 
wijające się w ostatnich latach badania teoretyczne. 
Ich celem jest przewidywanie konformacji makro¬ 
cząsteczki o najniższych wartościach energii poten¬ 
cjalnej na podstawie znajomości budowy chemicznej 
łańcucha polimeru oraz oddziaływań między tworzą¬ 
cymi go atomami. Zadanie sprowadza się do znale¬ 
zienia funkcji opisującej zależność energii potencjal¬ 
nej układu od współrzędnych wszystkich atomów 
cząsteczki w dopuszczalnym zakresie zmian ich war¬ 
tości. 

Podstawą tego typu obliczeń jest model budowy 
chemicznej łańcucha przyjęty w teorii izomerii geo¬ 
metrycznej. Dopuszczalne stereochemicznie konfor¬ 
macje cząsteczki definiuje się za pomocą kątów torsyj- 
nych opisujących obroty ogniw wokół wiązań łań- 
opis konfor- cucha głównego polimeru i grup bocznych w stosunku 
nrtacji makro- do osi łańcucha; podanie ich wartości dla wszystkich 
cząsteczki kolejnych ogniw w łańcuchu daje opis konformacji 
makrocząsteczki. Jednakże wykonanie obliczeń dla 
tak dużych układów jest jeszcze technicznie niemożli¬ 
we, zwłaszcza że należałoby w nich uwzględniać rów¬ 
nież oddziaływania między odległymi segmentami 
łańcucha oraz między poszczególnymi segmentami 
i cząsteczkami roztworu. Korzystając jednak z faktu, 
że oddziaływania określające postać funkcji i energii 
potencjalnej obrotu wokół danego wiązania w łań¬ 
cuchu głównym zależą w pierwszym przybliżeniu 
tylko od wzajemnego położenia sąsiadujących ze 



H O 


Rys. 4. Opis konformacji łańcucha polipeptydowego. Grupa 
dwupeptydowa, w tym przypadku alanylowa, wewnątrz której 
występuje korelacja obrotów wokół wiązań N—C (kąt rotacyjny 
<p) i C*—C' (kąt rotacyjny ty) podana jest na niebieskim tle. 
Obrót wokół wiązań N—C' (kąt rotacyjny to ~ 180°) nic za¬ 
chodzi w normalnych warunkach ze względu na dużą wysokość 
bariery energetycznej dla obrotu (J£ a 80 kJ/mol) 
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sobą ogniw, można obliczyć energie potencjalne seg¬ 
mentów łańcucha, w którym występuje korelacja 
kątów obrotu. W ten sposób przewiduje się najbar¬ 
dziej prawdopodobne konformacje podstawowych 
ogniw łańcuchów. Najwięcej takich obliczeń wykona¬ 
no dotychczas dla białek. Płaskość wiązania peptydo- 
wego pozwala opisać izomerię geometryczną łańcucha 
za pomocą kątów torsyjnych <p i (rys. 4). Tak więc 
segmentami łańcucha, których rotacje można trakto¬ 
wać jako praktycznie swobodne, są dwupetydy zde¬ 
finiowane przez parę kątów <pi i y* oraz rodzaj łań¬ 
cucha bocznego R. Energia konformacyjna takich 
jednostek zależy w zasadzie tylko od ich chemicznej 
budowy, tzn. od długości wiązań kowalencyjnych 
i kątów między nimi. Parametry geometryczne tej 
budowy muszą być wyznaczone z niezależnych badań 
krystalograficznych dwupeptydów lub odpowiednich 
modelowych związków. Graficzne przedstawienie 
energii potencjalnej układu w funkcji kątów (p i y 
przy optymalnej wartości kąta rotacyjnego xz grupy 
bocznej R stanowi mapę konformacyjną dwupepty- 
du, z której można odczytać najbardziej prawdopo¬ 
dobne jego konformacje, odpowiadające najniższym mapa kon- 
wartościom energii. Energię układu można obliczyć formacyjna 
w sposób przybliżony metodami klasycznymi roz¬ 
dzielając funkcję energii potencjalnej na składowe 
pochodzące od różnego typu oddziaływań między- 
atomowych w cząsteczce (wiązania wodorowe, van 
der Waalsa, elektrostatyczne, dipol-dipol indukowa¬ 
ny), dla których zależność energii oddziaływania od 
parametrów budowy cząsteczki można podać w po¬ 
staci analitycznej. 

Jednakże od czasu opracowania w połowie lat 
60-ych metod mechaniki kwantowej przystosowanych 
do badań konformacyjnych „dużych układów” (me¬ 
tody CNDO-2, PCILO, uwzględniające wszystkie 
elektrony walencyjne n i a) obliczenia te są wykony¬ 
wane głównie przy ich użyciu (-> Chemia kwanto¬ 
wa). Mapa konformacyjna grupy alanylowej, obli¬ 
czona metodą PCILO, przedstawiona na rys. 5, 



Rys. 5. Mapa konformacyjna reszty alanylowej białek, wyniki 
obliczeń otrzymano metodą PCILO; przy liniach izoenergetycz- 
nych podane są wartości energii (od 1 do 7) odniesionej do ogól¬ 
nego minimum energii cząsteczki, wyrażone w kcal/moł (1 kcal a 
a 4kJ, 7 kcal a 29 kJ); znak -f* oznacza lokalne minimum; obszar 
konformacji o energii do 24 kJ/mol powyżej ogólnego minimum 
jest zaznaczony na niebiesko. Na mapę naniesiono punkty od¬ 
powiadające konformacjom grupy alanylowej stwierdzonym 
w kilku globulamych białkach na podstawie badań krystalogra¬ 
ficznych (wg A. Pullman) 

























pokazuje dopuszczalne jej konformacje w przedziale 
energii 0-25 kJ/mol. Naniesione zostały na nią punkty 
odpowiadające znalezionym doświadczalnie parom 
kątów <p i y> dla grupy alanylowej w krystalicznych 
białkach globularnych. Leżą one wprawdzie w obrę¬ 
bie przewidzianego teoretycznie obszaru konforma- 
cyjnej stabilności grupy alanylowej, jednakże ich 
statystyczny rozkład w cząsteczkach białek nie od¬ 
powiada tym przewidywaniom. Jest to wynik oddzia¬ 
ływań dalszego zasięgu, których w dotychczas wyko¬ 
nywanych obliczeniach nie brano świadomie pod uwa¬ 
gę. Podejmowane są obecnie prace mające na celu 
ich uwzględnienie, a także — i to przede wszystkim — 
uwzględnienie wpływu uwodnienia i obecności jonów 
w warstwie solwatacyjnej łańcuchów. 

Podobne teoretyczne badania konformacji „nie¬ 
zależnych” segmentów łańcuchów prowadzi się i dla 
opis konfor- innych klas biopolimerów — kwasów nukleinowych, 
macji DNA polisacharydów, fosfolipidów. W przypadku kwa¬ 
sów nukleinowych nie wyszły one poza obliczenia 
map konformacyjnych poszczególnych jej fragmen¬ 
tów ze względu na znacznie większą liczbę stopni 
swobody ogniw nukleotydowych; głównym przed¬ 
miotem zainteresowania są dopuszczalne ułożenia 
przestrzenne łańcuchów bocznych względem łań¬ 
cucha głównego, decydujące o geometrii podwójnych 
heliksów oraz konformacje pięcioczłonowych pier¬ 
ścieni rybozy i dezoksyrybozy. 

Badania konformacji makrocząsteczek 
w roztworach 

Ustalona na podstawie danych rentgenograficznych 
uśredniona, statyczna konformacja makrocząsteczki 
w krysztale odpowiada określonemu jej stanowi ter¬ 
modynamicznemu. Czy jednak stan ten jest zachowa¬ 
ny przez cząsteczki biopolimerów w roztworach 
wodnych w warunkach odpowiadających trwałości 
termodynamicznej ich uporządkowanych konfor¬ 
macji? Ogromna liczba geometrycznie różnych uło¬ 
żeń, które może przyjąć łańcuch polimeru, nasuwa 
z kolei pytanie, czy utworzona w krysztale lub roz¬ 
tworze konformacja makrocząsteczki odpowiada 
globalnemu minimum energii swobodnej układu, czy 
też ma ona szereg stanów konformacyjnych odpo¬ 
wiadających lokalnym minimom energii swobodnej 
i oddzielonych od siebie wysokimi barierami energe¬ 
tycznymi, tak że w określonych warunkach realizuje 
się niekoniecznie stan najbardziej prawdopodobny. 
Odpowiedzi na te pytania biofizyka poszukuje na 
drodze badania konformacji makrocząsteczek w roz¬ 
tworach, sił odpowiedzialnych za ich uporządko¬ 
wanie, trwałości termodynamicznej (denaturacja) 
i samoorganizacji (renaturacja) cząsteczek ze stanu 
kłębka statystycznego. Znajdują w nich zastosowanie 
praktycznie wszystkie metody badania kształtu 
i konformacji cząsteczek, jakimi dysponuje współ¬ 
czesna chemia i fizyka. 

Przyjęcie przez łańcuch polimeru zdefiniowanej 
przestrzennie konformacji znajduje swoje odbicie 
w zewnętrznym kształcie cząsteczki oraz w jej większej 
sztywności w porównaniu z formą nieuporządko- 
badanie waną. Toteż badanie kształtów i giętkości makro- 
kształiu cząsteczek metodami stosowanymi w badaniach ich 
i giętkości form nieuporządkowanych umożliwia w sposób 
pośredni ocenę charakteru i stopnia uporządkowania 
ich łańcuchów. Informacji o konformacji łańcuchów 
dostarczają badania spektroskopowe właściwości uwa¬ 
runkowanych symetrią i względnym położeniem grup 
chromoforowych (grup o charakterystycznych ce¬ 
chach widmowych). Na przykład formy helikalne 
badania polipeptydów i polinukleotydów cechuje ze względu 
aktywności na właściwą im symetrię budowy duża aktywność 
optycznej optyczna różniąca się znakiem i wielkością od ak¬ 
tywności optycznej ich elementów budowy — amino¬ 
kwasów i nukleotydów (różne widma dyspersji 
światła spolaryzowanego liniowo lub widma absorpcji 


światła spolaryzowanego kołowo). Inne jeszcze wła¬ 
ściwości optyczne mają warstwowe struktury P poli¬ 
peptydów. W helikalnych, dwułańcuchowych kon¬ 
formacjach polinukleotydów warstwowo ułożone 
pary zasad absorbują znacznie słabiej promieniowa¬ 
nie nadfioletowe niż w bezładnie zwiniętych łańcu¬ 
chach (tzw. efekt hypochromowy). Podobnie wiele 
informacji dotyczących zarówno uporządkowania 
większych obszarów makrocząsteczek jak i ich frag¬ 
mentów uzyskuje się badając właściwości spektrosk- badanie wla- 
powe określonych atomów lub grup atomów (chro- ściwości 
moforów) i wykorzystując zależność ich stanów spi- spektrosko- 
nowych (spekstroskopia jądrowego rezonansu mag- powych 
netycznego i elektronowego rezonansu paramagne- chromoforów 
tycznego, zjawisko Móssbauera), oscylacyjnych (wid¬ 
ma absorpcyjne w podczerwieni, widma Ramana) 
i elektronowych (absorpcyjna i emisyjna spektrosko¬ 
pia w nadfioletowej i widzialnej części widma) od 
natury, odległości i orientacji sąsiadujących z nimi 
innych atomów i ich grup. Metody te pozwalają na 
obserwację zmian zachodzących w otoczeniu chromo¬ 
forów w procesach organizacji i dezorganizacji czą¬ 
steczek oraz w wyniku oddziaływań ich z innymi czą¬ 
steczkami w roztworze. Zakres zastosowania metod 
spektroskopowych stale wzrasta, m.in. dzięki roz¬ 
wojowi metod badawczych i ich podstaw teoretycz¬ 
nych oraz opanowaniu techniki wprowadzania 
w określone miejsca makrocząsteczek małych czą¬ 
steczek (wiązanych kowalencyjnie lub w postaci 
specyficznych kompleksów) o szczególnie czułych na 
zmiany w otoczeniu i o wyróżniających się właściwo¬ 
ściach spektroskopowych. Spełniają one funkcję 
sond stanu konformacyjnego makrocząsteczki. Żad¬ 
na jednak z metod badania konformacji makroczą¬ 
steczek w roztworach nie pozwala na wyznaczenie 
parametrów geometrii łańcucha. 

Złożoność budowy chemicznej i wielkość cząsteczek 
biopolimerów narzuca oczywistą strategię badań 
właściwości ich stanu uporządkowanego w roztwo¬ 
rach, polegającą na redukcji wielkości badanych 
układów. Bada się zatem określone większe fragmen- badanie 
ty natywnych cząsteczek, proste elementy ich budo- fragmentów 
wy jak monomery lub dimery oraz cząsteczki two¬ 
rzące łańcuchy boczne. Przedmiotem badań są rów¬ 
nież syntetyczne modeie naturalnych łańcuchów 
o prostszej chemicznie i odpowiednio zaprogramo¬ 
wanej budowie i stopniu polimeryzacji. Badania 
właściwości konformacyjnych fragmentów i modelo¬ 
wych cząsteczek pozwalają na ocenę roli łańcuchów 
bocznych monomerów o różnej chemicznej budowie 
(grupy alifatyczne i aromatyczne aminokwasów, za¬ 
sady purynowe i pirymidynowe nukleotydów) w for¬ 
mowaniu się określonych konformacji polimerów. 

Dostarczają również danych dotyczących fizycznego 
charakteru i wielkości energii oddziaływań określa¬ 
jących geometrię i trwałość tych konformacji. 


Siły odpowiedzialne za organizację 
łańcuohów makrocząsteczek 

Poznanie sił odpowiedzialnych za organizację gięt¬ 
kich łańcuchów polimerów w uporządkowane kon¬ 
formacje ma zasadnicze znaczenie w zrozumieniu 
właściwości ich stanu uporządkowanego. 

Ogólnie rzecz biorąc oddziaływania van der Waalsa 
i elektrostatyczne między atomami fragmentów budo¬ 
wy makrocząsteczek odpowiedzialne są zarówno za 
konformacje łańcuchów głównych jak i ich prze¬ 
strzenne upakowanie w uporządkowanych formach 
makrocząsteczek. Charakterystyczne dla danej makro¬ 
cząsteczki rozmieszczenie różnych łańcuchów bocz¬ 
nych wzdłuż łańcucha głównego determinuje wystą¬ 
pienie nieco silniejszych, kooperatywnych oddziały¬ 
wań przyciągających między określonymi fragmenta¬ 
mi jej budowy i przyjęcie przez nią najbardziej praw¬ 
dopodobnej energetycznie i termodynamicznie formy 
uporządkowania przestrzennego. Oddziaływania te 
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wodorowe 


oddziaływa¬ 
nie z czą¬ 
steczkami 
wody 


mają w tym sensie charakter kierunkowy. Wyróżnia 
się wśród nich przede wszystkim oddziaływania pro¬ 
wadzące do utworzenia tzw. wiązań wodorowych 
(—A---H—B—) między akceptorowymi (A) i donoro¬ 
wymi (B—H) ugrupowaniami atomów, zawierającymi 
atomy tlenu, azotu i siarki, z których jeden związany 
jest kowalencyjnie z atomem wodoru. 

W przyjętych modelach konformacji łańcuchów 
polipeptydowych i polinukleotydowych wiązaniom 
wodorowym przypisuje się rolę oddziaływań służą¬ 
cych wzajemnemu rozpoznawaniu się i przestrzennej 
orientacji segmentów cząsteczki sąsiadujących ze so¬ 
bą w tym samym łańcuchu (np. heliks a polipepty- 
dów), w przeciwległym łańcuchu (np. podwójny 
heliks DNA) lub oddalonych od siebie (formy globu- 
larne). Szczegółowa charakterystyka stereochemicz¬ 
nych i termodynamicznych warunków ich powsta¬ 
wania w układach modelowych oraz określenie ich 
energii w zależności od typu struktury, w której wy¬ 
stępują, jest przedmiotem licznych prac. 

Specyficzne właściwości konformacyjne biopoli¬ 
merów ujawniają się wyłącznie w roztworach wodnych, 
toteż poznanie hydratacji makrocząsteczek (wiązania 
się z cząsteczkami wody) i roli wody w formowaniu 
się i stabilizacji uporządkowanych struktur zajmuje 
szczególnie istotne miejsce we współczesnych bada¬ 
niach. Utworzeniu specyficznych, wewnątrzcząstecz- 
kowych wiązań wodorowych towarzyszy usunięcie 
cząsteczek wody związanej podobnymi wiązaniami 
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woda (sieć 
cząsteczek H2O 
powiązanych 
wodorowo) 



wokół cząsteczki 
węglowodoru 
powstaje warstwa 
hydratacyjna o wyższym 
stopniu uporządkowania 
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Rys. 6. Molekularny i termodynamiczny model oddziaływań hyd¬ 
rofobowych między grupami alifatycznymi w roztworze wodnym: 
a) Schemat rozpuszczania cząsteczek węglowodoru alifatycznego 
w wodzie; ograniczona rozpuszczalność węglowodoru alifatycz¬ 
nego W HjO, tzn. AGtozv — AHrozp — 7'(i4.S'łfont + w<J>S , hy<Srorab ^0 
(gdzie G — energia swobodna Gibbsa, H —entalpia) wynika 
z obniżenia się entropii układu JShydrojob = — S% (gaz) < 0 

na skutek wzrostu uporządkowania cząsteczek wody wokół 
cząsteczek węglowodoru (JHrozp < 0 Jest to entalpia rozpusz¬ 
czania, JSkont w 0 — zmiana entropii konfiguracyjnej węglowo¬ 
doru, i S% (gaz) — cząstkowe entropie związku w roztworze 
oraz w fazie gazowej), b) Schemat agregacji cząsteczek węglowo¬ 
doru oraz c) grup alkilowych łańcuchów bocznych liniowego poli¬ 
meru. Agregacja jest procesem termodynamicznie korzystnym, 
tzn. JGagr = AH* Kr — TJS*gr< 0, ponieważ towarzyszy mu du¬ 
ży przyrost entropii układu JS*gr = JSkonr -f-dCfShydrofob) > 0 
spowodowany usunięciem cząsteczek wody z warstwy solwatacyj- 
nej otaczającej agregujące grupy i cechującej się wyższym stopniem 
uporządkowania molekularnego niż sam rozpuszczalnik 
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wodorowymi z grupami akceptorowymi (A) i do¬ 
norowymi (B—H) polimerów. Bilans energetyczny 
procesów zerwania istniejących wiązań wodorowych 
A **H—O—H i B—H** OH 2 i utworzenia nowych 
wiązań A • •• H—B wnosi swój wkład do zmiany energii 
swobodnej układu. Procesy te są jednak ciągle nie¬ 
wystarczająco zbadane termochemicznie i zinterpre¬ 
towane termodynamicznie. Udział wody w powsta¬ 
waniu natywnych konformacji biopolimerów przeja¬ 
wia się jednak przede wszystkim w skłonności nie- 
polamych ich fragmentów budowy do skupiania się 
z wytworzeniem bezpośrednich kontaktów i usunię¬ 
ciem cząsteczek wody z ich powierzchni (oddziaływa- oddziaływa¬ 
nia hydrofobowe). Procesowi temu towarzyszy znacz- nie 
ny wzrost entropii układu, który decyduje o obniżeniu hydrofobowe 
jego energii swobodnej, stanowiąc zatem siłę napędo¬ 
wą reorganizacji struktury molekularnej (rys. 6). 

W cząsteczkach białek globularnych oddziaływa¬ 
nia hydrofobowe powodują skupianie się we wnętrzu 
globuli segmentów łańcuchów polipeptydowych, 
zbudowanych z aminokwasów mających grupy wę¬ 
glowodorowe jako łańcuchy boczne. W cząsteczkach 
kwasów nukleinowych oddziaływania hydrofobowe 
są jedną z przyczyn warstwowej organizacji par za¬ 
sad we wnętrzu podwójnego heliksu. Odpowiedzialne 
są one również za dwuwarstwową organizację fosfo- 
lipidowych błon komórkowych (-> Błony komórko¬ 
we). Zaproponowane dotychczas molekularne mode¬ 
le oddziaływań hydrofobowych, a także oparta na 
nich termodynamiczno-statystyczna interpretacja wła¬ 
ściwości roztworów zawierających cząsteczki orga¬ 
niczne o budowie zbliżonej do elementów budowy 
biopolimerów, tylko w sposób przybliżony wyjaśniają 
doświadczalnie obserwowane ich właściwości. Przy¬ 
czyną takiego stanu rzeczy jest niezadowalający po¬ 
stęp badań termochemicznych i badań struktury roz¬ 
tworów wodnych. Brak jest nawet poprawnej mole¬ 
kularnej teorii stanu ciekłego wody. 

Trwałość uporządkowanych konformacji biopoli- wpływ sta- 
merów, których łańcuchy mają właściwości polielek- bilizujący 
trolitów, zależy oczywiście od stanu oddziaływań elek- jonów 
trostatycznych w układzie makrocząsteczka-jony elektrolitu 
elektrolitów obecnych w roztworze. Elektrostatyczne 
odpychanie się ujemnie naładowanych grup fosfo- 
estrowych sąsiadujących ze sobą w cząsteczkach kwa¬ 
sów nukleinowych obniża stabilność konformacji po¬ 
dwójnego heliksu. Obecne w roztworze kationy sil¬ 
nych elektrolitów, takich jak NaCl, KC1, MgCl 2 , 
skupiają się wokół ujemnie naładowanych centrów 
i ekranują je. Ponieważ gęstość powierzchniowa ujem¬ 
nego ładunku podwójnego heliksu DNA jest większa 
niż pojedynczej nici polinukleotydowej, kationy są sil¬ 
niej wiązane przez formy uporządkowane kwasów nu¬ 
kleinowych, wywierając wpływ stabilizujący je. Ana¬ 
logicznie jest stabilizowana obecnością kationów 
warstwowa budowa fosfolipidowych błon biologicz¬ 
nych. In vivo oprócz kationów metali Na + , K + , 

Ca +2 , Mg +2 itd. stabilizujący wpływ na DNA wy¬ 
wierają również dodatnio naładowane grupy poliamin 
i białek zasadowych obecnych w chromatynie. 

Ponieważ energia oddziaływań elektrostatycznych 
jest odwrotnie proporcjonalna do przenikalności 
dielektrycznej fi ośrodka rozdzielającego ładunki 
elektryczne, a wartość e pozbawionego wody apo- 
larnego wnętrza globuli białkowej jest znacznie mniej¬ 
sza niż wody, zatem energia elektrostatyczna we 
wnętrzu globuli jest przynajmniej o jeden rząd wiel¬ 
kości większa niż na jej powierzchni. Toteż przycią¬ 
gające oddziaływania elektrostatyczne między do¬ 
datnio i ujemnie naładowanymi ogniwami — ami¬ 
nokwasami (wiązania jonowe) odgrywają istotną 
rolę w fałdowaniu łańcuchów polipeptydowych i sta¬ 
bilizacji globularnych makrocząsteczek. 

W wielu białkach spełniających funkcje transpor¬ 
towe (np. hemoglobina, cytochromy) lub katalitycz¬ 
ne (np. enzymy uczestniczące w reakcjach utleniania 
i redukcji) jony metali ciężkich, takich jak Fe, Mo, 

Co, Mn, Zn, specyficznie i trwale związane w warun- 





kach fizjologicznych, odgrywają rolę centrów wiążą¬ 
cych i katalitycznych. Zmiany stanu utlenienia jonu 
metalu wywołują w nich zmiany konformacyjne, 
przystosowujące cząsteczki do udziału w kolejnym 
etapie cyklu transportowego lub katalitycznego. 

Niespecyficzne i specyficzne oddziaływania jonów 
metali z cząsteczkami biopolimerów kontrolujące ich 
konformacje, a tym samym i funkcje w komórce, są 
od wielu lat przedmiotem systematycznych badań 
doświadczalnych i teoretycznych, obecnie dalekich 
jeszcze od zakończenia. 


Dynamika uporządkowanych konformacji 
biopolimerów 

Stan termodynamiczny i trwałość uporządkowanych 
konformacji makrocząsteczek określone są sumą bar¬ 
dzo wielu słabych oddziaływań wewnątrzcząsteczko- 
wych i międzycząsteczkowych ze składnikami roz- 
fluktuacje tworu wodnego. W rezultacie w cząsteczka h wystę- 
konforma- pują termiczne fluktuacje konformacyjne wywołujące 
cyjne odchylenia kątów konformacyjnych od wartości naj¬ 
bardziej prawdopodobnych w „statycznej” konfor¬ 
macji w stanie krystalicznym. Fluktuacje te mają naj¬ 
prawdopodobniej charakter drgań własnych układu, 
określonych budową chemiczną łańcucha i jego prze¬ 
strzenną organizacją. Nadają one makrocząsteczkom 
właściwości układów stochastycznych. O występo¬ 
waniu fluktuacji świadczą przede wszystkim obserwa¬ 
cje wskazujące na to, że pewne grupy funkcjonalne 
białek i kwasów nukleinowych, ukryte — wg danych 
krystalograficznych — w ich wnętrzu, są dostępne 
przez krótkie, 10“ 3 -10~ e s, okresy czasu dla różnych 
reakcji chemicznych (np. wymiana atomów wodoru 
i deuteru), bądź dla oddziaływań fizycznych z cząstecz¬ 
kami obecnymi w roztworze (np. gaszenie fluorescen- 
cji określonych grup przez tlen). Poznanie „widma 
fluktuacji konformacyjnych” makrocząsteczek, tzn. 
zależności częstości fluktuacji od energii aktywacji, 
oraz przypisanie poszczególnym częstościom okre- 
fluktuacje słonych zmian w budowie makrocząsteczek będzie 
a mechanizm miało istotne znaczenie dla wyjaśnienia mechaniz- 
rozpoznawa- mów specyficznego rozpoznawania przez makro- 
nia cząsteczki innych makrocząsteczek, a także małych 
cząsteczek, w trakcie spełniania właściwych im funkcji 
w komórce. Dotychczas jednak jeszcze bardzo nie¬ 
wiele wiadomo o tych fluktuacjach z doświadczalnego 
punktu widzenia. Rozwój technik szybkich pomia¬ 
rów kinetycznych w przedziałach czasu mikro- i na- 
nosekundowych połączonych ze spektroskopowymi 
badaniami zmian konformacyjnych rokuje nadzieje 
na postęp w doświadczalnych badaniach dynamiki 
budowy makrocząsteczek. Podejmowane są również 
próby teoretycznego jej opisu. 


Zmiany stanu uporządkowania 
makrocząsteczek 

Doświadczalne badania przebiegu procesów dezor¬ 
ganizacji przestrzennej budowy (denaturacji), samo¬ 
organizacji i przejścia cząsteczek białek i kwasów 
nukleinowych oraz ich syntetycznych modeli z jed¬ 
nej uporządkowanej konformacji w drugą dowodzą, 
że zmiana stanu konformacyjnego makrocząsteczki 
jest procesem odwracalnym (jeżeli nie zachodzą w niej 
zmiany chemiczne), kooperatywnym i ma charakter 
przejścia fazowego II rodzaju. Oznacza to, że zmiany 
strukturalne w makrocząsteczce zachodzą w sposób 
ciągły, towarzyszy im ciągła zmiana entalpii i skoko¬ 
wa zmiana pojemności cieplnej układu. Poznanie 
termodynamiki, molekularnych mechanizmów i kine¬ 
tyki tych procesów dla różnych klas biopolimerów 
i indywidualnych makrocząsteczek w poszczególnych 
klasach oraz ich statystyczno-termodynamiczna in¬ 
terpretacja ma na celu otrzymanie odpowiedzi na 
dwa zasadnicze pytania: w jaki sposób można przewi¬ 



dywać, opierając się na znajomości budowy chemicz¬ 
nej cząsteczek, ich uporządkowane konformacje? 
Jakie są elementarne fizyczne mechanizmy ich działa¬ 
nia w komórce i jak one wynikają z ich właściwości 
konformacyjnych? Dzisiaj biofizyka nie jest jeszcze 
w stanie udzielić zadowalającej odpowiedzi na te 
pytania. Systematyczne badania w tej dziedzinie zo¬ 
stały podjęte stosunkowo niedawno. Jednakże wyniki 
ich pozwalają już na sformułowanie szeregu ogólniej¬ 
szych wniosków i hipotez. 

Szczególnie wiele informacji dotyczących mecha¬ 
nizmu samoorganizacji makrocząsteczek dostarczają 
obserwacje spektroskopowe procesu relaksacji upo¬ 
rządkowanych konformacji, wytrąconych z równowa¬ 
gi termodynamicznej przez skokową zmianę tempera¬ 
tury lub ciśnienia w roztworze. Okazuje się, że czas 
potrzebny do przyjęcia przez bezładnie zwinięty 
kłębek określonej konformacji jest bardzo krótki, 
zależy jednak oczywiście od wielkości, charakteru 
i złożoności budowy chemicznej cząsteczki. Na przy¬ 
kład jest on rzędu 10" 8 s dla formowania się helikal- 
nych konformacji najprostszych polipeptydów zbu¬ 
dowanych tylko z jednego rodzaju aminokwasów. 
Natomiast samoorganizacja łańcuchów naturalnych 
polipeptydów w formy globulame o złożonej prze¬ 
strzennej organizacji wymaga od 0,01 do kilku se¬ 
kund. Tak krótki czas, w którym giętki łańcuch po¬ 
limeru przyjmuje określoną konformację spośród 
ogromnej liczby izomerycznych jej odmian, realizu¬ 
jących się w stanie kłębka statystycznego, świadczy 
o tym, że proces organizacji musi przebiegać przez 
ograniczoną liczbę stanów pośrednich. Można łatwo 
obliczyć, że gdyby proces fałdowania łańcucha poli- 
peptydowego zbudowanego ze 150 aminokwasów 
miał przebiegać przez „sprawdzanie” w przypadkowy 
sposób wszystkich dostępnych mu konformacji trwa¬ 
łoby to wówczas 10 26 lat! Na pojawienie się stanów 
przejściowych w procesach formowania się globular- 
nych cząsteczek białek i tRNA wskazują obserwacje 
spektroskopowe, analiza profili przejść konformacyj¬ 
nych oraz pomiary czasów relaksacji. W białkach 
globularnych obserwuje się występowanie dwu i wię¬ 
cej czasów relaksacji w obrębie przejścia kłębek 
globula. Interpretacja ich na podstawie analo¬ 
gicznych doświadczeń z polipeptydami o konforma¬ 
cjach heliksu a i warstwowej struktury fi prowadzi do 
wniosku, że pierwsze, szybkie stadium fałdowania 
łańcucha polipeptydowego białka polega na utworze¬ 
niu helikalnych fragmentów. Dużo powolniejsze 
stadium, ograniczające szybkość powstawania globuli, 
wiąże się z formowaniem struktury /? (rys. 8). Po¬ 
dobnie w przypadku tRNA powstanie globularnej 
formy cząsteczki rozpoczyna się od utworzenia szeregu 
odcinków podwójnego heliksu między komplemen¬ 
tarnymi odcinkami tego samego łańcucha (rys. 7). 
Najpowolniejszym stadium procesu powstawania 
form helikalnych i warstwowych jest utworzenie 
zarodka konformacji właściwej dla danej cząs¬ 
teczki (powstanie wiązań wodorowych między sąsia¬ 
dującymi resztami peptydowymi lub między komple¬ 
mentarnymi parami zasad w polinukleotydach), od 
którego poczynając następuje szybki, kooperatywny 
proces formowania się tej konformacji w całym łań¬ 
cuchu. 

Przedstawiony wyżej model procesu samoorganiza¬ 
cji białek globularnych stanowi podstawę prób teo¬ 
retycznego wyjaśnienia konformacji białek, których 
struktura w kryształach została ustalona metodami 
dyfrakcji promieniowania rentgenowskiego. Termo- 
dynamiczno-statystyczna interpretacja przejść konfer- 
macyjnych (zob. niżej) w odpowiednio dobranych mo¬ 
delowych poiipeptydach pozwala na określenie para¬ 
metrów termodynamicznych charakteryzujących pra- 


Rys. 7. Samoorganizacja cząsteczki tRNA: powstawanie formy 
globularnej poprzedzone jest formowaniem się struktur typu 
szpilki od włosów o budowie podwójnego heliksu między kom¬ 
plementarnymi fragmentami łańcucha polirybonukleotydowcgo 
(p jest symbolem reszty estrowej kwasu ortofosforowego) 
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wdopodobieóstwo występowania reszt poszczególnych 
aminokwasów w konformacjach heliksu a, struk¬ 
tury fi i mniej regularnych konformacjach warunku¬ 
jących zaginanie się łańcuchów. Następnie stosując 
metody termodynamiki statystycznej oblicza się dla 


kooperatywnego. Wśród biopolimerów nie stwier¬ 
dzono dotychczas antykooperatywności, tj. a > 1. 
Dla układów o złożonej budowie nie można otrzymać 
rozwiązań w postaci analitycznej ze względu na 
ogromne trudności matematyczne. Dotyczy to zwłasz- 




kfębek statystyczny 
łańcucha polipeptydowego 


Rys. 8. Samoorganizacja makrocząsteczek globularnego białka: / proces powstawania zarodków struktur a-helikalnych, pętli i zagięć 
łańcucha polipeptydowego w wyniku lokalnych oddziaływań między sąsiadującymi ogniwami; // w wyniku oddziaływań między oc¬ 
lonymi fragmentami łańcucha formują się centra krystalizacji globularnej typu szpilki od włosów; ///powstanie przejściowej struktury 
globularnej w wyniku połączenia się kilku centrów krystalizacji; IV ostateczne uformowanie się konformacji globuli po adjustacji ką¬ 
tów konformacyjnych łańcucha i wzajemnych orientacji segmentów do wartości odpowiadających ogólnemu minimum energii układu 


polipeptydu o znanej budowie łańcucha prawdopo¬ 
dobieństwo przyjmowania przez jego segmenty kon¬ 
formacji odpowiadających tym formom uporządko¬ 
wania. Otrzymuje się dość dobrą zgodność przewi¬ 
dywań teoretycznych z danymi krystalograficznymi. 


Statystyczno-termodynamiczna teoria 
przejść konformacyjnych 

Statystyczno-termodynamiczna teoria przejść kon¬ 
formacyjnych została opracowana dla wielu jedno-, 
dwu- i trójwymiarowych układów makrocząsteczko¬ 
wych i supercząsteczkowych o właściwościach ko¬ 
operatywnych. Opisuje ona przejścia między różnymi 
konformacyjnie uporządkowanymi stanami łańcu¬ 
chów, między danym stanem uporządkowanym i i sta¬ 
nem kłębka statystycznego, a także przejścia pole¬ 
gające na zmianie wzajemnej orientacji lub stopnia 
polimeryzacji makrocząsteczek tworzących funkcjo¬ 
nalne kompleksy nadmolekulame zbudowane z wielu 
identycznych lub różnych podjednostek. 

Jeżeli znana jest liczba i dostępnych makrocząstecz¬ 
ce lub układowi makrocząsteczek stanów konforma¬ 
cyjnych o energii Ei i statystycznej wadze gu można 
obliczyć funkcję rozdziału Q — Zg i z~ Ei!fcT - Wią¬ 
że ona molekularne i termodynamiczne właściwości 
układu, ponieważ energia swobodna układu G zależy 
następująco od jej wartości: G = —RT\nQ. Po¬ 
sługując się rachunkiem macierzowym wyprowadza 
się funkcję analityczną wiążącą doświadczalnie ob¬ 
serwowany stopień przejścia 0 z parametrami termo¬ 
dynamicznymi układu — stałymi równowagi, i z tem¬ 
peraturą (ewentualnie innym parametrem charak¬ 
teryzującym czynnik przesuwający tę równowagę). 
W najprostszym wypadku przejścia konformacyjnego 
realizującego się w dużym, jednorodnym i jednowy¬ 
miarowym układzie (długi łańcuch zbudowany z iden¬ 
tycznych ogniw, dla którego można pominąć efekty 
brzegowe w procesie nukleacji, czyli tworzenie się 
zarodka konformacji), parametrami termodynamicz¬ 
nymi układu są: stała równowagi 5 procesu wzrostu 
uporządkowania po nukleacji oraz stała równowagi 
tego ostatniego procesu as. Współczynnik a określa 
kooperatywność układu. Zależy ona wykładniczo od 
zmiany energii swobodnej procesu nukleacji: 

<T = ę~ G nxik\l kT > 

Gdy Gnuki >0, to a < 1, czyli układ jest koopera¬ 
tywny, natomiast gdy Gnuki = 0, również a = 0 
i zmiany zachodzące w układzie nie mają charakteru 


cza układów trójwymiarowych, takich jak białka 
globularne. Udaje się jedynie oszacować metodami 
numerycznymi przybliżone wartości parametrów 
termodynamicznych uproszczonego modelu układu. 

Wszystkie podstawowe właściwości termodyna¬ 
miczne układu kooperatywnego wyjaśnia w prosty 
i jednocześnie ogólny sposób teoria przejść konforma¬ 
cyjnych w układzie jednowymiarowym, opracowana 
przez B. Zimma i J. Bragga. Oparta jest ona na mode¬ 
lu Isinga jednowymiarowej sieci spinów elektrono¬ 
wych ferromagnetyka, rozważanym w teorii przejść 
fazowych ferromagnetyk ^ paramagnetyk w punkcie 
Curie. Model ten zakłada występowanie elementów 
układu w dwóch tylko stanach A i B oraz koopera¬ 
tywność ograniczoną do oddziaływań między bez¬ 
pośrednio sąsiadującymi ze sobą elementami. Ozna¬ 
cza to, że /-ty element w sąsiedztwie elementu, np. 
w stanie B wykazuje tendencję do przyjęcia tego sa¬ 
mego stanu. Model ten dobrze opisuje wiele rzeczy¬ 
wistych układów, np. przejście między dwiema helikal- 
nymi konformacjami poliproliny I i II, polegające 
na izomeryzacji cis-trans wiązania peptydowego 
(wówczas wartości 0 równe 1 i 0 odpowiadają for¬ 
mom I i II). Dla długiego, jednorodnego łańcucha 
spełniającego założenia takiego modelu wykres 
funkcji 6 = f(s , as) pokazuje, że ostrość przejścia 
(nachylenie krzywej) zależy od wartości a (rys. 9). 
Im mniejsza wartość tego współczynnika, tym większa 
jest liczba 7^ 0 = l/|/o" sąsiadujących ze sobą ogniw 
zmieniających jednocześnie swoją konformację (tzw. 



stała równowagi s 

Rys. 9. Zależność stopnia przejścia konformacyjnego 6 od stałej 
równowagi s przy różnych wartościach współczynnika koopera- 
tywności S(S — 1 • 10~ 8 , JO” 4 ) w jednowymiarowym modelu Isinga 
liniowego polimeru 
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długość kooperatywna) i tym samym ostrzejsze, bar¬ 
dziej kooperatywne przegięcie. Oznacza to, że w ukła¬ 
dach o silnej kooperatywności (o rzędu 10~ 3 -10~ 4 ) 
nawet niewielka zmiana równowagi d ln s/dx wywoła¬ 
na działaniem bodźca x na układ (zmiana ta jest 
analogia proporcjonalna do ]/o ) pociąga za sobą rozlegle zmia- 
z układami ny konformacyjne. Makrocząsteczkowe układy ko- 
przełączają- operatywne mogą zatem spełniać analogiczne funkcje 
cymi jak wyzwalające układy elektroniczne (rys. lOa). Jeżeli 
funkcja danego układu kooperatywnego zależy 
od jego stanu konformacyjnego (np. funkcje katali¬ 
tyczne białek enzymatycznych lub transportowe bia¬ 
łek błon komórkowych), wówczas bodźce wyzwalają¬ 
ce w nim przejścia między stanami o dużej i małej ak¬ 
tywności spełniają rolę regulatorów jego działania. 
Układy takie zachowują się analogicznie jak elek¬ 
troniczne układy wzmacniające, takie jak np. trioda 
lampowa lub odpowiedni układ tranzystorowy (rys. 
10b). 





Rys. 10. Analogia działania między elektronicznymi a koopera¬ 
tywnymi układami makromolekularnymi: a) Przełączanie: 
schemat i charakterystyka prądowo-napięciowa diody lampowej 
oraz schemat i charakterystyka przejścia konformacyjnego wy¬ 
wołanego działaniem bodźca zewnętrznego (T oznacza tempera¬ 
turę, pH ujemny logarytm stężenia jonów wodorowych, E pole 
elektryczne, c x — stężenie ligandu). b) Wzmacnianie: schemat 
i charakterystyka prądowo-napięciowa triody lampowej oraz 
schemat allosterycznej regulacji aktywności enzymu (T i R stany 
enzymu o niskiej i wysokiej aktywności katalitycznej) i wykres 
zależności szybkości reakcji od stężenia substratu (c*> w obec¬ 
ności allosterycznego aktywatora (+) i inhibitora (-) katalizy 


Czas przebiegu elementarnych procesów związa¬ 
nych z przemianami konformacyjnymi jest rzędu 
czas 10“ 10 s. Całkowity czas przebiegu przemiany obejmu- 
przebiegu jącej wiele ogniw makrocząsteczki jest oczywiście od- 
przemiany powiednio dłuższy, jednakże wystarczająco krótki 
w skali czasu procesów komórkowych dla zapewnie¬ 
nia sprawnej kontroli sterowania tymi procesami. 

Małocząsteczkowe układy molekularne, w których 
zachodzą rzeczywiste przejścia fazowe I rodzaju typu 
ciecz-kryształ nie mają takich właściwości. Zmiany 
struktury, a więc i objętości oraz wszystkich potencja¬ 
łów termodynamicznych, następują w nich skokowo. 
Wymagają one znacznie większych energii aktywacji 
i przebiegają wobec tego znacznie wolniej niż zmiany 
konformacyjne w kooperatywnych układach makro¬ 
cząsteczkowych. 


Kooperatywne właściwości bio¬ 
polimerów a regulacja ich funkcji 

Cząsteczki biopolimerów spełniają wszystkie warunki 
układów o dużym stopniu kooperatywności. Zmiany 
ich stanu konformacyjnego mogą zachodzić w wa¬ 


runkach fizjologicznych, jeśli chodzi o temperaturę, 
stężenie elektrolitów oraz stężenie jonów wodorowych. 
Rolę bodźca wyzwalającego zmianę stanu równowagi 
termodynamicznej makrocząsteczki, oprócz zmian 
temperatury i stężenia określonych jonów, może od¬ 
grywać wiele innych czynników fizycznych i chemicz¬ 
nych. 

Energia cząsteczek polielektrolitów — jako ukła¬ 
dów elektrostatycznych — zależy od wielkości przy¬ 
łożonego pola elektrycznego. W wielu peptydach 
obserwowano in vitro przejścia konformacje wywoły¬ 
wane działaniem pól o potencjale porównywalnym 
z potencjałem błon biologicznych in vivo. 

Wiadomo również, że wiele małocząsteczkowych 
i makrocząsteczkowych ligandów pełniących w ko¬ 
mórce różnorodne funkcje regulacyjne i kontrolne ma 
większe powinowactwo do jednej z pozostających 
w równowadze konformacji polimeru lub jego frag¬ 
mentu i wiążąc się z nim przesuwa równowagę w kie¬ 
runku tej konformacji. Na przykład aminy alifatycz¬ 
ne i białka zasadowe — histony, odgrywające istotną 
rolę w organizacji i funkcjonowaniu chromatyny, 
stabilizują podwójny heliks DNA. Inne białka tzw. 
rozplatające, które uczestniczą w procesie replikacji 
DNA fagów, bakterii i organizmów wyższych (np. 
białko, będące produktem genu 32 bakteriofaga T4), 
obniżają temperaturę przejścia konformacyjnego 
DNA heliks ^ kłębek. Wiązanie przez cząsteczki 
białek enzymatycznych cząsteczek substratów, koen¬ 
zymów i regulatorów allosterycznych wywołuje zmia¬ 
ny stanu konformacyjnego pewnych obszarów glo¬ 
buli białkowej. 

Przyczyną zmian stanu termodynamicznego makro¬ 
cząsteczek w procesach oddziaływania z innymi cząs- 
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Ksisms&słjo + o —- c^7 

heliks + a -► bezładny kłębek [A) 



Rys. 11. Generacja i działanie siły w układzie kooperatywnym: 
a) generacja siły wywołana zmianą stanu równowagi konforma- 
cyjnej heliks ps kłębek bezładny, b) po związaniu cząsteczki 
ligandu A o większym powinowactwie do kłębka wzrost swobod¬ 
nej energii układu wywołuje jego kontrakcję /heliks > lk i«b e k 


45 - Encyklopedia fizyki współczesnej 


705 




































przemiany 

energetyczne 

wywołane 

przejściem 

konforma- 

cyjnym 


allosteryczna 

regulacja 

aktywności 

katalitycznej 


superczą- 

steczkowe 

kompleksy 

białkowe 


teczkami jest porównywalność energii oddziaływań 
wewnątrzcząsteczkowych i międzycząsteczkowych. 
Dalszą konsekwencją tego stanu rzeczy jest sprzężenie 
energetyczne różnych ligandów związanych z różnymi 
fragmentami makrocząsteczki. Innymi słowy, dzia¬ 
łanie danego bodźca na układ może wzmagać lub 
niweczyć jednoczesne działanie innego. 

Reakcja kooperatywnego układu na działanie zew¬ 
nętrznego bodźca w formie przejścia konformacyjnego 
może z kolei być źródłem generacji siły: /= —SG/Sx 
mechanicznej (rys. 11), osmotycznej, chemicznej lub 
elektrycznej. Energia swobodna G makrocząsteczki 
w roztworze jest bowiem, ogólnie rzecz biorąc, funkcją 
jej rozmiarów liniowych, gradientu stężenia jonów 
i wiążących się z makrocząsteczką cząsteczek związ¬ 
ków organicznych, a także powierzchniowego po¬ 
tencjału elektrycznego. Warunkiem pojawienia się 
takiej siły jest oczywiście anizotropowa budowa danej 
cząsteczki jak i większego, otaczającego ją układu, 
gdyż tylko wówczas działanie bodźca i reakcja układu 
może mieć charakter kierunkowy. Praca wykonywana 
działaniem tych sił w komórce, która jest układem silnie 
anizotropowym, jest związana z przemianą różnych 
form energii chemicznej związków wysokoenergety¬ 
cznych, takich jak ATP (o wysokim potencjale chemi 
cznym), stanowiących podstawowe źródło energii ko¬ 
mórki, w inne formy energii chemicznej (reakcje enzy¬ 
matyczne), a także w energię osmotyczną (aktywny 
transport przez błony komórkowe), mechaniczną 
(m.in. skurcz mięśnia) i elektryczną (potencjały 
błon komórkowych). Tak więc kooperatywne przejścia 
konformacyjne makrocząsteczek stanowią podstawę 
wielu elementarnych mechanizmów funkcjonowania 
układów komórkowych na poziomie molekularnym, 
a także funkcjonalnych powiązań układów o ró¬ 
żnych funkcjach biochemicznych między sobą. 


Regulacja układów enzymatycznych 

Dobrze poznane pod względem biochemicznym i kine¬ 
tycznym procesy regulacji działania enzymów i kom¬ 
pleksów enzymatycznych (—► Białka) dostarczają 
szczególnie dużo przykładów powiązań funkcjonal¬ 
nych, opartych na kooperatywnych właściwościach 
cząsteczek białek. Zapewne najprostszym przykładem 
jest allosteryczna regulacja aktywności katalitycznej 
enzymów zbudowanych z pojedynczej cząsteczki 
białka. Wiązanie przez białko w miejscu odległym od 
jego centrum katalitycznego cząsteczki efektora reak¬ 
cji, powstającej w innym procesie enzymatycznym 
lub transportowanej do komórki przez otaczającą ją 
błonę, wywołują zmianę konformacyjną w miejscu 
wiązania substratu, zwiększającą lub obniżającą szyb¬ 
kość reakcji enzymatycznej. 

Znacznie bardziej złożony jest kooperatywny me¬ 
chanizm regulacji enzymów zbudowanych z kilku 
cząsteczek białek tworzących trwały termodynamicz¬ 
nie kompleks. W kompleksach takich mogą zachodzić 
zmiany wzajemnego położenia podjednostek, wy¬ 
wołane iokalnymi zmianami konformacji tych pod¬ 
jednostek. Różnym stanom funkcjonalnym takiego 
układu odpowiadają różne konfiguracje ułożenia pod¬ 
jednostek w kompleksie. W supercząsteczkowych 
kompleksach białkowych może realizować się sprzę¬ 
żenie dwóch różnych reakcji enzymatycznych. Na 
przykład, związanie substratu lub uwolnienie pro¬ 
duktu reakcji w jednym z centrów katalitycznych może 
wywoływać zmianę konformacyjną w cząsteczce 
białka, która w wyniku konformacyjnego sprzężenia 
dalekiego zasięgu indukuje aktywację centrum kata¬ 
litycznego innej reakcji biochemicznej. Przypuszcza 
się, że tego typu mechanizm może być odpowiedzial¬ 
ny za sprzężenie transportu elektronów i syntezy ATP 
z ADP w procesie oddychania w mitochondriach (-> 
Organizacja procesów życiowych komórki). Zmiana 
stanu utlenienia atomu żelaza w cytochromie C, jed¬ 
nym z białek tworzących łańcuch transportu elektro¬ 


nów, wywołuje w nim rozległą zmianę konformacyjną, 
która reguluje aktywność ATPazy — enzymu sąsia¬ 
dującego z nim w kompleksie supercząsteczkowym. 
W ten sposób obywa się przemiana chemicznej energii 
substratów łańcucha oddechowego w energię ATP — 
uniwersalne źródło energii chemicznej w komórce. 


Regulacja funkcji błon komórkowych 

Zbliżone swym charakterem do przejść fazowych 
ciekłych kryształów przejścia konformacyjne w po¬ 
dwójnych warstwach fosfolipidowych błon komórko¬ 
wych (-► Błony komórkowe. Ciekłe kryształy) od¬ 
grywają prawdopodobnie istotną rolę w regulacji ich 
różnorodnych funkcji. Doświadczenia z modelowymi 
błonami pokazują, że w podwójnej warstwie lipido¬ 
wej duża część energii swobodnej układu związana 
jest z oddziaływaniami elektrostatycznymi polarnych 
i zjonizowanych grup fosfoestrowych na jej powierz¬ 
chni. Zmiany gęstości powierzchniowej ładunku, a tym 
samym i powierzchniowego potencjału elektrycznego 
błony, wywołane przesunięciem równowagi dysocjacji 
kwasowej tvch ktud oraz adsorpcją na ich powierzchni 
jonów metali dwuwartościowych (Ca ++ ), przesuwają 
równowagę fazową uporządkowania łańcuchów wę¬ 
glowodorowych we wnętrzu warstwy. Obniżenie 
gęstości ładunku zwiększa stan uporządkowania łań¬ 
cuchów, podczas gdy jego wzrost wywołuje odwrotny^ 
efekt. Jony Na + i K + obniżają potencjał powierzchnio-^ 
wy błony zwiększając stopień dysocjacji kwasowej 
grup fosfoestrowych i obniżając temperaturę przejścia 
fazowego. Natomiast jony H + i Ca ++ ulegają adsorp¬ 
cji na powierzchni błony, redukują jej ujemny ładu¬ 
nek powierzchniowy i zwiększają temperaturę przejś¬ 
cia. Tak więc przejścia fazowe wywołane w stałej tem¬ 
peraturze działaniem jednego czynnika, np. H+, Na+, 
zgodnie z kooperatywnymi właściwościami układu 
wywołują duże zmiany w równowadze wiązania 
przez błonę wapnia Ca++. Błona może zatem być 
kontrolowanym rezerwuarem jonów wapnia, odgry¬ 
wających istotną rolę regulacyjną w wielu procesach, 
np. w regulacji skurczu mięśnia oraz w funkcjonal¬ 
nym sprzężeniu rodopsyny z zakończę niami syna¬ 
ptycznymi układu nerwowego w narządzie wzroku. 

W naturalnych błonach biologicznych cząsteczki 
białek, spełniające różnorodne funkcje enzymatyczne, 
transportowe i sygnalizacyjne, są „zanurzone” w war¬ 
stwach lipidowych. Zapewnia to wzajemne sprzężenie 
konformacyjne warstwy lipidowej i białek oraz białek 
między sobą, a tym samym powiązanie funkcjonalnej 
błony i cząsteczek białek. 


Regulacja skurczu mięśnia 

Innym, bardziej złożonym przykładem powiązań 
funkcjonalnych zachodzących dzięki kooperatywnym 
zmianom w molekularnej organizacji układu jest 
włókno mięśniowe. W tym wypadku kooperatywne 
oddziaływania elementów jego budowy obejmują całą 
komórkę. Złożony proces przemiany energii chemicz¬ 
nej w energię mechaniczną w trakcie skurczu włókien 
mięśniowych przejawia się jako widoczne pod mikro¬ 
skopem przesuwanie się cienkich (aktynowych) fila- 
mentów względem nieruchomych filamentów grubych 
(miozynowych) ku centralnej części sarkomeru (—► 
Molekularne podstawy skurczu mięśnia). Proces ini¬ 
cjowany jest przez jony Ca +2 uwalniane z błony sia¬ 
teczki sarkoplazmatycznej komórki mięśniowej w wy¬ 
niku pobudzenia przez impuls nerwowy. Zarówno na¬ 
pięcie mięśnia jak i szybkość hydrolizy cząsteczki ATP 
(źródła chemicznej energii dla pracy mięśnia), związa¬ 
nej z miozyną, krytycznie zależą od stężenia jonów 
wapnia w sposób typowy dla procesów kooperatyw¬ 
nych (rys. 12). 

Kooperatywność procesu makroskopowego jest 
wynikiem ciągu następujących po sobie kooperatyw- 
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nych zmian w molekularnej organizacji włókna mięś¬ 
niowego, inicjowanych przyłączeniem jonów Ca+ 2 do 
jednej z pod jednostek troponiny — białka regulujące¬ 
go skurcz, składnika filamentów cienkich. Związanie 


napięcie mięśnia 7 =. 



Rys. 12. Napięcie 
mięśnia i aktywność 
miofibrylarnej ATP- 
azy w zależności od 
stężenia jonów Ca + * 
(pCa + * ujemny loga- 
rytm stężenia); wg 
A. Weber Functional 
Linkage w Biomole- 
cular Systems, New 
York 1975 


jonów wapnia wywołuje przejście konformacyjne w 
troponinie, które pociąga za sobą zmianę położenia 
innego białka regulującego, obecnego w filamencie 
cienkim — tropomiozyny, względem tworzących 
rdzeń filamentu czesteczek aktyny. W ten sposób, 
w wyniku przyłączenia jonów Ca 2+ do jednej cząstecz¬ 
ki troponiny zostają odsłonięte miejsca reagowania 
z miozyną w siedmiu sąsiadujących ze sobą monome¬ 
rach Iaktyny. Łącząc się z globulamymi zakończenia¬ 
mi cząsteczek miozyny w grubym filamencie, stano¬ 
wiącym część tzw. poprzecznych mostków miozyno- 
wych, aktyna przyspiesza hydrolizę ATP w centrum 
katalitycznym miozyny zlokalizowanym w mostku. 
W trakcie hydrolizy zachodzi zmiana konformacji za¬ 
równo globulamej jak i liniowej części cząsteczki mio¬ 


zyny tworzącej mostek, a jej wynikiem jest przesunię¬ 
cie cienkiego filamentu względem grubego. Także 
uporządkowanie cząsteczek miozyny w grubym fila¬ 
mencie, przejawiające się w helikalnym ułożeniu ich 
globulamych zakończeń wzdłuż osi filamentu, ma 
charakter kooperatywny i kontrolowane jest przez stę¬ 
żenie elektrolitu. 

Mimo stosunkowo dobrze poznanej molekularnej 
organizacji włókien mięśniowych oraz zachodzących 
w niej w trakcie skurczu zmian, ciągle hipotetyczny fizyczny 
jest charakter sił powodujących przesuwanie się fila- modeS skur- 
mentu aktynowego. Wiele przesłanek doświadczał- czu mięśnia 
nych wskazuje na istotne znaczenie w tym procesie od¬ 
działywań elektrostatycznych między cyklicznie gene¬ 
rowanymi centrami na powierzchni stykających się 
filamentów w trakcie „włączania” aktyny przez jony 
Ca +2 oraz hydrolizy ATP w zakończeniach mostków 
poprzecznych miozyny (powstają wówczas aniony 
dwufosforanu adenozyny i kwasu fosforowego). Rów¬ 
nież zmiany w elastyczności konformacji mostków 
związane z hydrolizą ATP niewątpliwie odgrywają 
w nim rolę. Dzięki elastyczności budowy filamentów 
pojawienie się siły odpychającej, skierowanej po¬ 
przecznie do nich, musi powodować izometryczne na¬ 
pięcie mięśnia wzdłuż osi filamentów i jego skurcz 
w wyniku przesunięcia się filamentów cienkich. Elek¬ 
trostatyczne oddziaływania odpychające między fila- 
mentami oraz elastyczność ich budowy leżą u podstaw 
wielu modeli skurczu mięśnia, opisujących fizjologicz¬ 
ne i termodynamiczne właściwości mięśni. W mole¬ 
kularnym mechanizmie skurczu mięśnia dopatrujemy 
się obecnie ogólniejszych praw rządzących ukierun¬ 
kowanym ruchem makrocząsteczek w cytoplazmie. 

L. A. Blumenfeld Problemy fizyki biologicznej .Warszawa 1978; 

W. N. Cwietkow i in. Struktura makrocząsteczek w roztworach , 

Warszawa 1968; W. Hoppe i in. Biophysik, Berlin 1977; H. Mo¬ 
ra wetz Fizykochemia roztworów makrocząsteczek, Warszawa 
1970; F. O. Schmitt i in. Functional linkage in biomolecular 
systems. Nowy Jork 1975; M. W. Wolkjensztein Biologia mole¬ 
kularna, Warszawa 1969; M. W. Wolkensztejn Molekularna - 
ja biofizika , Moskwa 1975. 


Organizacja procesów życiowych 
komórki 

Tadeusz Kłopotowski 


Planeta nasza zamieszkała jest przez ogromną liczbę 
różnych gatunków organizmów. Różnią się one 
między sobą nie tylko wielkością i kształtem, lecz 
również odmiennymi warunkami życia oraz stopniem 
złożoności ich budowy i procesów fizjologicznych. 

Zróżnicowanie świata żywego rozpoczyna się od 
form tak prostych jak bakteriofagi i wirusy, które 
zawierają jedynie kwasy nukleinowe (RNA lub DNA) 
i są otoczone warstwą identycznych cząsteczek biał¬ 
kowych oraz mają struktury niezbędne do wniknięcia 
lub wstrzyknięcia samych tylko kwasów nukleino¬ 
wych do komórek. Bakteriofagi i wirusy nie wykazu¬ 
ją żadnej przemiany materii poza komórkami. DNA 
bakteriofagu po wniknięciu do komórki jest włącza¬ 
ny w określone mu miejsce w chromosomie albo też 
zawarte w tym chromosomie geny podlegają proceso¬ 
wi uaktywnienia. W tym drugim wypadku następują 
kolejno zmiany w metabolizmie komórki: produkcja 
swoistych białek regulatorowych i enzymów, replika¬ 
cja DNA pasożyta, uformowanie nowych bakteriofa¬ 
gów, które po rozpadzie komórki wydobywają się do 
otoczenia. Po napotkaniu nowych wrażliwych komó¬ 
rek cykl ten się powtarza od wniknięcia, przez mo¬ 
ment decyzji — integracja lub ekspresja informacji 
— do stabilizacji lub mnożenia się. 

Najprostszymi organizmami, czyli jednostkami 
zdolnymi do samodzielnej wegetacji, są bakterie. Są 
to twory jednokomórkowe, zdolne do samodzielnego 


metabolizmu i reprodukcji bez związku z innymi 
komórkami. Istnieje ogromna liczba gatunków bak¬ 
terii. Różnią się one swoją budową genetyczną, 
a przez to strukturą poszczególnych elementów bu¬ 
dowy, przebiegiem dróg metabolicznych i wymogami 
życiowymi. Bakterie autotroficzne nie wymagają do 
życia żadnych związków organicznych z zewnątrz, 
inne zwane prototroficznymi, wymagają jedynie glu¬ 
kozy. Niektóre gatunki bakterii żyjące w organizmach 
roślinnych lub zwierzęcych wymagają do swego wzro¬ 
stu również i innych związków organicznych z zew¬ 
nątrz, np. witamin i aminokwasów. Ewolucja wy¬ 
kształciła gatunki bakterii o różnych możliwościach 
przystosowywania się do zmiennych warunków zew¬ 
nętrznych: do głodu względnego — przez zatrzymanie 
jednych, a uruchomienie drugich szlaków metabo¬ 
licznych, do życia w ciemności lub wykorzystywania 
energii świetlnej, do życia w warunkach tlenowych lub 
beztlenowych. Zakres zdolności adaptacyjnych jest 
cechą charakterystyczną danego gatunku i jest zde¬ 
terminowany genetycznie. Ponieważ materiał gene¬ 
tyczny, DNA, jest narażony na mutacje, czyli przypad¬ 
kowe zmiany składu chemicznego, wszystkie gatunki, 
i to nie tylko bakterii, wykształciły w procesie ewo¬ 
lucji systemy enzymatyczne naprawy tych zmian. 

Informacja genetyczna dla pełnego cyklu repro- prokarionty 
dukcji bakterii oraz różnych procesów metabolicz¬ 
nych i adaptacyjnych zawarta jest w pojedynczych 
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kolistych cząsteczkach DNA. Na tej podstawie 
wszystkie zbadane pod tym względem bakterie zo¬ 
stały nazwane organizmami prokariotycznymi (pro- 
kariontami). 

Stojące wyżej w rozwoju świata żywego organizmy 
eukariotyczne (eukarionty) mają w każdej komórce 
po kilka lub nawet kilkadziesiąt różnych chromoso¬ 
mów, będących linearnymi cząsteczkami DNA, 
zwykle w kompleksach z białkami. Stanowią one za¬ 
sadniczą część jąder komórkowych, tworów otoczo¬ 
nych błonami o wybiórczej przepuszczalności. Naj¬ 
prostszymi eukariontami są drożdże i niektóre grzyby 
zdolne do bytu jednokomórkowego. Wszystkie orga¬ 
nizmy wielokomórkowe, zarówno rośliny jak i zwie¬ 
rzęta, są eukariontami. 

Komórki organizmów wyższych są zróżnicowane 
i tworzą odrębne tkanki, czyli zespoły komórek o ta¬ 
kiej samej budowie i funkcji. Zróżnicowanie komórek 
polega na tym, że mają one nie wszystkie funkcje zako¬ 
dowane w ich DNA, ale tylko ich część. W porówna¬ 
niu z komórkami prokariotycznymi mają one ograni¬ 
czone zdolności adaptacyjne, a wiele ich funkcji 
nie służy ich własnej wegetacji, lecz celom niezbęd¬ 
nym do trwania, rozwoju lub reprodukcji całego orga¬ 
nizmu. Kombinacje tkanek tworzą wyspecjalizowane 
narządy, takie jak: wątroba, serce, mózg. 
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Rys. 1. Masa składników komórkowych i komórek 


Złożoność świata żywego i rozmaitość struktury 
i funkcji jego podstawowych elementów, czyli komó¬ 
rek, powoduje oczywiste trudności we wszelkich pró¬ 
bach zwięzłego przedstawienia systemów organizacji 
procesów życiowych. Trudności te są tym większe, 
że tylko niektóre z tych procesów zostały poznane 
na tyle, by można było przedstawić choćby najważ¬ 
niejsze uczestniczące w nich cząsteczki, a także ich 
oddziaływania. A jeśli już do tego doszło, to poznane 
procesy mają często ograniczony zasięg występowania 
w świecie żywym (rys. 1). 


Strukturalne elementy komórek 


Każda komórka jest tworem oddzielonym od środo¬ 
wiska zewnęrznego lub innych komórek układem 
błon (-> Błony komórkowe). Funkcja tych błon polega 
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na zabezpieczeniu stałości środowiska wewnętrznego 
komórki przez ograniczenie swobodnej dyfuzji skład¬ 
ników znajdujących się w jej wnętrzu na zewnątrz, 
jak również związków chemicznych, znajdujących 
się w otoczeniu, do wnętrza komórki. Ponadto, błony 
te stanowią siedzibę układów transportujących selek¬ 
tywnie związki chemiczne oraz receptorów służących 
do rozpoznawania zmian środowiska lub innych, bar¬ 
dziej swoistych bodźców. 

Poszczególne błony danej komórki mają różną bu¬ 
dowę chemiczną i mało jeszcze wiadomo o poprzecz¬ 
nych powiązaniach między nimi. U niektórych bak¬ 
terii błona najbardziej zewnętrzna jest oddzielona od 
tzw. sztywnej ściany przestrzenią peryplazmatyczną. 
Zachowuje ona własne środowisko osmotyczne, lecz 
jest względnie łatwo dostępna dla związków chemicz¬ 
nych pochodzących z zewnątrz. W przestrzeni pery- 
plazmatyćznej nie zachodzą żadne reakcje wymagające 
energii. Zawiera ona enzymy hydrolizujące estry lub 
naturalne polimery, a także białka uczestniczące 
w aktywnym transporcie, który dopiero w dalszych 
etapach wymaga nakładu energii. 

Najpowszechniejszym elementem funkcjonalnym 
błon komórkowych są liczne, lecz mało poznane kom¬ 
pleksy transportujące selektywnie proste jony lub nie 
zjonizowane związki chemiczne. Poznano ich właści¬ 
wości kinetyczne, ale tylko w nielicznych wypadkach 
udało się zidentyfikować białka uczestniczące w tych 
procesach. Stwierdzono np., że enzymy fosforylujące 
cukry są silnie związane z błonami bakterii i udowod ¬ 
niono, że fosforylacja ta jest niezbędna do pobierania 
prostych cukrów z zewnątrz. W błonach komórek 
zwierzęcych znajduje się enzym, umożliwiający do¬ 
starczanie energii do procesu wymiany kationów 
wbrew gradientom stężeń. 

W błonach bakterii zlokalizowane są enzymy ukła¬ 
du oddechowego niezbędnego w gospodarce energe¬ 
tycznej komórki oraz specjalne struktury przetwa¬ 
rzające energię metaboliczną na ruch rzęsek. Dzięki 
temu mogą się one kierować w stronę większych stę¬ 
żeń potrzebnych im związków chemicznych. Zdolność 
tę nazwano chemotaksją. Układ czuciowy służący do 
rozpoznawania gradientów tych związków lub 
związków toksycznych jest zlokalizowany w błonach, 
lecz jedynymi poznanymi dotąd składnikami 
tego układu są wspomniane wyżej białka prze¬ 
strzeni peryplazmatycznej, uczestniczące również 
w aktywnym transporcie. 

Wnętrze komórki stanowi cytoplazma. W płynnym 
składniku cytoplazmy, zwanym ostatnio cytosolem, 
zachodzą procesy metaboliczne. W cytoplazmie znaj¬ 
dują się elementy strukturalne, takie jak jądro oraz 
inne, zwane ogólnie organellami. Jądro i organelle 
mają własne błony o selektywnej przepuszczalności, 
która zapewnia im autonomię środowiska wewnętrz¬ 
nego. 

Zasadniczym składnikiem jąder są chromosomy, 
które są nośnikami informacji genetycznej. Komórki 
eukariotyczne mają w jądrach podwójne komplety 
chromosomów odziedziczone po rodzicach. Dzięki 
temu każdy ich gen występuje w dwu wersjach rodzi¬ 
cielskich. W danej komórce tylko niektóre pary genów 
są aktywne, tzn. podlegają procesowi transkrypcji, 
której produktem jest komplementarny mRNA (-> 
Kwasy nukleinowe). 

Aktywność genów jest regulowana w zależności od 
bodźców wewnętrznych lub zewnętrznych, które mo¬ 
gą być m.in. przenoszone przez rekacje hormonów 
ze swoistymi receptorami na powierzchni komórek. 
W jądrach znajdują się składniki układu replikacji 
chromosomów i ich segregacji, zapewniające komór¬ 
kom potomnym otrzymanie takich samych kompletów 
chromosomów. Tylko niektóre bardzo wyspecjalizo¬ 
wane komórki, np. krwinki czerwone ssaków, nie 
mają jąder. 

Organellami powszechnie występującymi w orga¬ 
nizmach eukariotycznych są mitochondria. Ich głów¬ 
ną, a może nawet jedyną rolą w komórce jest przetwa- 
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rzanie energii chemicznej metabolitów w energię wy¬ 
sokoenergetycznych pirofosforanowych wiązań ATP. 
{Elektrony uwolnione z utlenianych związków są 
przenoszone wzdłuż łańcucha swoistych białek, w tym 
cytochromów (~> Białka), o coraz to wyższych po¬ 
tencjałach utleniania i redukcji. Przypuszcza się, że 
przestrzenne usytuowanie tych białek względem siebie 
sprzyja procesowi transportu elektronów. Są one 
zlokalizowane na ułożonych równolegle przegrodach 
nadających obrazom uzyskanym za pomocą mikro¬ 
skopu elektronowego charakterystyczny wygląd. 
Ważnym elementem mitochondriów jest ich błona, 
gdyż jej potencjał jest najistotniejszym elementem 
w procesach przekształcania energii. W komórce 
bakterii funkcję tę spełnia błona komórkowa. 

Mitochondria zawierają własne koliste cząsteczki 
DNA o wielkości odpowiadającej ok. jednej setnej 
chromosomu bakterii. Treść genetyczna tego DNA 
najlepiej jest poznana u drożdży piekarskich, będą¬ 
cych najprostszymi organizmami eukariotycznymi. 

Mitochondria mają odrębny układ biosyntezy biał¬ 
ka. Jego składniki i właściwości przypominają bak¬ 
teryjny układ biosyntezy białka. Podobieństwo to 
dotyczy np. wielkości rybosomów oraz wrażliwości 
biosyntezy na niektóre antybiotyki. Dało ono asumpt 
hipotezie, że we wczesnych etapach ewolucji doszło 
do symbiozy jakichś prabakterii i innych komórek. 
W dalszych jej etapach powstały komórki eukario¬ 
tyczne z mitochondriami jako reliktami tych pra¬ 
bakterii. 

Komórki roślinne zawierają organelle nazywane 
chloroplastami, które są miejscem, gdzie przebiegają 
procesy fotosyntezy. Zasadniczym ich składnikiem 
są barwniki, takie jak chlorofil, umożliwiające wyko¬ 
rzystanie energii słonecznej. Podobnie jak mito¬ 
chondria, chloroplasty zawierają DNA i mają układ 
biosyntezy białka podobny do bakteryjnego. Podobna 
jest też hipoteza ich powstania w dawnych etapach 
ewolucji. 

Wiele ważnych procesów metabolicznych zachodzi 
poza omówionymi już elementami strukturalnymi ko¬ 
mórki, w jej płynnym składniku — cytosolu. Są to 
zarówno procesy kataboliczne, z których najważniej¬ 
szym jest glikoliza czyli przemiana glukozy poprzez 
estry fosforowe do pirogronianu, jak i liczne procesy 
anaboliczne, polegające na syntezie elementów struk¬ 
tury komórkowej z prostych metabolitów'. 

Najważniejszym procesem anabolicznym jest bio¬ 
synteza białka. Głównymi czynnikami w tym procesie 
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są informacyjne RNA, tzw. mRNA (-► Kwasy nu¬ 
kleinowe), będące rybonukleinowymi wersjami ge¬ 
nów, rybosomy, tj. makrocząsteczkowe kompleksy 
swoistego RNA z kilkudziesięcioma różnymi biał¬ 
kami, kilkadziesiąt różnych tRNA, z których każdy 
jest związany z właściwym mu aminokwasem, wiele 
białek o swoistych funkcjach oraz ATP i GTP (gua- 
nozynotrójfosforan) jako źródła energii dla tworzenia 
wiązań peptydowycb. W trakcie procesu translacji są 
syntetyzowane białka wg programu zakodowanego 
w mRNA. 

U bakterii proces ten zachodzi w całej cytoplazmie 
i nie wykazuje żadnej szczególnej lokalizacji. W ko¬ 
mórkach eukariotycznych natomiast znaczna część 
biosyntezy białka zlokalizowana jest na powierzchni 
błoniastego labiryntu stanowiącego tzw. siateczkę siateczka 
endoplazmatyczną. Ważną jej funkcją jest wytwarza- endoplaz- 
nie błony jądrowej. Przypuszcza się, że związek bio- matyczna 
syntezy białka z siateczką endoplazmatyczną umożli¬ 
wia odpowiednie rozprowadzenie mRNA, a także 
nowo utworzonych białek, szczególnie tych, które 
mają być przemieszczone w kierunku powierzchni 
komórki — ku jej błonom lub na zewnątrz. Białka te 
zostają przeniesione do innego błoniastego układu 
zwanego aparatem Golgiego. W jego woreczkowa- aparat 
tych elementach (wakuolach) białka ulegają mody- Golgiego 
fikacjom, np. glikozylacji przez przyłączenie reszt 
cukrowych. Wakuole są zróżnicowane czynnościowo: 
jedne służą do transportu nowo zsyntetyzowanych bia¬ 
łek do miejsca ich przeznaczenia — tzn. do błony 
lub na zewnątrz komórki, inne transportują stamtąd 
związki chemiczne i jednocześnie odpowiednio je 
przekształcają. Szczególnymi wakuolami są lizosomy, 
zawierające enzymy, których ostatecznym przezna¬ 
czeniem może być zniszczenie komórki po jej obu¬ 
marciu. Inną funkcję mają peroksysomy, zawierające 
enzymy katalizujące utlenianie związków chemicz¬ 
nych przy użyciu nadtlenku wodoru. 


Podstawowe procesy 
metaboliczne 


Do przebiegu procesów życiowych wszystkich ko¬ 
mórek jest potrzebna energia. Pierwotnym źródłem 
energii dla świata żywego na Ziemi jest Słońce. 
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fotosynteza Energia jego promieniowania jest zamieniana w chlo¬ 
roplastach roślin i niektórych bakterii na energię 
wysokoenergetycznych wiązań pirofosforanowych 
w cząsteczce ATP, będących głównymi nośnikami 
biologicznej postaci energii (jest to tzw. proces foto¬ 
syntezy). W chloroplastach znajdują się 2 układy zło¬ 
żone z chlorofilu oraz układów przenośników elektro¬ 
nów, różnych dla każdego z tych układów (rys. 2). 
Absorpcja fotonu przez chlorofil układu U umożliwia 
hydrolizę wody i dostarczenie wzbudzonego elektronu 
do łańcucha utleniająco-redukujących przenośników. 
Jego przenoszenie przez kolejne ogniwa tego łańcucha, 
aż do chlorofilu układu / powoduje wytworzenie dwu 
wysokoenergetycznych wiązań pirofosforanowych. 
Absorpcja następnego fotonu przez chlorofil układu I 
sprawia, że wzbudzony elektron dostaje się do innego 
łańcucha przenośników. To przenoszenie elektronów, 
zgodnie z ich potencjałem utleniania-redukcji pro¬ 
wadzi do redukcji cząsteczki NADP, związku będą¬ 
cego koenzymem wielu enzymów utleniająco-re¬ 
dukujących (-*■ Białka). Cząsteczka NADP może ulec 
utlenieniu w innym układzie przenośników utlenia¬ 
jąco-redukujących, a część zawartej w niej energii 
może przejść w energię trzech wysokoenergetycznych 
wiązań pirofosforanowych ATP. 

Zmagazynowanie energii słonecznej w ATP umoż¬ 
liwia przebieg endoergicznej reakcji aktywacji węgla¬ 
nu i przyłączenia go do rybulozodwufosforanu. W wy¬ 
niku tej reakcji powstają dwie cząsteczki fosfoglice- 
rynianu. Ich przemiany regenerują rybulozodwufos- 
foran, który może reagować z następną cząsteczką 
aktywnego węglanu. Sześciokrotne powtórzenie tego 
cyklu prowadzi w ogólnym bilansie przemian do 
powstania jednej cząsteczki glukozy, 
glikoliza Glukoza ulega glikolizie, dzięki czemu staje się 
rodłem zredukowanego węgla, tlenu i wodoru dla 
prawie wszystkich procesów biosyntetycznych roślin. 
W ciemnościach oraz w tych częściach roślin, które 
•nie mają _chloroplastów, jest ^ona również źródłem 
energii. Tę podwójną funkcję dostarczania energii 
oraz węgła i wodoru — spełnia glukoza również i dla 
przeważającej większości innych organizmów ży- 
wych. 

Schemat wykorzystania glukozy ma niewiele 
wariantów, w świecie żywym. Przemiana glukozy wy¬ 
stępująca najpowszechniej, została zbadana przez 
H. Embdena, O. Meyerhofa i J. Parnasa (rys. 3). Po 
przyłączeniu fosforanu cząsteczka tego cukru ulega 
kolejnym przekształceniom, w których wyniku pow¬ 
stają dwie cząsteczki pirogronianu, a część uwolnio¬ 
nej energii zostaje zachowana w postaci wysokoener¬ 
getycznych wiązań ATP i zredukowanych cząsteczek 
NAD, innego koenzymu reakcji utleniania — redukcji. 
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Rys. 3. Szlak przemian glukozy do 
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Odmienny rodzaj przemian glukozy prowadzi przez 
estry fosforanowe mające 3, 4, 5, 6 lub 7 atomów 
węgla. Są to w zasadzie te same reakcje, które uczest¬ 
niczą w procesie asymilacji węglanu i syntezie glu¬ 
kozy. U organizmów niezdolnych do fotosyntezy ten 
cykl fosfopentozowy przemian glukozy służy głównie 
do produkcji fosfory boży, potrzebnej do syntezy kwa¬ 
sów nukleinowych oraz zredukowanego NADP nie¬ 
zbędnego dla redukcyjnych procesów biosyntetycz¬ 
nych, takich jak wiązanie atmosferycznego azotu 
u niektórych bakterii lub synteza kwasów tłuszczo¬ 
wych u wszystkich organizmów. 

Jednakże 'najważniejszym'i ~naj powszechniejszy rn 
sposobem odzyskiwania energii z glukozy jest proces 
przemian pirogronianu. Ulega on utlenieniu i odłą¬ 
czaniu C0 2 z udziałem kilku koenzymów i oczywiście 
swoistego enzymu. Produktami tej reakcji są acety- 
lo-koenzym A, zredukowany NAD i dwutlenek węgla. 
Acetylo-koenzym A reaguje ze szczawiooctanem. 
Powstający z tej reakcji cytrynian jest metabolizo- cykl 
wany w dalszych etapach cyklu Krebsa. Polega on na Krebsa 
dziesięciu reakcjach, w wyniku których ze szczawio- 
octanu i acetylo-KoA powstają dwie cząsteczki dwu¬ 
tlenku węgla, szczawiooctan oraz 13 równoważników 
wysokoenergetycznego wiązania pirofosforanowego 
w^postaci, m.in., zredukowanych koenzymów NAD, 

NADP i FAD. Przebieg tych reakcji zob. rys. 4. 
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Rys. 4. Cykl Krebsa 
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W procesie utleniającej fosforylacji zredukowane utleniająca 
koenzymy ulegają utlenieniu i przekazują elektrony fosforylacja 
do układu utleniająco-redukującego złożonego z kilku 
białek Gest to schematycznie przedstawione na rys. 5). 

Kolejne ich przeniesienie do ogniwa o coraz to wyż¬ 
szym potencjale utleniania-redukcji powodują wyda¬ 
lanie protonów na zewnątrz błony (mitochondriów, 
chloroplastów lub komórek bakteryjnych). Wytwarza 
to potencjał, który jest wykorzystywany albo bezpo¬ 
średnio do procesów transportu przez błony albo też 
do reakcji nieorganicznego fosforanu z ADP. Na sku¬ 
tek tej reakcji powstają nowe wysokoenergetyczne 
wiązania pirofosforanowe. Przedstawia to schema¬ 
tycznie rys. 6. 

ATP jest głównym i najbardziej bezpośrednim metabolizm 
źródłem energii w procesach metabolicznych komór- energetyczny 
ki, w tym dla wszystkich procesów nieredukcyjnych. 

W wyniku tych reakcji ulega on rozpadowi na ADP 
i fosforan lub AMP i pirofosforan. W niektórych 
reakcjach bierze udział GTP, lecz jego wiązania wy¬ 
sokoenergetyczne pochodzą przeważnie z ATP. 

Jak już wspomniano, w wielu procesach redukcyj¬ 
nych, takich jak wiązanie azotu atmosferycznego 



lub synteza kwasów tłuszczowych dawcą energii jest 
zredukowany koenzym NADP. 
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f 

ł- 


„ wewnętrzna błona 
mitochondriów 



Cechy metabolizmu energetycznego są prawie uni¬ 
wersalne dla świata żywego. Natomiast wykorzysta¬ 
nie energii, a raczej cele, na które jest wydatkowana, 
są różne i zależą od natury komórek i warunków ich 
bytu. Rośliny i bakterie fotosyntetyzujące wykorzys¬ 
tują mineralne źródła azotu i siarki. Syntetyzują one 
wszystkie związki organiczne niezbędne do kon¬ 
strukcji komórek, a także do pewnych reakcji na 
środowisko zewnętrzne. Natomiast wiele bakterii 
i grzybów oraz wszystkie organizmy zwierzęce wy¬ 
magają do życia związków organicznych — glukozy, 
niektórych aminokwasów oraz witamin. Dzięki ogra¬ 
niczaniu liczby procesów biosyntetycznych zwierzęta 
zyskiwały w coraz większym stopniu mechanizmy 
zwiększające ich niezależność od środowiska. Tak 
więc, wszystkie zwierzęta zużywają wiele energii na 
ruch (—► Molekularne podstawy skurczu mięśnia), 
a stałocieplne również na utrzymanie temperatury 
ciała. 

Cały metabolizm komórkowy, w tym i energetycz¬ 
ny, jest rezultatem reakcji katalizowanych przez biał¬ 
ka o swoistym działaniu na inne związki chemiczne, 
czyli enzymy (—► Białka). Wszystkie reakcje chemicz¬ 
ne tu omawiane, czy wspominane, są katalizowane 
przez swoiste enzymy, nie wymieniane tylko dlatego, 
aby zachować jasność tekstu. 

Każda jednostkowa reakcja metabolizmu jest kata¬ 
lizowana przez odrębny enzym. Rzadkimi odstęp¬ 
stwami od tej reguły są reakcje katalizowane przez 
kilka enzymów o podobnej funkcji katalitycznej oraz 
zupełnie wyjątkowe sytuacje, kiedy ten sam enzym 
katalizuje dwie różne reakcje. 

Metabolizm komórkowy musi być koordynowany 
tak, by najbardziej celowo wykorzystać dostępne pro¬ 
dukty. W przeciwnym wypadku komórka byłaby wy¬ 
eliminowana w drodze ewolucji przez inne, bardziej 
sprawne. Niezrównoważona akumulacja niektórych 
pośrednich produktów metabolizmu prowadzi bo¬ 
wiem nie tylko do marnotrawienia energii, ale również 
i do pewnych efektów toksycznych. Akumulacja ga- 
laktozo-1-fosforanu np. zatrzymuje całość metaboliz¬ 
mu bakterii, a u dzieci z defektami galaktozoepimera- 
zy prowadzi do ogólnego niedorozwoju, niekiedy śle¬ 
poty lub nawet śmierci. 

Rezultat pracy enzymu zależy od stężenia jego 
substratów. Ciąg reakcji enzymatycznych, np. bio¬ 
synteza jakiegoś aminokwasu, przebiega z wydajnoś¬ 
cią zdeterminowaną przez enzym o najniższej aktyw¬ 
ności. Jednakże ewolucja wykształciła systemy re¬ 
gulacyjne, działające na zasadzie sprzężenia zwrot¬ 
nego (inhibicja zwrotna). Ich działanie sprawia, że 
raczej zapotrzebowanie na produkt końcowy szlaku 
metabolicznego niż stężenia jego substratów decydują 
o sumarycznej wydajności. Otóż enzymy kluczowe 
dla wydajności szlaków metabolicznych, są to z re¬ 
guły enzymy katalizujące pierwsze reakcje tych szla¬ 
ków, mają one centra niezależne od centrów aktyw¬ 
nych, które wykazują powinowactwo do pewnych 
produktów końcowych szlaków metabolicznych, na¬ 
zywanych efektorami inhibicji zwrotnej. Na przykład 
pierwszy enzym biosyntezy histydyny — syntetaza fos- 
forybozylo-ATP ma oprócz centrum aktywnego, 
w którym reagują kosubstraty reakcji ATP i fosfo- 
rybozylopirofosforan, inne centrum, do którego 
wykazuje powinowactwo L-histydyna. Przyłączenie 
L-histydyny powoduje taką zmianę konformacji 
enzymu, że centrum aktywne ulega przestrzennej 
deformacji, co prowadzi do obniżenia jego zdol¬ 
ności katalizowania syntezy fosforybozylo-ATP. En¬ 
zymy, a ogólniej rzecz biorąc — białka, które mogą 
zmienić swą konformację i aktywność w wyniku 
współdziałania z efektorami biologicznie korzystnymi, 
nazwano allosterycznymi. 

Odrębny mechanizm regulacyjny działa dzięki pro¬ 
cesowi syntezy enzymów. Struktura poszczególnych 
enzymów jest zakodowana w DNA chromosomu każ¬ 
dej komórki. Odpowiedni odcinek DNA nazywa się 
genem struktury. 
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W bezpośrednim sąsiedztwie genu struktury znaj¬ 
dują się inne geny, które określają jego ekspresję 
(aktywność). Taka funkcjonalna jednostka genomu 
operon bakterii, która może zawierać większą liczbę genów 
struktury nazywa się operonem. Geny, które decydują 
o ilości wytwarzanych enzymów znajdują się zawsze 
w jednym końcu operonu i ich nadrzędne działanie 
rozciąga się na cały operon. 

Znane są dwa rodzaje współdziałających ze sobą 
promotor i nadrzędnych genów operonu. Promotor jest genem 
operator warunkującym rozpoczęcie transkrypcji genów struk¬ 
tury przez polimerazę RNA. Usunięcie lub deformacja 
struktury promotora przez mutację prowadzi do bra¬ 
ku transkrypcji podległych genów struktury, co jest 
niezbędnym warunkiem w procesie syntezy odpo¬ 
wiednich enzymów. 

Drugi z tych genów to operator, znajdujący się 
między promotorem a genem struktury. Przyłączenie 
do operatora swoistego białka o odpowiedniej kon¬ 
formacji allosterycznej powoduje wstrzymanie trans- 
represor krypcji. To białko, zwane represorem, jest kodowane 
przez gen nie należący do operonu. Jest ono produ¬ 
kowane stale z taką samą szybkością. Powoduje to 
stały naturalny brak transkrypcji danego operonu. 
Dopiero gdy w komórce znajdą się związki chemiczne 
zmieniające konformację represora i powodujące jego 
niezdolność do łączenia się z operatorem, może dojść 
do ekspresji genów struktury tego operonu. W ten 
sposób jest regulowana ekspresja operonu laktozy 
niektórych bakterii. Pojawienie się w komórkach 
laktozy prowadzi do powstania metabolitów, np. 
galaktozy, które łącząc się z represorem tego operonu 
zmieniają jego konformację, przez co traci on zdol¬ 
ność do wiązania się z operatorem. W rezultacie 
tego następuje ekspresja genów struktury operonu 
w postaci tworzonego swoistego mRNA. W układzie 
biosyntezy białka zachodzi proces translacji informa¬ 
cji zawartej w mRNA i dochodzi do wytworzenia od¬ 
powiednich enzymów. W wypadku operonu lac są 
to (rys. 7): /?-galaktozydaza (gen Z), permeaza (gen Y) 
i transacetylaza (gen A). Biologiczny sens tego mecha¬ 
nizmu jest oczywisty; do syntezy enzymów katabo¬ 
lizmu laktozy dochodzi tylko wówczas, gdy laktoza 
znajdzie się w komórce. 
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Rys. 7. Schemat regulacji operonu laktozy Escherichia coli. 
Promotor i operator oznaczono literami p i o, zaś geny struktury, 
kodujące trzy białka operonu literami Z, Y i A. Aktywny represor 
przedstawiono w kształcie półkola, zaś represor allosterycznie 
zmieniony przez przyłączenie efektora ma na rysunku kształt 
półksiężyca. Cząsteczki polimerazy RNA przestawiono jako 
koła, zaś mRNA jako linie krzywe, a) Stan represji jest skutkiem 
przyłączenia represora do operatora. Uniemożliwia to funkcję 
polimerazy RNA. b) Do indukcji, czyli uaktywnienia operonu 
dochodzi, gdy operator jest wolny, gdyż allosterycznie zmieniony 
represor nie może się do niego przyłączyć. Wówczas kolejne czą¬ 
steczki polimerazy RNA przyłączają się do promotora, a następ¬ 
nie posuwając się wzdłuż DNA operonu syntetyzują mRNA, 
mające strukturę komplementarną do jednej z nici genów struk¬ 
tury 

represja Jednakże, kiedy komórka jest dostatecznie zao- 
kataboliczna patrzona w prostsze źródło węgla i energii, jakim jest 
glukoza, indukcja enzymów katabolizmu laktozy 
ulega ograniczeniu przez inny mechanizm, zwany ka- 


taboliczną represją. Działa on na ekspresję wielu 
układów enzymatycznych, których funkcja polega na 
katabolizmie różnych związków, np. aminokwasów, 
w produkty mogące służyć jako źródła węgla i energii. 

Pośrednim efektorem represji katabolicznej jest 
glukoza. Jej obecność w komórce bakterii powoduje 
zmniejszenie wytwarzania cyklicznego adenozynomo- 
nofosforanu (cAMP) przez związaną z błonami ko¬ 
mórkowymi cyklazę adenylową. Szczegółowy me¬ 
chanizm tego wpływu nie jest znany i nie wiadomo, 
co jest efektorem działającym na cyklazę. Jedyną 
znaną funkcją cyklicznego AMP u bakterii jest two¬ 
rzenie kompleksu ze swoistym białkiem, zwanym 
CRP. Kompleks ten ma powinowactwo do promo¬ 
torów i jego związanie z DNA ułatwia wiązania się 
polimerazy RNA z promotorem, a dzięki temu 
zwiększenie transkrypcji operonu. Dlatego właśnie 
brak cyklicznego AMP w obecności glukozy zmniejsza 
transkrypcję operonów katabolicznych. 

Reasumując, ekspresja operonu laktozy jest regulo¬ 
wana zarówno w zależności od obecności substratów 
dla enzymów kodowanych przez ten operon, jak i od 
zapotrzebowania na produkty przemiany tych sub¬ 
stratów. 

Poznano już kilka operonów bakteryjnych. Każdy 
z nich różni się od innych rodzajem oddziaływania 
białek regulacyjnych na zapoczątkowanie procesu 
transkrypcji przez polimerazę RNA. Od operonu 
laktozy najbardziej się różnią te, których ekspresja 
wymaga obecności swoistych białkowych aktywato¬ 
rów. Ich zdolność do aktywacji procesu transkrypcji 
zależy, podobnie jak w wypadku represora operonu — 
laktozy, od konformacji allosterycznej. Uzyskują ją 
przez wiązanie odpowiednich niskocząsteczkowych 
efektorów. Różnica między nimi polega na tym, że 
związany represor zwiększa ekspresję swego operonu 
przez odłączenie się od niego, związany zaś z efek¬ 
torem aktywator zwiększa ekspresję odpowiedniego 
operonu przez przyłączenie się do jego operatora. 

Poznanie operonu laktozy uwidoczniło jeden ze 
sposobów, w jaki zachodzi regulacja metabolizmu 
w zależności od potrzeb komórki. Jednakże nawet 
rozszerzony model operonu stosuje się jedynie do 
najprostszych organizmów, tj. bakteriofagów i bak¬ 
terii. Już w drożdżach regulacja ta przebiega inaczej 
i na razie nie jest na tyle poznana, by można ją tu 
przedstawić z podobną ilością niewątpliwych szcze¬ 
gółów. 

Represja glukozowa nie jest jedynym przykładem 
nadrzędnego mechanizmu regulacji syntezy enzy¬ 
mów u bakterii. Wykryto, że jon amonowy działa 
jako pośredni efektor represji azotowej. Reguluje ona 
wydajność procesów prowadzących do wytwarzania 
jonu amonowego z innych źródeł, jak np. azotanu 
lub azotu atmosferycznego. Bezpośrednim efektorem 
represji azotowej jest w niektórych bakteriach białko, 
a mianowicie enzym, syntetaza glutaminy. 

Wpływ regulacyjny na syntezę niektórych enzymów 
może wywierać skład gazowy atmosfery. Tlen hamuje 
w nieznany sposób syntezę enzymów redukcji azo¬ 
tanu i azotu atmosferycznego, a indukuje syntezę 
enzymów utleniająco-redukujących, która też, z dru¬ 
giej strony, podlega katabolicznej represji. Natomiast 
efekt Pasteura, czyli zahamowanie glikolizy przez 
tlen nie zachodzi wskutek wpływu tlenu na syntezę 
enzymów glikolizy. 

W komórkach organizmów wyższych, szczególnie 
zwierząt, procesy regulacyjne są bardziej złożone. 
Przyczyną tego jest chyba fakt, że komórki tych or¬ 
ganizmów mają mniejszą samodzielność i przebieg 
ich metabolizmu jest kontrolowany z punktu widzenia 
interesu całego organizmu. W związku z tym komórki 
zwierząt są ze sobą powiązane systemem informacji 
metabolicznej i czynnościowej, tzn. za pomocą sys¬ 
temów, których elementami są hormony (—► Białka). 
Molekularny mechanizm ich działania jest bardzo 
słabo poznany. Receptory poszczególnych hormonów 
znajdują się tylko w tych komórkach, które mają na 
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nie reagować. Receptory hormonów steryd owych mogą 
występować wewnątrz komórek, natomiast receptory 
innych hormonów, np. insuliny czy adrenaliny wy¬ 
stępują tylko w błonach komórkowych. Ich stymu¬ 
lacja przez różne hormony zwiększa aktywność cyk- 
lazy adenylowej i ilość produkowanego przez nią 
cyklicznego AMP. W komórkach zwierzęcych cyklicz¬ 
ny AMP jest aktywatorem kinaz białkowych, czyli 
enzymów przyłączających grupy fosforanowe do 
białka. Przypuszcza się, że powstające w wyniku ich 
działania pochodne są dalszym ogniwem łańcucha 
informacji międzykomórkowej i one, w nieznany 
jeszcze sposób, kierują przebiegiem odpowiednich 
reakcji metabolicznych. Tych kilka informacji o regu¬ 
lacji metabolizmu w komórkach zwierzęcych nie sta¬ 
nowi obrazu tej regulacji, a raczej ilustruje jej złożo¬ 
ność i niepełność aktualnego stanu wiedzy. 

Wiadomo niewątpliwie, że dwa podstawowe me¬ 
chanizmy regulacyjne* a mianowicie inhibicja zwrot¬ 
na oraz indukcja enzymatyczna zachodzą w komór¬ 
kach zwierzęcych. Stwierdzono np. że aktywność 
pierwszego enzymu syntezy puryn wątroby gołębia 
podlega inhibicji przez niektóre nukleozydotrójfos- 
forany. Synteza enzymu wątroby szczura przyłącza¬ 
jącego grupę hydroksylową do policyklicznych węg¬ 
lowodorów może być wywoływana przez substraty 
tych enzymów, ale również przez niektóre hormony. 

Jednym z mechanizmów występujących zarówno 
u bakterii, jak i u organizmów wyższych jest zależ¬ 
ność syntezy rybosomalnego RNA od biosyntezy 
białka. Brak choćby jednego aminokwasu u bakterii 
powoduje zatrzymanie translacji. Wskutek tego do¬ 
chodzi do przemiany GTP w pochodną z grupą piro- 
fosforanową — ppGpp. Związek ten zwiększa trans¬ 
krypcję szeregu operonów kodujących enzymy proce¬ 
sów biosyntetyżujących aminokwasy, a zmniejsza 
transkrypcję genów kodujących rybosomalny RNA. 
Wykazano, że w fibroblastach, niedojrzałych komór¬ 
kach zwierzęcych, zachodzi podobna zależność syn¬ 
tezy rybosomalnego RNA od sprawnego przebiegu 
procesu translacji. 

Uogólniając sprawę mechanizmów regulacyjnych 
u zwierząt, można stwierdzić, że występują u nich me¬ 
chanizmy podobne do tych, które poznano u bakterii 
i innych prostych makroorganizmów, jak również 
działają jeszcze inne mechanizmy, koordynujące me¬ 
tabolizm wielu komórek w celu zapewnienia spraw¬ 
ności całego organizmu. 


SV!echanizmy zachowania 
gatunków i ich ewolucji 

Procesy metabolizmu umożliwiają komórkom uzyska¬ 
nie energii i syntezę składników niezbędnych do ich 
podział wzrostu. Jego kulminacją jest podział komórki, 
komórki w którego wyniku powstają dwie komórki potomne. 

Warunkiem żywotności tych komórek jest otrzymanie 
informacji genetycznej, determinującej całość cyklu 
życiowego. Zapewnia to zachodząca uprzednio re¬ 
plikacja materiału genetycznego w komórce macie¬ 
rzystej. 

Proces ten ma zasadniczo inny przebieg u orga¬ 
nizmów protokariotycznych, posiadających pojedyn¬ 
czy kolisty chromosom, niż u wyższych, eukariotycz¬ 
nych organizmów, mających liczne chromosomy, 
zawierające liniowe DNA związane z białkami i to 
zamknięte w jądrze, które ma swoje błony i które ma 
również swój cykl podziałowy (—> Kwasy nukleino¬ 
we). 

Proces replikacji przebiegający w sposób idealny 
zapewniałby powstanie dwu identycznych komórek, 
reperacja Jednakże zasady wchodzące w skład DNA podlegają 
uszkodzeń wielu reakcjom fizycznym lub w pewnych warunkach 
DNA nawet chemicznym, co powoduje zmiany zdolności 
komplementacji zasad drugiego łańcucha. Te kom- 


plementacyjne niezgodności są rozpoznawane przez 
swoiste enzymy, które również dokonują korekt, np. 
przez wycięcie zmienionych zasad. Powstałą lukę wy¬ 
pełnia z zachowaniem zasady komplementarności 
inny enzym. Komórki dysponują kilkoma niezależ¬ 
nymi systemami naprawy zmian w DNA, lecz mimo 
to nie wszystkie zmiany w DNA, nazywane mutacja¬ 
mi, mogą być naprawione. Prowadzi to do odmień- mutacje 
ności odpowiednich elementów informacji genetycz¬ 
nej w komórkach potomnych. Mutacje są przypad¬ 
kowymi zmianami w budowie pojedynczych kodonów 
lub całych ich serii. Zwykle odbija się to niekorzystnie 
na zdolności do metabolizmu lub innych bardziej 
złożonych funkcji kómórek. Na przykład zmiana 
w kodonie aminokwasu ważnego dla centrum aktyw¬ 
nego jakiegoś enzymu biosyntezy biotyny, koenzymu 
szeregu enzymów przyłączających węglan do innych 
związków, powoduje, że enzym ten jest nieaktywny, 
przez co komórka jest niezdolna do produkcji biotyny 
i jej żywotność zależy od możliwości uzyskania tej 
biotyny z zewnątrz. Inne geny — kodujące inne enzy¬ 
my — biosyntezy biotyny — mogą ulegać mutacjom, 
które nie umniejszą już zdolności życiowych komórek, 
gdyż enzymy te i tak są bezużyteczne. Długi ciąg mu¬ 
tacji może przekształcić produkty tych genów w inne 
enzymy. Ich użyteczność zapewni komórkom pewną 
przewagę w walce o byt. Ciągłe występowanie mutacji 
może na przestrzeni tysięcy pokoleń doprowadzić do 
powstania nowych odmian gatunków, a nawet zupeł¬ 
nie nowych gatunków. 

Ważnym czynnikiem w procesie ewolucji są procesy 
przekazywania materiału genetycznego poszczegól¬ 
nym Osobnikom. 

Bakterie mają wiele mechanizmów przekazywania transforma- 
materiału genetycznego. Transformacja polega na cja 
przenikaniu z roztworu DNA pochodzącego z rozpad- 
łych bakterii. Ulega on rekombinowaniu, jeżeli wy¬ 
kazuje dostateczny stopień homologii z DNA ko¬ 
mórki, w której się znalazł. Inny proces, nazwany transdukcja 
transdukcją polega na tym, że niektóre bakteriofagi 
przenoszą DNA bakterii, w których się namnożyły, 
do bakterii, w których się znalazły. Jeszcze inny pro¬ 
ces, zwany koniugacją, wymaga obecności plazmidów. 

Są to koliste cząsteczki DNA zdolne do samodziel- koniugacja 
nej replikacji wewnątrz bakterii oraz do włączania 
się do chromosomu bakterii. Nadają one komórkom 
cechy, określane jako męskie, gdyż umożliwiają prze¬ 
noszenie DNA do komórek nie zawierających tego 
plazmidu. 

We wszystkich trzech wypadkach los przeniesione¬ 
go DNA zależy od tego, czy nie ulegnie on zniszczeniu modyfikacja 
przez nukleazy. Wszystkie bakterie mają enzymy i restrykcja 
metylujące niektóre sekwencje DNA oraz endonu- 
kleazy rozpoznające, czy sekwencje te są odpowiednio 
zmodyfikowane przez metylację. Niezmetylowane 
sekwencje są przecinane, co umożliwia działalność 
egzonukleaz i hydrolizę fragmentu DNA, rozpozna¬ 
nego jako obcy materiał genetyczny. Zjawisko to 
nosi nazwę restrykcji. Utrudnia ona wymianę infor¬ 
macji genetycznej między różnymi gatunkami bak¬ 
terii, a nawet różnymi liniami tego samego gatunku 
bakterii. 

Przeniesiony materiał genetyczny u bakterii ulega rekombina- 
procesowi nazwanemu rekombinacją. Ten wieloeta- cja 
powy proces polega na tym, że homologiczne, czyli 
zasadniczo podobne fragmenty dwuniciowego DNA 
rozpoznają się w sposób, który do dzisiaj jest jedną 
z największych zagadek biologii molekularnej. Roz¬ 
poznanie to umożliwia równoległe ułożenie homolo¬ 
gicznych odcinków. Następnie dochodzi do wzajem¬ 
nej wymiany odcinków o przypadkowej, prawdopo¬ 
dobnie, długości. Enzymy biorące udział w rekom¬ 
binacji są również dotąd nieznane. 

Wszystkie trzy procesy — przenoszenia, restrykcji 
i homologicznej rekombinacji — ograniczają wymianę 
informacji genetycznej do osobników blisko spokrew¬ 
nionych. Powoduje to, że tylko mutacje akumulo- 
wane w poszczególnych liniach genealogicznych da- 
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nego gatunku mogą się sumować. Powstające rekom- 
binanty podlegają naturalnej selekcji, na skutek czego 
przeżywają odmiany najlepiej dostosowane do wa¬ 
runków otoczenia. 

W ostatnich latach wykryto, że wiele bakterii i ich 
plazmidów ma szczególne odcinki DNA, nazwane 
sekwencjami insercyjnymi lub czynnikami IS. Ich 
właściwością jest zdolność do przemieszczania 
się z jednego miejsca w chromosomie na drugie, 
znajdujące się albo w tym samym chromosomie 
lub w innej cząsteczce DNA tej samej komórki, 
transpozony Co więcej, przemieszczeniom tym podlegają pary 
identycznych czynników IS (a poznano już kilka ich 
rodzajów), wraz z odcinkiem DNA, zawartym między 
nimi. Te tzw. transpozony są jakościowo różnym 
czynnikiem ewolucyjnym. Ich przenoszenie nie odby¬ 
wa się bowiem na zasadzie homologicznej wymiany, 
lecz włączenia w dowolne miejsce zupełnie nowego 
i dodatkowego materiału genetycznego, 
zmienność Nie ma dotąd dowodów, by transformacja czy trans- 
u eukarion- dukcja, mogły zachodzić u organizmów eukariotycz- 
tów nych. Niemniej jednak, między osobniczy a wewnątrz- 
gatunkowy proces tworzenia nowych kombinacji 
informacji genetycznej zachodzi dzięki zróżnicowaniu 
płciowemu. Komórki wyższych organizmów mają 
podwójne komplety chromosomów. Jedynie komórki 


Błony komórkowe 

Stanisław Przestalski 

Występowanie błon i ich 
znaczenie 

Błona, albo membrana, jest to warstwa substancji 
oddzielająca dwa ośrodki od siebie. Błona różni się 
od obydwu ośrodków cechami chemicznymi, struk¬ 
turalnymi i funkcjonalnymi. Na ogół błona jest cienka 
w porównaniu z ośrodkami, które rozdziela. 

Wśród różnorodnych błon, z jakimi spotykamy się 
w przyrodzie nieożywionej i ożywionej, na szczegól- 
blony ną uwagę zasługują błony komórkowe. Błony te, 
komórkowe zwane również błonami plazmatycznymi, otaczają 
(plazmatycz- żywe komórki wszystkich rodzajów: komórki zwie- 
ne) rzęce, roślinne i bakteryjne. Komórki zwierzęce oto¬ 
czone są jedynie błonami plazmatycznymi (rys. 1). 
Natomiast komórki roślinne i bakteryjne, niezależnie 
od błony plazmatycznej, pokryte są dodatkowo osło¬ 
ną, zwaną ścianą komórkową (rys. 2); ściana komór¬ 
kowa odgrywa przede wszystkim rolę osłony mecha¬ 
nicznej i nie będzie dalej rozpatrywana. Błona plaz- 
matyczna oddziela wnętrze komórki (protoplapnę) 
od ośrodka zewnętrznego i umożliwia zachowanie jej 
indywidualności zapobiegając wymieszaniu zawar- 



Rys. 1. Schematyczne przedstawienie komórki zwierzęcej 
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płciowe: plemniki i jaja, mają pojedyncze komplety. 
Nowy organizm, powstający w wyniku zapłodnienia 
jaja, ma po jednym chromosomie z każdej pary od 
jednego z rodziców. Stanowi to zupełnie inną kombi¬ 
nację cech odróżniającą go od rodziców. Ponieważ 
każdy plemnik czy jajo jest inną praktycznie kombi¬ 
nacją chromosomów odziedziczonych po rodzicach 
rodziców, a ogólna ich liczba u człowieka wynosi 23 
pary, zróżnicowanie potomstwa tych samych rodzi¬ 
ców jest bardzo duże. Powiększa je fakt, że podczas 
mejozy, czyli redukcyjnego podziału jądra w czasie 
wytwarzania komórek płciowych, dochodzi do re¬ 
kombinacji między homologicznymi chromosomami. 

Przytoczone tu dane dowodzą, że zróżnicowanie 
płciowe umożliwia organizmom eukariotycznym 
ogromną zmienność osobniczą. Częstość mutacji 
u organizmów wyższych jest równie duża, jak u bak¬ 
terii. Powstają więc podobne warunki do procesów 
ewolucyjnych przez selekcję osobników lepiej dosto¬ 
sowanych do środowiska. Jednakże w skali czasu są 
one powolniejsze ze względu na długość życia po¬ 
kolenia i rozmiary populacji organizmów wyższych. 
Ewolucję opóźnia również ich większa niezależność 
od zmienności środowiska. Potrzeba ewolucji orga¬ 
nizmów wyższych, szczególnie człowieka, jest za¬ 
gadnieniem wykraczającym poza biologię. 


tości komórki z ośrodkiem. Błona umożliwia rów 
nocześnie konatakt ze światem zewnętrznym dzięk 
swojej szczególnej właściwości polegającej na zdol¬ 
ności do wybiórczego przepuszczania substancji. 



Grubość błony komórkowej jest rzędu 10 nm, pod¬ 
czas gdy liniowe rozmiary większości żywych komó¬ 
rek zawierają się w granicach od 0,5 • 10 3 nm do 10 4 nm, 
a więc są od dwóch do trzech rzędów wielkości 
większe od grubości błony. 

Pojęcie błony komórkowej zostało zaproponowane wprowadze- 
przez C. Nagaliego w 1855 r. na podstawie do- nie pojęcia 
świadczeń nad przenikaniem do wnętrza komórek błony 
pewnych barwników. Od tego czasu przez wiele lat 
ścierały się poglądy zwolenników pojęcia „błona 
komórkowa” z poglądami jego przeciwników. Ci 
ostatni utrzymywali, że błona komórkowa nie istnieje, 
a powierzchnię komórki charakteryzuje jedynie za¬ 
gęszczona warstwa protoplazmy. Obecnie istnienie 
błony komórkowej nie budzi na ogół wątpliwości. 

Przyjmuje się, że błona plazmatyczna jest tworem 
o ściśle określonej strukturze i o charakterystycznych 
właściwościach. Za istnieniem błony komórkowej 
przemawia wiele argumentów. A więc warstwy po¬ 
wierzchniowe żywych komórek zawierają przeważa¬ 
jącą (do 80%) część suchej masy komórek. Przekłu- 
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cie powierzchni komórki może spowodować wy¬ 
pływ protoplazmy na zewnątrz. Po wypłynięciu za¬ 
wartości komórki pozostaje często otoczka utożsa¬ 
miana przeważnie z błoną (chociaż najprawdopodob¬ 
niej to nie jest sama błona). Można również izolować 
błonę plazmatyczną uszkadzając komórkę innymi spo¬ 
sobami. Umieszczając np. komórkę w ośrodku wod¬ 
nym o niższym ciśnieniu osmotycznym od ciśnienia 
osmotycznego protoplazmy doprowadzamy do prze¬ 
pływu wody do wnętrza komórki, wzrostu jej obję¬ 
tości i pęknięcia. Tego rodzaju postępowanie stosuje 
się przede wszystkim w stosunku do czerwonych 
ciałek krwi (erytrocytów); zjawisko pękania krwinek 
pod wpływem różnicy ciśnień osmotycznych i wyda¬ 
lania zawartości tych komórek na zewnątrz nosi 
nazwę hemolizy. Po hemolizie w roztworze pozostają 
blade otoczki, zw. cieniami. Przyjmuje się, że cień 
zawiera błonę lub jest po prostu błoną czerwonej 
krwinki. Do wyodrębnienia błon komórkowych in¬ 
nych rodzajów komórek stosuje się inne metody. 
A więc komórki bywają np. rozrywane przy pomocy 
ultradźwięków lub mechanicznych homogenizatorów. 
Błony lub fragmenty błon oddziela się od pozostałych 
składników komórki drogą flotacji (czyli wypłukiwa¬ 
nia), wirowania lub ekstrahowania w roztworach 
buforowych. 

Wątpliwości dotyczące istnienia ółony pochodziły 
jednak głównie stąd, że nie można było zobaczyć 
przekroju błony. Grubość błony jest mniejsza od 
zdolności rozdzielczej mikroskopu optycznego i do¬ 
piero zastosowanie mikroskopu elektronowego poz¬ 
woliło „zobaczyć’' błonę, ale nie w stanie żywym. 
Technika mikroskopii elektronowej wymaga bowiem 
wielu drastycznych zabiegów, które prowadzą co naj¬ 
mniej do zniszczenia właściwości życiowych preparo¬ 
wanych komórek. Przygotowanie próbki polega na 
utrwaleniu komórki lub jej elementów (np. cieni) 
przy pomocy m.in. czterotlenku osmu, odwodnieniu, 
wycięciu ultracienkich skrawków <za pomocą mikro¬ 
tomu) nie grubszych'niż kilkadziesiąt rim i zabarwie¬ 
niu solami ciężkich metali, np. octanem uranylowym. 1 
Pod mikroskopem elektronowym przekrój komórki 
przedstawia się tak, jak ukazano na ii. 128 (tabl. 32). 
Na zdjęciu tym można wyróżnić warstwę powierz¬ 
chniową o charakterystycznej strukturze. Struktura 
ta jest przedstawiona w sposób schematyczny na 
rys. 3. Widzimy tu dwie gęste warstwy przedzielone 
warstwą słabiej rozpraszającą elektrony. Sumaryczna 
grubość tych warstw wynosi od 7 nm do 10 nm. Ta 
trójwarstwowa struktura jest traktowana jako obraz 
błony komórkowej. Interpretacja mikrofotografii 
elektronowej nie jest jednak sprawą prostą i do chwili 
obecnej nie można na jej podstawie określić szcze¬ 
gółów budowy błony. 

Błona komórkowa nie jest jedyną błoną spotykaną 
w układach biologicznych. Różnorodne organelle ko¬ 
mórkowe, jak np. jądro, mitochondria, lizosomy 
(a w komórkach roślinnych chloroplasty i wodniczki), 
są zaopatrzone we .własne błony. W cytoplazmie ko¬ 
mórek roślinnych i zwierzęcych występuje ponadto 
siateczka śródplazmatyczna (retikulum endoplazma- 
tyczne), która jest złożoną siecią błon tworzących 
wewnątrz komórki obszary o różnych kształtach, np. 
wąskie kanały, rurki, okrągłe pęcherzyki, cysterny, 
i która łączy się z błoną jądra i z błoną komórkową 
(rys. 1). 

Poza błonami komórkowymi i błonami wewnętrz¬ 
nymi komórek znamy liczne błony tkankowe złożone 
z żywych komórek. Należą do nich m.in. przepona 
jelitowa, błona nerki, skóra żaby i wiele innych. 

Układy żywe można więc traktować jako układy 
błon, tworzące zlokalizowane obszary, w których 
zachodzą różnorodne procesy życiowe. Podstawową 
i charakterystyczną funkcją błon jest regulacja tran¬ 
sportu substancji dzięki zdolności do selektywnego 
przepuszczania cząstek. Wszystkie komórki nieustan¬ 
nie wymieniają różnorodne substancje z otoczeniem. 
Wymiana ta jest specyficzna, ponieważ tylko niektóre 


związki wnikają i tylko niektóre wydostają się na 
zewnątrz. Mechanizm tej wymiany jest związany, jak 
się uważa, całkowicie lub niemal całkowicie z właści¬ 
wościami błon. Zdolność błon do kierowania proce¬ 
sami przenikania prowadzi do wielu konsekwencji, 
np. transport jonów przez błony jest źródłem pow¬ 
stawania napięć elektrycznych między wnętrzem ko¬ 
mórki i otoczeniem, co umożliwia powstawanie i roz¬ 
chodzenie się impulsów nerwowych w komórkach 
nerwowych. Właściwości transportowe błon mito- 
chondriów umożliwiają uzyskiwanie energii z wiązań 
chemicznych substancji pokarmowych przez ich utle¬ 
nianie w procesie oddychania. Błony wewnętrzne 
chloroplastów odgrywają ważną rolę w uzyskiwaniu 
energii w procesie fotosyntezy a retikulum endoplaz- 
matyczne — w syntezie białek, kwasów tłuszczowych 
i fosfolipidów. 

Oprócz wymienionych tu funkcji błon, znane są 
jeszcze inne formy ich aktywności. Ogólnie, błony 
biologiczne odgrywają bezpośrednio lub pośrednio 
zasadniczą rolę w życiowych procesach organizmów 
żywych. Na ogół uważa się, że błony komórkowe sta¬ 
nowią równie niezbędny składnik żywych komórek 
jak kwasy nukleinowe. Jeśli np. usuniemy przy po¬ 
mocy mikromanipulatora jądro komórki ameby, 
uszkadzając nieznacznie błonę, tak że zrośnie się ona 
szybko i cytoplazma nie wydostanie się na zewnątrz, 
a po kilku dniach wprowadzimy do niej jądro po¬ 
chodzące z innej ameby, odzyskuje ona normalną 
zdolność do podziałów i ruchów. Natomiast wszelkie 
trwałe uszkodzenia błony komórkowej, tzn. takie, 
które się nie regenerują, prowadzą do śmierci komórki. 

Błona komórkowa nie jest układem statycznym, 
lecz dynamicznym. Zmienia ona stale swoje właści¬ 
wości pod wpływem różnorodnych czynników, a 
w szczególności pod wpływem zmian temperatury, 
ciśnienia i składu chemicznego ośrodka, w którym się 
znajduje. 

Powszechne występowanie błon oraz ich znaczenie 
w procesach życiowych jest powodem szerokiego zain¬ 
teresowania strukturą i funkcjami błon we współ¬ 
czesnych badaniach biologicznych, biochemicznych 
i biofizycznych. Szczególnie istotna jest rola badań 
biofizycznych, ponieważ podstawowymi procesami 
badanymi w membranologii są procesy transportu 
substancji, energii i informacji poprzez błony biolo¬ 
giczne, czyli typowe procesy fizyczne, które mogą być 
badane jedynie metodami fizycznymi i opisywane przy 
pomocy praw fizycznych. Podobnie inne badania 
z tego zakresu, jak np. badania struktury przestrzen¬ 
nej błon, ich właściwości elektrycznych itd. mają 
typowy charakter fizyczny i wobec tego należą do 
kręgu problemów biofizycznych. Badania bioche¬ 
miczne błon są równie rozległe i dotyczą budowy 
chemicznej błon, reakcji chemicznych zachodzących 
w błonach, aktywnego transportu, zjawisk enzyma¬ 
tycznych i innych. Badania biofizyczne i biochemiczne 
w dużym stopniu uzupełniają się, a na poziomie 
molekularnym (np. w zagadnieniu oddziaływań mię¬ 
dzy cząsteczkami błony) wzajemnie się przenikają. 
Biofizyka i biochemia umożliwiają nowoczesny rozwój 
biologii w ogóle, a biologii błon komórkowych 
w szczególności. 
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Lipidy i białka membranowe 


Bądania chemiczne błon izolowanych, zarówno błon 
komórkowych jak i błon organelli wewnątrzkomór¬ 
kowych, wskazują na dominujący udział w składzie 
chemicznym błon dwóch typów substancji: lipidów 
(tłuszczowców) i białek. Z tego względu rozpatrzymy 
budowę i właściwości cząsteczek lipidowych, cząste¬ 
czek białkowych oraz właściwości układów lipid— 
woda i Iipid-białko. 

Lipidy są to różnorodne substancje, które charakte- lipidy 
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ryzuje mała rozpuszczalność w wodzie. W ściśle 
chemicznym sensie są to związki kwasów tłuszczo¬ 
wych, przeważnie estry tych kwasów i jedno- lub 
wielowodorotlenowych alkoholi. Lipidy dzielą się na 
lipidy proste i złożone. Pierwsze są wyłącznie estrami, 
drugie zaś zawierają ponadto jeszcze inne związki 
organiczne. W błonach występują przede wszystkim 
różne rodzaje lipidów złożonych. Budowę lipidów 
fosfolipidy złożonych omówimy na przykładzie jednej z grup 
tych lipidów, a mianowicie na przykładzie fosfolipi- 



o 


atom 
tlenu 

atom 
węgla 

0 atom 
wodoru 


rolu są zastąpione długołańcuchowymi resztami kwa¬ 
sów tłuszczowych, np.: 
kwasu mirystynowego —CH 3 (CH 2 ) 12 COOH, 
palmitynowego —CH 3 (CH 2 )i 4 COÓH, 
stearynowego —CH 3 (CH 2 ) 10 COOH, 
oleinowego —CH 3 (CH 2 )~CH(CH 2 ) 7 COOH, 
linolowego 

—CH3(CH 2 ) 4 CH=CHCH 2 CH=CH(CH 2 ) 7 COOH 
(rys. 5) i innych. W rozważanych lipidach najczęściej 
spotykamy łańcuchy węglowodorowe o parzystej 
liczbie atomów węgla, zawierające na ogół 12 do 18 
atomów węgla. Nienasycone (tzn. zawierające podwój¬ 
ne wiązania) łańcuchy węglowodorowe występują 
powszechnie, lecz szczególnie często podwójne 
wiązania spotykamy w kwasach tłuszczowych o 18 
atomach węgla (z jednym, dwoma lub trzema wią¬ 
zaniami podwójnymi). 

Trzecia grupa hydroksylowa cząsteczki glicerolu 
jest zwykle (w omawianym przypadku) zastępowana 



kwas 

mirystynowy 


Kwas 

palmitynowy 


kwas 

stearynowy 



kwas 

oleinowy 



kwas 

linolowy 


Rys. 5. Przykłady kwasów 
tłuszczowych; oznaczenia a- 
tomów są takie same jak na 
rys. 4 


dów, które w poważnym stopniu wpływają na właści¬ 
wości błon biologicznych. Lipidy te są pochodnymi 
cząsteczki glicerolu (rys. 4). W fosfolipidach zwykle 
dwie grupy hydroksylowe (—OH) cząsteczki glice- 


przez grupę polarną (na rys. 6a jest nią reszta fosfo¬ 
ranowa) lub kombinacją reszty fosforanowej i pewnej 
grupy dodatkowej (tak jak to jest przedstawione na 
rys. 6b). 



Rys. 6. Grupy zastę¬ 
pujące grupę hydro¬ 
ksylową cząsteczki 
glicerolu :a) grupa fo¬ 
sforanowa, b) kombi¬ 
nacja grupy fosfora¬ 
nowej i pewnej grupy 
dodatkowej, c) grupa 
cholino wa, + dodatni 
ładunek elektryczny 


716 






Fosfolipidy dzielą się na kilka klas. Każda klasa 
zawiera część złożoną z łańcuchów węglowodorowych 
(które mogą różnić się długością i mogą mieć różne 
ilości i różne położenia podwójnych wiązań) i część 
polarną (o charakterze anionu, kationu lub jonu 
obojnaczego). W jednej z klas fosfolipidów, w lecyty¬ 
nie, grupa fosforanowa związana jest z grupą choli- 


cia tej części lipidu do wody. Łańcuchy węglowodo¬ 
rowe jako hydrofobowe wystają na zewnątrz po¬ 
wierzchni wody. Kropla fosfolipidu rozlana na po¬ 
wierzchni wody rozpływa się na niej, ponieważ 
grupa polarna każdej cząsteczki lipidowej jest przy¬ 
ciągana przez wodę. W efekcie na powierzchni wody 
powstaje w granicznym przypadku—jeśli tylko po- 



powietrze 


woda 


Rys. 10. Warstwa monomołekularna cząsteczek lipidowych na 
granicy faz woda-powietrzc 


wierzchnia wody jest dostatecznie rozległa — lipido¬ 
wa warstwa monomolekulama. Cząsteczki fosfolipi¬ 
dów w tej warstwie są zorientowane prostopadle do jej 
powierzchni (rys. 10). Warto wspomnieć, że monomo- 
lekulame warstwy były po raz pierwszy badane przez 
B. Franklina, który w 1765 r. obliczył grubość war¬ 
stwy oliwy rozlanej na powierzchni wody w stawie 
i określił ją na 10~ 7 cala, czyli 2,5 nm. J. W. Rayleigh 
w 1890 r. pierwszy zasugerował, że warstwy tego ro¬ 
dzaju mają charakter monomolekularny, a J. Lang- 
muir w 1917 r. zwrócił uwagę na specyficzną orientację 
cząsteczek lipidowych w warstwie powierzchniowej. 
Tak więc pomiędzy fazą wodną i powietrzem fosfoli¬ 
pidy mogą tworzyć monomolekulame błony o spe¬ 
cyficznych właściwościach. Ogólniej mówiąc, między 
dwiema fazami o różnych przenikalnościach elek¬ 
trycznych powstaje warstwa lipidowa, przy czym grupy 
polarne tych cząsteczek są zanurzone w ośrodku 
o wyższej przenikalności elektrycznej, a łańcuchy hy¬ 
drofobowe— w ośrodku o przenikalności niższej. 
Łańcuchy węglowodorowe wystają zatem ponad po¬ 
wierzchnię wody w przypadku warstwy lipidowej 
utworzonej między wodą i powietrzem (jak wspom¬ 
niano wyżej), lub między wodą i oliwą. Natomiast 
grupy polarne cząsteczek lipidowych są usytuowa¬ 
ne w powietrzu w przypadku warstwy lipidowej ufor¬ 
mowanej na powierzchni granicznej między fazą lipi- 


Rys. 7. Ogólna postać lecytyny. Oznaczenia 
są takie same, jak na rys. 4 


nową (rys. 6c). Wobec tego cząsteczkę lecytyny można 
ogólnie przedstawić tak, jak na rys. 7. Cząsteczki 
lecytyny różnych rodzajów zawierają identyczne grupy 
polarne (w tym przypadku obojnacze), lecz różnią 
się charakterem łańcuchów węglowodorowych. Je¬ 
den z rodzajów lecytyny jest przedstawiony na 
rys. 9. 

Jak widać, ogólną właściwością fosfolipidów jest 
występowanie grupy polarnej i niepolarnych łańcu- 


Rys. 8. Jeden z rodzajów lecytyny. Przy pomocy okręgu zaznaczono część polarną cząsteczki. 
Pozostałe oznaczenia są takie same, jak na rys. 4 
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Rys. 9. Schematy¬ 
czny sposób przed¬ 
stawienia cząste¬ 
czek lipidowych 


chów węglowodorowych. W fosfolipidach z reguły 
spotykamy dwa łańcuchy kwasów tłuszczowych, 
a w innych rodzajach lipidów możemy się spotkać 
z jednym lub trzema łańcuchami węglowodorowymi. 
Schematycznie przedstawiamy cząsteczki lipidów na 
ogół tak, jak na rys. 8. 

Fosfolipidy (i inne substancje o podobnej struktu¬ 
rze) nazywają się substancjami amfifilnymi ze względu 
na dualistyczny charakter oddziaływania cząsteczek 
lipidowych z wodą. Grupa polarna cząsteczki lipidu 
ma charakter hydrofilowy, a łańcuchy węglowodoro¬ 
we mają właściwości hydrofobowe. Oddziaływanie 
elektrostatyczne między grupą hydrofilową cząsteczki 
fosfolipidu i cząsteczkami wody prowadzi do wniknię- 


dową i powietrzem (jak to jest np. w bańkach mydla¬ 
nych). Należy zauważyć, że właśnie cząsteczki lipidów 
zawierających grupę polarną i dwa łańcuchy węglo¬ 
wodorowe (jak np. lecytyna) posiadają szczególną 
zdolność tworzenia warstw monomolekularnych na 
granicy faz woda-powietrze. Cząsteczki lipidów za¬ 
wierające grupę polarną i jeden łańcuch węglowodo¬ 
rowy mają znaczną zdolność rozpuszczania się w wo¬ 
dzie i tworzenia różnorodnych układów przestrzen¬ 
nych w wodzie, ponieważ wpływ hydrofilowej grupy 
polarnej przeważa nad wpływem hydrofobowych 
łańcuchów węglowodorowych. Natomiast cząsteczki 
lipidowe o trzech łańcuchach węglowodorowych 
w ogóle nie rozpuszczają się w wodzie. 
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W błonach biologicznych stosunek zawartości lipi¬ 
dów do zawartości białek zależy przede wszystkim 
od rodzaju błony. Np. w błonie komórkowej czerwo¬ 
nych ciałek krwi ludzkiej stosunek ten niewiele się 
różni od jedności, a w tzw. błonie mielinowej komórek 
nerwowych jest wyjątkowo duży i wynosi dziewięć 
do jednego. W wielu błonach innego rodzaju prze¬ 
waża z kolei zawartość białek nad zawartością li¬ 
pidów. 

Ogólne właściwości cząsteczek białka oraz struk¬ 
tura tych makrodrobin zostały omówione w artykule 
—►Białka. W błonach występują białka różnych ro¬ 
dzajów, jednak pełnej i ścisłej ich identyfikacji nie 
udało się do chwili obecnej przeprowadzić. Wiadomo, 
że zakres molekularnych rozmiarów białek w błonach, 
ich skład i rodzaj konformacji nie wykazują różnic 
w stosunku do białek pochodzenia niemembranowego. 
Natomiast każda błona ma inny, charakterystyczny 
dla siebie skład białkowy. Większość białek pocho¬ 
dzenia membranowego należy do białek nierozpusz¬ 
czalnych w wodzie. Białka i lipidy mogą więc tworzyć 
trwałe układy w środowisku wodnym. Wiązaniami 
występującymi w tych układach są wiązania jonowe 
i hydrofobowe, ale szczegóły oddziaływań nie są 
jeszcze dokładnie poznane. Trudności w identyfikacji 
białek membranowych pochodzą stąd, że zabiegi 
chemiczne mające na celu wyodrębnienie białek z błon 
naturalnych prowadzą najczęściej do rozpadu tych 
białek na aminokwasy. Białka występujące w błonach 
grupuje się na ogół w dwóch klasach: w klasie białek 
strukturalnych (odgrywających rolę w budowie błony 
biologicznej) i białek funkcjonalnych (które biorą 
udział w wielu procesach metabolicznych, m.in., jako 
enzymy). 


Modele błon komórkowych 

Doświadczenia Gortera i Grendela (1925 r.) polegają¬ 
ce na wyekstrahowaniu lipidów z czerwonych ciałek 
krwi i utworzeniu z nich warstwy monomolekularnej 
na powierzchni wody wskazały, że warstwa ta ma 
powierzchnię w przybliżeniu dwukrotnie większą od 
powierzchni krwinek. Wyciągnięto stąd wniosek, że 
błona komórkowa czerwonych ciałek krwi (i innych 
komórek, jak również błona organelli komórkowych) 
jest zbudowana z dwumolekulamej warstwy lipido¬ 
wej. Ten wniosek leży u podstaw naszych poglądów 
na budowę błon biologicznych. Pierwszym naukowo 
uzasadnionym modelem błony komórkowej był model 
DanieIIiego-Davsona (1935). Został on zbudowany 
na podstawie doświadczeń Gortera-Grendela i na 
podstawie wyników pomiarów napięcia powierzchnio¬ 
wego żywych błon. Pomiary napięcia powierzchnio¬ 
wego żywych komórek wykazały, że nie przekracza 
ono wartości równej 2 10~ 3 Nm -1 . Ponieważ napięcie 
powierzchniowe czystych lipidów wynosi około 
4Q*10~ 3 Nm -1 , Danielli i Davson przyjęli, że obniże¬ 
nie napięcia powierzchniowego żywych komórek 
w stosunku do napięcia powierzchniowego fazy lipi¬ 
dowej pochodzi od białek zaadsorbowanych na po¬ 
wierzchni lipidowej części błon biologicznych. Stąd 
powstał model przedstawiony na rys. 11. Błona w tym 
ujęciu składa się z dwumolekulamej warstwy lipido¬ 
wej, w której grupy polarne skierowane są na zew¬ 
nątrz, a łańcuchy węglowodorowe stanowią wnętrze 
warstwy; na obydwu powierzchniach tej warstwy 
zaadsorbowane są cząsteczki białka. 

Model DanieIIiego-Davsona, mimo licznych zalet, 
nie wyjaśnia wszystkich zjawisk membranowych, 
w szczególności nie tłumaczy pewnych zjawisk tran¬ 
sportowych. Dlatego z upływem lat model ten uległ 
stopniowym modyfikacjom. W ostatnich latach z naj¬ 
większym uznaniem spotkał się model mozaikowy 
(Singer i Nicholson, Vanderkooi i Green Zahler oraz 
Wallach). W modelu tym zakłada się, że cząsteczki 
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białek występują nie tylko na powierzchniach błony 
(jak w modelu Danielliego-Davsona), lecz również 
wnikają w głąb warstwy lipidowej, a nawet przeni¬ 
kają ją na wskroś (rys. 12). Autorzy modelu mozai¬ 
kowego sugerują, że białka przenikające całą błonę 
są odpowiedzialne m.in. za transport pewnych sub¬ 
stancji nierozpuszczalnych w fazie lipidowej błony. 

białka 


lipidy 



Rys. 11. Model błony DanieIIiego-Davsona: a) płaski, ^prze¬ 
strzenny 



Rys. 12. Model mozaikowy błony: a) płaski, b) przestrzenny 


Koncepcja modelu mozaikowego jest poparta 
przede w-szystkim doświadczeniami wykonanymi me¬ 
todą tzw. wytrawiania zamrożeniowego lub sublima¬ 
cyjnego (ang. freeze etching). W metodzie tej błona 




















wytrawianie zostaje nagle zamrożona w temperaturze ciekłego 
zamrożenio- azotu, a następnie „rozłupana” tak, jak to schema- 
we błon tycznie pokazano na rys. 13. Błonę dzieli się na dwie 
warstwy wzdłuż powierzchni przechodzącej przez 
zakończenia łańcuchów węglowodorowych w dwu- 
molekulamej warstwie lipidowej, tam gdzie wiązania 
są najsłabsze. Odpowiednio przygotowane preparaty 



Rys. 13. Poglądowy rysunek wskazujący, jak sobie wyobrażamy 
„rozłupanie” błony zawierającej dwumolekularną warstwę lipi¬ 
dów wraz z wbudowanymi białkami 


ogląda się pod mikroskopem elektronowym. Na il. 
129 (tabl. 32) widzimy otrzymaną w ten sposób mikro¬ 
fotografię „rozłupanej” błony (a więc zdjęcie jednej 
z dwóch warstw błony) erytrocytu. Dla porównania 
na il. 130 (tabl. 32) możemy zobaczyć analogicznie 
uzyskaną mikrofotografię pojedynczej warstwy lipido¬ 
wej otrzymanej z dwuwarstwowej błony lipidowej nie 
zawierającej białek. Na il. 129 (tabl. 32) widać różno¬ 
rodne wypustki, których nie ma na il. 130 (tabl. 32). 
Z tego względu przyjmuje się, że wypustki na il. 129 
(tabl. 32) przedstawiają ślady cząsteczek białek wnika¬ 
jących w głąb błony. 

Obecny pogląd na budowę błony komórkowej jest 
wynikiem różnorodnych eksperymentów i spekulacji. 
Błona komórkowa jest na ogół wyobrażana zgodnie 
z modelem mozaikowym, ale nie jako twór statyczny, 
lecz dynamiczny. Zachodzą w niej ciągłe zmiany po¬ 
legające m.in. na przemieszczeniach cząsteczek w bło¬ 
nie, na zmianach ich konformacji, na zmianach 
orientacji elementów składowych cząsteczek i innych. 
Z tego względu i ze względów innych, o których częś¬ 
ciowo była mowa wcześniej, bezpośrednie badania 
żywych błon są trudne, lub niekiedy nawet, na dzisiej¬ 
szym poziomie technik eksperymentalnych, niemożli¬ 
we. To jest przyczyną, że wiele badań doświadczal- 
błony nych prowadzi się nie bezpośrednio na błonach bio- 
modelowe logicznych, lecz na błonach modelowych. Dzięki 
równoległym badaniom błon żywych i błon modelo¬ 
wych coraz lepiej poznajemy rzeczywistą strukturę 
i funkcje błon biologicznych. W badaniach obydwu 
rodzajów błon wykorzystuje się wiele fizycznych 
metod eksperymentalnych. Należą do nich metody 
spektroskopii w podczerwieni i ramanowskiej, rentge- 
nografii; używa się sondy fluorescencyjne, mikrosko¬ 
py elektronowe; wykorzystuje się również zjawiska 
rezonansu jądrowego i dichroizmu kołowego. 

Do błon modelowych, którymi najczęściej posłu¬ 
gują się badacze należą monomolekulame warstwy 
lipidowe, dwumolekularne warstwy lipidowe oraz 
obydwa wymienione rodzaje błon modyfikowane 
przy pomocy białek innych substancji. 

Monomolekulame warstwy lipidowe są wygodnym 
modelem błony, ale odbiegają znacznie swymi właści¬ 
wościami od błon komórkowych, ponieważ te pierw¬ 
sze stykają się z ośrodkiem wodnym tylko z jednej 
strony, natomiast błony komórkowe mieszczą się 
między dwoma ośrodkami wodnymi. Ponadto, jak 
wiadomo z doświadczeń Gortera i Grendela, błony 
komórkowe składają się z dwumolekularnej warstwy 
lipidowej, a nie warstwy jednomolekularnej. Tym 
tłumaczy się konieczność poszukiwań metody otrzy¬ 
mywania dwumolekulamych warstw lipidowych w 
warunkach sztucznych. Cel ten udało się zrealizować 
po długotrwałych badaniach w latach 1962-64 poprzez 
formowanie tzw. błon czarnych i liposomów. 


Błony czarne formuje się w urządzeniach typu po - błony 
kazanego na rys. 14. Składa się ono z dwóch kon - czarne 
centrycznych komór: wewnętrznej (na ogół teflono - 
wej) zaopatrzonej w otworek o średnicy około 1 mm 
oraz zewnętrznej, wykonanej z materiału przezro¬ 
czystego. Komory napełnia się wodnym roztworem 
elektrolitycznym, a następnie nakłada się na otwór 
(np. przy pomocy pipety) warstwę substancji lipido¬ 
wej. Warstwa ta w zastosowanym roztworze zmniej¬ 
sza stopniowo swoją grubość (rys. 15). Grubość tej 
warstwy ocenia się przy pomocy mikroskopu, do któ¬ 
rego dochodzi odbite od warstwy lipidowej światło. 

Odbita wiązka światła białego przyjmuje początkowo 
barwę szarą, następnie, wraz ze zmniejszaniem się gru¬ 
bości warstwy, pojawiają się barwne obrazy interfe¬ 
rencyjne, aż wreszcie obraz przyjmuje barwę czarną 
(stąd pochodzi nazwa „błona czarna”). Dzieje się tak 
wtedy, kiedy grubość błony osiąga wartość mniej 
więcej 5-6 nm; w tej sytuacji promienie odbite od obu 
powierzchni błony znajdują się prawie dokładnie 
w przeciwnych fazach. Po uzyskaniu barwy czarnej 
proces formowania błony zostaje zak ończony. Ponie¬ 
waż długość rozciągniętej cząsteczki lecytyny wynosi 
około 8 nm, otrzymane wartości potwierdzają przy¬ 
puszczenie, że uzyskana błona czarna jest błoną dwu¬ 
molekularną. 


źródło światła białego 



Rys. 14. Układ stosowany do formowania czarnych Won 



Rys. 15. Kolejne fazy tworzenia się czarnej błony 


Stopniowe zmniejszanie się grubości warstwy lipi¬ 
dowej w procesie formowania się błony czarnej za¬ 
chodzi spontanicznie wraz ze zmniejszaniem się energii 
swobodnej układu. Szczegółowe rozważania teore¬ 
tyczne wskazują, że proces ten odbywa się przy udzia¬ 
le elektrycznej warstwy podwójnej, sił Londona-van 
der Waalsa i sił grawitacyjnych. 

Błony dwumolekularne w postaci błon liposomów 
można wytworzyć dzięki temu, że większość natural¬ 
nych fosfolipidów dysperguje (rozdrabnia się) w wo¬ 
dzie i w wodnych roztworach soli. Powstają przy tym 
cząstki sferyczne i cylindryczne o rozmiarach zawie¬ 
rających się w granicach od ułamków milimetra do 
kilkudziesięciu nanometrów, zwane liposomami. Każ¬ 
dy liposom składa się z pewnej liczby dwumoleku- 
larnych warstw lipidowych ułożonych koncentrycz¬ 
nie i oddzielonych od siebie warstwami wody. Naj¬ 
częściej liposomy produkuje się przez napromienianie 
lipidów ultradźwiękami lub metodą wytrząsania lipi¬ 
dów w odpowiednim roztworze wodnym. 

Właściwości błon lipidowych uzależnione są od na¬ 
tury kwasów tłuszczowych występujących w lipidach 
tworzących daną błonę i od oddziaływania lipidów 
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między sobą. Im dłuższe są łańcuchy węglowodoro¬ 
we, tym bardziej błony są zwarte; im bardziej są 
nienasycone, tym bardziej ich konstrukcja jest luźna. 

W zależności od temperatury i wielu innych czyn¬ 
ników (np. wzrostu kwasowości ośrodka) stwierdza 
się różne zachowanie łańcuchów węglowodorowych 
tworzących wnętrze dwumolekulamych warstw lipido¬ 
wych. W temperaturach odpowiednio niskich łańcu¬ 
chy te znajdują się w stanie uporządkowanym, są 
sztywne w pewnym stopniu i usytuowane równolegle 
względem siebie. W temperaturach wyższych (oraz 
pod wpływem innych czynników) uporządkowanie 
to zanika i błona przechodzi w stan zbliżony do stanu 
płynnego. Płynność błon pozwala wytłumaczyć obec¬ 
nie wiele zjawisk membranowych, a w szczególności 
efekty związane z przenikaniem substancji przez 
błony i efekty związane z działaniem membranowych 
układów enzymatycznych. 

Błony modelowe w postaci czystych błon lipido¬ 
wych dostarczają istotnych informacji dotyczących 
związków między strukturą i funkcją błon modelo¬ 
wych, a te z kolei można odnosić w pewnym zakresie 
do wyjaśnienia właściwości błon komórkowych. Para¬ 
metry charakteryzujące dwumolekulame błony lipi¬ 
dowe różnią się jednak często od analogicznych pa¬ 
rametrów żywych błon komórkowych. Znacznie le¬ 
psze przybliżenie otrzymuje się poprzez modyfiko¬ 
wanie czystych błon lipidowych za pomocą białek. 
Takie białka np. jak walinomycyna i gramicydyna 
wprowadzone do błon lipidowych zmieniają właści¬ 
wości transportowe tych błon. W szczególności 
transport pewnych jonów odbywa się w tak zmodyfi¬ 
kowanych błonach w sposób bardzo zbliżony do 
transportu tych samych jonów w pewnych błonach 
komórkowych. 


Termodynamiczny opis 
zjawisk transportu 

Transport substancji rozpuszczonej w elemencie obję¬ 
tościowym roztworu może być zrealizowany trojako. 
Pierwsza możliwość polega na ruchu całego elementu 
objętościowego — rozpuszczalnika wraz z substancją 
rozpuszczoną; taki przepływ nazywa się przepływem 
objętościowym. Druga możliwość — to ruch cząstek 
(na ogół cząsteczek lub jonów) zachodzący w wyniku 
ich ruchu cieplnego, zwany dyfuzją. Trzecia możli¬ 
wość — to niedyfuzyjny ruch rozpuszczonej substan¬ 
cji pod wpływem sił zewnętrznych, zwany migracją. 

Wielkością charakteryzującą proces transportu 
substancji jest strumień. Przez strumień I substancji 
rozumiemy stosunek ilości substancji n przechodzącej 
w pewnym czasie przez daną powierzchnię A do tej 
powierzchni i do tego czasu, co można przedstawić 
za pomocą wyrażenia : 

1 dn 
~~A~dT' 

lub równoważnie: 

I — cv, 

gdzie v oznacza prędkość transportowanych cząstek, 
c — stężenie molarne. 

Zauważmy, że podane równania zostały zapisane 
w sposób skalamy, ale ogólnie mają one charakter 
wektorowy, gdyż prędkość, a wobec tego i strumień, 
są wektorami. 

Strumienie powstają pod wpływem różnych czyn¬ 
ników, zwanych bodźcami. Np. strumień dyfuzyjny 
powstaje w zasadzie pod wpływem gradientu poten¬ 
cjału chemicznego (albo, w roztworach nieskończenie 
rozcieńczonych, gradientu stężenia); tzn., że gradient 
potencjału chemicznego jest typowym bodźcem dla 
procesu dyfuzji (albo, mówiąc inaczej, jest bodźcem 


sprzężonym ze strumieniem dyfuzyjnym). Strumień 
objętościowy jest sprzężony z gradientem ciśnienia 
hydrostatycznego, strumień ładunków elektrycz¬ 
nych — z gradientem potencjału elektrycznego, stru¬ 
mień reakcji chemicznej (strumień produktów lub 
substratów) — z powinowactwem chemicznym. Wię¬ 
kszość bodźców wyraża się za pomocą gradientów, 
czyli ma charakter wektorowy. Ważnymi wyjątkami 
są termodynamiczny strumień reakcji chemicznej 
i jego termodynamiczny bodziec, które są skalarami. 
Termodynamicznym strumieniem reakcji chemicznej 
jest szybkość reakcji chemicznej, a odpowiednim 
bodźcem — powinowactwo chemiczne. 

Uważamy, że dany proces transportu jest znany, 
jeśli znamy konkretną zależność pomiędzy strumie¬ 
niem I i bodźcem X, którą ogólnie zapiszemy sym¬ 
bolicznie jako funkcję /: 

/ =RX). 

Często sformułowanie konkretnych równań tego 
typu oraz ich rozwiązanie jest sprawą trudną lub na 
dzisiejszym poziomie wiedzy — niemożliwą do zrea¬ 
lizowania. Wiele jednak problemów można rozwiązać 
wykorzystując liniową termodynamikę procesów nie¬ 
równowagowych (nieodwracalnych). Opiera się ona 
na postulacie głoszącym, że dla dostatecznie powol¬ 
nych procesów (i dla procesów stacjonarnych) stru¬ 
mienie są liniowymi funkcjami wszystkich bodźców 
w układzie: 

h= £ LacXic, ( 1 ) 

k 

gdzie It oznacza strumień /-tej substancji, Xk — k-ty 
bodziec, a Lik są współczynnikami liniowymi, zwa¬ 
nymi współczynnikami fenomenologicznymi. Współ¬ 
czynniki te są niezależne od strumieni i bodźców. 
Nazywają się one współczynnikami fenomenologicz¬ 
nymi prostymi, jeśli / = k, a współczynnikami 
fenomenologicznymi krzyżowymi, jeśli i ^ k. 
Wszystkie współczynniki fenomenologiczne muszą 
być w zasadzie wyznaczane doświadczalnie. Stru¬ 
mienie i bodźce o tych samych wskaźnikach są 
nazywane wielkościami sprzężonymi lub skoniugo- 
wanymi. Równania (1) nazywają się równaniami 
fenomenologicznymi. 

Równania fenomenologiczne można stosować w 
konkretnych zagadnieniach uwzględniając trzy pod¬ 
stawowe zasady: 

— Drugą zasadę termodynamiki, a właściwie pe¬ 
wną jej konsekwencję, która posiada następującą po¬ 
stać (dowód pomijamy): 

£L-2i t x t > o. 

gdzie S jest entropią, t — czasem, dSjdt — szybkością 
zmiany entropii wywołaną nieodwracalnością pro¬ 
cesów. 

— Zasadę Onsagera, która mówi, że współczynniki 
krzyżowe o przestawionych wskaźnikach są sobie 
równe: 

Lik = Lki (J 7 * k). 

— Zasadę Curie, która jest ogólnym prawem przy¬ 
rody, a w zastosowaniu do naszych rozważań może 
być sformułowana następująco: w układach izotro¬ 
powych przyczyna skalarna nie może wywołać skutku 
o charakterze wektorowym. A więc np. wektorowy 
strumień dyfuzyjny nie może być w ośrodku jedno¬ 
rodnym wywołany skalarnym bodźcem chemicznym 
w postaci powinowactwa chemicznego. 

Równania fenomenologiczne (1) dla dwóch stru¬ 
mieni i dla dwóch bodźców przyjmują postać: 

Li — LnXi-\-Li«X* 

h = i*A+Wi. ( 

Jak widać każdy ze strumieni jest uzależniony nie 
tylko od bodźca z nim skoniugowanego, lecz również 
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od bodźca nieskoniugowanego. Ponieważ zgodnie 
z zasadą Onsagera L n — L Z1 , przeto obydwa stru¬ 
mienie są wzajemnie sprzężone i oddziałują na siebie. 
Jeśli mianowicie z drugiego równania określimy X 2 
i otrzymany wynik podstawimy pod X 2 w równaniu 
pierwszym, otrzymamy: 


ii ~( Ln ~T7) Xi+ iz: h ’ 


co wskazuje na bezpośrednie sprzężenie między 
obydwoma strumieniami. 

Typowym przykładem fizycznym takiego sprzęże¬ 
nia jest zjawisko termodyfuzji. W zjawisku tym sprzę¬ 
żone są ze sobą strumienie dyfuzyjny i cieplny. W re¬ 
zultacie, pod wpływem gradientu temperatury, do¬ 
chodzi do powstania procesu dyfuzji. 

Kiedy współczynniki krzyżowe są równe zeru, to 
sprzężenia między strumieniami nie występują. Np. 
jeśli L 12 = L 21 = 0, to z równań (2) pozostają dwie 
niezależne relacje: l x = L u X x oraz / 2 == L^ 2 X 2 . 

Formalizm liniowej termodynamiki procesów nie¬ 
równowagowych pozwala opisać pewne zjawiska 
transportu bliskie stanom równowagi. Procesy za¬ 
chodzące w stanach odległych od stanu równowagi 
próbuje się opisać za pomocą metod nieliniowej ter¬ 
modynamiki procesów nierównowagowych. Przedsta¬ 
wienie nawet elementów tej ostatniej wykracza poza 
zakres niniejszego opracowania. 

Przedstawione wyżej rozważania o charakterze 
ogólnym zostaną w dalszym wywodzie wykorzystane 
do opisu pewnych zjawisk przenikania substancji 
przez błony komórkowe. 


cem (równanie 1) sprowadza się do jednego równania: 


4 - lx d . 

Jeśli bodźcem jest gradient stężenia 8 clćx (dla procesu 
zachodzącego w jednym tylko kierunku osi *), 
a L — —D y to otrzymamy znane prawo dyfuzji 
prostej (I prawo Ficka): 


gdzie D jest współczynnikiem dyfuzji. 

Jeżeli mamy dwa ośrodki dobrze mieszane (miesza¬ 
dłami lub metodą wstrząsania), tzn. takie, że można 
pominąć w rozważaniach dyfuzję w tych ośrodkach, 
bo mieszanie zachodzi szybciej niż dyfuzja i jeżeli 
te ośrodki rozdzielone są błoną (rys. 16), to dyfuzja 
będzie się odbywała jedynie wewnątrz błony i wobec 
tego w równaniu (3) 8 cjdx oznacza gradient stężenia 
wewnątrz błony, a jD — współczynnik dyfuzji prze¬ 
nikającej substancji przez fazę błony. Jeśli cząsteczka 
dyfunduje przez ciągłą warstwę lipidową, to ruch jej 



Rys. 16. Układ zawierający błonę i dwa dobrze mieszane roztwory 


Przenikanie substancji przez 
błony biologiczne 


Błona komórkowa stanowi barierę pomiędzy ośrod¬ 
kiem zewnętrznym a protoplazmą, a w organizmach 
wielokomórkowych stanowi również barierę między 
sąsiednimi komórkami. Przez błonę tę przenikają 
różnorodne substancje zarówno z ośrodka zewnętrz¬ 
nego do wnętrza komórki, jak i w kierunku przeciw¬ 
nym. Substancje przenikają również przez błony 
biologiczne innych rodzajów. 

Wszystkie błony biologiczne charakteryzuje zdol¬ 
ność do wybiórczej przepuszczalności substancji. 
Pewne substancje przenikają z większą szybkością, 
inne z mniejszą, a jeszcze inne nie są w ogóle przepusz¬ 
czane przez błonę. Błony biologiczne nie są więc bło¬ 
nami półprzepuszczalnymi, ponieważ umożliwiają 
transport nie tylko rozpuszczalnika (np. wody), lecz 
setek innych związków. Charakter przenikania danej 
substancji uzależniony jest od aktualnego stanu błony 
i zmienia się wraz ze zmianami błony zachodzącymi 
pod wpływem czynników zewnętrznych. 

Istnieje ogromna różnorodność procesów przeni¬ 
kania; można je podzielić na zasadnicze dwie klasy: 
procesy przenikania biernego i procesy przenikania 
aktywnego. Procesy przenikania biernego odbywają 
się bez nakładu energii zewnętrznej — samorzutnie, 
natomiast procesy aktywne wymagają nakładu energii 
(dostarczonej z metabolicznych reakcji chemicznych). 
Procesy przenikania biernego zachodzą pod wpływem 
różnych bodźców, takich jak np. gradient potencjału 
chemicznego, gradient stężenia, gradient potencjału 
elektrycznego. W związku z tym rozróżniamy takie 
procesy biernego transportu jak dyfuzja prosta, 
elektrody fuzja i przenikanie ułatwione. Gdy przeni¬ 
kanie zachodzi wyłącznie pod wpływem gradientu 
potencjału chemicznego lub (dla dostatecznie małych 
stężeń) gradientu stężenia, to jest to tzw. dyfuzja 
prosta. Jeśli nie ma oddziaływań pomiędzy strumie¬ 
niami danej substancji i ewentualnymi innymi stru¬ 
mieniami, to zależność między strumieniem i bodź- 



Rys. 17. Rozkład potencjału w obszarze lipidowej fazy błony 


ma charakter przeskoków z jednego położenia rów¬ 
nowagi do następnego poprzez szereg barier potencja¬ 
łu (rys. 17). Jeśli proces ma charakter stacjonarny 
i stężenie w jednym ośrodku wynosi c u a w drugim 
c z i jeśli grubość błony oznaczymy przez Ax, to 
równanie (3) przyjmuje postać: 

l n = -D^-= -PAc = -P’An, 

D Ax 

gdzie Ac = c x —c 2t P (zwane stałą przenikania) jest 
równe D/Ax t An jest różnicą ciśnień osmotycznych 
pomiędzy dwoma ośrodkami (ciśnienie osmotyczne 
71 dla roztworów nieskończenie rozcieńczonych wynosi 
RTCy gdzie R jest stałą gazową, T —temperaturą 
bezwzględną, a P' — P/RT ). 

Znamy wiele substancji, które przenikają przez 
błony żywych komórek zgodnie z prawem prostej 
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dyfuzji. Nie wiadomo jednak, czy substancje te prze¬ 
nikają przez ciągłą fazę lipidową błony, czy też przez 
hipotetyczne pory w błonie. Wynika to stąd, że pro¬ 
ces dyfuzji wyraża się w obydwu przypadkach takim 
samym prawem. Pewną wskazówką jest stwierdzona 
doświadczalnie zależność między szybkością dyfuzji 
i składem lipidowym błony. Im więcej nienasyconych 
lipidów znajduje się w błonie (im mniej zwarta jest 
jej struktura), tym szybciej zachodzi proces dyfuzyj¬ 
nego przenikania biernego. 

elektro- Transport jonów wynikły z równoczesnego działa- 
dyf uzja nia pola elektrycznego i gradientu stężenia nosi nazwę 
elektrodyfuzji. Różnica potencjałów elektrycznych 
powstaje zawsze w wyniku różnic w ruchliwościach 
jonów (tzw. potencjał dyfuzyjny). Ponadto w błonach 
biologicznych (a często i w sztucznych) występuje 
napięcie elektryczne, którego źródłem są nie przenika¬ 
jące przez błonę jony i ładunki związane z błoną 
(tzw. potencjał Donnana). Suma napięć dyfuzyjnych, 
napięć Donnana i napięć wywołanych przenikaniem 
aktywnym nazywa się potencjałem membranowym. 
Przenikanie jonów przez błony żywych komórek czę¬ 
sto może mieć charakter elektrodyfuzyjny, ponieważ 
w układzie żywa komórka-ośrodek często może wy¬ 
stępować równocześnie gradient potencjału elektrycz¬ 
nego i gradient stężenia. W tym wypadku równania 
fenomenologiczne (2) dla procesu stacjonarnego mogą 
być przedstawione następująco: 

Id = Ldd A7i-\-Ld<j> yAy 
I<p = L<pD~\~L<pq> Ay t 

gdzie Id jest strumieniem dyfuzyjnym, Ati — różnicą 
ciśnień osmotycznych, Ay — różnicą potencjałów 
membranowych, /«, — strumieniem elektrycznym, Idd> 
Ld<Pi I><pDy I~><p<p odpowiednimi współczynnikami fe¬ 
nomenologicznymi. Równania elektrodyfuzji pozwa¬ 
lają m.in. obliczyć dla wybranych jonów i przy wielu 
upraszczających założeniach, napięcie membranowe 
Ay t które jest źródłem impulsów nerwowych, 
przenikanie Są układy, w których transport bierny substancji 
ułatwione zachodzi z większą szybkością, niżby to wynikało 
z praw poprzednio omówionych; jest to tzw. przeni¬ 
kanie ułatwione. Przykładem może być m.in. tran¬ 
sport glukozy, która przenika przez błonę komórko¬ 
wą erytrocytów mniej więcej 5 razy szybciej niż przez 
odpowiednią warstwę lipidową. To zjawisko i wiele 
innych podobnych obserwacji doprowadziło do sfor¬ 
mułowania pojęcia nośników. Nośnikami są przy¬ 
puszczalnie pewne substancje (do dzisiaj w ostateczny 
sposób nie zidentyfikowane, choć w pewnych przy¬ 
padkach ich istnienie wydaje się niewątpliwe) obecne 
tylko wewnątrz błony, które mogą się selektywnie 
wiązać z cząstkami przenikającymi, tworząc komplek¬ 
sy. Kompleksy te charakteryzuje większy współczyn¬ 
nik dyfuzji w błonie aniżeli substancja bez nośnika. 
Rozpatrzymy jeden z możliwych modeli układu noś¬ 
nikowego vrys. 18). W modelu tym zakładamy, ze 
nośniki są ruchome i że przy jednej z powierzchni 
błony wiążą się bez nakładu energii z cząsteczkami 
substancji transportowanej tworząc kompleksy, któ¬ 
re dyfundują przez błonę, następnie ulegają dysocjacji 
przy drugiej powierzchni błony. Cząsteczki substancji 
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transportowej zostają po drugiej strome błony, 
a nośniki dyfundują z powrotem i proces się powta¬ 
rza. Można wykazać, że strumień jednokierunkowy 
wyraża się tu następująco: 

/ = / t5] 

gdzie Im i K są pewnymi stałymi, S —stężeniem 
substancji przenikającej w ośrodku zewnętrznym. Jak 
widać dla dostatecznie dużych wartości S (tzn. jeśli 
S > K) wartość strumienia przyjmuje stałą wartość 
/ = Im. Przebieg zależności strumienia* od stężenia 
zewnętrznego jest przedstawiony na rys. 19. Dla 
dostatecznie dużych stężeń wszystkie nośniki zostają 
zaangażowane w transport substancji S i wobec tego 
dalsze zwiększenie stężenia nie może doprowadzić do 
wzrostu strumienia — następuje nasycenie. 



Rys. 19. Zależność pomiędzy strumieniem i stężeniem przenika¬ 
jącej przez błonę substancji w transporcie nośnikowym 


Przenikanie bierne każdego rodzaju może zachodzić 
zgodnie z gradientem stężenia substancji przenikającej 
lub też wbrew gradientowi stężenia. Np. w procesie 
elektrodyfuzji transport jonów może odbywać się 
wbrew gradientowi stężenia, jeśli tylko w układzie wy¬ 
stępuje odpowiednie napięcie elektryczne. Możemy 
również obserwować przepływ substancji pomimo 
braku różnicy stężeń tej substancji. Np. wyobraźmy 
sobie komórki, które w swej błonie zawierają nośniki 
wiążące się zarówno z pewną substancją A jak i z 
pewną substancją B. Jeśli utrzymujemy komórki 
w ośrodku o wysokim stężeniu substancji A (w nie¬ 
obecności B) tak długo, aż strumień wpływający 7* p 
stanie się równy strumieniowi substancji wypływają¬ 
cej 7^ yp z komórek, to strumień netto 7^ et = 0. 
Jeżeli teraz dodamy do ośrodka zewnętrznego sub¬ 
stancję B, to wówczas wystąpi konkurencja substancji 
A i B o wykorzystanie nośników. Początkowo kon¬ 
kurencja będzie dotyczyła jedynie nośników znajdu¬ 
jących się w pobliżu powierzchni błony od strony 
ośrodka zewnętrznego. Dlatego strumień wpływający 
stanie się mniejszy od strumienia wypływającego 
/wp < 7vvyp» a więc pojawi się strumień netto różny 
od zera (7 net ^ 0) pomimo braku różnicy stężeń suł> 
stancji A. 

Przeważnie prawom transportu biernego podlegają 
substancje o mniejszym znaczeniu fizjologicznym. 
Najważniejsze z biologicznego punktu widzenia sub¬ 
stancje (np. jony potasu i sodu, białka, wiele cukrow¬ 
ców) przenikają aktywnie. 

Transport aktywny wymaga dopływu energii swo¬ 
bodnej z jakiegoś niezależnego źródła; przeważnie 
energii tej dostarczają reakcje metaboliczne. Wobec 
tego transport aktywny w błonach biologicznych 
może być określony jako przepływ dyfuzyjny sprzę¬ 
żony z chemicznym procesem metabolicznym. 

Jednak według zasady Curie takie sprzężenie między 
wektorowym strumieniem dyfuzyjnym i skalarnym 
strumieniem chemicznym w układzie izotropowym 
jest niemożliwe. Stąd sądzono, że przenikanie aktyw¬ 
ne jest specyficznym procesem biologicznym nie pod¬ 
legającym prawom fizyki. Rozwiązanie tego para¬ 
doksu wynika z następującego rozumowania. 
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Rozważmy układ, w którym występuje bodziec 
wektorowy w postaci różnicy ciśnień osmotycznych 
An i bodziec skalarny w postaci powinowactwa che¬ 
micznego E oraz strumień dyfuzyjny I i strumień 
reakcji chemicznej 7 r . Równania fenomenologiczne 
przyjmują wówczas postać: 

Id = Ldd An+ LdtE, (4) 

Ir — ErD A?l-\- LrrE, 

gdzie Ldd , Ddt, L t d , L rr są odpowiednimi współ¬ 
czynnikami fenomenologicznymi. W układzie izotro¬ 
powym nie ma sprzężeń, więc współczynniki krzyżo¬ 
we znikają i równania sprowadzają się do dwóch 
równań niezależnych: Id = LddAti oraz U = L rr E y 
wskazujących, że w ośrodku jednorodnym mogą v^y- 
stępować jedynie nie oddziałujące ze sobą strumienie. 
Stąd należy wnosić, że gdyby błona komórkowa była 
tworem izotropowym, to żadne procesy aktywne nie 
mogłyby w niej powstawać. Błona jest jednak ukła¬ 
dem anizotropowym, który charakteryzuje przestrzen¬ 
na i strukturalna asymetria. Z tego względu zasada 
Curie przestaje obowiązywać (albo też mówiąc ina¬ 
czej, strumień reakcji chemicznej w odpowiednio asy¬ 
metrycznym układzie staje się strumieniem ukierun¬ 
kowanym, a więc wektorowym i zasada Curie pozo¬ 
staje słuszna) i w błonach biologicznych mogą istnieć 
sprzężenia między dyfuzją i reakcją chemiczną; w 
równaniach (4) współczynniki krzyżowe Ldt i L t d 
nie znikają. 

Tak więc błona żywa ze względu na swoją asyme¬ 
trię umożliwia sprzężenia między reakcjami chemicz¬ 
nymi i aktywnym transportem substancji i w konse¬ 
kwencji jest odpowiedzialna za podstawowe procesy 
życiowe. Dzięki powiązaniom reakcji chemicznej 
z procesem transportu istnieje możliwość regulacji 
dopływu substancji do wnętrza komórek przy pomocy 
subtelnych zmian w kinetyce reakcji chemicznych 
zachodzących wewnątrz błon komórkowych. W roz¬ 
ważanym zagadnieniu, opierając się na drugiej zasa¬ 
dzie termodynamiki możemy napisać 

dS 

~ = I D An+l r E > 0. 

dt 

Ostatnia nierówność prowadzi do wniosku, że stru¬ 
mień dyfuzyjny sprzężony z reakcją chemiczną może 
płynąć w kierunku przeciwnym do kierunku działania 
jego własnego bodźca. Z nierówności tej wynika, że 
suma obydwu wyrazów musi być większa od zera. 
Wobec tego jeden z wyrazów może być ujemny, 
jeśli tylko ten drugi jest dodatni na tyle, że zapewnia 
dodatnią wartość sumy. Jeśli więc wartość wyrazu 
metabolicznego 7 r i: jest dostatecznie duża, to iloczyn 
IdAti może być ujemny (co oznacza, że kierunki Id 
i Ati są różne) i tym samym może zmniejszać entropię. 
Przenikanie aktywne może również odbywać się 
zgodnie z gradientem, np. stężenia. Zachodzi ono jed¬ 
nak w takich razach z większą szybkością aniżeli 
miałoby to miejsce w procesie dyfuzji. Procesy tego 
typu spotyka się w żywych komórkach. Np. mecha¬ 


nizmy aktywnego transportu mogą być uruchamiane 
w błonie komórkowej wówczas, kiedy konieczne jest 
jak najszybsze wydalanie trujących produktów roz¬ 
puszczonych wewnątrz komórki. 

Przenikanie aktywne zachodzi na ogół dzięki energii 
wyzwalanej w procesie hydrolizy kwasu adenozyno- 
trójfosforanowego (ATP). Jest to związek wysoko¬ 
energetyczny. Oderwanie się jednej grupy fosforowej 
od ATP prowadzi do wydzielenia się energii potrzeb¬ 
nej do podtrzymywania procesu aktywnego. Powią¬ 
zanie tej energii z procesem aktywnego przenikania 
wynika ze stwierdzeń doświadczalnych: zahamo¬ 
wanie procesu rozpadu ATP powoduje wstrzymanie 
procesu aktywnego transportu. Również bilans ener¬ 
getyczny wskazuje na ścisłe powiązanie pomiędzy 
energią pochodzącą z ATP i procesem transportu 
aktywnego. Nie wiadomo jednak, jak dochodzi do 
przekształcenia energii chemicznej w energię mecha¬ 
niczną transportu. Istnieją jedynie liczne, mniej lub 
bardziej uzasadnione hipotezy i spekulacje. Najczęś¬ 
ciej przyjmuje się, że przenikanie aktywne jest reali¬ 
zowane przy pomocy nośników, które (inaczej niż 
to ma miejsce w biernym transporcie nośnikowym) 
wiążą się z transportowaną substancją dzięki dostar¬ 
czonej energii metabolicznej. 


ATP — źródło 
energii dla 
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Od czego zależy dalszy rozwój 
biofizyki bfon 


Błony biologiczne są niezbędnym składnikiem wszy¬ 
stkich żywych komórek i organizmów wielokomór¬ 
kowych. Liczne funkcje błon związane z podstawo¬ 
wymi funkcjami życiowymi — odżywianiem się, foto¬ 
syntezą, powstawaniem i rozchodzeniem się impul¬ 
sów nerwowych, procesami metabolicznymi — spro¬ 
wadzają się przede wszystkim do zdolności regulo¬ 
wania procesów transportu. Matematyczny opis 
procesów transportu jest obecnie utrudniony z kilku trudności 
co najmniej ważnych powodów, a przede wszystkim opisu mate- 
z powodu braku dobrej znajomości budowy i struk- matycznego 
tury błon; zadowalającej teorii budowy cieczy i pełnej 
teorii termodynamiki procesów nierównowagowych 
(jeśli w ogóle termodynamiczny opis może być sto¬ 
sowany do układów o rozmiarach 10 nm, odpowia¬ 
dających grubości błony). Dalszy rozwój biofizyki 
błon jest więc uzależniony od rozwoju fizycznych 
metod pomiarowych, głównie spektroskopowych, 
rozwoju teorii cieczy, w szczególności roztworów 
i rozwoju termodynamiki małych układów, względnie 
innych ujęć matematyczno-fizycznych zagadnień. 
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mórek t Kraków 1970; W. Leyko (red.) Wykłady z biofizyki , t. 1, 

Łódź 1975; A. P. M. Lockwood The Membranę of Animal Cells, 

London 1971; S. Przestalski Opis zjawiska transportu przez 
błony biologiczne , Postępy Biologii Komórki 2, 165 (1975); 

E. D. P. de Roberts i in. Biologia komórki. Warszawa 1974. 


Białka 

Kazimierz Zakrzewski 


Chociaż nie potrafimy zdefiniować, czym jest życie, 
intuicja na ogół bezbłędnie pozwala nam odróżnić 
twory żywe od martwych. Skomplikowana, lecz har¬ 
monijna budowa, celowe reagowanie na bodźce ze¬ 
wnętrzne, a przede wszystkim zdolność do rozmna¬ 
żania się, do odtwarzania w organizmie potomnym 
organizmów rodzicielskich to nieodłączny i nie¬ 
rozłączny zespół cech charakteryzujących zjawisko 
życia. Egzystencja zaś organizmu jest bezwzględnie 


uzależniona od jego metabolizmu — systemu reakcji metabolizm 
chemicznych umożliwiających przyswajanie, prze- organizmów 
twarzanie i wykorzystywanie substancji z otoczenia 
jako materiału budulcowego i źródła energii. 

Wyjaśnienie zasad reakcji metabolicznych stworzy¬ 
ło podstawy obecnego burzliwego rozwoju nauk bio¬ 
logicznych. Udowodnienie zaś, że białka są zdefinio¬ 
wanymi i zróżnicowanymi związkami chemicznymi, 
a nie bezpostaciową i pasywną masą „biokoloidu”. 
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jak niegdyś sądzono, oraz że enzymy są białkami, 
znaczenie miało znaczenie przełomowe. Enzymy, białka wy- 
białek dia kazujące czynność katalityczną, umożliwiają ko- 
życia morkom żywym prowadzenie złożonych reakcji che¬ 
micznych w wąskich, dopuszczalnych dla życia gra¬ 
nicach temperatury. Bez istnienia enzymów nie był¬ 
by możliwy metabolizm, niemożliwa byłaby także 
replikacja (odtwarzanie) aparatu genetycznego, wa¬ 
runek rozmnażania się organizmów i istnienia życia 
na ziemi. Nie tylko jednak enzymy okazały się biał¬ 
kami, ale również wszystkie inne, dotąd poznane na¬ 
rzędzia molekularne komórki: specjalne białka od¬ 
powiedzialne są za transport substancji i ich wymianę 
z otoczeniem, inne — za odbieranie i przekazywanie 
sygnałów chemicznych i fizycznych o stanie środo¬ 
wiska wewnętrznego i zewnętrznego oraz za koordy¬ 
nację funkcji biologicznych. Jeżeli się do tego doda, 
że z białek powstaje też zrąb strukturalny, układ 
składników zapewniających trwałą a elastyczną or¬ 
ganizację wewnętrzną tworów żywych, to stanie się 
oczywiste, że mają one uniwersalne znaczenie dla 
życia. 


Budowa białek 


czynność optyczną (rys. 2), a z dwu możliwych stereo- 
izomeronów w białkach występują tylko L-a-amino- 
kwasy (wyjątkiem jest tu pozbawiona czynności opty¬ 
cznej glicyna, która ma dwie wartościowości C® podsta¬ 
wione atomami wodoru: tabela). Przyczyny, dla któ¬ 
rych przyroda wybrała tę właśnie możliwość, są nie 
znane. Mogły to spowodować warunki panujące na 
naszej planecie w okresie powstawania życia na ziemi, 
np. charakter pola magnetycznego, polaryzacja świa* 
tła słonecznego, siły związane z obrotem kuli ziem¬ 
skiej wokół osi. Również możliwe jest, że konfigura- 


R 



nh 2 


Rys. 2. Struktura przestrzenna a-aminokwasów. Tworzy on 
tetraedr, w którego środku znajduje się atom węgla C (niewi¬ 
doczny na rysunku), natomiast grupy aminowa, karboksylowa 
i łańcuch boczny R rozmieszczone są w wierzchołkach tetraedru 
zgodnie z ruchem wskazówek zegara w L-ot-aminokwasach i prze¬ 
ciwnie — w D-a-aminokwasach 


Wszechstronnym funkcjom białek towarzyszy ogro¬ 
mna różnorodność ich własności fizycznych i chemicz¬ 
nych — wielkości, kształtu i ładunku elektrycznego 
cząsteczki, barwy, rozpuszczalności itd. Wspólną 
jednak ich cechą jest to, że zbudowane są z tych 
samych dwudziestu różniących się między sobą ami¬ 
nokwasów, połączonych w długi i nierozgałęziony 
łańcuch. I to właśnie leży u podstaw różnorodności 
struktury i funkcji białek. W łańcuchu bowiem każdy 
z dwudziestu aminokwasów może występować w do¬ 
wolnej pozycji i wielokrotnie. Proste obliczenie wska¬ 
zuje, że w małym białku, zbudowanym np. ze stu 
aminokwasów, dwadzieścia różnych aminokwasów 
może być ułożonych na 10 130 sposobów, może więc 
dać tyleż różniących się rodzajów cząsteczek. Jest to 
więcej niż wynosi liczba atomów we Wszechświecie, 
szacowana na 10 8 °, ale w przyrodzie występuje tylko 
niewielka ich część, być może — ok. 10 12 różnych 
białek. Znacznie więcej było ich bez wątpienia wypró- 
bowywanych w toku ewolucji i odrzuconych jako nie 
przyczyniających się do przeżycia gatunku. Białka 
są na ogół bardzo dobrze dostosowane do warunków 
bytowania organizmów, chociaż są i takie — pro¬ 
dukty świeżych lub starszych mutacji — które mają 
własności niekorzystne, oraz białka różniące się nieco 
od optymalnych, nie pogarszające szansy przeżycia 
i jak gdyby oczekujące na ujawnienie swoich walo¬ 
rów wówczas, gdy się zmienią warunki bytowania 
organizmu. 

aminokwa- W przyrodzie występuje wiele dziesiątków różnych 
sy — cegiełki aminokwasów (a więcej ich można otrzymać synte- 
hudowy tycznie), lecz białka budowane są tylko z tych dwu¬ 
dziestu, które mają w zapisie informacji genetycznej 
odpowiednie kodony (-> Kwasy nukleinowe). Są to 
a-aminokwasy (rys. 1) o charakterystycznej i jedna¬ 
kowej konfiguracji atomowej przy węglu C®, lecz 
różniące się swymi łańcuchami bocznymi (tabela). 
Ponieważ cztery wartościowości węgla C® wysycone 
są różnymi podstawnikami, a-aminokwasy wykazują 
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Rys. 1. Wzór strukturalny a-aminokwasu (u dołu w postać 
skróconej). Aminokwasy, podstawowe cegiełk’ budowy białka' 
są związkami organicznymi, zawierającymi w swojej cząsteczce 
grupę aminową (—NH t ) o własnościach zasadowych i grupę 
karboksylową (—COOH) o własnościach kwasowych. Białka bu¬ 
dowane są z jednego tylko rodzaju aminokwasów — takich, 
w których grupa aminowa i grupa karboksylowa znajdują się 
przy tym samym atomie węgla, oznaczanym jako C®; zwane są 
one a-aminokwasami. W pozycji oznaczonej R znajduje się 
łańcuch boczny aminokwasu (zob. tabela). Atomy węgia w łań¬ 
cuchu bocznym oznacza się kolejnymi literami greckimi P , y itd. 
zaczynając od węgla C*; atom węgla grupy kwasowej oznacza 
się jako C' 


cja L ma jakąś wyższość nad D albo że o wyborze 
konfiguracji zdecydował przypadek: pierwszy zdolny 
do długotrwałej samoreprodukcji twór mógł być zbu¬ 
dowany z L-a-aminokwasów i uniemożliwił wy¬ 
kształcenie się innych form życia. 

Białka syntetyzowane są w procesie translacji 
(-► Kwasy nukleinowe) przez wyłączenie cząsteczki 
wody z grupy —COOH jednego aminokwasu i grupy 
NH 2 następnego (rys. 3). Powstaje między nimi wią¬ 
zanie peptydowe (rys. 4), ważny czynnik strukturo- 
twórczy w białkach, i formuje się łańcuch polipepty- 
dowy. W roztworze wodnym, jedynym środowisku, 
w jakim na naszej planecie mogą zachodzić zjawiska 
życia, przybiera on ukształtowanie przestrzenne uza¬ 
leżnione od właściwości wiązania peptydowego oraz 
od kolejności występowania w polipeptydzie rozma¬ 
itych łańcuchów bocznych aminokwasów (rys. 3). 
Kolejność ta, zwana sekwencją aminokwasową lub 
strukturą pierwszorzędową białka, jest bezpośrednim 
odzwierciedleniem zapisu informacji genetycznej 
w genie i determinuje przestrzenne ukształtowanie 
(konformację, strukturę wyższego rzędu) całej czą¬ 
steczki. Struktura wyższego rzędu sprawia, że w czą¬ 
steczce białka przybliżają się do siebie aminokwasy, 
na ogół znajdujące się w odległych miejscach łańcucha 
polipeptydowego, i powstają charakterystyczne dla 
danego białka ich zgrupowania, będące centrami 
czynnymi (np. o funkcji katalitycznej). Dopiero osta¬ 
tecznie ukształtowana cząsteczka białka jest zdolna 
do spełniania właściwych funkcji biologicznych, a nie 
pierwotnie syntetyzowany łańcuch polipeptydowy. 
Sens więc biologiczny zawarty w zapisie informacji 
genetycznej ujawnia się nie w sekwencji aminokwa- 
sowej białka, ale w jego przestrzennym ukształtowa¬ 
niu. 

W strukturze przestrzennej białka występują dwa 
elementy. Jeden z nich zależy od ciągłego powtarzania 
się wzdłuż łańcucha głównego układu atomów 
—C®—C'—N— (rys. 3), identycznego we wszystkich 
białkach i określającego możliwości konformacyjne 
łańcucha głównego. Elementem drugim jest genetycz¬ 
nie ustalona kolejność różnych aminokwasów, ogra¬ 
niczająca te możliwości i nadająca danemu białku 
właściwą mu strukturę i funkcję. 

Łańcuch główny ma znaczną swobodę w przybie¬ 
raniu różnych postaci przestrzennych w roztworze 
wodnym, gdyż wiązania idące do węgla C* (rys. 3) 
są nasycone i pozwalają na swobodny obrót atomów 
wokół ich osi — w odróżnieniu od sztywnego i płas¬ 
kiego wiązania peptydowego (rys. 4). Zmienne kąty 
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Rys. 3. Podstawowa budowa białka. Aminokwasy łączą się ze sobą w łańcuch w reakcji polegającej na wydzieleniu 1 cząsteczki wody 
z grupy karboksylowej jednego aminokwasu i grupy aminowej następnego (wzór w formie skróconej na górze). W powstającym łańcuchu 
znikają grupy aminowe i karboksylowe przy C* z wyjątkiem grupy aminowej pierwszego aminokwasu (tzw. koniec aminowy lub ko¬ 
niec N łańcucha) i grupy karboksylowej ostatniego (koniec karboksylowy czyli koniec C). Rysunek ukazuje schematycznie budowę 
związku utworzonego przez 7 reszt aminokwasowych. W schemacie tym, nie odzwierciedlającym budowy przestrzennej łańcucha (z wy¬ 
jątkiem faktu, że łańcuchy boczne odchodzą naprzemiennie w przeciwne strony od łańcucha głównego), zaznaczono: symbolem a 
atomy C*, atomy azotu (N), siarki (S), tlenu (O); puste duże kółka oznaczają atomy węgla (ale w pierścieniach aromatycznych np. ty¬ 
rozyny, atomy węgla pominięto), małe kółka — atomy wodoru (zaznaczone tylko na grupach skrajnych). Nazwy trójliterowe amino¬ 
kwasów są wpisane dokładnie pod C* danego aminokwasu. Związki zbudowane z dwu reszt aminokwasowych nazywane są dwupep- 
tydami, z trzech —trójpeptydami itd. Związki zbudowane z kilku do kilkunastu aminokwasów określa się ogólnie jako oligopeptydy, 
a większe —jako polipcptydy. Pojęcie „białko” jest bardziej ogólne i mniej precyzyjne: obejmuje ono łańcuchy polipeptydowc (na ogół 
dłuższe niż 100-aminokwasowe) a także cząsteczki zbudowane z kilku łańcuchów polipeptydowych oraz polipeptydy z przyłączonymi 
związkami nie mającymi charakteru aminokwasów. Glikoproteidy np. są łańcuchem polipeptydowym z przyłączonymi resztami cu¬ 
krowca, w metaloproteidach zaś występują atomy metalu jako integralny składnik danego białka 


torysyjne przy O (rys. 5) nie mogą przybierać takich 
wartości, które by przybliżyły do siebie jakiekolwiek 
atomy, nie związane chemicznie, na odległości mniej- 



Rys. 4. Wiązanie pcptydowe. Wiązanie pcptydowe —CO—NH—, 
powstające przez kondensację grupy karboksylowej jednego 
aminokwasu z grupą aminową innego (zob. rys. 3) ma zdeloka- 
lizowane elektrony, tworzące orbital molekularny rozciągający 
się od atomu tlenu poprzez atom węgla C' do atomu azotu (ry¬ 
sunek na dole). Jego skrajne postacie pokazuje rysunek na górze. 
Rezonansowa energia stabilizacji wiązania peptydowego wynosi 
ok. 88 *10® J/mol (21 kcal/mol) i stanowi przeszkodę dla obrotu 
atomów wokół osi —C'—N—. W rezultacie, wszystkie atomy 
spięte wiązaniem peptydowym znajdują się (w przybliżeniu) na 
jednej płaszczyźnie. Mogą one być w układzie trans jak na ry¬ 
sunku dolnym (atomy C* skierowane w przeciwne strony) lub 
cis (atomy C a skierowane w tę samą stronę). W białkach wiązanie 
peptydowe ma konfigurację trans 


sze niż suma ich promieni van der Waalsa (-* Chemia 
kwantowa). Cząsteczka zaś jako całość osiągnie mo¬ 
żliwie najniższy stan energetyczny, a więc przybierze 
trwałą konformację (-► Przedmiot i problemy biofi¬ 
zyki molekularnej), gdy pomiędzy możliwie najwięk¬ 



szą liczbą grup —CO i —NH (jedynych reaktywnych 
grup w łańcuchu głównym) powstaną wiązania wo¬ 
dorowe (rys. 6). Muszą one, ze względu na sztywność 
wiązania peptydowego, tworzyć się pomiędzy resztami 
aminokwasów bardziej od siebie odległymi, a nie ty¬ 
mi, które są ze sobą połączone wiązaniem peptydo¬ 
wym. Maksymalna liczba wiązań wodorowych może 
powstać wtedy, gdy łańcuch polipeptydowy ma sy- 


Rys. 5. Łańcuch polipeptydowy — widok perspektywiczny. Ry¬ 
sunek ukazuje jedną resztę aminokwasową (między niebieskimi 
kreskami) i początki dwu reszt sąsiadujących. Płaszczyzny wiązań 
peptydowych zaznaczono kolorem niebieskim. Czarna gruba 
linia wytycza łańcuch główny, łańcuchy boczne pominięto, zo¬ 
stawiając tylko ich pierwsze węgle (O*). Atomy wodoru (małe 
kółka) pozostawiono tylko przy atomach C* i N. Łańcuch po¬ 
lipeptydowy na rysunku znajduje się w postaci maksymalnie roz¬ 
ciągniętej. Zgodnie z obowiązującą konwencją, kąt torsyjny wią¬ 
zania peptydowego przyjęto za 180°, a w maksymalnie rozciąg¬ 
niętym łańcuchu kąty torsyjne O i przyjęto jako również ma¬ 
jące wartość 180°. Obrót płaszczyzn w kierunku strzałek opisuje 
się jako wzrost wartości kątów torsyjnych 0 i V 
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Aminokwasy 
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Niektóre ważniejsze produkty potranslacyjnej** 
modyfikacji aminokwasów 



cystyna 


dwujodotyrozyna 



hydroksyprolina 


*Stan jonizacji polarnych aminokwasów podany jest tylko w przybliżeniu, 
gdyż w zależności od różnych czynników jonizacja może być częściowo 
zahamowana lub może się pojawić. 


**Potranslacyjna modyfikacja aminokwasów jest wynikiem 
działania enzymów na aminokwas Już wbudowany 
do łańcucha polipeptydowego: dwie cysteiny po utlenieniu 
ich grup-SH dają cystynę, z proliny powstaje hydroksypro¬ 
lina itd. Modyfikacji takich znanych jest kilkadziesiąt. 


metrię śrubową (-► Budowa kryształów), a to dzięki 
temu, że obrót i translacja kolejnych reszt aminokwa- 
sowych stwarzają warunki do odpowiedniego zbli¬ 
żenia odległych od siebie wiązań peptydowych. Drugą 
możliwością osiągnięcia maksymalnego wysycenia 
wartościowości potencjalnych partnerów wiązania 
wodorowego jest bliskie ulokowanie równolegle uło¬ 
żonych łańcuchów polipeptydowych w postaci roz¬ 
prostowanej (stosunki przestrzenne między sąsiadu¬ 
jącymi w łańcuchu polipeptydowym resztami amino¬ 
kwasów nazywane bywają strukturą drugorzędową 
białka). 

Istnieje kilka teoretycznie możliwych struktur łań¬ 
cucha polipeptydowego o symetrii śrubowej, tj. da¬ 
jących w efekcie cząsteczkę o kształcie określanym 
prawoskręt- jako heliks. W białkach wykryto tylko heliksy pra¬ 
ne a-heliksy woskrętne, należące do rodziny zwanej strukturami 
a (rys. 7). Ponieważ duże wymiary atomu tlenu 
w grupie —CO bardzo ograniczają możliwości uzwo¬ 
jenia łańcucha głównego, struktury a mogą mieć 


w jednym całkowitym zwoju tylko od ok. 2 do pra¬ 
wie 5 reszt aminokwasowych. Wiązania wodorowe 
w nich mogą łączyć odpowiednio grupę —CO każ¬ 
dego wiązania peptydowego z grupą —NH trzeciego, 
czwartego, piątego lub szóstego aminokwasu. Struk¬ 
tury a różnią się między sobą nie tylko liczbą reszt 
aminokwasowych w jednym zwoju, ale także pochy¬ 
leniem uzwojenia, a to sprawia, że w niektórych 
heliksach wiązania wodorowe są dosyć naprężone 
i mało trwałe. Najbardziej korzystne warunki do 
utworzenia wiązań wodorowych pojawiają się w 
a-heliksie (rys. 7b) i on też najczęściej bywa obserwo¬ 
wany w białkach (a przynajmniej tych, które zbadano 
krystalograficznie); a-heliks w białkach często zakoń¬ 
czony jest krótkim odcinkiem 3 10 -heliksu (rys. 7a). 
Lewoskrętnych struktur a w białkach nie wykryto. 
Występowanie ich jest mało prawdopodobne, gdyż 
asymetiycznie ulokowany w L-a-aminokwasach łań¬ 
cuch boczny stanowi przeszkodę do swobodnego 
uzwajania się łańcucha w lewo. Lustrzanym odbiciem 
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Rys. 6. Wiązanie wodorowe. Wiązanie wodorowe tworzy atom 
wodoru, znajdujący się między dwoma silnie elektroujemnymi 
atomami. W białkach xviąże ono najczęściej atomy tlenu, azotu 
i siarki w rozmaitych kombinacjach. Na rysunku przedstawiono 
wiązanie wodorowe między dwoma atomami tlenu, z których 
znajdujący się po lewej stronie nazywany jest donorem, a po pra¬ 
wej — akceptorem wodoru. Przy akceptorze zaznaczono gęstości 
elektronowe na niebiesko, a skala odległości podana jest pod ry¬ 
sunkiem. Znaczenie wiązania wodorowego dla białek polega na 
tym, że działa ono na stosunkowo dużą odległość (0,25-0,30 nm) 
i jest dosyć silne (1-3 *10 4 J/mol). Istnienie wiązania wodorowego 
uzależnione jest od odpowiedniego zbliżenia donora i akceptora, 
ale także od stanu środowiska. Przy zmianie jego przenikalności 
elektrycznej, kwasoty i in., wiązanie wodorowe może pęknąć lub 
powstać, co wpływa na strukturę białka i uzależnia ją w ten spo¬ 
sób od zjawisk chemicznych zachodzących w środowisku 


„plisowane arkusze”; rys. 9) o bardzo regularnym struktury)? 
rozmieszczeniu łańcuchów bocznych. W białkach 
mogą one mieć nawet bardzo duże rozmiary (rys. 10) 
i wtedy cały arkusz wykazuje lekkie skręcenie płasz¬ 
czyzny w prawo, a całość struktury układa się w 
kształt zbliżony do cylindrycznego (tzw. j?-baryłka). 

Mniejsze lub większe struktury fi występują we wszy¬ 
stkich białkach i odgrywają w nich szczególnie ważną 
rolę. Są one bowiem znacznie bardziej sztywne niż 
struktury helikalne, nadają więc białkom dobre wła¬ 
ściwości mechaniczne, a jednocześnie mogą zape¬ 
wnić aminokwasom o decydującym znaczeniu, np, 
w centrach katalitycznych, precyzyjnie ustaloną po¬ 
zycję. Struktury helikalne — w odróżnieniu od struk¬ 
tur fi '— mają charakter bardziej sprężysty, ponieważ 
stabilizowane są wiązaniami wodorowymi, dosyć od¬ 
pornymi na rozciąganie i tolerującymi pewne zmiany 
w położeniu tworzących je partnerów. Dlatego to 
struktury helikalne odgrywają dużą rolę w formo¬ 
waniu przestrzennego kształtu cząsteczki białka po 
zakończeniu syntezy łańcucha polipeptydowego, 
a ostatecznej cząsteczce zapewniają ruchliwość kon- 
formacyjną, dynamiczne zmiany stosunków prze- 

struktury 

helikalne 


Rys. 7. Struktury helikalne w biał¬ 
kach — modele atomowe struktury 
3, 0 -heliksu i a-heliksu. Taśmą nie¬ 
bieską zaznaczono wyidealizowany 
przebieg heliksu, a grubą kreską — 
aktualny układ jego łańcucha głów¬ 
nego. Atomy C a są zakropkowane, 
symbolami N i O oznaczono atomy 
azotu i tlenu wiązań peptydowych, 
między którymi powstają wiązania 
wodorowe (kreski przerywane). Obie 
struktury należą do struktur «, które 
opisuje wzór: 


I | 

—C—{NH • CH(R) • CO]n—N—; 
n oznacza liczbę reszt aminokwaso- 
wych zamkniętych w pętlę wiąza¬ 
niem wodorowym, w 1 pętli zatem 
znajduje się 3/i+4 atomów. Struk¬ 
turę a wystarczająco opisują dwie 
liczby, określające liczbę reszt w jed¬ 
nym zwoju i liczbę atomów w jednej 
pętli. Np. 3 10 -heliks ma 3 reszty a- 
minokwasowe w zwoju i 10 atomów 
w pętli; heliks tradycyjnie nazywany 
a-heliksem ma formalną nazwę 
3,6 13 -heliks. a-hetiks ma bardzo 
mało zdeformowane wiązania wo¬ 
dorowe i on to głównie występuje 
w białkach, czasem będąc zakoń¬ 
czony krótkim 3 x0 -heliksem 



a -heliks 



3 10 -heliks 


prawoskrętnych heliksów zbudowanych z L-a-ami¬ 
nokwasów są lewoskrętne heliksy zbudowane z D-a- 
-aminokwasów, a te nie są w przyrodzie ziemskiej 
do tworzenia białek wykorzystywane. 

Drugą regularną, termodynamicznie stabilną kon¬ 
formacją łańcucha polipeptydowego są struktury fi 
(rys. 8). Łańcuchy polipeptydowe są w nich prawie 
maksymalnie rozprostowane, ułożone w stosunku do 
siebie równolegle lub przeciwrównolegle i połączone 
wiązaniami wodorowymi. Mają one charakter płas¬ 
kich, lekko pofałdowanych arkuszy (stąd ich nazwa 


strzennych między różnymi odcinkami łańcucha poli¬ 
peptydowego (-*■ Przedmiot i problemy biofizyki 
molekularnej). 

W niektórych białkach, zwanych fibrylarnymi, czyli białka 
włókienkowymi, dominuje regularna konformacja fibrylarne 
(a lub fi) większej części czy nawet całego ich łańcucha 
polipeptydowego. Cząsteczka białka fibrylamego ma 
wówczas kształt bardzo wydłużony, jak np. w biał¬ 
kach podporowych, stanowiących osnowę zrębu 
strukturalnego organizmów wyższych (np. kolagen). 

Większość jednak białek ma cząsteczkę o kształcie 
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Rys. 8. Struktury fi. Prawie rozprostowane łańcuchy polipepty- 
dowe (odrębne łańcuchy lub odcinki tego samego łańcucha) 
mogą wytworzyć między sobą sieć wiązań wodorowych, utrzy- 
mujących ich układ przestrzenny. Na rysunku pokazano wzory 
chemiczne struktur fi o równoległym lub przeciwrównolcgłym 
przebiegu łańcucha (kierunek określa pozycja jego końca N). 
W układzie przcciwrównoległym, który w białkach występuje 
częściej, wiązania wodorowe są mniej zdeformowane niż w ukła¬ 
dzie równoległym 


białka zbliżonym do kulistego. W białkach takich, określa- 
gfobularne nych jako globulame, konformacja łańcucha poli- 
peptydowego jest mieszana: krótsze lub dłuższe od¬ 
cinki o konformacji a lub p połączone są odcinkami 
o konformacji nieregularnej (stosunki przestrzenne 
między odcinkami łańcucha polipeptydowego nazy¬ 
wane bywają strukturą trzeciorzędową białka). Me¬ 
chanizmy, które kierują części łańcucha polipepty¬ 
dowego ku określonej konformacji nie zostały jeszcze 
dobrze poznane (—► Przedmiot i problemy biofizyki 
molekularnej), dwa jednak czynniki mają szczególnie 
duże znaczenie: zróżnicowane powinowactwo amino¬ 
kwasów do wody oraz rozmaitość własności chemicz¬ 
nych łańcuchów bocznych. 

Grupy polarne, znajdujące się w łańcuchach bocz¬ 
nych aminokwasów hydrofitowych (np. —OH, 
—COOH; tabela), wiążą cząsteczki wody i stąd ich 
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termodynamicznie faworyzowaną pozycją w czą- aminokwasy 
steczce białka jest ta, która im zapewnia dobry kon- hydrofiłowe 
takt z wodą. Odwrotnie się zachowują węglowodo- i hydrofo¬ 
rowe łańcuchy boczne aminokwasów hydrofobo- bowe 
wych: w środowisku wodnym otaczają się one pa- 
rakrystaliczną siatką cząsteczek wody, co powoduje 
spadek entropii wody i wzrost swobodnej energii 
układu. Układ więc dąży do maksymalnego zmniej¬ 
szenia kontaktów między wodą a apolarnymi łań¬ 
cuchami bocznymi, co osiąga przez wydzielenie ich 
w postaci bezwodnych skupień. Przeciętny łańcuch 
apolamy aminokwasu hydrofobowego w skupieniach 
tych zyskuje ok. 17 kJ/mol (4 kcal/mol) swobodnej 
energii stabilizacji, głównie kosztem entropii wody, 
której cząsteczki odzyskują swobodę przyjęcia mniej 
uporządkowanego rozmieszczenia. W rezultacie — 
cząsteczka przybiera kształt „kropli oliwy w wodzie”: 
aminokwasy polarne lokują się na powierzchni w 
kontakcie z wodą, aminokwasy apolame zaś tworzą 
bezwodne, silnie skupione wnętrze, mające bardziej 
charakter ciała stałego niż roztworu, gdyż upakowa¬ 
nie atomów może w nim wynosić do 75% dostępnej 
przestrzeni. 

Na ostateczne ukształtowanie przestrzenne czą¬ 
steczki białka szczególnie duży wpływ mają niektóre 
aminokwasy. Prolina np. nie może być ulokowana wpływ pro- 
w prawoskrętnej strukturze a (ale może — w lewo- liny na 
skrętnym heliksie, jak np. w kolagenie, o czym niżej) strukturę 
ze względu na odmienną niż w innych aminokwasach 
konfigurację atomów przy węglu O. Tworzący się 
prawoskrętny heliks musi ulec przerwaniu w miejscu, 
w którym występuje prolina, i może ponownie po¬ 
wstać po kilku aminokwasach, które na ogół pozo¬ 
stają w konformacji nieregularnej. Występowanie 
takich krótkich nieregularnych odcinków za proliną 
często sprawiają, że następny odcinek helikalny ma 
zupełnie inny kierunek niż poprzedni. Aminokwasy 
o polarnych, lecz nie zjonizowanych grupach w łań¬ 
cuchach bocznych, np. seryna, asparagina (tabela) 



Rys. 9. Struktura fi układająca się tak jak pofałdowany (pliso¬ 
wany) arkusz. Łańcuchy polipetydowe w strukturach fi nic są 
całkowicie rozprostowane, tj. ich kąty torsyjne O i (zob. 
rys. 5) odbiegają nieco od wartości 180° (np. w strukturze prze- 
ciwrównolcgłej 4> = -140°, a V = 135°). W rezultacie płasz¬ 
czyzna ograniczona przez łańcuch główny wykazuje regularne 
załamania. Wiązania wodorowe między łańcuchami (linie prze¬ 
rywane) pozwalają na. wytworzenie bardzo rozległych arkuszy 
struktury fi. Łańcuchy boczne R skierowane są naprzemiennie 
w górę i w dół od płaszczyzny arkusza. Na rysunku pokazano 
tylko atomy C®, atom wodoru przy C oraz pierwszy atom łań¬ 
cucha bocznego R. Płaszczyzny arkusza struktury wykazują ten¬ 
dencję do lekkiego skrętu w prawo (nie zaznaczoną na rysunku), 
co czasem prowadzi do powstania tzw. ^-baryłki (zob. rys. 10) 

utrudniają tworzenie regularnych konformacji, gdyż 
między ich grupami polarnymi a grupami —CO 
czy —NH łańcucha głównego mogą powstać wiąza¬ 
nia wodorowe, utrudniające wytworzenie wiązań wo¬ 
dorowych potrzebnych do stabilizacji struktury a 
czy p. Jednocześnie jednak takie wiązanie wodorowe 
między łańcuchem bocznym aminokwasu a łańcu¬ 
chem głównym utrwala zwrot łańcucha głównego 
o ok. 180° (zwany zwrotem p lub zwrotem typu 
szpilki do włosów) i umożliwia zapoczątkowanie 
struktury p . Całość struktury białka stabilizowana wiązania 
jest rozmaitymi wiązaniami, wśród których szczegół- stabilizując© 
nie dużą rolę odgrywają silne, kowalencyjne wiązania strukturę 


'łązanie 



Rys. 10. Topologia struktur/? — struktury /? kilku spośród wielu zbadanych krystalograficznie białek. Grube proste strzałki obrazują 
przebieg łańcucha głównego połipeptydu, znajdującego się w płaszczyźnie struktury (płaszczyzna papieru), a połączenia między odcinka¬ 
mi łańcucha głównego przedstawiają linie cienkie pojedyncze —jeżeli przebiegają pod płaszczyzną struktury p i kreską podwójną — jeżeli 
przebiegają nad płaszczyzną. W strukturach p występują dwa rodzaje połączeń: łańcuch polipeptydowy może opuścić płaszczyznę struk¬ 
tury p i powrócić na nią z tej samej strony (zwrot typu „szpilki do włosów”) lub też powraca ze strony przeciwnej („przekrzyżowanie”). 
W rysunkach górnych nie uwzględniono ani długości ani ich konformacji. Najmniejsze struktury P zbudowane są z łańcuchów o prze¬ 
biegu przeciwrównoległym (STBI — inhibitor enzymów proteolitycznych oraz Liz — enzym lizozym), a układy równolegle pojawiają się 
dopiero w strukturach większych (enzymy: RNA-za — rybonuklcaza, chymtr. — chymotrypsyna, karbpt. — karboksypeptydaza, oraz 
chlorofil bakteryjny). Większe struktury P , a zwłaszcza te, które mają bardzo regularny przebieg i brak przekrzyżowań. układają się cy¬ 
lindrycznie, w tzw. p — baryłkę. Połączenia między łańcuchami w strukturze p często mają charakter helikalny (rubredoksyna — metalo- 
proteid bakteryjny, prealbumina — białko osocza krwi, izomeraza FT — enzym przemiany cukrowcowej) 


—S—S— (tzw. mostki dwusiarczkowe) między dwie¬ 
ma resztami cysteiny (rys. 11). 

Nie wszystkie polarne reszty aminokwasów znajdu¬ 
ją się na powierzchni i nie wszystkie apolarne we¬ 
wnątrz cząsteczki białka. Tam, gdzie pozycja danego 
aminokwasu nie odpowiada jego termodynamicznie 
faworyzowanej lokalizacji, w cząsteczce białka po¬ 
wstają lokalne naprężenia, mimo że jako całość 
może się ona znajdować w minimum energetycznym. 
Ma to bardzo duże znaczenie dla funkcji biologicz¬ 
nej białka. Skryte w hydrofobowym wnętrzu grupy 



jonowe dwusiarczkowe wodorowe hydrofobowe 

[Lys-Glu] [Cys-Cys] [Asp-Tyr] [Val-Val] 

5 

Rys. 11. Niektóre wiązania międzyłańcuchowe w białkach. Dwa 
odcinki tego samego łańcucha polipeptydowego (linia zygzako¬ 
wata na niebieskim tle) mogą się ze sobą połączyć wiązaniem jo¬ 
nowym, dwusiarczkowym, wodorowym lub hydrofobowym. Są 
to przykłady najczęściej w białkach występujących wiązań, słu¬ 
żących do stabilizacji ich struktury trzeciorzędowej. Wzory reszt 
aminokwasów, tworzących dane wiązanie, podano pod schema¬ 
tem w skrótach trójliterowych 


polarne silniej oddziałują elektrostatycznie, niż gdyby 
się znajdowały w środowisku wodnym, mającym dużą 
przenikalność elektryczną. W rezultacie odgrywają 
one dużą rolę w utrzymywaniu struktury przestrzen¬ 
nej białka (np. wtedy, gdy wiązanie wodorowe jest 
chronione przez bezwodne środowisko), a także w jego 
właściwościach katalitycznych (gdy w bezwodnym 
obszarze wiązania substratu znajduje się nie zjoni- 
zowana grupa —COOH, mogąca katalizować prze¬ 
kształcenie kowalencyjne substratu, o czym niżej). 
Apolarne, lecz powierzchniowo ulokowane łańcuchy 
boczne dążą do uzyskania bardziej bezwodnego oto¬ 
czenia przez tworzenie kompleksów z innymi biał¬ 
kami czy z substancjami, znajdującymi się w otacza¬ 
jącym roztworze, a mającymi cechy hydrofobowe. 
Siła takiego wiązania (stała stabilności kompleksu) 
uzależniona jest od stopnia dostosowania (komple- 
mentarności) powierzchni hydrofobowej białka do 
substancji wiązanej (zwanej ogólnie ligandem). Jest 
to podłożem molekularnym najważniejszej biologicz¬ 
nie funkcji białka —jego zdolności do rozpoznawania 
swoistych dla niego ligandów w otoczeniu. Właści¬ 
wość ta jest podłożem wybiórczości w działaniu bia¬ 
łek (np. receptorów, enzymów, transporterów), a tak¬ 
że możliwości samoorganizacji białek do wysoko 
spolimeryzowanych superstruktur molekularnych. 


Rodzaje białek 


Białka — elastyczny szkielet organizmów 

Zrąb organizmów żywych tworzy subtelne utkanie, 
w skład którego wchodzą białka, wielocukry, czasem 
również lipidy oraz krystaliczne składniki mineralne 
(np. kości). Białka zwane podporowymi lub struk¬ 
turalnymi tworzą osnowę zrębu: utrzymują jego orga¬ 
nizację, nadają mu spoistość i sprężystość, w ich 
sieci ulokowane są komórki produkujące poszczegól- 


typołogia 
struktur (.? 


zdolność do 
rozpoznawa¬ 
nia swoistych 
ligandów 
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ne składniki zrębu. Jednakże rola białek struktural¬ 
nych nie jest tylko pasywna, podtrzymująca. Orga¬ 
nizm jest plastyczny, a w jego ruchach białka struk¬ 
turalne często są składnikiem czynnym. Wreszcie — 
oddziaływanie białek strukturalnych z różnymi skład¬ 
nikami ustroju, lokalnymi czy dopływającymi z krwią, 
sprawia, że stanowią one istotny element w integracji 
organizmu. 

Białka strukturalne z reguły są białkami polime- 
rycznymi. Zbudowane są z dużej liczby podjednostek, 
połączonych ze sobą głównie wiązaniami niekowalen- 
cyjnymi (często polimer jest dodatkowo wzmocniony 
wiązaniami kowalencyjnymi, np. mostkami dwu- 
siarczkowymi). Utworzenie polimeru jest procesem 
spontanicznym: podjednostki (monomery lub gdy 
najmniejsza zdolna do samoorganizacji podjedno- 
stka nie jest pojedynczym łańcuchem poiipeptydo- 
wym — protomery) łączą się ze sobą (w sposób od¬ 
wracalny) tak, że ostatecznie utworzona superstruk- 
tura molekularna jako całość znajduje się w minimum 
energetycznym i jest trwała. Układ stabilizujących ją 
wiązań określa stosunki przestrzenne między pod- 
jednostkami (tzw. strukturę czwartorzędową białka), 
a ponieważ białka polimeryczne budowane są z iden¬ 
tycznych lub prawie identycznych podjednostek, wy¬ 
kazują wysoką regularność swojej organizacji wewnę¬ 
trznej. Budowa podjednostek determinuje zarówno 
budowę białka polimerycznego, jak jego funkcję. 

Wewnętrzny szkielet komórek tworzy siateczka 
śródplazmatyczna (—*■ Błony komórkowe) oraz — 
w komórkach zawierających jądro, roślinnych i zwie¬ 
rzęcych — system delikatnych rureczek, zwanych 
mikrotubulami (il. 114, tabl. 28). Mają one charakter 
tworów pojedynczych lub podwójnych, długości ułam¬ 
ków mikrometra, choć czasem znacznie dłuższych. 
W aparacie ruchowym komórki, np. w witkach ple¬ 
mników, mikrotubule tworzą precyzyjny (i spotykany 
w innych białkach strukturalnych) splot „9+2” 
(rys. 12), sprzęgnięty z cząsteczkami enzymu, do- 



Rys. 12. Aparat ruchowy komórki. Na powierzchni wielu ko¬ 
mórek znajdują się długie cienkie wypustki, będące w stałym 
ruchu. Ich głównym elementem strukturalnym i ruchowym są 
mikrotubule. Wypustki te stanowią aparat ruchowy komórki, 
np. witki plemników, lub przesuwają wzdłuż powierzchni ko¬ 
mórki płyn, zawiesinę czy ciała obce, np. rzęski (il. 116, tabl. 28). 
Rzęski i witki mają podobną budowę: dwie centralne mikrotu¬ 
bule pojedyncze otoczone są przez 9 podwójnych mikrotubuli, 
tworząc tzw. splot „9-1-2”. Liczne inne białka zapewniają trwa¬ 
łość całego narządu, a wśród nich znajduje się również dyneina, 
enzym udostępniający energię, zawartą w ATP {-*■ Organizacja 
procesów życiowych komórki) dla wykonania pracy mechanicz¬ 
nej. Ruch rzęski czy witki podobny jest do ruchu szybko uderza¬ 
jącego bata. Wywołany on jest przez kolejne przesuwanie się 
jednej połowy podwójnej mikrotubuli wzdłuż jej drugiej połowy, 
która pozostaje nieruchoma (il. 114, tabl. 28) 
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starczającego energii koniecznej do wykonywania 
pracy mechanicznej. Mikrotubula zbudowana jest 
z podjednostek, małego globularnego białka zwanego 
tubuliną (il. 116, tabl. 28), ułożonego hełikalnie w 
ścianie mikrotubuli. Helikalny układ podjednostek 
sprawia, że dwa końce mikrotubuli różnią się od 
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Rys. 13. Struktura kolagenu. Lewoskrętny heliks kolagenu ma 
3 reszty aminokwasowe w jednym zwoju. Pochylenie zwojów jest 
znacznie większe niż w analogicznej strukturze a (rys. 7), w wyni¬ 
ku czego łańcuchy boczne nie stanowią przeszkody dla uzwojenia 
w lewo, ale grupy —CO i —NH skierowane są na zewnątrz 
heliksu i nic mogą utworzyć wewnątrzcząsteczkowych wiązań 
wodorowych charakterystycznych dla struktur a. Lewoskrętny 
heliks kolagenu może być ustabilizowany tylko wtedy, gdy trzy 
podobnie ukształtowane łańcuchy polipeptydowe zbliżą się do 
siebie na tyle, by powstały między nimi wiązania wodorowe. 
Z prawej strony ukazana jest trójłancuchowa struktura kolagenu 
(rysunek nie uwidacznia tego, że struktura trójłancuchowa jest 
jako całość lekko skręcona prawoskrętnie) 


siebie, a to jest skojarzone z jej funkcją biologiczną: 
mikrotubula jest kierunkowskazem i organizatorem 
procesów nadających komórce jej anizotropię — róż- 
nokierunkowość jej budowy i czynności. Mikrotubule 
formowane są w cytoplazmie, z obfitego zasobu 
podjednostek zawsze tam, gdzie ulega polaryzacji 
struktura i funkcja komórki: przy wytwarzaniu 
wrzeciona mitotycznego, narządów ruchu przy wydłu¬ 
żaniu ciała komórki, przy sekrecji enzymów hormo¬ 
nów. 

Funkcja mikrotubuli jest bezpośrednio związana 
z podziałem komórki i jej różnicowaniem się; pro¬ 
cesy te ulegają zahamowaniu przez różne czynniki 
(m.in. farmakologiczne), które uniemożliwiają samo- 
organizację wolnej tubuliny w mikrotubule (znalazło 
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Rys. 14. Powstawanie włókna kolagenu. Łańcuchy polipeptydo- 
we kolagenu powstają na rybosomach, następnie niektóre reszty 
proliny są w nich przekształcone w reszty hydroksyprołiny (ta¬ 
bela) i do łańcucha podstawiane są reszty cukrowe. Tak zmody¬ 
fikowane łańcuchy łączą się ze sobą wiązaniami dwusiarczko- 
wymi (—S—) na jednym końcu w obszarze tzw. peptydów usta¬ 
lających (faliste końce). Struktura trójłaricuchowa kolagenu 
ulega w ten sposób stabilizacji na długości ok. 1000 aminokwa¬ 
sów. Peptydy ustalające mające inny skład aminokwasowy niż 
reszta łańcucha (w której co trzecim aminokwasem jest glicyna) 
ulegają skróceniu przez swoisty enzym, peptydazę kolagenu, 
i cała trójłańcuchowa struktura staje się zdolna do spontanicznej 
polimeryzacji. Włókno kolagenu organizuje się w ten sposób, że 
wszystkie cząsteczki tropokolagenu układają się równolegle 
i w tym samym kierunku, a każda z nich jest w stosunku do są¬ 
siednich przesunięta o 1 / 4 swój ej długości. Ta regularność budow-y 
znajduje swój wyraz w obrazach uzyskanych w mikroskopie 
elektronowym (powiększenie 100 tys. razy — preparat barwiony 
meta lem, 30 tys. razy — preparat napylany metalem) 
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to zastosowanie m.in. w praktyce przeszczepiania 
tkanek). Mikrotubule występują wyłącznie u orga¬ 
nizmów posiadających jądra komórkowe (brak ich 
u bakterii); u wszystkich tych organizmów skład 
aminokwasowy tubuliny oraz forma i funkcja mikro- 
tubuli są jednakowe. Wskazuje to, że tubulina po¬ 
wstała jako białko o decydującym znaczeniu dla 
przekształcenia się organizmów prostych, bezjądrza- 
stych, w organizmy wyższe, jądrzaste i wielokomór¬ 
kowe. Geny kontrolujące syntezę tubuliny są zapewne 
produktem szczególnie starannej selekcji, gdyż jak 
się wydaje, przetrwały bez istotnych zmian ponad 
miliard lat. 

między ko- Międzykomórkowy zrąb strukturalny organizmów 
mórkami — zwierzęcych tworzy kolagen, białko stanowiące do 

kolagen 30% masy wszystkich białek ich ustroju. Długie, silne 
i dosyć sztywne włókna kolagenowe, związane 
z substancją podstawową (z białkami, wielocukrami, 
materiałem mineralnym), są osnową wszystkich ro¬ 
dzajów tkanki łącznej — kości, chrząstek, skóry itd. 
Uniwersalne znaczenie kolagenu dla budowy ciała 
zwierząt, w zestawieniu z jego nie spotykaną w innych 
białkach konformacją (rys. 13), wskazuje, że jest 
on wynikiem szczególnie surowej presji selekcyjnej. 
Z tym też zapewne jest związany niezwykle złożony 
proces formowania włókna kolagenowego, w którym 
potranslacyjna modyfikacja łańcucha polipepty- 
dowego (modyfikacja chemiczna aminokwasów, 
zachodząca po zakończeniu jego biosyntezy) odgrywa 
istotną rolę. 

Włókno kolagenowe powstaje spontanicznie z pro- 
tomerów tropokolagenu (rys. 14), jednakże uformo¬ 
wanie tych zdolnych do samoorganizacji podjedno- 
stek wymaga działania szeregu enzymów, mogących 
rozpoznać wybrane odcinki sekwencji aminokwaso- 
wej w pierwotnie syntetyzowanym łańcuchu polipep- 
tydowym. Najpierw niektóre reszty proliny zostają 
przekształcone w reszty hydroksyproliny, co ułatwia 
lewoskrętneuzwojenie heliksu (ii. 114, tabl. 28). Kon¬ 
formacja ta jest jednak nietrwała i jej powstanie 
byłoby mało prawdopodobne, gdyby końce trzech 
łańcuchów nie zostały połączone ze sobą (w obszarze 
tzw. peptydów ustalających; rys. 14). Wtedy dopiero 
całemu zespołowi zostaje nadany zwijający go ruch 
obrotowy (podobny do przędzenia na kołowrotku) 
o nieznanym mechanizmie, ale zapewne przy jednym 
końcu ustabilizowanym, i drugim — ruchomym. 
Wreszcie — peptydy ustalające są odcinane (przez 
następny swoisty enzym, rozpoznający ich sekwencję) 
i gotowy tropokolagen wydalany jest z komórki. 
W przestrzeni pozakomórkowej tropokolagen spon¬ 
tanicznie polimeryzuje (rys. 14) w sposób analogiczny 
do tego, jakim się posługuje powroźnik przy splataniu 
liny: ciągłość całej struktury zapewnia niewielkie 
przesunięcie poszczególnych jej elementów składo¬ 
wych w stosunku do siebie. Samoorganizacja włókna 
dokonuje się z ogromną precyzją: każda cząsteczka 
tropokolagenu jest przesunięta dokładnie o 234±3 
aminokwasy w stosunku do sąsiedniej. To drugie, po¬ 
zornie mało prawdopodobne zdarzenie w formowaniu 
włókna kolagenowego umożliwione jest przez szcze¬ 
gólną sekwencję jego łańcucha: cząsteczki tropokola¬ 
genu są właśnie o tyle przesunięte, że wytwarza się 
między nimi maksymalna ilość wiązań niekowalencyj- 
nych, a także powstają wiązania kowalencyjne między 
wcześniej odpowiednio zmodyfikowanymi resztami 
lizyny. 

osłony Osłony zewnętrzne organizmów zwierzęcych speł- 
zewnętrzne niają ważne, lecz mało skomplikowane zadania. 

Mają one też dość prostą budowę, nadającą im wy¬ 
różniające się własności mechaniczne i znaczną na 
ogół odporność na czynniki środowiskowe. Ich łań¬ 
cuch polipeptydowy w całości lub w znacznej części 
ma jednolitą konformację — albo strukturę a, albo 
strukturę /?. 

jedwab Przykładem białka osłonowego o strukturze fł jest 
jedwab, z którego stawonogi, a głównie owady i pa¬ 
jęczaki budują oprząd i gniazda oraz tworzą instru- 
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ment lokomocyjny — pajęczynę. Elementem nośnym 
włókna jedwabiu jest fibroina, białko zbudowane 
z fałdowanych arkuszy o przeciwrównoległej konfor¬ 
macji. W łańcuchu polipeptydowym fibroiny na dłu¬ 
gich odcinkach występują powtarzające się sekwencje 
(Gly-Ser-Gli-Ala-Gly-AIa)n. Włókno jedwabiu utwo¬ 
rzone jest z wielu takich arkuszy nałożonych na siebie 
(i wtopionych w serycynę — białko o nieregularnej 
konformacji, zwane klejem jedwabnym). W rezulta¬ 
cie — we włóknie występują regularne zgrupowania 
łańcuchów bocznych glicyny i alaniny (rys. 15) 



siebie pofałdowane („plisowane”) arkusze fibroiny (struktura (i), 
model otrzymany na podstawie badań krystalograficznych. Re¬ 
gularne rozmieszczenie powtarzających się wzdłuż łańcucha 
głównego reszt — alaniny (A) i glicyny (G) — prowadzi do utwo¬ 
rzenia krystalicznej struktury białkowej 


o charakterze krystalicznym; zgrupowania te nadają 
mu miękkość i giętkość oraz typowy dla jedwabiu 
piękny połysk. 

Tam, gdzie sprężystość ma być główną cechą ma¬ 
teriału osłonowego, budowany jest on z elastycznych 
a-heliksów. Sposób jednak, w jaki się formuje super- 
struktura molekularna o konformacji a, nadaje jej a-keratyna 
również i inne pożądane cechy, a zwłaszcza odpor¬ 
ność na zerwanie, jak to ilustruje przykład a-keratyny 
(rys. 16). Na najniższym szczeblu samoorganizacji 
powstaje protomer (protofibryla, rys. 16a), będący 
superheliksem trójłańcuchowym o splocie liny. Na 
szczeblu następnym protofibryle asocjują do splotu 
„9+2” (rys. 10), konstrukcją bardziej podobnego do 
kabla niż liny i odpowiednio silniejszego. Dalsza zaś 
organizacja a-keratyny zachodzi dopiero pod wpły¬ 
wem potranslacyjnej modyfikacji jej łańcucha poli- 
peptydowego: reszty cysteiny utleniane są do cystyn 
i tworzą mostki dwusiarczkowe, wzmacniające heliksy 
wzdłuż i łączące je poprzecznie ze sobą i z substancją 
podstawową, białkiem bogatym w cysteinę, ale nie 
mającym regularnej konformacji. Włókno keratyno- 
we staje się w ten sposób odporne na zerwanie, pozo¬ 
staje giętkie i elastyczne, natomiast przy bardzo 
dużej ilości mostków dwusiarczkowych jest twarde, 
jak na przykład w rogach, kopytach i paznokciach. 

We wszystkich białkach strukturalnych ogólna za¬ 
sada ich tworzenia się jest jednakowa: spontaniczna 
polimeryzacja podjednostek do wielkiej superstruk- 
tury molekularnej. Znajduje też ona zastosowanie 
w konstruowaniu wielu innych białek, np. enzymów 
oligomerycznych oraz wirusów. 

Powstaje pytanie, dlaczego przyroda wybrała ten dłaczego 
sposób konstruowania białek zamiast syntetyzować samoor- 
od razu jeden bardzo długi łańcuch polipeptydowy, ganizacja? 
który by przecież mógł spełniać identyczną funkcję. 

Jedną z przyczyn jest niewątpliwie ogólna tendencja 
ewolucji do maksymalnie oszczędnego gospodarowa¬ 
nia materiałem genetycznym: znacznie mniej DNA 
potrzeba do zakodowania małej podjednostki i wbu¬ 
dowania w nią wszystkich potrzebnych do samoorga- 


nizacji wskazówek niż do zakodowania olbrzymiego 
włos — łańcucha polipeptydowego. Maleje także szansa błę- 
struktura du, jeżeli wynosi ona np. 10 -3 na 1 aminokwas, to błąd 
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pojawi się w łańcuchu składającym się z wielu tysięcy 
aminokwasów, natomiast krótkie podjednostki będą 
w znacznej części od błędu wolne. Co więcej — pod- 
jednostka z defektem może być łatwo pominięta przy 
tworzeniu superstruktury, podczas gdy wycięcie błęd¬ 
nego odcinka sekwencji wymaga istnienia aparatu, 
który może go rozpoznać, i enzymów rozszczepiają¬ 
cych wiązania peptydowe. Wreszcie — niekowalencyj- 
ny sposób łączenia ze sobą podjednostek sprawia, że 
superstruktura — przynajmniej zanim zostanie usta¬ 
bilizowana wiązaniami kowalencyjnymi — jest agre¬ 
gatem odwracalnym i jej powstawanie staje się zależne 
od aktualnego stężenia podjednostek, co umożliwia 
lepszą kontrolę procesu samoorganizacji i uzależnia 
go od różnych czynników ustrojowych. 


Białka — narzędzia transportu 

Złożony układ błon selektywnie przepuszczalnych 
sprawia, że wymiana substancji z otoczeniem i ich 
wewnętrzne przemieszczanie w organizmach żywych 
nie zachodzi przez swobodną dyfuzję, ale prawie wy¬ 
łącznie przy udziale białek transportowych. Białka te 
ułatwiają przenoszenie związków nierozpuszczalnych, 
np. tłuszczowców, przyspieszają zgodną z różnicą 
stężeń wędrówkę związków rozpuszczalnych, np. tlenu 
z płuc do tkanek, i umożliwiają ich przenikanie 
wbrew różnicy stężeń, np. jonów nieorganicznych 
przez błony komórkowe; często też stanowią one 
magazyn substancji drobnocząsteczkowych, z którego 
komórka czerpie w miarę potrzeby (-* Organizacja 
procesów życiowych komórki; zob. też Błony komór¬ 
kowe). 

Funkcja biologiczna białka transportowego została 
wykształcona przez wytworzenie w nim swoistej po¬ 
wierzchniowej konfiguracji aminokwasów, służącej 
za centrum wiązania ligandu. Centrum to determinuje 
wybiórczość transportu albo bezpośrednio, wiążąc 
ligandy o pasującej do niego konfiguracji, albo po¬ 
średnio — wiążąc tzw. grupę prostetyczną, związek 
niebiałkowy, a często atom metalu, stanowiący właś¬ 
ciwe miejsce przyłączania ligandu. Ligand jest wią¬ 
zany niekowalencyjnie, tak że w jego wysokich stę¬ 
żeniach równowaga reakcji przesunięta jest na stronę 
kompleksu ligand-białko, a w niskich — ligand się 
odłącza (oddysocjowuje) i białko może ponownie 
służyć za transporter. 



Rys. 16. Włos: a) Przejście od pierwotnie syntetyzowanego łańcucha polipeptydowego poprzez kolejne stadia organizacji cząsteczek do 
dojrzałego włosa, b) Fotografia włosa ludzkiego (powiększenie ok. 300 razy, mikroskop elektronowy skanningowy) wyłaniającego się 
z mieszka skórnego. Widoczna jest zewnętrzna powłoka włosa, utworzona przez ułożone jak łuska rybia płaskie komórki (obfitujące w 
keratynę), oraz złuszczające się, też bogate w keratynę, komórki naskórka (zaznaczone strzałkami) 
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Przykładem prostego białka transportowego jest 
mioglobina (rys. 17), stanowiąca magazyn tlenu w 
tkance mięśniowej. Zbudowana jest ona z białka 
zwanego globiną i z tkwiącej w kieszonce globiny 
grupy prostetycznej — hemu. Atom żelaza w hemie 
wiąże tlen, a funkcją globiny jest utrzymanie żelaza 
w stanie dwuwartościowym w czasie tej reakcji 


mioglobina 



(reakcja odłączenia elektronu od żelaza ma podwyż¬ 
szoną energię aktywacji w wyniku hydrofobowego 
otoczenia hemu). Na jedną globinę w mioglobinie 


hemoglobina (podjednostka) 


Rys. 17. Mioglobina i hemoglobina: a) budowa mioglobiny, b) budowa jednej podjednostki hemoglobiny (jej cala, złożona z 4 podjedno- 
stek cząsteczka zob. rys. 19). Mioglobina jest białkiem przenoszącym tlen z krwi do mięśni. Hemoglobina wykształciła się w toku ewo¬ 
lucji z mioglobiny jako białko transportujące tlen z płuc do tkanek. Mioglobina i podjednostki hemoglobiny zbudowane są z ok. 150 
aminokwasów, a ich łańcuch polipeptydowy w ok. 80% jest w konformacji oc-heliksu. Zarys przebiegu łańcucha w mioglobinie pokazany 
jest podwójną przerywaną unią, w hemoglobinie nieco dokładniej, z zaznaczonymi atomami C“. Zarys struktury trzeciorzędowej, pokaza- 


ipeptydo wy znajduje się hem, związek żelazoorganiczny (żelazoporfiryna z centralnym atomem żelaza — kulką — i czterema sprzężonymi 
pierścieniami pięcioatomowym*, zob. wzór w kieszonce hemoglobiny; na modelu mioglobiny hem jest zaznaczony schematycznie). Do 
hemu jest przyłączany tlenmołekulamy O t . Atom żelaza hemu jest związany koordynacyjnie z óligandami, dostarczającymi po jednej pa- 
rZ u i-i r 0 c?co J d °z nich pochodzą z pierścieni organicznych (pyrolowych) porfiryny, jedna z histydyny tzw. bliskiej, 
z heliksu F (F8 na modelu hemoglobiny i wzór wpisany w model mioglobiny). Szósta para elektronowa w mioglobinie pochodzi z czą¬ 
steczki wody (W), skoordynowanej z drugiej strony z hfstydyną z heliksa E (histydyna „daleka”). W hemoglobinie w obecności tlenu 
szósta wartościowość koordynacyjna pozostaje jak się zdaje niewysycona; w obecności tlenu molekularnego 0 2 para elektronowa do- 
s arczana jest przez tlen. W mioglobinie tlen molekularny wchodzi na miejsce wody. Otoczenie hemu jest hydrofobowe, co — wraz ze 
sposobem wiązania hemu z łańcuchem polipeptydowym — zapewnia to, że wiązanie tlenu przez żelazo nie doprowadza do utlenienia 
ze aza dwuwartościowego na trójwartościowe, a to jest warunkiem spełniania przez hemoglobinę i mioglobinę ich funkcji transportowych 


krew żylna krew tętnicza 



Rys. 18. Wiązanie tlenu kooperatywne i niekooperatywne. Wy¬ 
kres pokazuje zależność między ciśnieniem cząstkowym tlenu 
a stopniem wysycenia tlenem cząsteczek hemoglobiny i mioglo¬ 
biny. Zależność ta jest hiperboliczna (krzywa m ) w przypadku 
mioglobiny, która wiąże tlen nickooperatywnie, i sigmoidalna 
(krzywa h) w przypadku hemoglobiny, wiążącej tlen koopera- 
tywnie. Wysokie wysycenie mioglobiny tlenem przy niskiej jego 
prężności pozwala jej służyć jako magazyn tlenu dla pracującego 
mięśnia nawet wtedy, gdy hemoglobina prawie całkowicie tlen 
oddysocjowała 


przypada jeden atom żelaza, tak że może ona być 
albo całkowicie tlenem wysycona, albo wolna od 
tlenu. Wysycenie więc mioglobiny tlenem przebiega 
zgodnie z kinetyką reakcji bimolekulamej i jest 
hiperboliczną funkcją stężenia tlenu w środowisku 
(rys. 18). 

W cząsteczce białka może być więcej niż jedno 
centrum wiązania ligandu i wówczas z reguły oddzia¬ 
łują one na siebie. Białka takie wykazują koopera- 
tywność wiązania ligandów: wysycenie jednego cen¬ 
trum może ułatwiać (kooperatywność dodatnia) lub 
utrudniać (kooperatywność ujemna) wysycenie na¬ 
stępnego. Krzywa wysycenia ma wówczas kształt 
esowaty (sigmoidalny), jak to ilustruje reakcja hemo¬ 
globiny z tlenem. 

Hemoglobina i mioglobina wykazują daleko idące 
podobieństwo: mają tę samą grupę funkcyjną, hem, 
i bardzo zbliżoną strukturę trzeciorzędową (rys. 17). 
Różnią się jednak tym, że mioglobina jest monome¬ 
rem, a hemoglobina tetramerem, zbudowanym z 
4 podjednostek (rys. 19), z których każda ma zresztą 
sekwencję aminokwasową, wykazującą bliskie po¬ 
krewieństwo z sekwencją mioglobiny. Hemoglobina 
ma cztery hemy w cząsteczce, wiąże więc cztery czą¬ 
steczki tlenu, a kooperatywność tego wiązania zależy 
od kontaktów między podjednostkami. Łańcuchy po- 
lipeptydowe hemoglobiny wykształciły się z łańcucha 
mioglobiny w wyniku duplikacji jej genu i nagroma¬ 
dzenia się w nim wielu punktowych mutacji (-► Kwa¬ 
sy nukleinowe). Nie zmienione zostały te odcinki se- 
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kwencji, które są odpowiedzialne za podstawową 
funkcję biologiczną transportera tlenu: wiązanie tlenu 
i ochronę dwuwartościowości żelaza. Powstały jed¬ 
nak nowe odcinki sekwencji sprawiające, że łańcuchy 
mogą się ze sobą wiązać, i to w taki sposób, że mini- 
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Heterotropowe oddziaływania uzależniają reakcje te 
od innych czynników, np. produktów przemiany ma¬ 
terii czy substancji docierających do komórki z ze¬ 
wnątrz. Współistnienie w białku izo- i allosterycznych 
centrów czyni z niego kluczowy element w regula- 


Rys. 19. Cząsteczka hemoglobiny. Hemoglobina jest tetramcrem, 
tj. białkiem zbudowanym z czterech podjednostek, złączonych 
niekowalencyjnie. W jej skład wchodzą dwie podjednostki a 
i dwie fi t mające budowę bardzo podobną do siebie i do mioglo- 
biny (zob. rys. 17). Cząsteczka hemoglobiny ma obrys prawie 
kulisty, a podjednostki są w niej rozmieszczone symetrycznie 
(klasa symetrii 222). Na rysunku pokazano prawdziwą oś sy¬ 
metrii (linia ciągła) i jedną pseudooś (linia przerywana); druga 
pseudooś jest prostopadła do płaszczyzny papieru 


mum energetyczne osiągnięte jest w tetramerze. 
Reakcja z tlenem w jednej podjednostce wywołuje 
w niej małą zmianę konformacji (rys. 20), pociągającą 
jednak za sobą zerwanie niektórych kontaktów mię¬ 
dzy podjednostkami. Sąsiadujące więc podjednostki 
znajdują sobie nową, korzystną termodynamicznie 
konformację, a cały tetramer uzyskuje w związku 
z tym nieco zmienioną strukturę czwartorzędową: 
ze sprężonej, charakterystycznej dla stanu beztleno¬ 
wego przechodzi w rozluźnioną, właściwą dla wiązań 
z tlenem (rys. 21). Najtrudniejsze jest wysycenie tlenem 
pierwszego hemu, gdyż musi zostać przełamana ba¬ 
riera energii stabilizacji stanu sprężonego tetrameru. 
Każdy jednak następny atom tlenu jest coraz łatwiej 
wiązany (czwarty — kilkaset razy szybciej niż pierw¬ 
szy), bo tetramer przeszedł już ze stanu sprężonego 
w rozluźniony. Molekularny mechanizm koopera- 
tywności polega na tym, że lokalna, a wywołana 
przez związanie ligandu zmiana struktury trzecio¬ 
rzędowej staje się bardziej uogólnioną zmianą kon¬ 
formacji, w białkach podjednostkowych wyrażającą 
się odmienną strukturą czwartorzędową. 

Oddziaływanie takie jak między hemami, tj. mię¬ 
dzy identycznymi centrami wiązania (izosterycznymi), 
nosi nazwę oddziaływania homotropowego. W biał¬ 
kach istnieją jednak centra o odmiennej budo¬ 
wie (allosteryczne), wiążące inne ligandy, np. w he¬ 
moglobinie — dwutlenek węgla, jony wodorowe, 
kwas fosfoglicerynowy. Wpływają one na wiązanie 
tlenu (m.in. usztywniając sprężoną strukturę hemo¬ 
globiny). Oddziaływanie na siebie centrów o odmien¬ 
nej budowie nazywa się oddziaływaniem hetero- 
tropowym. 

Specyficzna geometria centrum wiąpnia ligandu 
nadaje białkom zdolność wyszukiwania właściwego 
ligandu. Homotropowe oddziaływania dokładniej 
dopasowują reakcje asocjacji (przyłączania) i dyso- 
cjacji (odłączania) ligandu do aktualnych potrzeb. 



Rys. 20. Pierwszy akt przekształcenia konformacyjnego w hemo¬ 
globinie. Schemat pokazuje zmianę stosunków przestrzennych 
i wiązań niekowalencyjnych w hemoglobinie, zachodzą w wyniku 
związania przez nią tlenu molekularnego. Oznaczenia heliksów 
i niektórych aminokwasów, biorących udział w przekształceniu, 
jak na rys. 17. W nieobecności tlenu (a) atom żelaza (Fe) znajduje 
się nieco poza płaszczyzną pierścienia porfirynowego. Wiążąc 
tlen molekularny (O*) żelazo przechodzi w stan niskospinowy 
i wsuwa się w płaszczyznę porfiryny (b). Pociąga to za sobą 
histydynę „bliską”, w wyniku czego heliks F odsuwa się od 
heliksu H i pęka wiązanie wodorowe utrzymujące tyrozynę (HC2) 
w kieszonce między heliksem H i F. To z kolei osłabia drugie wią¬ 
zanie (solne, między histydyną HC3 i kwasem asparaginowym 
FG1), utrzymujące pozycję końca C podjednostki. Słabną wów¬ 
czas kontakty między podjednostkami i ostatecznie cała struktura 
podjednostkowa tetrameru (jego struktura czwartorzędowa) ulega 
rozluźnieniu, co ułatwia wiązanie następnych cząsteczek tlenu 
(zob. rys. 21) 
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Rys. 21. Przekształcenie konformacyjne tetrametrycznej hemoglo¬ 
biny. W hemoglobinie w nieobecności tlenu podjednostki mają 
charakterystyczną strukturę trzeciorzędową (symbolicznie ozna¬ 
czoną jako kwadraty: małe — podjednostki a, duże — fi). Są one 
połączone ze sobą wieloma wiązaniami (cienkie kreski) a całość 
struktury czwartorzędowej jest wzmocniona przez efektor allo- 
steryczny, związany między podjednostkami a i fi. Związanie 
tlenu prowadzi do zerwania części wiązań wewnątrzcząsteczko- 
wych (rys. 20), w konsekwencji czego zmienia się struktura trze¬ 
ciorzędowa podjednostki, która tlen związała (symbolizuje to 
zmiana kształtu kwadratowego na okrągły). Pociąga to za sobą 
rozluźnienie kontaktów między podjednostkami i ostatecznie cały 
tetramer przechodzi z formy „sprężonej", T (od ang. iense) 
w formę ,rozluźnioną”, R (od ang. rełaxcd). Zmiana struktury 
czwartorzędowej zachodzi głównie jako przesunięcie jednego 
dimeru afi w stosunku do drugiego, zmiany stosunków prze¬ 
strzennych między a i fi są nieznaczne 
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cjach metabolicznych zarówno wtedy, gdy funkcja 
wiązania występuje w nim w stanie czystym (np. 
w białkach transportowych), jak i wtedy, gdy sprzę¬ 
żona jest ona z inną funkcją, np. katalityczną (jak 
w enzymach). 

Białka — narzędzia regulowanej katalizy 

Wczesnym i krytycznym stadium katalizy, tym, które 
umożliwiło wykształcenie się wszelkich form życia, 
było utworzenie enzymów, białek o funkcji katali¬ 
tycznej. Enzymy, jak wszystkie katalizatory, przyspie¬ 
szają reakcje chemiczne, lecz same nie są w nich zuży¬ 
wane. Działają one jednak sprawniej niż sztuczne 
katalizatory, a cechą, która je uczyniła uniwersalnym 
narzędziem katalizy biologicznej, jest wysoka wybiór¬ 
czość ich działania oraz możliwość uzależnienia akty¬ 
wności od stanu komórki i od rozmaitych substancji 
w niej obecnych, m.in. produktów przemiany materii. 
Gdyby tak nie było, metabolizm stałby się chaotyczny, 
organizm nie mógłby sprawować kontroli nad zacho¬ 
dzącymi w nim reakcjami chemicznymi i niemożliwa 
stałaby się celowa odpowiedź na stale zmieniające 
się warunki otoczenia. Dlatego też wszystkie właści¬ 
wie reakcje chemiczne w organizmie żywym przebie¬ 
gają przy udziale enzymów, niezależnie od tego, czy 
są one w warunkach fizjologicznych szybkie czy po¬ 
wolne. Komórka zawiera od tysięcy (bakterie) do 
milionów (organizmy wyższe) różnych enzymów, co 
stanowi przeszło połowę wszystkich jej białek. Każdy 
enzym jest wyspecjalizowany co do reakcji, jaką 
może katalizować, oraz co do substratu (czy grupy 
podobnych substratów), na który może działać. 
Tabela przedstawia nazwy i podstawowe własności 
najważniejszych dotąd poznanych klas enzymów. 

Enzymy 

Klasa 1: Oksydoreduktazy (ok. 2000 enzymów) — katalizują od- 
szczepienie atomu wodoru lub elektronu od jednych związków 
i przeniesienie ich na drugie. Większość utleniań biologicznych 
rozpoczynają dehydrogenazy odłączające atom wodoru od grup 
alkoholowych (—CHOH), aldehydowych (—CHO), kwasowych 
(—COOH), aminowych (—NH 2 ), tiolowych (—SH) i wielu in¬ 
nych, stanowiących donory wodoru. Akceptorami mogą być 
liczne koenzymy i inne związki. Dehydrogenazy, dla ‘których 
akceptorem wodoru jest tlen molekularny O,, nazywane są oksy¬ 
dazami. W transporcie elektronów biorą też udział rozmaite biał¬ 
ka, zwłaszcza cytochromy i inne metaloproteiny (np. zawierające 
atomy miedzi, molibdenu), a także flawoproteiny, białka z wiąza¬ 
niami —S—S—. 

Klasa 2: Transferazy (ok. S00 enzymów) — katalizują przenoszenie 
grup chemicznych z jednych związków na drugie. Przenoszona 
może być grupa metylowa (—CH 3 ), aldehydowa, kwasowa, amino¬ 
wa, reszty kwasu fosforowego, aminokwasów, cukrów, nukleo- 
tydów i in. 

Klasa 3: Hydrolazy (ok. 900 enzymów) — katalizują rozszczepie¬ 
nie wiązań przy udziale cząsteczki wody, czyli hydrolizę. Dzia¬ 
łają na wiązania —C—O—, —C—N—, —C—C—, —C—Cl, 
—C—P—, —P—N—, —S—N—, —C—P—, np. esterazy hydro- 
lizuja wiązanie estrowe (—C—O—), peptydazy — peptydowe 
(—C—N—). 

Klasa 4: Liazy (ok. 300 enzymów) — katalizują wyłączanie grupy 
chemicznej ze związku, pozostawiając w nim wiązanie podwójne. 
Działają na wiązania —C—C—, -C—O—, —C—N—,—C—S— 
i inne. 

Klasa 5: Izomerazy (ok. 100 enzymów) — katalizują wewnętrzne 
przekształcenie związku,strukturalne lub geometryczne,np. prze¬ 
kształcają izomer L w D, cis w trans (rys. 4), przenoszą w obrębie 
danego związku wiązania podwójne (—C=C—), dwusiarczkowc 
(—S—S) i in. 

Klasa 6: Ligazy, zwane również syntetazami (ok. 70 enzymów) 
— katalizują połączenie dwu cząsteczek w nowy związek. Two¬ 
rzą one m.in. wiązania —C—O— (np. łączenie aminokwasu z 
tRNA), —C—S— (np. w działaniu koenzymu A) —C—C—, 
—P—O— (np. enzymy naprawiające uszkodzenia w kwasach 
nukleinowych). 

Enzymy są białkami o masach cząsteczkowych od 
tysięcy do kilku milionów daltonów. Część z nich 
(głównie enzymy wydzielane z komórek na zewnątrz) 
jest białkami monomerycznymi, zbudowanymi z jed¬ 
nego łańcucha polipeptydowego. Większość jednak 
są to białka oligomeryczne, złożone z kilku (a czasem 
więcej) podjednostek. Masy cząsteczkowe enzymów 


monomerycznych i podjednostek enzymów oligome- 
rycznych mieszczą się w tych samych granicach — od 
kilkunastu do ok. 80 tysięcy daltonów. 

Wszystkie enzymy mają wybiórczo działające cen¬ 
tra wiązania różnych ligandów. Funkcja biologiczna 
enzymu określona jest przez to centrum, z którym 
sprzężone są grupy katalitycznie czynne i które wraz 
z nimi tworzy tzw. obszar czynny enzymu. W obsza¬ 
rze tym dokonuje się reakcja chemiczna, przyspiesza¬ 
na przez dany enzym — przetworzenie substratu reak¬ 
cji w jej produkt. Oprócz centrum wiązania tego li- 
ganda, który jest substratem reakcji, enzymy mają 
zazwyczaj jedno (lub więcej) centrum allosteryczne. 
Wiązane tam ligandy mają odmienną od substratu 
budowę i nie ulegają przemianie chemicznej katalizo¬ 
wanej przez dany enzym. Natomiast wysycenie cen¬ 
trum allosterycznego przez taki ligand wywołuje lo¬ 
kalną zmianę konformacyjną w enzymie, przenoszącą 
się w okolice obszaru czynnego i powodującą — w 
drodze oddziaływania heterotropowego — zmianę 
szybkości katalizowanej reakcji. Ligandy allosterycz¬ 
ne są zazwyczaj nazywane efektorami lub modulato¬ 
rami reakcji enzymatycznych. 

Wybiórczość działania enzymów, zwana ich swo¬ 
istością substratową, jest niezwykle wysoka, nieosią¬ 
galna przy pomocy katalizatorów sztucznych. Są en¬ 
zymy działające na jeden tylko związek chemiczny lub 
na jeden z jego izomerów przestrzennych czy struk¬ 
turalnych. Czasem swoistość substratowa enzymu 
może być szersza, ale zawsze ograniczona jest do jed¬ 
nego rodzaju reakcji i określonego typu wiązania che¬ 
micznego (tabela). U jej podłoża leży specyficzna geo¬ 
metria centrum wiązania substratu, a zwiększa się 
jeszcze wskutek wymagania, by podatne na katalizę 
wiązanie było dostępne dla grup katalitycznie czyn¬ 
nych, tj. tych grup chemicznych w enzymie, które do¬ 
konują zerwania wiązań kowalencyjnych w substracie 
i utrwalają ostateczną strukturę produktu. Drobne 
nawet różnice konfiguracji atomowych wokół podat¬ 
nego na katalizę wiązania mogą spowodować, że 
związek bardzo podobny do substratu nie ulega kata¬ 
lizie, pomimo że jest wiązany w obszarze czynnym. 
Staje się on tzw. kompetytywnym inhibitorem: kon¬ 
kurując z substratem o centrum wiązania, uniemożli¬ 
wia związanie substratu i w rezultacie hamuje reakcję. 
Wiele takrch związków jest wytwarzanych w organiz¬ 
mie i odgrywają one ważną rolę w regulacji procesów 



postęp reakcji 

Rys. 22. Zmiany energetyczne w przebiegu reakcji chemicznej 
katalizowanej i niekatalizowanej. Wykres przedstawia zmiany 
swobodnej energii reakcji katalizowanej (linia ciągła) i nickatali- 
zowanej (Unia przerywana). Zaznaczono poziomy swobodnej 
energii dla substratu (S), związku przejściowego (SP) i produktu 
(P) jako funkcję postępu reakcji chemicznej. Opisana wykresem 
reakcja jest spontaniczna, gdyż poziom swobodnej energii sub¬ 
stratu jest wyższy niż produktu. Aby jednak substrat przekształcił 
się w produkt, musi powstać związek pośredni, co w-ymaga do¬ 
prowadzenia odpowiedniej ilości energii (energia aktywacji 
(Jakt). Przy wysokiej barierze energii aktywacji spontaniczna reak¬ 
cja może być niezauważalna w normalnych warunkach ciśnienia 
i temperatury. W obecności katalizatora energia aktywacji jest 
mniejsza i reakcja przebiega ze znacznie większą szybkością 
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metabolicznych. Syntetycznie otrzymywane inhibito¬ 
ry kompetyty wne znajdują szerokie zastosowanie jako 
leki, pestycydy i inne użyteczne preparaty. 

Z wysoką wybiórczością działania enzymów kojarzy 
się ich druga cecha, odróżniająca je od sztucznych ka¬ 
talizatorów — zdolność do ogromnego przyspieszania 
reakcji chemicznych. Reakcje katalizowane przez en¬ 
zymy przebiegają 10 8 i więcej razy szybciej niż w obec¬ 
ności katalizatora sztucznego. Połączenie tych dwu 
cech sprawia, że organizmy są w stanie przeprowa¬ 
dzać w stosunkowo niskiej temperaturze i przy nor¬ 
malnym ciśnieniu reakcje, dla których technologia 
współczesna musi stosować bardzo drastyczne i ob¬ 
ciążające naturalne środowisko warunki (np. katali¬ 
tyczna redukcja azotu powietrza do amoniaku). 

W reakcji chemicznej cząsteczka związku ulega 
przekształceniu kowalencyjnemu, w wyniku którego 
powstaje produkt reakcji, związek o innej niż substrat 
budowie, różniący się od niego systemem wiązań ko¬ 
walencyjnych, a na ogół także liczbą i rodzajem ato¬ 
mów. (W odróżnieniu od tego przekształcenie kon- 


formacyjne nie wymaga zajścia reakcji chemicznej, 
gdyż nie musi się zmienić struktura kowalencyjna da¬ 
nego związku). Aby doszło do reakcji chemicznej, 
cząsteczka substratu musi się zderzyć niesprężyście np. 
z inną cząsteczką. Powstaje wówczas tzw. związek 
przejściowy o budowie pośredniej między substratem 
a produktem, nie będący zresztą związkiem chemicz¬ 
nym w zwykłym tego słowa znaczeniu, gdyż jest bar¬ 
dzo nietrwały i szybko rozpada się z wytworzeniem 
produktu czy produktów reakcji. Do zderzeń niesprę- 
żystych zdolne są tylko te cząsteczki substratu (zwane 
aktywowanymi), których energia kinetyczna jest wyż¬ 
sza od średniej energii substratu o wartość określoną 
jako energia aktywacji (rys. 22). A ponieważ ich udział 
w całości w warunkach normalnych jest bardzo nie¬ 
wielki (np. 10“ 14 ), reakcje chemiczne, nawet te, które 
są spontaniczne, tj. przebiegają z ubytkiem swobodnej 
energii, zachodzą bardzo powoli, a czasem są w ogóle 
niezauważalne. 

Katalizatory przyspieszają reakcje chemiczne dzięki 
temu, że spośród wielu możliwych dróg od substratu 




5 ) rybonukleaza lizozym papaina 

Rys. 23. Modele atomowe enzymów: a) Model cząsteczki lizozymu (zob. rys. 24), enzymu rozszczepiającego niektóre wielocukry, wyko¬ 
nany z modeli atomów uwzględniających promienie van der Waalsa. Z lewej strony — lizozym z jego charakterystyczną szczeliną, miesz¬ 
czącą obszar czynny; zaznaczono kilka aminokwasów, odgrywających istotną rolę w katalizie (rys. 24). Z prawej — ten sam model lizo¬ 
zymu z substratem (zaznaczonym na niebiesko) wypełniającym szczelinę. Gdy substrat wchodzi w obszar czynny, brzeg szczeliny nieco 
się na niego nasuwa, a tryptofan (Try 62) przesuwa się o 75 nm (na rysunku niewidoczne), b) Rozmieszczenie atomów łańcucha głównego 
w trzech enzymach monometrycznych; kolorem niebieskim zaznaczony jest ogólny obrys cząsteczki 
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działanie do produktu wybierają tę, która jest najbardziej ko- 
fcat&lizatora rzystna energetycznie. Ich działanie polega na obniże¬ 
niu energii aktywacji, charakterystycznej dla danej 
reakcji (rys. 22). Katalizator wiąże aktywowaną czą¬ 
steczkę substratu na swojej powierzchni w ten sposób, 
że oddziaływanie między grupami czynnymi kataliza¬ 
tora i substratu staje się ułatwione. W rezultacie do¬ 
chodzi między nimi do termodynamicznie korzystnej 
reakcji chemicznej, stanowiącej właściwy akt katali¬ 
tyczny: zerwaniu ulegają wiązania stare (substratu) 
i powstają nowe, właściwe dla produktu. Produkt się 
oddziela, a katalizator ponownie może wejść w reak¬ 
cję z substratem. Udostępniona w akcie katalitycz¬ 
nym swobodna energia przyczynia się w znacznym 
stopniu do obniżenia energii aktywacji katalizowanej 
reakcji. 

Akt katalityczny w enzymach, przynajmniej tam, 
gdzie to było dokładnie zbadane, wydaje się przebie¬ 
gać tak samo jak w katalizatorach sztucznych. Naj¬ 
częściej jest to reakcja nukleofilna, czasem elektrofil- 
na, niejednokrotnie prowadząca do powstania ko¬ 
walencyjnego, nietrwałego związku między substratem 
a katalizatorem. Niemniej efekt działania kata¬ 
lizatora sztucznego, mierzony wielkością energii ak¬ 
tywacji, jest znacznie słabszy niż enzymu. W warun¬ 
kach normalnych np. nadtlenek wodoru („perhydrol”) 
rozpada się spontanicznie na wodę i tlen z energią 
aktywacji ok. 72 kJ/mol (18 kcal/mol); w obecno¬ 
ści katalizatora sztucznego, czerni platynowej, ener¬ 
gia aktywacji wynosi ok. 50 kJ/mol, a w obecności 
katalazy, enzymu swoistego dla reakcji rozkładu nad¬ 
tlenku wodoru, energia aktywacji wynosi zaledwie 
8 kJ/mol (szybkość reakcji rozkładu w obecności ka¬ 
talazy jest ponad 10 8 razy wyższa niż przy czerni pla¬ 
tynowej). Wobec podobieństwa mechanizmu aktu 
katalitycznego w enzymach i w katalizatorach sztucz¬ 
nych sam akt nie może być wystarczającym tłumacze¬ 
niem znacznie większej sprawności enzymów. 

Katalizatory sztuczne wymagają znacznego dopły¬ 
wu energii, by można było osiągnąć należytą szybkość 
katalizowanej reakcji, gdyż zachodzi konieczność akty¬ 
wowania bardzo dużej liczby cząsteczek substratu, 
niezbędnych do zapoczątkowania reakcji z kataliza¬ 
torem. Enzymy nie mogą funkcjonować w tak dra¬ 
stycznych warunkach, a wręcz przeciwnie — musiały 
być tak wykształcone, by miały dużą sprawność w 
enzymy środowisku, w jakim się mogła toczyć ewolucja materii 
w procesie żywej — w niskiej temperaturze, normalnym ciśnieniu, 
ewolucji w rozcieńczonym roztworze substratów. Elementem 
struktury białka, który sprawił, że pierwotnie (w ewo¬ 
lucji prebiotycznej, zanim się pojawiły organizmy) 
istniejące katalizatory chemiczne, np. metale i związki 
metaloorganiczne, przekształciły się w enzymy, było 
prawdopodobnie utworzenie w białkach, w bezpo¬ 
średniej bliskości grupy katalitycznie czynnej, cen¬ 
trum wiązania substratu. Centrum to, w dzisiejszych 
enzymach komplementarne raczej w stosunku do sta¬ 
nu przejściowego substratu niż podstawowego, wiąże 
substrat silnie i może go wychwytywać nawet przy 
bardzo jego niskim stężeniu w środowisku. Prawdo¬ 
podobieństwo reakcji np. między dwiema cząsteczka¬ 
mi jest w takim roztworze bardzo małe. Gdy jednak 
zostaną one upakowane w centrum wiązania, to tra¬ 
cą swobodę ruchu (rotacyjnego i translacyjnego) i 
znajdują się w bezpośredniej bliskości ze sobą i z enzy¬ 
mem, szybkość więc reakcji bardzo wzrasta. Wskutek 
posiadania swoistego centrum wiązania substratu 
enzym $taje się niejako maxwellowskim „demonem” 
entropii: wprowadza chwilowy stan wysokiego upo¬ 
rządkowania materii bez wydatkowania (netto) ener¬ 
gii. Jest to ważny czynnik w działaniu enzymów, być 
może krytyczny we wczesnym okresie ewolucji. Sam 
przez się nie wystarcza jednak do wyjaśnienia całego 
ogromnego przyspieszenia reakcji przez enzym. Więk¬ 
sze znaczenie ma tutaj zdolność enzymu do wykorzy¬ 
stania energii wiązania substratu dla umożliwienia 
przekształcenia konformacyjncgo i substratu, i enzy¬ 
mu. Zjawisko to zostało ujawnione w ostatnim dzie- 
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Rys. 24. Substrat w obszarze czynnym enzymu. Schemat pokazuje 
lokalizację substratu (zbudowanego z 6 reszt cukrowcowych) 
w obszarze czynnym lizozymu (rys. 23). Sześć pierścieni cukrow¬ 
cowych (nieregularne sześciokąty niebieskie) jest złączonych 
z wieloma atomami reszt aminokwasowych lizozymu wiązaniami 
wodorowymi (linie kreskowane). Podobszary wiązania dwu 
skrajnych reszt z każdego końca wielocukru utrzymują całą jego 
cząsteczkę w rozprostowanej formie. Dla trzeciego (od góry) 
i czwartego pierścienia cukrowca nie ma dosyć miejsca w obsza¬ 
rze czynnym, są one skręcone (ustawione są niemal prostopadle 
do płaszczyzny papieru) co wprowadza do ich wiązań naprężenia, 
zwłaszcza do pierścienia czwartego od góry. Grupy polarne silnie 
elektroujemnych aminokwasów, Asp 52 i Glu 35 znajdujące się 
w pobliżu wiązania między czwartym a piątym pierścieniem, 
zrywają to wiązanie i wielocukier rozpada się na dwie części. 

sięcioleciu dzięki badaniom rentgenowskim nad kry¬ 
stalicznymi enzymami i ich kompleksami z substratem 
(a ściślej — z inhibitorami kompetytywnymi, analo¬ 
gami substratu). Badania te w połączeniu z badaniami 
biochemicznymi i rozważaniami ewolucyjnymi dały 
po raz pierwszy obraz — może jeszcze niedoskonały, 
ale wewnętrznie spoisty — mechanizmów molekular¬ 
nych w działaniu enzymów. 

Obszar czynny enzymu jest ulokowany w zagłębie¬ 
niu (szczelinie, kieszonce) powierzchni jego cząsteczki 
(widoczne na rys. 23). W obszarze tym istnieje 
zazwyczaj kilka podobszarów (rys. 24), komplemen¬ 
tarnych w stosunku do poszczególnych części sub¬ 
stratu lub przyjmujących różne substraty, gdy enzym 
działa więcej niż na jeden substrat jednocześnie (więk¬ 
szość reakcji enzymatycznych jest dwusubstratowa, 
choć często dla uproszczenia pomija się, że np. woda obszar 
jest też substratem w wielu reakcjach). Specyficzna czynny 
geometria obszaru czynnego zmusza substrat do przy- enzymu 
jęcia konformacji odmiennej od tej, którą miał w sta¬ 
nie wolnym w roztworze. Wprowadzone zostają w ten 
sposób naprężenia do jego cząsteczki: ulegają zmianie 
kąty wartościowości, odległości atomowe, maleje ener¬ 
gia stabilizacji rezonansowej niektórych wiązań. Czą¬ 
steczka się zniekształca, na ogół geometrycznie, ale 



często również elektrostatycznie, i przybliża do formy 
związku przejściowego, w której jest silniej związana 
z enzymem. Energia wiązania substratu jest też wyko¬ 
rzystywana w lokalnych zmianach konformacji en¬ 
zymu: katalitycznie czynne grupy (w enzymach, w od¬ 
różnieniu od katalizatorów sztucznych — często jed¬ 
nocześnie elektro- i nukleofilne) zbliżają się do strate¬ 
gicznie ważnych miejsc substratu, przede wszystkim 
tych, w których w stanie przejściowym pojawią się 
formalne lub częściowe ładunki. Łatwo już wtedy 
zajdzie właściwy akt katalityczny: ostateczna polary¬ 
zacja elektronów w nietrwałym związku przejściowym, 
prowadząca do wytworzenia trwałych wiązań kowa¬ 
lencyjnych produktu reakcji. 

Nasilenie zmian konformacyjnych w substracie 
i w enzymie bywa różne w rozmaitych reakcjach enzy¬ 
matycznych. Gdy substrat ma dużą swobodę zmiany 
swojej konformacji, jak np. wielocukier (rys. 24), to 
enzym może być dosyć sztywny i może ulegać tylko 
bardzo niewielkim przekształceniom. Wyraźne nato¬ 
miast zmiany konformacji enzymu zachodzą, gdy 
rozrywane wiązanie jest sztywne, jak np. wiązanie 
peptydowe (rys. 25). Czasem zaś zmiany konforma- 
cyjne substratu są bardzo małe, natomiast duże jest 
przemieszczenie w nim ładunków elektrostatycznych 
(rys. 27). 

enzymy Mechanizm katalizy enzymatycznej odzwierciedla 
katalizatory warunki, jakie biosfera stawiała, by ewolucja orga- 
techniczne nizmów żywych zachodziła pomyślnie. Bezwzględne 
wymagania selekcji biologicznej doprowadziły do 
utworzenia katalizatorów, działających z niezwykłą 


sprawnością w bardzo wąskich granicach niskiej tem¬ 
peratury i w niewielkim stężeniu substratów. Człowiek 
w swoim empirycznym podejściu nieświadomie wyko¬ 
rzystał do opracowania katalizatorów technicznych 
jedną tylko cechę strukturalną enzymów — udział me¬ 
talu w obszarze czynnym, cechę bardzo wielu enzy¬ 
mów i praktycznie wszystkich katalizatorów technicz¬ 
nych. Bogactwo jednak rozwiązań ewolucyjnych pro¬ 
blemu katalizy jest znacznie większe. Wiele enzymów 
nie zawiera metalu w swojej cząsteczce, a ich grupy 
katalitycznie czynne nie wykazują — w odróżnieniu 
od metalu — aktywności katalitycznej, gdy są odłą¬ 
czone od białka. Nie ulega wątpliwości, że głębsze po¬ 
znanie subtelnej struktury enzymów i molekularnych 
mechanizmów w ich działaniu dostarczy przesłanek 
do utworzenia katalizatorów technicznych „drugiej 1 
generacji”, opartych na wzorach wypracowanych 
przez przyrodę, wydajniejszych niż dotychczasowe, 
nie wymagających tak dużego wkładu energii i mniej 
obciążających naturalne środowisko człowieka. 

Szybkość katalizy enzymatycznej, podobnie jak regulacja 
szybkość innych reakcji w roztworach wodnych, za- funkcji 
leży od stężeń substratu, produktu, jonów wodoro- enzymów 
wych oraz od temperatury, potencjału oksydoreduk- 
cyjnego, lepkości i in. Czynniki te wpływają na prze¬ 
bieg reakcji metabolicznych, są jednak zbyt mało 
swoiste by zapewnić dostateczną subtelność regula¬ 
cji funkcji enzymów. Duże natomiast znaczenie mają 
tu swoiste cechy obszaru czynnego enzymów. Enzym 
np. może skierować przemianę substratu w określo¬ 
nym kierunku, jeżeli z kilku enzymów działających na 



Rys. 25. Zmiany konformacyjne enzymu w czasie katalizy. Rysunek przedstawia część (ok. ł /*) łańcucha polipeptydowego karboksypep* 
tydazy (zob. rys. 10), enzymu rozrywającego ostatnie od końca C wiązanie peptydowe w białkach. Na rys. a) widoczna jest szczelina pro¬ 
wadząca do obszaru czynnego, który na rys. b) wypełniony jest substratem (dwupeptyd Gli-Tyr, puste kółka niebieskie). Substrat jest 
związany swoim końcem N (grupą —CO glicyny) z atomem cynku (Zn), stanowiącym integralną część obszaru czynnego; koniec C 
substratu (pierścień tyrozyny) znajduje się w hydrofobowej kieszonce obszaru czynnego. Związanie substratu wywołuje znaczne prze¬ 
mieszczenie trzech reszt aminokwasowych, zaznaczonych pełnymi kółkami niebieskimi. Grupa hydroksylowa Tyr 248 wiąże dwoma wią¬ 
zaniami wodorowymi grupę aminową substratu i grupę —NH jego łańcucha głównego. Arg 145 wiąże jego grupę karboksylową, a grupa 
karboksylowa Glu 270 atakuje spolaryzowane przez związanie z cynkiem wiązanie peptydowe substratu 
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dany substrat jeden przekształca go sprawniej niż inne. 
A także w wielu reakcjach metabolicznych (rys. 26) 
wytwarzane są produkty będące kompetytywnymi 
inhibitorami różnych enzymów, co stwarza możliwość 
sprzężenia rozmaitych ciągów reakcji enzymatycz¬ 
nych ze sobą. Ważnym czynnikiem regulacji dla nie¬ 
których enzymów są koenzymy, drobnocząsteczkowe 
związki organiczne, wiązane przez enzym w jednym 
z pod obszarów czynnego obszaru i stanowiące współ- 
substrat w jego działaniu katalitycznym. Koenzym 
wiąże się (kowalencyjnie) z produktem reakcji, w tej 
postaci oddysocjowuje od enzymu i jest transportowa¬ 
ny do innych enzymów. Tam produkt zostaje odłączo¬ 
ny od koenzymu i przetwarzany dalej, a koenzym re¬ 
generuje się i ponownie wchodzi w cykl reakcji. Za¬ 
sób koenzymów w komórce jest niewielki (większość 
z nich stanowią witaminy i ich pochodne), tak że do¬ 
stępność koenzymu dla danej reakcji enzymatycznej 
staje się czynnikiem kontrolującym szybkość całego 
ciągu przemian metabolicznych, jak np. NAD — w 
łańcuchu oddechowym (-*■ Organizacja procesów ży¬ 
ciowych komórki). 

Praktycznie nieograniczone możliwości regulacji 
funkcji enzymu wynikają z oddziaływań heterotropo- 
wych, związane z obecnością w nim centrów alloste- 
rycznych: uzależniają one bowiem szybkość katalizy, 
a nawet jej swoistość nie od substratu czy produktu, 
ale od czynników o zupełnie innej budowie. Oddziały¬ 
wania heterotropowe występują zarówno w enzymach 
monomerycznych, jak oligomerycznych (często nazy¬ 
wanych enzymami allosterycznymi), zwłaszcza jednak 
silnie są rozwinięte w tych ostatnich. Enzymy bowiem 
monomeryczne mają na ogół tylko jeden obszar czyn¬ 
ny w swojej cząsteczce (wyjątki są nieliczne), podczas 
gdy w enzymach oligomerycznych może być ich tyle, 
ile jest podjednostek, a więc efektory reakcji wpływa¬ 
ją na cały system oddziaływań homotropowych. Co 
więcej — w enzymach oligomerycznych podjednostki 
nie muszą być identyczne, mogą się różnić swoistością 
substratową, a część z nich może być wyspecjalizowa¬ 
na jako podjednostki regulacyjne pozbawione funkcji 
katalitycznej, tylko hamujące (czy aktywujące) funkcję 
podjednostki katalitycznej w oligomerze. 

Enzymy oligomeryczne zostały w toku ewolucji tak 
wyselekcjonowane, że przynajmniej jednym efekto- 



Rys. 26. Allosteryczne sprzężenia zwrotne w biosyntezie. Schemat 
pokazuje powstawanie kilku różnych aminokwasów z kwasu 
asparaginowego jako substratu (aminokwasy oznaczone skróta¬ 
mi trójliterowymi, tak jak w tabeli; Hse —homoseryna, Asp-P0 4 
i Asp-CHO — fosforan asparatylu i semialdehyd asparatylu, 
odpowiednio). Powstające aminokwasy (droga biosyntezy — 
strzałki czarne, kilka grotów na strzałce oznacza, że pominięto 
kilka produktów pośrednich) stają się efektorami allosterycznymi, 
hamującymi (strzałki niebieskie) niektóre wcześniejsze etapy ich 
biosyntezy 
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Rys. 27. Elektronowe przesunięcia w enzymie w czasie katalizy. 
Chymotrypsyna jest enzymem proteolitycznym (proteazą), tj. roz¬ 
szczepiającym wiązania peptydowe w białkach. W czasie katalizy 
nie ulega ona wyraźnym przekształceniom konformacyjnym 
(w odróżnieniu od np. karboksypeptydazy — rys. 25) ani też nie 
doprowadza do geometrycznego naprężenia w substracie (w od¬ 
różnieniu od np. lizozymu, rys. 24). Katalityczne działanie chy- 
motrypsyny odbywa się głównie, jeżeli nie wyłącznie, w wyniku 
przesunięć elektronowych w enzymie i w substracie: a) W obsza¬ 
rze czynnym chymotrypsyny (i wielu innych proteaz zwanych 
,,sery nowymi”) występuje aminokwas seryna w bezpośrednim są¬ 
siedztwie histydyny i kwasu asparaginowego. Aminokwasy te nie 
sąsiadują ze sobą w sekwencji, ale są zbliżone przez pofałdowania 
łańcucha polipeptydowego chymotrypsyny. Substrat jest silnie 
wiązany przez enzym w bezpośrednim sąsiedztwie układu Asp- 
His-Ser (od góry rysunku), a atomy Qf i N wiązania peptydowego 
znajdują się w kontakcie van der Waalsa z grupami czynnymi en¬ 
zymu. powoduje to przesunięcia elektronowe (niebieskie strzałki) 
nadające tlenowi seryny własności nukłcofilne. b) Atak nuklcofil- 
ny na grupę —CO substratu prowadzi do utworzenia wiązania 
kowalencyjnego między enzymem a częścią substratu zaczynają¬ 
cą się od —CO wiązania peptydowego, rozrywanego przez enzym. 
Histydyna staje się donorem wodoru do grupy —NH substratu, a 
powstająca amina odłącza się od obszaru czynnego, c) Na miejsce 
aminy wchodzi cząsteczka wody, hydrolizująca wiązanie kowa¬ 
lencyjne enzym-substrat. d) Druga część substratu z utworzoną 
grupą —COOH odłącza się i enzym jest zregenerowany 














































Rys. 28. Kompleks wieloenzyinowy. Wiele enzymów oligomerycznych, katalizujących kolejne etapy w ciągu reakcji metabolicznych 
uformowało się w toku ewolucji w struktury polimeryczne zw. kompleksami wieloenzymowymi. W kompleksach tych znacznie sprawniej 
przekazywane są produkty pośrednie do następnych enzymów. Rysunek przedstawia jeden z takich kompleksów wieloenzymowych, 
dehydrogenazę ketokwasów, która wprowadza produkt końcowy przemian cukrowych i tłuszczowych, kwas pirogronowy, do cyklu 
Krebsa (-+■ Organizacja procesów życiowych komórki). Pokazane są modele strukturalne (kule reprezentują protomery) oraz zdjęcia ob¬ 
razu otrzymanego za pomocą mikroskopu elektronowego. Kompleks zbudowany jest z trzech enzymów oligomerycznych: enzymu usu¬ 
wającego grupę —COOH kwasu pirogronowego i redukującą jego grupę —CO (E x ); enzymu utleniającego produkt poprzedniej reakcji 
do kwasu octowego (E 2 ) oraz enzymu przenoszącego resztę kwasu octowego na koenzym A (Eg). Ten ostatni związek wchodzi do cyklu 
Krebsa. Organizatorem kompleksu jest E 2 , zbudowany z 8 protomerów w układzie sześciennym. Przyłącza on na swoich ścianach 6 czą¬ 
steczek E 3 (każda złożona z 4 protomerów) oraz na krawędziach 12 cząsteczek E x (każda złożona z 2 protomerów). Masa cząsteczkowa 
kompleksu wynosi ok. 4,5 miliona daltonów 


rem reakcji jest produkt końcowy tego ciągu reakcji, 
w którym dany enzym stanowi stadium początkowe 
(rys. 27). Hamowanie funkcji enzymu może być całko¬ 
wite lub stopniowe. Na przykład enzym, który synte¬ 
tyzuje glutaminę i zapoczątkowuje co najmniej 6 róż¬ 
nych ciągów reakcji w przemianie azotowej bakterii, 
zbudowany z 12 identycznych podjednostek, jest czę¬ 
ściowo hamowany przez każdy z 6 końcowych pro¬ 
duktów, a całkowicie — przez wszystkie razem. Wiele 
jednak enzymów allosterycznych ma podjednostki 
nieidentyczne i zwykle zbudowane z dimerycznych 
protomerów, w których jeden monomer jest podjed- 
nostką regulacyjną, drugi zaś — katalityczną. W di- 
merze takim podjednostka katalityczna, oddzielona 
od regulacyjnej, może być zupełnie nieaktywna lub też 
może wykazywać całkowitą aktywność. Stąd też po¬ 
wstają dwie klasy enzymów regulacyjnych tego typu: 
jedne na efektor odpowiadają zahamowaniem aktyw¬ 
ności, drugie —jej wyzwoleniem. 

Nie tylko hamowanie i aktywacja są rezultatem od¬ 
działywań allosterycznych w enzymach. Zmiana 


struktury trzeciorzędowej może doprowadzić do zmia- zmiana 
ny geometrii centrum wiązania substratu, pociągają- struktury 
cej za sobą zmianę swoistości substratowej enzymu, i zmiana 
Przykładem może tu być dehydrogenaza glutaminia- swoistości 
nowa, enzym sprzęgający biosyntezę aminokwasów substratowej 
z cyklem kwasów trójkarboksylowych Krebsa (—► Or¬ 
ganizacja procesów życiowych komórki), który może 
katalizować, w zależności od efektora, przyłączenie 
grupy aminowej do a-ketoglutaranu i tworzyć kwas 
glutaminowy, lub do pirogronianu i tworzyć alaninę. 

Enzym ten jest zbudowany z 6 identycznych podjed¬ 
nostek i w roztworze występuje jako heksamer mogą¬ 
cy mieć dwie różne postaci (oktaedr lub piramida try- 
gonalna, —► Budowa kryształów). W obecności efekto- 
rów, a także niektórych hormonów, jedna postać hek- 
sameru przechodzi w drugą z jednoczesną zmianą 
swoistości substratowej enzymu. 

W enzymie oligomerycznym podjednostki mogą się 
od siebie różnić swoistością w stosunku do substratu. 

Enzym nabiera wówczas właściwości układu (kom¬ 
pleksu) wieloenzymowego (staje się tzw. multienzy- 
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mem). Jednym z najprostszych jest enzym, który syn¬ 
tetyzuje tryptofan, zbudowany z dwu par nieidentycz- 
nych podjednostek a 2 /? 2 . Podjednostka a katalizuje po¬ 
wstanie indolu, a podjednostka przyłącza do niego 
serynę, tworząc ostatecznie tryptofan. Aktywności en¬ 
zymatyczne wolnych podjednostek są raczej niskie, 
a w kompletnym enzymie rosną prawie stukrotnie. 
Zespół dwu podjednostek (a 2 /? 2 ) pozwala na efektywne 
sprzężenie dwu kolejnych reakcji, a podjednostki wza¬ 
jemnie się w nim aktywują. Te korzystne cechy są 
w przyrodzie szeroko wykorzystywane i bardzo wiele 
kluczowo ważnych enzymów uformowanych jest 
w takie kompleksy wieloenzymowe (rys. 28). Składają 
kompleksy się one z kilku enzymów oligomerycznych i mają ściśle 
wiełoenzy- określoną budowę przestrzenną, w której jeden enzym 
mowo tworzy rdzeń i jest organizatorem całości. Przykładem 
kompleksu może być dehydrogenaza ketokwasów 
(rys. 28), organizatorem jej jest transacylaza liponiano- 


uszkodzona tkanka, ciało obce 
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wa (enzym zbudowany z 24 bardzo podobnych, może 
identycznych podjednostek), która przyłącza do siebie 
po 12 cząsteczek pozostałych dwu enzymów (w jej 
nieobecności nie agregują one ze sobą). W toku ewo¬ 
lucji enzymy wielofunkcyjne tak zostały wyselekcjo¬ 
nowane, że ich częściami składowymi są enzymy oli- 
gomeryczne, katalizując kolejne etapy w danym ciągu 
przemian metabolicznych. Stworzyło to możliwość 
bezpośredniego przekazywania produktów jednych 
reakcji do enzymów katalizujących etap następny, bez 
strat spowodowanych dyfuzją i konkurencją innych 
układów enzymatycznych. 

Większość (ok. 95%) zbadanych enzymów oligo¬ 
merycznych zbudowana jest z 2,4,6 lub 8 podjedno¬ 
stek. Protomery ich są prawie zawsze identyczne (choć 
mogą się składać z dwu lub nawet więcej jednostek —- 
i to niekoniecznie identycznych), a w oligomerze znaj¬ 
dują się w równoważnym (pseudoidentycznym) oto¬ 
czeniu. Swobodne protomery łączą się we właściwą 
dla danego enzymu strukturę czwartorzędową, bez 
tendencji do tworzenia wyższych polimerów, co wska¬ 
zuje na to, że wszystkie potencjalne wiązania między- 
protomerowe są w oligomerze wysycone. Ta cecha 
w połączeniu z małą liczebnością podjednostek (i ogra¬ 
niczeniem sterycznym wynikającym z konfiguracji 
L-a-aminokwasów) sprawia, że możliwości przestrzen¬ 
nego rozmieszczenia podjednostek w enzymie oligome- 
rycznym są bardzo ograniczone. Tetramer np. może 
mieć geometrię kwadratu lub tetraedru, heksamer zaś 
i oktamer mają po trzy możliwości, zawsze ze środ¬ 
kiem symetrii i w układzie zamkniętym (a nie linio¬ 
wym i otwartym — jak wielkie superstruktury cha¬ 
rakterystyczne dla białek strukturalnych). Czwarto¬ 
rzędowa struktura oligomeru zależna jest od trzecio¬ 
rzędowej struktury podjednostki, a ta zależy od obec¬ 
ności ligandu (np. efektora allosterycznego) w centrum 
wiązania. Jeżeli podjednostka (w najprostszym ujęciu) 
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Rys. 29. Krzepnięcie krwi jest wynikiem złożonej sekwencji reakcji enzymatycznych (kaskady), wywołanych m.in. uszkodzeniem tkanki, 
kontaktem z ciałem obcym (na lewo na górze), a doprowadzającej do powstania fibryny (na dole), wysokospolimcryzowancgo, nieroz¬ 
puszczalnego białka, zorganizowanego w rozległą sieć, w której utkwione są komórki krwi (skrzep krwi). Rysunek przedstawia kolejną 
aktywację 5 enzymów protołitycznych, zw. czynnikami krzepnięcia i oznaczonych cyframi rzymskimi, cyfry arabskie oznaczają masy 
cząsteczkowe w tys. daltonów. Każdy z nich występuje w dwu postaciach: nieczynnego prekursora i czynnego enzymu (strzałka prążko¬ 
wana pokazuje przekształcenie prekursora w enzym). Utworzony enzym modyfikuje (strzałka pojedyncza) kowalencyjną straukturę pre¬ 
kursora następnego enzymu przez nacięcie w nim kilku wiązań peptydowych (grot strzałki wskazuje na obszar ulegający wycięciu). Po 
usunięciu odcinka łańcucha polipeptydowego ujawnia się obszar czynny enzymu. Przedstawione czynniki krzepnięcia są proteazami se- 
rynowymi (rys. 27), a lokalizacja katalitycznie czynnych reszt asparaginy, histydyny i seryny pokazana jest kropkami na schemacie bu¬ 
dowy czynnika X i II; proste czarne kreski na schematach wskazują pozycje wiązań dwusiarczkowych, utrzymujących integralność czą¬ 
steczki po wycięciu części łańcucha. Ostatnim enzymem w kaskadzie jest czynnik II (prekursor — protrombina i enzym — trombma). 
Trombina — ale nie pozostałe czynniki — atakuje niektóre wiązania peptydowe w fibrynogenie (zacieniowane na modelu, na prawo na 
dole) i doprowadza do odszczepienia od niego fibrynopeptydów (na dole). Tak zmodyfikowany fibrynogen polimeryzuje spontanicznie do 
fibryny. W fibrynie monomery są początkowo połączone wiązaniami niekowalencyjnymi (kreski przerywane), potem jednak zostaje ona 
usztywniona wiązaniami kowalencyjnymi (niewidoczne na rysunku) 
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Rys. 30. Pobudzenie metabolizmu komórkowego przez hormon. Wiele hormonów jest wiązanych na powierzchni komórki, co stanowi 
pierwszy etap oddziaływania hormonu na komórkę. Wyzwala to w komórce wiele procesów, ale hormon już nic bierze w nich bezpośred¬ 
niego udziału. W procesach tych zasadniczą rolę odgrywa cykliczny nukleotyd, którego synteza jest pobudzana przez związanie pod jed¬ 
nostki regulacyjnej enzymu, cyklazy nukleotydowej (np. cyklazy przekształcającej ATP w cykliczny nukleotyd adenylowy z uwolnieniem 
nieorganicznego fosforanu — na lewo u góry). Aktywacja cyklazy przez hormon nie jest dobrze poznana, np. nie wiadomo czy podjed- 
nostka regulacyjna cyklazy (R) jest receptorem wiążącym hormon (jak na rys.), czy też istnieją jakieś etapy pośrednie. Cykliczny nu¬ 
kleotyd (cAMP), zw. „drugim posłańcem” w mechanizmie działania hormonów, wprowadza przy udziale enzymu zw. kinazą, resztę 
fosforanową (P w kółku) do rozmaitych białek i aktywuje je w ten sposób. Rysunek przedstawia przekrój ok. komórki żywej i ukazuje 
3 główne ciągi reakcji aktywowanych przez hormon za pośrednictwem cAMP: 1) Aktywacja przepuszczalności błony komórkowej jest 
spowodowana wprowadzeniem reszty fosforanowej do białka blokującego kanały jonowe i wywołaną tym zmianę jego konformacji; 
2) aktywacja enzymów, na przykładzie aktywacji przemiany cukrowej, w czym biorą udział trzy enzymy: kinaza I aktywuje kinazę II, a ta 
aktywuje fosforylazę glikogenu, enzym prowadzący do rozszczepienia glikogenu z wydzieleniem glikozy; 3) aktywacja biosyntezy białka; 
katalityczna podjednostka kinazy (K) przenika przez błonę jądrową i wprowadza resztę kwasu fosforowego do białka stabilizującego 
DNA, co w bliżej nie poznany sposób ułatwia transkrypcję genu 


ma tylko dwie możliwe struktury trzeciorzędowe (jed¬ 
ną charakterystyczną dla stanu wolnego, drugą — dla 
stanu związania z ligandem), to enzym oligomeryczny 
będzie miał dwie możliwe struktury czwartorzędo¬ 
we, odpowiadające najbardziej korzystnej interakcji 
identycznych podjednostek w ich dwu wzajemnie wy¬ 
kluczających się formach. Wysycenie jednej podjedno- 
stki ligandem doprowadza do przekształcenia jej 
struktury trzeciorzędowej, zmieniając jednocześnie 
sposób, w jaki się wiąże ona z pozostałymi podjedno- 
stkami. Uniemożliwia to utrzymanie poprzedniej 
struktury czwartorzędowej i zmusza cząsteczki do 
zmiany ich konformacji na alternatywną. Powstanie 
nowa struktura czwartorzędowa, alternatywna do po¬ 
przedniej. Chwilowo podjednostki w niej, z wyjątkiem 
pierwszej, nie są wysyccne ligandem, ale mają zwięk¬ 
szoną łatwość takiego wiązania, gdyż nowa ich struk¬ 
tura trzeciorzędowa posiada taką geometrię centrum 
wiązania jak podjednostka, która jest już z ligandem 
skompletowana. Wiele enzymów (oraz białek trans¬ 
portowych, np. hemoglobina, str. 734) tak się za¬ 
chowuje i efekt allosteryczny definiowano pierwotnie 
właśnie jako zgrane i symetryczne przekształcenie 
wszystkich podjednostek oligomeru. Dobrze to tłu¬ 
maczyło kinetykę wielu reakcji enzymatycznych i pro¬ 
cesów transportu. Dziś się jednak sądzi, że konforma¬ 
cja może się zmieniać stopniowo w kolejnych podjed- 
nostkach i że symetryczne przekształcenie struktury 
czwartorzędowej jest tylko skrajną z wielu możli¬ 
wości, sięgających aż do dysocjacji enzymu oligome- 
rycznego do wolnych podjednostek. W każdym jednak 
razie funkcjonalność architektury enzymu wyraża się 
ścisłym sprzężeniem między jego strukturą trzecio- 
i czwartorzędową, stanowiącym, że aktywność enzy¬ 


mu staje się zależna i od czynników, które wpływają 
na układ podjednostek w polimerze, i od tych, które 
modyfikują konformację podjednostki. Zawsze jednak 
ostatecznym skutkiem związania ligandu, substratu 
czy efektora jest kooperatywne wzmożenie lub zaha¬ 
mowanie katalizy enzymatycznej. 

Allosteryczne regulacje polegają w istocie na nieko- 
walencyjnych modyfikacjach struktury enzymu. Stąd 
też są one łatwo odwracalne i enzym może oscylować 
pomiędzy stanami odpowiadającymi wiązaniu roz¬ 
maitych ligandów. Często jednak potrzebna jest bar¬ 
dziej trwała zmiana własności enzymu — uruchomie¬ 
nie lub zahamowanie jego aktywności czy uzależnienie 
go (względnie uniezależnienie) od pewnych efektorów. 
Do tego celu służą kowalencyjne potranslacyjne mo¬ 
dyfikacje struktury enzymu, z reguły nadrzędne w sto¬ 
sunku do działania efektorów allosterycznych. Enzym 
może być modyfikowany nieodwracalnie, gdy np. roz¬ 
cięte zostaną w nim niektóre wiązania peptydowe 
(rys. 29), albo odwracalnie, gdy odpowiedni system 
enzymatyczny może usunąć grupy modyfikujące (rys. 
30). W każdym wypadku — ściśle określony bodziec 
(jak np. uraz powodujący krzepnięcie krwi czy hor¬ 
mon) (rys. 29 i 30) wyzwala kaskadowe, wielostopnio¬ 
we układy enzymatyczne o potężnym działaniu bio¬ 
logicznym. 


Białka — sygnały i receptory sygnałów 

W organizmach zwierzęcych funkcja biologiczna 
wszystkich komórek jest całkowicie podporządkowa¬ 
na potrzebom ustroju jako całości. Nadrzędnym inte¬ 
gratorem jest system nerwowy, komunikujący się 
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z komórkami i tkankami za pośrednictwem hormo¬ 
nów — grup różnorodnych chemicznie substancji, do 

hormony i których się dzisiaj zalicza zarówno hormony w sensie 
neurotrans- klasycznym (tj. produkty gruczołów wydzielania we- 
mitery wnętrznego), jak i tzw. neurotransmitery, czyli związki 
wydzielane przez zakończenia nerwowe. Większość 
hormonów stanowią pochodne aminokwasów oraz 
oligo- i polipeptydy, ale są wśród nich także związki 
nieaminokwasowe, jak sterydy. Hormony przekazują 
bodźce nerwowe od jednej komórki nerwowej do dru¬ 
giej (np. acetylocholina, noradrenalina), kontrolują 
metabolizm (np. insulina — przemianę cukrową), doj¬ 
rzewanie i różnicowanie komórek (np. hormony 
płciowe). Hormony są sygnałami chemicznymi, wy¬ 
zwalającymi w komórkach ich utajone lub nie w pełni 
ujawnione możliwości biologiczne przez aktywację 
tych genów, które w nieobecności hormonu pozostają 
w stanie represji, a zawarta w nich informacja gene¬ 
tyczna nie znajduje wyrazu w produkcji swoistego 
białka. 

receptory Hormony docierają do wielu (niektóre do wszyst¬ 
kich) komórek organizmu, ale tylko tzw. komórki do¬ 
celowe dla danego hormonu odpowiadają na jego 
obecność charakterystyczną aktywacją swoich funkcji 
biologicznych. Komórki bowiem docelowe, w odróż¬ 
nieniu od innych, zawierają białka zwane receptorami, 
zdolne do silnego i ściśle wybiórczego wiązania właści¬ 
wego hormonu. Receptory hormonów są białkami 
o masach cząsteczkowych w przybliżeniu od ok. 
100 000 do 300 000 dal tonów (większe zbudowane są 
z podjednostek), a ich cząsteczka ma kształt wydłużo¬ 
ny i charakter wyraźnie hydrofobowy. Prawie wszy¬ 
stkie receptory hormonów są trwale związane z błoną 
komórkową i wychwytują hormony z otaczającego 
komórkę płynu. Odmienne są tylko receptory hormo¬ 
nów sterydowych (i jak się zdaje, hormonów tarczycy), 
które się mogą przemieszczać w cytoplazmie i pobie¬ 
rać stamtąd sterydy, wnikające swobodnie do komór¬ 
ki poprzez błonę. 

Receptor wiąże hormon, ulega przekształceniu 
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Rys. 31. Receptory hormonów sterydowych. Hormony stery¬ 
dowe (trójkąty), w odróżnieniu od innych hormonów swobodnie 
przenikają z krwi do komórki. W cytoplazmie napotykają na 
swoiste dla nich receptory, białka zbudowane z dwu podjedno¬ 
stek i mające dwa miejsca wiązania dla danego hormonu. Utwo¬ 
rzenie kompleksu hormon-receptor modyfikuje cząsteczkę recep¬ 
tora tak, że może ona przeniknąć przez błonę jądrową i wiąże się 
z białkami stabilizującymi DNA. To związanie ponownie mody¬ 
fikuje cząsteczkę receptora: dysocjuje ona, jedna jej pod jednostka 
(lokalizacyjna) pozostaje związana, druga (aktywacyjna) prze¬ 
nosi się wzdłuż nici DNA i w bliżej nie poznany sposób roz¬ 
luźnia strukturę DNA, ułatwiając transkrypcję określonego genu 
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konformacyjnemu, podobnie jak białka transportowe 
i enzymy. Receptor nie jest jednak transporterem do¬ 
prowadzającym hormon do wrażliwego nań obszaru 



Rys. 32. Immunoglobuliny — białka odpowiedzi obronnej orga¬ 
nizmu. a) Immunoglobulina zbudowana jest z 4 łańcuchów poli- 
peptydowych: dwóch „ciężkich" — H (od ang. heavy ), złożonych 
z ok. 450 reszt aminokwasowych, i dwóch „lekkich” — L (od 
ang. light ), złożonych z ok. 220 reszt. Cząsteczka immunoglobu¬ 
liny ma kształt litery \ z dwuterotną osią symetrii mięazy parami 
łańcuchów Hl. Łańcuchy H ciągną się przez całą długość czą¬ 
steczki, łańcuchy L — tylko wzdłuż ramienia litery Y; końce N 
łańcuchów znajdują się na końcu ramion Y. W sekwencji amino- 
kwasowej łańcuchów powtarzają się sekwencje po około 110 ami¬ 
nokwasów, zw. domenami, spięte pośrodku wiązaniem dwusiarcz- 
kowym (—S—). b) Model utworzony na podstawie badań kry¬ 
stalograficznych. Widać, że każda z domen stanowi typową 
/J-baryłkę (rys. 10) w układzie łańcuchów przeciwrównolcgłym 
(strzałki); widoczne jest również wiązanie dwusiarczkowe (czarny 
słupek). Sekwencja aminokwasowa w domenach C (od ang. 
constant 'stały’) jest bardzo podobna u wszystkich osobników 
danego gatunku i mało się różni u rozmaitych gatunków kręgow¬ 
ców. Domeny V (od ang. variable 'zmienny’), przy pewnym po¬ 
dobieństwie ogólnym sekwencji do domen C, mają wyróżniające 
je bardzo krótkie odcinki sekwencji „hiperzmiennych” (linie fa¬ 
liste na rys. a). Te hiperzmienne sekwencje są wprowadzone do 
cząsteczki immunoglobuliny w odpowiedzi na obecność antygenu 
w organizmie (mechanizm genetyczny tego procesu jest zagad¬ 
kowy) i formują w niej obszar wiązania antygenu, c) Cząsteczka 
immunoglobuliny ma dwa, zawsze identyczne, obszary wiązania 
antygenu. Wiążąc się z antygenem, immunoglobulina (przeciw¬ 
ciało — jeżeli znany jest swoisty dla niej antygen) może tworzyć 
rozległą sieć (np. z lewej strony — sieć, której węzły tworzą de¬ 
terminanty antygenowe na powierzchni bakterii), wypadającą ze 
środowiska (np. z krwi). Cząsteczki immunoglobuliny mogą 
także wiązać się na powierzchni bakterii, wirusów i in. (na dole 
pośrodku), a następnie — wiązać je z komórkami, które mają na 
swojej powierzchni receptory dla ostatniej czy ostatnich dwóch 
domen stałych immunoglobuliny. Komórki te (np. komórki 
żerne) mają zdolność niszczenia lub unieszkodliwiania rozmai¬ 
tych ciał obcych, mogących przedostać się do organizmu 
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komórki ani też nie nabiera własności katalitycznych. 
W utworzonym kompleksie receptor staje się prze¬ 
twornikiem otrzymanej z hormonem informacji i czy¬ 
ni ją zrozumiałą dla komórki. Receptor hormonów 
sterydowych (rys. 31) przekształca się w induktor (de- 
represor, -> Organizacja procesów życiowych komór¬ 
ki) i uruchamia transkrypcję genów. Receptory trwale 
związane z błoną komórkową wywołują ten sam efekt, 
ale pośrednio: wiążą podjednostkę regulacyjną enzy¬ 
mu zwanego cyklazą nukleotydową (rys. 30), hamują¬ 
cą jej podjednostkę katalityczną, i uruchamiają ka¬ 
skadę enzymatyczną, która aktywuje rozmaite białka 
komórkowe — enzymy, białka strukturalne (układ 
tubulina-mikrotubule), białka jądra komórkowego. 
Selektywność działania receptorów hormonów stery¬ 
dowych polega prawdopodobnie na tym, że jedna ich 
podjednostka (rys. 31) rozpoznaje pewne obszary 
(tzw. miejsca akceptorowe) w chromatynie, a druga 
rozluźnia pobliski obszar zbitej, tj. spoczynkowej 
chromatyny. Nie wiadomo jednak, w jaki sposób za¬ 
chodzące w obszarze błony komórkowej oddziaływa¬ 
nie przekształconego receptora innych niż sterydowe 
hormonów z cyklazą nukleotydową doprowadza do 
aktywacji wybranych genów. 

Hormony są sygnałem chemicznym, ale analogicz¬ 
ny system receptorów funkcjonuje w przetwarzaniu 
informacji zawartej w sygnale fizycznym (takim re¬ 
ceptorem jest np. rodopsyna, zwana purpurą wzroko¬ 
wą, w siatkówce oka, aktywująca cyklazę adenylową 
pod wpływem światła widzialnego). I nie tylko sygnały 
chemiczne czy fizyczne są w ten sposób rozpoznawa¬ 
ne, ale również sygnały, których natury nie potrafimy 
jeszcze zdefiniować w pojęciach innych niż biologicz¬ 
ne. Należy do nich zdolność organizmów wyższych do 
rozróżniania między składnikiem (substancją, komór¬ 
ką) „swoim” i „obcym”, leżąca u podłoża immunolo¬ 
gicznych odczynów obronnych.' 

Ponieważ wniknięcie komórki obcej do organizmu 
wielokomórkowego stanowi dla niego potencjalne 
niebezpieczeństwo, w toku ewolucji organizmów wyż¬ 
szych wykształcone zostały mechanizmy zapobiegają¬ 
ce temu zagrożeniu. Typowym ich przykładem jest 
produkcja przeciwciał — białek należących do grupy 
immunoglobulin (rys. 31) — w odpowiedzi na zakaże¬ 
nie bakteryjne czy szczepienie ochronne. Przeciwciała 
mogą również powstać po wprowadzeniu do organiz¬ 
mu prawie każdej substancji wielkocząsteczkowej —^ 
pod warunkiem, że nie jest ona naturalnym i prawid-' 
łowym jego składnikiem. Wytworzone przeciwciało 
wiąże czynnik, który wzbudził jego produkcję (tzw. 
antygen); jest to wiązanie niekowalencyjne, ale silne 
i o wybiórczości często przekraczającej wybiórczość 
wiązania substratu przez enzym. 

Obszar wiązania antygenu (rys. 32) jest zagłębie¬ 
niem w cząsteczce przeciwciała utworzonym wspólnie 
przez A-końcowe odcinki łańcucha ciężkiego i łańcu¬ 
cha lekkiego, czyli znajduje się w domenie zmiennej, 
a jego geometrię określają łańcuchy boczne amino¬ 
kwasów hiperzmiennych (rys. 32a). Zagłębienie to 
(w cząsteczce przeciwciała) ma wymiary ok. 3,5 x 
X 1,5 x 1,0 nm, tak że może pomieścić tylko niewielką 
część antygenu wielkocząsteczkowego, jego tzw. de¬ 
terminantę, liczącą 5-7 reszt aminokwasów czy cuk¬ 
rów. Antygen ma zazwyczaj wiele determinant, a prze¬ 
ciwciało wiąże co najmniej dwa antygeny (rys. 32c), 
tak że powstający kompleks jest agregatem zbudowa¬ 
nym z wielu cząsteczek. Konformacja przeciwciała 
ulega w nim zmianie, wyrażającej się m.in. usztywnie¬ 
niem połączeń między domenami stałymi (rys. 32b). 


W wyniku zaś tego ulega aktywacji druga funkcja 
przeciwciała — funkcja efektorowa: przeciwciało na¬ 
biera zdolności do wiązania się z błonami komórek 
(np. żernych, trawiących antygeny) i z czynnikami 
znajdującymi się w osoczu krwi, a wyzwalającymi 
kaskadę enzymatyczną (tzw. komplement, czyli do¬ 
pełniacz), niszczącą spójność błony komórki obcej. 
Przeciwciało jest receptorem, który rozpoznaje sygnał 
obcości w swojej domenie zmiennej, a otrzymaną in¬ 
formację przetwarza w domenach stałych (rys. 32a,b) 
w postać zrozumiałą dla wyspecjalizowanych układów 
komórkowych organizmu, mogących wyeliminować 
komórkę czy substancję obcą. 

Za zjawisko odporności odpowiedzialne są białe 
komórki krwi zwane limfocytami. Jedne z nich wytwa¬ 
rzają przeciwciała i uwalniają je do krwi i innych pły¬ 
nów ustrojowych; odrębny rodzaj stanowią limfocyty 
biorące udział w odczynach alergicznych w odrzuca¬ 
niu przeszczepów tkankowych: rozpoznają one anty¬ 
geny za pomocą swoich receptorów, związanych z bło¬ 
ną komórkową. Budowa ich jest odmienna (choć 
o wielu cechach wspólnych) niż przeciwciał i kontrolo¬ 
wane są przez odrębne zespoły genów. Powstaje w 
związku z tym pytanie, jedno z najważniejszych we 
współczesnej biologii: skąd przeciwciało czy inny re¬ 
ceptor „wie”, że dany antygen jest obcy? W jaki spo¬ 
sób organizm może wyprodukować tak ogromną ilość 
różnych receptorów (a są ich zapewne miliony), roz¬ 
poznających praktycznie wszystkie determinanty an¬ 
tygenowe, zarówno naturalne, jak syntetyczne? Nie¬ 
gdyś sądzono, że antygen funkcjonuje jak matryca 
wytwarzająca specyficzną geometrię obszaru wiązania 
w nie uformowanej jeszcze ostatecznie cząsteczce im- 
munoglobuliny. Dziś wiemy, że te wszystkie różne re¬ 
ceptory istnieją już przed pierwszym kontaktem orga¬ 
nizmu z antygenem, w mało zróżnicowanych komór¬ 
kach macierzystych, z których powstają immunolo¬ 
gicznie czynne komórki, limfocyty. Antygen jest dla 
nich sygnałem wyzwalającym — tak jak się to dzieje 
przy pobudzeniu komórki przez hormony — podziały 
i różnicowanie, prowadzące do namnożenia populacji 
komórkowej zdolnej do swoistej odpowiedzi na dany 
antygen. Różnorodność przeciwciał (i innych tego ro¬ 
dzaju receptorów sygnału obcości) musi więc być wy¬ 
nikiem działania aparatu genetycznego, a genetyczna 
kontrola biosyntezy immunoglobulin wydaje się wy¬ 
jątkową. Pojedynczy łańcuch polipeptydowy immu- 
noglobuliny, zarówno lekki, jak ciężki, jest ciągły, ale 
jego dwie funkcjonalnie różne części, domena zmienna 
i domena stała, są pod kontrolą dwu różnych genów 
(ściślej: zespołów genów). Ogólną jednak prawidło¬ 
wością biosyntezy białka jest to, że jeden łańcuch po¬ 
lipeptydowy jest kontrolowany przez jeden gen. W 
czasie biosyntezy immunoglobulin nie pojawiają się 
odrębne mRNA (-» Kwasy nukleinowe) domeny 
zmiennej i domen stałych ani nie występują krótsze 
peptydy, które by się mogły połączyć w jeden łańcuch 
(ciężki lub lekki) po zakończonej translacji. Można 
stąd wnosić, że już w obrębie genetycznego aparatu 
następuje połączenie genów domeny zmiennej z genem 
(genami) domen stałych. To zapewne dzięki tej szcze¬ 
gólnej właściwości genów immunoglobulin do do¬ 
meny zmiennej mogą się włączać krótkie sekwencje 
aminokwasowe, nadające specyficzną geometrię cen¬ 
trum wiązania antygenu. Nie wiadomo jednak, czy w 
genach domeny zmiennej zawarta jest informacja na¬ 
byta w czasie ewolucji organizmu, czy też powstaje ona 
w wyniku mutacji somatycznych, zachodzących w ko¬ 
mórkach macierzystych układu odpornościowego. 
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Kwasy nukleinowe 

Edward Czuryło i Magdalena Fikus 

Najmniejszym obiektem żywym jest komórka. Z te¬ 
oretycznych rozważań biochemicznych i biofizycz- 
nych wynika, że najmniejsza żywa komórka powinna 
mieć średnicę co najmniej 50 nm, a jej sucha masa (ma¬ 
sa pozostała po odparowaniu wody z komórki) po¬ 
winna by się składać z ok. 1,5 min atomów. Średnica 
najmniejszej żywej komórki znalezionej przez biolo¬ 
gów wynosi ok. 100 nm i jej sucha masa zbudowana 
jest z ok. 12 min atomów. 

Ta ogromna liczba atomów połączona jest w czą¬ 
steczki, z których znaczna większość to cząsteczki or¬ 
ganiczne, cząsteczki zawierające węgiel. Węgiel jest 
pierwiastkiem czterowartościowym i może tworzyć 
wiązania chemiczne z czterema innymi atomami. 
Dzięki temu cząsteczki organiczne mogą się ze sobą 
łączyć, tworząc tzw. makrocząsteczki. Makrocząstecz¬ 
ka, w której się powtarza stale określona grupa ato¬ 
mów (zwana monomerem lub merem), nazywa się po¬ 
limerem. Taka makrocząsteczka przypomina łańcuch 
połączonych ze sobą ogniw, a proces tworzenia się ta¬ 
kiego łańcucha nazywa się polimeryzacją. Można 
sobie wyobrazić łańcuch (makrocząsteczkę) zbudowa¬ 
ny z kilku lub kilkunastu różnych (pod względem 
składu chemicznego, kształtu lub wielkości) ogniw. 
Makrocząsteczka zbudowana z różnych ogniw nazy- 
wako się polimerem, polimerem złożonym z kilku uro¬ 
dzajów monomerów. 

W żywej komórce występuje kilka rodzajów makro¬ 
cząsteczek — biopolimerów, a każda taka makro¬ 
cząsteczka jest kopolimerem innej grupy związków or¬ 
ganicznych; np. makrocząsteczka białka (-*• Białka) 
zbudowana jest ze związków stanowiących grupę 
aminokwasów (istnieje 20 rodzajów aminokwasów), 
cząsteczka wielocukru składa się z cząsteczek tzw. 
cukrów prostych. 

W dalszej części tego artykułu rozpatrzymy budo¬ 
wę, strukturę i funkcję, jaką spełniają kwasy nuklei¬ 
nowe— biopolimery zbudowane z merów zwanych 
nukleotydami. 


Budowa kwasów nukleinowych 


W skład kwasów nukleinowych wchodzą atomy wo¬ 
doru, węgla, azotu, tlenu i fosforu. Powtarzającymi 
się jednostkami kwasów nukleinowych są nukieotydy, 
w których skład wchodzi reszta kwasu fosforowego, 
cukier i zasada. W naturalnych kwasach nukleino¬ 
wych występują dwie różne cząsteczki cukru: ryboza 
i dezoksyryboza. W zależności od tego, jaki cukier 
występuje w kwasie nukleinowym, mówimy o kwa¬ 
sach rybonukleinowych lub o kwasach dezoksyrybo¬ 
nukleinowych (rys. 1). Każdy z tych kwasów zawiera 
cztery zasady. Kwas rybonukleinowy (RNA) zawiera 
adeninę, cytozynę, guaninę i uracyl, kwas dezoksyry¬ 
bonukleinowy (DNA) — adeninę, cytozynę, guaninę 
i tyminę. Odpowiednie nukieotydy oznaczamy pierw¬ 
szymi literami (dużymi) nazw zasady, a dla całkowite¬ 
go opisania często przed nią dodaje się małą literę r 
lub d, w celu wskazania, o jakim rodzaju nukleotydu 
mowa (np. rA, dC itp.). 

Podczas łączenia się nukleotydów w łańcuch poli- 
nukleotydowy reszta kwasu fosforowego łączy wiąza¬ 
niami kowalencyjnymi atom węgla 3'jednego nukleo¬ 
tydu z atomem węgla 5' drugiego nukleotydu (rys. 1). 
W ten sposób powstaje łańcuch złożony z dwu rodza¬ 
jów ogniw, które występują przemiennie, a zasada jest 
jak gdyby perełką wiszącą obok. Kolejność pojawia¬ 
nia się po sobie poszczególnych zasad nie jest dowolna 
i jak się dowiemy później, ma ona ogromne znaczenie 
dla życia całej komórki i organizmu. 



Rys. 1. Łańcuchy polinukleotydowe; zasadę umieszczono w pro¬ 
stokącie, cukier w pięciokącie, a resztę kwasu fosforowego w okrę¬ 
gu. W pierścieniu cukrowym podano numerację atomów węgla, 
a) Fragment łańcucha kwasu dezoksyrybonukleinowego, b) Frag¬ 
ment łańcucha kwasu rybonukleinowego, który od łańcucha 
kwasu dezoksyrybonukleinowego różni s-ę tym, że w pierścieniu 
cukrowym przy atomie węgla 2' zamiast wodoru (H) wystę¬ 
puje grupa hydroksylowa (OH), c) Scnemat łańcucha polinuklć- 
otydowcgo (oznaczenia analogiczne jak w punkcie a) 


Struktura kwasów 
nukleinowych 

Jedną z podstawowych cech charakterystycznych 
struktury biopolimerów jest kolejność merów w łań¬ 
cuchu makrocząsteczki (w wypadku kwasów nuklei¬ 
nowych kolejność nukleotydów). Jest to tzw. sekwen¬ 
cja biopolimeru lub strifktura pierwszorzędowa. Na¬ 
stępną cechą jest ułożenie poszczególnych części łań¬ 
cucha w przestrzeni, czyli tzw. struktura przestrzenna. 
Strukturę przestrzenną dzielono na: strukturę drugo- 
rzędową—tworzenie kształtów śrubowych odpowied¬ 
niego typu, oraz strukturę trzeciorzędową — ułoże¬ 
nie odcinków śrubowych i ewentualnych odcinków 
nieśrubowych względem siebie. Najnowsze badania 
wykazały, że ten podział jest sztuczny; najczęściej 
tworzenie się spirali i ich wzajemna orientacja zależą 
tylko od sekwencji i są ściśle uwarunkowane odpo¬ 
wiednimi wymaganiami fizycznymi. Inaczej mówiąc, 
przy danej sekwencji i ściśle określonych warunkach 
tylko jedna struktura będzie najbardziej ekonomiczna 
i najbardziej trwała. Strukturą natywną biopolimeru 
nazywamy taką strukturę, która zapewnia jego aktyw- 
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ność biologiczną, a więc taką strukturę w jaKiej wystę¬ 
puje w żywej komórce. 

Istnieją cząsteczki, które w komórce łączą się po 
dwie lub więcej i w takim stanie są zdolne spełniać 
swe funkcje; są to tzw. struktury nadcząsteczkowe. 


Struktura DNA 

Na podstawie wyników badań rentgenograficznych 
prowadzonych przez M. Wilkinsa oraz zebranych do 
tego czasu wiadomości chemicznych i biochemicznych 
J. D. Watson i F. Crick opracowali w 1953 r. model 
cząsteczki DNA. Zadanie było stosunkowo łatwe, po¬ 
nieważ wiadomo było, że w skład cząsteczki DNA 
wchodzą cztery nukleotydy oraz że liczba nukleoty- 
dów A jest równa liczbie nukleotydów T, liczba zaś 
nukleotydów C jest równa liczbie nukleotydów G. Na 
tej podstawie stwierdzono, że tworzą się pary nukleo- 
komplemen- tydowe utrzymywane za pomocą wiązań wodorowych 
tarność (rys. 2). Zjawisko to nazwano komplementarnością 
nukleotydów nukleotydów. 

Cząsteczki DNA nie tworzą kryształów, gdyż są 
bardzo duże, a poza tym preparaty DNA najczęściej 
są niejednorodne pod względem długości i składu 
nukleotydowego. Ze stężonych roztworów DNA moż¬ 
na jednak formować włókna. Włókno takie składa się 
z wielu cienkich i długich, równoległych do siebie czą¬ 
steczek DNA. Na takie włókna można skierować 
wiązkę promieni rentgenowskich, a z zarejestrowane¬ 
go dyfrakcyjnego obrazu spróbować odtworzyć uło¬ 
żenie nukleotydów w cząsteczce, ustalić jej strukturę. 
Otrzymana fotografia (il. 118, tabl. 29) różni się od 
rentgenogramu wszelkich kryształów. Nie można na 
niej znaleźć refleksów poszczególnych atomów, można 
jedynie stwierdzić, że w cząsteczce DNA jest powta¬ 
rzający się element strukturalny. Należało zatem za¬ 
stosować inną analizę takiego rentgenogramu niż 
w wypadku kryształów (-► Osiągnięcia krystalografii 
białek). 

metoda po- Przyjęto istnienie komplementarnych par zasad 
równywania nukleinowych i poszukiwano takiej struktury, w któ- 
obrazów rej pary te powtarzałyby się periodycznie. Następnie 
dyfrakcyj- odtwarzano dyfrakcyjny obraz dla modelu i porówny- 
nych wano go z dyfrakcyjnym obrazem DNA uzyskanym 
przez Wilkinsa (il. 118, tabl. 29). Podobieństwo dy- 
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Rys. 2. Komplementarne pary zasad występujące w heliksie 
DNA; linią przerywaną zaznaczono wiązania wodorowe. Liczby 
obok atomów wchodzących w skład pierścieni oznaczają nume¬ 
rację tych atomów odpowiednio w zasadzie purynowej (dużej) — 
adeninie i guaninie, oraz w zasadzie pirymidynowej (malej) — 
tyminie i cytozynie 


frakcyjnego obrazu modelu do dyfrakcyjnego obrazu heSiks 
cząsteczek DNA otrzymano wtedy, gdy przyjęto Watsona- 
strukturę utworzoną z dwu nici polinukleotydowych Cricka 
skierowanych antyrównolegle i nawiniętych na po¬ 
wierzchnię walca wzdłuż prawoskrętnej linii śrubo¬ 
wej — heliksu. Strukturę taką nazywamy heliksem 
Watsona-Cricka. Heliks taki (il. 117, tabl. 29) ma śred¬ 
nicę 2 nm, skok 3,4 nm i skok ten utworzony jest przez 
10 par nuideotydowych, a zatem na jedną parę nukleo¬ 
tydów przypada wycinek heliksu 0,34 nm. Płaszczyz¬ 
ny zasady są prostopadłe do osi heliksu. Ponieważ 
w obu komplementarnych parach występuje po jednej 
zasadzie „małej” i po jednej „dużej” średnica heliksu 
jest stała na całej długości cząsteczki. 

Widać więc, że model struktury DNA został od¬ 
gadnięty a nie ustalony drogą analityczną. Dlatego też 
jego słuszność była przedmiotem wielu badań kon¬ 
trolnych, których wyniki nie pozwoliły sformułować 
ważkich zarzutów podważających zgodność modelu 
z rzeczywistą strukturą DNA. Natomiast ustalono 
wiele faktów, które potwierdzały hipotezę Watsona 
i Cricka o helikalnej budowie makrocząsteczki DNA 
i mechanizmie przekazywania informacji genetycznej. 

Bardzo ciekawe doświadczenie przeprowadzili doświadczę- 
M. Meselson i E. W. Stahl, którzy stosując ciężki izo- nio Meselso- 
top azotu i prawo Archimedesa udowodnili hipotezę na » Stahla 
Watsona i Cricka. Poświęćmy temu doświadczeniu 
nieco więcej uwagi. 

Kolonie bakterii E. coli hoduje się na pożywce,która 
zawiera azot 15 N, a nie zawiera atomów 14 N. Po pew¬ 
nym czasie we wszystkich komórkach bakteryjnych 
DNA zawiera zasady, w których występują wyłącznie 
atomy azotu 15 N. Masa cząsteczkowa tego DNA jest 
większa od masy cząsteczkowej DNA bakterii ho¬ 
dowanych na normalnej pożywce. Różnica między 
nimi wynosi ok. 1 % masy cząsteczkowej DNA. Nie 
można jej stwierdzić żadną znaną metodą pomiaru mas 
cząsteczkowych polimerów, gdyż jest ona bardzo ma¬ 
ła, mniejsza od dokładności tych metod. Ponieważ 
przyrostowi masy M cząsteczkowej nie towarzyszy 
zmiana objętości, należy przypuszczać, że zmieniła 
się gęstość cząsteczki. Gęstość DNA zależy od pro¬ 
centowej zawartości par G-C i waha się w granicach 
1,64-1,76 g/cm 3 . Dokładność pomiaru gęstości prepa¬ 
ratów DNA jest nie mniejsza niż ±0,001 g/cm 3 . 

Gęstość DNA komórek E. coli jest następująca: gę¬ 
stość 14 N-DNA wynosi 1,709 g/cm 3 , 15 N-DNA - 1,725 
g/cm 3 . Gęstość DNA wyznacza się za pomocą wiro¬ 
wania w ultrawirówce roztworu tego DNA w stężo¬ 
nym (7,7M) roztworze chlorku cezu (CsCl). Po pew¬ 
nym czasie wirowania takiego roztworu jego gęstość 
w różnych miejscach naczynia wirowniczego jest róż¬ 
na. Zmiany gęstości zależą w liniowy sposób od odle¬ 
głości od osi obrotu, tzn. wirowanie wytworzyło linio¬ 
wy gradient gęstości. Jeśli się do takiego roztworu 
doda małą ilość roztworu DNA, to cząsteczki tego 
DNA będą się zbierały w takim miejscu naczynia wi¬ 
rowniczego, w którym gęstość roztworu chlorku cezu 
będzie równa gęstości DNA. Wynika to stąd, że na 
cząsteczkę DNA znajdującą się w roztworze o więk¬ 
szej gęstości będzie działała siła wyporu Archimedesa, 
a na cząsteczkę znajdującą się w roztworze o mniejszej 
gęstości będzie działała siła odśrodkowa. 

Badacze przenosili bakterie E. coli hodowane na 
pożywce zawierającej 15 N na pożywkę zawierającą. 

14 N i kontynuowali hodowlę przez czas równy wzros¬ 
towi jednego pokolenia lub dwu pokoleń. Z tych bak¬ 
terii wydzielono DNA i wirowano go w roztworze 
CsCl. Okazało się, że DNA z bakterii, które rosły na 
pożywce zawierającej 14 N przez okres wzrostu jedne¬ 
go pokolenia, ma gęstość równą średniej arytmetycz¬ 
nej gęstości X4 N-DNA i 16 N-DNA. Natomiast DNA 
z bakterii, które rosły na pożywce zawierającej X4 N 
przez okres równy wzrostowi dwu pokoleń, rozdziela 
się na dwie warstwy, przy czym gęstość jednej z nich 
jest równa gęstości 14 N-DNA, a gęstość drugiej war¬ 
stwy równa się gęstości DNA pierwszego pokolenia 
bakterii. Z wyników tych można wyciągnąć następują- 
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cy wniosek: w pierwszym pokoleniu bakterii ich DNA 
składa się z jednej nici zawierającej zasady z 14 N i jed¬ 
nej — z 15 N. W drugim pokoleniu część bakterii po¬ 
siada DNA taki jak w pierwszym, pozostała zaś część 
bakterii posiada DNA, w którym obie nici zawierają 
tylko zasady z 14 N, jest to 14 N-DNA. 
formy Dalsze badania rentgenograficzne włókien DNA 
helikalnych wykazały, że parametry heliksu mogą się nieco zmie- 
DNA niać. Wyróżnia się trzy formy helikalnych DNA we 
włóknach. 

W przypadku włókien utworzonych z sodowej po¬ 
tasowej lub cezowej soli DNA o wilgotności względ¬ 
nej 75% stwierdzono formę A. Formę A charakteryzu- 
forma A je się skokiem heliksu 2,8 nm, zbudowanego z 11 par 
nukleotydów, których zasady są nachylone pod kątem 
20° do osi heliksu. Podobną strukturę może tworzyć 
dwuniciowy RNA. 

W przypadku soli sodowej DNA o 92% wilgotno¬ 
ści względnej heliks DNA przyjmuje parametry iden- 
forma B tyczne jak w modelu Watsona i Cricka i tę formę na¬ 
zywamy formą B. 

Wyniki badań przeprowadzonych za pomocą in¬ 
nych metod pozwalają przypuszczać, że w roztworze 
o małych siłach jonowych DNA tworzy strukturę zbli¬ 
żoną do formy B. 

forma C Wyróżnia się również formę C utworzoną przez sól 
litową DNA o wilgotności względnej 60% (skok he¬ 
liksu 3,1 nm, który wypełniony jest przez 9,3 par 
nukleotydów). Zasady tworzą kąt 6° z osią heliksu. 
Heliks DNA przyjmuje formę C w roztworach o wy¬ 
sokich stężeniach soli lub w obecności glikolu etyle¬ 
nowego. 

Zbadano również parametry heliksu DNA w hy¬ 
brydzie DNA-RNA. Są one identyczne jak w przy¬ 
padku formy A. Ponieważ helikalna struktura DNA 
utrzymywana jest głównie przez oddziaływania war¬ 
stwowe i hydrofobowe oraz istniejące wiązania wo¬ 
dorowe, to można przypuszczać, że przejście od jednej 
formy heliksu do innej związane jest z różnym wkła¬ 
dem poszczególnych typów oddziaływań do całkowi¬ 
tej energii makrocząsteczki. W praktyce wkład ten 
zmieniamy przez stosowanie rozpuszczalników odpo¬ 
wiedniej kompozycji (zawartość i rodzaj soli, pH, za¬ 
wartość substancji organicznych) lub też przez wpro¬ 
wadzenie do roztworu określonych białek. Można więc 
przypuszczać, że w roztworze cząsteczka DNA tworzy 
helikalną strukturę dynamiczną, a jej końcowymi 
formami mogą być forma A i B. Ta dynamiczna 
struktura zapewnia biologiczną aktywność DNA. 
W roztworach mogą się tworzyć struktury pośrednie; 
niektóre z tych struktur znaleziono doświadczalnie 
i stwierdzono, że są to struktury metastabilne i częściej 
występują w DNA bogatych w pary A-T. 
metody wy- W zależności od rodzaju organizmu, z którego ko- 
znaczania mórek pochodzi DNA, jego masa cząsteczkowa zawie- 
masy czą- ra się w granicach od kilku milionów do kilkunastu 
stoczkowej miliardów jednostek masy atomowej (daltonów). Do¬ 
kładne wyznaczanie masy cząsteczkowej natywnego 
DNA stanowi dość trudne zagadnienie. 

Stosowanie tradycyjnych metod hydrodynamicz¬ 
nych jest niecelowe, gdyż łańcuchy DNA są bardzo 
wrażliwe na występujące napięcia ścinające. Inne me¬ 
tody takie jak mikroskopia elektronowa czy auto ra¬ 
diografia wymagają wstępnego wzorcowania. Z me¬ 
tod stosowanych najlepsza była metoda rozproszenia 
światła pod małymi kątami. Rozwój techniki lasero¬ 
wej stwarza możliwość zastosowania do badania 
współczynnika dyfuzji dużych cząsteczek dopplero- 
wskiego przesunięcia długości fali rozproszonego 
światła laserowego. Współczynnik ten wraz ze stałą 
sedymentacji pozwala, podobnie jak rozproszenie 
światła, wyznaczyć bezwzględną masę cząsteczkową. 
Inną przeszkodą na drodze do wyznaczenia masy czą¬ 
steczkowej natywnego DNA są trudności w wyizolo¬ 
waniu nieuszkodzonych cząsteczek. W czasie prepara¬ 
tyki DNA narażony jest zarówno na napięcia ścinają¬ 
ce jak i na działanie enzywów z grupy nukleaz, które 
mogą trawić łańcuch DNA. 
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Niektórzy badacze uważają, że masa cząsteczkowa 
DNA w komórce eukariontów sięga 1,7-10 10 dalto¬ 
nów, a jego cząsteczka składa się z około 21 podjed- 
• nostek o masie 8-10 8 , które połączone są liniowo 
przez odcinki białkowe. Właśnie w miejscach łączenia 
się podjednostek cząsteczka bardzo łatwo ulega rozer¬ 
waniu. W tym przypadku zakłada się, że strukturą 
podjednostek jest właśnie heliks Watsona-Cricka. 

Komórki prokariontów zawierają DNA o masach 
cząsteczkowych w granicach od 10 6 do 10® daltonów, 
a jego struktura przestrzenna może być różna. DNA 
tych organizmów może być dwuniciowym heliksem 
liniowym, dwuniciowym heliksem kołowym (kiedy 
końce jego łańcuchów są połączone ze sobą fosfodw.u- 
estrowym wiązaniem kowalencyjnym) bądź też wy¬ 
stępować w postaci jednoniciowej cząsteczki koło¬ 
wej lub jednoniciowej cząsteczki liniowej. 

Cząsteczki dwuniciowego DNA kołowego mogą 
tworzyć superheliks (tzn. heliks o odpowiednio dużej 
średnicy i dużym skoku linii śrubowej) utworzony 
z heliksu Watsona-Cricka (np. DNA niektórych wi¬ 
rusów, plazmidowy lub chromosom E. coli). W orga¬ 
nizmach wyższych kołowy DNA dwuniciowy wystę¬ 
puje w mitochondriach i chloroplastach. Struktura 
cząsteczek DNA jednoniciowego liniowego i kołowe¬ 
go prawdopodobnie jest zbliżona do struktury RNA. 

Mimo, że struktura przestrzenna DNA była znana 
od dawna, to przez wiele lat nie udawało się ustalić 
sekwencji DNA z dwu podstawowych przyczyn. Po 
pierwsze nie znano tak specyficznych dezoksyrybo- 
nukleaz jak rybonukleazy, a po drugie otrzymane pre¬ 
paraty DNA były mieszaniną różnych fragmentów 
natywnej cząsteczki DNA. Dopiero w 1977 r. udało 
się ustalić sekwencję DNA bakteryjnego wirusa 0X 
174. Ten DNA koduje 9 znanych białek wirusa 0X 
174 i zbudowany jest z 5375 nukleotydów, z czego 
około 10% to sekwencje nie wykorzystywane w trans¬ 
lacji. Jest to jednoniciowy DNA kołowy o masie czą¬ 
steczkowej 1,6- 10 G daltonów i długości około 0,6 ]im, 
a zatem jest to jeden z najkrótszych znanych DNA. 

Cząsteczki DNA, których masa cząsteczkowa jest 
rzędu 10 10 daltonów mają długość kilkunastu milime¬ 
trów. Zrozumiałe jest więc, że cząsteczki te powinny 
być w jakiś sposób „upakowane”, aby mogły pomieś¬ 
cić się w komórce, a w przypadku eukariontów — w 
jądrze komórkowym. 

W komórkach eukariontów DNA znajduje się w 
chromosomach, a te z kolei w jądrze komórkowym. 
U różnych gatunków liczba chromosomów jest różna'. 
Problem w jaki sposób cząsteczka DNA rozmieszczo¬ 
na jest w chromosomie, pozostaje nadal otwarty. 
Wiemy, że dwuniciowy heliks ma średnicę 2 nm, a w 
komórce oddziałuje z białkami i średnica jego zwiększa 
się do 3 nm. Przypuszcza się, że cząsteczki białka od¬ 
działując z DNA układają się w większej (głębszej) 
bruździe heliksu. Prócz tego DNA oddziałuje z grupą 
białek globularnych, zwanych histonami, tworząc 
z nimi bardzo specyficzne kompleksy o ściśle określo¬ 
nej strukturze. Kompleks helikalnego DNA, histo- 
nów i białek niehistonowych nazywamy chromatyną. 

Znamy pięć rodzajów białek histonowych (H'l, H2a, 
H2b, H3 i H4) i ok. 20 białek niehistonowych, które 


Rys. 3. Schemat budowy po¬ 
jedynczego nukleosomu. Wi¬ 
doczne kule symbolizują glo¬ 
bule poszczególnych białek 
histonowych 



heiiksy 
liniowe 
i kołowe 


histony 


chromatyna 


wchodzą w skład chromatyny. Sposób oddziaływania 
i rola białek niehistonowych, wchodzących w skład 
chromatyny, są jeszcze słabo poznane. Znacznie wię¬ 
cej wiemy o kompleksach DNA z histonami, które 
nukleosomy tworzą tzw. nukleosomy (ii. 113, tabl. 28). W skład 
nukleosomu wchodzi po dwie cząsteczki histonów 
H2a, H2b, H3 i H4 oraz odcinek heliksu zawierający 
około 140 par nukleotydowych (rys. 3). Ten odcinek 
cząsteczki DNA tworzy 1,75 zwoju superheliksu 
o średnicy około 11 nm i skoku linii śrubowej około 
2,8 nm. Nukleosom ma kształt płaskiego walca o śred¬ 
nicy ok. 11 nm i wysokości ok. 5,7 nm. Wyniki te uzy¬ 
skano z analizy rentgenograficznej kryształów nukleo- 
somów i są one zgodne z wcześniej uzyskanymi wyni¬ 
kami za pomocą rozproszenia promieni rentgenow¬ 
skich pod małymi kątami lub rozproszenia neutro¬ 
nów przez roztwory nukleosomów. 

Histon HI tworzy kompleks z nukleosomem, ale 
nie wiadomo, w jaki sposób i jaka jest jego rola. Przy¬ 
puszcza się jedynie, że nie wpływa on na strukturę 
nukleosomu. Nie jest wykluczone, że kompleksuje on 
z odcinkiem heliksu nie biorącym udziału w superhe- 
liksie i składającym się z ok. 40 par nukleotydów. 
Przyjęcie takiej hipotezy tłumaczyłoby wyniki badań 
biochemicznych, z których wynika, że powtarzającą 
się jednostką w chromatynie jest odcinek heliksu zło¬ 
żony z 200 par nukelotydów. 


Struktura RN A 

Wydawało się, że po ustaleniu helikalnej struktury 
DNA wyznaczenie struktury kwasów rybonukleino¬ 
wych nie będzie przedstawiało większych problemów. 
Okazało się jednak, że przestrzenna struktura RNA 
w zasadniczy sposób różni s i ę od struktury DNA. Zna¬ 
my dwuniciowe i jednoniciowe cząsteczki RNA. 
Struktura oraz wielkość cząsteczki zależą od funkcji, 
jaką spełniają kwasy rybonukleinowe w żywej ko¬ 
mórce. Ze względu na spełnianą funkcję kwasy ry¬ 
bonukleinowe dzieli się na: informacyjne — mRNA, 
rybosomalne — rRNA i transportujące — tRNA. 


Cząsteczki tRNA są bardzo małe, gdyż składają się 
z 75-85 nukleotydów, a ich masa cząsteczkowa zawie¬ 
ra się w granicach 30 000 daltonów, stała sedymen¬ 
tacji — ok. 4 S. 

Stała sedymentacji jest to wielkość równa stosunko¬ 
wi prędkości osiadania cząsteczek do przyspieszenia 
odśrodkowego wywołującego to osiadanie, a jedno¬ 
stką stałej sedymentacji jest swedbergd S = 10 _13 s). 

Tak małe cząsteczki jak tRNA nie tworzą włókien 
lecz kryształy i dzięki temu można, podobnie jak w 
przypadku białek globularnych, przeprowadzić anali¬ 
zę fourierowską rentgenogramów i ustalić położenie 
atomów w przestrzeni. Aby jednak tego dokonać 
otrzymywane monokryształy powinny być odpowied¬ 
niej jakości i trwałości. Otrzymanie takich kryształów 
wymagało około dziesięciu lat pracy naukowców z kil¬ 
ku wyspecjalizowanych laboratoriów na świecie. 
W międzyczasie przeprowadzono badania innymi me¬ 
todami, a najcenniejsze wyniki otrzymano za pomocą 
metody rozproszenia promieni rentgenowskich pod 
małymi kątami przez roztwory tRNA. Dzięki tym wy¬ 
nikom można było wyznaczyć kształt cząsteczki, tzn. 
wyznaczyć taką najmniejszą pod względem objętości 
bryłę geometryczną, w której by się mieściła cała czą¬ 
steczka tRNA. Wprowadzając wielkość zwaną elek¬ 
tronowym promieniem bezwładności, analogiczną do 
promienia bezwładności układu punktów material¬ 
nych, można było przewidzieć zagęszczenie atomów 
w poszczególnych częściach cząsteczki. Metoda ta 
umożliwiła obliczenie masy przypadającej na jedno¬ 
stkę długości cząsteczki, co z kolei pozwoliło stwier¬ 
dzić, że ta jednoniciowa cząsteczka powinna zawie¬ 
rać odcinki helikalne podobne do heliksu Watso- 
na-Cricka, lecz utworzone z jednego łańcucha polinu- 
kleotydowego. 

Pierwszy model struktury przestrzennej tRNA opra¬ 
cowano w 1968 r. W latach następnych udoskonalono 
stare lub proponowano nowe modele tej cząsteczki, 
pod koniec 1974 r. liczba modeli przekroczyła 20. 
Modele te różniły się głównie ułożeniem poszczegól¬ 
nych części nici polinukleotydowej wewnątrz czą¬ 
steczki, a więc różnice dotyczyły tych szczegółów 
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Rys. 4. Makrocząsteczka tRNA przenoszącego alaninę w komórkach drożdży: a) Kolejność 
nukleotydów (w tych makrocząsteczkach tRNA występuje wiele zasad różnych od zasad A, 
C, G i U; zasady te nazywamy zasadami rzadkimi); A adenina, C cytozyna, G guanina, 
U urydyna, Gm 1-metyloguanina, Gd N*-dwumetyloguanina, H e U-dwuhydrourydyna, 
T rybotymidynajH' pseudourydyna, I inozyna. Im I-metyloinozyna, CCA ramię aminokwa- 
sowe (do końca 3" przyłączany jest aminokwas), TC ramię posiadające w swej pętli trójkę 
nukleotydów T C, AC ramię antykodonowe (w pętli zaznaczono trójkę nukleotydów, które 
są komplementarne do kodonu mRNA), DHU ramię dwuhydrouracylowc, s.a. ramię doda¬ 
tkowe (małe), b) Przestrzenny modct makrocząsteczki tRNA wg Kima, 1973 r. 
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struktury, których nie można było ustalić na podsta¬ 
wie badań rentgenograficznych pod małymi kątami. 
Na rys. 4b przedstawiono najnowszy model tej czą¬ 
steczki, opracowany na podstawie badań rentgeno¬ 
graficznych kryształów tRNA. Większość modeli 
opracowano dla przypadku tRNA transportującego 
alaninę w komórkach drożdży, ponieważ w 1965 r. 
R.W. Holley ze współpracownikami ustalili sekwencję 
nukleotydów w tym tRNA (rys. 4a). Znajomość sek¬ 
wencji w znacznej mierze ułatwiała badania struktural¬ 
ne, które równocześnie nie traciły na ogólności, gdyż 
struktura wszystkich tRNA jest identyczna. Była to 
pierwsza cząsteczka wśród kwasów nukleinowych, 
w której ustalono kolejność nukleotydów. W końcu 
1977 r. znano sekwencję ok. 80 cząsteczek tRNA prze¬ 
noszących różne aminokwasy i pochodzących z róż¬ 
nych organizmów. 

O strukturze pozostałych kwasów rybonukleino¬ 
wych wiemy znacznie mniej, a główną przyczyną tego 
jest brak metod fizycznych umożliwiających badanie 
struktury przestrzennej jednoniciowych cząsteczek 
o dużych masach cząsteczkowych. 

Cząsteczki mRNA stanowią 5-10% ogólnej zawar¬ 
tości kwasów rybonukleinowych w komórce. Ich masa 
cząsteczkowa jest bardzo różna i zawiera się w grani¬ 
cach 0,5 • 10 6 -2-10® daltonów, co jest związane z rolą 
biologiczną tych cząsteczek. Korzystając z doświad¬ 
czeń w ustalaniu sekwencji tRNA rozpoczęto ustale¬ 
nie sekwencji mRNA. Ustalono sekwencję mRNA 
z bakteriofaga MS2 (bakteriofag jest to wirus zaka¬ 
żający bakterie), który ma mRNA kodujący tylko trzy 
białka. Ustalono, że zawiera ok. 3500 nukleotydów. 
Na rys. 5 przedstawiono sekwencję wycinka mRNA 
bakteriofaga MS2, kodującego białko złożone z 129 
aminokwasów. Wychodząc z założenia, że istnieje 
maksymalna liczba wiązań wodorowych między kom¬ 
plementarnymi parami zasad w łańcuchu polinukleo- 
tydowym (minimum energii konformacyjnej, objaś¬ 
nione dalej), zaproponowano tzw. strukturę drugo- 
rzędową tego wycinka mRNA. Nie wiemy jednak, 
jak poszczególne odcinki heliksu są zorientowane 
względem siebie w przestrzeni oraz względem pozo¬ 
stałej (znacznie większej) części cząsteczki. 


Najmniej wiemy o rybosomalnym kwasie rybonu- rybosomalny 
kleinowym, rRNA. Zdołano ustalić, że w jednej ko- kwas rybo- 
mórce istnieją cztery różne typy cząsteczek tego ro- nukleinowy 
dzaju kwasów nukleinowych. Ich nazwy wiążą się rRNA 
z szybkością osiadania w polu sił odśrodkowych — 
stałą sedymentacji. Poszczególne składniki ryboso- 
malnego RNA to: 5S-RNA o masie cząsteczkowej 
ok. 3-10®, 16S-RNA (u organizmów wyższych 
18S-RNA) o masie cząsteczkowej ok. 0,55-10®, 

23S-RNA (u organizmów wyższych 28S-RNA) o ma¬ 
sie cząsteczkowej ok. 1,2-10® daltonów. Ustalono, że 
28S-RNA pewnej linii komórek ludzkich hodowa¬ 
nych w laboratoriach, zwanych komórkami HeLa, 
składa się z co najmniej dwóch łańcuchów; jeden krót¬ 
ki, składający się ze 140 nukleotydów, posiada stałą 
sedymentacji ok. 5S. Z powodu braku odpowiedniej 
nazwy ta czwarta z kolei cząsteczka rybosomalnego 
RNA nosi na razie w literaturze nazwę „RNA zwią¬ 
zane z 28S-RNA”. Dotychczas prowadzono nad tymi 
kwasami głównie badania biochemiczne, dzięki któ¬ 
rym ustalono sekwencje 5S-RNA w kilkunastu wypad¬ 
kach. Na rys. 6 przedstawiono jedną z poznanych 
sekwencji cząsteczki 5S-RNA rybosomalnego oraz 
jedną ze 110 możliwych struktur drugorzędowych tej 
cząsteczki (wskazanie odcinków helikalnych i tzw. 
odcinków niestrukturowanych). Z tych 110 struktur 
tylko 9 można było uznać za mało prawdopodobne, 
wśród pozostałych 101 szukano dalej takiej, która by 
była prawdopodobna w odniesieniu do innych czą¬ 
steczek 5S-RNA o znanej sekwencji i która by tłuma¬ 
czyła znane fakty chemiczne i fizyczne. Tak np. bada¬ 
nia za pomocą jądrowego rezonansu magnetycznego 
o wysokiej rozdzielczości wykazały, że w cząsteczce 
powinno być ok. 28 par nukleotydów połączonych 
wiązaniami wodorowymi (na modelu 25 par), a wśród 
nich 4 pary A-U (na modelu 5 par A-U). W modelu 
cząsteczki 5S-RNA należało także uwzględnić krót¬ 
kie sekwencje, które nie uczestniczą w wiązaniach wo¬ 
dorowych, lecz wchodzą w skład odcinków nieustruk- 
turowanych, zwanych pętlami, oraz inne fakty do¬ 
świadczalne. 
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Rys. 5. Sekwencja makrocząsteczki mRNA bakte- ^ 
riofaga MS2. Wycinek zaznaczony na rysunku Q*/ 
strzałkami koduje łańcuch białka złożony z 129 
reszt aminokwasowych. Kropkami zaznaczono ^ 
wiązania między komplementarnymi parami nu¬ 
kleotydów, które wchodzą w skład odcinków he¬ 
likalnych. Kółeczkami zaznaczono wiązania mię¬ 
dzy nietypowymi parami nukleotydów wchodzą¬ 
cych do heliksu 
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Rys. 6. Płaski model cząsteczki 5S-RNA (E. co//) oraz kolejność 
nukleotydów w jej łańcuchu. W modelu postuluje się tworzenie 
trzech par U-G; ich wiązania zaznaczono na rysunku kropkami. 
Istnienie par U-G jest możliwe, lecz są one mniej korzystne ener¬ 
getycznie od par G-C. Uważa się, że część zacieniowana oddzia¬ 
łuje z 50S składnikiem rybosomu 


Jak się układają poszczególne części tej cząsteczki 
w przestrzeni, na razie nie wiemy; należy przypusz¬ 
czać, że inne jest ułożenie wówczas, gdy w roztworze 
znajdują się tylko cząsteczki 5S-RNA, a inne, gdy 
wchodzą one w skład rybosomu. 


Przejścia konformacyjne 
w cząsteczkach 
kwasów nukleinowych 

Jeśli roztwór dwuniciowych heliksów DNA ogrzewać, 
zmieniać pH roztworu lub stosować jakikolwiek inny 
czynnik wpływający na strukturę, to wiązania wodoro¬ 
we między komplementarnymi zasadami ulegają ro¬ 
zerwaniu, a nici polinukleotydowe ulegają rozdziele¬ 
niu. Proces ten zachodzi spontanicznie w przedziale 
ściśle określonych temperatur lub pH. W przybliżeniu 
jest to przejście fazowe drugiego rodzaju, 
denat u racja Rozdzielone nici polinukleotydowe przyjmują tzw. 

konformację kłębkową, w której łańcuch cząsteczki 
posiada dużą giętkość, a ułożenie poszczególnych jego 
części względem siebie jest dość dowolne. Przejście od 
struktury helikalnej do struktury kłębka nazywamy 
przejściem konformacyjnym heliks-kłębek lub dena- 
turacją. 

Tworzenie się kłębków obserwowano bezpośrednio 
za pomocą mikroskopu elektronowego. Natomiast 
rozdzielenie polinukleotydowych nici DNA obserwo¬ 
wano za pomocą wirowania, w gradiencie gęstości 
CsCl, natywnych i zdenaturowanych cząsteczek DNA 
zawierającego nici 18 N i 14 N (patrz wyżej). Przed dena- 
turacją cząsteczka DNA, którego jedna nić zawiera 
izotopy azotu 15 N, a druga 14 N, posiada gęstość 
1,717 g/cm 3 , zaś po denaturacji otrzymujemy dwie 
warstwy, z których jedna posiada gęstość 1,724 g/cm 3 
(nici zawierające izotop 14 N), a druga 1,740 g/cm 3 
(nici zawierające izotop 15 N). Wzrost gęstości w obu 
przypadkach spowodowany jest utworzeniem kłęb¬ 
ka — struktury o ściślejszym upakowaniu niż he- 
liks. 

Przejście konformacyjne heliks-kłębek jest przej¬ 
ściem kooperatywnym, tzn. że rozerwanie wiązań wo¬ 
dorowych między komplementarnymi parami zasad 
następuje na odcinku heliksu o określonej długo¬ 
ści, nie mniejszej niż 4 pary zasad. W przeciwnym 
wypadku bilans energetyczny procesu byłby nieko¬ 
rzystny. 

W sprzyjających warunkach w wielu miejscach he¬ 
liksu mogą powstawać zalążki denaturacji — centra 
nukleacji, które z kolei ułatwiają denaturację sąsiadu¬ 
jących odcinków heliksu. Jest to więc proces samona- 
silający się. Powstawanie wielu zalążków denaturacji 
potwierdza niezwykle szybko zachodzący proces de¬ 


naturacji — DNA o masie cząsteczkowej rzędu 10 8 
daltonów ulega denaturacji w ciągu około 1 minuty, 
podczas gdy denaturacja postępująca tylko od obu 
końców trwałaby kilkadziesiąt dni. 

Taka zmiana struktury wiąże się ze zmianą widma 
elektronowego, lepkości roztworu i stałej sedymenta¬ 
cji i innych wielkości fizykochemicznych charakteryzu¬ 
jących strukturę helikalną DNA. Obserwacje tego 
procesu prowadzi się przez pomiary odpowiedniej 
w ielkości w zależności od natężenia czynnika wywołu¬ 
jącego przejścia strukturalne. Otrzymuje się krzywą 
zależności podobną do litery S. 

Przejście konformacyjne zależy od wielu właściwo¬ 
ści DNA, a jego badanie dostarcza informacji o sa¬ 
mych cząsteczkach DNA. Na przykład wykazano, że 
natywna cząsteczka DNA posiada dwukrotnie więk¬ 
szą masę cząsteczkową niż cząsteczka zdenaturowana, 
co z kolei świadczy o tym, że heliks utworzony jest 
z dwu a nie dowolnej parzystej liczby nici polinukleo¬ 
tydowych. 

Proces przejścia konformacyjnego heliks-kłębek 
jest analogiczny do procesu topnienia kryształu, dla¬ 
tego często mówi się o topnieniu DNA, zwłaszcza jeśli 
czynnikiem denaturującym jest temperatura. Jeśli 
czynnikiem wywołującym przejście konformacyjne 
jest temperatura, to można otrzymać następujące in¬ 
formacje. 

Można wyznaczyć temperaturę przejścia (topnie¬ 
nia) T m — temperaturę, w której 50% heliksu zostało 
stopione. 

Można wyznaczyć szerokość przejścia konformacyj¬ 
nego (AT m ) — czyli różnicę odpowiadającą stopieniu 
3 /4 heliksu i V*- Jeśli preparat DNA był jednorodny, 
to przejście będzie odbywało się w wąskim przedziale 
temperatur. Preparaty niejednorodne będą się charak¬ 
teryzowały dużymi wartościami AT m . Szerokość 
przejścia konformacyjnego zależy również od stężenia 
soli w roztworze. Przy małych siłach jonowych przej¬ 
ście odbywa się w szerszym zakresie temperatur, a przy 
dużych siłach jonowych w węższym. 

Energia komplementarnej pary A-T jest mniejsza 
od pary G-C, dlatego też wartość T m jest proporcjo¬ 
nalna do zawartości par G-C w heliksie. Zatem znając 
wartość T m badanego DNA można wyznaczyć jaki 
procent stanowią w nim pary G-C. Gdyby zaś w he¬ 
liksie były długie odcinki różniące się w znaczny spo¬ 
sób za wartością par G-C, to przejście może zachodzić 
wielostopniowo. 

Proces odwrotny do procesu denaturacji nazywamy 
procesem renaturacji lub przejściem konformacyjnym 
kłębek-heliks. Proces ten następuje wtedy, gdy usu¬ 
niemy czynnik powodujący denaturację. W omawia¬ 
nym powyżej przypadku będzie to obniżenie tempera¬ 
tury. Z zasady powinien to być proces fazowy drugie¬ 
go rodzaju, a w rzeczywistości zależy od cech renatu- 
rującego DNA i warunków, w jakich zachodzi rena- 
turacja. Łączenie dwu nici polinukleotydowych w pro¬ 
cesie renaturacji zachodzi w sposób kooperatywny. 

Renaturacja DNA uwarunkowana jest procesem 
dyfuzji, który określa prawdopodobieństwo spotkania 
się dwu komplementarnych nici DNA. Współczynnik 
dyfuzji zależy od temperatury i rozmiarów cząstek re- 
naturujących. W niskich temperaturach (około 4°C) 
cząsteczki DNA będą poruszały się w roztworze naj¬ 
wolniej. W tym zakresie temperatur najczęściej spoty¬ 
kamy łączenie się fragmentów dwu łańcuchów DNA 
o nieodpowiednich sekwencjach, ponieważ nie ma 
źródła energii umożliwiającej rozerwanie powstałych 
wiązań wodorowych między kilkoma nukleotydami. 
Współczynnik dyfuzji będzie zmniejszał się wraz ze 
wzrostem ciężaru cząsteczkowego DNA i będzie ha¬ 
mował proces renaturacji. 

Proces renaturacji będzie zależał również od siły jo¬ 
nowej roztworu, ponieważ cząsteczki DNA posiadają 
znaczne odpychające się ładunki elektryczne. Kationy 
znajdujące się w roztworze ekranują te ładunki, 
zmniejszając w ten sposób siły odpychania elektro¬ 
statycznego. 
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Prawdopodobieństwo spotkania się dwu komple¬ 
mentarnych nici DNA będzie zależało od stężenia 
DNA i czasu trwania renaturacji. Im większe jest stę¬ 
żenie DNA, tym mniejsza jest średnia przebyta droga 
konieczna do spotkania innej cząsteczki DNA, a im 
dłuższy jest czas trwania dyfuzji, tym dłuższa jest 
średnia przebyta droga. 

Oprócz zjawisk dyfuzji na stopień renaturacji ma 
wpływ sekwencja DNA. Na przykład znacznie łatwiej 
będą renaturowały cząsteczki typu d(G) n • d( C)» niż 
DNA, w którym występują wszystkie cztery zasady 
i do tego połączone w określonej kolejności. 


Aktywność biologiczna kwasów 
nukleinowych t 

Od czasu, gdy w 1944 r. O. T. Avery ze współpracow¬ 
nikami udowodnili, że żywe bakterie mogą wchłonąć 
DNA pochodzący z innych bakterii i uzyskać w ten 
sposób dziedzicznie utrwaloną nową cechę genetycz¬ 
ną, charakterystyczną dla bakterii — dawcy DNA, na¬ 
gromadzono wiele bezpośrednich dowodów doświad- 
DNA — czalnych na to, iż DNA jest tą substancją, w której się 
nośnik infor- zawiera i w postaci której jest przenoszona informacja 
macji gene- genetyczna żywych organizmów. 

tycznej Watson i Crick, postulując strukturę helikalną 
DNA, zaproponowali również hipotetyczny mecha¬ 
nizm wiernego powielania się tej struktury poprzedza¬ 
jącego podział komórki. Lata, które nastąpiły po ogło¬ 
szeniu hipotezy Watsona-Cricka, były latami inten¬ 
sywnych badań mechanizmów rządzących przekazy¬ 
waniem informacji genetycznej oraz powielaniem, 
replikacją materiału genetycznego. 

Warto może zdać sobie sprawę z fizycznych rozmia¬ 
rów aparatu genetycznego żywych organizmów. W po¬ 
jedynczej somatycznej komórce organizmów wyż¬ 
szych znajduje się wiele cząsteczek DNA, różnych pod 
względem kolejności nukleotydów i długości łańcu¬ 
cha. Gdyby się np. wszystkie takie cząsteczki zawar¬ 
te w komórce ludzkiej rozciągnęło wzdłuż prostej, 
w postaci pojedynczego heliksu Watsona-Cricka, 
miałyby one łączną długość 174 cm, a ważyłyby 5 pi- 
kogramów. Te cząsteczki DNA zorganizowane są 
w pewnych okresach życia komórki w struktury zwane 
chromosomy chromosomami; w każdej komórce somatycznej czło¬ 
wieka jest 46 chromosomów. Długość pojedynczej czą¬ 
steczki DNA składającej się na największy chromo¬ 
som wynosi 7,3 cm. Sam chromosom ma długość 
0,001 cm. Już zestawienie liczb wskazuje na to, że 
DNA musi tworzyć w chromosomie zwarte struktury, 
które jednocześnie dopuszczają wierną replikację 
DNA przed podziałem komórki i rozdział powielo¬ 
nego DNA między dwie potomne komórki. Niestety, 
mimo iż w tym kręgu zagadnień pracuje wielu bada¬ 
czy, wiedza o tych strukturach jest jeszcze niepełna. 

DNA Łączna długość zawartych w pojedynczej komórce 
różnych danego organizmu cząsteczek DNA nie zawsze zależy 
organizmów °d miejsca tego organizmu na drzewie ewolucyjnym. 

I tak np. ssaki, płazy i gady posiadają podobny zasób 
DNA, ale istnieją również płazy, których komórki za¬ 
wierają 25 razy więcej DNA niż komórki ssaków. Po¬ 
nieważ część łańcucha DNA w organizmach wyż¬ 
szych odgrywa rolę strukturalną, a nie uczestniczy 
w przekazywaniu informacji genetycznej, taka sytua¬ 
cja jest możliwa. Jednak ogólnie biorąc, w komórkach 
ptaków i roślin wyższych jest średnio 3 razy mniej 
DNA niż w komórkach ssaków, w bakteriach 100- 
1000 razy mniej, w niektórych małych wirusach — 
milion razy mniej. Niemniej jednak w tej ostatniej 
grupie organizmów DNA musi się charakteryzować 
strukturami wyższego rzędu niż heliks Watsona-Cri¬ 
cka; pojedyncza cząsteczka DNA bakterii E. coli , sta¬ 
nowiąca jej cały aparat genetyczny, ma 0,12 cm dłu¬ 
gości, podczas gdy sama komórka jest tysiąc razy 
krótsza. 


Informacja genetyczna komórki, zakodowana w jej 
DNA wyrażana jest przez syntezę białek tej komórki. 

Białka, enzymy lub elementy strukturalne (-► Białka) 
stanowią o funkcjach życiowych komórki, o jej feno¬ 
typie. Ocenia się, że w cyklu życiowym komórki bak¬ 
teryjnej syntetyzowane jest ok. 3 tys. różnych białek, 
natomiast w organizmie człowieka — ok. 5 min. Moż¬ 
na obliczyć, że w gatunkach żyjących na Ziemi (ok. 

1,2 min) produkowanych jest ok. 10 12 różnych rodza¬ 
jów białek i 10 10 różnych rodzajów kwasów nukleino¬ 
wych. Tę ogromną liczbę warto porównać z liczbą ok. 

10* organicznych związków chemicznych syntetyzo¬ 
wanych dotychczas przez człowieka. 

W organizmach wielokomórkowych każda komór¬ 
ka określonego osobnika zawiera taki sam komplet 
cząsteczek DNA. Jednakże wyspecjalizowane tkanki 
produkują wybrany rodzaj białek, który nie jest syn¬ 
tetyzowany w innych komórkach tego samego orga¬ 
nizmu. Tak więc w organizmach wiclkokomórkowych 
muszą istnieć również mechanizmy wyboru tych in¬ 
formacji genetycznych, które powinny być realizowa¬ 
ne w zależności od wieku organizmu lub specjalizacji 
danej grupy komórek, tkanki. Okazuje się również, 
o czym wspomniano wyżej, że nie wszystkie sekwencje 
DNA organizmów wyższych mają sens genetyczny 
(realizowane są jako białka), niemniej jednak odgry¬ 
wają one określoną rolę fizjologiczną. Niektóre ucze¬ 
stnicy w powstawaniu struktur DNA wyższego rzę¬ 
du niż heliks Watsona-Cricka. 

Zadziwiającą cechą żywej komórki jest jej zdolność 
do bezbłędnej niemal samoreprodukcji przez setki i ty¬ 
siące pokoleń. Stabilność DNA przewyższa większość stabilność 
zapisów informacji pozostawionych przez ludzkość; DNA 
bakterie zachowały cechy biochemiczne i morfologicz¬ 
ne podobne do cech przodków sprzed milionów lat. 

Jednocześnie indywidualna, konkretna nić cząsteczki 
DNA, jest tak nietrwała poza organizmem, że ulega 
rozerwaniu nawet przy przechodzeniu przez rurki 
szklane o średnicy milimetra. Cząsteczka DNA może 
się stać również celem ataku różnych destrukcyjnych 
enzymów znajdujących się w komórce, jak również 
ulegać zmianom chemicznym pod wpływem takich 
czynników zewnętrznych jak promieniowanie, tem¬ 
peratura, niektóre związki przenikające do komórek. 

Zachowanie zatem genetycznej stałości gatunków jest 
uwarunkowane istnieniem w żywych organizmach 
skutecznych układów naprawczych, które szybko usu¬ 
wają za pomocą enzymów każde lub prawie każde 
uszkodzenie powstające w DNA i zapewniają bez¬ 
błędne powielanie DNA, czyli bezbłędną replikację. 


Replikacja DNA 

Replikacja DNA jest procesem złożonym i do dziś nie 
do końca zrozumianym. Najlepiej poznane są pro¬ 
cesy replikacji DNA w bakteriofagach i w bakteriach, 
mniej wiadomo o nich w wyższych organizmach, posia¬ 
dających materiał genetyczny zlokalizowany wewnątrz 
jądra (eukariontach). Nie ulega obecnie wątpliwości, 
że nawet w najprostszych organizmach replikacja 
przebiega w złożonym, wieloskładnikowym i wielo- 
enzymatycznym kompleksie, prawdopodobnie związa¬ 
nym ze strukturą białkowo-lipidową błony komórko¬ 
wej. Nie jest łatwo określić składniki takiego kom¬ 
pleksu, gdyż utrzymujące go w stanie funkcjonalnym 
oddziaływania, głównie między białkami, należą do 
oddziaływań słabych, kompleks replikacyjny ulega 
łatwo rozpadowi w czasie prób wydzielania i oczysz¬ 
czenia jako całości. Z genetycznych badań replikacji 
w bakteriach wiadomo od dość dawna, że zależy ona 
od wielu białek, np. co najmniej od 13 w £. coli , 
jednak ich rola w replikacji jest w większości przy¬ 
padków nieznana, lub w najlepszym razie nie do koń¬ 
ca wyjaśniona. Zidentyfikowana i oczyszczona do ho- polimeraza 
mogenności jest polimeraza DNA, duże białko en- DNA 
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Rys. 7. Model replikacji DNA. Dwa komplementarne łańcuchy 
macierzystego DNA ulegają lokalnej denaturacji, tworząc widełki 
replikacyjne. Polimeraza DNA dobudowujc łańcuchy potomne 
do rozdzielonych łańcuchów matrycy. W dole rysunku ostatnia 
para nukleotydów (G-C) została narysowana nie symbolicznie, 
lecz w postaci odpowiednich wzorów chemicznych 
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zymatyczne, które syntetyzuje z nukleotydów po¬ 
tomne łańcuchy DNA, komplementarne do łańcu¬ 
chów macierzystych (widać to na rys. 7 i 8). Kolejność 
nukleotydów łańcucha macierzystego wyznacza jed¬ 
noznacznie kolejność nuekleotydów w łańcuchu 



Rys. 8. Autoradiogram koliste; cząsteczki DNA bakteryjnego, 
w trakcie replikacji (powiększenie ok. 240 razy). Hodowane na 
nieradioaktywnym podłożu bakterie przeniesiono na pożywkę 
zawierającą znakowany promieniotwórczym izotopem (trytem) 
nukleotyd, który polimeraza DNA wbudowała do replikowanego 
DNA. Odcinki intensywnie zaczernione przedstawiają DNA zna¬ 
kowany w obu łańcuchach podwójnej spirali (dwie linie czarne 
na rysunkowym schemacie objaśniającym), odcinki jaśniejsze 
przedstawiają DNA znakowany w jednym łańcuchu (linie nie¬ 
biesko-czarne na schemacie). Zdjęcie przedstawia sytuację przy 
końcu drugiej rundy replikacji po dodaniu izotopu 

potomnym dzięki zacnowaniu zasady komplemen- 
tamości nukleotydów jednego łańcucha do nukleoty¬ 
dów drugiego. Przypomnijmy, że naprzeciw nukleo- 
tydu A zostanie wbudowany do nowego łańcucha 
nukleotyd T, a naprzeciw nukleotydu G — nukleo¬ 
tyd C. 

replikacja Z jednej cząsteczki macierzystej powstają zatem 
póHkonser- dwie identyczne cząsteczki potomne DNA, każda zło- 

watywna żona z jednego łańcucha macierzystego i jednego no¬ 
wo syntezowanego. Mechanizm ten nazwano replika- 
cją półkonserwatywną. W wielu badanych systemach 
replikacyjnych wykazano istnienie białek specyficznie 
destabilizujących strukturę heliksu Watsona-Cricka, 
wiążących się kooperatywnie i specyficznie z pojedyn- 
czołańcuchowym DNA, ułatwiających denat u rację 
macierzystego DNA w rejonie replikacji. Jedno z bia¬ 
łek rozplątujących podwójnołańcuchowy DNA hy- 
drolizuje jednocześnie ATP (-*■ Organizacja proce¬ 
sów życiowych komórki), jego funkcja życiowa jest 
nieznana. Odkryto również niezbędny w replikacji 
enzym, gyrazę (inaktywacja gyrazy powoduje na- 
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tychmiastowe zatrzymanie replikacji), która badana 
in vitro podwyższa liczbę superhelikalnych zwojów 
DNA, ułatwiając w ten sposób w innym rejonie DNA 
rozplątanie skrętów heliksu Watsona-Cricka. Ten 
enzym również wymaga jednoczesnej hydrolizy ATP. 

Wśród pozostałych białek identyfikowanych jako 
uczestniczące w procesach replikacji wiele wywołuje 
również hydrolizę niektórych wysokoenergetycznych 
niskocząsteczkowych substancji. Wydzielająca się 
wówczas energia prawdopodobnie zużywana jest na 
wprowadzenie allosterycznych zmian w białkach kom¬ 
pleksu replikacyjnego, rozkręcenie podwójnego helik¬ 
su DNA, ułatwia utrzymywanie się replikacyjnych ze¬ 
społów białkowych w całości. Żadne z odkrytych do¬ 
tychczas białek nie dostarcza samo wg ilościowych 
ocen, wystarczającej energii do tych procesów. 

Interesującą cechą wszystkich znanych polimeraz 
DNA jest to, że nie potrafią one rozpocząć syntezy 
nowego łańcucha DNA. Prawdopodobnie syntezę 
taką rozpoczyna inny enzym, polimeraza RNA, 
budująca na wzorcu, łańcuchu DNA, jego komple- starter 
mentarną kopię RNA zwaną starterem. Nie wiado¬ 
mo, co jest sygnałem do zmiany polimeraz, w pewnym 
stadium syntezy startera polimeraza RNA zostaje 
zastąpiona przez polimerazę DNA, która kontynuuje 
polimeryzację budując już potomny łańcuch DNA. 

Tak przebiegająca synteza DNA jest nieciągła, poli¬ 
meraza DNA syntetyzuje krótkie fragmenty łańcucha, 
zwane od nazwiska odkrywcy tego zjawiska fragmen¬ 
tami Okazaki; w trakcie jednej rundy replikacji do¬ 
chodzi zatem wielokrotnie do inicjacji fragmentów 
Okazaki przez polimerazę RNA i elongacji ich przez 
polimerazę DNA. Startery RNA są w późniejszym 
okresie replikacji usuwane przez inne enzymy, po- 
wstaiąca na ich miejscu luka zapełniana przez poli¬ 
merazę DNA, a fragmenty Okazaki łączone w łańcuch 
ciągły enzymem, ligazą. 

Replikacja DNA rozpoczyna się zawsze od ściśle 
zdefiniowanego odcinka macierzystego DNA zwane¬ 
go punktem początkowym replikacji. Przyczyna wy¬ 
boru przez kompleks replikacyjny punktu początko¬ 
wego jest nieznana, w niektórych wypadkach został 
on zlokalizowany z dokładnością do kilkunastu lub 
kilkudziesięciu nukleotydów. Wiadomo również, że 
inicjacja replikacji jest kontrolowana genetycznie i że 
uczestniczą w niej specyficzne białka inicjatorowe. 

W niektórych przypadkach replikacja biegnie 
w jednym kierunku od punktu początkowego, 
w niektórych — jednocześnie w obie strony. 

Szybkość replikacji w bakteriach (w temperaturze 
37°) ocenia się na 10 5 nukleotydów polimeryzowanych 
w ciągu minuty. W przypadku, gdy do łańcucha 
potomnego włączony zostanie nukleotyd niekomple- 
mentarny istnieje możliwość bezpośredniego popra¬ 
wienia tego błędu przez polimerazę DNA i towa¬ 
rzyszące enzymy drogą wymiany niewłaściwego nu¬ 
kleotydu na prawidłowy. Wierność replikacji jest bar¬ 
dzo wysoka, błąd popełniany jest nie częściej niż raz 
na 10 10 włączonych nukleotydów. Jednak w pewnych 
warunkach do replikującego się DNA może zostać 
wbudowany nieprawidłowy nukleotyd, lub prawi¬ 
dłowy ulec modyfikacji chemicznej. Może to stać się 
przyczyną mutacji genetycznej, tzn. dziedziczonej mutacja 
zmiany, która może okazać się korzystna lub nie- genetyczna 
korzystna dla organizmu. Procesy ewolucyjne utrwa¬ 
lać będą mutacje korzystne dla gatunku, eliminować — 
mutacje obniżające żywotność gatunku. 

Przyczynami mutacji mogą być również zmiany 
chemiczne w już syntetyzowanej cząsteczce DNA, 
wywołane przez czynniki zewnętrzne: światło, pro¬ 
mieniowanie ultrafioletowe, jonizujące i inne. Nie 
zawsze przyczyna zmian jest nam znana, jeśli nie — 
mówimy o mutacjach spontanicznych. Zdarzają się 
zmiany obejmujące fragment łańcucha DNA, np. 
podwojenie pewnych sekwencji łańcucha, dodanie 
(addycja) lub wypadnięcie (delecja) części łańcucha 
DNA czy jednego nukleotydu. Jeśli przyczyną mu¬ 
tacji jest modyfikacja jednego nukleotydu, to wtedy 


mutację tę nazywa się punktową. Mutacje punktowe, 
w odróżnieniu od delecyjnych są stosunkowo łatwo 
odwracalne. 

Prawdopodobieństwo mutacji spontanicznej, zmie¬ 
niającej funkcję białka u bakterii jest niewielkie 
(10~ 7 -10 _ ® na jedno pokolenie komórek), ale ze 
względu na dużą liczebność bakterii w środowisku 
jest ono źródłem pojawiania się mierzalnych ilości 
zmienionych osobników (mutantów). Przykładem mu¬ 
cho roby tacji niekorzystnych dla gatunku są tzw. choroby ge- 
genetyczne netyczne. 

Dobrze poznanym przykładem takiej choroby jest 
złośliwa anemia sierpowata, utrzymująca się wśród 
afrykańskich plemion murzyńskich. Białko hemoglo¬ 
biny (masa cząsteczkowa ok. 67 tys. daltonów) wy¬ 
dzielone z krwinek ludzi chorych różni się od białka 
normalnej hemoglobiny tylko tym, że aminokwas — 
kwas glutaminowy zastąpiony został przez amino¬ 
kwas — walinę. Różnica ta, wydawałoby się nie¬ 
znaczna, powoduje, że ludzie dotknięci anemią sier- 
powatą umierają w wieku młodzieńczym. Opisano 
wiele innych nieprawidłowych hemoglobin i stwierdzo¬ 
no, że w każdym wypadku zmiana funkcji wynika 
z niewielkiej zmiany w składzie aminokwasowym glo- 
biny ludzi chorych. 

Przekazywanie informacji genetycznej z DNA do 
komórki jest wynikiem dwu procesów: transkrypcji 
i translacji. 


Transkrypcja informacji 
genetycznej 

Określenie transkrypcja obejmuje procesy syntezy 
RNA wg wzorca DNA, a więc polega na przeniesieniu 
informacji genetycznej z jednego kwasu nukleinowego 
(DNA) na drugi (RNA). W procesach transkrypcji 
uczestniczą: DNA jako matryca, enzym polimeryzu¬ 
jący (polimeraza RNA), białka, niskocząsteczkowe 
substraty i substancje regulatorowe, tzw. efektory 
(rys. 9, 10 i il. 119, tabl. 29). Polimeraza RNA rozpo- 





Rys. 10. Dwa odcinki DNA bakteryjnego (zdjęcie w mikroskopie 
elektronowym, powiększenie 150 000 razy). W dolnym fragmencie 
DNA ulega transkrypcji, syntetyzowany jest mRNA, który jesz¬ 
cze w trakcie transkrypcji łączy się z rybosomami, tworząc poli¬ 
som. Rozpoczyna się synteza polipeptydu (translacja). W prawej 
górnej części zdjęcia widać globularne cząsteczki polimerazy 
RNA rozpoczynającej transkrypcję, w lewej dolnej części — naj¬ 
starszy mRNA widoczny na zdjęciu, będący w trakcie intensyw¬ 
nego procesu translacji 

padków polimerazy RNA są białkami składającymi 
się z podjednostek, w polimerazie bakteiyjnej jedna z 
nich, tzw. białko sigma, ułatwia jedynie specyficzne 
rozpoczęcie transkrypcji, a następnie ulega odłączeniu 
od kompleksu transkrybującego. Polimerazy RNA, 
jak już wiemy, w odróżnieniu od polimerazy DNA, 
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DNA 

Rys. 9. Model transkrypcji RNA. Syntetyzowany na matrycy 
lokalnie zdenaturowanego DNA informacyjny RNA (mRNA) 
łączy się z rybosomami i tworzy kompleks translacyjny 

znaje, nie wiadomo jeszcze jak, ten fragment łańcucha 
DNA, od którego się rozpoczyna transkrypcja. Roz¬ 
poczęcie transkrypcji oraz jej kontynuacja związane 
są z koniecznością lokalnego rozplątania heliksu ma¬ 
trycy DNA, gdyż transkrypcji ulega tylko jeden łań¬ 
cuch DNA. W ogromnej większości poznanych przy¬ 










mogą rozpoczynać transkrypcję de novo y nie wymaga¬ 
jąc do tego startera. 

Nie wyjaśniono również mechanizmu kończenia 
transkrypcji z określonego odcinka DNA, nie wia¬ 
domo, jaki sygnał decyduje o rozpadzie transkrypcyj- 
nego kompleksu i oddzieleniu się polimerazy i pro¬ 
duktu (RNA) od matrycowego DNA. Być może w 
procesie tym odgrywają rolę dodatkowe białka. Jed¬ 
nym z takich białek jest np. tzw. czynnik rho, w obec¬ 
ności którego transkrypcja kończy się we właściwym 
dla danego genu rejonie DNA. 

prekursor Ważną cechą procesu transkrypcji, poznaną stosun- 
RNA kowo niedawno, jest to, że jego pierwotny produkt, 
tzw. prekursor RNA, jest dłuższy niż odpowiadający 
mu RNA biologicznie aktywny. Prekursor taki podle¬ 
ga następnie procesowi dojrzewania, w którym uczest¬ 
niczą liczne, często wysokospecyficzne enzymy. Pro¬ 
ces dojrzewania polega na skracaniu łańcucha pre¬ 
kursora oraz na dodatkowych modyfikacjach, np. 
metylacji lub dodawaniu końcowych fragmentów, 
nie mających swoich komplementarnych odpowied¬ 
ników w matrycowym DNA. Prekursory mRNA ko¬ 
mórek eukariontów syntezowane w jądrze składają 
się w ok. 10% z właściwych sekwencji mRNA, który 
pełni swą funkcję następnie poza jądrem, w cyto- 
plazmie; pozostałe 90% to sekwencje dodatkowe 
strukturotwórcze lub chroniące mRNA przed nuklea- 
zami, nigdy nie opuszczające jądra. Prawie we wszyst¬ 
kich mRNA organizmów eukariotycznych jeden 
z końców składa się tylko z nukleotydów adeniny (A) 
dodanych enzymatycznie do mRNA już po transkryp¬ 
cji. Ta właściwość pozwoliła na łatwe oddzielenie prc- 
paratywne mRNA od całej puli innych kwasów nuklei¬ 
nowych komórki, umożliwiła w następstwie oczysz¬ 
czanie mRNA pojedynczych genów, oznaczanie se¬ 
kwencji ich podjednostek nukleotydowych, a także 
zastosowanie nowych technik inżynierii genetycznej 
(zob. niżej) do syntezy genów w probówce. 

Warto tu również dodać, że zarówno prekursor 
mRNA w jądrze, jak i mRNA w cytoplazmie, nie wy¬ 
stępują nigdy w formie wolnego kwasu nukleinowego, 
a jedynie w kompleksach ze specyficznymi białkami 
informosomy tworząc tzw. informosomy. W kompleksie tym rola 
białek może polegać na blokowaniu pewnych odcin¬ 
ków mRNA, a więc może być rolą regulatora aktyw¬ 
ności biologicznej mRNA. Jedną z większych sensacji 
genetyki molekularnej ostatnich lat stało się odkrycie, 
iż w organizmach eukariotycznych niektóre geny są 
podzielone na fragmenty, oddzielone jeden od drugie¬ 
go odcinkami DNA o długości porównywalnej do 
długości genu, których nie odnajduje się następnie 
w dojrzałym transkrybowanym mRNA tego genu. 
Fakt ten sugeruje istnienie nowych, nieznanych dotąd 
sposobów regulacji wyrażania aktywności określo¬ 
nych genów organizmów eukariotycznych. 

Wszystkie typy RNA syntetyzowane w procesie 
transkrypcji (mRNA, tRNA, rRNA) grają rolę w pro¬ 
cesach translacji, czyli w procesie przeniesienia infor¬ 
macji genetycznej z kwasu nukleinowego (mRNA) 
na białko (rys. 9). 


Translacja informacji 
genetycznej 


Jak wyjaśniono uprzednio, kwasy nukleinowe skła¬ 
dają się z 4 rodzajów podjednostek, nukleotydów, 
białka zaś — z 20 podjednostek, aminokwasów. Dla¬ 
tego też translacja byłaby niemożliwa przy założeniu, 
że jednemu fiukleotydowi odpowiada jeden amino¬ 
kwas, jak również w wypadku sekwencji dwunukleo- 
tydowych, tzn. kombinacji, w której dwóm nukleoty- 
dom odpowiada jeden aminokwas, bo takim sekwen¬ 
cjom przypisać można tylko 16 różnych aminokwasów. 
Z prostych reguł kombinatoryki wynika, że dopiero 
trójnukleotydowe „litery” (64 możliwych kombina- 
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cji) składają się na „alfabet” bogatszy niż dwudziesto- kod 
literowy „alfabet” aminokwasowy. Okazało się, że genetyczny 
istotnie w przyrodzie ustalił się powszechny kod trój¬ 
kowy. Trójce nukleotydów w mRNA w określonej 
kolejności (kodonowi) odpowiada jeden i tylko jeden 
aminokwas. Badania te pozwoliły na określenie nastę¬ 
pujących cech kodu genetycznego: a) Kod jest uni¬ 
wersalny, tzn. taki sam w całym świecie istot żywych, 
od wirusa do człowieka. Fakt ten świadczy o tym, że 
ewolucja kodu została bardzo dawno zakończona i że 
stanowi ona optymalne rozwiązanie problemu trans¬ 
lacji genetycznej, b) Kod jest trójkowy, ciągły i nie za¬ 
chodzący, tzn. odczytywane są kolejne trójki nukleo- 
tydowe w łańcuchu mRNA i każdy z nukleotydów 
wchodzi w skład tylko jednego kodonu. Dzięki tej 
właściwości kodu pojawienie się w łańcuchu białka 
danego aminokwasu nie zależy od rodzaju poprze¬ 
dzającego i następującego po nim aminokwasu, c) Kod 
jest zwyrodniały, tzn. ten sam aminokwas może być 
zapisany więcej niż jedną trójką nukleotydów. Ta 
cecha kodu pozwala na syntezę dowolnych białek 
również i w organizmach, których DNA jest szczegól¬ 
nie bogate w niektóre nukleotydy, a ubogie w inne, 
tym niemniej wystarcza im kodonów do wyrażenia 
wszystkich aminokwasów składających się na białka 
konieczne do życia, d) Kod jest współliniowy, tzn. 
kolejność kodonów odpowiada kolejności wbudowa¬ 
nych do białka aminokwasów, odpowiadających ko- 
donom. e) Kod jest odczytywany od określonego pun¬ 
ktu startowego w sposób ciągły, znane są kodony po¬ 
czątkujące i kończące odczytywanie danej informacji. 

Czasem znajomość kodu genetycznego pozwala na 
poszukiwanie i izolowanie mRNA, matrycy w synte¬ 
zie określonych białek. Tak np. produkowane przez 
poczwarki jedwabnika białko, fibroina, ma bardzo 
szczególny skład aminokwasowy; zawiera 45% ami¬ 
nokwasu glicyny, reszta zaś to tylko dwa aminokwasy: 
alanina i seryna. W kodonach odpowiadających tym 
aminokwasom przeważa nukleotyd guanylowy. Z po- 
czwarek jedwabnika udało się wydzielić RNA bogaty 
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Rys. 11. Schemat struktury rybosomu bakteryjnego. W skład 
aktywnego biologicznie rybosomu (70S) wchodzą dwie różnej 
wielkości podjednostki (3ÓS i 50S). Każda podjednostka składa 
się z rRNA i rybosomąlnych białek. Różne geometryczne figury 
w prawej części rysunku symbolizują różnice w budowie między 
poszczególnymi białkami rybosomalnymi; skręcone nici — struk¬ 
tury przestrzenne rybosomąlnych RNA 

Stała sedymentacji jest proporcjonalna do masy cząsteczkowej 
makrocząsteczki podniesionej do potęgi a (s ~ A/ a , a—współ¬ 
czynnik zależny m.in. od kształtu makrocząsteczki) 


w nukleotyd guanylowy; stanowił on aż 1,4% ogólnej 
puli RNA poczwarki i posiadał rzeczywiście cechy 
mRNA fibroiny. 

Można przypomnieć tu również omawiany już 
przykład anemii sierpowatej, której przyczyną mole¬ 
kularną jest zmiana jednego aminokwasu w białku 
krwi, globinie. Dzięki ustaleniu zapisu kodu gene¬ 
tycznego wiemy, że kodonami kwasu glutaminowego 
są dwie trójki nukleotydów, GAA i GAG, natomiast 
waliny — GUA i GUG. Tak więc anemia sierpowata 
jest wynikiem zastąpienia w mRNA reszty A przez 
resztę U. Oznacza to również, że w odpowiadającym 
temu mRNA odcinku DNA nastąpiła zmiana nu- 
kleotydu A na nukleotyd T (mutacja). 

Tak więc wszystkie informacje genetyczne zostały 
zapisane językiem trójek nukleotydów DNA, następ¬ 
nie przepisane w procesie transkrypcji do RNA. Od¬ 
czytanie kodu odbywa się w procesie translacji, czyli 
syntezy białka, zgodnie z kolejnością ułożenia ko- 
donów w łańcuchu mRNA. 

powstawanie Odczytywanie RNA informacyjnego wymaga po- 
kompleksów wstania kompleksu mRNA z rybosomami (tzw. poli- 
mRNA z ry- somu). Budowa i skład rybosomów bakteryjnych 
bosomami pokazana jest schematycznie na rys. 11. Rybosomalne 
białka i rRNA zostały wydzielone, oczyszczone i częś¬ 
ciowo zbadane. Udało się również uzyskać funkcjo¬ 
nalnie aktywny rybosom po zmieszaniu w odpowied¬ 
nich warunkach uprzednio rozdzielonych i oczyszczo¬ 
nych składników. Udało się również zbadać niektóre 
oddziaływania wzajemne składników rybosomu, scha¬ 
rakteryzować część sił utrzymujących strukturę rybo¬ 
somu, prowadzone są intensywne badania roli bio¬ 
logicznej rybosomalnego RNA i poszczególnych bia¬ 
łek rybosomalnych oraz jakim zmianom ulega struk¬ 
tura w czasie funkcjonowania rybosomu. 
przyłączanie Aminokwasy nie zbliżają się do mRNA jako swo- 
aminokwa- bodnę cząsteczki, lecz przyłączone do tRNA. Przyłą- 
sów do czenie to katalizowane jest przez zespół enzymów, 
tRNA syntetaz aminoacylo-tRNA. Każdy aminokwas może 
być przyłączony do cząsteczki swojego specyficznego 
tRNA tylko przez taką syntetazę. Specyfika tRNA 
polega na tym, że w jego cząsteczce znajduje się trójka 
nukleotydów zwana antykodonem (rys. 4a). Antyko- 
don i kodon mRNA są komplementarne, dzięki temu 
możliwe jest między nimi oddziaływanie takie jak 
w podwójnej spirali DNA. Kod, jak już wspomniano, 
jest zwyrodniały, a więc ten sam aminokwas może być 
przyłączony więcej niż do jednego tRNA, a miano¬ 
wicie do tych tRNA, których antykodony są komple- 
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Rys. 12. Schemat przebiegu syntezy białka w rybosomie. Rybo¬ 
som przesuwa się wzdłuż łańcucha mRNA. Kolejne kodony 
mRNA odczytywane są przez komplementarne trójki nukleoty¬ 
dów (antykodony) w tRNA. W rybosomie znajdują się dwa miej¬ 
sca wiążące, miejsce A, wiążące tRNA aminokwasu, który ma być 
włączony do łańcucha polipeptydowego, i miejsce B> do którego 
przyłączony jest poprzedzający tRNA połączony z syntetyzowa¬ 
nym łańcuchem polipeptydowym. Po utworzeniu wiązania pep- 
tydowego tRNA przesuwa się z miejsca A na miejsce B, a drugi 
tRNA zostaje uwolniony z miejsca B i z rybosomu. Aczkolwiek 
tRNA mogą się różnić między sobą sekwencją nukleotydów, to 
ich struktura przestrzenna musi być w zasadzie podobna, tak aby 
pasowała do struktury nadcząsteczkowej przedstawionego tu 
schematycznie kompleksu translacyjnego 


mentarne do wszystkich kodonów danego amino¬ 
kwasu. Dotychczas w komórce bakteryjnej znaleziono 
ponad 50 różnych tRNA. 

Proces łączenia aminokwasów w łańcuchu białko- synteza 
wym tak zwanymi wiązaniami peptydowymi przebiega białka 
wewnątrz rybosomu (rys. 12). Kompleks rozpoczyna¬ 
jący syntezę białka składa się z kilku białek o aktyw¬ 
ności enzymatycznej, z mRNA, z rybosomów, z ni- 
skocząsteczkowego związku — dawcy energii, z tRNA 
połączonego z aminokwasem. Wyróżniono również 
białka, których obecność konieczna jest do zapocząt¬ 
kowania translacji, inne uczestniczą w procesie prze¬ 
dłużania łańcucha polipeptydowego, w przesuwaniu 
rybosomu wzdłuż mRNA do następnych, jeszcze nie 
odczytanych kodonów, w kończeniu syntezy danego 
polipeptydu, w wiązaniu tRNA połączonego z ami¬ 
nokwasem do rybosomu. Jednym z białek ryboso¬ 
malnych jest również enzym, transferaza peptydowa, 
syntetyzująca wiązanie peptydowe. Po zakończeniu 
syntezy białko zostaje odłączone od rybosomu i po¬ 
zostaje w cytoplazmie. 



białka rybosom polipeptyd 

rybosomalne 


Rys. 13. DNA przedstawiony został jako okrąg, w takim kształcie 
występuje w bakteriach i bakteriofagach. W wyniku transkrypcji 
na matrycy DNA powstają wszystkie typy RNA, o różnej struk¬ 
turze przestrzennej, co schematycznie zaznaczono na rysunku. 
Transkrybowane RNA różnią się również funkcjonalnie: rRNA 
łączy się z białkami rybosomalnymi i tworzy aktywny biologicz¬ 
nie rybosom (schemat w ramce w dole rysunku), tRNA przyłącza 
aminokwas (schemat w ramce w górnej części rysunku) i w tej 
aktywnej formie dołącza się do rybosomu połączonego z mRNA. 
W wyniku translacji informacji zawartej w mRNA powstaje po¬ 
lipeptyd (białko), który uwalnia się od rybosomu. Po sfałdowaniu 
w strukturę natywną oraz po transporcie do odpowiedniego re¬ 
jonu komórki białko to jest gotowe do wypełniania swej funkcji 
biologicznej 

Ogólny schemat omówionych pokrótce procesów 
transkrypcji i translacji ze szczególnym uwzględnie¬ 
niem roli RNA podany został na rys. 13. 

Inżynieria genetyczna 

Poznanie wzajemnych zależności między strukturą 
i funkcją kwasów nukleinowych w żywej komórce 
uzależnione jest od znajomości sekwencji nukleoty¬ 
dów w natywnej cząsteczce kwasu nukleinowego, 
DNA lub RNA. Nie można się spodziewać pełnego 
wytłumaczenia mechanizmu żadnego z omówionych 
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tu procesów: replikacji, mutagenezy, transkrypcji, 
translacji, jeżeli nieznana będzie budowa uczestni¬ 
czących w tych procesach biopolimerów, a także 
zmiany zachodzące w strukturze w zależności od 
funkcjonalnego stanu badanego biopolimeru. Pod¬ 
czas gdy w latach 1965-1975 rozwinęły się znacznie 
metody badania sekwencji różnych RNA to w dzie¬ 
dzinie oznaczania sekwencji DNA postęp był nie¬ 
zwykle powolny. Sytuacja ta uległa radykalnej zmia¬ 
nie z chwilą odkrycia i scharakteryzowania (od 1972 r.) 
restryktazy nowej grupy enzymów działających na DNA, naz¬ 
wanych restryktazami. Enzymy te, izolowane z bak¬ 
terii, nacinają łańcuch DNA wtedy, gdy zawiera on 
określoną sekwencję kilku nukleotydów, w taki 
sposób, że pozostawiają po obu stronach nacięcia 
krótki pojedynczołańcuchowy fragment DNA. I tak 
np. jedna z najlepiej poznanych restryktaz, Eco RI, 
nacina DNA w następujący sposób: 


G 1 AATTC .G AATTC.... 

Eco RI 

GTTAA | G. .CTTAA G. 


Powstałe jednołaócuchowe końce, zwane lepkimi, 
mogą w odpowiednio dobranych warunkach odna¬ 
leźć się i dopasować, zgodnie z zasadą komplementar- 
ności nukleotydów. Jeżeli dodać wówczas enzym, 
który może zszywać przerwy w ciągłości łańcucha 
ligaza DNA, ligazę, to nastąpi połączenie dwu fragmentów 
DNA uprzednio przez restryktazę naciętych. Według 
tej strategii można połączyć ze sobą dwa łańcuchy 
DNA wydzielone z dowolnych organizmów, pod wa¬ 
runkiem, że były nacinane przez ten sam enzym re¬ 
strykcyjny. To odkrycie stało się podstawą rozwoju 
nowego działu biologii molekularnej niekiedy zwa¬ 
nego inżynierią genetyczną. 

DNA — DNA, który chcemy badać, dołączamy w wyżej 

wektor opisany sposób do innego DNA, zwanego DNA- 
wektorem. DNA-wektorem mogą być plazmidy lub 
DNA wirusów, które mogą wejść do żywej komórki 
i tam replikować przez dowolną liczbę pokoleń. 
W ten sposób można uzyskać dowolną ilość intere¬ 
sującego nas DNA połączonego ligazą z DNA-wek- 
torem. Podstawowy schemat takich zabiegów przed¬ 
stawiał się w 1977 r. jak następuje: 

— Oczyszczano mRNA transkrybowane z określo¬ 
nego genu o znanej funkcji i o znanym produkcie 
białkowym. 

— Specyficzną polimerazą DNA izolowaną z wiru¬ 
sów onkogennych syntetyzowano na matrycy tego 
mRNA dwułańcuchowy DNA komplementarny do 
mRNA, który nazwać można syntetycznym genem. 
— Syntetyczny gen dołączono do DNA-wektora 
i wprowadzono do komórki bakteryjnej, która przez 
wiele generacji replikowała wektor razem z synte¬ 
tycznym genem. 


— Izolowano z powrotem DNA-wektor, wycinano 
z niego restryktazą syntetyczny gen i sprawdzano czy 
nie uległ on zmianie w czasie wielokrotnych replikacji 
w komórce gospodarza. 

Jednocześnie i współzależnie od odkrycia i stoso¬ 
wania restryktaz opracowano dwie nowe i szybkie 
metody sekwencjonowania DNA. Jeżeli w 1974 r. 
oznaczenie sekwencji 20 nukleotydów DNA zajmo¬ 
wało dwa lata, to w cztery lata później wykonywano je 
w jeden dzień. Osiągnięty postęp jest tak wielki, że sta¬ 
ło się łatwiejszym ustalenie sekwencji DNA niż sek¬ 
wencji RNA, a nawet z sekwencji DNA przepowiada 
się już sekwencje aminokwasów w trudniejszych do 
oczyszczenia białkach, produktach danego genu 
(DNA). 

Metody inżynierii genetycznej, aczkolwiek w dużej 
mierze oparte na procedurach in yitro, stanowią 
o tak wielkim postępie w rozumieniu struktury genu 
i jego transkryptu, mRNA, a także, co jeszcze waż¬ 
niejsze, o sposobach regulacji ich aktywności, że nie 
mogą być pominięte przy omawianiu struktury i funk¬ 
cji kwasów nukleinowych. 

W krótkim artykule trudno wyłożyć wszystkie 
aspekty problemu wzajemnych zależności między 
strukturą i funkcją kwasów nukleinowych. Aby przed¬ 
stawić w dostatecznie zwartej postaci wszystkie naj¬ 
ważniejsze zagadnienia z punktu widzenia biologicz¬ 
nego, trzeba było zrezygnować z opisu wielu metod 
fizycznych, które niezmiernie wzbogaciły naszą wie¬ 
dzę o kwasach nukleinowych (-* Przedmiot i proble¬ 
my biofizyki molekularnej). 

W przedstawionym schemacie funkcjonowania dlaczego 
kwasów nukleinowych w komórce starano się głów- istotne 
nie podkreślić pojawianie się w opisywanych proce- jest 
sach przejściowych oddziaływań kwasów nukleino- badanie 
wych między sobą i z białkami oraz to, że dopiero kwasów 
zespół biopolimerów może odgrywać określoną rolę nukleino- 
biologiczną. Co więcej, cechą specyficzną organiz- wych 
mów żywych jest fakt tworzenia przez biopolimery 
funkcjonalnych struktur wyższych rzędów, takich jak 
chromatyna, kompleksy polimeraz z matrycami 
i substratami, rybosomy, informosomy i polisomy. 

Struktury te mogą powstawać w określonych warun¬ 
kach doświadczalnych spontanicznie, bez udziału 
enzymów, a więc informacja o nich zawarta jest 
a priori w strukturze przestrzennej składników. Dla¬ 
tego też badania struktur podstawowych i ich wza¬ 
jemnych oddziaływań mają zasadnicze znaczenie 
w pojmowaniu procesu życia. W tej dziedzinie wiedzy 
należy się też spodziewać wciąż nowych, być może 
zaskakujących odkryć. 

J. Ciernochowska i in. Molekularne podstawy życia, Warsza¬ 
wa 1976; J. N. Davidson Biochemia kwasów nukleinowych. War¬ 
szawa 1977; Fizyczne metody badań białek i kwasów nukleino¬ 
wych, red. Ju. S. Łazurkin, Warszawa 1972; J. D. Watson Biolo¬ 
gia molekularna genu. Warszawa 1975; M. W. Wolkensztejn 
Na skrzyżowaniu dróg wiedzy, Warszawa 1975. 


Molekularne podstawy skurczu 
mięśnia 

Hanna Strze/ecka - Go/asze wska 


Współczesne poglądy na temat molekularnego mecha¬ 
nizmu skurczu mięśni są rezultatem wieloletnich 
badań fizjologów, morfologów, biochemików i bio¬ 
fizyków. Najczęstszym obiektem dotychczasowych 
badań były mięśnie szkieletowe kręgowców. Mięśnie 
te, należące do grupy mięśni poprzecznie prążkowa¬ 
nych, mają strukturę bardziej regularną niż inne typy 
mięśni, toteż stanowią odpowiedniejszy materiał do 
badań mikroskopowych i rentgenograficznych, a zwła¬ 
szcza do śledzenia z zastosowaniem tych właśnie me¬ 
tod zmian strukturalnych zachodzących podczas 


skurczu. W badaniach biochemicznych, wymagają¬ 
cych dużych ilości materiału, najczęściej używane są 
mięśnie królika, natomiast mięśnie sartorius i semi- 
tendinosus żaby okazały się — ze względu na ich 
wielkość i kształt — najodpowiedniejsze do doświad¬ 
czeń nad mechaniką i energetyką skurczu. Niektóre 
zagadnienia badane są również porównawczo na 
różnych typach mięśni różnych zwierząt. Badania te 
wykazały, że mimo specyficznych różnic w sposobie 
działania, budowie makro- i mikroskopowej oraz 
w molekularnej strukturze i właściwościach białek 
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kurczliwych różnych typów mięśni podstawowe me¬ 
chanizmy skurczu są wspólne. Co więcej, ostatnie 
badania nad organizmami jednokomórkowymi oraz 
wielokomórkowymi, lecz nie posiadającymi wyspe¬ 
cjalizowanej tkanki mięśniowej, wskazują na to, że 
podstawą wszelkiego rodzaju ruchliwości są te same 
lub bardzo zbliżone mechanizmy molekularne. 


cie nie obserwuje się zmian zawartości ATP aż do 
momentu wyczerpania zapasu fosfokreatyny. 

Inny enzym (miokinaza) katalizuje przeniesienie 
grupy fosforanowej z jednej cząsteczki ADP na drugą, 
z wytworzeniem jednej cząsteczki ATP i jednej czą¬ 
steczki kwasu adenozynomonofosforowego (AMP): 

2 ADP ATP+AMP. (3) 


hydroliza 

ATP 


Źródła energii skurczu 


Mięsień jest czymś w rodzaju biologicznego silnika 
przekształcającego energię chemiczną, zmagazyno¬ 
waną w prostych substancjach chemicznych, w energię 
mechaniczną. Wiadomości o przemianach energe¬ 
tycznych związanych ze skurczem pochodzą z badań 
na mięśniach wyizolowanych z organizmu i drażnio¬ 
nych sztucznie impulsami elektrycznymi, imitującymi 
impulsy nerwowe w organizmie zwierzęcym. 

Badając zmiany chemiczne zachodzące w kurczą¬ 
cym się mięśniu, ustalono ponad wszelką wątpliwość, 
że bezpośrednim źródłem energii mechanicznej i cie¬ 
pła wydzielanego podczas skurczu jest reakcja hy¬ 
drolizy kwasu adenozynotrójfosforowego, w skrócie 
ATP, w wyniku której powstają kwas adenozyno- 
dwufosforowy (ADP) i kwas ortofosforowy: 
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kwas adenozynotrójfosforowy {ATP) 


Ta reakcja przebiega w kierunku syntezy ATP 
dopiero wówczas, gdy stężenie ADP przewyższa 
stężenie ATP, toteż w warunkach normalnej pracy 
mięśnia ma ona mniejsze znaczenie, odgrywa nato¬ 
miast ważną rolę przy intensywnej pracy, prowadzącej 
do wyczerpania zapasu fosfokreatyny. 

Łączny zapas energii zawartej w ATP i fosfokreaty- 
nie w mięśniach żaby wystarcza na wykonanie 80- 
100 skurczów. Wykonywanie przez mięsień jeszcze 
większej pracy — nawet wówczas, gdy jest on wyizo¬ 
lowany z organizmu, a więc odcięty od dopływu sub¬ 
stancji pokarmowych — możliwe jest dzięki procesom 
metabolicznym odtwarzającym ATP z ADP i nieor¬ 
ganicznego fosforanu. Źródłem energii, która w toku 
tych procesów magazynowana jest w wiązaniu koń¬ 
cowej grupy fosforanowej w cząsteczce ATP, jest 
utlenianie węglowodanów i tłuszczów. Wspólny dla 
przemiany węglowodanów i tłuszczów końcowy łań¬ 
cuch reakcji składających się na proces tzw. oksyda¬ 
cyjnej fosforylacji jest najbardziej wydajnym pro¬ 
cesem fosforylacji ADP. Ponieważ jednak jest on 
uzależniony od obecności tlenu, przeto odgrywa rolę 
przy krótkotrwałej oraz długotrwałej, lecz powolnej 
pracy mięśni, a także w okresie „odnowy”, po za¬ 
kończeniu pracy. Podczas intensywnej pracy szyb- 

O(-) Ol ł 

o-P-O—p—o 1-1 + h 2 o 


o O 


-► ADP 2 “+ HPC> 4 _-ł- energia 


Zawartość ATP w mięśniu jest stosunkowo niska 
i wystarcza najwyżej na 10 kolejnych skurczów, gdy 
tymczasem wyizolowany z organizmu mięsień może 
w warunkach tlenowych wykonać ponad 1000 skur¬ 
czów. W każdym mięśniu zachodzi bowiem wiele 
. procesów enzymatycznych, które odtwarzają rozło- 
reakcje żony AT p Najważniejszą z reakcji utrzymujących 
odtwarzające $taly poz j om ATP w pracującym mięśniu jest prze- 
A p niesienie gupy fosforanowej z innego wysokoenerge¬ 
tycznego związku fosforowego, a mianowicie fosfo¬ 
kreatyny, na ADP (przeniesienie jest katalizowane 
przez enzym kreatynofosfotransferazę): 

o- ch 3 

O-—P—N—C—N—CH 2 —COO- + ADP 

11 I 11 

O H NH (2) 

fosfokreałyna 

H CH 3 

5± H—Ń ®—C—N—CH.—COO' + ATP. 

i i: 

H NH 

krcatyna 

Reakcja ta jest odwracalna — nie towarzyszą jej 
zmiany swobodnej energii układu, lecz kierunek jej 
przebiegu uzależniony jest od stężeń reagujących 
ze sobą związków w taki sposób, że ADP, powstający 
w mięśniu w wyniku hydrolizy ATP, jest natychmiast 
przekształcany w ATP (fosforylacja ADP) i w rezulta- 


kość dostarczania tlenu przez krew jest niewystarcza¬ 
jąca dla zapewnienia sprawnego przebiegu reakcji 
tlenowych. 

Odtwarzanie ATP z ADP i nieorganicznego fosfo¬ 
ranu w warunkach beztlenowych zapewnia proces 
glikogenolizy, obejmujący wstępne etapy przemiany 
glikogenu. W obecności tlenu produkt glikogenolizy - 
kwas pirogronowy — wchodzi w cykl reakcji prowa¬ 
dzących do jego całkowitego spalenia; w warunkach 
niedotlenienia, np. przy dużym wysiłku fizycznym, 
glikogen ulega przemianie beztlenowej, której końco¬ 
wym produktem jest kwas mlekowy, gromadzony 
w mięśniu podczas pracy, a następnie usuwany przez 
krwiobieg i utleniany w innych narządach. 

Część ATP powstającego w procesach oksydacyjnej 
fosforylacji i glikogenolizy służy z kolei do odtwo¬ 
rzenia zapasu fosfokreatyny (reakcja 2). 

Wszystkie wymienione procesy i pojedyncze reakcje 
chemiczne umożliwiają przenoszenie energii chemicz¬ 
nej zawartej w różnorodnych substancjach pokarmo¬ 
wych na ATP — jedyną substancję zdolną do prze¬ 
kazywania energii chemicznej elementom kurczli¬ 
wym, które przekształcają ją na pracę mechaniczną. 

Badania nad mechanizmem przekształcania przez najprostszy 
mięsień energii chemicznej w mechaniczną zostały za- model 
początkowane odkryciem przez W. A. Engelhardta skurczu 
i M. N. Lubimową w 1939 r., że jedno z głównych mięśnia 
strukturalnych białek mięśniowych — miozyna —jest 
enzymem katalizującym hydrolizę ATP, oraz o dwa 
lata późniejszą obserwacją A. Szent-Gyorgyiego, 
że miozyna połączona z drugim białkiem mięśnio¬ 
wym — aktyną — po wstrzyknięciu przez rurkę ka¬ 
pilarną do wody wytrąca się w postaci nici, które po 
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dodaniu ATP ulegają skurczeniu. W ten sposób uzys¬ 
kano najprostszy modelowy układ złożony z miozyny, 
aktyny i ATP, umożliwiający badanie procesów, które 
zachodzą w żywym mięśniu podczas skurczu. Uzys¬ 
kane tą drogą informacje, łącznie z wynikami jed¬ 
nocześnie prowadzonych badań nad molekularną 
organizacją miozyny i aktyny w mięśniu, ukształto¬ 
wały współczesne poglądy na molekularny mecha¬ 
nizm skurczu. 


Budowa komórek mięśniowych 


Wszystkie typy mięśni zbudowane są z jedno- lub 
wielojądrowych komórek w kształcie włókien o śred¬ 
nicy ok. 100 pm. Włókna mięśni szkieletowych i mięś¬ 
nia sercowego kręgowców wypełnione są przebiega¬ 
jącymi przez całą długość komórki, ułożonymi rów- 
miofibryfe nolegle włókienkami, noszącymi nazwę miofibryli. 

Miofibryle wykazują regularne poprzeczne prążko¬ 
wanie, widoczne na podłużnych przekrojach mię¬ 
śnia w mikroskopie optycznym. Na podstawie ob¬ 
serwacji w mikroskopie polaryzacyjnym ustalono, 
że prążkowanie to jest skutkiem występowania wzdłuż 
miofibryli na przemian stref mających właściwość 
podwójnego załamywania światła, które w związku 
z tym otrzymały nazwę prążków anizotropowych 
(w skrócie prążki A ), oraz stref nie mających tej wła¬ 
ściwości, czyli prążków izotropowych (prążki /) 
(rys. la). Ponadto wyróżniono cienki, ciemniejszy 
prążek przechodzący w poprzek każdego prążka / 
i dzielący go na połowę, który nazwano linią Z, oraz 
jaśniejszą strefę pośrodku prążka A, zwaną strefą H. 
sarkomęsy Powtarzające się wzdłuż miofibryli odcinki struktural¬ 
ne ograniczone dwiema sąsiednimi liniami Z nazwa¬ 
no sarkomerami. 
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Rys. I. Przekrój podłużny mięśnia poprzecznie prążkowanego: 
a) schemat obrazu miofibryli otrzymywanego w mikroskopie 
optycznym, b) schemat budowy pojedynczego włókna. U dołu 
ukazane są schematy przekrojów poprzecznych 
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Obserwacje w mikroskopie elektronowym wyka¬ 
zały, że poprzeczne prążkowanie miofibryli spowo¬ 
dowane jest obecnością i charakterystycznym ułożę- filamenty 
niem w każdym sarkomerze dwojakiego rodzaju 
włókienkowatych elementów strukturalnych, które 
ze względu na ich różną średnicę nazwano filamenta- 
mi grubymi i cienkimi (il. 120, tabl. 30). Filamenty 
grube, o średnicy 10-12 nm, przebiegają wzdłuż prąż¬ 
ka A f natomiast filamenty cienkie, o średnicy 5-7 nm, 
biegną od linii Z przez całą długość prążka I, wnikają 
do prążka A i dochodzą w nim do granicy strefy H. 

Tak więc centralna strefa H zbudowana jest wyłącznie 
z filamentów grubych, boczne zaś strefy prążka A — 
z obu typów filamentów. Na przekrojach poprzecz¬ 
nych mięśnia widać regularne, heksagonalne uło¬ 
żenie filamentów cienkich wokół każdego filamentu 
grubego, a filamentów grubych względem siebie 
(rys. Ib). 

W połowie lat 50-ych H. E. Huxley i J. Hanson oraz 
A.F. Huxley i R. Niedergerke jednocześnie ogłosili 
wyniki swoich obserwacji, które dały jednoznaczną 
odpowiedź na pytanie, jakie zmiany morfologiczne 
zachodzą w mięśniu podczas skurczu, powodując jego 
skracanie się. Stwierdzili oni, że następuje wówczas 
skrócenie prążków I oraz strefy Hj całkowita zaś 
długość prążków A pozostaje niezmieniona. A zatem 
zmiany długości mięśnia są wynikiem przesuwania 
się grubych i cienkich filamentów wzdłuż osi miofibryli 


I A 1 


Z H Z 




Rys. 2. Schemat zmian układu filamentów we włóknie mięśnio¬ 
wym podczas skurczu 

w przeciwnych kierunkach w każdej połówce sarko- 
meru oraz zwiększenia strefy zachodzenia filamentów 
pomiędzy siebie bez zmiany długości samych fila¬ 
mentów (rys. 2). 

Zrozumienie mechanizmu powodującego przesu¬ 
wanie się filamentów grubych i cienkich względem 
siebie wymaga dokładniejszej znajomości nie tylko 
budowy tych filamentów, lecz także właściwości 
białek, z których są one utworzone. 

Po mechanicznym zniszczeniu struktury komórek 
mięśniowych można w stosunkowo prosty sposób 
wyizolować z nich miofibryle, z których działaniem 
odpowiednich roztworów soli można następnie kolej¬ 
no wydzielić dwa główne strukturalne białka mięś¬ 
niowe: miozynę i aktynę. Obserwacje mikroskopowe 
zachodzących przy tym zmian w strukturze miofibryli 
doprowadziły do wniosku, że filamenty grube zbu¬ 
dowane są z miozyny, filamenty cienkie — z aktyny. 
Materiałem, z którego utworzona jest linia Z, łą¬ 
cząca filamenty cienkie sąsiednich sarkomerów (rys. 
1), jest inne białko strukturalne, zwane a-aktyniną. 
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Rys. 3. Schemat 
budowy polimeru 
aktyny 


Charakterystyka strukturalnych 
białek mięśniowych i ich 
molekularnej organizacji 
w mięśniu 

Aktyna wyizolowana z mięśnia może występować 
w dwóch postaciach: monomerycznej i spolimeryzo- 
wanej, odwracalnie przechodzących jedna w drugą. 
Cząsteczka aktyny monomerycznej ma kształt sfe¬ 
ryczny. Zbudowana jest z pojedynczego łańcucha poli- 
peptydowego o masie 42 300 daltonów (dalton — 
stosowana w biochemii nazwa jednostki masy ato¬ 
mowej u; 1 u jest równa Vi 2 masy jądra izotopu węgla 
12 C). W tej postaci aktyna występuje w roztworach 
wodnych nie zawierających soli nieorganicznych. 
Dodanie soli w stężeniach fizjologicznych powoduje 
polimeryzację aktyny. Badając w mikroskopie elek¬ 
tronowym otrzymane w ten sposób polimery, stwier¬ 
dzono, że mają one postać filamentów, takich samych 
jak cienkie filamenty bezpośrednio wyizolowane 
z mięśni po mechanicznym zniszczeniu struktury 
komórkowej i miofibrylarnej (ii. 121, tabl. 30). Każdy 
filament zbudowany jest z dwóch śrubowo wokół 
siebie skręconych łańcuchów sferycznych jednostek 
o średnicy 5,5 nm, odpowiadającej średnicy monome¬ 
ru obliczonej na podstawie fizykochemicznych badań 
roztworów aktyny monomerycznej. Punkty przeci¬ 
nania się obu łańcuchów monomerów w rzucie fila¬ 
ment u na płaszczyznę (rys. 3), powtarzają się w re¬ 
gularnych odstępach 36 nm. Ponieważ na rentgeno- 
gramach żywych mięśni znaleziono refleksy odpo¬ 
wiadające tej okresowości, można sądzić, że struktura 
filamentów aktynowych „widziana” w mikroskopie 
elektronowym odpowiada ich strukturze w żywym 
mięśniu. 

Podobnie jak aktyna, wyizolowana z mięśni mio¬ 
zyna może występować bądź w postaci monomerycz¬ 
nej, bądź w postaci agregatów odpowiadających 
kształtem filamentom grubym. Cząsteczki miozyny, 
o masie ok. 480 000 daltonów, mają kształt pałeczek 
zakończonych dwiema główkami (widoczne na rys. 4). 
Zbudowane są z dwóch łańcuchów poiipeptydowych 
o masie 200 000 daltonów, zwanych łańcuchami 
ciężkimi, oraz czterech łańcuchów tzw. lekkich, o ma¬ 
sach od kilkunastu do dwudziestu kilku tysięcy dal¬ 
tonów. Każdy z dwóch łańcuchów ciężkich ma 
w większej swej części strukturę heliksu a; na tym od¬ 
cinku oba łańcuchy skręcone są jeszcze dodatkowo 
wokół siebie w superheliks, który tworzy pałeczko- 
watą część cząsteczki. W dalszej swej części oba 



a) 



5 ) Rys. 4. Budowa cząsteczki miozyny: a) obraz w mikroskopie 
elektronowym (preparat kontrastowany metodą cieniowania; 
powiększenie 175 000 razy (wg S. Lowey i in.), b) schemat. 
W nawiasach podano masy cząsteczkowe produktów trawienia 
cząsteczki trypsyną 


ciężkie łańcuchy tracą wysoki stopień strukturalnego 
uporządkowania i przechodzą w jedną z dwóch głó¬ 
wek, w których się znajdują również łańcuchy lekkie, 
luźno połączone z łańcuchami ciężkimi. Wiadomo 
obecnie, że dwa z czterech lekkich łańcuchów są nie¬ 
zbędne dla zachowania' aktywności enzymatycznej 
miozyny, natomiast funkcja dwóch pozostałych, które 
można usunąć nie powodując utraty aktywności, 
jest dopiero przedmiotem badań. Charakterystyczną 
cechą miozyny z różnych typów mięśni oraz z mięśni 
różnych zwierząt jest znaczne zróżnicowanie masy, 
struktury i własności jej lekkich łańcuchów, niewątpli¬ 
wie pozostające w związku z pewnymi różnicami włas¬ 
ności całej cząsteczki. 

Ważnym elementem molekularnej budowy mio¬ 
zyny jest obecność w cząsteczce dwóch miejsc szcze¬ 
gólnie wrażliwych na działanie enzymów trawiących 
białka. Dzięki temu przez trawienie trypsyną można 
podzielić cząsteczkę — jak zaznaczono na rys. 4 — 
na dwa fragmenty, z których jeden nazwano mero- 
miozyną lekką (w skrócie LMM\ drugi — ciężką 
( HMM ). Przy dłuższym trawieniu następuje roz¬ 
szczepienie HMM na dwa subfragmenty: SI i S2 , 
z których pierwszy odpowiada główce, drugi zaś 
stanowi odcinek pałeczkowatej części cząsteczki. Po 
rozdzieleniu produktów trawienia okazało się, że 
SI zachowuje zdolność hydrolizy ATP, natomiast 
pozostałe fragmenty cząsteczki nie biorą udziału 
w aktywności enzymatycznej miozyny. Stwierdzono 
ponadto, że tylko subfragment SI posiada inną ważną 
właściwość miozyny — zdolność tworzenia komplek¬ 
su z aktyną. 

W roztworach soli o niskim, fizjologicznym stę¬ 
żeniu cząsteczki miozyny agregują, tworząc filamenty 
podobne do filamentów grubych bezpośrednio wy¬ 
izolowanych z mięśni (rys. 5). W mikroskopie elek¬ 
tronowym na powierzchni filamentów widoczne są 
liczne „wypustki”, których pozbawiony jest jedynie 
środkowy odcinek filamentu. W podobnych warun¬ 
kach meromiozyna lekka również agreguje tworząc 
filamenty, lecz o powierzchni gładkiej, natomiast ani 
HMM , ani SI lub S2 nie wykazują tendencji do agre¬ 
gacji. Z tych obserwacji H. A. Huxley wysnuł wnio¬ 
sek, że rdzeń filamentu grubego utworzony jest 
z ułożonych równolegle do osi filamentu odcinków 
cząsteczek miozyny odpowiadających meromiozynie 
lekkiej, natomiast części odpowiadające meromiozy¬ 
nie ciężkiej wystają na zewnątrz w formie widocznych 
w mikroskopie elektronowym luźnych wypustek 
(il. 123, tabl. 31). W centralnej, pozbawionej wypustek 
części filamentu zmienia się kierunek ułożenia czą¬ 
steczek, co nadaje filamentowi strukturalną polar- 
ność, której znaczenie zostanie omówione w dalszej 
części artykułu. 
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Rys. 5. Sche¬ 
mat budowy 
filamentu 
miozynowego 


Molekularny mechanizm 
skurczu 


Hydroliza ATP katalizowana przez miozynę w obec¬ 
ności jonów potasu, magnezu i wapnia w takich stę¬ 
żeniach, w jakich jony te występują w mięśniu, prze¬ 
biega z małą szybkością, nie wystarczająca na pokry¬ 
cie potrzeb energetycznych skurczu. W obecności 
aktyny szybkość ta znacznie wzrasta i osiąga wartość 
. porównywalną z szybkością rozkładu ATP (mierzoną 
ubytkiem fosfokreatyny zużywanej na jego resyntezę) 
w kurczącym się mięśniu. Jak wynika z rozważań 
przedstawionych w poprzednim rozdziale, zarówno 
miejsce hydrolizy ATP, jak i łączenia się miozyny 
z aktyną znajduje się w tej części cząsteczki miozy- 
nowej, która wystaje z trzonu filamentu grubego 
w postaci wypustki. Według ogólnie dziś akceptowa¬ 
nej teorii H. E. Huxleya, dochodzący do mięśnia im¬ 
puls nerwowy powoduje, że wypustki filamentów teoria 
miozynowych (zwane częściej poprzecznymi mostka- Hux!eya 
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mi) łączą się z filamentami aktynowymi. Połączenie 
z aktyną powoduje aktywację hydrolizy ATP przez 
miozynę i wyzwolenie energii wiązania końcowego 
fosforanu z ATP. Energia ta zostaje zużyta na zmianę 
kąta, pod jakim główka cząsteczki miozynowej (sub- 
fragment SI), stanowiąca część mostka, połączona 
jest z filamentem aktynowym. Zmiana kąta powoduje 
przesunięcie filamentu aktynowego wzdłuż miozyno- 
wego o pewien odcinek (rys. 6), nie większy niż 5-10 
nm, po czym następuje rozerwanie międzyfilamento- 
wego połączenia i ponowne jego utworzenie w dalszej 
części filamentu aktynowego. Opisany cykl zmian 
powtarza się wielokrotnie podczas skurczu, a każdy 
związany jest z hydrolizą jednej cząsteczki ATP. 



Przedstawione wyżej zasadnicze elementy teorii 
Huxleya zostały sformułowane w końcu lat 50-ych. 
Wypada obecnie przedstawić nieco dokładniej zało¬ 
żenia oraz dowody, na których teoria została oparta, 
i uzupełnić je wynikami późniejszych badań, 
wahadłowy Dla wytłumaczenia wahadłowego ruchu mostków 
rwch rsiosfc- miozynowych w kierunku filamentów cienkich oraz 
ków miozy- zmiany kąta przyłączenia główek miozynowych do 
nowych filamentu cienkiego Huxley oparł się na założeniu, iż 
w tej części łańcucha polipeptydowego, która tworzy 
mostek, istnieją dwa miejsca charakteryzujące się 
pewną giętkością i spełniające funkcję „zawiasów”: 
jedno tam, gdzie mostek przechodzi w trzon filamen¬ 
tu, drugie — pomiędzy główką (subfragmentem SI) 
a liniową częścią mostka (subfragmentem S2), ma¬ 
jącą charakter sztywnej pałeczki. 

Cykliczne zmiany ustawienia mostków miozyno¬ 
wych podczas skurczu mięśnia muszą być rezultatem 
zmian w konformacji łańcucha polipeptydowego 
w obrębie wspomnianych wyżej giętkich obszarów 
mostka. Z zastosowaniem metod biofizycznych (np. 
badania zmian widma miozyny w ultrafiolecie, ba¬ 
dania fluorescencji, rezonansu elektronowego itp.) 
uzyskano wiele dowodów na to, że w trakcie hydrolizy 
ATP rzeczywiście zachodzą zmiany konformacyjne 
w cząsteczce miozyny w pobliżu jej aktywnego cen¬ 
trum enzymatycznego. 

Na schemacie ilustrującym zmiany ustawienia mo¬ 
stków miozynowych podczas skurczu (rys. 6) przed¬ 
stawiono mostki w sposób uproszczony, z pojedyn¬ 
czą główką — subfragmentem SI , jakkolwiek wiado¬ 
mo, że na jedną cząsteczkę miozyny, a co za tym idzie 
— na jeden mostek przypadają dwa SI. Wiele obser¬ 
wacji wskazuje na to, że oba subfragmenty SI tego 
samego mostka nie działają jednocześnie. 

Ruch filamentów aktynowych w każdym sarkome- 
rze kurczącego się mięśnia odbywa się w sposób sko¬ 
ordynowany — w kierunku centralnej części sarko- 
meru, a więc, jak już o tym mówiono (rys. 2), w każ¬ 
dej połówce sarkomeru w kierunku przeciwnym. Taką 
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koordynację zapewnia wspomniana w poprzednim 
rozdziale strukturalna polarność filamentów miozyno- polarność 
wych, wynikająca z odwrotnego kierunku ułożenia filamentów 
cząsteczek miozyny w obu połówkach filamentu. miozynowych 
Ponadto badania H. E. Huxleya i jego współpracow- i aktynowych 
ników dostarczyły również dowodów polamości 
struktury filamentów aktynowych. Przemawia za 
nią struktura kompleksów utworzonych przez przy¬ 
łączenie cząsteczek meromiozyny ciężkiej lub sub- 
fragmentu SI do filamentów aktynowych (il. 122, 
tabl. 30). Kompleksy te wyglądem swoim przypomina¬ 
ją długi szereg skierowanych w tę samą stronę grotów 
strzał długości 36 nm. Ponieważ długość ta odpo¬ 
wiada skokowi podwójnego heliksu, jaką tworzą łań¬ 
cuchy monomerów w filamencie aktynowym, uznano, 
że każdy monomer aktyny wiąże jedną cząsteczkę sub- 
fragmentu SI. W ten sposób cały kompleks zachowuje 
okresowość śrubowej struktury filamentu aktynowego. 

Aby powstała charakterystyczna struktura grotów 
strzał, przyłączone cząsteczki muszą tworzyć kąt ostry 
z osią filamentu i muszą być zwrócone w tym samym 
kierunku; w ukierunkowaniu tym ujawnia się właśnie 
strukturalna polarność filamentów aktynowych. 

W odróżnieniu od sztucznie wytworzonych kom¬ 
pleksów —- w mięśniu nie wszystkie monomery akty¬ 
ny łączą się jednocześnie z mostkami miozynowymi. 

Maksymalna liczba możliwych połączeń wynika 
przede wszystkim z rozmieszczenia mostków na fila¬ 
mencie miozynowym. Do uzyskania informacji na 
ten temat wykorzystano obrazy dyfrakcji promieni 
rentgenowskich na żywym mięśniu. Kierując wiązkę 
promieni rentgenowskich prostopadle do dłuższej 
osi włókna mięśniowego, na rentgenogramie otrzy- badanie 
muje się w kierunku równoległym do osi włókna układ struktury 
refleksów południkowych (il. 126, tabl. 31), będących filamentów 
wynikiem odbić od elementów powtarzających się metodą rent- 
wzdłuż osi włókna. Ich źródłem może więc być za- genowską 
równo śrubowa struktura filamentów aktynowych, 
jak i regularne, periodyczne rozmieszczenie mostków 
wzdłuż filamentów miozynowych. Odległość reflek¬ 
sów południkowych od równika jest miarą odległości 
między powtarzalnymi strukturami w mięśniu. Na¬ 
tomiast rozkład refleksów na równiku — w kierunku 
prostopadłym do dłuższej osi włókna — odpowiada 
regularnościom przestrzennego rozmieszczenia fila¬ 
mentów (rys. 7). 



Rys. 7. Heksagonalna siatka grubych i cienkich filamentów w mię¬ 
śniu poprzecznie prążkowanym kręgowców; na rysunku zazna¬ 
czono płaszczyzny będące źródłem refleksów równikowych (pro¬ 
stopadłych do dłuższej osi włókna mięśniowego) na obrazach 
dyfrakcji promieniowania rentgenowskiego na żywym mięśniu 

Charakterystyczną cechą obrazów dyfrakcji pro¬ 
mieni X przez mięsień w stanie spoczynkowym (il. 

126, tabl. 31) jest ułożenie refleksów południkowych w 
linie warstwowe odpowiadające okresowości 42,9 nm 
oraz obecność o wyjątkowo dużym natężeniu refleksu 
południkowego odpowiadającego okresowości 14,3 
nm. Po skonfrontowaniu tych danych z obrazami 
podłużnych skrawków mięśnia w mikroskopie elek¬ 
tronowym (na których przy dużych powiększeniach model 
można zauważyć pary mostków odchodzące od Hux!eya 
filamentu miozynowego w odstępach ok. 40 nm) i Browna 
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Rys. 8. Model rozmieszczenia poprzecznych mostków na fila- 
mencie grubym (wg H. E. Huxleya). Część mostków oznaczono 
szarym kolorem dla uwidocznienia ich śrubowego układu 


H. E. Huxley i W. Brown zaproponowali model roz¬ 
mieszczenia mostków na filamencie miozynowym 
(rys. 8). Śrubowe ułożenie mostków w taki sposób, 
że tworzą one jednocześnie sześć biegnących wzdłuż 
filamentu rzędów, w których odstępy między mostka¬ 
mi wynoszą 42,9 nm, najlepiej tłumaczy wyniki badań 
rentgenograficznych, a zarazem uzasadnione jest 
faktem, że każdy filament miozynowy otoczony jest 
sześcioma filamentami aktynowymi; takie rozmiesz- 
szczenie mostków byłoby więc najkorzystniejsze jeśli 
chodzi o łatwość wytwarzania międzyfilamentowych 
połączeń. 

Regularność budowy filamentów miozynowych 
uwidacznia się tylko na rentgenogramach mięśni 
w stanie spoczynkowym, kiedy to międzyfilamentowe 
połączenia są przerwane. Po wyczerpaniu zapasu ATP 
i fosfokreatyny w wyniku długotrwałej serii skurczów 
mięsień wyizolowany przechodzi w stan tężca, staje 
się sztywny i nierozciągliwy. Wskazuje to na wytwo¬ 
rzenie trwałych połączeń między filamentami miozy- 
nowymi i aktynowymi, co jest zgodne z wynikami ba¬ 
dań nad reagowaniem miozyny z aktyną in vitro 
(w nieobecności ATP oba białka łączą się w kompleks). 
Rentgenogramy mięśnia w tym stanie znacznie się 
różnią od obrazów jego w stanie- spoczynkowym: 
południkowe refleksy odpowiadające okresowi 
42,9 nm niemal całkowicie zanikają, a następuje 
wzmocnienie refleksów pochodzących z filamentów 
aktynowych (36 nm). Zmienia się także względne na¬ 
tężenie refleksów równikowych (osłabienie refleksu 

I. 0, a wzmocnienie 1.1: rys. 7). Ponieważ natężenie 
refleksów klw jest proporcjonalne do gęstości sub¬ 
stancji rozpraszającej promienie X , zmiany te inter¬ 
pretuje się jako wynik przesunięcia większej części 
masy mostków miozynowych w kierunku filamentów 
aktynowych dla wytworzenia z nimi połączeń. Połą¬ 
czenie z filamentami aktynowymi nadaje konfiguracji 
mostków nową regularność, określoną sposobem uło¬ 
żenia monomerów w filamencie aktynowym. 

Z porównania natężenia poszczególnych reflek¬ 
sów na rentgenogramach mięśni w stanie skurczu, 
tężca i spoczynku wynika, że podczas skurczu w każ¬ 
dym momencie dochodzi do skutku zaledwie ok. 20% 
możliwych połączeń międzyfilamentowych. Jest to 
eksperymentalny dowód słuszności jednego z głów¬ 
nych założeń teorii skurczu H. E. Huxleya — cyklicz- 
ności wytwarzania międzyfilamentowych połączeń. 
Tak niski procent jednocześnie istniejących połączeń 
oznacza, że każdy mostek w następujących po sobie 
cyklach zmian jego stanu pozostaje w połączeniu 
z filamentem aktynowym przez stosunkowo krótki 
czas — zaledwie 1 / 5 część czasu trwania całego cyklu. 

Analiza rentgenogramów mięśnia dostarczyła rów¬ 
nież dowodów na to, że w mięśniu rozkurczonym, 
w którym międzyfilamentowe połączenia są rozerwa¬ 
ne, globutame części mostków (główki cząsteczek 
miozyny) ustawione są pod kątem prostym do osi 
filamentów, natomiast gdy mięsień znajduje się w sta¬ 
nie tężca, są one połączone z filamentami aktyno¬ 
wymi pod kątem 45°. Są to spostrzeżenia, które nie 
stanowią wprawdzie bezpośredniego dowodu na wy¬ 
stępowanie tych dwóch konfiguracji mostków przej¬ 
ściowo w każdym cyklu tworzenia i rozrywania mię¬ 
dzyfilamentowych połączeń, czynią jednak to istotne 
założenie teorii Huxleya wysoce prawdopodobnym. 

W ostatnich latach wykazano, że hydroliza ATP 
przez miozynę jest procesem, na który się składa co 
najmniej 7 kolejnych reakcji: 


hydroliza 
ATP przez 
miozynę 


M + ATP M-ATP M*-ATP 
: M*** ADP*P :j± M*ADPPi M* ADP + P^: 
M« ADP-f P M+ADP-f-P, (4) 


gdzie przez M, M* i M** oznaczono miozynę w róż¬ 
nych stanach konformacyjnych, które rozróżniono 
stosując techniki spektroskopowe. Jakkolwiek pod 
wpływem aktyny ogólna szybkość rozkładania ATP 
przez miozynę ulega znacznemu zwiększeniu, właści¬ 
wa reakcja hydrolizy (3) przebiega w tym układzie z 
taką samą szybkością jak w nieobecności aktyny. 

Dzieje się tak dlatego, że przyłączenie ATP w centrum 
aktywności enzymatycznej^ miozyny powoduje dyso- 
cjację kompleksu miozyny z aktyną i dopiero po hy¬ 
drolizie ATP, która zachodzi na cząsteczce wolnej 
miozyny, następuje ponowne połączenie się miozyny 
z aktyną, co przyspiesza uwalnianie produktów 
hydrolizy z centrum aktywności enzymatycznej 
miozyny i w ten sposób przyspiesza cały proces: 

M* * ATP -* M** ADP P 

I / A \ ! (5) 

1 / 

AM + ATP — AM - ATP AM* • ATP AM** • ADP * P -► 

AM*. ADP P -> AM*ADP+P -> AM • ADP+P — AM+ADP+P. 

Taka sekwencja reakcji implikuje rozdzielenie w cza¬ 
sie etapu uwalniania energii chemicznej z ATP i etapu 
jej przekształcania w energię mechaniczną, ponieważ 
hydroliza ATP (uwalnianie energii) zachodzi na wol¬ 
nej miozynie, natomiast wykonanie pracy przesunię¬ 
cia filamentu aktynowego wymaga istnienia między- 
filamentowego połączenia. Badania nad procesem 
hydrolizy ATP przez aktomiozynę in \itro wykazały 
że — zgodnie z przyjętym w teorii Huxleya założe¬ 
niem — energia chemiczna końcowego wiązania fo¬ 
sforanowego w ATP zostaje podczas skurczu mięśnia 
zużyta na zmianę konformacji cząsteczki miozyny i w 
tej formie jest „przechowywana” do momentu prze- zmiana 
kształcenia w energię mechaniczną, co ma miejsce konformacji 
wówczas, gdy cząsteczka miozyny połączona z aktyną — forma 
powraca do swojej konformacji wyjściowej. Nie jest przechowy- 
jeszcze pewne, która z poznanych reakcji procesu hy- wansa energii 
drolizy ATP sprzężona jest z wykonaniem pracy me¬ 
chanicznej, nie ulega jednak wątpliwości, że jest to 
jedna z reakcji prowadzących do uwolnienia pro¬ 
duktów hydrolizy ATP z cząsteczki miozynowej. 



stan 1 stan 2 stan 3 stan 4 


Rys. 9. Schemat zmian konfiguracji mostków miozynowych na 
różnych etapach hydrolizy ATP w układzie aktomiozynowym 
(wg H. G. Mannherza i in.). 


Rysunek 9 ilustruje pierwszą próbę korelacji zmian 
konfiguracji mostków miozynowych z cyklem reakcji 
procesu hydrolizy ATP. W modelu tym najbardziej 
hipotetyczna jest konfiguracja mostków po przy¬ 
łączeniu ATP (stan 4 ); nie udało się dotąd sprawdzić jej 
doświadczalnie, ponieważ—jak już wspomniano — 
reakcja hydrolizy zachodzi szybciej niż uwalnianie 
jej produktów, można więc przypuszczać, że w żywym 
mięśniu, tak jak w roztworach białek, w obecności 
ATP w każdym momencie większość cząsteczek mio¬ 
zynowych występuje w połączeniu z produktami hy- 
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drolizy (stan ]). Stan 1 jest analogiczny do tego, w ja¬ 
kim się znajdują wszystkie lub większość mostków 
podczas rozkurczu (spoczynku) mięśnia, konfiguracja 
zaś mostków w stanie 3 jest typowa dla stanu tężco¬ 
wego. 


Regulacja cyklu skurczowo- 
rozkurczowego 

Odpowiedź .na pytanie, w jaki sposób dochodzący do 
mięśnia bodziec nerwowy odbierany jest przez białka 
kurczliwe i jakie wywołuje w nich zmiany, które pro¬ 
wadzą do skurczu mięśnia, nasunęła się w wyniku ba- 
' dania procesu odwrotnego, czyli rozkurczu. Skoncen¬ 
trowanie uwagi na mechanizmie rozkurczu wynikło 
stąd, że wszystkie układy modelowe stosowane w ba¬ 
daniach nad skurczem wydawały się pozbawione tej 
ważnej właściwości żywego mięśnia, jaką jest zdolność 
do rozkurczu. Tak zw. glicerynowane włókna mięś¬ 
niowe, tj. włókna pozbawione substancji niskoczą- 
steczkowych i rozpuszczalnych białek przez wypłuka¬ 
nie ich wodnym roztworem glicerolu, po umieszczeniu 
w roztworze ATP i jonów magnezu ulegają skur¬ 
czowi, który się utrzymuje nadal po całkowitym roz¬ 
łożeniu ATP. Również nieodwracalna jest superpre- 
cypitacja — reakcja preparatów aktomiozyny na do¬ 
danie ATP w fizjologicznych warunkach jonowych, 
polegająca na wytrąceniu się żelu aktomiozynowego 
w postaci odwodnionego osadu; jest to najprostszy 
model skurczu mięśnia in vitro. Po rozłożeniu doda¬ 
nego ATP nie obserwuje się rozpuszczenia wytrąco¬ 
nego białka. 

Po bezskutecznych poszukiwaniach hipotetycznej 
substancji rozkurczającej udało się w latach 50-ych 
uzyskać rozkurcz glicerynowanych włókien mięśnio¬ 
wych przez potraktowanie ich substancjami silnie wią- 
rola żącymi jony wapnia. Zwrócono wówczas uwagę na 
jonów wcześniejszą obserwację fizjologów, że wstrzyknięcie 
wapnia soli wapnia do włókien mięśniowych wywołuje lokal¬ 
ny skurcz. Okazało się, że skurcz i rozkurcz inicjowane 
są za pośrednictwem tej samej substancji — jonów 
wapnia. 

Badając zależność napięcia glicerynowanych włó¬ 
kien mięśniowych, stopnia superprecypitacji żelu 
aktomiozynowego, a także aktywacji ATPazy mio- 
zynowej przez aktynę od stężenia jonów wapnia, 
stwierdzono, że odpowiedź skurczowa wymaga obec¬ 
ności jonów wapnia w stężeniach powyżej 10" 6 mol/l. 
Przy stężeniu 10~ 5 mol/l otrzymuje się maksymalną 
reakcję wszystkich badanych modeli mięśniowych. 
W tak niskich stężeniach wapń obecny jest zawsze 
jako zanieczyszczenie zarówno w preparatach białek, 
jak i w glicerynowanych włóknach — tym się tłuma¬ 
czy stosunkowo późne zwrócenie uwagi na jego fizjo¬ 
logiczną rolę w mięśniu. 

Całkowite stężenie wapnia w mięśniu jest rzędu 
10 -3 mol/l. Zaczęto więc z kolei poszukiwać fizjolo¬ 
gicznej substancji lub struktury, która odwracalnie 
wiążąc i uwalniając jony wapnia mogłaby regulować 
ich stężenie w plazmie komórki mięśniowej. Okazało 
się, że funkcję taką spełnia wewnątrzkomórkowy 
siateczka układ strukturalny zwany siateczką sarkoplazma- 
sarkoplaz- tyczną (rys. 10 i il. 124 z tabl. 31). Jest to zamknięty 
ma tyczna układ błon tworzących podłużne kanaliki wokół mio- 
fibryli, łączące się w pobliżu granicy między prążkami 
A i / (w mięśniach szkieletowych ssaków) lub w pobli¬ 
żu linii Z (w mięśniach niższych kręgowców) w tzw. 
cysterny. Między sąsiadującymi ze sobą cysternami 
przebiegają kanaliki poprzeczne, tworzące tzw. układ 
T(skrót od angielskiej nazwy transverse 'poprzeczny’), 
który w odróżnieniu od błon siateczki sarkoplazma- 
tycznej posiada łączność z błoną otaczającą komór¬ 
kę mięśniową — sarkolemmą; kanaliki T są to 
wpuklenia sarkolemmy do wnętrza komórki mięśnio¬ 
wej. 
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Stosując różne metody pozwalające uwidocznić 
rozmieszczenie jonów wapnia na preparatach ogląda¬ 
nych w mikroskopie elektronowym, udało się ziden¬ 
tyfikować cysterny siateczki sarkoplazmatycznej jako 
miejsca magazynowania wapnia w stanie spoczynku badanie prze- 
mięśnia. Do zbadania przemieszczania się jonów mieszczania 
wapnia w komórce mięśniowej w cyklu skurcz-roz- s ię jonów 
kurcz posłużono się białkiem zwanym ekworyną, wapnia 
którego charakterystyczną cechą jest luminescencja 
pod wpływem wiązania wapnia. Wstrzyknięta do 
włókien mięśniowych ekworyną łatwo się w miopla- 
zmie rozprzestrzenia, a jej wysokie powinowactwo do 
wapnia zapewnia wiązanió tego jonu przy jego niskich, 
fizjologicznych stężeniach. Rejestrując luminescencję 
nasyconych ekworyną włókien mięśniowych stwier¬ 
dzono, że skurcz włókien pod wpływem elektrycznego 
pobudzenia poprzedzony jest wzrostem stężenia wa¬ 
pnia w mioplazmie. Udowodniono w ten sposób, że 
szybkość uwalniania wapnia z siateczki sarkoplazma¬ 
tycznej jest wystarczająca na to, aby przekazywanie 
pobudzenia wytłumaczyć przemieszczeniem jonów 
wapnia do mioplazmy. 



Rys. 10. Schemat budowy siateczki sarkoplazmatycznej: wg D. W. 

Fewcctt, M. S. McNutt, J. Celi Biol. 42, 1 (1969) 

Błony siateczki sarkoplazmatycznej nie stykają się 
bezpośrednio z powierzchnią komórki mięśniowej w 
mięśniach szkieletowych kręgowców, wobec tego 
rolę ogniwa pośredniczącego w przekazywaniu bodźca 
nerwowego do wnętrza komórki przypisano kanalikom 
T, o czym zdecydowała ich łączność z sarkolemmą oraz kanalików T 
bliskie sąsiedztwo z cysternami siateczki sarkoplaz¬ 
matycznej. Z badań elektrofizjologicznych wiadomo, 
że dochodzący do mięśnia impuls nerwowy powoduje 
depolaryzację sarkolemmy, tj. obniżenie dodatniego 
potencjału elektrycznego występującego na jej ze¬ 
wnętrznej powierzchni w stanie spoczynku. Ten spo¬ 
czynkowy potencjał jest wywołany różnicą stężeń 
niektórych jonów w komórce i w płynie pozakomór- 
kowym, utrzymującą się wskutek selektywnej prze¬ 
puszczalności sarkolemmy. Depolaryzacja związana 
jest ze zmianą przepuszczalności i przenikaniem jonów 
sodu do wnętrza komórki. Stopień depolaryzacji 
wzrasta ze wzrostem siły bodźca, przy czym do pew¬ 
nej wartości progowej nie powoduje to zmiany stanu 
mięśnia; po przekroczeniu tej wartości następuje dal¬ 
sza, gwałtowna zmiana przepuszczalności błony, po¬ 
wodująca dalszą dyfuzję jonów i wytworzenie poten¬ 
cjału o znaku przeciwnym, potencjału czynnościowe¬ 
go, któremu towarzyszy skurcz. Przyjmując założenie, 
że właściwości błon układu T są takie same jak sar¬ 
kolemmy, łatwo sobie wyobrazić, że potencjał czyn¬ 
nościowy rozprzestrzenia się dostatecznie szybko na 


































błonę kanalików T. Sygnał ten, przekazywany cyster¬ 
nom siateczki sarkoplazmatycznej, powoduje uwol¬ 
nienie jonów wapnia do mioplazmy (schemat tego pro¬ 
cesu jest przedstawiony na rys. 11). 

sarkoiemma 
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skurcz 


rozkurcz 


Rys. U. Schemat ilustrujący sprzężenie procesu pobudzenia 
i skurczu mięśnia 


Mechanizm przekazywania pobudzenia z kanali¬ 
ków T do siateczki sarkoplazmatycznej jest jeszcze 
przedmiotem dyskusji. Według jednej z hipotez de¬ 
polaryzacja błony kanalików T wywołuje depolary¬ 
zację błony cystern, a ta z kolei zmienia stopień jej 
przepuszczalności dla wapnia. Inna hipoteza zakłada 
uwalnianie ze ścian kanalików T jakiejś nie znanej 
jeszcze substancji, która oddziałuje na błonę cystern. 
Dokładna obserwacja w mikroskopie elektronowym 
wykazała, że w miejscu zetknięcia z kanalikami T 
błona cystern jest pofałdowana, a pomiędzy nią a bło¬ 
ną kanalika T występują regularnie rozmieszczone 
zagęszczenia bezpostaciowego materiału (rys. 12). 
Te zagęszczenia mogłyby być miejscami przepływu 
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Rys. 12. Struktura zetknięcia się kanalików układu T z cysternami 
siateczki sarkoplazmatycznej: a) obraz w mikroskopie elektrono¬ 
wym. powiększenie 70 000 razy (wg C. Franzini-Armstrong), b) 
schemat, strzałkami zaznaczono zagęszczenia bezpostaciowego 
materiału między błonami cysterny i kanalika T 


prądu elektrycznego albo mogłyby spełniać funkcję 
utrzymywania błon obu układów w stałej odległości, 
ewentualna zaś dyfuzja hipotetycznej substancji po¬ 
budzającej zachodziłaby w przestrzeniach pomiędzy 
nimi. 

Dokładne poznanie molekularnego mechanizmu 
uwalnianie uwalniania wapnia z siateczki sarkoplazmatycznej 
wapnia również wymaga dalszych badań. Obecnie już wiado¬ 
mo, że absorpcja wapnia po ustaniu działania bodźca 
nerwowego jest procesem aktywnego transportu 
kosztem energii ATP, przy udziale enzymu hydroli- 
zującego ATP, będącego głównym składnikiem biał¬ 
kowym błon siateczki sarkoplazmatycznej. Transport 
ten zachodzi do momentu obniżenia stężenia wolnych 
jonów wapnia na zewnątrz układu do wartości rzędu 
10~ 8 mol/l. Na wewnętrznej powierzchni błon sia¬ 
teczki sarkoplazmatycznej rozmieszczone są białka 
o wysokim powinowactwie do wapnia, przypuszczal¬ 
nie więc wapń — w stanie spoczynku mięśnia — zma¬ 
gazynowany jest w postaci kompleksu z tymi białka¬ 
mi, a jego dyfuzję do mioplazmy pod wpływem im¬ 


pulsu nerwowego poprzedza zmiana konformacji 
białka, umożliwiająca uwolnienie wapnia w formie 
zjonizowanej. 

Wkrótce po zwróceniu uwagi na rolę wapnia w pro¬ 
cesie skurczu zauważono, że hydroliza ATP i super- 
precypitacja aktomiozyny wymagają obecności jo¬ 
nów wapnia tylko wówczas, gdy białka kurczliwe nie 
były poddawane dokładnemu oczyszczaniu. W latach 
1963-66 S. Ebashi z uniwersytetu w Tokio wykazał, 
że funkcję „uczulania” aktomiozyny na zmiany stę¬ 
żenia jonów wapnia spełniają dwa inne białka: tro- 
pomiozyna, której obecność w mięśniu znana była 
już wcześniej, oraz białko odkryte przez Ebashiego 
i nazwane przez niego troponiną. 

Troponina jest jedynym białkiem miofibrylarnym, 
które wiąże i uwalnia wapń w zakresie jego fizjolo¬ 
gicznych stężeń w mioplazmie. Sama troponina nie 
wywiera jednak żadnego wpływu na aktomiozynę, 
dopiero w połączeniu z tropomiozyną wykazuje zdol¬ 
ność uczulania wysoce oczyszczonych preparatów 
aktomiozyny na zmiany stężenia wapnia, tzn. powo¬ 
duje hamowanie ich aktywności ATP-azowej i super- 
precypitacji gdy stężenie wolnych jonów wapnia nie 
przekracza 10 -45 mol/l. Już te wstępne informacje 
wskazywały na to, że bodziec nerwowy jest — za 
pośrednictwem uwolnionego z siateczki sakroplazma- 
tycznej wapnia — odbierany przez troponinę i prze¬ 
kazywany przez nią białkom kurczliwym przy udzia¬ 
le tropomiozyny. 

Zdolność wiązania tropomiozyny i troponiny, któ¬ 
rą ma aktyna, a której miozyna nie posiada, była 
pierwszą wskazówką, że oba te białka są zlokalizo¬ 
wane w cienkich filamentach. Potwierdziły to badania 
immunochemiczne, w których się wykorzystuje spe¬ 
cyficzną reakcję przeciwciała z jego antygenem. Oglą¬ 
dając w mikroskopie elektronowym podłużne skraw¬ 
ki mięśni potraktowane przeciwciałem na tropomio- 
zynę, stwierdzono równomierną reakcję przeciwciała 
z filamentami cienkimi na całej ich długości. Nato¬ 
miast obserwacje w mikroskopie elektronowym z za¬ 
stosowaniem normalnej techniki kontrastowania pre¬ 
paratów białkowych nie wykazywały różnic w struk¬ 
turze filamentów otrzymanych przez polimeryzację 
czystej aktyny i filamentów aktynowych zawierają¬ 
cych tropomiozynę. Zaproponowany przez J. Han- 
son i J. Lowy ł ego model rozmieszczenia tropomiozy¬ 
ny na fi lamencie aktynowym godzi te pozornie 
sprzeczne obserwacje. Cząsteczka tropomiozyny 
zbudowana jest z dwóch łańcuchów polipeptydowych 
o masie ok. 34 000 daltonów, posiadających konfor¬ 
mację heliksu a i zwiniętych wokół siebie w superheliks 
(podobnie jak to ma miejsce w wypadku ciężkich łań¬ 
cuchów miozyny w pałeczkowatej części cząsteczki 
miozynowej); długość cząsteczki wynosi 40 nm, 
a średnica — zaledwie 2 nm. W roztworach o niskiej 
zawartości soli cząsteczki tropomiozyny polimeryzują 
łącząc się „koniec z początkiem”. Według sugestii 
Hanson i Lowy’ego dwa łańcuchy tak połączonych 
cząsteczek tropomiozyny, nawinięte na aktynowy 
trzon filamentu, mieszczą się w rowkach podwójnego 
heliksu, który tworzą łańcuchy monomerów akty¬ 
ny (rys. 13), i dlatego nie są widoczne w mikrosko- 
pie. 

Pierwsze informacje o rozmieszczeniu troponiny 
na filamencie cienkim uzyskano także przy użyciu 
przeciwciała na to białko. Przeciwciało przyłącza się 
do cienkich filamentów w regularnych odstępach, rów¬ 
nych długości cząsteczki tropomiozyny, a znacznie 
przekraczających wymiary globularnej cząsteczki 
troponiny. Uznano więc, że regularne rozmieszczenie 
troponiny wzdłuż filamentu cienkiego (rys. 13) jest 
wynikiem wiązania się jej z tropomiozyną w jednym 
tylko miejscu, które według najnowszych badań znaj¬ 
duje się w odległości ok. 14 nm od karboksylowego 
końca cząsteczki tropomiozyny. 

Bardziej szczegółowych informacji o strukturze 
cienkich filamentów dostarczyły badania włóknistych 
agregatów, powstających w pewnych warunkach 
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przez połączenie równolegle do siebie ułożonych fila- nia z miozyną siedmiu monomerów aktynowych po- 
mentów. Agregaty filamentów czystej aktyny (il. 125a, zostających w kontakcie z tą samą cząsteczką tropo- 
tabl. 31) wykazują prążkowanie o okresie 36 nm, od- miozyny. 



Rys. 13. Model cienkiego filamentu (C. Cohen). Symbolami TNI, TNC i TNToznaczono trzy składniki białkowe wchodzące w skład 
cząsteczki troponiny 


badanie powiadające skokowi podwójnego heliksu łańcuchów 
agregatów monomerów w filamencie, co świadczy o połączeniu 
filamentów filamentów na odpowiednich poziomach ich spiralnej 
aktyny struktury. Na obrazach agregatów filamentów zawie¬ 
rających tropomiozynę i troponinę (il. 125b, tabl. 31) 
okres śrubowej struktury aktyny ulega zatarciu wsku¬ 
tek pojawienia się innego rodzaju prążkowania, 
o okresie 38,5 nm. W świetle wyników uzyskanych 
przy użyciu przeciwciał to nowe prążkowanie należy 
przypisać periodycznemu rozmieszczeniu troponiny. 
W ten sposób wyjaśniło się również nie znane dotąd 
pochodzenie południkowych refleksów o okresie 
38,5 nm, występujących na rentgenogramach żywego 
mięśnia. 

Dzięki regularności ułożenia filamentów w ich 
agregatach można badać ich strukturę metodą op¬ 
tycznej dyfrakcji na wykonanych w mikroskopie 
elektronowym zdjęciach agregatów. Analizując roz¬ 
kład i natężenie refleksów na otrzymanych obrazach 
dyfrakcyjnych, można metodą transformacji Fouriera 
obliczyć funikcję rozkładu gęstości optycznej, 
a z niej — określić przestrzenny rozkład masy cząste¬ 
czek białkowych w filamencie i wykonać trójwymiaro¬ 
wą rekonstrukcję filamentu. W ten sposób udało się 
nie tylko potwierdzić (w pewnych szczegółach nawet 
skorygować) przedstawiony wyżej model cienkiego 
filamentu, lecz również zauważyć zmiany w strukturze 
filamentu zachodzące pod wpływem wiązania wapnia 
przez troponinę. Okazało się, że w nieobecności jo¬ 
nów wapnia łańcuchy cząsteczek tropomiozyny prze¬ 
biegają nie przez środek, lecz wzdłuż krawędzi row¬ 
ków między łańcuchami monomerów aktyny (rys. 
14a). Obecność jonów wapnia powoduje niewielkie 
przesunięcie cząsteczek tropomiozyny ku centrum 
rowka, z jednoczesnym odsunięciem środka ich masy 
od aktynowego trzonu filamentu. 

Z zaproponowanych dotychczas modeli najlepiej tę 
zmianę ilustruje schemat przedstawiony na rys. 14b. 
Przy konstruowaniu tego modelu uwzględniono dwu- 
łańcuchową budowę cząsteczki tropomiozyny i zało¬ 
żono, że przesunięcie jest wynikiem rotacji cząsteczki 
wokół jej osi. Z przeprowadzonych analiz wynika, że 
sumaryczne przesunięcie tropomiozyny wynosi 1,5 
nm. Do podobnego wniosku skłaniają wyniki analizy 
rentgenograficznej mięśni w stanach spoczynku i skur¬ 
czu. 

mechanizm Na podstawie tych obserwacji przypuszcza się, że 
regulacji mechanizm regulacji cyklu skurczowo-rozkurczowego 
skurczu jest następujący: tropomiozyna w pozycji rozkurczo¬ 
wej (na krawędzi rowka między łańcuchami aktyny) 
blokuje przestrzennie miejsce reagowania aktyny 
z miozyną (rys. 15). Wapń uwolniony z siateczki sar- 
koplazmatycznej jest wiązany przez troponinę, co 
powoduje zmianę konformacji troponiny (obecnie 
jest już na to wiele dowodów eksperymentalnych). 
Wskutek tej zmiany następuje przemieszczenie tro¬ 
pomiozyny i odsłonięcie regionu niezbędnego dla wy¬ 
tworzenia połączenia aktyny z mostkami miozyno- 
wymi. W ten sposób troponina — mimo jej periodycz¬ 
nego rozmieszczenia na filamencie — może kontrolo¬ 
wać stan wszystkich monomerów aktynowych: jedna 
cząsteczka troponiny reguluje zdolność do reagowa- 



Rys. 14. Schemat przekroju poprzecznego przez cienki filament 
ilustrujący zmianę pozycji tropomiozyny TM w cyklu skurczo- 
wo-rozkurczowym: a) w nieobecności jonów wapnia, b) po zwią¬ 
zaniu wapnia przez troponinę (wg D. A. D. Parry’ego) 



Rys. 15. Schematyczne przedstawienie wpływu pozycji tropo¬ 
miozyny w filamencie cienkim na oddziaływanie aktyny z mostka¬ 
mi miozynowymi. Linią przerywaną zaznaczono pozycję „roz¬ 
kurczową”, blokującą miejsce interakcji z mostkiem miozyno- 
wym (modyfikacja schematu T. Wakabayashiego i in.) 
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W tej chwili nie wiadomo jeszcze, czy postulowa¬ 
na uprzednio konformacyjna zmiana w cząsteczkach 
tropomiozyny jest powodem ich przesunięcia na fila- 
mencie aktynowym. Istnieje alternatywna możliwość, 
że skurczowa pozycja tropomiozyny — bliżej cen¬ 
trum rowka—jest termodynamicznie bardziej ko¬ 
rzystna od pozycji spoczynkowej. W tym wypadku 
zmiana konformacji troponiny w następstwie zwią¬ 
zania przez nia wapnia powodowałaby uwolnienie 
tropomiozyny z termodynamicznie mniej korzystnej 
pozycji, bez zmiany konformacji cząsteczki tropo- 
miozyny. Druga z wymienionych możliwości wydaje 
się bardzo prawdopodobna w świetle obecnych wia¬ 
domości o mechanizmie reagowania troponiny w cien¬ 
kim filamencie na zmiany stężenia jonów wapnia. 

Dla uproszczenia pominięto w dotychczasowych 
rozważaniach fakt, że troponina zbudowana jest 
z trzech podjednostek o odrębnych własnościach, po¬ 
łączonych w stosunku molowym 1:1:1. Składnik 
zwany TNI, o masie 23 000 daltonów (w mięśniach 
szkieletowych królika; w różnych typach mięśni 
i u różnych zwierząt ciężary cząsteczkowe podjedno- 
połączenie stek troponiny nieco się różnią), w obecności tropo- 
trcponiny miozyny hamuje reakcję aktyny z miozyną niezależnie 
z filamentem od stężenia jonów wapnia w środowisku. Składnik 
TNC, o masie 19 000 daltonów, jest tym składnikiem, 
w którym są zlokalizowane miejsca wiązania wapnia 
z troponiną, a w obecności trzeciego składnika, TNT, 
o masie 39 000 daltonów, powoduje zniesienie hamu¬ 
jącego działania TNI, jeżeli stężenie wolnych jonów 
wapnia przekracza 10 -5 mol/l. Wyniki szczegółowych 
badań nad zdolnością reagowania poszczególnych 
podjednostek troponiny z tropomiozyną i aktyną 
sugerują, że cząsteczka troponiny ma dwa miejsca 
przyłączenia do cienkiego filamentu (rys. 16): połą¬ 
czenie przez TNT jest trwałe niezależnie od stężenia 
jonów wapnia w środowisku, natomiast drugie połą¬ 
czenie, przez TNI, dochodzi do skutku tylko w nieo¬ 
becności jonów wapnia. Ponieważ TNC nie wiąże się 
bezpośrednio ani z aktyną, ani z tropomiozyną, a jest 
jedynym składnikiem troponiny wiążącym wapń, 
zmiana stężenia jonów wapnia musi wpływać na wią¬ 
zanie TNI z aktyną i (lub) tropomiozyną przez zmianę 
konformacji TNC. Jednoczesne istnienie obu połą¬ 
czeń (przez TNT i przez TNI) utrzymuje tropomio- 
zynę w pozycji blokującej miejsce reagowania aktyny 


Biomechanika mięśni 

Kazimierz Fideius, Krzysztof Kędzior i Adam Morecki 

zgromadzonego w ciągu ostatnich stukilkudziesięciu 
lat, a z drugiej strony — z wyników w dziedzinie mo¬ 
delowania matematycznego i symulacji systemów 
uzyskanych ostatnimi czasy. 

Analizę ruchu można przeprowadzić opierając się analiza ruchu 
wyłącznie na podstawach anatomicznych i fizjologicz¬ 
nych oraz obserwując zewnętrzne przejawy ruchu. 

Metodami służącymi do takiej obserwacji są: technika 
filmowa i elektromiografia (rejestracja elektrycznych 
potencjałów mięśniowych). Ten kierunek badawczy 
otrzymał nazwę kinezjologii. Można także, korzysta¬ 
jąc z metod i praw mechaniki ciał sztywnych i od¬ 
kształca lnych, opisywać ruch (np. ruch ciała ludzkie¬ 
go lub jego części, czy przepływ cieczy w naczyniach) 
w postaci zależności matematycznych. Jest to podej¬ 
ście charakterystyczne dla współczesnych badań bio- 
mechanicznych. W razie potrzeby opis matematyczny 
obejmuje także towarzyszące zjawiskom mechanicz¬ 
nym zjawiska elektryczne, cieplne i inne. Na podsta¬ 
wie takich badań proponuje się różne modele orga¬ 
nizmu, jego części, narządów wewnętrznych i zew¬ 
nętrznych, które by wyjaśniły m.in. zagadnienia koor¬ 
dynacji ruchu. 

W ostatnich latach biomechanika rozwija się 
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Przedmiotem biomechaniki jest badanie ruchu orga¬ 
nizmów żywych, a w szczególności człowieka, przy 
korzystaniu z praw mechaniki. Zakres badań biome- 
chanicznych obejmuje zarówno mechaniczne jak 
i biologiczne aspekty ruchu. W organizmach żywych 
poruszają się nie tylko poszczególne części ciała, lecz 
również organy wewnętrzne, ciecze w naczyniach 
krwionośnych i limfatycznych, powietrze w układzie 
oddechowym itp. Strona mechaniczna tych ruchów 
jest jeszcze mało zbadana. Stosowanymi metodami 
badawczymi są analiza i synteza ruchu prowadzone 
na podstawie pomiarów różnych jego parametrów 
i charakterystyk: kinematycznych, dynamicznych 
i regulacyjnych. Bardzo pomocne przy tych badaniach 
jest modelowanie układów ruchu i układów sterowa¬ 
nia ruchem. 

Rozwój nauk biologicznych, medycznych i cyber¬ 
netyki wpływał i wpływa na rozwój biomechaniki. 
Ponieważ omawiana dziedzina ma charakter inter¬ 
dyscyplinarny, do rozwiązywania powstających za¬ 
gadnień potrzebne są zespoły grupujące badaczy 
o różnym przygotowaniu zawodowym. Teoria bio¬ 
mechaniki formująca się od niedawna korzysta z jed¬ 
nej strony z ogromnego materiału doświadczalnego, 


z miozyną. Rozerwanie połączenia przez TNI przy 
wzroście stężenia wapnia powoduje przemieszczenie 
tropomiozyny (być może właśnie wskutek zwolnienia 
jej z termodynamicznie niekorzystnej pozycji) i umoż¬ 
liwia reagowanie aktyny z miozyną. Taki mechanizm 
najlepiej tłumaczy dotychczas poznane fakty do¬ 
świadczalne, nie można jednak wykluczyć pewnych 



Rys. 16. Schemat regulacji cyklu skurczowo-rozkurczowego przez 
troponinę i wapń 


Opisany mechanizm regulacji cyklu skurczowo- 
rozkurczowego jest charakterystyczny dla mięśni 
szkieletowych kręgowców. W mięśniach wielu zwie¬ 
rząt niższych nie znaleziono troponiny, najprawdo¬ 
podobniej też białko to nie występuje w mięśniach 
gładkich kręgowców. Istnieją dowody przemawiające 
za tym, że w mięśniach gładkich rolę akceptora jonów 
wapnia podczas skurczu odgrywa jeden z lekkich 
łańcuchów miozyny. 

Dokładniejsze omówienie różnic w budowie mi¬ 
kroskopowej wszelkich typów mięśni oraz moleku¬ 
larnej organizacji i funkcjonowania ich białek struk¬ 
turalnych i regulujących przekracza ramy tego arty¬ 
kułu. Mimo różnic w charakterystycznych właści¬ 
wościach poszczególnych typów mięśni, podstawą mechanizm 
mechanizmu skurczu wszystkich mięśni jest reago- skurczu 
wanie ze sobą filamentów miozynowych i aktyno- wszystkich 
wych w trakcie hydrolizy ATP — źródła energii dla mięśni 
skurczu, oraz regulacja tego procesu poprzez zmiany 
stężenia jonów wapnia. 







w trzech podstawowych kierunkach: mechanika 
człowieka traktowanego jako całość, mechanika 
kończyn człowieka i mechanika sterowania ruchem 
człowieka lub jego poszczególnych części ciała. Roz¬ 
wijają się także zastosowania w medycynie, technice 
i sporcie. Stąd rozróżnia się biomechanikę medyczną, 
inżynierską i ćwiczeń sportowych, 
główne Systemowe ujęcie głównych układów człowieka 
układy uczestniczących w ruchu pokazano na rys. 1. Model 
ruchu przedstawiony na tym rysunku składa się z trzech 
człowieka podstawowych układów, a mianowicie: ruchu, stero¬ 
wania i zasilania. Czwarty układ reprezentuje środo¬ 
wisko, z którym współdziała cały system. Ogólne 
sprzężenia oraz wpływy zewnętrzne i wewnętrzne w 
układach zaznaczono na rysunku odpowiednimi 



Rys. 1. Schemat blokowy głównych układów współuczestniczą¬ 
cych w ruchu organizmu, gdzie propriorccepcja oznacza infor¬ 
macje od receptorów czucia własnego mięśni, ścięgien i stawów, 
eksterorecepcja — informacje o stanie środowiska zewnętrznego 
(wzrokowa, słuchowa, powonienia, dotyku itp.), wiscerorecep- 
cja — informacje płynące od trzew (viscera), ciśnienie krwi, stę¬ 
żenie C0 2 itp. 

strzałkami. Układ ruchu składa się z aparatów: kost¬ 
no-stawowego i mięśniowego. Układ sterowania we 
współczesnym ujęciu jest hierarchicznym, kilkupozio- 
mowym układem, w którym, przy ogólnie obowiązu¬ 
jącej centralizacji sterowania, poszczególne poziomy 
mają określony stopień autonomii. Bodźce ruchowe 
są przesyłane do poszczególnych tzw. aktonów mięś¬ 
niowych wywołujących ruch w stawach. Wyjścia tego 
układu są jednocześnie wejściami do środowiska zew¬ 
nętrznego. Informacje o stanie środowiska są prze¬ 
kazywane przez telereceptory i kontaktoreceptory, 
a informacje o stanie układu ruchu — przez proprio- 


receptory do układu sterowania. Układ zasilania po¬ 
biera pokarm i powietrze z otoczenia, przetwarzając 
pokarm na substancje energetyczne i powietrze, oraz 
rozprowadza substancje energetyczne i tlen. Tak ujęty 
model działalności ruchowej człowieka umożliwia 
przeprowadzenie różnych analiz jego działania w roz¬ 
maitych sytuacjach ruchowych. Szczególnym przy¬ 
padkiem działania może być działanie informacyjne 
lub energetyczne układu. Należy podkreślić, że układy 
ruchu i sterowania są stosunkowo nieźle zbadane, na¬ 
tomiast znacznie mniej jest zbadany układ zasilania. 


Układ ruchu 

Aparat kostno-stawowy 

Podamy na początek kilka szczegółowych informacji 
o kościach i stawach, gdyż wiąże się to z głównym 
przedmiotem opisu, tj. mięśniami. Liczba kości u czło¬ 
wieka jest zmienna w zależności od wieku i wynosi od 
270 u noworodka, przez 356 u ludzi młodych, do 206 
u ludzi dorosłych i w miarę starzenia się organizmu 
nadal maleje. Każda z czterech kończyn u ludzi do¬ 
rosłych ma 22 kości. Tak więc łączna liczba kości w 
kończynach wynosi 88, co stanowi ponad 40% ogól¬ 
nej liczby kości u dorosłego człowieka. Na rys. 2 po¬ 
kazano schematycznie kończyny przednie lub górne 
5 ssaków i ptaka. Nietrudno zauważyć, że poszczegól¬ 
ne kości — narysowane jako odcinki — tworzą łań¬ 
cuchy kinematyczne. Są to łańcuchy otwarte, a ich 
zamknięcie następuje np. przy unieruchomieniu ręki 
względem otoczenia lub przy zetknięciu stopy z pod¬ 
łożem, tzn. podczas ruchów lokomocyjnych i stania. 

Tak samo jest w kończynach dolnych. Liczba wszyst- | jczfca stopni 
kich ruchów (zwana liczbą stopni swobody), które swobody 
możemy wykonać w poszczególnych stawach szkiele¬ 
tu, nie interesując się zakresami ruchów i przyjmując, 
że każdy z nich można wykonać niezależnie, wynosi 
240-250. W tym kończyny górne i dolne umożliwiają 
wykonanie aż 120 ruchów, czyli ok. 50% wszystkich 
ruchów. W rzeczywistości niektóre ruchy np. palców 
u ręki oraz palców u stopy są sprzężone i trudno jest 
wykonywać niezależne ruchy poszczególnych części 
palca. 

Stawy są tak rozmieszczone, że położone najbliżej rozmieszcze- 
tułowia stawy ramienny (rys. 2) i biodrowy umożli- n * e stawów 
wiają wykonanie trzech niezależnych ruchów. Stop¬ 
niowo przez stawy: łokciowy i promieniowo-nad- 
garstkowy w kończynie górnej oraz kolanowy i sko- 
kowo-goleniowy w kończynie dolnej, przechodzi się 
do stawów palców, które umożliwiają wykonanie tyl¬ 
ko jednego ruchu w każdym stawie. Nasuwa się natu- 


n = 7 


w = 9 



koń 



R ys . 2. — Schematy strukturalne 6 kończyn przednich lub górnych ssaków i ptaka; n liczba stawów, w liczba 
stopni swobody. V oznacza stawy, o trzech, dwóch i jednym ruchu obrotowym (czyli pary biokinema- 

tyczne klasy ///, 7K, V) 
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liczba stawów 


ralne pytanie, dlaczego spośród różnych możliwych nich latach udało się otrzymać ogólny związek opisu- 
rozwiązań ukształtował się właśnie taki a nie inny jący współzależność pomiędzy liczbą stopni swobody 
schemat strukturalny aparatu kostno-stawowego, kończyn (suma liczby stopni swobody stawów koń- 
Składa się na to wiele czynników, z których podsta- czyny) a liczbą funkcji mięśni napędzających daną 
wowy to omówiony niżej sposób napędu aparatu kończynę (suma funkcji wszystkich mięśni). Na rys. 3 
kostno-stawowego przez zespół mięśni. podano kilka charakterystycznych liczb dotyczących 

kończyn wybranych ssaków i ptaka. Przyjmując, że 
kończyna górna człowieka jest najbardziej zaawanso- 
Aparat mięśniowy wana pod względem wszechstronności rozwoju usta¬ 

lono, że związek pomiędzy liczbą stopni swobody w 
O ile układ kostno-stawowy wydaje się, przynajmniej a liczbą funkcji aktonów mięśniowych / może być 
na pierwszy rzut oka, dość przejrzysty i zbudowany aproksymowany podanym na rys. 4 równaniem, któ- 
wg określonych zasad, to zespół mięśni wywołuje wra- 



liczba funkcji aktonów mięśniowych w stawach 

Rys. 3. Zależność pomiędzy liczbą stawów a liczbą różnych funkcji aktonów mięśniowych w tych stawach 


się do tego bardzo duża liczba mięśni, człowiek ma 
ich ok. 640, które składają się łącznie z ok. 6 mld włó¬ 
kien mięśniowych i ok. 6 bilionów włókienek mięśnio¬ 
wych. 

Mięśnie dzielą się na trzy rodzaje: mięśnie szkiele¬ 
towe, czyli poprzeczne prążkowane, mięśnie gładkie 
i mięsień sercowy. Układ ruchu jest napędzany mię¬ 
śniami szkieletowymi, których człowiek ma ponad 
440. Do ich sterowania służy ponad 420 tys. komórek 
nerwowych (tzw. komórek ruchowych) znajdujących 
się w rdzeniu kręgowym. Każda z tych komórek ste- 
jednostka ruje działaniem zespołu włókien mięśniowych. Zespół 
motoryczna taki, zwany jednostką motoryczną (ruchową) zawiera 
od kilku (4-6 w mięśniach poruszających gałką oka) 
do kilkuset (640 w dużych mięśniach nóg) włókien 
mięśniowych. 

Mięśnie szkieletowe, w zależności od przebiegu 
włókien mięśniowych względem osi podłużnej mięśnia, 
dzielą się na mięśnie obłe, pierzaste, płaskie, okrężne 
aktony i inne. Niektóre mięśnie mają kilka głów lub części 
i dzieli się je wówczas na tzw. aktony, ponieważ każda 
z części mięśnia wykonuje inne funkcje w stawach, 
ponad którymi przebiega. Tak więc przez pojęcie ak- 
tonu rozumie się tę część mięśnia, której włókna są tak 
usytuowane, że rozwijają (wytwarzają) siłę w jednym 
określonym kierunku, co jest równoważne rozwijaniu 
momentu siły względem jednej z osi obrotu w stawie. 
Wiele mięśni składa się z jednego tylko aktonu. W za¬ 
leżności od sposobu działania aktonu względem osi 
stawu wyróżnia się jego następujące funkcje: prosto¬ 
wanie i zginanie (ruch w płaszczyźnie strzałkowej), su- 
pinację i pronację (ruch w płaszczyźnie poprzecznej) 
oraz przywodzenie i odwodzenie (ruch w płaszczyźnie 
czołowej). W stawach o trzech stopniach swobody 
(np. staw ramienny człowieka) występuje wszystkie 
sześć funkcji. 

Badanie rozmieszczenia mięśni szkieletowych na¬ 
suwa wniosek, że natura zastosowała tutaj bardzo 
skomplikowany system, który nie poddaje się łatwo 
analizie. Jak wynika z zależności przedstawionych na 
rys. 3, w organizmach o strukturach prostych wystę¬ 
puje niewielkie zróżnicowanie funkcji. W strukturach 
rozwiniętych rozkład możliwych funkcji jest bardziej 
zróżnicowany. Świadczy to o przystosowaniu danej 
kończyny do wypełniania różnych funkcji. W ostat- 



Rys. 4. Zależność pomiędzy liczbą stopni swobody kończyn w 
a liczbą funkcji / aktonów różnych zwierząt; p kończyna przed¬ 
nia, / kończyna tylna. Zależność ta ma postać tzw. krzywej lo¬ 
gistycznej 

rego wykres ma postać tzw. krzywej logistycznej. Ta 
prawidłowość pozwala na wyciągnięcie różnych wnio¬ 
sków natury biologicznej i technicznej. 


Rodzaje mięśni i ich możliwości 


Ewolucja mięśni 

U zwierząt jednokomórkowych narządem ruchu są wilki, 
różnego rodzaju witki i rzęski, wewnątrz których znaj- rzęski 
dują się nici aktyny i miozyny (-► Molekularne pod- i mięśnie 
stawy skurczu mięśnia). Zwierzęta wielokomórkowe 
mają bardziej urozmaicony aparat ruchowy, w którym 
nitki aktyny i miozyny otoczone sarkoplazmą grupują 
się, tworząc włókna mięśniowe i mięśnie. Mięsień, 
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zgodnie z III zasadą dynamiki Newtona, może rozwi¬ 
jać siłę (akcja), jeśli na końcach jego przyczepów lub 
wewnątrz jam ciała, które otacza, będzie występować 
opór (reakcja). 


przetyk\ 


mięśnie podłużne 


mięśnie okrężne 
(poprzeczne) 



Rys. 5. Rozmieszczenie mięśni gładkich: a) ukwiaia końskiego, 
b) w żołądku człowieka 


aparaty Niżej rozwinięte zwierzęta, np. jamochłony i pła- 
ruchowe zińce poruszają się całym ciałem, które tworzy wór 
różnych skórno-mięśniowy. Pasma włókien mięśniowych bieg- 
zwterząt ną u nich w różnych kierunkach, powodując wydłu¬ 
żanie się lub grubienie całego ciała, zwieranie otworu 
gębowego lub wciąganie do wewnątrz niektórych 
części ciała albo pokarmu (rys. 5). U skorupiaków 
mięśnie są już bardzo dobrze rozwinięte, do czego 
przyczynia się niewątpliwie obecność twardej skorupy. 
Małże np. posiadają silne zwieracze dwu połówek 
muszli, która je otacza; ślimak natomiast posiada 
„nogę” przytwierdzoną pośrednio do skorupy, dzię¬ 
ki której może się, wprawdzie bardzo powoli, poru¬ 
szać. 

U stawonogów obserwuje się duże różnice w budo¬ 
wie aparatu ruchowego w porównaniu ze zwierzętami 
niższymi. Po pierwsze, niższe od nich formy poruszają 
się bez udziału specjalnych części ciała zwanych koń¬ 
czynami (nogami). Występujące u nich witki, rzęski 
a nawet „noga” ślimaka są tylko pseudonogami, po- 



Rys. 6. Schemat działania mięśni u owadów: a) mięśnie porusza¬ 
jące skrzydłami 1. W rzeczywistości poruszają one tułowiem 
i znajdującą się na nim płytką grzbietową. Mięśnie poprzeczne 2 
powodują ruch skrzydeł ku górze a mięśnie podłużne 3 — do 
dołu. b) Budowa stawu nogi owada. Człony chitynowc 4 połą¬ 
czone tkanką wiotką tworzą staw J, poruszany znajdującymi 
się wewnątrz mięśniami 6 


nie potrafią rozwinąć dużej mocy mechanicznej, nie¬ 
zbędnej np. do latania w powietrzu. U stawonogów 
za to pojawiają się: twardy zewnętrzny szkielet chity- 
nowy oraz najbardziej sprawne żywe silniki — mięśnie 
poprzecznie prążkowane (rys. 6). 


Mięśnie szkieletowe 

Mikroskopowa budowa mięśnia szkieletowego wska- budowa 
żuje, że składa się on z setek lub tysięcy równoległych mikroskopo- 
komórek — włókien mięśniowych otoczonych współ- wa 
ną osłoną. Na obu końcach mięsień przechodzi w 
ścięgna, które łączą się z kośćmi szkieletu (rys. 7). 



Rys. 7. Budowa mięśnia poprzecznie prążkowanego: a) mięsień, 
b) wycinek mięśnia, c) włókno mięśniowe, na którym widać 
prążki poprzeczne oraz włókienka, d) sarkomer (który ograni¬ 
czają linie Z) przed skurczem, e) sarkomer w stanie skurczu 


Włókno mięśniowe z kolei składa się z zespomw włó- włókno 
kienek mięśniowych (miofibryli) osłoniętych owłó- mięśniowe 
knią mięśniową, która jest cienką (ok. 2,5 pm) przej¬ 
rzystą błoną (rys. 7b). Miofibryle są elementami kurcz¬ 
liwymi włókien mięśniowych, które występują we 
włóknach mięśni gładkich, mięśnia sercowego i mięśni 
szkieletowych. W tych ostatnich i w mięśniu serco¬ 
wym mają one budowę prążkowaną nadającą charak¬ 
terystyczny wygląd całemu włóknu obserwowanefnu 
pod mikroskopem. Włókno mięśniowe ma średnicę 



'organ Golgiego 
łopatka. 


jądro 


mięsten 

'-.dwugłowy 


ramienia 


z ■ z 


biegun kurczliwy 
wrzeciona 


kosc ramienna 


komórka 

Renshawa 


komórki 
ćiowe 


substancja 
szara rdzenia 
kręgowego 


Rys. 8. Działanie stawu łokciowego i schemat połączeń mięśnia 
dwugłowego ramienia z rdzeniem kręgowym; Fi siła rozwijana 
przez mięsień, r« promień siły mięśniowej, F z obciążenie zewnętrz¬ 
ne stawu, R promień siły Fz 


nieważ nie mają własnego szkieletu. Po drugie, poru¬ 
szają się one za pomocą mięśni gładkich, które są po¬ 
wolne, choć bardzo wytrzymałe na zmęczenie. Mięśnie 
te nie potrzebują twardego szkieletu, ale równocześnie 
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10-100 pm i długość 3-5 a nawet 12 cm. Miofibryle 
mają grubość ok. 0,5-2 pm (rys. 7c) i składają się 
z setek elementów strukturalnych, tzw. filamentów, 
które z kolei składają się z łańcuchów cząsteczek biał¬ 
kowych rozmieszczonych wg ściśle określonego planu 
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(rys. 7d) (-*» Molekularne podstawy skurczu mięśnia). 
Badania ultracienkich preparatów mięśniowych me¬ 
todą mikroskopii elektronowej wykazały, że miofibry- 
le są zbudowane z dwóch rodzajów filamentów, a mia¬ 
nowicie grubszych (miozynowych) o średnicy ok. 
1000 nm i długości 1,5 jim i cienkich (aktynowych) 
o średnicy 400-550 nm i długości 2 pm. Jak wynika 
z rys. 7d, filamenty w mięśniach poprzecznie prążko¬ 
wanych częściowo pokrywają się i w rezultacie prążki 
A są widoczne w strefach nakładania się cienkich 
i grubych filamentów, prążki I odpowiadają nakła¬ 
daniu się tylko cienkich, a strefy H — nakłada¬ 
niu się grubych filamentów. Wąskie pasmo rozdzie¬ 
lające na połowę cienkie filamenty odpowiada tzw. 
linii Z. 

Mięśnie szkieletowe kręgowców mają bardzo różne 
kształty: obłe, czworoboczne, trójkątne, wachlarzo- 
wate, okrężne itp. Poruszane przez nie kości wykonują 
ruchy obrotowe w stawach. Na rys. 8 pokazany jest 
dla przykładu staw łokciowy człowieka poddany ob¬ 
ciążeniu siłą F z . 

Jest jednak pewna odrębna grupa mięśni poprzecz¬ 
nie prążkowanych, która podczas skracania się wy¬ 
wołuje zmianę ciśnienia w obrębie jam naszego ciała. 
Jama ustna jest otoczona mięśniami, których praca 
wywołuje ciśnienie ujemne (zassanie) lub dodatnie 
(dmuchanie). Podobnie działają mięśnie otaczające 
klatkę piersiową oraz jamę brzuszną (rys. 9). Pierwsze 
zapewniają wdychanie i wydychanie powietrza z płuc, 
ale oddychanie może się również odbywać przy ak¬ 
tywnym udziale mięśni brzucha. Łatwo to wyczuć, 
np. podczas kaszlu. Jednak główne zadanie mięśni 
brzucha polega na utrzymaniu narządów na właści¬ 
wym miejscu oraz usztywnianiu tułowia podczas prze¬ 
kazywania pędu z kończyn dolnych lub górnych na 
resztę ciała człowieka. Narządy wewnętrzne, takie jak : 
serce, wątroba, żołądek lub jelita wypełnione płynami 
mają masy rzędu 1 kg (np. serce ok. 0,5 kg, wątroba 
ok. 2 kg). Przyspieszenie ciała wynosi np. przy skoku 
wzwyż 2-3 g (g — przyspieszenie ziemskie), co wy¬ 
wołuje pojawienie się dużych sił bezwładności działa¬ 
jących na te narządy. Siły bezwładności są równowa¬ 
żone przez zwiększone ciśnienie w jamach ciała. 



a) b) 

Rys. 9. Schemat działania mięśni jamowych: A klatki piersiowej, 

B jamy brzusznej; / mięsień prosty brzucha, 2 przebieg włókien 
mięśni skośnych zewnętrznych i wewnętrznych oraz mięśnia po¬ 
przecznego brzucha. 3 mięśnie międzyżebrowe, 4 kręgosłup wraz 
z żebrami, 5 miednica, 6 mostek, 7 przepona moczopłciowa, 
^przepona piersiowa 

Szkielet tułowia człowieka ma 51 kości i 49 stawów, 
które mają łącznie 104 stopnie swobody. Przy wielu. 
ruchach cały ten układ musi być usztywniony przez 
mięśnie poprzecznie prążkowane w celu przenoszenia 


sił działających na kończyny. Odbywa się to zarówno 
podczas odbicia nogami (skok, bieg, chód), jak i pod¬ 
czas rozwijania dużych sił za pomocą kończyn gór¬ 
nych (zwisy, podnoszenie ciężarów itp.). 

Przebieg włókien nerwowych między rdzeniem krę¬ 
gowym a mięśniami szkieletowymi, na przykładzie 
mięśnia dwugłowego ramienia pokazano na rys. 8. 
Włókna mięśniowe są pobudzane z komórek rucho¬ 
wych rogów rdzenia czyli komórek i włókien a. Infor¬ 
macja o długości i prędkości skracania mięśni prze¬ 
biega do rdzenia od środkowego odcinka wrzeciona 
mięśniowego (włókna a x i a 2 ). Układ nerwowy uzysku¬ 
je informację o sile rozwijanej przez mięsień od orga¬ 
nów Golgiego, które znajdują się w ścięgnach mięśni. 
Wrzeciona mięśniowe biegną równolegle do włókien 
mięśniowych. Na biegunach mają one części kurczli¬ 
we, które skracają się pod wpływem bodźców wysy¬ 
łanych z komórek y. Skurcz części biegunowej powo¬ 
duje rozciąganie części środkowej wrzeciona i 
wytwarzanie impulsów przekazywanych do rdzenia 
kręgowego. 

Jednostki motoryczne mięśnia szkieletowego dzia¬ 
łają zgodnie z zasadą „wszystko albo nic” (prawo 
Bowditcha), co oznacza, że rozwijają one maksymal¬ 
ną siłę na jaką je aktualnie stać, lub że ich naprężenie 
aktywne jest równe zeru. Takie działanie czyni mię¬ 
sień szkieletowy mało przydatnym do utrzymania 
ciała w położeniu statycznym. Szkielet zewnętrzny 
stawonogów utrzymuje ciało w bezruchu bez udziału 
mięśni, natomiast wewnętrzny szkielet kręgowców 
wymaga stałego napięcia mięśni dla utrzymania pos¬ 
tawy. Jeśli uśpić pająka za pomocą chloroformu, to 
będzie on stał nadal. Uśpienie kręgowca spowoduje 
natomiast jego przewrócenie się. Ze względu na wa¬ 
runki statyki ciała, mięsień szkieletowy jest zatem 
lepiej dostosowany do funkcji pełnionych u stawono¬ 
gów, u których pierwotnie się wykształtował, niż 
u kręgowców. Wspomniana wyżej, niejednoczesna 
praca jednostek motorycznych u kręgowców wystę¬ 
puje również u stawonogów, u których jednak cały 
mięsień jest unerwiony przez jedną komórkę ruchową 
i dlatego proces koordynacji (sterowania) ruchu jest 
u nich znacznie ułatwiony. 

Prawie połowa masy ciała człowieka składa się 
z mięśni i wszystkie nasze czynności zewnętrzne wy¬ 
konywane są za ich pośrednictwem. Mięsień jest ma¬ 
szyną biochemiczną pracującą w stałej temperaturze. 
Nawet izolowany, utrzymywany sztucznie poza orga¬ 
nizmem mięsień może podnieść ciężar o masie 2000 
razy większej od jego własnej. Mięśnie dwugłowy ra¬ 
mienia ( biceps ) i ramienny (brachialis) u dobrze zbu¬ 
dowanego mężczyzny mają masę 200-300 g. Podczas 
pojedynczego skurczu wykonują one pracę równą 
pracy podniesienia masy 1 kg na wysokość 90 m. 
Przy pojedynczym skurczu temperatura tych mięśni 
podnosi się o ok. 0,003°C. Przy każdym skurczu 
znaczna część energii chemicznej zostaje zamieniana 
na ciepło i rozproszona. Należy podkreślić, że energia 
skurczu przewyższa ponad 1000 razy energię pobu¬ 
dzenia w mięśniu. Na ogół mięśnie pracują w nieko¬ 
rzystnych warunkach mechanicznych, przy przełoże¬ 
niach dźwigni kostnych w stosunku ok. 10:1 (rys. 8). 
Tracąc na sile, wywołują one w stawach duże pręd¬ 
kości kątowe. Pomimo to można przez okres kilku 
sekund utrzymać w dwóch rękach, przy poziomej 
pozycji przedramienia, przedmiot o ciężarze 900 N. 
Siła rozwijana przez mięśnie musi być w tym położeniu 
10 razy większa, czyli wynosić 9000 N. Podnoszona 
masa jest prawie 2000 razy większa od masy pracują¬ 
cych mięśni. Jako ciekawostkę można podać, że naj¬ 
większy mięsień człowieka pośladkowy wielki ( glu - 
teous maximus) rozwija siłę 12 000 N. Sprawność me¬ 
chaniczna tej znakomitej maszyny wynosi 25% lub 
więcej podczas pracy w odpowiednich warunkach. 
Mięsień osiąga więc sprawność silnika spalinowego. 
Siła rozwijana przez pojedyncze włókno mięśniowe 
przy stosunku jego średnicy do długości jak 1:5000, 
wynosi 1-3 N, a naprężenie mięśnia wynosi 70- 
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100 N/cm 2 przekroju poprzecznego. Masa 1 kg mięś¬ 
nia może w ciągu 8 h rozwinąć moc ok. 15 W. 

Człowiek może zaangażować jednocześnie ł /; swo¬ 
ich mięśni. Gdyby natomiast te wszystkie mięśnie 
miały ten sam punkt przyczepu, to mogłyby działać 
wady z siłą 250 000 N. Niezależnie od wymienionych zalet 
mięśni mięsień szkieletowy ma również swoje wady. Jego 
szkieleto- skurcz jest bardzo gwałtowny, co powoduje koniecz- 
wych ność amortyzacji całego ruchu. Dlatego w mięśniu 
szkieletowym występują podatne elementy, takie jak 
błona Z, a zwłaszcza włókna łącznotkankowe two¬ 
rzące ścięgna mięśni. Rolę amortyzatorów u stawo¬ 
nogów pełni również szkielet chitynowy, a u kręgow¬ 
ców chrząstki stawowe. Mięsień szkieletowy, w od¬ 
różnieniu od gładkiego, musi po skurczu odpocząć, co 
uwzględnia układ nerwowy kręgowców, pobu¬ 
dzając włókna mięśniowe nie równocześnie, lecz po 
kolei — część z nich pracuje, inne odpoczywają 
Równoczesne pobudzenie prawie wszystkich włókien 
danego mięśnia w ruchach pojedynczych u kręgo¬ 
wców występuje niezmiernie rzadko, np. podczas 
gwałtownego skoku. 


Mięśnie gładkie 

Mięśnie szkieletowe są przyczepione do szkieletu ko¬ 
stnego i chrząstkowego. Mięśnie gładkie natomiast 
nie przyczepiają się do elementów sztywnych. Znajdu¬ 
ją się w ścianach przewodu pokarmowego, naczyń 
krwionośnych, układu moczowego, narządów rod¬ 
nych i dróg oddechowych. W pewnym sensie „szkie¬ 
letem” dla mięśni gładkich jest ciśnienie płynów prze¬ 
mieszczanych przez te mięśnie. 

budowa Włókna mięśni gładkich (miocyty) mają kształt 

włókien wrzecionowaty. Długość ich wynosi 30-500 pm, 
a średnica 5-10 pm. Z zewnątrz otoczone są błoną, 
a wnętrze włókna jest wypełnione sarkoplazmą, którą 
wypełniają prawie całkowicie miońbryle o średnicy 
0,2-0,3 pm. W obrębie miofibryli włókien mięśni 
gładkich występują mniejsze elementy strukturalne, 
tzw. miofilamenty o średnicy ok. 5 nm. Kilka lub kil¬ 
kanaście włókien mięśniowych tworzy pęczek. Nie¬ 
kiedy zakończenia włókien mięśni gładkich kończą się 
sprężystymi, splatającymi się ze sobą ścięgnami, dzięki 
czemu powstaje elastyczno-kurczliwy zespół, który 
reguluje wielkość przekroju przepływu płynu przez 
naczynie. 

właściwości Brak sztywnego szkieletu, do którego byłyby przy- 
mięśni łączone mięśnie gładkie oraz ich funkcja w organi- 
gładkich zmie, determinują mniejszą dynamikę ich działania. 

Nici aktyny i miozyny w mięśniach gładkich nie są 
uporządkowane przestrzennie. Dlatego nie występuje 
w nich poprzeczne prążkowanie. Brak uporządkowa¬ 
nia przestrzennego miofilamentów powoduje również 
mniejszą zmienność siły w zależności od długości 
mięśni gładkich. Ich wydłużenie względne jest większe 
niż mięśni szkieletowych. Na przykład mięśnie gładkie 
macicy w okresie ciąży wydłużają się kilkunastokrot¬ 
nie w stosunku do długości spoczynkowej. Zmiana 
siły mięśni gładkich w funkcji ich długości zależy, 
bardzo znacznie od prędkości ich rozciągania. Powol¬ 
ne rozciąganie ma niewielki wpływ na zmianę ich siły, 
natomiast szybkie ich rozciąganie powoduje istotny 
wzrost siły. 

Czynność tych mięśni jest bardziej powolna i cha¬ 
rakteryzują ją automatyczne skurcze rytmiczne. Skur¬ 
cze te odbywają się niezależnie od świadomości. Czas 
skurczu wynosi ok. 3 s, a cały cykl z okresem utajo¬ 
nym i zluźnieniem trwa do 20 s. Pracują więc one 200 
razy wolniej niż mięśnie szkieletowe. 


Mięsień sercowy 

Trzeci typ mięśnia to mięsień sercowy. Włókna mięś¬ 
nia sercowego wykazują prążkowanie podłużne i po¬ 
przeczne, przy czym prążki poprzeczne przypominają 


analogiczne prążki występujące we włóknach mięśni skurcze 
szkieletowych. Skurcz pojedynczy mięśnia sercowego serca 
reagującego na pojedynczy bodziec ma przebieg po¬ 
dobny do skurczu mięśni szkieletowych. Jednakże 
czas trwania skurczu mięśnia sercowego jest znacznie 
dłuższy. Prądy czynnościowe mięśnia sercowego są 
zazwyczaj rejestrowane za pomocą elektrod umoco¬ 
wanych w wybranych miejscach powierzchni ciała. 

Ich zapis w funkcji czasu nosi nazwę elektrokardio- 
gramu (EKG). 

W odróżnieniu od mięśni szkieletowych w mięśniu 
sercowym nie występuje zależność siły skurczu od 
wartości pobudzenia. Bodziec progowy wywołuje od 
razu maksymalny skurcz mięśnia sercowego. Skurcze 
serca są automatyczne. Częstość skurczów (zwana 
również częstością tętna) wynosi u dorosłego człowie¬ 
ka ok. 70/min. U dzieci jest ona znacznie większa 
(noworodek — 135/min, dziecko pięcioletnie — 105/ 

/min) i w miarę dojrzewania zmniejsza się stopniowo. 

W czasie dużych wysiłków częstość skurczów może 
wzrosnąć do 180/min, a u zawodników nawet do 
220/min. 

Serce pompuje bez przerwy krew — w spoczynku wydolność 
ok. 4 l/min, co stanowi ok. 2 TO 6 l/rok lub ok. 130-10 6 serca 
I w ciągu 65 lat. Podczas wysiłku wydolność serca jest 
większa, w czasie intensywnej pracy może wzrosnąć 
ośmiokrotnie w stosunku do wydolności spoczynko¬ 
wej serca. Ciśnienie w tętnicach jest wysokie, równe 
w przybliżeniu ciśnieniu słupa wody o wysokości 
1,5-1,8 m. Tak więc, w ciągu roku serce człowieka 
pozostającego w spoczynku wykonuje pracę równą 
podniesieniu ok. 2-10® 1 krwi na wysokość 1,5—1,8 m 
lub podniesieniu 340-410 1 krwi na wysokość Mount 
Everestu. U człowieka wykonującego przeciętną pracę 
serce podnosi rocznie ok. 1 t krwi na wysokość Mount 
Everestu. 


Badanie właściwości 
biomechanicznych 
mięśni szkieletowych 

Badaniami różnych właściwości mięśni zajmują się 
fizjologowie od przeszło 100 lat, a w ostatnich dwu¬ 
dziestu kilku latach do badań tych włączyli się również 
biomechanicy i inżynierowie. Wynika to ze znaczenia 
mięśni dla utrzymywania przy życiu organizmów 
żywych. Niemałe znaczenie ma również fakt, że 
mięsień jest bardzo wdzięcznym obiektem do badań. 
Starannie wypreparowany, trzymany w odpowiednim 
roztworze i odżywiany, może całymi tygodniami 
funkcjonować po oddzieleniu go od właściciela. 

Badania właściwości mechanicznych mięśni pro¬ 
wadzone są na mięśniach szkieletowych całkowicie 
izolowanych, częściowo izolowanych i w organizmie. 
Każde z tych badań wymaga stosowania odpowied¬ 
niej metodyki i odpowiednich stanowisk pomiaro¬ 
wych oraz dostarcza innych informacji. 


Badanie mięśni izolowanych 

Większość badań podstawowych jest prowadzona na 
mięśniach (lub nawet pojedynczych włóknach mięś¬ 
niowych) całkowicie izolowanych {in vitro). Warunki 
te umożliwiają bowiem wykonanie selektywnego po¬ 
miaru najważniejszych parametrów biomechanicznych 
mięśni i otrzymanie informacji o związku między 
nimi, co nie jest możliwe w organizmie żywym ze 
względu na wpływ czynników anatomicznych (np. 
mięśnie wielostawowe), a także psychicznych (moty¬ 
wacja), które zakłócają pomiar. Badania takie mają na 
celu ustalenie związku między siłą rozwijaną przez 
mięsień a jego długością, prędkością skracania lub 
wydłużania i wartością pobudzenia (bodźcem stymu- 
lacyjnym) przy obciążeniu statycznym lub dynamicz- 
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nym. Ponadto dąży się do ustalenia związków między 
wymienionymi parametrami biomechanicznymi a 
strukturą tkanki mięśnia, zjawiskami energetycznymi 
i biochemicznymi w mięśniu oraz do matematycznego 
opisu tych związków w postaci możliwie ogólnego 
modelu. 

Badania te prowadzi się na specjalnie przystoso¬ 
wanych stanowiskach, umożliwiających stworzenie 
środowiska i warunków zbliżonych do naturalnych, 
które mięsień znajduje w organizmie. Jak już wspom- 
badanie niano, mięsień wypreparowany z organizmu, a pocho- 
mięśnia dzący od zwierząt o zmiennej ciepłocie ciała (np. od 
żaby żaby) umieszczony w roztworze fizjologicznym, przez 
który przetłaczany jest tlen, pobudzany bodźcami 
elektrycznymi o odpowiednio dobranych parametrach 
(amplituda, kształt, czas trwania, czas przerw) po 
pewnym czasie „przyzwyczaja się” do nowego środo¬ 
wiska i stabilizuje swe właściwości biomechaniczne. 
Na przykład mięsień krawiecki żaby (sartoriuś), który 
jest mały (przeciętna masa kilkadziesiąt mg) i cienki, 
a przez to łatwo pobierający tlen z roztworu, ma wy¬ 
starczające zasoby energetyczne, aby nawet po kilku 
tygodniach przebywania w roztworze (wolnym od 
bakterii!) i po tysiącach skurczów nadal zachować 
swoje właściwości. Rysunek 10 przedstawia schemat 



Rys. 10. Stanowisko pomiarowe do badania charakterystyk bio- 
mechanicznych mięśnia izolowanego żaby stosowane przez ba¬ 
daczy japońskich. Badany mięsień M umieszczony jest w na¬ 
czyniu N z roztworem fizjologicznym. Wymiennik ciepła T ste¬ 
rowany przez termoregulator R utrzymuje stalą temperaturę roz¬ 
tworu. Do stymulowania mięśnia służą generator impulsów elek¬ 
trycznych G oraz dwie elektrody platynowe E zanurzone po obu 
stronach mięśnia. Jeden koniec mięśnia przyłączony jest do czuj¬ 
nika siły F, a drugi koniec do ruchomej dźwigni D z obciążnikiem 
F, której ruch jest śledzony przez urządzenie z fotokomórką FO. 
Do ustalania długości mięśnia służą zderzak Z i urządzenie mi- 
krometryczne Mk. Regulator prędkości V, który może być do¬ 
łączony do dźwigni utrzymuje stałą, zadaną prędkość skracania 
lub wydłużania mięśnia 


stanowiska do badania właściwości biomechanicz- 
nych mięśni żaby, stosowanego przez badaczy ja¬ 
pońskich. 

Pomiary podstawowych parametrów biomechanicz- 
nych mięśni izolowanych prowadzi się zarówno pod¬ 
czas tzw. skurczu izometrycznego (stała długość 
mięśnia), jak i tzw. skurczu izotonicznego (stała siła 
rozwijana przez mięsień). W żywym organizmie naj¬ 
częściej występuje skurcz auksotoniczny, w którym 
zarówno długość mięśnia, jak i jego siła zmieniają 
się równocześnie w czasie trwania skurczu, 
skurcz W odpowiedzi na otrzymany pojedynczy bodziec 
włókna (naturalny — doprowadzony drogą nerwową, lub 
mięśniowego sztuczny — z generatora), o czasie trwania kilku mili¬ 
sekund i napięciu wyższym od progowego, pojedyncze 
włókno mięśnia szkieletowego reaguje skurczem poje¬ 
dynczym, po czym wraca do spoczynku. Rysunek lla 
przedstawia zależność siły od czasu po zadziałaniu 
bodźca stymulacyjnego na utrzymywane w warun¬ 
kach izometrycznych włókno mięśniowe kręgowca. 
Przebieg pokazany na rys. lla nie jest stopniowany, 
ale jak już wspomniano zgodny z zasadą „wszystko al¬ 


bo nic”. Gdy bodziec jest wystarczająco silny, aby spo¬ 
wodować reakcję, to jest ona maksymalna. W czasie 
kilku milisekund po zadziałaniu bodźca nie obserwuje 
się odpowiedzi w' postaci siłowej, rejestruje się nato¬ 
miast zmiany potencjału błony komórkowej (rys. 11 b). 




c) 

.-znacznik podstawowy czasu 


Rys. 11. Różne charakterystyki włókna mięśniowego kręgowca 
utrzymywanego w warunkach izometrycznych: a) siła rozwijana 
w rezultacie zadziałania w chwili / = 0 bodźca stymulacyjnego, 
siła w jednostkach względnych, b) zmiany potencjału na błonie 
komórkowej włókna, c) przykład oscylogramu przedstawiający 
sumowanie się bodźców pojedynczych i powstanie skurczu tęż¬ 
cowego 


J 


0.02 s 




czas ^ 


Czas trwania skurczu pojedynczego zarówno włók- czas 
na jak i całego mięśnia zależy od temperatury i od trwania 
rodzaju mięśnia. Podobnie jak w wielu procesach bio- skurczu 
logicznych i chemicznych wzrost temperatury o 10°C 
powoduje dwu-, trzykrotny wzrost prędkości przebie¬ 
gu tego zjawiska. U ssaków czas trwania skurczu po¬ 
jedynczego jest na ogół mniejszy od 0,1 s, u owadów 
wynosi ok. 0,01 s, a u zwierząt o zmiennej ciepłocie 
ciała wydłuża się niekiedy (w niskich temperaturach) 
aż do kilkudziesięciu sekund. Tak np. mięsień uru¬ 
chamiający zęby żołądkowe raka lub mięśnie nóg żół¬ 
wia budzącego się ze snu zimow-ego, potrzebują ok. 

30 s na wykonanie pojedynczego skurczu. Mięśnie 
skrzydeł pospolitej muchy ( Phormia ) skracają się 120 
razy na sekundę, a częstość uderzeń skrzydeł dochodzi 
do kilkuset na sekundę. Rozpiętość jest więc ogromna 
i mięśnie owadów poruszają się ok. 3000 razy częściej 
niż mięśnie raka i żółwia. Na tym tle człowiek wypada 
korzystnie w porównaniu z żółwiem, ale niezbyt ko¬ 
rzystnie w porównaniu z komarem, którego skrzydła 
uderzają ok. 900 razy na sekundę. Nie potrafimy 
bowiem poruszać palcami szybciej niż 8—10 razy na 
sekundę. 

Wielkość siły rozwijanej przez cały mięsień, w prze- siła 
ciwieństwie do pojedynczego włókna mięśniowego, rozwijana 
zależy od amplitudy bodźca stymulacyjnego. Gdy przez 
przekracza ona wartość progową, notuje się słabą mięsień 
odpow-iedź mięśnia, która powiększa się aż do mo¬ 
mentu osiągnięcia przez bodziec najw-iększej wartości. 

Słabe bodźce pobudzają kilka włókien mięśniowych, 
natomiast bodziec maksymalny pobudza wszystkie 
włókna mięśniowe. Podobnie przy pobudzaniu natu¬ 
ralnym siła rozwijana przez mięsień zależy od liczby 
jego włókien zaangażowanych w wysiłek. 

Jeżeli kolejny bodziec jest doprowadzany do wJókna 
mięśniowego w trakcie trwania poprzedniego skurczu, 
to występuje zjawisko sumowania odpowiedzi siło¬ 
wych mięśnia. Przy określonej częstości bodźców zja¬ 
wisko sumowania doprowadza do wystąpienia pełne¬ 
go (tzw. gładkiego) skurczu tężcowego. Rysunek lic 
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przedstawia przebieg siły rozwijanej przez włókno 
mięśniowe kręgowca w warunkach izometrycznych 
w trakcie stymulacji o częstości najpierw rosnącej, 
a następnie — malejącej. Częstość pobudzania wy¬ 
wołująca skurcz tężcowy zależy od rodzaju mięśnia 
i od temperatury. Dla mięśni szkieletowych żaby w 
temperaturze 0°C częstość ta wynosi ok. 18 Hz, 
w temperaturze 20°C ok. 30 Hz, a dla mięśni człowieka 
ok. 50 Hz. Skurcz tężcowy trwa tak długo, jak długo 
są dostarczane bodźce lub dopóki nie nastąpi zmę¬ 
czenie mięśnia. Aby siła maksymalna nie malała, 
mięsień izolowany wymaga przeciętnie 1 min odpo¬ 
czynku na 1 s skurczu tężcowego. 

Podstawową właściwością mięśnia jest rozwijanie 
(wytwarzanie) siły. Na rys. 12 przedstawiono podsta¬ 
wową charakterystykę biomechaniczną mięśni na przy¬ 
kładzie charakterystyki uzyskanej dla izolowanego 
mięśnia krawieckiego żaby (sartorius). Charakterys- 





dlugość / = / 0 +AI, gdzie długość spoczynkowa i G = 31 mm 

Rys. 12. Charakterystyka statyczna mięśnia izolowanego 


zależność tyka ta zwana charakterystyką statyczną przedstawia 
rozwijanej zależność siły całkowitej F rozwijanej przez mięsień 
Slł ¥ (podczas izometrycznego skurczu tężcowego i przy 
od długość stałym pobudzaniu) od długości l Jest ona sumą 
składowej biernej Fb i składowej czynnej Fc , czyli 
F=Fb+Fc. Mięsień nie pobudzony, rozciągany 
powyżej długości spoczynkowej / 0 przeciwstawia się 
biernie sile rozciągającej z siłą Fb. Natomiast składo¬ 
wa czynna Fc pochodzi od aktywnie kurczących się, 
pod wpływem pobudzenia, elementów struktury 
mięśnia i jej wartość zależy od wartości bodźców 
pobudzających. 

Doświadczalnie można mierzyć składową bierną 
(rozciągając mięsień nie pobudzony) i siłę całkowitą 
(mierząc siłę rozwijaną przez mięsień pobudzony). 
Przebieg składowej czynnej Fc dla />/„ wyznacza się 
odejmując od siły całkowitej składową bierną. Dłu¬ 
gość spoczynkowa / 0 w pewnym przybliżeniu odpo¬ 
wiada długości mięśnia w pośrednim położeniu kąta 
zakresu (amplitudy) ruchu w stawie. Krzywe typu 
F — F(J ), dla których siła osiąga maksimum w okolicy 
/ 0 , a długość mięśnia może zmieniać się o kilkadziesiąt 
procent / 0 w obie strony, są typowe dla prawie wszyst¬ 
kich rodzajów mięśni: szkieletowych, sercowego 
i gładkich. Wyjątkiem są mięśnie owadów, które roz¬ 
ciągnięte o więcej niż kilka procent ulegają uszkodze¬ 
niu. Siła rozwijana przez te mięśnie maleje w miarę 
ich rozciągania, dzięki czemu mogą one wytwarzać 
ciągłe drgania, jeżeli są połączone z tułowiem owada 
i jego skrzydłami, których bezwładność i sztywność są 
odpowiednio dostrojone do sztywności i częstości 
drgań mięśni. 

ślizgowa Przebieg zależności składowej czynnej Fę od dłu- 
teona gości mięśnia można wyjaśnić na podstawie ślizgowej 
skurczu teorii skurczu zaproponowanej przez H. E. Huxleya 
i współpracowników. Na rys. 13 przedstawiono wyniki 
bardzo precyzyjnych pomiarów przeprowadzonych 
przez H. E. Huxleya i innych na preparatach pobra¬ 
nych z pojedynczych włókien mięśniowych żaby. Na 
rys. 13a i c przedstawiono schemat mikrostruktury 
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Rys. 13. Sarkomer: a) schemat mikrostruktury z podstawowymi 
wymiarami: a = 1,60 pm, b = 2,05 pm, c = 0,15-0,20 pm, z = 
= 0,05 pm), b) krzywa siły w funkcji długości (schematyczne 
przedstawienie wyników, strzałki nad wykresem wskazują różne 
etapy zachodzenia na siebie nitek, przedstawione na rys. c; 
c) kolejne etapy zachodzenia na siebie grubych i cienkich nitek 
podczas skracania się 


(por. z rys. 7d) i podano podstawowe wymiary sar- 
komeru (odległość między dwiema kolejnymi liniami 
Z). Na rys. 13b podano zależność siły czynnej Fc 
rozwijanej przez pojedyncze włókno mięśniowe w 
funkcji długości sarkomeru. Dla pojedynczego włókna 
mięśniowego zależność rozwijanej przezeń siły czynnej 
Fc = Fcif) jest liniowa odcinkami. Nieciągłości 
w punktach 1, 2,3, 4,5 i 6 wynikają z przejść między 
kolejnymi fazami współpracy nitek aktyny i miozyny. 
Dzięki wypustkom, jakie mają nitki miozyny (tzw. 
mostkom) następuje połączenie miozyny z aktyną 
z równoczesnym wzajemnym przesuwaniem się — 
ślizganiem — obu filamentów, co prowadzi do skra¬ 
cania się włókna mięśniowego. Dla mięśnia badanego 
w całości nie obserwuje się nieciągłości, charakterysty- 



siła czynna F ę 

Rys. 14. Zależność między silą rozwijaną przez mięsień a pręd¬ 
kością skracania Fdv) oraz między mocą i siłą N(F C ) 














































ki są zaokrąglone, ponieważ nawet w obrębie jednego 
włókna mięśniowego sarkomery nie kurczą się 
równomiernie. Rysunek 13c przedstawia schemat 
procesu ślizgania. 

charaktery- Na rys. 14 pokazano przykładowy przebieg podsta- 
styka wowej charakterystyki dynamicznej mięśni, czyli za- 
dynamiczna leżności między siłą czynną Fc rozwijaną przez 
mięśni mięsień a prędkością skracania mięśnia v przy okreś¬ 
lonej długości i przy stałym pobudzeniu. Dla innych 
wartości / = const i ustalonego pobudzenia przebieg 
charakterystyk ma podobny kształt. Krzywe tego 
typu otrzymuje się dla wszystkich rodzajów mięśni, 
nie tylko szkieletowych, lecz także sercowych i gład¬ 
kich, a nawet dla preparatów z nitek aktomiozyny. 
Jedynym wyjątkiem są znowu mięśnie skrzydeł owa¬ 
dów pracujące na zasadzie niewielkich drgań, a nie 
dużych zmian długości. 

Hiperboliczny przebieg zależności Fc = Fc(v) tłu¬ 
maczono początkowo, zakładając że siła rozwijana 
przez mięsień jest w rzeczywistości stała przy wszel¬ 
kich prędkościach, lecz że część tej siły jest zużywana 
na pokonanie wewnętrznych sił tarcia i lepkości w 
mięśniu, dlatego nie ujawnia się ona na zewnątrz. 
Obecnie wydaje się raczej, że na charakter tej krzywej 
decydujący wpływ ma prędkość zachodzenia reakcji 
biochemicznych w skracającym się mięśniu. Prak¬ 
tyczny wniosek wypływający z przebiegu zależności 
F c = Fc{v) jest taki, że moc mechaniczna rozwijana 
przez mięsień N — Fv osiąga maksimum w punkcie 
odpowiadającym mniej więcej jednej trzeciej wartości 
maksymalnej siły i maksymalnej prędkości. Moc ma¬ 
ksymalna rozwijana przez mięsień wynosi ok. 
0,lFmax Aby wykonać mechaniczną pracę przy 
użyciu mięśni w sposób najefektywniejszy, należy 
dobrać obciążenie zgodne z tą zasadą. Przerzutka ro¬ 
werowa jest przykładem urządzenia pozwalającego 
dopasować obciążenie i prędkość do właściwości 
mięśni, bez względu na pochylenie drogi. 

Mierząc energię doprowadzaną i odbieraną można 
określić sprawność mechaniczną mięśnia, która wy¬ 
nosi ok. 25%. Należy podkreślić, że nawet w warun¬ 
kach izometrycznych, gdy mięsień nie skraca się, 
można mówić o wykonywaniu pracy (rozwijaniu mo¬ 
cy) przez mięsień, w odróżnieniu od urządzeń tech¬ 
nicznych. 


Badanie mięśni częściowo izolowanych 
i mięśni bezpośrednio w organizmie 

Pomiary właściwości biomechanicznych mięśni częś¬ 
ciowo izolowanych są pośrednim rodzajem badań. 
Dostarczają one informacji o mięśniach naturalnie 
odżywianych i przez to znajdujących się w warunkach 
bardziej zbliżonych do naturalnych niż mięśnie izolo¬ 
wane. Z drugiej strony konieczność wykonywania 
pomiarów w ograniczonym czasie, wpływ narkozy 
i obrzęku mięśni na skutek częściowego ich obna¬ 
żenia, bardzo utrudnia pomiary i prowadzi zazwy¬ 
czaj do rozrzutu wyników. 

Na rys. 15 przedstawiono dla przykładu zestaw 
pomiarowy stosowany do badań zależności w rodzaju 
F = F(/) dla mięśni obłych i pierzastych królika pod 
narkozą (in vivo ). Badania na mięśniach pozostają¬ 
cych w organizmie {in situ ) prowadzi się między in¬ 
nymi w celu poznania zjawisk bioelektrycznych to¬ 
warzyszących skurczowi mięśni. Duża liczba włókien 
mięśniowych i ich mikroskopijne wymiary skłaniają 
badaczy do rozpatrywania i mierzenia sumarycznego 
efektu elektrycznego zespołu włókien, który można 
traktować jako miarę działania całego mięśnia. Po¬ 
miar miopotencjałów mięśni powierzchniowych (znaj¬ 
dujących się tuż pod skórą) nie wymaga bezpośred¬ 
niego dotarcia do mięśnia. Wystarczy umieszczenie 
odpowiednich elektrod na skórze w miejscu położo¬ 
nym nad mięśniem. Uzyskany w ten sposób zapis, 
elektromio- zwany elektromiogramem (EMG), jest sumą poten- 
gram cjałów pewnej liczby włókien badanego mięśnia znaj¬ 


dujących się w pobliżu elektrod. Napięcie miopoten¬ 
cjałów zawiera się w przedziale od kilku jiV do kilku 
mV. Za pomocą bipolarnych elektrod igłowych 



Rys. 15. Zestaw pomiarowy stosowany do badań częściowo izo¬ 
lowanych mięśni królika. Łapa badanego królika jest umocowana 
linkami 1 i zaciskiem 2. Badany mięsień 3 częściowo wypreparo¬ 
wany, jednym końcem odcięty od kości i przyłączony do czuj¬ 
nika siły 6 pobudzany jest bodźcami ze stymulatora 5 doprowa¬ 
dzonymi do mięśnia parą elektrod powierzchniowych. Długość 
mięśnia u- talona jest przy pomocy płytki z otworami 4. Wartość 
siły odczytywana jest na wskaźniku wzmacniacza 7 


o niewielkich wymiarach, które nie powodują odczu¬ 
walnych uszkodzeń mięśnia, można otrzymać EMG 
nawet pojedynczych włókien mięśniowych. Okazuje 
się, że zamiany potencjałów mięśniowych są w pew¬ 
nych zakresach proporcjonalne do zmian naprężeń 
włókien mięśniowych, a tym samym do siły rozwijanej 
przez mięsień. 

Na il. 127a (tabl. 32) pokazano widok ogólny sta¬ 
nowiska pomiarowego stosowanego do badań. 
Przedmiotem badania jest współdziałanie aktonów 
mięśniowych obsługujących staw ramienny w warun¬ 
kach statycznych. Aktonów tych jest siedemnaście 
i w różny sposób współdziałają one podczas ruchów 
w stawie. Badany człowiek wykonuje ruchy z różnym 
wysiłkiem, np. 25%, 50% i 100% wysiłku maksymal¬ 
nego, a w tym czasie aparatura wzmacniająca i piszą¬ 
ca rejestruje zarówno rozwijaną siłę (uzyskuje się tzw. 
mechanogramy), jak i przebieg potencjałów mięśnio¬ 
wych (elektromiogramy). Przykład jednoczesnego 
zapisu mechanogramu i elektromiogramu jednego 
z aktonów pokazano na il. 127b (tabl. 32). W celu 
określenia udziału każdego z badanych aktonów 
mięśniowych należy prowadzić jednoczesny zapis 
mechanogramów i elektromiogramów dla każdego 
z nich. 


Modelowanie mięśni izolowanych 


Badania biomechaniczne mięśni izolowanych do¬ 
starczyły bogatego materiału doświadczalnego; nie 
udało się jednak sformułować na jego podstawie uni¬ 
wersalnego modelu matematycznego mięśnia. Zna¬ 
ne obecnie modele są typu fenomenologicznego i obo¬ 
wiązują tylko w określonych zakresach parametrów 
i stanów mięśnia. 

Do najbardziej rozpowszechnionych należą modele 
typu reologicznego, co wynika z faktu, że właściwości 
mechaniczne tkanki mięśniowej są zbliżone do właści¬ 
wości kauczuku i innych elastomerów. Podobieństwo 
to jest wynikiem podobieństwa budowy chemicznej — 
długich łańcuchów cząsteczek. W modelu Teologicz¬ 
nym materiał rzeczywisty zastępuje się układem 
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sprężyn, tłumików i innych elementów nie mających 
odpowiedników w naturze. Jednakże, w przeciwień¬ 
stwie do innych tworzyw, właściwości żywego mięśnia 
zmieniają się w zależności od stopnia pobudzenia. 
Poza tym mięsień może się samodzielnie kurczyć i roz¬ 
wijać siłę. Fakty te muszą być uwzględnione przy bu¬ 
dowie modelu. 


Sformułowanie uogólnionego modelu 

Sformułowanie uogólnionego modelu jest oparte na 
przyjmowanym powszechnie założeniu, że siła F 
rozwijana przez mięsień w funkcji długości mięśnia /, 
podczas skurczu tężcowego i przy stałym pobudzeniu 
jest sumą niezależnej od pobudzenia składowej bier¬ 
nej Fb i zależnej od wartości pobudzenia składowej 
uogólniony czynnej Fc (rys. 12). Schemat uogólnionego modelu 
model Teologicznego mięśnia opracowany w Polsce przed- 
reologiczny stawiony jest na rys. 16, gdzie 7,2,5 oznacza zespoły 
składowe modelu, E 0t E u E 2y E 3 — wartości modułów 
Younga elementów sprężystych modelu, E s — moduł 
Younga charakteryzujący element siłowy modelu 
(jest on funkcją czasu t napięcia stymulacji U i czę¬ 
stości/), tj u r \ 2 , r ] 3 — współczynniki lepkości elemen¬ 
tów tłumiących modelu, a u <r 2 , <r 3 , a — naprężenia od¬ 
powiednio dla zespołów 7, 2, 3 i całego modelu. 

Zakłada się, że parametry E 0 -E 3t E Sy r^-rj 3 modelu 
mają następujące cechy: są nieliniowymi funkcjami 
długości mięśnia /, nie są zależne od czasu (nie uwzglę¬ 
dnia się wpływu takich parametrów, jak np. zmęcze¬ 
nie), nie zależą od pobudzenia mięśnia (rozpatruje się 
przypadek stałego pobudzenia). 

Taki układ połączeń modeli składowych został 
przyjęty z następujących przyczyn: Mięsień nie pobu¬ 
dzony i rozciągany biernie w warunkach statycznych 
zachowuje się (rys. 12), jak nieliniowa sprężyna o cha¬ 
rakterystyce Fb (/), stan ten charakteryzuje zespół / 
(o parametrze E 0 \ rys. 17). Stan mięśnia niepobudzo- 
nego w warunkach dynamicznych opisać można ze¬ 
społem 2, w którym pierwszy element Maxwella o pa¬ 
rametrach E lt opisuje tzw. składową szybką, a ele¬ 
ment o parametrach E 2y t ? 2 — składową wolną, 
model Zespół 3 modeluje składową czynną siły rozwijanej 
składowej P rzez mięsień (rys. 14). Wyniki badań wielu autorów 
czynnej wskazują na fakt, że model składowej czynnej powi¬ 
nien zawierać tzw. element siłowy (kurczliwy), który 
w tej pracy jest modelowany elementem o module 
sprężystości E 8 . Element ten charakteryzuje wyłącznie 
zdolność mięśnia do rozwijania siły. Stwierdzono 
także, iż mięsień pobudzony zmienia swą lepkość 
OFaz zawiera tzw. szeregowy element sprężysty, co 
w tym modelu jest uwzględnione przez wprowadzenie 
elementów o parametrach y 3 , E 3 . 



Składowe uogólnionego modelu mięśnia 
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Zależnie od długości mięśnia l oraz jego stanu do 
opisu zachowania się mięśnia można wykorzystać 
określone kombinacje modeli składowych podane 
w tabeli (s oznacza wydłużenie mięśnia, e = Aljl , 
U oznacza bezwymiarowe pobudzenie, (/ ma x = 1). 

Inny rodzaj modelu mięśni izolowanych (model 
matematyczny) wynika z tzw. równania charaktery¬ 
stycznego Hilla podawanego zwykle w postaci 

(F+a)(v + b) = (F 0 +a)b, 

gdzie: Fjest siłą rozwijaną izotonicznie przez mię¬ 
sień, F 0 — siłą rozwijaną izometrycznie przez mięsień 
przy długości 7 0 , v — prędkością skracania mięśnia, 
#, b — współczynnikami. Zależność tę A. V. Hill 
uzyskał w 1938 r. na podstawie analizy wyników po¬ 
miarów mechaniczno-energetycznych (pomiary ciepła 
wydzielanego przez mięsień w różnych fazach skurczu) 
i początkowo przypuszczał, że współczynniki a i b 
mają dla danego mięśnia wartości stałe. Od tamtego 
czasu teoria Hilla została znacznie rozszerzona i udos¬ 
konalona. Obecnie bardzo intensywnie rozwijanym 
kierunkiem są próby opisania charakterystyk mecha¬ 
nicznych mięśnia F = F(J) i F = F(v) w powiązaniu 
z przemianami biochemicznymi zachodzącymi pod¬ 
czas jego pracy i z występującymi wówczas zmianami 
w jego mikrostrukturze. 

W ostatnich latach, w związku z rozpowszechnia¬ 
niem się metod cybernetycznych, są podejmowane 
próby modelowania mięśni izolowanych, w których — 
zgodnie z teorią automatycznego sterowania — 
mięsień traktuje się jako obiekt wieloparametrowy, 
mający różne wejścia i wyjścia. Wprowadzając na 
wejścia takiego obiektu określone sygnały wymusza¬ 
jące pochodzenia mechanicznego i elektrycznego bada 
się odpowiedź obiektu i na tej podstawie dobiera się 
równania matematyczne opisujące model. Opisana 
metoda była zastosowana w badaniach przeprowa¬ 
dzonych w Polsce. Przyjęto, że mięsień izolowany 
jest wieloparametrowym, nieliniowym obiektem re- 
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Rys. 17. Model cybernetyczny mięśnia izolowanego 


gulacji o dwóch wejściach (długość / i napięcie sty¬ 
mulacji U) i jednym wyjściu (siła F — Fc t Fb). 
Przyjęto także, iż obiekt ten można podzielić na dwa 
człony, odpowiadające składowym Fb i Fc siły 
rozwijanej przez mięsień (rys. 17). Na podstawie wy¬ 
ników badań doświadczalnych przeprowadzonych na 
mięśniu izolowanym brzuchatym łydki (gastrocne- 
mius) żaby wyznaczono układ równań różniczkowych 
opisujących ten model mięśnia. 

Wyniki uzyskane przy modelowaniu mięśni opi¬ 
sanymi metodami mają dwa główne kierunki zasto- 
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sowań: ułatwiają teoretyczne rozpatrywanie skompli¬ 
kowanych zagadnień dynamicznych biomechaniki 
ruchu (np. zagadnienia współudziałów mięśni) oraz 
są pomocne przy syntezie mięśni sztucznych o właści¬ 
wościach zbliżonych do mięśni naturalnych. Oba 
wymienione kierunki badań są obecnie intensywnie 
rozwijane ze względu na podejmowane próby skon¬ 
struowania antropomorficznych (człowiekopodob- 
nych) robotów i manipulatorów. 


Możliwości rozwoju siły 
mięśniowej przez trening 


siła 

rozwijana 
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Silę F m rozwijaną przy stałej długości mięśnia przez 
jednostkę motoryczną należącą do danego mięśnia 
można wyrazić zależnością 

F = S<r, 

gdzie S jest przekrojem poprzecznym (tzw. przekro¬ 
jem fizjologicznym) włókien mięśniowych, a — na¬ 
prężeniem rozwijanym przez te włókna. Siła rozwija¬ 
na w danym momencie przez mięsień zależy zarówno 
od liczby synchronicznie (równocześnie) pobudzanych 
jednostek motorycznych (ich siły sumują się z od¬ 
powiednimi wagami) jak i od częstości ich pobudzania 
(sumują się skurcze pojedyncze poszczególnych jed¬ 
nostek). Ponieważ działalności mechanicznej włókien 
mięśniowych towarzyszy aktywność elektryczna, to 
stan pobudzenia całego mięśnia jest zakodowany 
zarówno w amplitudzie jak i w częstości elektromio- 
gramu. W celu łącznego ujęcia obu tych parametrów 
przyjmuje się, że miarą pobudzenia mięśnia jest 
amplituda U tzw. scałkowanego elektromiogramu, 
otrzymanego przez uśrednienie (średnia ważona) 
elektromiogramu wyjściowego w kolejnych krótkich 
przedziałach czasu. 

Przyjmując, że wartość maksymalna scałkowanego 
elektromiogramu C/ m axjest rejestrowana wówczas, 
gdy mięsień rozwija siłę maksymalną, tzn. gdy wszy¬ 
stkie jednostki motoryczne są pobudzone, to bezwy¬ 
miarowy stosunek w = UIU m &x jest proporcjonalny do 
liczby jednostek motorycznych (czyli do części prze¬ 
kroju fizjologicznego) mięśnia w danej chwili zaanga¬ 
żowanych w rozwijaniu siły. 

Siła Fi rozwijana przez i-ty mięsień w warunkach 
statycznych jest więc funkcją jego przekroju fizjolo¬ 
gicznego Si, średniego naprężenia rozwijanego przez 
włókna en, długości mięśnia h i wielkości Tii. Długość 
h mięśni w organizmie zależy jednoznacznie od kąta 
obrotu w stawie a. Dla zespołu mięśni obsługujących 
staw o jednym stopniu swobody można napisać tzw. 
równanie udziałów w postaci: 

n 

M z = J] Fi {Si, (Ti, a, ud • n (a), 

i=l 


gdzie: M z jest momentem wypadkowej sił zewnętrz¬ 
nych względem osi stawu, ri — ramieniem siły Fi 
względem osi stawu, n — liczbą mięśni (rys. 8). Je¬ 
żeli staw ma większą liczbę stopni swobody (np. staw 
ramienny o trzech stopniach swobody — il. 127a (tabl. 
32)należy rozpatrzyć równanie udziałów dla każdego 
ze stopni swobody oddzielnie. 

Równanie udziałów w kilku odmianach opraco¬ 
wano i zbadano w Polsce. Obszerne badania mięśni 
obsługujących różne stawy kończyny górnej człowie¬ 
ka: łokciowy, promieniowo-nadgarstkowy,łokciowo- 
promieniowy i ramienny przeprowadzone w latach 
1963-1979 pozwoliły na opracowanie metodyki usta¬ 
lania udziału poszczególnych mięśni w realizacji okre¬ 
ślonego aktu ruchowego w warunkach statycznych 
i dynamicznych. 

W sporcie i medycynie jest możliwe wywieranie 
wpływu na wartość siły mięśni przez odpowiedni tre¬ 
ning. Trening mięśni następuje podczas każdej pracy 


fizycznej, ale jego skuteczność zależy głównie od 
intensywności wykonywanej pracy. Praca o dużej 
intensywności oznacza, że organizm rozwija podczas 
tej pracy dużą moc użyteczną. Pracę intensywną 
wykonują robotnicy fizyczni, ale nie jest to praca 
o maksymalnej mocy, ponieważ taka praca nie może 
być wykonywana przez kilka godzin. Zatem trening 
mięśni u robotników fizycznych występuje tylko 
w niewielkim stopniu. Intensywny trening uprawiają 
tylko sportowcy, dlatego wpływ treningu na zmianę 
siły mięśni zostanie zilustrowany przykładami za¬ 
czerpniętymi ze sportu. 

Przekrój fizjologiczny włókien mięśniowych i osią¬ 
gane przez nie naprężenie zmieniają swoje wartości 
zarówno pod wpływem pracy (treningu) jak i bez¬ 
czynności. Zmiany te zależą od rodzaju treningu. 

Trening szybkościowy, polegający na krótkotrwa¬ 
łych ćwiczeniach od kilku do kilkunastu sekund, wy¬ 
konywanych z maksymalną prędkością, powoduje 
głównie wzrost naprężenia mięśni. 

Trening siłowy i siłowo-wytrzymałościowy powo¬ 
duje głównie wzrost przekroju fizjologicznego włókien 
mięśniowych. Trening siłowy polega na kilkusekun- 
wym maksymalnym pobudzeniu mięśni, a siłowo- 
dowytrzymałościowy na długotrwałej (od kilku do- 
kilkunastu minut) pracy przy średnim obciążeniu 
mięśni. 

Zagadnienie wpływu treningu na wzrost siły mięś¬ 
niowej można prześledzić posługując się równaniem 
udziałów W tym równaniu parametry a i n nie pod¬ 
legają treningowi. Natomiast takie parametry jak 
przekrój fizjologiczny Si, naprężenie en i pobudzenie 
u{ istotnie zależą od wytrenowania mięśnia. Ponadto, 
w warunkach dynamicznych siła mięśniowa zależy 
także od prędkości skracania mięśnia zgodnie z cha¬ 
rakterystycznym równaniem Hilla. Zarówno pręd¬ 
kość skracania mięśnia, jak i wartość siły przy danej 
prędkości podlegają również wytrenowaniu. 

Wartość parametrów siłowych mięśni zależy głów¬ 
nie od stanu układu nerwowego oraz rodzaju źródeł 
energetycznych, które decydują zarówno o czasie 
trwania pracy, jak i rozwijanej przez mięśnie mocy 


trening 

szybkościo¬ 

wy 

trening 

siłowy 


Zasób i moc źródeł energii 


Źródło energii 

Zasób 

energii 

J na I kg 
masy ciała 

Moc 

W na 1 kg 
masy ciała 

Maksymal¬ 
ny czas 
pracy 
s 

Fosforylacja 

420 

54,4 

4-6 

Glikoliza beztlenowa 

960 

29,3 

40-90 

Procesy tlenowe 

nieograni¬ 

15* 

nieograni¬ 


czony 


czony 


* Przy długotrwałych wysiłkach moc zmierza do zera. 


maksymalnej. Przy założeniu, że praca jest wykony¬ 
wana z maksymalną intensywnością, charakterystyki 
czasowe wykorzystania źródeł energetycznych (-* Mo¬ 
lekularne podstawy skurczu mięśnia) mają postać 
jak na rys. 18, a ich zasób i moc przedstawia tabela. 



czas 

Rys. 18. Udział różnych źródeł energii w zależności od czasu 
pracy mięśnia 
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zwiększenie 

przekroju 

mięśni 


zwiększenie 
liczby pobu¬ 
dzanych 
włókien 


Zdolność do wykonywania pracy i rozwijania mocy przez 
człowieka o masie 75 kg 


Źródło energii 

Praca 

włożo¬ 

na 

J 

Praca 

uzyska¬ 

na 

J 

Moc 

włożo¬ 

na 

W 

Moc 

jzyska- 

na 

W 

Spraw¬ 

ność 

mecha¬ 

niczna 

% 

Fosforylacja 
Glikoliza beztle¬ 

31 500 

4 750 

4 070 

610 

15 

nowa 

Procesy tlenowe 

71 200 
nieo¬ 

14 250 
nieo¬ 

2 200 

440 

20 


grani¬ 

czona 

grani¬ 

czona 

1 125 

290 

26 


W tabeli u góry podano z kolei jak są wykorzystywane 
poszczególne źródła energii przez człowieka na przy¬ 
kładzie człowieka o masie 75 kg. 

Charakterystyki te decydują o doborze intensywno¬ 
ści i czasu trwania wysiłku w treningu parametrów 
podlegających wytrenowaniu. Wzrost naprężenia 
mięśni oi jest trenowany głównie przez przedstawi¬ 
cieli szybkościowych i szybkościowo-siłowych dyscy¬ 
plin sportu. Wzrost powoduje zwiększenie siły 
i prędkości ruchu rozwijanych przez mięśnie bez wy¬ 
raźnego zwiększenia masy mięśniowej, czyli bez istot¬ 
nego zwiększania przekroju fizjologicznego mięśni. 
Wzrost naprężenia mięśni cr< uzyskuje się w wyniku 
ćwiczeń polegających na maksymalnym obciążeniu 
mięśni przez kilka lub kilkanaście sekund, co zwiększa 
zasób źródeł wysokoenergetycznych w mięśniu — 
głównie fosfokreatyny i częściowo glikogenu (rys. 18). 
Są to ćwiczenia w rodzaju krótkich biegów, skoków, 
serii uderzeń. 

Przekrój fizjologiczny Si mięśni zwiększa się przede 
wszystkim przez wzrost plazmy w komórkach mięś¬ 
niowych (tzw. mioplazmy), przy nie zmienionej liczbie 
włókien mięśniowych. Zwiększa się ona wówczas, 
gdy rośnie w niej niezbędny zapas substancji energe¬ 
tycznych — głównie glikogenu. Takie warunki wy¬ 
stępują wtedy, gdy praca jest wykonywana prawie 
z maksymalną intensywnością przez kilkanaście do 
kilkudziesięciu sekund (tabela z poprzedniej strony: 
Zasób i moc źródeł energii, rys. 18). Wzrost przekroju 
fizjologicznego jest czynnikiem pożądanym u kultu¬ 
rystów, zapaśników, miotaczy, a także ciężarowców, 
u których duża masa ciała nie przeszkadza, a na od¬ 
wrót — pomaga w osiąganiu dobrych wyników spor¬ 
towych. 

Umiejętność synchronicznego pobudzania maksy¬ 
malnej liczby włókien mięśniowych (wzrost w<) jest 
głównie związana z działalnością układu nerwowego. 
Gwałtowne napinanie mięśni jest możliwe tylko przy 
wykorzystaniu bezpośrednio ATP (kwas adenozyno- 
trój fosforowy). Jednakże zapas ATP starcza zaledwie 
na 2-3 maksymalne napięcia mięśni (rys. 18) i więk¬ 
sza liczba powtórzeń (np. 3-7) musi odbyć się na 
koszt fosfokreatyny wchodzącej w reakcję odtwarza¬ 
nia ATP z ADP (kwas adenozynodwufosforowy) 
(CP na rys. 18). Metody treningu tej właściwości 
układu mięśniowego i nerwowego polegają na dyna¬ 
micznym wymuszaniu pobudzenia dużej liczby włó¬ 
kien mięśniowych. Dzieje się to np. podczas zeskoków, 
gdy mięśnie muszą gwałtownie hamować rozpędzone 
ciało. Duża prędkość skracania mięśni zachodzi 
również wówczas, gdy przemieszcza się niewielkie 
masy —np. piłkę, oszczep, rakietę tenisową lub wy¬ 
konuje ćwiczenia cykliczne bez dodatkowego obciąże¬ 


nia, np. bieg. W tym drugim wypadku prędkość skra¬ 
cania mięśni decyduje o dużej amplitudzie częstości 
ruchów wykonywanych przy dużej amplitudzie ru¬ 
chów w stawach. Maksymalną częstość ruchów cy¬ 
klicznych uzyskuje się po ok. 4-6 s, co jest głównie 
związane z wykorzystaniem fosfokreatyny jako źródła 
energii. 

Ponadto trening mięśni jest stosowany w procesie 
rehabilitacji inwalidów. Zasady tego treningu są 
zbliżone do zasad treningu sportowego. 


Problemy wymagające dalszych 
badań 

Wiele zagadnień dotyczących mięśni zostało jeszcze 
nie zbadanych, dlatego na pewno pozostaną one 
nadal w centrum zainteresowania fizjologów, biome- 
chaników, inżynierów-bioników, biochemików i bio¬ 
fizyków. Dalszych badań wymaga m.in. ustalenie 
zależności właściwości mięśni od ich budowy (szcze¬ 
gólnie mięśni gładkich). Nie jest także całkowicie wy¬ 
jaśniony związek między zjawiskami chemicznymi, 
mechanicznymi i elektrycznymi zachodzącymi pod¬ 
czas pracy mięśnia. Jak dotąd w modelowaniu ma¬ 
tematycznym i przy symulacji własności mięśni w róż¬ 
nych odpowiednikach technicznych nie udało się 
uwzględnić ich właściwości biochemicznych. Dokład¬ 
niejsze zbadanie miopotencjałów rejestrowanych na 
powierzchni ciała lub za pomocą elektrod wkłuwa- 
nych i implantowanych powinno wyjaśnić udział 
włókien i jednostek motorycznych w przebiegu glo¬ 
balnego elektromiogramu. Bliższe poznanie mecha¬ 
nizmu zmian miopotencjału pozwoli na lepsze wy¬ 
korzystanie elektromiogramów do celów diagnos¬ 
tyki i do sterowania urządzeń technicznych, np. bio- 
protez. 

Interesująca i mało zbadana jest kwestia męczenia 
się mięśnia podczas kolejnych skurczów. Wiadomo 
w tej chwili, że przy odpowiednim stosunku czasów 
skurczów do czasów odpoczynku można znacznie 
dłużej utrzymywać mięsień w stanie zdolności do 
pracy. 

Kolejnym zagadnieniem, które wymaga dalszych 
badań jest współdziałanie mięśni podczas wykony¬ 
wania ruchów w stawach. W każdym ruchu bierze 
udział wiele mięśni, które z różnym wkładem sił 
uczestniczą w pokonywaniu zewnętrznego obciążenia 
kończyny. Dotąd podano kilka hipotez mechanizmu 
współdziałania mięśni obsługujących np. staw łok¬ 
ciowy lub promieniowo-nadgarstkowy w warunkach 
statycznych. Zbyt mało jest natomiast zbadane współ¬ 
działanie mięśni w warunkach dynamicznych, szcze¬ 
gólnie w stawach o większej liczbie ruchów, jak np. 
ramiennym lub biodrowym. Poznanie mechanizmu 
współdziałania mięśni pozwoli na budowanie zaa¬ 
wansowanych manipulatorów antropomorficznych 
o lepszej sprawności energetycznej, dokładniejszym 
pozycjonowaniu i krótszym czasie działania przy 
wykonywaniu określonych zadań. 

J. R. Bendall Muscles, Molecules and Movement , An essay in 
the contribution of Muscles, London 1970; E.V. Hill First and 
Last Experiments in Muscle Mechanics , London 1970; A. Mo- 
recki Manipulatory bioniczne , Warszawa 1976; A. Morecki i in. 
Bionika ruchu , Warszawa 1971; A. Morecki i in. Badanie własnoś¬ 
ci mechanicznych mięśni. Wykłady z biofizyki , Łódź 1975; A. Mo¬ 
recki i in. Cybernetyczne systemy ruchu kończyn zwierząt i robo¬ 
tów , Warszawa 1979; D. R. Wilkje Mięsień, Warszawa 1974. 
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Biocybernetyka 

Ryszard Gawroński 

Biocybernetyka jako metoda 
badań procesów w złożonych 
układach biologicznych 


Dzięki powstałym około dwudziestu lat temu nowym 
metodom badań złożonych układów biologicznych, 
stosunkowo szybko zmieniły się poglądy na podsta¬ 
wowe zjawiska zachodzące w organizmach żywych 
i obecnie trudno sobie wyobrazić nowoczesne bada¬ 
nia biologiczne bez udziału specjalistów w zakresie 
teorii sterowania i przetwarzania informacji oraz ich 
metod. Już z definicji, jaką podał w 1948 r. Norbert 
Wiener w swojej klasycznej pracy Cybernetics , or 
Conlrol and Communication in the Animal and the 
Machinę ('Cybernetyka, komunikacja i sterowanie 
w zwierzętach i maszynach’), wynika, że cybernetyka 
w równym stopniu może być stosowana w badaniach 
biologicznych, jak i w technicznych. Biologowie 
z dość dużą rezerwą przyjmowali tak rewolucyjne 
zmiany w metodach badań przyrodniczych. Większość 
znanych naukowców pracujących w dziedzinie bio¬ 
cybernetyki — to technicy, oprócz nich raczej lekarze 
(np. psychiatrzy W. Mc Culloch lub W. Ross Ashby) 
niż biologowie. Obecnie na świecie biocybernetyką 
zajmują się setki instytutów naukowych lub labora¬ 
toriów w szkołach wyższych, a jej wpływ, mniej lub 
więcej uświadomiony, obserwuje się w większości 
prac biologicznych. Nie ogranicza się on, jak nie¬ 
którzy sądzą, do wykrycia pętli sprzężeń zwro¬ 
tnych lub wyrysowania tzw. schematów blokowych, 
tzn. rysunków, w których poszczególne elementy 
(prostokąty, koła) oznaczają etapy procesu lub pod¬ 
zespoły układu, a linie łączące te elementy obrazują 
wzajemne wpływy podzespołów. Do tego celu nie 
trzeba by powoływać nowej gałęzi nauki ani tworzyć 
nowych zespołów badawczych, wystarczyłyby zwy¬ 
czaje lub wyniki uzyskane w naukach technicznych. 
Warto tu podkreślić, że potrzeba nowego podejścia 
wynika przede wszystkim z trudności analizy zło¬ 
żonych procesów biologicznych metodami klasycz¬ 
nymi, które mają w zasadzie charakter opisowy i nie 
wykorzystują w dostatecznym stopniu nowych osiąg¬ 
nięć innych działów wiedzy (oprócz techniki pomia¬ 
rowej). 

Cybernetyczne metody w biologii polegają na: 

możliwie precyzyjnym opisie jakościowym i ilo¬ 
ściowym wszystkich mierzalnych wielkości, które wy¬ 
stępują w procesie; 

ustaleniu bądź założeniu (w postaci odpowiednich 
hipotez) związków między interesującymi nas wiel¬ 
kościami; 

wykorzystaniu metod matematycznych do opisu 
badanych zjawisk i formowaniu tzw. modelu rnate- 
matycznego procesu; 

badaniu procesu nie tylko w stanie ustalonym, ale 
również badaniu jego dynamiki, tzn. zmian zachodzą¬ 
cych w czasie; 

wykorzystaniu teorii sterowania i powstałej nie¬ 
dawno teorii systemów do analizy procesów w zło¬ 
żonych układach, a zwłaszcza w układach z pętlami 
sprzężeń zwrotnych, w układach adaptacyjnych i opty¬ 
malnych lub układach hierarchicznych; 

wykorzystaniu teorii informacji i metod przetwa¬ 
rzania informacji do oceny różnych procesów, w któ¬ 
rych dawniej uwzględniano głównie aspekty energe¬ 
tyczne; 

wykorzystaniu metod technicznego modelowania 
do weryfikacji hipotez i analizy przebiegów procesów 
biologicznych, zwłaszcza wówczas, gdy analiza mate¬ 
matyczna jest zbyt trudna, a wyniki skomplikowane 
i nieczytelne. 


Pierwsze trzy cechy stosowania metod cybernetycz¬ 
nych w biologii wynikają ze związków biocybernetyki 
z matematyką, która w coraz większym stopniu staje 
się podstawowym narzędziem badań (jak to wcześniej 
nastąpiło w fizyce i w różnych dziedzinach techniki). 

Pierwszy etap analizy układu lub procesu biolo¬ 
gicznego polega zwykle na zastosowaniu tzw. metody 
czarnej skrzynki (rys. 1). Przypuśćmy, że o wewnętrz- metoda 
nej strukturze badanego obiektu nie wiemy nic lub czarne] 
tak mało, że symbolicznie możemy go przedstawić skrzynki 
np. w postaci prostokąta o nieznanej stukturze wew¬ 
nętrznej. W tym wypadku wygodnie będzie posłużyć 
wejścia dodatkowe X d zakłócenia Z 

14 1 \ W 

wejścia-badany obiekt 

główne ; lub proces 


Rys. 1. Metoda „czarnej skrzynki** 

się pojęciem układu względnie odosobnionego, wpro- układ 
wadzonym przez niedawno zmarłego prof. Henryka względnie 
Greniewskiego. odosobniony 

W odróżnieniu od stosowanego w fizyce, a także 
w cybernetyce, pojęcia układu całkowicie odosob¬ 
nionego, w układzie względnie odosobnionym ist¬ 
nieją wyróżnione punkty powierzchni brzegowej, 
przez które możliwy jest wpływ otoczenia na procesy 
wewnętrzne układu. Ponadto wyróżnia się inne pun¬ 
kty, przez które następuje oddziaływanie układu na 
otoczenie. Pierwszego rodzaju punkty nazywamy wej¬ 
ściami układu, drugiego zaś — jego wyjściami. 

W układach biologicznych ustalenie wejść i wyjść na¬ 
potyka zwykle duże trudności i wymaga wstępnej zna- 
omości badanego procesu. 

Przypuśćmy np.,że pragniemy opisać zachowanie pszczoła 
się pszczoły w czasie jej pierwszego lotu od ula do jako układ 
miejsca zbierania pokarmu. Pszczoła korzysta z in- cyberne- 
formacji zewnętrznych i z pewnych danych wewnętrz- tyczny 
nych (pamięci), wynikających z dotychczasowych do¬ 
świadczeń. Jako informacje zewnętrzne należy trakto¬ 
wać dane o zachowaniu się (parametry ruchu) innych 
zbieraczek przylatujących do ula, a zwłaszcza tzw. 
taniec pszczół po przylocie w obszar ula. Liczba i za¬ 
kres zmian tych parametrów mogą być dość duże 
i w naszym przykładzie nie wiemy dokładnie, które 
parametry są istotne, a które można pominąć; do¬ 
piero seria badań prowadzi do wybrania istotnych 
sygnałów wejściowych. Ponadto pszczoła przypusz¬ 
czalnie do .ustalenia kierunku lotu uwzględnia dane 
o zapachu pokarmu zebranego przez inne zbieraczki, 
o położeniu Słońca, kierunku wiatru itp. Na pszczołę 
oddziałują również pewne czynniki zakłócające, np. 
zjawienie się owadów będących jej naturalnymi wro¬ 
gami, ruchomych obiektów, które trzeba ominąć itp. 

Za wyjścia można przyjąć zmieniony kierunek lotu 
i ewentualnie jego średnią szybkość. Jak widać, można 
rozróżnić trzy rodzaje wejść (będziemy je oznaczać 
czcionką półgrubą — jak wektory wielowymiarowe — 
rozumiejąc np. przez X w zbiór wszystkich wejść głów¬ 
nych) : 

— wejścia główne X w , mające zasadniczy wpływ na 
przebieg zjawiska (w eksperymencie biologicznym są 
to często wejścia sterowane przez eksperymentatora); 

— wejścia pomocnicze Xd, które woźna zmierzyć i na¬ 
leży uwzględnić przy ustalaniu warunków pomiaru; 

— wejścia zakłócające Z, których na ogół nie można 
zmierzyć, ale można niekiedy ustalić pewne jego para¬ 
metry statystyczne, np. średnią częstość zjawiania się 
danego zjawiska. 
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Nietrudno zauważyć, że podane tu rozumowanie 
zawsze charakteryzowało badania fizyczne oraz bio- 
pytania logiczne i nie widać tu jeszcze potrzeby odwoływania 
eksperymen- się do cybernetyki. Ale współczesny eksperymentator 
tatora zaczyna stawiać pytania ilościowe: 

Jakie są związki między sygnałami wejściowymi 
X w i wyjściowymi Y? 

Jaki jest wpływ na te związki wejść dodatkowych 
X tf ? 

Jaki jest wpływ stanu obiektu (dotychczasowy 
rozwój i dojrzałość osobnicza, przeprowadzone 
doświadczenia i in.) na związki między X»aY? 

Jaki jest wpływ zakłóceń Z na wyjścia obiektu? 
Wymienione wyżej zależności można w ogólnej po¬ 
staci przedstawić za pomocą pewnej, na razie nie-zna- 
nej funkcji F: 

Y = F(X«>, X*. Z, s), 

gdzie przez wektor s oznaczono zespół parametrów 
charakteryzujących stan obiektu. 

Celem badań jest oczywiście ustalenie postaci fun¬ 
kcji F, a ściślej — zespołu funkcji, ponieważ F jest 
również wektorem o liczbie k składowych równej 
liczbie wyjść Yi, i = 1,2,..., k. Powstają natychmiast 
zasadnicze pytania: 

1. Czy możliwe jest ustalenie postaci funkcji F, 
czyli ilościowego opisu obiektu przedstawionego 
w postaci czarnej skrzynki, a więc czy istnieje ciąg 
pomiarów wielkości Xu>, Xd , i Y, który umożliwi taki 
opis z żądaną dokładnością? 

2. Czy istnieje tylko jedna postać funkcji F, tzn. 
czy istnieje tylko jeden sposób opisu obiektu? 

3. Jak należy zaplanować eksperyment, by ewen¬ 
tualne ustalenie opisu obiektu (postaci funkcji F) na¬ 
stąpiło w możliwie najkrótszym czasie i możliwie 
najmniejszym kosztem? 

identyfikacja Sformułowane w tych trzech punktach zadanie na- 
obiektu żywa się w cybernetyce identyfikacją obiektu i przy 
jego rozwiązaniu korzystamy często — ze względu 
na występowanie zakłóceń Z — z bardzo subtelnych 
metod matematycznych, najczęściej statystycznych. 

W każdym razie wiadomo, że na drugie pytanie 
odpowiedź jest negatywna i bez dodatkowych ogra¬ 
niczeń nie można jednoznacznie opisać obiektu. Moż¬ 
na np. żądać, aby funkcja F miała postać szeregu po¬ 
tęgowego o minimalnej liczbie składników. Identy¬ 
fikacja polega wtedy na określeniu liczby i wartości 
współczynników przy kolejnych potęgach zmiennych 
wejściowych. Procedura obliczenia tego typu współ¬ 
czynników w bardziej złożonych wypadkach wymaga 
stosowania k omputera. 

W odróżnieniu od wyżej podanego przykładu coraz 
częściej spotykamy się z taką sytuacją, że posiadamy 
pewne wstępne jakościowe i ilościowe dane o struk¬ 
turze wewnętrznej badanego obiektu i możemy je 
model wykorzystać przy ustalaniu jego opisu. Konstruując 
układu n P* model układu oddechowego, należy uwzględnić 
oddecho- tylko wiedzę dotyczącą budowy i własności płuc 
wego * układu mięśni klatki piersiowej, ale i dane o ośrodku 
nerwowym sterującym procesem oddychania. Wia¬ 
domo, że w rdzeniu przedłużonym, tworzącym naj¬ 
niższą funkcjonalnie część mózgowia, znajdują się 
ośrodki wdechu i wydechu, których praca zależy od 
zawartości C0 2 we krwi. Uwzględniając tego typu 
dane, można narysować schemat blokowy obrazujący 
wewnętrzną strukturę obiektu oraz niektóre własności 
szara jego elementów (zob. rys. 10). W takiej sytuacji mó- 
skrzynka wimy w przenośni, że mamy do czynienia riie z czar¬ 
ną, lecz z szarą skrzynką, ponieważ posiadamy pewne 
informacje o jej wnętrzu. 


Rola sprzężenia zwrotnego 

W pierwszym etapie rozwoju biocybernetyki podkre¬ 
ślano, że istótną Cechą metod biocybćrnetycznych 
jest wyodrębnienie pętli sprzężeń zwrotnych. Sprzę¬ 
żenie zwrotne jest jednym z najważniejszych pojęć 
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cybernetyki, umożliwia wyjaśnienie szeregu zjawisk 
występujących w przyrodzie. Sprzężenie zwrotne jest 
obecnie wykorzystywane powszechnie w urządzeniach 
technicznych, zwłaszcza w złożonych systemach ste¬ 
rowania. Najbardziej ogólnie można stwierdzić, że ze 
sprzężeniem zwrotnym mamy do czynienia, gdy jedna 
lub kilka wielkości wyjściowych z rozpatrywanego 
układu zostaje przekazana z powrotem na wybrane 
wejścia tego układu. Żartobliwie powołujemy się tu 
niekiedy na analogię do węża, który zaczyna zjadać 
własny ogon — ale jest to analogia jedynie struktu¬ 
ralna, bo oczywiście zjawiska fizyczne, jakie wystę¬ 
pują w przypadku sprzężenia zwrotnego, są innego 
rodzaju. 

Sprzężenie zwrotne dzielimy na ujemne (rys. 2b) 
i dodatnie (rys. 3). W wypadku ujemnego sprzężenia 
zwrotnego sygnał wyjściowy y jest przykładany na 
wejście z przeciwnym znakiem, przeciwdziała jakby 
zmianom zachodzącym w układzie. Jeżeli natomiast 
mamy do czynienia z dodatnim sprzężeniem zwrot¬ 
nym, sygnał wyjściowy dodawany jest do odpowied¬ 
nich sygnałów wejściowych, co powoduje często pod¬ 
trzymanie bądź narastanie procesów. 

Ujemne sprzężenie zwrotne wyjaśnia dobrze sta¬ 
bilizację różnych wielkości fizycznych i biochemicz¬ 
nych występujących w układzie biologicznym. Tak 
np. wzrost temperatury otoczenia hamuje odpływ 
ciepła wytwarzanego stale przez organizm człowieka. 
Jeden ze sposobów kompensacji tego wpływu po¬ 
lega na poceniu się (a np. u psów’ — na szybszym od¬ 
dechu), które ułatwia odpływ ciepła i stabilizuje tem¬ 
peraturę ciała. 

Na rys. 2a przedstawiono dowolny obiekt, którego 
jedna z wielkości wyjściowych y powinna być stabi¬ 
lizowana bądź zmieniana zgodnie z pewną regułą. 
Na obiekt można wpływać za pomocą pewnego sygna¬ 
łu sterującego u. Ponadto na obiekt oddziałują za- 
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Rys. 2. Działanie pętli ujemnego sprzężenia zwrotnego: a) obiekt 
sterowany sygnałem «, b) tenże obiekt objęty pętlą 


kłócenia z zwykle o charakterze przypadkowym i trud¬ 
nym do bezpośredniego pomiaru. Schemat na rys. 2b 
ilustruje rolę ujemnego sprzężenia zwrotnego, zazna¬ 
czono na nim: x w — wartość zadaną wielkości sta¬ 
bilizowanej (wartość sterującą); y — stabilizowaną 
wielkość wyjściową, której wartość powinna być 
możliwie zbliżona do wartości x w \ z — zakłócenia; 
e = xw - y, tzw. sygnał błędu, charakteryzujący od¬ 
chylenie wielkości wartości sterującej (zadanej) od 
wyjściowej. Przypuśćmy, że zachowanie się obiektu 
(rys. 2a) można opisać prostym równaniem: 

y = k u u f k z z, (2) 

gdzie u — sygnał sterujący obiektem, k u = Ay/Au — 
wzmocnienie w torze sygnału sterującego, k z = AyjAz 
— wzmocnienie w torze zakłóceń, Au i Az przyrosty 
wielkości u i z wywołane w obiekcie dla wyznaczenia 
współczynników k u i k z . Rozpatrzmy zachowanie się 
takiego obiektu po objęciu go pętlą sprzężenia zwrot- 
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nego. Ponadto przypuśćmy, że ustawiono dodatkowy 
wzmacniacz umożliwiający dość duże wzmocnienie 
sygnału błędu: 

u — — k 0 (xw—y). (3) 

Oprócz obiektu i wzmacniacza w skład pętli sprzęże¬ 
nia zwrotnego wchodzi komparator, sprawdzający 
zgodność sygnału wyjściowego z sygnałem wejścio¬ 
wym i przekazujący do obiektu sygnał sterujący u , 
oraz element zmieniający znak sygnału wyjściowego y. 
Oczywiście do przekazania informacji potrzebna jest 
zawsze jakaś (na ogół niewielka) ilość energii, będą¬ 
cej nośnikiem informacji. Ilość tej energii określają 
pewne prawa badane w teorii informacji. 

Na podstawie rysunku 2 można napisać następu¬ 
jącą prustą zależność: 

y = k 0 k u ( x tv —y) ■+ k z z. 

Rozwiązując względem y otrzymamy: 

_ k 0 k u Xw J r k z z 

k(f ku ■+■ I 

Analizując wzór (5) nietrudno zauważyć, że w mia¬ 
rę wzrostu iloczynu k 0 k u (czyli w miarę wzrostu 
wzmocnienia w torze sygnału błędu i torze sygnału 
sterującego) maleje rola członu £ z z, a więc maleje 
wpływ zakłóceń na działanie układu. Jeśli k 0 k u > 1, 
wzór (5) można uprościć: 

y - Xa+ TT~ Z - (6) 

K 0 K U 

Widać tu jeszcze wyraźniej, że dzięki pętli sprzężenia 
zwrotnego wpływ zakłóceń został zmniejszony pro¬ 
porcjonalnie do k 0 k u . 

Inny przykład umożliwi nam wyjaśnienie jeszcze 
jednego pojęcia używanego w teorii sterowania (a 
wcześniej — w podstawach automatyki), a mianowi¬ 
cie pojęcia układu śledzącego. Wartość wejściowa x w 
nie zawsze musi być stała; może być zmieniana, gdy 
tego wymaga zadanie układu. Przypuśćmy dla uprosz¬ 
czenia, że jednokierunkowy ruch kończyny jest ste¬ 
rowany jednym mięśniem. Zatem wielkość skurczu 
musi być tak sterowana, aby przebieg wyjściowy „śle¬ 
dził’ 1 zmiany sygnału sterującego, a wynik sterowania 
powinien możliwie mało zależeć od zakłóceń. Jeżeli 
sterowanie skurczem odbywa się przez zmianę x w (t) 
w pętli sprzężenia zwrotnego, to zgodnie z wzorem 
(6) otrzymamy: 

y(t)=xAO+- 2(0. (7) 

KqKu 

gdzie y(t) może obecnie oznaczać np. położenie końca 
kończyny względem tułowia. 

Znacznie bardziej skomplikowane zjawiska wy¬ 
stępują wówczas, gdy zachowanie się obiektu wymaga 
uwzględnienia procesów dynamicznych, tzn. proce¬ 
sów związanych ze zmianami energetycznymi w ukła¬ 
dzie, lub gdy obiekt może magazynować energię, np. 
w postaci energii kinetycznej czy potencjalnej. (W me¬ 
chanice proces dynamiczny oznacza ruch cząstek 
pod wpływem sił, w teorii sterowania o dynamice 
mówimy wówczas, gdy w układzie zachodzą zmiany 
wielkości charakteryzujących różne rodzaje energii). 
Obiekt zawierający kilka wejść i kilka wyjść oraz ele¬ 
menty magazynujące energię może być opisany za po¬ 
mocą układu równań różniczkowych, a badanie zja¬ 
wisk występujących przy sterowaniu układami biolo¬ 
gicznymi wymaga dobrej znajomości współczesnej 
teorii sterowania. 


(4) 

(5) 


Stabilność układu 

Jedno z zagadnień, które się rozwiązuje metodami 
teorii sterowania,- polega na ustaleniu, czy opracowa¬ 
ny przez biocybernetyka model matematyczny pro¬ 


cesu jest modelem stabilnym. Stan układu lub mo¬ 
delu nazywamy niestabilnym, jeżeli — mówiąc w 
uproszczeniu — bardzo małe zaburzenia powodują stan 
powstanie w układzie procesów (np. wychyleń lub niestabilny 
drgań), które wyprowadzają układ poza stany do¬ 
puszczalne w normalnej pracy układu. Ołówek po¬ 
stawiony pionowo na ostrzu nie znajduje się w stanie 
stabilnym, ponieważ najmniejsze nawet zaburzenie 
powoduje szybką zmianę jego położenia na poziome. 

Można wykazać, że występowanie w układzie bio¬ 
logicznym lub technicznym dodatniego sprzężenia 
zwrotnego prowadzi do niestabilności. Ilustruje to 
rysunek 3, na którym przyjęto w celu uproszczenia, że 
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Rys. 3. Działanie pętli dodatniego sprzężenia zwrotnego 


zamiast obiektu znajduje się prosty element opóźnia¬ 
jący każdy przebieg o stałą wartość t. Jeżeli w pętli 
sprzężenia zwrotnego wzmocnienie jest większe od 
jedności, to drobne zaburzenie np. na wejściu układu 
powoduje po czasie t zjawienie się na wyjściu sygnału 
k 0 e , a to po kolejnych przejściach przez pętlę wywoła 
sygnały o wartości k\ e, kie itd.; jeżeli przy tym k> 1, 
to sygnał będzie narastał aż do zjawienia się dodatko¬ 
wych ograniczeń amplitudy procesu. Występujące 
w niektórych schorzeniach układu nerwowego silne 
drżenie kończyn czy napady padaczkowe można wyjaś¬ 
nić zjawianiem się pętli dodatniego sprzężenia zwrot¬ 
nego. Na ogół jednak organizm uruchamia w takich 
wypadkach dodatkowe pętle, tzw. hamujące, które 
wygaszają nadmierne oscylacje (np. przez zmniej- pętla 
szenie wzmocnienia). Mamy tu do czynienia z nowym hamująca 
zjawiskiem, które należy do tzw. zjaw-isk adaptacyj¬ 
nych. Powstanie nowej sytuacji lub zmiany warunków 
pracy układu mogłyby spowodować niekorzystne dla 
organizmu procesy. Aby temu zapobiec, organizm 
uruchamia nowe procesy, np. zmiany wzmocnienia 
w poszczególnych pętlach, które kompensują zabu¬ 
rzenia i sprowadzają warunki pracy układu do wa¬ 
runków dopuszczalnych. 

Układy adaptacyjne mają co najmniej dwie pętle układy 
sprzężenia zwrotnego. Jedna z nich np. stabilizuje adaptacyjne 
proces w normalnych warunkach, druga — steruje 
akością procesu ub 'włącza się z chwilą przekroczenia 
typowych warunków pracy. Organizmy żywe zawie¬ 
rają tysiące pętli sprzężenia zwrotnego, a ich rolę 
można będzie stopniowo wyjaśniać prowadząc ba¬ 
dania biocybemetyczne. 


Zastosowanie teorii informacji 

Chociaż nasza wiedza o procesach występujących 
w organizmach żywych, zwłaszcza w układzie nerwo¬ 
wym, znajduje się w początkowym stadium, rozwój 
teorii informacji przyniósł rewelacyjne zmiany w po¬ 
glądach na te procesy i w metodach ich badania. 
W 1948 r. C. E. Shannon, badając systemy komuni¬ 
kacyjne, wprowadził miarę ilości informacji dla oceny 
zjawisk zachodzących między nadawcą a odbiorcą. 
Najprostszy system przekazywania wiadomości przed¬ 
stawiono na rys. 4. Celem systemu jest przekazanie 






















sygnał — wiadomości od nadawcy do odbiorcy, czyli — inaczej 
nośnik mówiąc — u odbiorcy musi nastąpić jakiś proces, 
informacji który będzie pewnym (na ogół niejednoznacznym) 
odwzorowaniem jakiegoś zjawiska zachodzącego 
u nadawcy. Aby to było możliwe, nadawca musi mieć 
do swej dyspozycji nadajnik (np. aparat telegraficzny, 
sygnalizator świetlny lub narząd mowy), który wysyła 
sygnał (akustyczny, elektryczny, świetlny itp.). Sygnał 
jest nośnikiem informacji. Oznacza to, że pewne pa¬ 
rametry sygnału charakteryzują stan nadawcy. Pa¬ 
rametry te muszą być przesłane kanałem komunika¬ 
cyjnym i przyjęte w odbiorniku, a następnie przeka¬ 
zane odbiorcy jako dane o pewnym stanie nadawcy. 



Rys. 4. Najprostszy system informacyjny 


Przy konstruowaniu technicznych urządzeń komu¬ 
nikacyjnych, jak i przy badaniu wzajemnego przeka¬ 
zywania informacji przez środowisko i organizm żywy 
(a także wewnątrz organizmu) dążymy do wyodręb¬ 
nienia źródła sygnałów i ich znaczenia dla badanego 
układu, charakteru i własności procesu fizycznego 
będącego nośnikiem informacji (np. rozchodzenia się 
fal akustycznych czy elektromagnetycznych, przepły¬ 
wu prądów elektrycznych lub procesów elektroche¬ 
micznych), ewentualnego wpływu zakłóceń oraz spo¬ 
sobu reagowania odbiorcy na ten proces. 

Najprostsza sytuacja występuje wówczas, gdy u 
nadawcy możliwe są dwa stany, np. głodny lub nasy¬ 
cony. Pisklę ptaka w gnieździe sygnalizuje milczeniem 
stan nasycenia, a krzykiem lub piskiem stan głodu, 
ilość Pierwszy stan oznaczamy np. 0, drugi 1. Ilość infor- 
informacji macji zawartej w wiadomości o wyborze jednego 
z dwu możliwych i jednakowo prawdopodobnych 
bi* stanów została nazwana 1 bitem. 

Jeżeli u nadawcy możliwe są 4 stany, to wbrew 
pierwszemu wrażeniu liczba informacji zawartej w 
wiadomości o tym stanie jest równa 2 bity. Najpierw 
dzielimy 4 stany na dwie pary i ustalamy, o którą 
z tych dwóch par chodzi (1 bit), a następnie ustalamy 
stan w danej parze (1 bit). Podobnie, jeżeli mamy 
s — 2 n stanów u nadawcy, to wiadomość o wybranym 
stanie (spośród s jednakowo prawdopodobnych) za¬ 
wiera 

log 2 s = log 2 2” = n 

bitów informacji. Wzór ten jest słuszny, gdy chodzi 
o stany jednakowo prawdopodobne. Najprostszym 
i naturalnym uogólnieniem uwzględniającym możli¬ 
wość różnych prawdopodobieństw występowania po¬ 
szczególnych stanów nadawcy jest następujący wzór 
wyprowadzony przez Shannona: 

K 

0IO&/K/) bitów, (8) 

i=l 


gdzie p{i) — prawdopodobieństwo zjawienia się stanu 
oznaczonego numerem i u nadawcy. 

Nie wnikając głębiej w problemy teorii informacji, 
trzeba podkreślić, że do istotnych zagadnień należy 
kodowanie wybór sposobu kodowania informacji, tzn. wybór 
informacji tych parametrów w sygnale, których zmiana przenosi 
informację. Od sposobu kodowania może zależeć, 
czy mimo zakłóceń informacja zostanie przekazana 
prawidłowo odbiorcy. Drugie ważne zagadnienie 
polega na odpowiedniej selekcji tych informacji, tak 
aby najważniejsze dotarły do odbiorcy, a nieistotne 
zostały pominięte. Wiąże się to z tzw. zagadnieniem 
selekcja selekcji danych o otoczeniu, której dokonuje stale 
informacji każdy organizm żywy za pomocą układu nerwowego. 

Przede wszystkim selekcjonowane zostają sygnały 
o niebezpieczeństwie, potem o pokarmie, w pewnych 
sytuacjach o partnerze seksualnym, a następnie np. 
o możliwości komfortowego spędzenia czasu itp. 
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Modelowanie 

Wobec ogromnej złożoności zjawisk w organizmach 
żywych opisy matematyczne nawet bardzo uprosz¬ 
czonych układów lub funkcji organizmu żywego są 
również wyjątkowo skomplikowane. Opisy te mają 
często postać układów równań różniczkowych lub 
różniczkowo-różnicowych (tzn. niektóre składniki 
tych równań odpowiadają różnym czasom), a ich 
rozwiązanie analityczne jest z reguły niemożliwe. 
Niekiedy korzysta się w takiej sytuacji z maszyn cy¬ 
frowych (komputerów), znacznie przyspieszających 
obliczenia, ale otrzymane wyniki dotyczą tylko kon¬ 
kretnych wypadków o ustalonych parametrach, przy 
tym często nie wystarczają do poznania całego bo¬ 
gactwa zjawisk, jakie mogą wystąpić w badanym 
obiekcie. Dlatego właśnie w biocybernetyce dużego 
znaczenia nabierają metody modelowania fizycznego 
zjay/isk biologicznych (-> modelowanie procesów 
biologicznych). 

Modelowanie różnorodnych zjawisk fizycznych, 
technicznych, a ostatnio nawet ekonomiczno-spo¬ 
łecznych, jest często jedyną możliwością choćby czę¬ 
ściowego poznania procesów w złożonym układzie 
(systemie). W tym celu wykorzystuje się (bądź spe¬ 
cjalnie konstruuje) urządzenia techniczne opisywane 
w przybliżeniu tymi samymi równaniami co badany 
układ. Urządzenia te umożliwiają łatwą zmianę syg¬ 
nałów wejściowych, struktury i wielkości parametrów 
poszczególnych elementów modelu oraz pomiar do¬ 
wolnych procesów zarówno na wyjściu, jak i wew¬ 
nątrz modelu. 

Należy wyraźnie podkreślić, że model w postaci 
urządzenia mechanicznego, elektrycznego, a ostatnio 
najczęściej elektronicznego, jest z reguły bardzo 
uproszczonym odwzorowaniem rzeczywistych pro¬ 
cesów biologicznych i dlatego ogromnego znaczenia 
nabiera wybór tych własności i parametrów badanego 
zjawiska biologicznego, które mają być odwzorowane 
w modelu. W rozdziale dotyczącym układu nerwo¬ 
wego podane zostaną przykłady modelowania fizycz¬ 
nego z wykorzystaniem zarówno typowych maszyn 
matematycznych, jak i wyspecjalizowanych urządzeń 
technicznych. 


Biocybernetyka a układy regulacji 


W układach biologicznych zwykle wydziela się kilka 
powiązanych hierarchicznie poziomów regulacji: po¬ 
ziom regulacji procesów wewnątrzkomórkowych, 
regulacja ustrojowa przemian metabolicznych w tkan¬ 
kach i podstawowych procesów wegetatywnych, re¬ 
gulacja zachowania się organizmu przez wyższe po¬ 
ziomy układu nerwowego. 

Dotychczas udział biocybernetyki w analizie pro¬ 
cesów pierwszego i drugiego poziomu regulacji był 
stosunkowo niewielki, jednakże próby tworzenia mo¬ 
deli matematycznych i programów komputerowych 
do badania poszczególnych układów regulacji są co¬ 
raz częstsze. Na przykład przy modelowaniu procesu 
syntezy białka z uwzględnieniem roli kwasów nuklei¬ 
nowych i enzymów w reprodukcji określonych białek 
korzysta się ze schematów blokowych, chociaż jest 
to dopiero wstęp do badań cybernetycznych. Więcej 
jest prac polegających na modelowaniu takich pro¬ 
cesów w organizmie jak sterowanie oddechem, regu¬ 
lacja obiegu krwi, stabilizacja poziomu temperatury, 
ilości wody i innych płynów w organizmie, regulacja 
hormonalna różnych przemian metabolicznych i wiele 
innych. 

Wszystkie te przykładowo wymienione procesy są 
ze sobą w różnym stopniu powiązane i układy regu¬ 
lacji muszą w odpowiednim stopniu uwzględniać te 
powiązania. Odpowiedzialna za pracę i koordynację 
układów regulacji w organizmach żywych jest część 
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układu nerwowego zwana układem wegetatywnym. 
Analizując liczne dane o układzie wegetatywnym pod 
kątem widzenia ogólnej struktury i charakteru pro¬ 
cesów, można stwierdzić następujące jego własności: 

1. Hierarchiczno-równoległa organizacja współza¬ 
leżności poszczególnych ośrodków i obwodów (rys. 5). 
Warto podkreślić, że wzajemne powiązania różnych 
obwodów i wpływy nadrzędne między nimi mogą być 
różne, a nawet mogą się zmieniać w zależności od 
warunków otoczenia. Tak np. człowiek nie ma (i nie 
ma potrzeby) bezpośredniego dowolnego wpływu 
ani na bicie serca lub skurcz naczyń krwionośnych, 
ani na pracę wielu ośrodków hormonalnych. Wpływ 



Rys. 5. Struktura hierarchiczno-równoległa. Strzałkami czarnymi 
oznaczono połączenia między sąsiednimi szczeblami hierarchii, 
niebieskimi — połączenia bezpośrednie łączące szczeble bardziej 
odległe, umożliwiające szybkie przekazywanie bodźców do tych 
szczebli 
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Rys. 6. Dwa 
rodzaje wejść 


ten pojawia się w sposób pośredni, np. przez stany 
emocjonalne, lub występuje u niektórych specjalnie 
wytrenowanych osób. Z drugiej strony wiele proce¬ 
sów jest ściślej ze sobą powiązanych w porównaniu 
z innymi. Dotyczy to np. regulacji bicia serca, ciśnie¬ 
nia krwi, skurczu naczyń krwionośnych i w ogóle 
procesów w układzie krążenia. Układ sterowania bi¬ 
ciem serca jest związany z regulacją ukrwienia róż¬ 
nych narządów, np. układu trawiennego lub mięśni. 
Ustalenie ogólnej struktury powiązań stanowi pierw¬ 
szy etap badań modelowych. 

2. Występowanie licznych obejmujących się wzaje¬ 
mnie pętli sprzężenia zwrotnego. Badanie dynamiki 
takich pętli, zwłaszcza przy uwzględnieniu własności 
nieliniowych i inercyjnych (a w tym i opóźnienia), 
ogranicza się na razie do konkretnych wypadków, ale 
można wysunąć ogólne przypuszczenie, że dodatkowe 
pętle zmniejszają wpływ wahań parametrów i za¬ 
kłóceń o różnych szybkościach zmian. Przykład ta¬ 
kiego układu z kilkoma pętlami podany jest na rys. 10 
i zostanie opisany nieco dalej. 

Układ nazywamy nieliniowym, jeżeli nie można do 
niego zastosować zasady superpozycji (reakcja na 
sumę dwóch bodźców nie jest równa sumie reakcji 
na bodźce składowe); układ nazywamy inercyjnym, 
jeżeli zawiera elementy gromadzące energię pod jąką- 
kolwiek postacią (kinetyczną, potencjalną, chemicz¬ 
ną itp.). 

3. Występowanie dwóch rodzajów wejść do po¬ 
szczególnych pętli regulacji. Oprócz opisanych w po¬ 
przednim rozdziale wejść typu sumacyjnego w ukła¬ 
dach biologicznych występują bardzo często wejścia 
mnożące (rys. 6). Zmieniają one wzmocnienie w po¬ 
szczególnych elementach pętli sprzężenia zwrotnego, 
co w zasadniczy sposób zmienia własności, a zwłasz¬ 
cza dynamikę procesu regulacji. Przy omawianiu 
układu sterowania mięśniami (rys. 23) zostanie po¬ 
dany przykład wpływu zmiany wzmocnienia na szyb¬ 
kość skurczu mięśni. W pierwszej bowiem fazie skur¬ 
czu zwiększa się czułość układu na przychodzące syg¬ 


nały sterujące, wskutek czego proces rozpoczyna się 
prędzej niżby to nastąpiło przy stałym wzmocnieiu. 

4. Występowanie kilku sygnałów wejściowych (rys. kilka sygna- 
7). Element wyjściowy, zwany często efektorem (mię- tów wejśclo- 
sień lub gruczoł), otrzymuje sygnały sterujące, do- wych 



Rys. 7. Hipotetyczny schemat typowej pętli sterowania w orga¬ 
nizmie żywym z kilkoma wejściami (sumującymi i mnożącymi) 


cierające do niego różnymi drogami. Wyższe szczeble 
hierarchicznego układu regulacji otrzymują infor¬ 
mację nie tylko o wartości regulowanej wielkości, 
ale i o wartościach sygnałów w poszczególnych punk¬ 
tach układów sterowania, w tym również o wartości 
sygnałów błędu, stanu czujników itp. 

5. Hierarchia czasowa zjawisk. W układzie nerwo¬ 
wym, a zatem i w układach sterowania, występują 
procesy o różnych stałych czasowych. Na ogół można 
wydzielić dwa typy pętli: pętle szybkie i pętle wolno 
działające. Pętle szybkie są związane z receptorami 
o małej stałej czasowej i umożliwiają szybką reakcję 
na określony bodziec, natomiast pętle powolne, naj¬ 
częściej o charakterze adaptacyjnym, umożliwiają 
dopasowanie procesu do nowych warunków otocze¬ 
nia. 

6. Występowanie ośrodków antagonistycznych. 
Sygnały w ośrodkach biologicznych mają z reguły 
stały znak i dlatego w typowych układach regulacji 
procesów biologicznych występują dwie pętle (rys. 8). 
Jedna z nich służy do kompensacji niedomiaru lub 
zbyt małej wartości jakiejś wielkości, druga zaś 
umożliwia zmniejszenie nadmiaru lub zbyt dużej war¬ 
tości regulowanej wielkości. Zresztą w całym układzie 
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Rys. 8. Hipotetyczny układ regulacji z pętlami antagonistycznymi 


regulacji wegetatywnej wydziela się dwa podukłady: 
tzw. wspólczulny (sympatyczny) i przywspółczulny 
(parasympatyczny). Na ogół ośrodki układu współ- 
czulnego działają pobudzająco na różne funkcje or¬ 
ganizmu, ośrodki układu przywspółczulnego działają 
na nie hamująco. Wprawdzie od tej zasady są wyjątki, 
ale zawsze są to działania antagonistyczne. 
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Należy podkreślić, że przytaczane tu schematy są 
bardzo uproszczone, a modele, z których korzystamy 
przy analizie zjawisk, zawierają wiele wejść i wyjść 
i pętli sprzężeń zwrotnych, co zostało jedynie zasyg¬ 
nalizowane dodatkowymi strzałkami na rys. 7, 8 itd. 

Podsumowując powyższe uwagi na temat struktur 
układów sterowania organizmów żywych, można 
przedstawić ogólny schemat układu sterowania ma¬ 
jącego zapewnić organizmowi takie warunki, w któ¬ 
rych by wszystkie procesy życiowe przebiegały w op¬ 
tymalny sposób. Na rys. 9 przedstawiono wycinek 
najniższych szczebli hierarchii takiego układu; na¬ 
zwiemy go układem homeostazy. Poszczególne obiekty 
regulacji O ly 0 2f ... Ok itd. są oczywiście powiązane 
układ zależnościami fizyczno-chemicznymi. Zgodnie z po- 
homoostazy przednio podanymi zasadami czujniki nadmiaru 
(oznaczone indeksem a) i niedomiaru (oznaczone 
indeksem b ) Cwai , c sa i, c w ti, c S bi, c W a 2 , c S ni itd. są źród¬ 
łami sygnałów korekcyjnych dla odpowiednich ośrod¬ 
ków regulacji. Zarówno wzmocnienia czujników, jak 
i pobudliwości ośrodków mogą być zmieniane przez 
ośrodki nadrzędne. Ponadto przewidziano w układzie 
występowanie pętli regulacji o małej i dużej stałej 
czasowej, czyli pętle działające szybko (oznaczone 
indeksem s ) i pętle działające wolno (oznaczone in¬ 
deksem w). Ośrodki nadrzędne N u N 2 ,...» Nk również 
tworzą pary antagonistyczne i sterują zarówno pobu¬ 
dzeniem poszczególnych obwodów, jak i ich wzmoc¬ 
nieniem. 



Rys. 9. Schemat przedstawiający typową strukturę układów ste¬ 
rowania homeostazą 
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Jako przykład rozpatrzmy schemat układu stero¬ 
wania oddechem. Chociaż badaniom tego układu 
poświęcono wiele prac zarówno fizjologicznych, jak 
i cybernetycznych, istnienie i rola wielu połączeń 
i własności tego układu nie są jeszcze wyjaśnione. 
Ogólna jego struktura została przedstawiona na rys. 10. 
Intensywność oddychania zależy od składu gazowego 
krwi, co można przedstawić wzorem Graya: 

v r = -f Kj Pco 2 4* K z pH— K z Po 2 , (9) 
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Rys. 10. Schemat blokowy układu sterowania oddechem (wg 
A. Nechaya) 


w którym v T —intensywność oddychania, AT 0 , K lf K 2f 
K z — współczynniki, Pc o 2 — cząsteczkowe ciśnienie 
dwutlenku węgla we krwi, Po 2 — cząsteczkowe ciś¬ 
nienie tlenu, pH — stężenie jonów wodorowych. 

Odpowiednie chemoreceptory, znajdujące się za¬ 
równo w centralnym układzie nerwowym, jak i.na 
jego części peryferyjnej, umożliwiają pomiar stężeń 
C0 2 i O z . Maksimum czułości czujnika C0 2 przypada 
nieco powyżej cząstkowego ciśnienia normalnego dla 
C0 2 (tj. Pco 2 = 40 mm Hg), natomiast maksimum 
czułości na zmiany ciśnienia tlenu występuje przy 
ciśnieniu cząstkowym znacznie niższym niż norma¬ 
lne dla tlenu, a więc gdy Po 2 = 55 mm Hg. W ukła¬ 
dzie sterowania występują zatem dwie nadrzędne 
pętle sterujące intensywnością oddechu, z których 
jedna reaguje na wzrost C0 2 , a druga na spadek 0 2 
we krwi. 

Najniższy szczebel sterowania jest układem typo¬ 
wo samowzbudnym i o regulowanym wzmocnieniu. 

W płucach znajdują się dwa typy mechanorecepto- mechanore- 
rów: wdechu i wydechu. Pobudzenie ich pobudza ceptory 
odpowiednio ośrodki wdechu i wydechu w rdzeniu wdechu 
przedłużonym i łącznie z mięśniami wdechu i wydechu i wydechu 
tworzy zasadniczą część układu wydechowego. Na¬ 
tomiast ośrodki znajdujące się nieco wyżej, tzw. 
pneumotaksyczny i apneustyczny, wpływają zarówno 
na częstotliwość, jak i na amplitudę procesów przez 
dwie pętle ujemnego sprzężenia zwrotnego. Pierwszą 
pętlę stanowi połączenie ośrodka pneumotaksycznego 
z ośrodkiem wdechu. Ośrodek pneumotaksyczny ha¬ 
muje ośrodek wdechu z siłą zależną od pobudzenia, 
jakie od niego otrzymuje. Druga pętla jest dłuższa 
i obejmuje ośrodek wdechu, mięśnie wdechowe, 
mechanoreceptory i ośrodek apneustyczny. Ośrodek 
apneustyczny pobudza ośrodek wdechu, a receptory 
sygnalizujące wdech hamują ośrodek apneustyczny. 
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badanie W badaniach układu oddechowego przeprowadzo- 
ukfadu od- nych na zwierzętach stwierdzono oscylacyjne procesy 
dechowego w ośrodkach wdechu i wydechu nawet po ich izolo¬ 
waniu od mechanoreceptorów i od ośrodków nad¬ 
rzędnych. Przypuszcza się, że w ośrodkach wdechu 
i wydechu istnieją sieci komórek złożone z wielu 
zamkniętych pętli. Komórki w tych pętlach pobudza¬ 
ją się kolejno, a potencjały ich pobudzenia rozprze¬ 
strzeniają się dość wolno w pewnym obszarze, tak jak 
się to dzieje w mięśniu sercowym. Potencjał progowy 
tych komórek narasta w funkcji czasu, a pobudzenie 
dochodzi do nasycenia. Wskutek ujemnego sprzęże¬ 
nia zwrotnego między ośrodkami pobudzenie jed¬ 
nego ośrodka hamuje pracę drugiego i odwrotnie, 
co prowadzi do rytmicznej pracy układu. 

Występowanie w organizmach żywych wielu 
sprzężeń zwrotnych nasuwa pewne zasadnicze pyta¬ 
nie. W jaki sposób zapewniona jest stabilność tak 
złożonego układu, w którym istnieje bardzo duże 
prawdopodobieństwa zjawienia się dodatniego sprzę¬ 
żenia zwrotnego pod wpływem zmieniających się 
warunków zewnętrznych i wewnętrznych? W. R. 
Ashby wykazał doświadczalnie możliwość istnienia 
takiej elastycznej struktury sterowania, która za¬ 
pewnia stabilność złożonego układu niezależnie od 
homeostat zakłóceń. Skonstruował on urządzenie nazwane 
homeostatem. W sposób najbardziej ogólny można 
go nazwać układem znajdującym stan równowagi we 
wszelkich stwarzanych mu warunkach. Ogólna 
struktura homeostatu przedstawiona została na rys. 
lla. Homeostat składa się z dwóch zasadniczych 
części. Część pierwsza (I) zawiera cztery układy 
połączone ze sobą w sposób pokazany na rys. llb. 
Jak widać, połączenia te tworzą sieć licznych pętli 
sprzężeń zwrotnych. Między innymi uwzględniono tu 
również sprzężenia zwrotne działające na własny 
element. Druga część (II) homeostatu składa się 
z szeregu przełączników krokowych (działających 
wtedy, gdy któryś z parametrów osiągnie graniczną 
wartość dopuszczalną) powodujących zmianę pa¬ 
rametrów części pierwszej. 

Istota pracy układu polega na tym, że zmienne 
opisujące przebiegi w części I mogą przybierać war¬ 
tości tylko w pewnym dopuszczalnym przedziale. > 
Osiągnięcie granic przedziału przez którąkolwiek ze 




Rys. 11. Homeostat: a) struktura ogólna, b) pętle sprzężenia 
zwrotnego między układami homeostatu 


zmiennych (np. prądu w elemencie części I) powoduje 
wysłanie odpowiedniego sygnału do części II i zadzia¬ 
łanie przełączników krokowych, zmieniających para¬ 
metry części I. Jeśli część I osiągnie stan równowagi 
wewnątrz obszaru dopuszczalnych wartości, to prze¬ 
łączniki części II.będą nieruchome —i całość znajdzie 
się w stanie równowagi. Bardziej prawdopodobna jest 
jednak taka sytuacja, że któraś ze zmiennych w części 
I osiągnie wartość graniczną — wtedy zadziała część 
II, zmieniająca parametry części I, i rozpocznie się 
nowy cykl pracy zmian przebiegów w części I, który 
zakończy się bądź osiągnięciem stanu równowagi, 
bądź osiągnięciem przez którąś ze zmiennych war¬ 
tości granicznej, co poprowadzi do następnego cyklu 
pracy. Cykle będą się powtarzać dopóty, dopóki 
układ nie znajdzie się w stanie równowagi. 


Przypuśćmy na chwilę, że w układzie zmieniają się 
tylko dwie zmienne, czyli prądy / x i / 2 . Na rys. 12 
podano kilka przykładów tzw. płaszczyzn fazowych 
(w technice i matematyce stosuje się termin obrazy 
fazowe), tzn. zestawu krzywych obrazujących wza- płaszczyzny 
jemne powiązania wielkości i t i i 2 . Strzałki oznaczają fazowe 
kierunek zmian zachodzących w miarę upływu czasu. 

Chwilową wartość prądu charakteryzuje pewien 
punkt * poruszający się po krzywych. Ponadto na 
rysunkach podano linie ograniczające brzegi dopusz- 





Rys. 12. Przykłady płaszczyzn fazowych 


czalnych zmian wartości zmiennych. Gdy punkt x> 
poruszając się w miarę upływu czasu, osiągnie brzeg 
obszaru, nastąpi opisane wyżej zadziałanie układu 
krokowego i zmiana płaszczyzny fazowej na inną. 

Uwidacznia to rys. 13. Wprowadzono tu trzecią 
zmienną s , ilustrującą stan przełączników. Zmienna 
ta może przybierać dyskretne wartości, tzn. że zmie¬ 
nia się skok owo od wartości do s 2 , dalej do s 3 itd. Na 
rys. 13 podano przykładowy ruch punktu x obrazują¬ 
cy zmiany prądów / x i i 2 w miarę upływu czasu i po¬ 
szukiwania stabilnej płaszczyzny fazowej, czyli 
takiej, przy której punkt równowagi (węzeł trwały) 
znajduje się wewnątrz obszaru. Jak widać z rysunku, 
płaszczyzną tą okazała się płaszczyzna przy wartości punkt 
s 3 . W praktyce jednak poszukiwanie punktu stabilne- równowagi 
go może trwać bardzo długo. Interesujące własności 





Rys, 13. Ruch punktu po płaszczyznach fazowych przy uwzględ¬ 
nieniu zmian parametru s 
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opisanego tu urządzenia ujawniają się, gdy ekspery¬ 
mentator wprowadza do układu nowe zmiany, np. 
zmienia kierunki lub wartości prądów w elementach 
części I. Okazuje się, że nawet bardzo duże i złośliwe 
zmiany parametrów homeostatu (tzn. takie, które 
powodują powstanie pętli dodatniego sprzężenia 
zwrotnego) nie mogą uniemożliwić znalezienia sta¬ 
nu stabilnego, wydłużają tylko czas jego poszuki¬ 
wania. 

Warto zwrócić uwagę na to, że homeostat posiada 
dwa typy sprzężeń zwrotnych. Jedne z nich (przed¬ 
stawione na rys. 11) są pętlami lokalnymi realizują¬ 
cymi oddziaływania między poszczególnymi zmien¬ 
nymi, a sprzężenia zwrotne drugiego typu działają nad¬ 
rzędnie i włączając się okresowo zmieniają związki 
między elementami powiązanymi przez pętle lokalne. 
Pętla nadrzędna działa dopóty, dopóki układ nie 
osiągnie zamierzonego celu, jakim jest w tym wypad¬ 
ku osiągnięcie stanu równowagi stabilnej. 

Takie właśnie hierarchiczne struktury występują 
w organizmach żywych, a homeostat jest jednym 
z przykładów ich ogromnych możliwości. Przykłady 
innych złożonych struktur będą podane w następnym 
rozdziale. 


IMeurocybernetyka 


Najbardziej rozwinięty dział biocybernetyki, neurocy- 
bernetyka, zajmuje się modelowaniem i analizą 
procesów w układzie nerwowym. Jej rozwój wiąże 
się oczywiście z rozwojem badań neurofizjologicz¬ 
nych, a zwłaszcza z rozwojem teorii działania pod- 


drzewko dendrytowe 



stawowego elementu systemu nerwowego, jakim jest 
komórka nerwowa, czyli neuron. Z rys. 14, na którym 
przedstawiono różne typy neuronów, widać, że nawet 
anatomicznie jest to zwykle bardzo skomplikowany 
element. 

W latach trzydziestych panowała opinia, że do¬ 
kładniejszy, a zwłaszcza matematyczny opis zarówno 
neuronu, jak i układów złożonych z większej liczby 
tego typu elementów jest praktycznie niemożliwy. 
Punktem zwrotnym prac w tym zakresie był opubli¬ 
kowany w 1943 r. artykuł W.S. Mc Cullocha i W. Pit- 
tsa, w którym na podstawie ówczesnych danych 
o własnościach neuronu stworzono teoretyczne pod¬ 
stawy analizy sieci złożonych z bardzo uproszczo¬ 
nych modeli neuronów. Dzięki odpowiedniemu 
sformułowaniu własności elementów i charakteru 
sygnałów wejściowych można było wykorzystać 
aparat logiki matematycznej do analizy ogólnych 
własności tego typu sieci. 
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Wprowadzony przez Mc Cullocha model elementu, 
nazywany zwykle neuronem formalnym, może się 
znajdować w jednym z stanów, dwu a mianowicie 
w stanie pobudzenia (aktywności) — oznacza się go 
zwykle umownie 1 — lub w stanie niepobudzenia 
(pasywności), który oznaczamy umownie 0. Zmiana 
stanu jest możliwa jedynie w ustalonych momentach 
czasu t y /+1, /+ 2 , ..., t+ky które można określić za 
pomocą liczb całkowitych. Każdy neuron formalny 
posiada wejścia pobudzające i hamujące (rys. 15). 
Zostaje on pobudzony wówczas, gdy liczba wejść, 
do których przyłożono sygnały pobudzające, jest 
większa od zadanej wartości, zwanej wartością pro¬ 
gową, i gdy jednocześnie nie działa żadne wejście 
hamujące. Tak np. w układzie podanym na rys. 15, 
jeżeli próg ma wartość 2, muszą zostać pobudzone 
dowolne trzy wejścia pobudzające spośród czterech 
narysowanych x u x 2 , x 3f x t , a jednocześnie na wej¬ 
ściach hamujących x s i x s pobudzenia muszą być 
równe zeru. 

Późniejsze badania neurofizjologiczne wykazały, 
że warunkiem pobudzenia jest, aby różnica między 
liczbą wejść pobudzających a liczbą wejść hamują¬ 
cych była równa wartości progowej lub większa od 
niej. Rozszerza to możliwości sieci. Ponadto uważa 
się, że każdy element wprowadza jednostkowe opóź¬ 
nienie (np. 1 milisekundę), równe czasowi trwania 
jednego taktu pracy sieci. 

Z tak zdefiniowanych elementów można zestawić 
proste sieci realizujące podstawowe działania lo¬ 
giczne. Łącząc np. elementy w sposób podany na 
rys. 16, na wyjściu neuronu formalnego o progu 1 
otrzymamy pobudzenie wtedy, i tylko wtedy, kiedy 
zostanie pobudzony co najmniej jeden neuron wej¬ 
ściowy. Zapisując to w sposób formalny, otrzymamy: 

N(t+l) = W,(t) V W 2 {t)\j W 3 (t)\J ... V W n (t\ 

gdzie N(t -f 1) — stan pobudzenia neuronu wejściowe¬ 
go w chwili r+1; W(t)i — stan pobudzenia neuronu i 
w chwili t ; a zatem sieć realizuje sumę logiczną zda¬ 
rzeń, którymi są sygnały wejściowe. 

Jeżeli w tej samej sieci dokonamy pewnej zmiany, 
a mianowicie próg będzie równy liczbie neuronów 
wejściowych n, to wyjście będzie pobudzane jedynie 
wówczas, gdy pobudzone zostaną wszystkie wejścia. 
Oznacza to, że sieć realizuje iloczyn logiczny 

N(t+ 1) = Wtf/jA W«/)A ... A W n {t). 


wejście 



wejście 
hamujące y 

t 
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model 
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Liczne prace dotyczące tego typu sieci wykazały, 
że mają one ogromne możliwości i mogą realizować 
bardzo szeroką klasę procesów, o których dawniej 
myślano, że są możliwe jedynie w organizmach ży¬ 
wych. W szczególności sieci te mogą modelować od¬ 
ruchy warunkowe, to znaczy mogą się uczyć reagowa¬ 
nia na bodziec warunkowy, który przez pewien czas 
towarzyszył bodźcowi bezwarunkowemu. Na rys. 17 
przedstawiono sieć, która w uproszczony sposób rea¬ 
lizuje powstanie odruchu warunkowego. W układzie 
są dwa wejścia: wejście bezwarunkowe BB i wejście 
warunkowe BW. Bodziec bezwarunkowy pobudza 
neuron I, a ten sygnałem podwójnej intensywności 
(dwa wejścia) pobudza z kolei neuron wyjściowy VI. 
Pobudzenie jedynie wejścia warunkowego BW nie 
wystarcza do pobudzenia komórki VI, która ma próg 
2. Łączne pobudzenie obu wejść uruchamia komórkę 
iloczynową III, ta zaś z kolei komórkę V. Wskutek 
zastosowania sprzężenia zwrotnego impuls zjawiający 
się na wyjściu neuronu V jest z powrotem przykładany 
na jego wejście. Otrzymujemy układ samowzbudny, 
w którym stale krążą impulsy (jeśli nie zostaną przer¬ 
wane przez przyłożenie sygnału hamującego z neuro¬ 
nu IV). Po takim łącznym zjawieniu się sygnałów na 
obu wejściach stan modelu jest więc inny i przy na¬ 
stępnym pobudzeniu wystarczy już przyłożenie bodź¬ 
ca jedynie do wejścia BW, aby (łącznie ze stale do¬ 
cierającymi sygnałami z komórki V) pobudzić ko¬ 
mórkę wyjściową VI. 

Jak widać, komórka V została tu wykorzystana jako 
element pamięciowy. Ponadto przewidziano tu 
wygaszanie odruchu za pomocą komórki IV. Jak 
wspomniano, samo przyłożenie bodźca warunkowego 
pobudza komórkę IV i wygasza komórkę V. 

Układy tego typu mogą być bardzo rozbudowane, 
tak aby tworzenie się odruchu nastąpiło dopiero po 
wielokrotnym przyłożeniu pary bodźców: warunko¬ 
wego i bezwarunkowego. 

Nowe informacje o własnościach komórek nerwo¬ 
wych wykazały, że są to elementy znacznie bardziej 
skomplikowane. Wiele prac neurocybernetycznych 
w latach sześćdziesiątych poświęcono modelowaniu 


własności zarówno pojedynczych neuronów, jak i pro- modele 
stych sieci złożonych z takich modeli. Na rys. 18 neuronu 
przedstawiono przykładowy schemat elektronicznego 
modelu neuronu, a na rys. 19 — zdjęcie tego typu 
modeli wykonanych w Zakładzie Bioniki byłego 
Instytutu Cybernetyki Stosowanej PAN. Nadal nie 
ma jednak jednolitych poglądów na temat tych 
własności neuronu, które są najbardziej istotne 
z punktu widzenia przekazywania i przetwarzania 
informacji w systemie nerwowym. 

Rys. 20 przedstawia schemat funkcjonalny mo¬ 
delu, neuronu, w którym wykorzystano obecne po¬ 
glądy na przebiegi zjawiska w neuronie. Układ ma 
szereg wejść, z których jedne przenoszą pobudzenia, 
inne — hamowania. Sygnały wejściowe mnożymy 
przez pewien współczynnik wt , zwany wagą wejścia, 
następnie sygnały z wszystkich wejść sumujemy i otrzy¬ 
mujemy wypadkowy sygnał pobudzający: 

k 

e £ = £ xt Wi(ui), 
i=1 

przy czym k — liczba wejść, Wi(ut) — waga /-tego 
wejścia, Ui — sygnał sterujący wielkością wagi. 

W omawianym modelu wprowadzono drugi rodzaj 
wejść w postaci sygnałów u, zmieniających wartość 
wagi wejścia. Przypuszcza się, że z istnieniem tego 
rodzaju sygnałów związane są tzw. plastyczne włas¬ 
ności neuronu, czyli możliwość uczenia się. Jeżeli 
wy stępują sygały u, można modelować wytwarzanie 
odruchów warunkowych oraz inne zjawiska związane 
z procesami uczenia się w organizmach żywych. 

Neuron odznacza się pewną bezwładnością, co ozna¬ 
cza, że jego zachowanie się zależy od częstości impul¬ 
sów przykładanych do wejść. Dlatego też model 
neuronu zawiera element inercyjny o charakterze 
układu całkującego RC , uśredniającego w pewnym 
zakresie przebieg e £ . Następnym blokiem jest tzw. 
generator progowy impulsów. W bloku tym wytwa¬ 
rza się krótki impuls o stałej amplitudzie za każdym 
razem, gdy wypadkowe pobudzenie e £ przekracza 
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wartość progową. Im większa jest różnica pomiędzy 
wartością progową a ei , tym większa jest częstotli¬ 
wość generowanych impulsów. Ponadto w modelu 
neuronu uwzględnia się stałe opóźnienie, występujące 
z reguły w komórce nerwowej. Sygnał wyjściowy z mo¬ 
delu może być podany na wejścia większej liczby in¬ 
nych neuronów sieci modelujących pewne fragmenty 
tkanki nerwowej. 


procesów elektrycznych w tkance) tylko w nielicz¬ 
nych wypadkach można ustalić ogólne zasady łą¬ 
czenia neuronów w sieci. Takim przykładem mogą 
być sieci warstwowe z połączeniami lokalnymi 
(rys. 21). Sieci podobnego typu odgrywają prawdo¬ 
podobnie istotną rolę w procesie przetwarzania 
informacji wzrokowej docierającej do siatkówki oka. 
Wykazano m.in., że sieci te mogą służyć do wykry- 




Rys. 19. Modele neuronu (a) i utworzona z nich sieć (b) 




Rys. 20. Schemat funkcjonalny modelu neuronu 


Podstawowe zagadnienie, które się pojawia na tym 
etapie badania procesów w układzie nerwowym, 
polega na ustaleniu sposobu połączeń między neuro¬ 
nami, czyli struktury sieci. Na podstawie niektórych 
sieci danych anatomicznych oraz przesłanek wynikają- 
neuronów cych z badań elektrofizjologicznych (czyli badań 
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wania pewnych cech lokalnych obrazu, takich jak 
zakończenia, załamania i zagięcia linii, jak również 
skrzyżowania i rozgałęzienia. 

W wyniku badań nad procesami rozpoznawania modele 
obrazów zachodzącymi w tzw. analizatorze wzroko- percepcji 
wym, czyli w części układu nerwowego zajmującego wzrokowej 
się analizą sygnałów docierających do siatkówki oka. 


Rys. 21. Sieć warstwowa z połączeniami lokalnymi 



























zbudowano szereg modeli percepcji wzrokowej. Ba¬ 
daniom tym zawdzięczamy udoskonalenie urządzeń 
do automatycznego rozpoznawania obrazów, a zwła¬ 
szcza do skonstruowania automatycznych czytników 
tekstów drukowanych lub maszynopisowych (czyt¬ 
niki takie są już stosowane w polskich drukarniach 
przy automatycznym składaniu tekstów). 

Oprócz prac nad modelowaniem procesów per¬ 
cepcji wzrokowej i słuchowej modelowano również 
sterowanie mięśniami. Z teoretycznego i praktycz¬ 
nego punktu widzenia jest rzeczą bardzo interesującą, 
w jaki sposób układ nerwowy steruje zespołem kilku¬ 
dziesięciu czy kilkuset mięśni, uwzględniając przy 
tym liczne własności mechaniczne układu ruchowego 
człowieka i zwierzęcia oraz sytuację otoczenia. Okaza - 
ło się, że część układu nerwowego sterującego ruchem 
ma również bardzo złożoną budowę hierarchiczną 
(rys. 22). Pomimo licznych badań nie mamy o niej wy¬ 
starczających informacji, by zbudować jej zadowala¬ 
jący model. Można jednak w przybliżeniu zmodelować 
najniższy stopień w hierarchii układu ruchowego, 
zawierający elementy sterujące skurczem mięśni. 



Rys. 22. Uproszczony schemat układu ruchowego ssaków 


Przykład takiego układu sterowania mięśniami 
przedstawiono na rys. 23. Ma on jedynie zilustrować 
ogólny charakter tego typu schematów. Znajdujące 
się w rdzeniu kręgowym komórki motoryczne (zwane 
niekiedy komórkami alfa) powodują skurcz włókien 
mięśniowych przez wysłanie odpowiedniego pobu¬ 
dzenia włóknami nerwowymi. Skurcz mięśnia prze¬ 
nosi się oczywiście na obiekt, którym może być np. 
podnoszony przedmiot, a ciężar tego przedmiotu 
układ wpływa na wielkość skurczu mięśnia i rozwijaną przez 
sterowania niego siłę. W mięśniu oraz w ścięgnach istnieją spe- 
mięśniami cjalne elementy pomiarowe, tzw. wrzeciona i organy 
Golgiego, służące do pomiaru skurczu mięśnia. 
Zmianę długości mięśnia l x sygnalizuje wrzeciono 
komórkom motorycznym znajdującym się w rdzeniu 
kręgowym. Dzięki organom Golgiego komórki te 
otrzymują też informację o sile rozwijanej przez 
mięsień. Również receptory czucia powierzchniowego 
mogą przekazywać bodźce do komórek motorycz- 
nych alfa. Z powyższego widać, że komórka motorycz- 
na jest pewnego rodzaju centrum skupiającym infor¬ 


macje o efekcie, jaki wywołała ona sama, powodując 
skurcz mięśnia. 

Obwodowo-rdzeniowy układ sterowania mięśniami 
zawiera zatem kilka pętli (rys. 23), a własności ele¬ 
mentów są do tego stopnia skomplikowane, że układ 
wymaga specjalnych badań modelowych. W odróż- 



Rys. 23. Funkcjonalny schemat układu sterowania mięśniem: 
lm długość mięśnia, Fobc siła obciążenia, Fm siła rozwijana przez 
mięsień, Iw sygnał ustalający długość wrzeciona, JV lt 1V t i W % 
wejścia sygnałów z innych ośrodków nerwowych 

nieniu od klasycznych układów technicznych odzna¬ 
cza się on szerokim zakresem adaptacji do zmiennych 
warunków obciążenia, stosunkowo dużą precyzją 
i szybkością działania, budzi więc zainteresowanie 
nie tylko biologów, ale i techników. Przedstawiając 
w bardzo uproszczony sposób niektóre wyniki 
badań modelowych, można powiedzieć, że proces 
sterowania skurczem mięśnia dzięki jednoczesnemu 
wykorzystaniu kilku rodzajów sygnałów wejściowych 
i kilku obwodów sterowania umożliwia znacznie 
szybszą i precyzyjniejszą regulację położenia kończyny 
niżby to było możliwe w wypadku klasycznego układu 
ze sprzężeniem zwrotnym. Ponadto analiza tego 
układu umożliwia wyjaśnienie pewnych sytuacji pato¬ 
logicznych, jak np. sztywność mięśniową oraz spa- 
styczność. 

Modelowanie wyższych szczebli układu ruchowego 
napotyka znacznie większe trudności, chociaż np. 
ostatnie wyniki badań dotyczące roli móżdżku w pro¬ 
cesie korekcji sterowania ruchem są bardzo interesu- 
ące z biocybemetycznego punktu widzenia. 

Postęp badań w neurocybemetyce jest ściśle zwią¬ 
zany z rozwojem badań w dziedzinie neurofizjologii, 
a zwłaszcza elektrofizjologii, i z wykorzystaniem 
nowoczesnych metod techniki, zwłaszcza elektroniki. 

Na podstawie współczesnych poglądów neurofizjo- układ 
logicznych można przedstawić, bardzo zresztą nerwowy — 
ogólnikowo, schematy funkcjonalnych powiązań powiązania 
(które nie budzą większych wątpliwości) pomiędzy między 
głównymi ośrodkami układu nerwowego. Przykład ośrodkami 
takiego schematu przedstawiono na rys. 24. 

Schemat ten składa się z 3 części: 

1. Układ dośrodkowy, w którym następuje prze¬ 
kazywanie i analiza sygnałów docierających z oto¬ 
czenia. Sposób analizy jest regulowany przez nad¬ 
rzędne ośrodki koordynująco-decyzyjne. 

2. Centralny układ asocjacyjno-decyzyjny, w któ¬ 
rym na podstawie stanu otoczenia, stanu organizmu, 
dotychczasowego doświadczenia i prognozy skutków 
zostaje wypracowana decyzja o reakcji organizmu. 

3. Układ odśrodkowy, w którym na podstawie pod¬ 
jętej decyzji wypracowany jest plan ruchu (ogólnej 
reakcji organizmu), uwzględniający sytuację staty¬ 
czną i dynamiczną oraz doświadczenie organizmu 
w zakresie optymalizacji ruchu. 

Ponadto wydzielić można układ koordynacji i re¬ 
gulacji różnych ośrodków, umieszczony w środkowej 
części rysunku. 

Szczególnie obiecujące są prace związane z modę- 
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Rys. 24. Funkcjonalny schemat powiązań między głównymi 
ośrodkami układu nerwowego 


Iowaniem procesów uczenia się i badania sieci neuro¬ 
nowych o zmiennej strukturze. Umożliwią one 
wyjaśnienie niektórych podstawowych procesów 
psychicznych związanych z podejmowaniem decyzji 
i zachowaniem się zwierząt oraz staną się źródłem 
koncepcji przy konstruowaniu złożonych urządzeń 
technicznych do selekcji informacji i sterowania 
złożonymi systemami. 

Jako przykład przedstawiono na rys. 25 uproszczo¬ 
ny funkcjonalny schemat układu uczącego się rozpo¬ 
znawania obrazów. Zgodnie z obecnymi poglądami 
rozpoznawanie obrazu, np. litery, cyfry, figury geo¬ 
metrycznej, fotografii osoby czy znajomych przed¬ 
miotów, odbywa się w kilku etapach. Poszczególne 
układ etapy zostały przedstawione na rysunku. Ostatecz- 
usczący się nym rezultatem rozpoznania jest ustalenie nazwy 
rozpoznający oglądanego przedmiotu; kod nazwy jest przekazany 
obrazy w organizmach żywych dalszym częściom układu 
nerwowego, a w urządzeniach technicznych — urzą¬ 
dzeniom informatyki wykorzystującym rozpoznanie. 

Ostatnie dwa (a być może trzy) etapy rozpoznania 
zawierają sterowane elementy, np. w postaci wyżej 
opisanych modeli neuronów o sterowanej wadze. 
Zadaniem układu uczącego się jest wywołanie takich 
zmian w układzie selekcji cech obrazu oraz w klasy¬ 
fikatorze, aby urządzenie rozpoznające popełniało 
jak najmniej błędów. Tak np. jedna z reguł uczenia 
się polega na tym, że przy błędnym rozpoznaniu 
zmniejszają się wagi cech, które uczestniczyły w roz¬ 
poznaniu, natomiast przy prawidłowym rozpoznaniu 
rosną wagi cech (wzmocnienia w odpowiednich 
kanałach), które się przyczyniły do prawidłowego 
rozpoznania, pozostałe ewentualnie maleją. Niekiedy 
można teoretycznie wykazać (niekiedy zaś praktycznie 
sprawdzić), że proces uczenia się doprowadza do 


rozpoznawania przez tego typu układ uczący się 
różnego typu obrazów, np. liter, cyfr lub prostych 
obrazów konturowych. Ostatnio pojawiły się rów¬ 
nież urządzenia do rozpoznawania bardziej złożo¬ 
nych obrazów, np. fotografii osób, lub dźwięków 
mowy. 



nazwa obrazu 


Rys. 25. Funkcjonalny schemat układu uczącego się rozpozna¬ 
wania obrazów 

Inne równie przydatne w przyszłości zastosowanie sterowanie 
sieci uczących się polegać będzie najprawdopodobniej robotami 
na sterowaniu ruchem różnego rodzaju robotów 
uczących się zastępowania człowieka w warunkach 
niebezpiecznych lub nużących i nieopłacalnych dla 
człowieka. 
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Fizyka medyczna 

Oskar Chomicki 

Fizykę medyczną można określić jako dział fizyki Z historycznego punktu widzenia związek pomię- związek 
stosowanej, który traktuje o zastosowaniu zasad dzy fizyką a medycyną można podzielić na dwa między 
i metod fizycznych we wszystkich dziedzinach za- okresy: przed odkryciem promieniowania jonizują- a medycyną 
pobiegania, rozpoznawania i leczenia chorób ludz- cego (promieni X i radu) i po jego odkryciu. Pierwszy i c izyką 
kich, jak również w badaniach naukowych mających okres rozpoczął się w czasach Odrodzenia — do końca 
na celu zdrowie człowieka. XIX w. (związek między fizyką a medycyną opierał 

Jest to definicja niejednoznaczna, co wynika stąd, się głównie na osiągnięciach w fizyce dokonywanych 
że fizyka medyczna należy do nauk z pogranicza przez lekarzy i na zdobyczach medycyny będących 
fizyki, biologii, medycyny i techniki. dziełem fizyków; tabela). Już Galileusz, który prawdo- 
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podobnie początkowo studiował medycynę, do badań 
nad wahadłem używał podobno własnego pulsu. 
Dopiero jednak jego rodak Santorio stał się poniekąd 
pierwszym fizykiem medycznym; on to zastosował 
termometr do mierzenia temperatury ciała ludzkiego. 

Drugi okres rozwoju fizyki medycznej, zapoczątko¬ 
wany w 1895 r. odkryciem promieni X przez Roentge¬ 
na oraz radu przez małżonków Curie, trwa do dziś. 
Sami fizycy nie mogą już przeszczepiać swoich 
odkryć do medycyny; oba te działy stały się zbyt 
rozległe i wyspecjalizowane. Powstała więc nowa 
specjalizacja, fizyka medyczna, która się włączyła do 
ścisłej współpracy z medycyną, szczególnie radiolo¬ 
giczną (tabela). 

W różnych krajach stan fizyki medycznej jest 
różny. Zależy on od wielu czynników (organizacja 
służby zdrowia, poziom ekonomiczny itp.). Liczba fi¬ 
zyków medycznych na milion ludności w 1975 r.: od 
0,02 (Nigeria) do 17 (Wielka Brytania). Znaczne róż¬ 
nice występują w tym zakresie nawet w krajach uprze¬ 
mysłowionych (np. Francja ma wskaźnik 0,9, Szwecja 
— 5,0, Polska zaś — 3,0). 

Większość fizyków medycznych pracuje w dziedzi¬ 
nie zastosowań promieniowania jonizującego, część — 


Zakres działalności fizyka medycznego 

Dziedzina 

Działalność fizyka 

Współpraca z leka¬ 
rzami w zakresie 
pracy klinicznej 

pomiary ciśnienia i szybkości krążenia 
krwi oraz płynów tkankowych 
bioelektryczna czynność ciała 
elektroniczne metody diagnostyczne 
urządzenia techniki medycznej (serce-płu- 
co, sztuczna nerka itp. — przy współpracy 
z inżynierami) 
aparatura optyczna 

ocena i planowanie dawek w radiodiagno¬ 
styce i radioterapii 
metody medycyny nuklearnej 
metody diagnostyki ultradźwiękowej 

Współpraca z leka¬ 
rzami w zakresie 
prac badawczych 

radiobiologia i biofizyka 
nowe metody pomiaru promieniowania 
nowe urządzenia do napromieniowania 
zastosowanie maszyn liczących 
zastosowanie teorii informacji do diagno¬ 
styki 

analiza aktywacyjna 
modelowanie matematyczne 

Ochrona przed 
promieniowaniem 

kontrola narażania na promieniowanie 
w szpitalach i laboratoriach 
pomiary radioaktywności całego ciała 

Nauczanie fizyki 

studenci medycyny 
radiologowie i radioterapeuci 
przyrodnicy 
studenci radiobiologii 


w dziedzinach, które nabierają coraz większego 
znaczenia, jak np. zastosowanie podczerwieni, dzie¬ 
dzina laserów, bioprądów czy mikrofal. Oblicza się, że 
np. w Wielkiej Brytanii działy te obejmują obecnie 
ok. 25% wszelkiego typu zastosowania fizyki do 
medycyny (tabela). 


Typowe zastosowania fizyki w medycynie 


wmms&wmmmmmmamammmmm 

Specjalność 


Zastosowanie fizyki 


Anestezjologia 

Anatomopatologia 

Chirurgia 

Dermatologia 


Fizykoterapia 

Ginekologia i 
położnictwo 
Kardiologia 


Laryngologia 
Medycyna ogólna 

Neurologia i 
neurochirurgia 
Ochrona przed 
promieniowaniem 
Okulistyka 
Radiologia i 
radioterapia 
(onkologia) 


zastosowanie fizyki gazów, analiza gazów 
optyka mikroskopowa, technika radio¬ 
izotopowa 

urządzenia biomechaniczne, technika ra¬ 
dioizotopowa 

leczenie chorób skóry przez naświetlanie, 
pomiary kolorymetryczne, technika radio¬ 
izotopowa 

leczenie krótkofalowe i mikrofalowe, sty¬ 
mulatory elektryczne, telemetria 
technika radioizotopowa, ultradźwięko¬ 
wa, promieniolecznictwo 
elektrokardiografia, fonokardiografia, ba- 
listokardiografia, pobudzenie mięśni, apa¬ 
ratura do badania ciśnienia i przepływu 
krwi, stymulatory serca 
aparatura audiometryczna 
technika radioizotopowa, zastosowanie 
ultradźwięków, technika podczerwieni 
zastosowanie ultradźwięków, elektroen¬ 
cefalografia 

ustalenie przepisów bezpieczeństwa pracy, 
pomiar skażeń promieniotwórczych 
zastosowanie laserów i ultradźwięków 
scyntygrafia, wzmacniacze obrazu, pomia¬ 
ry zawartości minerałów w kościach, do¬ 
zymetria, planowanie leczenia 


Najważniejsze rodzaje zastosowania termografii medycznej 


Specjalność 

Zastosowanie 

Onkologia 

wykrywanie raka sutka i przerzutów no¬ 
wotworowych 

Interna 

choroby układu krążenia 

Ortopedia 

lokalizacja uszkodzeń mięśni, stawów 

i kręgów 

Ginekologia i 
położnictwo 

lokalizacja łożyska 

Dermatologia 

badania stopnia oparzenia, odmrożeń; 
chirurgia plastyczna 

Farmakologia 

badanie skuteczności Icków i niektórych 
metod leczenia 


Główne zadania stojące przed fizykiem medycznym 
wiążą się z jednej strony z pracą w zakładach fizyki 
akademii medycznych, które są terenem intensywnej 
działalności dydaktycznej i badawczej związanej 
z ogólnymi zagadnieniami medycznymi, z drugiej zaś 
strony pozostają w związku z jego pracą w służbie 
zdrowia, przede wszystkim w szpitalu, tylko bowiem 
szpital — z uwagi na swoje możliwości materialne 
i organizacyjne — może stanowić bazę działalności 
fizyka, wymagającego skomplikowanej i kosztownej 
aparatury i odpowiedniego zrozumienia ze strony 
personelu lekarskiego. Odpowiedzialność lekarza 
i fizyka dzieli się w ten sposób, że lekarz zleca okre¬ 
ślone badanie lub metodę leczenia, do którego wy¬ 
magane jest zastosowanie aparatury lub metody 
fizycznej, natomiast fizyk dba o to, aby postępowanie 
było poprawne metodycznie i pozwoliło na uzyskanie 
zamierzonego skutku. 

Zadania fizyka medycznego w służbie zdrowia 
dzielą się na rutynowe i badawcze. Do zajęć ruty¬ 
nowych należy troska o niezawodność aparatury 
i rzetelność otrzymywanych wyników, co zwykle 
sprowadza się do nadzoru nad konserwacją aparatury 
i nad personelem technicznym obsługującym urzą¬ 
dzenia do standardowych badań (przeliczniki, ka¬ 
mery, elektrokardiografy, encefalografy itp.). 

O wiele ważniejsza i wymagająca wyższych kwali 
fikacji jest działalność fizyka medycznego w prowa- 
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badania dzeniu badań naukowych i opracowywaniu nowych 
naukowe rozwiązań technicznych problemów medycznych 
stawianych przez lekarza. Fizyk może się w tym za¬ 
kresie wykazać całą swoją wiedzą fizyczną, gdyż dzie¬ 
dziny badań medycznych mogą być bardzo rozległe, 
od chirurgii kości, rehabilitacji (zastosowania mecha¬ 
niki) począwszy, przez okulistykę (zastosowania opty¬ 
ki), fizykoterapię (zastosowanie prądu elektrycznego 
i elektrostatyki), aż do radiodiagnostyki, radioterapii 
i medycyny nuklearnej (zastosowanie fizyki atomo¬ 
wej). Wszechstronność wykształcenia fizyka pozwala 
na efektywną współpracę z lekarzami różnych specjal¬ 
ności, a równocześnie zapewnia ścisły, ujęty matema¬ 
tycznie (w miarę możliwości) pogląd na zagadnienia 
medyczne. 

zadania w Fizyk medyczny znajduje rozległe pole działania 
ochronią ra- w zakresie ochrony przed promieniowaniem. Pro- 
diologicznej wadzi badania radioaktywności naturalnej środowi¬ 
ska, sprawuje stały nadzór nad poziomem skażeń 
promieniotwórczych, które mogą wystąpić wskutek 
pracy takich urządzeń jak reaktory czy elektrownie 
atomowe, oraz współuczestniczy w pracach bardziej 
podstawowych, mających na celu badanie efektów 
promieniowania na tkankę czy komórkę. W Polsce 
wielu fizyków medycznych uzyskało tytuł inspektora 
ochrony radiologicznej, co podkreśla wagę pełnio¬ 
nych przez nich funkcji. 

zadania w Rola fizyka medycznego w zakresie radiodiagno- 
radiodiagno- styki polega na nadzorze nad bezpieczeństwem i higie- 
styce ną pracy, na czuwaniu nad typową aparaturą i przede 
wszystkim na ścisłej współpracy z lekarzem w opra¬ 
cowywaniu lub adaptowaniu nowych metod diagno¬ 
styki (nowe badania kontrastowe, tomografia, angio¬ 
grafia, kseroradiografia, zastosowanie wzmacniacza 
obrazu itp.). Należy podkreślić, że działalność fizyka 
podnosi w sposób zasadniczy jakość wykonywanych 
badań; przez ścisłą kontrolę aparatury osiąga się 
ponadto optymalizację dawki promieniowania użytej 
przy badaniu. 

zadania w W radioterapii fizyk medyczny odgrywa jeszcze 
radioterapii ważniejszą rolę: zajmuje się przede wszystkim 
planowaniem leczenia, a poza tym — opracowywaniem 
dodatkowych urządzeń do kierowania wiązką, kali¬ 
bracją aparatury i rozwojem nowych metod radio- 
terapeutycznych. 


Promieniowanie jonizujące 
w medycynie 

Promieniowanie jonizujące Jest terminem, przez 
który będziemy przede wszystkim rozumieć promie¬ 
niowanie składające się z cząstek naładowanych, 
takich jak elektrony, pozytony, protony, deuterony, 
cząstki alfa, piony, oraz cząstek nienaładowanych, jak 
fotony czy neutrony. Wszystkie te cząstki niosą 
ze sobą pewną energię i dopiero częściowe przekaza¬ 
nie tej energii materii, przez którą przechodzą, pozwa¬ 
la na ich wykrycie. Nas będą oczywiście interesować te 
rodzaje wzajemnego oddziaływania promieniowania 
i materii, które albo umożliwiają stosowanie urządzeń 
wykrywających promieniowanie (detektorów), albo 
powodują uszkodzenie lub zniszczenie tkanki, 
cząstki Przechodząc przez materię, naładowana cząstka 
naładowane może wywoływać jonizację, tj. wybijać elektrony z ato- 
— jonizacja mów, wzbudzać atomy, rozrywać wiązania czą¬ 
steczkowe, a także, jeżeli zostanie nagle zahamo¬ 
wana lub przyśpieszona, wysyłać promieniowanie 
elektromagnetyczne, zwane promieniowaniem hamo¬ 
wania. Z biologicznego punktu widzenia najważniejszą 
sprawą jest jonizacja wywołana przez cząstkę w tkan¬ 
ce. Im cząstka jest cięższa, tym szybciej traci energię 
i tym wcześniej jest zatrzymana, a więc jej zasięg 
jest mniejszy. Na przykład zasięg cząstki alfą w tkance 
wynosi ok. 0,07 mm, cząstki beta (elektrony) — 
4,2 mm (przy energii 1 MeV). Jeśli energia elektro- 
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nów wynosi kilkanaście MeV, zasięg ten wzrasta 
do kilku cm. Krzywa zależności zasięgu od energii 
elektronów przekazanej tkance (rys. 1) ma kształt 
przypominający prostokąt o stosunkowo stromych 
zboczach. 



Rys. 1. Zależność zasięgu promieniowania jonizującego od energii 
(energia promieniowania jest wyrażona w jednostkach względ¬ 
nych) 


Promieniowanie nienaładowane, a więc przede cząstki 
wszystkim promieniowanie rentgenowskie lub gamma, nienałado- 
zachowuje się zupełnie inaczej przy przejściu przez wane — 
materię. We wzajemnym oddziaływaniu indywidua!- różnorodne 
nego fotonu X lub gamma i elektronu przekazanie procesy 
energii odbywa się wieloma sposobami. Cechą 
charakterystyczną wzajemnego oddziaływania wiązki 
fotonów X lub gamma i materii jest wykładnicza 
zależność energii przekazanej przez wiązkę promie¬ 
niowania od grubości ciała pochłaniającego (krzywa 
na rys. 1; gdy cząstki są ciężkie, jak deuterony, krzywa 
ma charakterystyczne, ostre maksimum). 


promieniowanie X lub y 
pada na układ biologiczny 



Rys. 2. Schemat oddziaływania promieniowania X lub y z ukła¬ 
dem biologicznym. Całkowite pochłonięcie energii padającego 
fotonu X lub y następuje po ok. 30 kolejnych aktach takiego od¬ 
działywania 




















,,historia By wyjaśnić złożoność procesów pochłaniania 
życia" i rozpraszania promieniowania X padającego na 
fotonu układ biologiczny rozpatrzmy „historię życia” fotonu 
(rys. 2). Można przypuścić, że pierwotne wzajemne 
oddziaływanie fotonu i elektronu następuje w odle¬ 
głości średniej drogi przebytej w tkance. Z obliczeń 
wynika, że odległość ta wynosi 56 cm. Stosując 
teraz odpowiednie wzory opisujące rozproszenie 
i pochłanianie, otrzymamy, że ze 100 fotonów pada¬ 
jących o energii 20 MeV powstaną w pierwotnym od¬ 
działywaniu 44 pary elektron-pozyton, 56 szybkich 
elektronów comptonowskich oraz 56 rozproszonych 
fotonów o średniej energii 5,4 MeV. Pary elektron- 
pozyton ulegną anihilacji, dając początek 88 fotonom 
o energii 511 keV. Dalej śledzić będziemy los fotonów 
powstałych z anihilacji, choć podobne rozważania 
można by również zastosować do fotonów rozproszo¬ 
nych o energii 5,4 MeV. 

Otóż po przebyciu w tkance drogi 10,3 cm owych 
88 fotonów ulegnie rozproszeniu comptonowskiemu, 
tzn. powstanie 88 elektronów comptonowskich o ener¬ 
gii 175 keV i 88 rozproszonych fotonów o energii 
336 keV. Fotony te przebędą średnią drogę 9,1 cm 
do następnego miejsca oddziaływania. Proces ten 
będzie się powtarzał aż do chwili, gdy energia foto¬ 
nów spadnie do kilkunastu keV, a wówczas zacznie 
przeważać proces fotoelektryczny, będzie wzrastała 
liczba fotoelektronów i będzie się zmniejszała liczba 
fotonów comptonowskich, aż pozostanie tylko jeden 
foton; a zatem proces rozproszenia i pochłaniania 
pierwotnych 100 fotonów o energii 20 MeV zostanie 
zakończony. Tak przedstawiona „historia życia” 
fotonu jest, oczywiście, bardzo uproszczona, ale 
przy zastosowaniu statystycznej metody Monte 
dawka Carlo i obliczeń komputerowych, do np. 500 000 
pochłonięta; „historii”, uzyskuje się poprawny ilościowy opis 
grej zjawisk pochłaniania i rozpraszania w tkance, co ma 
wielkie znaczenie przy określaniu dawki pochłoniętej. 
Jednostką dawki pochłoniętej jest grej — Gy; jest to 
dawka, przy której substancja o masie 1 kg pochłania 
energię 1 J (poprzednio stosowaną jednostką był rad; 

1 rad = 10” 2 Gy). Średnia dawka śmiertelna dla czło¬ 
wieka, którego całe ciało zostało napromieniowa¬ 
ne promieniami X lub gamma, wynosi ok. 4 grejów, 
dopuszczalna zaś dawka roczna < 5*10- 2 Gy. Ponie¬ 
waż różne rodzaje promieniowania wywołują różny 
skutek biologiczny, wprowadza się tzw. współczynnik 
jakości promieniowania QF, który przy promienio¬ 
waniu X, gamma i elektronów równy jest 1, a np. przy 
szybkich neutronach sięga 10. Tak zwany równo¬ 
ważnik dawki jest określony jako iloczyn dawki po¬ 
chłoniętej i współczynnika QF: stosowaną powszech¬ 
nie jednostką równoważnika dawki jest rem (1 rem jest 
to równoważnik dawki 1 rad promieniowania o współ¬ 
czynniku QF = 1). 

Skutki działania promieniowania na ustrój zależą 
od wielu czynników: od wielkości dawki w okre¬ 
ślonej jednostce czasu, od masy ciała czy tkanki, 
wreszcie od biologicznych cech ustroju i wrażliwości 
jego poszczególnych tkanek. Pochłonięcie energii jo¬ 
nizacji przez komórkę powoduje zasadnicze zmiany 
skutki w procesach wewnątrzkomórkowych, szczególnie 
działania w jądrze komórki: może nastąpić śmierć komórki, 
promienio- zahamowanie podziałów komórkowych, uszkodzenie 
wanaa chromosomów lub zmiany czynnościowe. Okazuje się, 
że wiele komórek może przeżyć dawki kilkuset rem, 
toteż, by całkowicie zniszczyć np. tkankę nowotwo¬ 
rową, stosuje się dawki sięgające kilkunastu lub kilku¬ 
set tysięcy rem na określonym obszarze. Od 
dawna wiadomo, że promieniowanie jonizujące może 
pociągać za sobą szkodliwe skutki genetyczne; na 
ogół są one proporcjonalne do wielkości dawki, 
prawdopodobnie jednak nawet najmniejsze dawki, 
nawet pojedyncze akty jonizacji mogą prowadzić 
do mutacji genetycznych Szczególnie wrażliwy na 
promieniowanie jest organizm ludzki w czasie życia 
płodowego i to przede wszystkim w najwcześniejszym 
okresie 5-6 tygodni. Ponadto niektóre tkanki i na¬ 


rządy ciała ludzkiego, np. skóra, układ krwiotwórczy 
i limfatyczny, narządy rozrodcze, soczewka oka, 
błona śluzowa jelit, wykazują wysoką promienio- 
czułość. 

Wszystkie te względy narzucają konieczność 
określenia maksymalnej dopuszczalnej dawki pro¬ 
mieniowania jonizującego — i to różnej dla róż¬ 
nych grup ludności. Dla pracowników bezpośrednio 
narażonych na promieniowanie dawka nie powinna 
przekraczać 1,3 rema na kwartał, a w żadnym razie 
5 (A^— 18) remów w całym życiu (gdzie N jest wiekiem 
pracownika). Dla każdego człowieka dopuszczal¬ 
na jest dawka 5 remów w ciągu pierwszych 30 lat 
życia. 

Ludność narażona jest na promieniowanie jonizu¬ 
jące pochodzące z promieniowania kosmicznego, 
z promieniowania naturalnych pierwiastków promie¬ 
niotwórczych oraz z promieniowania stosowanego w 
radiodiagnostyce i radioterapii, ponadto — w krajach 
uprzemysłowionych — na promieniowanie pochodzą¬ 
ce z zakładów przemysłowych i instytutów badaw¬ 
czych stosujących radioizotopy, a także z pracują¬ 
cych elektrowni atomowych. Dokładna analiza wszy¬ 
stkich źródeł promieniowania jonizującego w Polsce 
prowadzi do wniosku, że przyjęta największa dopusz¬ 
czalna dawka 5 rem na 30 lat uwzględnia z nadmia¬ 
rem bezpieczeństwo całej ludności, nawet przy in¬ 
tensywnej rozbudowie do 2000 r. elektrowni atomo¬ 
wych. 

Z drugiej strony — oddziaływanie promieniowa¬ 
nia jonizującego na materię, o którym mówiliśmy 
wyżej z punktu widzenia jego szkodliwości dla orga¬ 
nizmu, pozwala na jego wykrywanie przy zastoso¬ 
waniu tzw. mierników promieniowania. Podstawowa 
zasada działania takich mierników ukazana jest na 
rys. 3. Zasadniczym elementem miernika jest detek¬ 
tor, tj. urządzenie służące do przetwarzania energii 
promieniowania na energię (sygnał) dogodną do po- 
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Rys. 3. Schemat typowych układów pomiarowych do mierzenia 
promieniowania jonizującego 


miaru (najczęściej prąd elektryczny). W komorze 
jonizacyjnej jest to prąd ciągły a w licznikach Geige- 
ra-Miillera, w licznikach proporcjonalnych oraz 
scyntylacyjnych — prąd impulsowy, który następnie, 
po wzmocnieniu, zostaje zmierzony w układzie po¬ 
miarowym. 

Konstruuje się mierniki różnego rodzaju, zależnie 
od rodzaju promieniowania i od celu, któremu mają 
służyć. Dzisiaj jednak są to przeważnie tzw. liczniki 
scyntylacyjne, o których będzie mowa dalej w związ¬ 
ku z omówieniem medycyny nuklearnej. 


Radiodiagnostyka i radioterapia 

Radiodiagnostyka i radioterapia, w medycynie zwane 
łącznie radiologią, obejmują zastosowanie zarówno 
źródeł promieniowania rentgenowskiego (aparaty radiologia 
rentgenowskie) i promieni gamma czy strumieni czą¬ 
stek, jak i zamkniętych lub otwartych źródeł pro¬ 
mieniotwórczych (np. stosowane w radioterapii 
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igły radowe lub kobaltowe, które się umieszcza we¬ 
wnątrz ciała chorego, są źródłami zamkniętymi, na¬ 
tomiast radioizotop jodu 131 J, stosowany w leczeniu 
m.in. przerzutów nowotworowych, uczestniczący 
w przemianie metabolicznej w organizmie, jest 
źródłem otwartym). 

Radiodiagnostyka, zwana również rentgenodiagno- 
styką, jest najpowszechniej stosowaną metodą badań 
przy użyciu aparatów rentgenowskich. Ponieważ 
różne tkanki organizmu pochłaniają promieniowanie 
rentgenowskie w różnym stopniu, zależnie od ich 
składu chemicznego, na ekranie pokrytym substancją 
fluoryzującą pod wpływem promieni X powstaje 
obraz o różnym kontraście (rys. 4). Zamiast ekranu 
umieszcza się kliszę światłoczułą pomiędzy dwiema 
wzmacniającymi foliami, które świecą pod wpływem 
promieniowania X i dodatkowo naświetlają emulsję 
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Rys. 4. Schemat otrzymywania obrazu rentgenowskiego na przy¬ 
kładzie prześwietlenia podudzia. Zmiana natężenia wiązki po 
przejściu przez tkanki zależy od ich rodzaju 


kliszy fotograficznej. Zdjęcia rentgenowskie są nega¬ 
tywami i są zawsze w tej postaci interpretowane przez 
lekarzy. 

Różne typy aparatów rentgenowskich przeznaczone 
są do różnych celów. I tak seriografy stosuje się 
do wykonywania wielu zdjęć w krótkim czasie, tomo¬ 
grafy służą do wykonywania zdjęć warstwowych, 
wreszcie kamery do zdjęć małoobrazkowych pozwa¬ 
lają na szybkie przeprowadzenie masowych badań 
ludności. Obecnie coraz częściej stosuje się układy 
rentgenotelewizji złożone z aparatu rentgenowskiego, 
elektronowego wzmacniacza obrazu, kamery TV 
i monitora TV (rys. 5 i ii. 25, tabl. 8). Dzięki ogromnej 
czułości wzmacniacza obrazu (kilka tys. razy większej 
niż czułość zwykłego ekranu rentgenowskiego) można 
znacznie obniżyć dawkę promieniowania pochłanianą 
przez pacjenta. Przez zastosowanie kserografii zwięk¬ 
sza się kontrast i rozdzielczość obrazów rentgeno¬ 
wskich, a ponadto unika się kłopotliwej obróbki klisz 
w ciemni fotograficznej. 

Najnowszym osiągnięciem w dziedzinie diagnostyki 
rentgenowskiej są tomografy komputerowe. Metoda 
konwencjonalnej tomografii rentgenowskiej (do zdjęć 
warstwowych) polega na tym, że lampa rentgenowska 
przesuwa się w trakcie naświetlania w jednym kie¬ 
runku, a sprzężona z nią kaseta z kliszą fotograficzną 
przesuwa się w kierunku przeciwnym (rys. 8). 

Jeżeli weźmiemy pod uwagę punkty A i B leżące 
w ciele pacjenta w płaszczyźnie obrotu układu lampa- 
kaseta PP X , to rzutami tych punktów na kliszy w jej 
pierwszym położeniu będą punkty A x i B ly w drugim 
zaś — A 2 i B 2 . Wypadną one w tym samym miejscu 
kliszy i dlatego po jej wywołaniu będą widoczne 
jako ostre, natomiast rzuty każdego punktu leżą¬ 
cego poza płaszczyzną obrotu PP X (rys. 8) wypadną 
w różnych miejscach kliszy (punkty C x i C 2 ), nawet 
znajdą się poza kliszą (punkt C,). Tak więc obraz 
tkanek leżących w płaszczyźnie obrotu układu lam- 
pa-kaseta jest ostry na zamazanym tle pochodzącym 
z nałożonych na siebie rzutów obrazów z innych 
płaszczyzn. Przez zmianę odległości lampa-kaseta 
zmienia się płaszczyznę ostrego obrazu, a zatem uzy¬ 
skuje się możliwość oglądania kolejnych warstw 
tkanek. Jedna klisza rentgenowska odpowiada tylko 
jednej płaszczyźnie, a zatem uzyskanie pełnego, 
trójwymiarowego obrazu tkanek byłoby możliwe 
jedynie po złożeniu jedna na drugiej wszystkich 
klisz, na których leżą rzuty wszystkich płaszczyzn, 
co jest technicznie niewykonalne. 

Wykorzystując minikomputer, udało się jednak za¬ 
stosować samą ideę superpozycji rzutów tomogra- 
ficznych do zbudowania nowego urządzenia, zwanego 
tomografem komputerowym. Nastąpił przewrót w me¬ 
todach diagnostycznych medycyny, jak sądzą nie¬ 
którzy— na miarę odkrycia samych promieni 
rentgenowskich. Twórcą pierwszego tomografu kom- 
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Rys. 5. Zasada zastosowania 
wzmacniacza obrazu 
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puterowego (EMI Brain Scanner) był Anglik, God- 
frey N. Hounsfield, z firmy EMI (nagroda Nobla 
1979 r.). Zastosowany w praktyce lekarskiej w 1973 r. 
tomograf służył przede wszystkim do badania mózgu. 


zaś z kolei daje możliwość odróżnienia tkanek nie¬ 
wiele różniących się gęstością. 

Pacjenta umieszcza się na kozetce przechodzącej 
przez otwór tzw. bramki skaningowej urządzenia. 



Rys. 6. Przesunięcie liniowe aparatu tomograficznego 


Tomograf komputerowy składa się z urządzenia 
przesuwającego (z lampą rentgenowską i układem 
detektorów; rys. 6 i 7), z konsoli rentgenowskiej 



ciało pacjenta 


układ detektorów | 




Rys. 7. Po fazie przesunięć liniowych aparat tomograficzny obraca 
się o 10° 


układu monitorowania i regulacji oraz z zespołu 
pamięci (dyskowej lub taśm magnetycznych) i ekranu 
TV, służących do rejestracji i oglądania otrzymanych 
obrazów. Lecz najważniejszą rolę w tomografie od¬ 
grywa szybki minikomputer, który stanowi serce ca¬ 
łego urządzenia. 

W takim tomografie bada się tkanki ciała w plas¬ 
trach grubości 13 mm, wyciętych bezkrwawo, prosto¬ 
padle do pionowej osi ciała (rys. 9). Dzięki zastoso¬ 
waniu minikomputera można przeprowadzić analizę 
niewielkich nawet różnic, w natężeniu promie¬ 
niowania po przejściu przez tkanki, a więc i współ¬ 
czynników pochłaniania promieni rentgenowskich; to 



kierunek przesuwu lampy 


ciało pacjenta 


płaszczyzna obrotu 


stół 


kierunek przesuwu kasety z kliszą 
Rys. 8. Schemat otrzymywania rzutów tomograficznych 


Kozetka może się przemieszczać wzdłuż osi poziomej 
przechodzącej przez bramkę. W bramce skaningowej 
znajduje się źródło promieni rentgenowskich i układ 
detektorów scyntylacyjnych. Źródło i detektory usta¬ 
wione są naprzeciw siebie, a pomiędzy nimi znajduje 
się badana część ciała pacjenta. Dodatkowy detektor 
mierzy natężenie pierwotnej wiązki promieni rentge¬ 
nowskich (il. 182, tabl. 47). 



Rys. 9. Metodą tomograficzną bada się kolejne plastry ciała 
pacjenta 


Badanie rozpoczyna się od fazy, w której bramka 
przesuwa się względem ciała pacjenta, przy czym 
wąska wiązka skolimowanych promieni rentgenow¬ 
skich przechodzi przez ciało i pada na układ detek¬ 
torów. W czasie jednego przesunięcia otrzymuje się 
jeden rzut tomograficzny z zarejestrowanych 18 000 
pomiarów natężenia promieniowania. Po zakończe¬ 
niu przesuwu bramka skaningowa obraca się wzglę¬ 
dem ciała pacjenta o 10°, następnie powtarza się 
przesuw z jednoczesnym pomiarem i obrót bramki 
o 10°. I tak 18 razy, aż bramka zatoczy pół okręgu, 
tzn. wykona obrót o 180°. Wartości liczbowe dla 
każdego rzutu tomograficznego są w sposób ciągły 
wprowadzane do minikomputera, który oblicza 
łącznie 80 000 wartości współczynników pochłaniania 
dla badanego obszaru ciała i przekazuje do pamięci 
dyskowej, która może przechowywać wyniki ośmiu 
obrazów — ośmiu plastrów ciała. 

Istota tomografii komputerowej polega na wyko¬ 
nywaniu dokładnych obliczeń — za pomocą mini¬ 
komputera — współczynników pochłaniania promie¬ 
ni rentgenowskich dla każdego rzutu tomograficznego 
(co odpowiada na zdjęciu obszarom o różnym za¬ 
czernieniu), a następnie rekonstrukcji matematycznej 
całkowitego obrazu plastra z tych rzutów. Współ¬ 
czynniki pochłaniania obliczane są z dużą dokład¬ 
nością. Pozwala to na uwidocznienie tkanek o małych 
różnicach gęstości, co tradycyjnymi metodami radio¬ 
diagnostyki było nieosiągalne. Układ wyjściowy z kolo¬ 
rowym monitorem telewizyjnym pozwała na ogląda¬ 
nie obrazów badanych plastrów ciała i rejestrację 
ich na kliszy (ii. 22, tabl. 8 i il. 183, tabl. 47). 
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Czas badania jednego plastra wynosi 20 s (bada 
się 8 plastrów). Średni całkowity czas badania pacjenta 
wynosi ok. 30 min, w co wlicza się czas potrzebny 
na pracę minikomputera. 

Ten nowy system przedstawiania obrazów rentge¬ 
nowskich wymaga od lekarza radiologa innego spo¬ 
sobu interpretacji, gdyż większość zdjęć wykonywano 
dotychczas w płaszczyznach równoległych do piono¬ 
wej osi ciała. Chociaż w tradycyjnej rentgen odiagno- 
styce (szczególnie w kseroradiografii) można odróż¬ 
nić szczegóły budowy tkanki kostnej z dokładno¬ 
ścią rzędu mikronów, to jednak dopiero w tomo¬ 
grafii komputerowej uzyskuje się obrazy miękkich 
tkanek ciała, a więc większości wewnętrznych 
organów' człowieka. 

Zakres medycznych zastosowań tomografii kom¬ 
puterowej jest ogromny i rozszerza się z każdym 
rokiem: począwszy od diagnostyki nowotworów czy 
zatorów w mózgu bez konieczności wprowadza¬ 
nia środka cieniującego lub powietrza (co się zawsze 
wiąże z niewygodą lub nawet niebezpieczeństwem 
dla pacjenta), poprzez badania profilaktyczne, 
spraw-dzanie wyników leczenia — aż po badanie 
dynamiki organów (np. serca) — wszędzie ta metoda 
znajduje zastosowanie. 

Obecnie prowadzi się również prace nad za¬ 
stosowaniem tomografii komputerowej w dziedzinie 
krótkożyciowych radioizotopów pozytonowych, ta¬ 
kich jak n C, ł3 N czy xs O, albo ciężkich jonów. Można 
sobie również wyobrazić zastosowanie komputero¬ 
wej metody tomograficznej w technice sonografii 
ultradźwiękowej lub w technice pól magnetycznych. 

Naczelną troską konstruktorów diagnostycznych 
aparatów rentgenowskich jest stałe dążenie do zmniej¬ 
szania dawki promieniowania związanej z badaniem. 
Natomiast w aparatach rentgenowskich stosowanych 
w terapii, przede wszystkim nowotworowej, istotne 
jest otrzymywanie możliwie silnych, jednorodnych 
i stabilnych wiązek promieni X , terapia bowiem 
polega na niszczeniu tkanki nowotworowej przy 

\ 



Z fizycznego punktu widzenia terapię rentgenow¬ 
ską podzielić można na 4 działy: do ok. 100 kV 
(terapia powierzchniowa), do ok. 150 kV (terapia 
półgłęboka), do 500 kV (terapia głęboka) oraz od ok. 

1 MV (terapia megawoltowa). Inne warunki muszą 
być spełnione, gdy chodzi o napromienianie skóry, 
a inne, gdy chodzi o tkanki nowotworowe znajdujące 
się głęboko w ciele chorego. Program napromieniania 
opracowuje lekarz radioterapeuta przy współpracy 
z fizykiem medycznym, o czym poniżej. 

W rentgenoterapii stosuje się lampy rentgenowskie 
nieruchome (terapia stacjonarna) lub lampy, które 
wykonują ruch obrotowy (terapia obrotowa). 

Oprócz terapii rentgenowskiej w leczeniu nowotwo¬ 
rów stosuje się zewnętrzną i wewnętrzną terapię 
promieniami gamma. Dawka promieniowania gamma terapia pro- 
pochłonięta przez tkanki kostne jest mniejsza niż mieniami y 
dawka promieniowania rentgenowskiego. Ponadto 
stosowanie promieni gamma pozwala na korzystniej¬ 
sze napromieniowanie tkanek nowotworowych poło¬ 
żonych głębiej w ciele przy jednoczesnym oszczędza¬ 
niu skóry. Wewnętrzna terapia gamma polega na sto¬ 
sowaniu tzw. aplikatorów w postaci igieł, walców 
itp. zawierających rad, kobalt-60, iryd-192 i cez-137, 
wprowadzanych śródtkankowo lub śródjamowo do 
organizmu. Zewnętrzna zaś terapia polega na sto¬ 
sowania aparatu do teleterapii Co-60, tzw. bomby ko¬ 
baltowej. Jest to urządzenie zawierające ładunek ak¬ 
tywności rzędu 10 14 Bq, umożliwające krótkie i inten¬ 
sywne naświetlanie tkanki nowotworowej. Problemy 
planowania teleterapii są w tym wypadku podobne do 
planowania terapii rentgenowskiej. Bomby kobaltowe 
produkowane przez firmę Siemens nazywają się gam- 
matronami (iJ. 52, tabl. 14). 

Rozważmy tu przykładowo zagadnienie planowania zastosowa- 
kuracji — za pomocą bomby kobaltowej (Co-60)— nie bomby 
pacjenta, u którego w pęcherzu wykryto zmiany kobaltowej 
nowotworowe. Po wykryciu tych zmian na zdjęciu 
rentgenowskim lekarz wskazuje fizykowi obszar 
odpowiadający anatomicznie pęcherzowi i całkowitą 


Rys. 10. Sumaryczny rozkład dawki na pęcherz ze zmianami nowotworowymi pochodzący od trzech wiązek promieniowania y izoto¬ 
pu ,0 Co 


jak najmniejszym uszkodzeniu tkanki zdrowej. Tak 
rozumiane leczenie promieniami X wymaga opraco¬ 
wania szczegółowego programu napromieniowania. 
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dawkę promieniowania, którą obszar ten ma zostać 
naświetlony. Na rys. 10, przedstawiającym przekrój 
w płaszczyźnie pęcherza prostopadły do pionowej osi 













ciała pacjenta, obszar ten obwiedzony jest czarną linią. 
Rola fizyka medycznego polega na takim dobraniu 
warunków napromieniowania, aby maksimum dawki 
przypadło w tym właśnie obszarze, pozostałe zaś czę¬ 
ści ciała zostały jak najmniej napromieniowane. W wy¬ 
padku przedstawionym na rysunku fizyk medyczny 
dobrał napromieniowanie nowotworu trzema wiązka¬ 
mi promieni gamma z trzech kierunków. Linie koloru 
izodozy niebieskiego są to tzw. izodozy, tj. krzywe łączące 
punkty o tej samej wartości daw’ki (podanej w pro¬ 
centach; dawkę odpowiadającą wiązce padającej od 
przodu przyjęto jako 100%). Izodozy te powstały z su¬ 
mowania trzech rozkładów pierwotnych izodoz, które 
dotyczyły trzech kierunków oddzielnie, a które otrzy- 
fantom mano z badań na fantomach — sztucznych układach 
własnościami imitujących ciało człowieka. Wiązki pro¬ 
mieni gamma mają w tym przykładzie „średnicę” 
8 cm i tego rzędu zasięg najefektywniejszego działa¬ 
nia. 

Przygotowanie rozkładu izodoz, tzn. dobranie 
wszystkich warunków, takich jak odległości, wielkości 
dawek, liczba kierunków napromieniowania, zasto¬ 
sowanie specjalnych filtrów formujących wiązki itp., 
jest procedurą żmudną i pracochłonną, i dlatego po¬ 
wierza się je obecnie coraz częściej odpowiednio 
zaprogramowanym komputerom. Programy na kom¬ 
puter są oczywiście pisane również przez fizyków 
medycznych. 

zastosowanie W niewiele lat po skonstruowaniu pierwszych 
akcelerato- akceleratorów typu Van de Graaffa, betatronów 
rów i akceleratorów liniowych do celów badań fizycznych 
okazało się, że mogą one być z pożytkiem wykorzysta¬ 
ne w radioterapii. Obecnie jest na świecie przeszło 
400 betatronów i akceleratorów liniowych stosowa¬ 
nych w medycynie. Liczba pacjentów leczonych 
sięga miliona rocznie, a koszt leczenia — wieluset 
milionów dolarów. 

Akceleratory służą do otrzymywania wiązek 
cząstek naładowanych, np. elektronów, protonów, 
lub pośrednio do otrzymywania wiązek cząstek nie 
naładowanych, jak neutrony i fotony. W radioterapii 
staw-ia się specjalne wymagania: energia cząstek 
musi być na tyle duża, aby dotarły one do obszaru 
now-otworu, natężenie wiązki musi być tak duże, 
żeby okres napromieniowania pacjenta był jak naj¬ 
krótszy, sama zaś wiązka musi być jednorodna i łatwa 
do regulowania i kontroli. Wreszcie zależność wiel¬ 
kości dawki od grubości tkanki musi się charakteryzo¬ 
wać szybkim narastaniem, możliwie płaskim maksi¬ 
mum i szybkim spadkiem (rys 1). 

W radioterapii wykorzystuje się najczęściej elektro¬ 
ny o energiach do 40 MeV oraz promienie A' od 8 do 
20 MeV. Stosuje się również neutrony prędkie, 
produkowane najczęściej w cyklotronach izochro- 
nicznych. Wreszcie w celach leczniczych mogą być 
stosowane protony, deuterony, a nawet piony. Stosu¬ 
jąc protony o energii przekraczającej 100 MeV i tech¬ 
nikę obrotową, otrzymuje się wyjątkowa korzystne 
warunki napromieniowania głęboko położonej tkanki 
nowotworowej przy małej dawce powierzchniowej. 
W radioterapii można również stosować wysokoener¬ 
getyczne ciężkie jony, dające dobry rozkład dawki, 
np. w wypadku nowotworów położonych głęboko. 


Medycyna nuklearna 

Uważa się powszechnie, że medycynę nuklearną 
można określić jako dziedzinę, która obejmuje wszy¬ 
stkie rodzaje zastosowania źródeł promieniowania 
jonizującego w postaci substancji radioaktywnych 
(promieniotwórczych) w diagnozie i leczeniu oraz 
w pracy badawczej z wyjątkiem zastosowania zamk¬ 
niętych źródeł promieniowania, o których była mowa 
w części poświęconej radioterapii. Medycyna nuklear¬ 
na szybko się rozwija. Wprowadza się bezustannie 
nowe radiofarmaceutyki, nowe techniki pomiaru 
i nowe testy diagnostyczne. 


Metody diagnostyczne medycyny jądrow-ej — meto¬ 
dy radioizotopowe, — opierają się na zastosowaniu 
tzw. znaczników. Atomy radioaktywnego izotopu da¬ 
nego pierw-iastka wprowadzone do organizmu zacho¬ 
wują się jak atomy pierwiastka trwałego i uczestniczą 
we wszystkich procesach metabolicznych na podo¬ 
bieństwo agentów policji zmieszanych z tłumem 
demonstrantów i wysyłających radiowa raporty 
o sytuacji. Tak samo atomy radioaktywne, wysyłając 
promieniowanie gamma (lub elektrony), które mogą 
być wykryte za pomocą detektorów promieniowania, 
dają nam znać o przebiegu procesów w organizmie, 
tkance czy komórce. Ponieważ liczba znaczników 
radioaktywnych jest znikomo mała w porównaniu 
z odpowiednimi atomami trwałymi, efekt zakłócający 
procesy biologiczne, jaki mogłoby wywrzeć promie¬ 
niowanie wysyłane przez znaczniki, jest w większości 
wypadków również znikomy. Nie można jednak 
pominąć efektu mszczącego tkankę i dlatego poda¬ 
wanie jakichkolwiek substancji radioaktywnych do 
organizmu musi być obwarowane odpowiednimi 
przepisami i zastrzeżeniami. Wszelkie substancje 
promieniotwórcze, tzw. radiofarmaceutyki, wpro¬ 
wadzane są do żywnego organizmu pod kontrolą 
lekarską. Celowo nie używamy terminu „radiolek”, 
gdyż substancje promieniotwórcze stosowane są 
w ogromnej większości do celów diagnostycznych, 
a nie leczniczych. Stosuje się je, aby zbadać funkcję 
określonego narządu w organizmie lub, aby uzyskać 
obraz struktury narządu. Muszą je charakteryzować 
cztery zasadnicze cechy: odpowiednie właściwości 
biologiczne, rodzaj i szybkość rozpadu radioizotopu, 
właściwości umożliwiające detekcję i łatwość pro¬ 
dukcji. 

Ilość radioizotopu albo raczej proporcjonalną 
do niej aktywność promieniotwórczą mierzy się 
liczbą rozpadów na jednostkę czasu. Jednostką 
aktywności jest bekerel — Bq; 1 Bq jest to aktywność, 
przy której następuje I rozpad w czasie 1 sekundy 
(poprzednio stosowaną jednostką był kiur — Cj; 

1 Ci = 3,7*10 10 Bq). Można w zasadzie przyjąć, że 
ilości radioizotopu w radiofarmaceutykach stosowa¬ 
nych diagnostycznie są rzędu 10 4 Bq, stosowanych zaś 
w radioterapii — rzędu (0,1-1)* 10 9 Bq. 

Charakterystyczną cechą każdego radioizotopu 
jest jego fizyczny czas połowicznego zaniku T’i/ 2* 
Ze względu na szkodliwość radioizotopów dla orga¬ 
nizmu oraz wymagania związane z detekcją radioizo¬ 
topy medyczne podawane w postaci radiofarmaceuty- 
ków powinny mieć czas połowicznego zaniku Ty* nie 
krótszy niż 1 min i nie dłuższy niż 100 dni; energie 
emitowanych przez nie promieni beta powinny być 
jak najniższe, a energie promieni gamma nie wieksze 
niż 1 MeV. 

Każdą substancję podawaną żywemu organ izmowi 
charakteryzuje czas, po którym organizm wydala 
połowę podanej ilości. Jest to tzw. biologiczny czas 
połowicznego zaniku T$ f2 . W rezultacie obserwowany 
czas połowicznego zaniku, tzw. efektywny czas po¬ 
łowicznego zaniku podawanego radiofarmaceutyka 
jest mniejszy od T vz w stopniu zależnym od TJ*. 
Znajomość — z obserwacji — czasu efektywnego 
pozwala łącznie z danymi o zdolności jonizacyjnej 
radioizotopu na obliczenie dawki pochłoniętej przez 
określony narząd czy tkankę. Obliczenia takie są 
skomplikowane, wymagają użycia komputerów, ale 
są niezwykle ważne w medycynie nuklearnej, gdyż 
dzięki nim można wyznaczyć efekt szkodliwości 
podawania określonego radioizotopu. Ponadto ra¬ 
dioizotopy znajdują zastosowanie w badaniach me¬ 
tabolicznych (tabela). 

Większość radioizotopów stosowanych w medycy¬ 
nie otrzymuje się w reaktorze, niektóre w cyklotronie 
( ,23 J, 62 Fe, 18 F, 21 C, 23 N i ls O). Obecnie coraz szerzej 
stosowane są radioizotopy krótkożyjące 6 h, 

takie jak " w Tc czy 113 In). Otrzymuje się je bezpośred¬ 
nio w pracowni medycznej z rozpadu dłużej żyjących 
radioizotopów macierzystych umieszczonych w tzw. 
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Metody diagnostyczne i terapeutyczne w medycynie 
jądrowej 


Diagnostyka 


Terapia 


Badanie czynności tarczycy 
Scyntygrafia tarczycy 
Badanie czynności wątroby 
Scyntygrafia wątroby 
Scyntygrafia mózgu 
Badanie czynności nerek 
Scyntygrafia nerek 
Scyntygrafia ognisk nowotworo¬ 
wych 

Scyntygrafia układu kostnego 
Scyntygrafia mięśnia sercowego 
Diagnostyka chorób układu krą¬ 
żenia 

Oznaczanie objętości krwi krą¬ 
żącej 

Diagnostyka zaburzeń ukrwienia 
Badanie metabolizmu, np. żelaza 
Badanie gospodarki wodnej 


Zastosowanie źródeł otwar¬ 
tych 

Leczenie chorób tarczycy 
Leczenie chorób krwi 
Leczenie przerzutów nowo¬ 
tworowych 

Zastosowanie źródeł zam¬ 
kniętych 

Leczenie kontaktowe i śród¬ 
miąższowe 

Wprowadzenie do przysadki 
mózgowej 

Leczenie nowotworów skóry 
za pomocą izotopów 
^“-promieniotwórczych 


Radioizotopy najczęściej stosowane w medycynie nuklear¬ 
nej i ich właściwości 


Izotop 

T iit 

Energia 

B 

Energia 

7 

Radiofarma- 

ceutyka 

Zastosowa¬ 

nie 

l *C 

5700 lat 

bardzo 

niska 

- 

liczne związ¬ 
ki orga- 
riczne 

badania 

biomedycz¬ 

ne 

"Co 

5,2 lat 

średnia 

wysoka 

źródło 

zamknięte 

leczenie 

nowotwo¬ 

rów 

•‘Kr 

10,4 lat 
(bar¬ 
dzo 
krótki 

«b) 


średnia 

gaz 

przepływ 
krwi, zabu¬ 
rzenia od¬ 
dychania 

•To 

6h 


średnia 

nadtechne- 
cjan, związ¬ 
ki znako¬ 
wane 

scyntygrafia 

tarczycy, 

nowotwo¬ 

rów 

1 |*I 

1,7 h 


wysoka 

związki che- 
latowe 

scyntygra¬ 
fia nowo¬ 
tworów 

itij 

60 d 

niska 

niska 

jodek sodu, 
liczne zwią¬ 
zki orga¬ 
niczne 
(hormony) 

badania 
gruczołów 
wydzielania 
dokrewne- 
go (prze¬ 
ważnie in 
vitro ) 

mj 

8,1 d 

średnia 

średnia 

jodek sodu, 

albumina, 

hipuran, 

hormony 

tarczycy 

diagnostyka 
tarczycy, 
nerek, prze¬ 
pływ krwi 
(przeważ¬ 
nie in vivo ) 

łM Au 

2,7 d 

wysoka 

średnia 

zawiesina 

koloidalna 

terapia no¬ 
wotworowa 

“ 7 Hg 

67 h 

niska 

niska 

neohydryna 

scyntygra¬ 
fia nerek 

*°’Hg 

47 d 

średnia 

średnia 

neohydryna 

scyntygra¬ 
fia nerek 


energia mała: < 100 keV 
energia średnia: 100 keV —500 keV 
energia duża: > 500 keV 


generatorach (rys. 11). Na przykład " m Tc otrzymuje 
się z generatora ## Mo o czasie połowicznego zaniku 
67 h. Radioizotopy te znajdują szczególnie szerokie 
zastosowanie w scyntygrafii. 

Diagnostyczne metody radioizotopowe pozwalają 
na postawienie lepszej diagnozy niż metody nieradio- 
izotopowe, gdyż umożliwiają otrzymywanie danych 
pewniejszych, bardziej szczegółowych, bardziej obiek¬ 
tywnych, bo ilościowych; ponadto umożliwiają 
wprowadzenie badań masowych (np. w diagnostyce 
nowotworowej) i zmniejszają koszt badań. 

Podstawowym przyrządem mierzącym ilość pro¬ 
mieniowania (przeważnie gamma) ze znacznika krą¬ 
żącego w ustroju lub zawartego w próbce krwi pobra¬ 
nej od pacjenta jest licznik scyntylacyjny. Składa się 
on ze scyntylatora krystalicznego (NaJ aktywowany 
talem) i fotopowielacza połączonych ze sobą (rys. 12). 


Wiązka promieni gamma, ograniczona przez oło¬ 
wiany kolimator, pada na scyntylator i powoduje 
powstanie w nim krótkotrwałych błysków świetlnych, 
tzw. scyntylacji. Światło tych scyntylacji, padając na 
światłoczułą katodę fotopowielacza, uwalnia z niej 



Rys. 11. Kolumna do otrzymywania radioizotopów krótkożyją- 
cych. Izotop technetu 89m Tc otrzymuje się np. wymywając roz¬ 
tworem chlorku sodu izotop molibdenu M Mo osadzony na ko¬ 
lumnie szklanej z tlenkiem glinu. Proces ten można powtarzać 
co ok. 24 h aż do spadku aktywności ,9 Mo 


strumień elektronów. Strumień ten, zwielokrotniony 
w fotopowielaczu, tworzy na wyjściu prąd elektryczny 
w postaci impulsów przekazywanych dalej do ukła¬ 
dów wzmacniających, kształtujących i liczących. 
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Rys. 12. Schemat sondy scyntylacyjnej 
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Liczniki scyntylacyjne mają największą ze wszy¬ 
stkich typów detektorów wydajność liczenia promieni 
gamma; ich kształty i rozmiary mogą być różne — 
od wąskich sond, średnicy ułamka centymetra, do 
wielkich detektorów średnicy kilkudziesięciu centy¬ 
metrów. 

metody in vivo m Metody pomiarowe stosowane w medycynie dzielą 
i in vitro na hietody in vivo (w żywym organizmie) i in vitro 
(poza organizmem, w probówce). Pomiary in vivo 
obejmują pomiary czynnościowe i lokalizacyjne 
(scyntygrafia). Obecną tendencją jest niewątpliwie 
przechodzenie od metod in vivo do metod in vitro 
(np. testy radioimmunologiczne, polegające na po¬ 
miarach pewnych parametrów biochemicznych we 
krwi z zastosowaniem znaczników „wbudowanych” 
w radiofarmaceutyk). Pomiary prowadzone in vivo , 
z uwagi na zmienną geometrię, zależną od pacjenta, 
jak i na wiele innych trudności związanych z charakte¬ 
rem promieniowania przechodzącego przez tkanki, 
są bardziej kłopotliwe i mniej dokładne. W pomiarach 
in vitro próbki krwi czy innych płynów ustrojowych, 
które zostały pobrane od pacjenta otrzymującego 
uprzednio radiofarmaceutyk lub do których radio¬ 
farmaceutyk został podany pozaustrojowo, mierzy 
się w scyntylatorze zwanym studniowym, w stałych 
warunkach geometrycznych. 

Typowym przykładem pomiarów czynnościowych 
in vivo może być test polegający na pomiarze jodo- 
badanie chwytności tarczycy. Tarczyca jest gruczołem, który 
tarczycy j°d z pożywienia „wbudowuje” w hormon wydzie¬ 
lany do krwi (jod odgrywa bardzo ważną rolę w wielu 
procesach organizmu). Miarą czynności tarczycy jest 
m.in. ilość jodu, która zostaje wbudowana na jed¬ 
nostkę czasu. Otóż czynność tę można określić mie¬ 
rząc jaki procent podanego radiofarmaceutyka (np. 
jodek sodu Na 13ł J w ilości ok. 4-10 5 Bq) znajduje się 
w tarczycy po upływie np. 24 godzin od podania 
(rys. 13). Stosując inne radiofarmaceutyki można 
określić działanie nerek, zmierzyć szybkość przepły¬ 
wu krwi krążącej, szybkość produkcji witaminy B,o 
w szpiku itp. (ii. 184, 185, 187, 188 i tabl. 48). 



Rys. 13. Zasada pomiaru jodochwytności tarczy. Po podaniu 
pacjentowi diagnostycznej dawki Na 1M J (w postaci tabletki) 
mierzy się liczbę impulsów nad tarczycą pacjenta (/ p ) oraz — 
w takich samych warunkach geometrycznych — nad próbką 
Na 13l J o aktywności równej podanej, umieszczoną w sztucznej 
tarczycy, tzw. fantomie (//). Procent jodochwytności oblicza się 
z ilorazu I P II/ 

scyntygrafia Bardzo rozległą dziedziną metod określania ra- 
radioizoto- dioaktywności in vivo jest scyntygrafia radioizotopo- 
powa wa. Umożliwia ona przedstawienie rozmieszczenia 
radioizotopów w tkankach ustroju w postaci dogod¬ 
nej do interpretacji za pomocą wzroku lub kompu¬ 
terów. 

W diagnostyce zadaniem scyntygrafii jest wizualne 
przedstawienie badanego obszaru, tj. narządu lub 
tkanki patalogicznej u pacjenta, w celu stwierdzenia 
zmian patologicznych lub określenia położenia, wiel¬ 
kości i kształtu tego obszaru oraz względnej ilości wy- 
chwytanego przez niego radiofarmaceutyka. Te ra¬ 
czej skomplikowane zadania spełniają aparaty scyn¬ 
tygraficzne; są to urządzenia detekcyjno-zapisujące, 
które przyjmują sygnały (w tym wypadku promienio¬ 
wanie gamma), przetwarzają je, a następnie przedsta¬ 
wiają je jako obrazy płaskie, złożone z kresek, plamek 
lub liczb. Wszystkie aparaty scyntygraficzne można 


podzielić na dwa typy: scyntygrafy, zwane inaczej 
skenerami, oraz scyntykamery. 

W scyntygrafie (rys. 14) głowica detektora przesuwa scyntygrafy 
się ruchem meandrowym nad obszarem badanym. 

Głowica wyposażona jest w kolimator, będący so¬ 
czewką zbierającą promienie gamma w danej chwili 
z niewielkiego obszaru. Na wyjściu otrzymuje się obraz 
o różnym zaczernieniu, który stanowi rzut płaski 
obszaru zawierającego radioizotop o różnej koncen¬ 
tracji (il. 187, tabl. 48). 



Rys. 14. Scyntygraf—ruchomy aparat scyntygraficzny. Scynty- 
gram kreskowy otrzymuje się za pomocą pisaka na papierze 
umieszczonym na stoliku scyntygrafu 
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Scyntykamera (rys. 15) wyposażona jest w nieru¬ 
chomy detektor (w postaci dużego i płaskiego scyn¬ 
tylatora), w którym powstaje scyntylacyjny obraz 
rozmieszczenia radioizotopu w tkance. Obraz ten 
zostaje elektronicznie zanalizowany i przedstawiony 
na ekranie oscyloskopu (il. 188, tabl. 48). 

Przykładowo na il. 184 (tabl. 48) podane są dwa 
scyntygramy: jeden — fantomu tarczycy po podaniu 
Na 131 J — wykonany scyntygrafem, drugi — po po¬ 
daniu *® m Tc — wykonany scyntykamerą.. 

Ze stosowaniem komputerów do ilościowej oceny 
scyntygramów i z dążeniem do rejestracji przebiega¬ 
jącego w czasie procesu rozchodzenia się znaczników 
w ciele wiąże się w pewnym stopniu inna ważna meto¬ 
da badań radioizotopowych in vivo, która polega na 
stosowaniu liczników całego ciała. Są to niezwykle 
czułe mierniki wykrywające znikome ilości radio¬ 
izotopów w ciele. Znajdują one zastosowanie w ochro¬ 
nie przed promieniowaniem (określanie wewnętrznych 
skażeń promieniotwórczych) oraz w badaniu niektó¬ 
rych długotrwałych przemian w organizmie. 

Zastosowanie terapeutyczne radioizotopów jako 
źródeł otwartych nie jest tak częste jak zastosowanie 
diagnostyczne; niektóre metody podane są w tabeli. 
Warto tu wspomnieć przykładowo o metodzie bez¬ 
krwawej operacji tarczycy za pomocą podawania 
doustnie jodku sodu Na 131 J w ilości (40-80) • 10 6 Bq. 
Radiofarmaceutyk ten zostaje wychwycony przez tar¬ 
czycę i w tak dużej ilości (1000 razy większej od 
ilości podawanej diagnostycznie) powoduje znisz¬ 
czenie nadmiernie rozrośniętej tkanki tarczycy w cho¬ 
robie Gravesa-Basedowa. 

Zakres pracy fizyka medycznego w medycynie 
nuklearnej jest szeroki. Zajmuje się on kontrolą bez¬ 
pieczeństwa i higieny pracy, co ma szczególne zna¬ 
czenie z uwagi na pracę z otwartymi źródłami pro¬ 
mieniowania oraz stosowanie krótkożyjących ra¬ 
dioizotopów. Otrzymywanie tych izotopów z gene¬ 
ratorów wymaga pomiaru ich aktywności, dozowania 
i podawania ich w warunkach sterylnych i nie powo¬ 
dujących reakcji ubocznych. Poza tym konieczna jes 
współpraca fizyka medycznego z lekarzem przy opra¬ 
cowywaniu i prowadzeniu pomiarów in vivo i in yitro. 
Szczególnie pomiary in vivo wymagają starannego 
wzorcowania. Rozwój metod nowoczesnej scynty¬ 
grafii (kilka tysięcy prac publikowanych rocznie na 
całym świecie) zależy również w dużej mierze od 
współpracy lekarzy i fizyków medycznych. 

Na zakończenie podkreślimy raz jeszcze, że obecna 
tendencja rozwojowa w dziedzinie zastosowania 
promieniowania jonizującego w medycynie polega na 
zmniejszaniu aktywności substancji podawanych pac¬ 
jentowi w celach diagnostycznych, a nawet na prze¬ 
chodzeniu do badań stosujących radioizotopy poza- 
ustrojowo, z drugiej zaś strony — na dalszym roz¬ 
woju potężnych urządzeń terapeutycznych wykorzy¬ 
stujących promieniowanie jonizujące, a także zasto¬ 
sowaniu innych niż wymienione w artykule źródeł 
promieniowania. 


Promieniowanie niejonizujące 
w medycynie 


Jak wspomniano na wstępie, dział fizyki medycznej 
obejmujący dziedziny zastosowania promieniowania 
niejonizującego staje się mniej więcej od 10 lat kon¬ 
kurentem działu promieniowania jonizującego. Z jed¬ 
nej strony jest to wynikiem nowych odkryć fizyki 
i nowych rozwiązań techniki, z drugiej zaś — tenden¬ 
cji (w diagnostyce medycznej) do stosowania metod 
jak najmniej szkodliwych dla pacjenta. Tak więc 
znaczenia nabierają metody stosujące promieniowanie 
laserowe, promieniowanie podczerwone (termografia) 
oraz fale ultradźwiękowe (—► Badanie ośrodków za 
pomocą ultradźwięków). 
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Promieniowanie laserowe 

Promieniowanie laserowe charakteryzuje wysoki sto¬ 
pień spójności i monochromatyczności; można 
je wytwarzać w postaci silnie skolimowanych wiązek 
o średnicy nawet rzędu długości fali tego promienio¬ 
wania. Ta druga cecha pozwala na ogromne zwięk¬ 
szenie gęstości mocy wiązki, co z kolei daje możli¬ 
wość skupienia dużych ilości energii na minimalnym 
obszarze. Szczególne znaczenie mają w biomedycynie 
lasery molekularne ze względu na dużą wydajność, 
niski koszt wytwarzania i niewielkie rozmiary. Po¬ 
nadto promieniowanie lasera molekularnego przypa¬ 
da na część podczerwoną widma, która jest silnie 
pochłaniana przez tkankę. 

Lasery wykorzystuje się obecnie w medycynie do 
trzech zasadniczych celów: w terapii — do niszczenia 
tkanki metodą „cięcia” lub „odparowywania” (bez¬ 
krwawa chirurgia), w diagnostyce — jako źródło 
oświetlające oraz do celów badawczych w biomedy¬ 
cynie. 


Terapeutyczne i diagnostyczne zastosowania laserów 


Specjalność 

Zastosowanie 

terapia 

diagnostyka 

Okulistyka 

koagulacja siatków¬ 
ki mikrochirurgia 

badanie zaćmy 

Onkologia 

niszczenie tkanki 
nowotworowej 

holografia ultra¬ 
dźwiękowa, rentge¬ 
nowska 

Chirurgia 

cięcie tkanek mięk¬ 
kich i twardych 

oświetlanie narzą¬ 
dów od wewnątrz 
(endoskopia) 

Stomatologia 

usuwanie próchnicy, 
plombowanie 


Dermatologia 

usuwanie tatuażu, 
procesy rozrostowe 



Ogólnie biorąc, wiązka promieniowania laserowego 
oddziałuje na tkankę,jak to przedstawiono na rys. 16. 
Wiele efektów występujących przy odbiciu i rozpro¬ 
szeniu nie ma dla nas większego znaczenia, najważ¬ 
niejsze jest termiczne oddziaływanie promieniowania 
na tkankę, zasadniczo związane z pochłanianiem (nie 


wiązka padająca z lasera 



Rys. 16. Schemat oddziaływania wiązki laserowej z tkanką 


należy jednak zapominać, że promieniowanie odbite 
lub rozproszone może powodować uszkodzenie tkan¬ 
ki). Oddziaływanie termiczne zależy przede wszystkim 


zalety pro¬ 
mieniowania 
laserowego 


lasery w 
medycynie 













od gęstości mocy promieniowania. Po przekroczeniu 
pewnej wartości gęstości występuje zjawisko odparo¬ 
wywania tkanki na obszarze, na który pada wiązka 
promieniowania. Warto podać, że do odparowania 
1 g tkanki, której gęstość jest w przybliżeniu równa 
gęstości wody, potrzeba energii ok. 2000 J. Najtrud¬ 
niejszą sprawą z praktycznego punktu widzenia jest 
dobranie odpowiednich ilości energii. Przy zbyt dużej 
gęstości mocy mogą powstawać małe eksplozje, 
utrudniające stosowanie lasera do cięcia tkanek, przy 
zbyt małej — mogą wystąpić dodatkowe komplikacje, 
laser jako Ostra wiązka laserowa stosowana jako skalpel 
skalpel chirurgiczny umożliwia przeprowadzanie czystych 
cięć w tkankach, a przez przypalanie rany — zmniej¬ 
sza krwawienie. Takich bezkrwawych zabiegów moż¬ 
na dokonywać na narządach silnie ukrwionych, jak 
wątroba, płuca czy mózg. Czyni się również próby 
użycia promieni laserowych do usuwania próchnicy 
zębów, a nawet do plombowania zębów. Najbardziej 
jednak rozpowszechnione jest zastosowanie wiązki 
laserowej w okulistyce, a mianowicie w mikrochirur- 
gii ocznej do łączenia (koagulacji) odklejonej siat¬ 
kówki z naczyniówką w oku ludzkim. Urządzenie 

oko lekarza 



Rys. 17. Schemat działania głowicy koagulatora laserowego 


koagulator służące do tego zabiegu zwie się koagulatorem lasero- 
laserowy wym, zabieg zaś polega na tym, że wiązkę laserową 
kieruje się przez źrenicę tak, aby soczewka skupiła ją 
w miejscu, w którym ma powstać koagulacja; silny 
impuls świetlny wywołuje odczyn zapalny, w następ¬ 
stwie czego powstaje zrost, który „przykleja” siat¬ 
kówkę do naczyniówki. Koagulator laserowy (rys. 17 
i ii. 16, tabl. 5) góruje nad uprzednio stosowanymi fo- 
tokoagulatorami krótkim czasem naświetlania i małą 
średnicą wiązki (o energii 10" 3 -10 -2 J). 
technika Technika odparowywania rozległejszych tkanek, 
„odparowy- wymagająca znacznie większych gęstości mocy niż 
wania" cięcie czy koagulacja, znajduje zastosowanie przy 
niszczeniu tkanki nowotworowej przede wszystkim 
w miejscach na ciele pacjenta dostępnych do bezpo¬ 
średniego naświetlania. Nie można jednakże ustalić 
jednej wartości dopuszczalnej dawki promieniowania 
laserowego. Istnieją zalecenia podające różne war¬ 
tości, zależne od parametrów samych urządzeń la¬ 
serowych, ale uważa się zawsze, iż najdelikatniejszym 
narządem jest oko ludzkie. Uznano, że dozwolone 
dawki promieniowania bezpośrednio padającego na 
źrenicę oka wahają się od 5-10“ 8 do 1CT 6 J/cm 2 , 
natomiast dawki promieniowania „odbitego” w 100% 
od powierzchni rozpraszającej wahają się od 0,07 do 


0,9 J/cm 2 . Jeśli chodzi o inne organy (skóra itp.), 
wartości dawek mogą być znacznie większe. Do na¬ 
promieniowania narośli o średnicy kilku milimetrów 
wymagana jest energia kilku dżuli w impulsie; znisz¬ 
czenie większych obszarów tkanki zdegenerowanej 
wymaga stosowania laserów dających wiązki o energii 
do 10 000 J. Zastosowanie światłowodów umożliwia 
niszczenie tkanki wewnątrz organizmu. 

W niedalekiej przyszłości wiązka promieniowania 
laserowego może znaleźć zastosowanie w diagno¬ 
styce medycznej, a mianowicie do oświetlania narzą¬ 
dów wewnętrznych. Wiąże się to również z zastoso¬ 
waniem techniki przesyłania światła za pomocą 
światłowodów. Nawet holografia powinna znaleźć 
zastosowanie w medycynie, szczególnie z chwilą uzy¬ 
skania spójnych wiązek promieni X. Już obecnie 
filtracja holograficzna w rentgenodiagnostyce po¬ 
prawia czytelność zdjęć rentgenowskich. Czyni się 
próby wykorzystania w diagnostyce holografii ultra¬ 
dźwiękowej. 

Jeszcze inną dziedziną zastosowania promienio¬ 
wania laserowego jest biomedycyna. Promieniowanie 
to pozwala na przeprowadzanie mikrooperacji wew¬ 
nątrz ... pojedynczej komórki. 

Nie należy jednakże zapominać o niebezpieczeń¬ 
stwach związanych z użyciem promieniowania lase¬ 
rowego. Nowe rodzaje jego zastosowania będą zatem 
wynikiem nowych rozwiązań w dziedzinie techniki 
laserowej i prac nad ustaleniem wpływu tego pro¬ 
mieniowania na obiekty biologiczne. 

Rola fizyka medycznego polega w tej dziedzinie 
przede wszystkim na udziale w projektowaniu urzą¬ 
dzeń, które w diagnostyce lub terapeutyce mają 
częstokroć charakter prototypowy, a ponadto na 
obsłudze aparatury, określaniu warunków bezpie¬ 
czeństwa pracy itp. 


Promieniowanie podczerwone 

Źródłem promieniowania podczerwonego są wszyst¬ 
kie ciała, a m.in. człowiek; wykorzystano to w diag¬ 
nostyce. Zasada działania klasycznych detektorów 
promieniowania podczerwonego polega na wzroście 
temperatury odbiornika absorbującego promienio¬ 
wanie, które nań pada. W nowoczesnych detektorach 
fotoprzewodzących lub fotoemisyjnych promienio¬ 
wanie podczerwone przetwarzane jest bezpośrednio 
na prąd elektryczny. 

Do otrzymywania obrazów przedmiotów wysyłają¬ 
cych fale podczerwone stosuje się złożone układy 
optyczne: przetworniki obrazu, które przetwarzają 
obraz widzialny na ekranie fluorescencyjnym, oraz 
termografy, stanowiące detektory przeszukujące. 

Zasada działania klasycznego termografu podana 
jest na rys. 18. Promieniowanie podczerwone (ciepl¬ 
ne) badanego obiektu, którym jest np. ciało ludzkie, 

promieniowanie podczerwone 



Rys. 18. Schemat działania termografu 
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AGA 

kamera 


zastosowanie 
termog rafii 


pada na detektor po odbiciu od zwierciadła nachylo¬ 
nego pod kątem 45° do kierunku wiązki promienio¬ 
wania. Zwierciadło, wprawione w ruch, „przeszukuje” 
pole widzenia. Sygnały z detektora modulują natę¬ 
żenie światła lampki, która oświetla kliszę fotogra¬ 
ficzną. W ten sposób otrzymuje się obraz rozkładu 
temperatury na obszarze ciała w postaci rozkładu 
zaczernienia kliszy. 

Jednym z najnowszych termografów jest kamera 
AGA Thermovision (rys. 19). Charakteryzuje ją duża 
czułość (0,2°C), gdyż jako detektora użyto tu anty- 
monku indu chłodzonego ciekłym azotem; „prze¬ 
szukiwania” dokonuje się za pomocą drgającego 
lustra oraz obracającego się kwarcowego pryzmatu; 
otrzymuje się 16 obrazów termograficznych na sekun- 


naczynie Dewara 
z ciekłym azotem 

detektor InSb 



lustro ruchome 

pryzmat wielokątny wirujący 
Rys. 19. Kamera termowizyjna firmy AGA 


soczewki 
germanowe 

lustro optyczne 


dę, obserwowanych na ekranie monitora (lampa 
oscyloskopowa), fotografowanych lub filmowanych. 

Za pomocą termowizyjnej kamery można rów¬ 
nież uzyskać obraz złożony z izoterm, tj. krzywych 
łączących punkty o tej samej temperaturze; ułatwia 
to diagnozę kliniczną. 

Termograf znajduje szerokie zastosowanie w prak¬ 
tyce medycznej. Interpretacja obrazu otrzymanego 
w termografie wymaga ustalenia związku między 
temperaturą normalną, podwyższoną lub obniżoną 
danej części ciała a stanem klinicznym. Ogólnie 
biorąc, podwyższenie temperatury łączy się ze zwięk¬ 
szoną przemianą metaboliczną, zwiększonym ukrwie- 
niem, natomiast obniżenie temperatury wiąże się 
z ogólnym oziębieniem ciała, napięciem psychicznym 
lub... paleniem papierosów (ii. 186 i 189, tabl. 48). 

Termografia jest metodą całkowicie bezpieczną 
dla pacjentów i choć dostarcza informacji o tempe¬ 
raturze tylko powierzchni ciała, znajduje coraz szersze 
zastosowanie w medycynie. 


Fizyka medyczna nieradiacyjna 


Ten dział fizyki, najskromniejszy w niniejszym arty¬ 
kule, dotyczy z jednej strony badań napięć bioelek¬ 
trycznych i prądów czynnościowych w organizmie 
żywym, z drugiej zaś — zastosowań bodźców elek¬ 
trycznych w celach terapeutycznych. Ta ostatnia 
dziedzina wchodzi jednak tradycyjnie w zakres tzw. 
fizykoterapii, która choć z nazwy przypomina fizykę 
medyczną, niewiele ma z nią wspólnego. Fizykote¬ 
rapia polega bowiem na zastosowaniu w celach leczni¬ 
czych lub zapobiegawczych naturalnych czynników 
fizycznych (np. działanie energii mechanicznej lub 
cieplnej, pewnych cech powietrza i wody) oraz czyn¬ 


ników fizycznych sztucznie wytwarzanych przez róż- fizykoterapia 
nego rodzaju przyrządy elektryczne. Natomiast ba¬ 
danie napięć bioelektrycznych stanowi — również 
tradycyjnie — domenę tzw. bioelektroniki. Dlatego 
też ograniczymy się tu do zasygnalizowania niektó¬ 
rych problemów, nie wdając się w szersze rozważania. 


Z fizycznego punktu widzenia badanie napięć 
bioelektrycznych w organizmie jest fascynujące za¬ 
równo w skali makro (elektrokardiografia, elektro¬ 
encefalografia), jak i mikro (zjawiska elektryczne 
w komórce). 

Zdolność wytwarzania napięć elektrycznych jest napięcia bio- 
cechą wszystkich żywych komórek i tkanek. Związana elektryczne 
jest z faktem występowania różnicy stężenia jonów 
potasu i sodu między wnętrzem komórki a obszarem 
pozakomórkowym. Ta różnica stężenia jonów pro¬ 
wadzi do utworzenia się potencjału zwanego spoczyn¬ 
kowym. Po przyłożeniu bodźca zewnętrznego poten¬ 
cjał spoczynkowy przechodzi w potencjał czynnościo¬ 
wy, przenoszony wzdłuż włókien nerwowych w myśl 
zasady „wszystko albo nic”. Takim złożonym obra¬ 
zem potencjałów czynnościowych jest zapis dobrze 
znanych krzywych, zwanych elektrokardiogramami 
lub encefalogramami. Krzywe te pozwalają lekarzowi 
na przeprowadzenie diagnozy chorób serca (EKG) 
czy anomalnej czynności mózgu (EEG). Ponadto 
znaczenie kliniczne posiada badanie potencjałów 
elektrycznych mięśni (elektromiografia) lub siatkówki 
oka (elektroretinografia). 


Ogólnie biorąc, odbierane napięcia bioelektryczne 
są bardzo małe, często na poziomie szumów aparatury 
i zakłóceń sieci. Tak np. napięcia występujące przy 
rejestracji prądów mózgu wahają się od 0,005 do 
0,1 mV. Dlatego też wymagania, jaJkie się stawia 
bioelektrykom konstruującym wzmacniacze wielo¬ 
kanałowe, są bardzo wysokie. 

Obecnie urządzenia elektrokardiograficzne pracują 
w połączeniu z aparatami do ciągłego lub okresowego 
rejestrowania danych, szczególnie na tzw. oddziałach 
intensywnego nadzoru. Z kolei do analizy danych 
elektroencefalograficznych, których interpretacja jest 
zazwyczaj trudna, wprowadza się coraz szerzej kom¬ 
putery. 

Ciekawą dziedziną, w której uczestniczą fizycy me- działanie 
dyczni, jest coraz bardziej rozwijająca się dziedzina pól elektro- 
badań skutków biologicznego oddziaływania pól magnetycz- 
elektromagnetycznych, ze szczególnym uwzględnię- nych 
niem mikrofal. Efekt oddziaływania pól elektromag¬ 
netycznych majak się wydaje, charakter kumulujący. 

Szkodliwymi źródłami pól mogą być reklamy świetlne, 
telewizja itp. Źródeł tych nie można usunąć, ale efekt 
ich można ograniczyć przez odpowiednie warunki 
narzucone budownictwu mieszkaniowemu. 

Jeżeli chodzi o bardziej wymierne i lepiej zbadane 
oddziaływanie mikrofal na tkankę, okazuje się, że 
głównym efektem jest działanie cieplne, choć wystę¬ 
pują również zjawiska, jak np. aberracje chromozo- 
malne in vitro i in vivo , które wymagają innego wy¬ 
jaśnienia. W związku z rozpowszechnianiem się sto¬ 
sowania mikrofal sprawy te nabierają coraz więk¬ 
szego znaczenia. 

Z przedstawionego wyżej krótkiego przeglądu fizy¬ 
ki medycznej widzimy, że ta nowa dziedzina zastoso¬ 
wań fizyki wyodrębnia się w pewnych działach w sa¬ 
modzielną specjalność (np. promieniowanie jonizu¬ 
jące), w- innych zaś współpracuje z bioelektroniką, 
bioinżynierją czy biofizyką. Trudno jest przeprowa¬ 
dzić jakiś zdecydowany podział, a może nawet nie 
trzeba, gdyż nauka współczesna przestaje być zbio¬ 
rem nie powiązanych ze sobą dziedzin, zaczyna coraz 
bardziej przypominać jedną wspólną budowlę opartą 
na tych samych fundamentach. 

O. A. Chomicki,T. Górowski, W. Jasiński Scyntygrafia kli¬ 
niczna, Warszawa 1971; R. Miller, R. Richwien Podstawy ele¬ 
ktroniki medycznej , Warszawa 1973; A. Piątkowski, W.Scharf 
Aparatura radiomedyczna w medycynie i biologii. Warszawa 1972; 

A. Piątkowski, W. Scharf Mierniki promieniowania jonizują¬ 
cego 1980; A. Pilawski, Podstawy biofizyki , Warszawa 1977; 

Radiologia, red S. Z. Zgliczyński. Warszawa i967. 















Modelowanie matematyczne 
procesów biologicznych 


Dymitr Cżerna wski i Ewa Skrzypczak 

Modelowanie procesów biologicznych należy do 
ważnych i szeroko stosowanych metod w naukach 
biologicznych. Modelowanie matematyczne odgrywa 
tu szczególną rolę, zwłaszcza w stosunkowo młodych 
dziedzinach: biofizyce i biologii teoretycznej. Jego 
znaczenie oraz związane z nim problemy opiszemy 
powołując się na przykład starszej dyscypliny nauko¬ 
wej, a mianowicie fizyki. Zadaniem fizyki teoretycz¬ 
nej jest formułowanie postulatów i praw niesprzecz- 
nych ze znanymi faktami eksperymentalnymi oraz 
wyciąganie na ich podstawie wniosków, które powinny 
być konfrontowane z wynikami doświadczeń nie zna¬ 
nymi dotychczas bądź nie należącymi do zespołu 
faktów leżących u podstaw teorii. Sformułowanie 
teorii, a zwłaszcza jej skuteczne wykorzystanie dla 
otrzymania wniosków, wymaga często wprowadzenia 
upraszczających założeń, idealizujących rzeczywistość 
fizyczną. Takie założenia stanowią punkt wyjścia dla 
konstrukcji modeli w fizyce. Typowym, prostym tego 
model: przykładem jest w fizyce zagadnienie ruchu wahadła 
wahadło matematycznego, które stanowi model rzeczywistego 
matema- fizycznego wahadła. W modelu pomija się siłę tarcia 
tyczne i oporu ośrodka, rozciągliwość nici, rozmiary i kształt 
ciężarka, zastępowanego w modelu przez tzw. punkt 
materialny. Uproszczenia wprowadzone w założe¬ 
niach modelu ograniczają oczywiście wnioski do 
określonego zespołu procesów dotyczących badanego 
obiektu czy zjawiska. 

Mimo oczywistej niedoskonałości modelu w porów¬ 
naniu ze ścisłą, kompletną teorią jego skonstruowa¬ 
nie i analiza wzbogacają z reguły wiedzę o pewnym 
zespole zjawisk i na ogół poprzedzają następny etap, 
którym jest sformułowanie teorii fizycznej. 

W odróżnieniu od fizyki biologię uważano do nie¬ 
dawna za dyscyplinę eksperymentalną, jeżeli nie 
opisową. Biofizyka natomiast bywa często potocznie 
uznawana za tę dziedzinę biologii, w której podsta¬ 
wową rolę odgrywa zastosowanie aparatury i ekspery¬ 
mentalnych metod fizyki w badaniu obiektów biolo- 
biologia gicznych. W ostatnich latach zrodziły się nowe dyscy- 
teoretyczna pliny: biologia teoretyczna i biofizyka teoretyczna. 

i biofizyka Podstawową funkcję w tych dziedzinach pełni mo- 
teoretyczna delowanie matematyczne procesów zachodzących 
w żywych obiektach lub w ich zespołach. Podobnie 
jak w fizyce, podejście modelowe w biologii wymaga 
starannego sformułowania założeń, ograniczenia roz¬ 
ważań do określonego zespołu faktów i zjawisk naj¬ 
bardziej istotnych dla badanego procesu, wprowa¬ 
dzenia uproszczeń. Następnym krokiem jest analiza 
modelu i wyciągnięcie wniosków, ułatwiających zro¬ 
zumienie mechanizmu procesu, oraz opis, choćby 
w ogólnym zarysie, zachowania się badanego układu 
i przebiegu zjawiska w czasie. 

Jednym z podstawowych założeń w modelach 
i teoriach fizycznych jest izolacja rozważanego układu 
od wpływu czynników zewnętrznych. Mówimy wów¬ 
czas o układzie zamkniętym i odosobnionym. W mo¬ 
delowym podejściu do badania układów biologicz¬ 
nych istotną trudność stanowi fakt, że dopóki roz¬ 
ważane obiekty są żywe, dopóty nie mogą stanowić 
układu izolowanego i zamkniętego. 

Odrębnym zagadnieniem utrudniającym konstruo¬ 
wanie i analizę modeli biologicznych jest ogromna 
liczba i różnorodność procesów zachodzących w obiek¬ 
tach biologicznych. Wybór procesów czy zjawisk naj¬ 
bardziej istotnych stanowi podstawowy krok przy 
konstrukcji modelu. Jest to trudne i odpowiedzialne 
zadanie, wymagające znajomości ogólnych charakte¬ 
rystyk rozważanych zjawisk oraz wykorzystania od¬ 
powiedniego aparatu i metod matematycznych. 


Wspomniane trudności sprawiają, że młode dyscy¬ 
pliny — biologia i biofizyka teoretyczna — rozwijają 
się wolniej niż fizyka teoretyczna, a osiągnięcia ich 
nie mogą na ogół być teoriami o takim stopniu dosko¬ 
nałości i precyzji, jakie charakteryzują teorie fizyczne. 
Istotny rozwój biologii i biofizyki teoretycznej w ostat¬ 
nich latach wiąże się w znacznym stopniu z rozwojem 
eksperymentalnej biologii i biofizyki oraz z zaintere¬ 
sowaniem tymi dziedzinami matematyków i fizyków 
teoretyków, którzy wnoszą w tę dziedzinę znajomość 
aparatu matematycznego oraz ogólnego procesu 
przechodzenia od hipotez do modeli i od modeli do 
teorii. 

Niniejszy artykuł przedstawia niektóre aspekty 
współczesnej biologii i biofizyki teoretycznej związa¬ 
ne z modelowaniem matematycznym procesów biolo¬ 
gicznych jako szczególną metodą modelowania. 


Klasyfikacja modeli 

Jak już wspomniano wyżej, modelowe podejście do 
opisu i analizy jakiegoś procesu lub zespołu procesów 
wymaga znajomości pewnych podstawowych faktów, 
wynikających z obserwacji i doświadczeń, oraz przy¬ 
jęcia pewnych założeń, które stanowią z reguły jakąś 
idealizację, a zarazem uproszczenie problemu. Na¬ 
stępnym krokiem jest skonstruowanie modelu w po- konstru- 
staci rzeczywistego układu fizycznego, poddającego owanie 
się bezpośredniej lub pośredniej obserwacji, bądź modelu 
w postaci układu równań matematycznych. Analiza 
działania układu fizycznego lub właściwości układu 
równań prowadzi następnie do wniosków. 

Modele stosowane obecnie w biologii i biofizyce 
możemy podzielić (pamiętając jednak, że żadna klasy¬ 
fikacja nie jest ścisła i doskonała) na modele fizyczne 
(w szczególności analogowe), matematyczne (dyna¬ 
miczne) i statystyczne. 


Modele fizyczne 

Modele fizyczne są to układy fizyczne zawierające 
elementy mechaniczne, hydrauliczne, elektryczne lub 
elektroniczne, akustyczne czy optyczne, umożliwia¬ 
jące imitowanie określonych procesów biologicznych 
przez procesy fizyczne, które jest łatwiej obserwować 
i analizować. Pozwala to na wyciąganie wniosków 
o właściwościach procesów i ich przebiegu. 

Ilustrację modelu fizycznego mogą stanowić mode¬ 
le, w których przepływ cieczy w odpowiednio dobra¬ 
nym układzie naczyń i rurek imituje obieg krwi, 
powietrza czy innych substancji w żywym organizmie 
lub w jego części. Wprowadzenie do układu dodat¬ 
kowych elementów, takich jak błony półprzewodzące, 
wymiana, dopływ, czy odpływ płynu z układu itp., 
umożliwia uwzględnienie szeregu szczegółów właści¬ 
wych modelowanemu zjawisku. 

Innym przykładem modelu fizycznego jest klasycz- model 
ny model Lilliego, imitujący rozchodzenie się impulsu Lilliego 
wzdłuż włókna nerwowego (aksonu). Podstawowym 
elementem modelu jest żelazny drut umieszczony 
w roztworze kwasu azotowego. W tych warunkach 
powierzchnia drutu pokrywa się szybko warstwą 
tlenku żelaza. Do układu doprowadzamy z zewnętrz¬ 
nego źródła impuls elektryczny. Wzdłuż drutu zaczy¬ 
na się rozchodzić sygnał elektryczny, któremu towa¬ 
rzyszy chwilowe pozbawienie kolejnych odcinków 
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druta warstwy tlenku żelaza. Na podstawie obserwacji 
obszaru znikania tej warstwy i pomiarów przeprowa¬ 
dzonych przy pomocy odpowiednich układów elek¬ 
trycznych można ocenić prędkość rozchodzenia się 
sygnałów wzdłuż drutu oraz kształt impulsu. Stwier¬ 
dzono, że sygnał taki powstaje i rozchodzi się, jeżeli 
wielkość pierwotna impulsu przekracza pewną war¬ 
tość progową, oraz że kształt powstałego sygnału nie 
zależy od wielkości pierwotnego impulsu. Model ten 
umożliwia jakościową imitację rzeczywistego prze¬ 
biegu zjawiska rozchodzenia się sygnałów wzdłuż 
włókien nerwowych. 

modele Często do badania procesów biologicznych, 
analogowe a zwłaszcza ich dynamiki, stosuje się modele analo¬ 
gowe. Zasadą konstruowania modelu analogowego 
jest zastąpienie układu rzeczywistego przez układ 
innego rodzaju, opisywany takimi samymi zależnoś¬ 
ciami matematycznymi jak układ modelowany i mają¬ 
cy parametry wzajemnie proporcjonalne — niezależ¬ 
nie od ich fizycznej natury. Modelami analogowymi 
mogą być układy elektroniczne, hydrauliczne, 
model Dla stosowania modeli tego rodzaju wystarcza nie- 
pracy kiedy tylko jakościowa znajomość analizowanego 
serca procesu; ścisłe formułowanie związków matematycz¬ 
nych nie jest wówczas niezbędne. 

Przykładem takiego modelu analogowego jest kla¬ 
syczny już model pracy serca zaproponowany przez 
Van der Pola (rys. 1). Składał się on z lampki neono- 
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Rys. 1. Model pracy serca van der Pola: a) analogie między pod- 
u kładami aparatury i modelowanego serca (IV węzeł zatokowy, 
P przedsionek, K komora serca, R układ opóźniający), b) kom¬ 
pletny układ elektryczny, c) sztuczny elektrokardiogram otrzy¬ 
many za pomocą układu elektrycznego dla przypadku fizjolo¬ 
gicznego (/) i patologicznego (2) 


wej, zapewniającej oscylacyjny przebieg zjawiska, 
oraz kondensatora i oporu elektrycznego, imitującego 
działanie węzła zatokowego. Prosty ten model poz¬ 
walał imitować procesy związane z biciem serca 
zarówno w przypadkach fizjologicznych, jak i patolo¬ 
gicznych (arytmia) — w zależności od warunków 
pracy (w szczególności oporu elektrycznego w ukła¬ 
dzie analogowym). Opisanemu tu modelowi, opraco¬ 
wanemu ponad 40 lat temu, poświęcamy więcej 
miejsca, aby podkreślić, że bardzo proste założenia 
matematyczne oraz dość prymitywna aparatura mogą 
niekiedy odtwarzać złożone procesy biologiczne. 

Odpowiednio skonstruowane maszyny analogowe maszyny 
umożliwiają bezpośrednią obserwację (na ekranie analogowe 
oscyloskopu) przebiegów czasowych interesujących 
nas zmiennych oraz zależności tych przebiegów od 
parametrów układu i od założeń stanowiących punkt 
wyjścia dla modelowania badanego procesu. Otwiera 
to szerokie możliwości zarówno w zakresie sprawdza¬ 
nia przyjętych założeń początkowych, jak i szczegóło¬ 
wego opisu przebiegu badanych zjawisk, a nawet 
umożliwia przewidywanie faktów trudnych lub wręcz 
niedostępnych bezpośredniej obserwacji w realnych 
procesach biologicznych. 


Modele matematyczne 

Modelem matematycznym badanego procesu bądź 
zespołu obserwacji dotyczących przejawów jakiegoś 
zjawiska nazywamy układ związków matematycznych, 
wiążących ze sobą te zmienne (wielkości mierzone czy 
— ogólniej — stanowiące przedmiot zainteresowania), 
wartości parametrów oraz czas — jeżeli rozważany 
model dotyczy dynamiki procesu, tzn. przebiegu 
analizowanych procesów w czasie. Zmiennymi, wy¬ 
stępującymi w modelu, mogą być np. stężenia sub¬ 
stancji biorących udział w reakcjach biochemicznych, 
liczebności populacji, wielkości charakteryzujące ba¬ 
dane obiekty, takie jak ich rozmiary, prędkości itp. 

Modele statyczne mają najczęściej postać jednego modele 
(lub więcej) związku algebraicznego. Kształt matema- statyczne 
tyczny takiego związku może wynikać z przesłanek 
a priori, wynikających z ogólnej znajomości badanych 
zjawisk, bądź z danych doświadczalnych, do których 
dopasowuje się postać związków matematycznych. 

Jeżeli — dla ilustracji — ograniczymy się do najprost¬ 
szego przypadku jednego związku między dwiema 
zmiennymi, przy czym przypuszczamy, że związek ten 
jest liniowy, to modelem matematycznym procesu 
nazwiemy równanie o postaci y = ax+b , gdzie * i y 
są zmiennymi, zaś a i b — parametrami modelu. Za¬ 
daniem, jakie sobie wówczas stawiamy, jest: a) zna¬ 
lezienie odpowiedzi na pytanie, czy dane doświad¬ 
czalne (zbiór par wartości x i y wyznaczonych ze zna¬ 
ną dokładnością) spełniają powyższy związek linio¬ 
wy, oraz b) wyznaczenie wartości parametrów a i b 
i ich błędów. Rozwinięte są metody statystyczne 
umożliwiające wykonanie tych zadań oraz określenie 
tzw. poziomu ufności uzyskanych wyników. Jeżeli 
zgodność modelu z danymi doświadczalnymi okaże 
się niezadowalająca, należy testowany model (linio¬ 
we równanie w naszym przykładzie) odrzucić lub 
zmodyfikować. Taka modyfikacja polega zazwyczaj 
na wzbogaceniu postaci modelu o człony zawierające 
wyższe potęgi x lub y, bądź o człon zawierający inną, 
pierwotnie pominiętą, zmienną (z). Zastosowanie od¬ 
powiednich metod statystycznych pozwala następnie 
na znalezienie najlepiej pasującego do danego zespołu 
parametrów (a, b , ...) testowanej postaci modelu. 
Interpretacja tak otrzymanego i akceptowanego mo¬ 
delu prowadzi do lepszego opisu i zrozumienia bada¬ 
nych zjawisk. Ponadto znajomość związku (czy 
związków) między zmiennymi występującymi w mo¬ 
delu umożliwia następnie wykorzystywanie modelu 
do znajdowania wartości jednej zmiennej, gdy znamy 
pozostałe — bez przeprowadzania za każdym razem 
badań eksperymentalnych. 
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Modele dynamiczne, których przedmiotem jest 
analiza przebiegu badanego procesu w czasie, mają 
zazwyczaj postać układu złożonego z jednego lub wię¬ 
cej równań różniczkowych zawierających pochodne 
zmiennych względem czasu. 

Analizy takiego modelu matematycznego można 
dokonać bądź stosując teorię równań różniczkowych 
(opis tego podejścia i przykłady jego zastosowania 
przedstawimy w rozdziałach: „Modele matematycz¬ 
ne” i „Wybrane przykłady modeli matematycznych 
w zagadnieniach biologicznych”), bądź za pomocą 
rola analogowych maszyn matematycznych. Rolą maszy- 
maszyny ny analogowej jest rozwiązanie układu równań sta- 
analogowe] nowiących model i znalezienie związków między wiel¬ 
kościami dynamicznymi. Szczególnie ważna jest w tym 
wypadku możliwość badania reakcji modelowanego 
układu na zmiany parametrów układu, charaktery¬ 
zujących warunki, w jakich działa rzeczywisty układ. 

Na rys. 2 widać zdjęcie ekranu oscyloskopowego 
maszyny analogowej, przy użyciu której analizowano 
model złożonego zjawiska — procesu fotosyntezy 
u roślin. Obraz otrzymany na ekranie przedstawia 
związek między zmiennymi dynamicznymi — w tym 
wypadku są to stężenia tzw. lekkich i ciężkich cuk¬ 
rów biorących udział w reakcjach chemicznych, które 
leżą u podstaw zjawiska fotosyntezy. Na osiach po¬ 
ziomej i pionowej odłożone są stężenia odpowied¬ 
nich cukrów. Nawet pobieżne spojrzenie na zdjęcie 
prowadzi do ważnego wniosku o oscylacyjnym cha¬ 
rakterze zmian w czasie stężeń lekkich i ciężkich cuk¬ 
rów, przy czym oscylacje stężeń tych cukrów są wzglę¬ 
dem siebie przesunięte w fazie. Zdjęcie to przedstawia 
tzw. obraz fazowy badanego układu. Zastosowanie 
maszyny analogowej zastąpiło niełatwą w tym wy¬ 
padku bezpośrednią analizę układu równań stano¬ 
wiących model matematyczny zjawiska. 

Ostatnio w biologii teoretycznej badane są modele 
matematyczne nie wymagające nawet formułowania 
konkretnych równań matematycznych; modele tego 
teoria rodzaju prowadzą z reguły do wniosków jakościo- 
katastrof wych. Punktem ich wyjścia jest teoria katastrof 
Thoma R. Thoma. Przy takim podejściu do zagadnienia usta¬ 
la się zespół zmiennych i parametrów istotnych dla 



Rys. 2. 


badanego zjawiska. Zarówno zmienne, jak i para¬ 
metry traktowane są na równych prawach—-z tym, 
że parametrom przypisuje się powolniejszą zmienność 
w czasie niż zmiennym. Zbiór tych wszystkich wiel¬ 
kości, charakteryzujący chwilowy stan układu, sta¬ 
nowi zbiór współrzędnych punktu w przestrzeni wielo¬ 
wymiarowej. Zbiór stanów rozważanego układu 
przedstawiony jest przez pewną hiperpowierzchnię 
(wielowymiarową) w tej przestrzeni. Rozważania 
oparte na znajomości topologii pozwalają na wpro¬ 
wadzenie pewnej klasyfikacji takich powierzchni. Ja¬ 
kościowe przypisanie badanemu zjawisku określo¬ 
nego charakteru takiej powierzchni i jej osobliwości 
geometrycznych umożliwia dokonanie jakościowego 
opisu procesów odbywających się w układach biolo¬ 
gicznych i wyciągnięcie pewnych wniosków o właści¬ 
wościach tych procesów, jak np. gwałtowne skokowe 
zmiany jednych zmiennych przy jednoczesnej gład¬ 
kiej zmienności innych. Tego rodzaju modele teore¬ 
tyczne bywają stosowane np. do analizy takich za¬ 
gadnień, jak praca serca, działanie neuronu, różni¬ 
cowanie tkanek, oraz pewnych problemów z dziedziny 
embriologii i ekologii. 

Bardziej szczegółowa dyskusja teorii katastrof 
w zastosowaniu do modelowania procesów biolo¬ 
gicznych wykracza poza ramy niniejszego artykułu. 


Modele statystyczne 

W modelach matematycznych zmienne oraz para- wartości 
metry badanego układu są pewnymi wielkościami średnie 
mającymi charakter wielkości średnich (np. stężenie 
substancji, liczebność komórek czy populacji, pręd¬ 
kość reakcji). Operowanie nimi jest uzasadnione 
wówczas, gdy przypadkowe fluktuacje w wartościach 
tych wielkości są małe w porównaniu z samymi 
wielkościami. Zdarza się jednak, że informacje doty¬ 
czące średnich wielkości charakteryzujących badane 
obiekty i procesy są niedostatecznie ścisłe, a przy¬ 
padkowe fluktuacje są porównywalne z samymi wiel¬ 
kościami. Odpowiada to sytuacjom, gdy liczba inte¬ 
resujących nas obiektów jest niewielka i pojęcie stę¬ 
żenia traci swój ścisły sens. Tak bywa w niektórych 
zagadnieniach ekologicznych, kiedy np. liczba osobni¬ 
ków na danym terytorium wyraża się w dziesiątkach, 
a nawet w jednostkach, lub przy rozważaniu reakcji 
biochemicznych, gdy liczba cząstek biorących udział 
w reakcji jest w obrębie jednej komórki niewielka. 

W tego rodzaju zagadnieniach stosuje się modele 
statystyczne, w których rolę zmiennych odgrywają 
prawdopodobieństwa analizowanych zdarzeń. Związ¬ 
ki między zmiennymi zapisuje się w postaci równań 
różniczkowych lub równań algebraicznych, albo też 
podaje się algorytmy, umożliwiające przeprowadzenie 
rachunków modelowych na komputerach metodą modele wy* 
Monte Carlo. Modele wykorzystujące metodę Monte korzystające 
Carlo stosowane są np. przy badaniu i analizie zagad- metodę 
nienia rozwoju i podziału komórek wówczas, gdy pro- Monte Carlo 
cesy te w znacznym stopniu zależą od przypadkowych 
czynników otoczenia, w wyniku czego okres podziału 
i czas trwania kolejnych faz w cyklu komórkowym 
podlegają znacznym fluktuacjom. 

Modele statystyczne, w których się stosuje równa¬ 
nia różniczkowe, są w istocie — mimo różnic w okreś¬ 
leniu zmiennych charakteryzujących badany układ — 
podobne do modeli dynamicznych, którymi się zaj¬ 
miemy bardziej szczegółowo w następnym rozdziale. 

Analiza modelu statystycznego umożliwia nie tylko 
znalezienie związków między zmiennymi dynamicz¬ 
nymi modelowanego układu, lecz także ocenę roli 
fluktuacji i ich wpływu na przebieg zjawiska. Szczegól¬ 
ne znaczenie takiej analizy przejawia się np. przy 
badaniu układów przełączeniowych (tryggerowych), 
w których niewielka przypadkowa fluktuacja wartości 
zmiennych czy parametrów może decydować o dal¬ 
szym przebiegu dynamiki modelowanego procesu 
(dokładniej w rozdziale Modele przełączania). 
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Modele matematyczne 
(dynamiczne) 

Jak już wspomniano wyżej, modelem matematycz¬ 
nym nazywamy układ związków matematycznych 
między zmiennymi dynamicznymi, współrzędnymi 
przestrzennymi, czasem i parametrami układu. 

Zmienne dynamiczne, ich liczba i charakter zależą 
od rodzaju analizowanego układu. W zagadnieniach 
biochemicznych są to najczęściej stężenia substancji 
wchodzących w reakcje, w zagadnieniach ewolucyj¬ 
nych i ekologicznych — liczebności badanych obiek¬ 
tów lub populacji. Zależność zmiennych (, x ) od czasu 
(0 wyrażana jest w modelu przez pochodne tych 
zmiennych względem czasu (dxjdt). Na ogół zmienne 
dynamiczne mogą zależeć nie tylko od czasu, lecz 
i od miejsca w przestrzeni. 

Parametrami układu mogą być np. prędkości reak¬ 
cji chemicznych,' śmiertelność lub przyrost naturalny 
badanej populacji, wielkości charakteryzujące od¬ 
działywanie między komórkami, cząsteczkami che¬ 
micznymi, członkami badanych populacji itp. Kon¬ 
kretne wartości parametrów często nie są znane lub 
też zmieniają się w szerokim zakresie — w zależności 
od warunków, w jakich się znajduje badany układ. 

Nie wchodząc na razie w szczegóły procedur sto¬ 
sowanych przy analizie modelu (poniżej), wymienimy 
tylko kolejne etapy modelowania matematycznego. 

1. Zebranie dostępnych (zaczerpniętych z badań 
eksperymentalnych oraz ze znanych ogólnych prawid¬ 
łowości) informacji o badanym procesie. 

2. Podjęcie decyzji, jakie zmienne dynamiczne oraz 
jakie parametry będą rozważane w modelu. 

3. Sformułowanie modelu, tj. związków między 
zmiennymi dynamicznymi, parametrami i czasem oraz 
położeniem w przestrzeni. Zależności od czasu i miej¬ 
sca wyraża się przez pochodne względem czasu 
i współrzędnych geometrycznych. 

4. Analiza modelu matematycznego, polegająca 
bądź na 

a) rozwiązaniu układu równań różniczkowych 
i otrzymaniu jawnej postaci zależności każdej ze 
zmiennych od pozostałych zmiennych, czasu i miej¬ 
sca w przestrzeni, bądź na 

b) jakościowej analizie właściwości układu dyna¬ 
micznego, prowadzącej do wniosków o ogólnym cha¬ 
rakterze wzajemnych związków między zmiennymi 
i o ich zależności od parametrów, czasu i miejsca. 

5. Sformułowanie wniosków dotyczących dyna¬ 
micznych charakterystyk analizowanego zjawiska czy 
zespołu zjawisk. Wnioski takie mogą np. zawierać 
stwierdzenie charakteru zmienności w czasie po¬ 
szczególnych zmiennych (np. występowanie oscylacji) 
lub stwierdzenie asymptotycznego (po długim czasie) 
zachowania się zmiennych (np. dążenie do warto¬ 
ści stacjonarnych odpowiadających trwałym, stabil¬ 
nym stanom układu albo oddalenie się od wartości 
stacjonarnych odpowiadających stanom nietrwa¬ 
łym. 

Ważne jest, że badając model, można przeanalizo¬ 
wać wpływ poszczególnych parametrów na przebieg 
badanego zjawiska, a w szczególności — przewidzieć 
możliwość występowania nagłych zmian jakościo¬ 
wych przebiegu procesu (przełączanie). 

6. Porównanie wniosków wynikających z analizy 
modelu ze znanymi faktami doświadczalnymi doty¬ 
czącymi badanego procesu lub wskazanie możliwych 
obserwacji i eksperymentów umożliwiających porów¬ 
nanie rzeczywistych charakterystyk procesu z przewi¬ 
dywaniem modelu. Po dokonaniu takiej konfron¬ 
tacji model i założenia stanowiące jego podstawę 
mogą być uznane za prawidłowe, oczywiście w grani¬ 
cach przewidzianych przy wprowadzeniu uproszczeń 
i przy idealizacji rzeczywistej sytuacji. 

W następnych paragrafach tego rozdziału omówi¬ 
my metody modelowania matematycznego układów 
dynamicznych i wprowadzimy podział modeli na 
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modele punktowe, modele uwzględniające wiek 
obiektów oraz modele uwzględniające układy prze¬ 
strzennie niejednorodne. 


Modele punktowe 

Do najprostszych modeli matematycznych należą ta¬ 
kie, w których zmienne dynamiczne nie zależą od 
współrzędnych przestrzennych. Takie modele mate¬ 
matyczne nazywamy punktowymi. Przed sformuło¬ 
waniem układu równań stanowiących model mate¬ 
matyczny układu niezbędne jest podjęcie decyzji 
o wyborze i liczbie zmiennych dynamicznych. Jeżeli 
liczba zmiennych (*<) wynosi n, wówczas model 
matematyczny badanego zjawiska można zapisać 
w postaci układu równań różniczkowych: 

dxi 

~~dt~ ^2ł ••• > ■*«)» (1) 

gdzie w funkcjach P Ł zawarte są parametry charak¬ 
teryzujące warunki, w jakich zachodzą badane pro¬ 
cesy. Jeżeli pochodne zmiennych dynamicznych 
względem czasu (dxi/dt) są miarą tempa zmian wiel¬ 
kości Xi w czasie, to charakteryzują one dynamikę 
zachowania się tych wielkości. 

Rozwiązanie tego układu równań w postaci jaw¬ 
nych zależności każdej ze zmiennych Xi od pozostałych 
zmiennych i czasu daje obraz zachowania się mode¬ 
lowanego układu w czasie. Wykażemy niżej, że nie 
zawsze taka postać rozwiązania jest niezbędna. Często 
wystarczające dla opisu modelowanego procesu jest 
podanie i analiza jego tzw. obrazu fazowego (o czym 
niżej). 

Jeżeli funkcje Pi nie zależą w sposób jawny od 
czasu, to układ taki nazywamy autonomicznym; w fi¬ 
zyce jest to równoważne badaniu układu odosobnio¬ 
nego. Jeżeli mamy do czynienia z układem znajdu¬ 
jącym się w zmiennych warunkach zewnętrznych, 
wówczas mówimy o układzie nieautonomicznym; 
w układzie równań odpowiada to wprowadzeniu jaw¬ 
nej zależności od czasu. Dążenie do uwzględnienia 
w modelu wszystkich procesów zachodzących w ba¬ 
danym układzie biologicznym wiąże się nieuchronnie 
z wprowadzeniem dużej liczby zmiennych i — od¬ 
powiednio —- dużej liczby równań stanowiących 
układ. Analiza takiego układu i efektywne wypro¬ 
wadzenie wniosków, choćby tylko jakościowych, 
stanowi często zadanie trudne, niekiedy wręcz nie¬ 
wykonalne. Wynika to z trudności matematycznych, 
a przede wszystkim — z niedoskonałej znajomości 
charakterystyk poszczególnych procesów. Zdarza 
się co prawda, że nie znając szczegółowo jakiegoś 
procesu, wiemy jednak że jest to proces bardzo po¬ 
wolny w porównaniu z innymi, opisywanymi przez 
pozostałe równania układu, albo odwrotnie: wiemy, 
że jedna ze zmiennych dynamicznych zmienia się bar¬ 
dzo szybko, np. oscylując z okresem małym w po¬ 
równaniu z interwałem czasowym charakterystycz¬ 
nym dla innych zmiennych. W takich wypadkach wol- 
nozmienne wielkości można uznać za stałe i trakto¬ 
wać jako parametry układu dynamicznego. Z drugiej 
strony —■ można przyjąć, że szybko zmieniające się 
wielkości osiągnęły już swoje wartości stacjonarne, 
odpowiadające chwilowym wartościom innych zmien¬ 
nych. Umożliwia to związanie tych szybkozmiennych 
wielkości z pozostałymi za pomocą równań algebra¬ 
icznych (przez przedstawienie tych zmiennych jako 
funkcji pozostałych zmiennych). 

W wyniku takich rozważań i zastosowania odpo¬ 
wiednich procedur matematycznych otrzymujemy 
ostateczny układ dynamiczny, zawierający tylko te 
zmienne, których prędkości zmian w czasie są w przy- 
bliżeniu tego samego rzędu. Oznacza to, że jeżeli 
analizujemy zjawisko o pewnych określonych cha¬ 
rakterystykach czasowych, nieistotne są procesy 
przebiegające znacznie wolniej lub znacznie szybciej. 


najprostsze 

modele 

dynamiczne 


układ 

autono¬ 

miczny 



Model matematyczny składa się zatem w rezultacie 
najczęściej z niewielu równań różniczkowych, często 
tylko z dwóch lub trzech. 

najprostszy Zajmiemy się najprostszym rodzajem układu dy- 
układ namicznego, złożonym tylko z dwóch równań róż- 
dynamiczny niczkowych, które zapiszemy w postaci: 

dxjdt — P(x,y), 
dy/dt = Q(x,y). 

Funkcje P{x t y) i Q(x , y) stanowią więc miarę tempa 
zmian zmiennych dynamicznych x i y. Odpowiednio 
równania te dzielimy stronami przez siebie, elimi¬ 
nujemy czas z układu równań (2) i otrzymujemy: 

dy{dx = Q(x, y)IP(x , y) (3) 

pod warunkiem, że procedura ta nie dotyczy punk¬ 
tów, w których funkcja P{x , y) osiąga wartość zero. 
Otrzymane w ten sposób równanie różniczkowe, wią¬ 
żące zmienne dynamiczne * i y, można niekiedy roz¬ 
wiązać analitycznie, tj. można znaleźć jawną postać 
związku y — /(*), który spełnia równanie (3). Ele¬ 
mentarna znajomość rachunku różniczkowego i cał¬ 
kowego prowadzi do wniosku, że rozwiązanie zapisa¬ 
ne w postaci y = f{x) nie jest jedyne; ogólne rozwią¬ 
zanie równania (3) ma postać: 

y-Ax,o, ( 4 ) 

gdzie C jest tzw. stałą całkowania. Wartość stałej 
całkowania C zależy od wartości początkowych, 
tj. wartości zmiennych x i y w określonej chwili, 
którą możemy nazwać chwilą początkową, t — 0. 
W ten sposób rozwiązaniem równania (3) jest cała 
rodzina związków między zmiennymi x i y; poszcze¬ 
gólne funkcje, wchodzące w skład tej rodziny różnią 
się między sobą wartościami stałej C. Związek między 
zmiennymi x i y można przedstawić jako wykresy 
w układzie współrzędnych x i y. Rysunek 3 przedsta¬ 
wia przykład takiej rodziny krzywych, przy czym 
każdej krzywej odpowiada inna określona wartość 
stałej C. Taką płaszczyznę (przestrzeń trój- lub więcej 
wymiarową, jeżeli mamy do czynienia z więcej niż 
płaszczyzna dwiema zmiennymi) nazywamy płaszczyzną fazową, 
fazowa a wykresy funkcji (4) nazywamy trajektoriami układu 
w przestrzeni fazowej. Trajektorie są krzywymi 
zorientowanymi, tzn. zaopatrzonymi w strzałki okre¬ 
ślające zwrot ruchu po trajektorii. Przechodzenie od 
punktu do punktu wzdłuż określonej trajektorii od¬ 



powiada zmianom stanu modelowanego układu 
w czasie, jeżeli układ wystartował w chwili początko¬ 
wej ze stanu, który odpowiada punktowi znajdują¬ 
cemu się na tej trajektorii, a warunki (parametry 
układu bądź wpływy czynników zewnętrznych) nie 
uległy w tym czasie zmianie. Zbiór trajektorii nosi obraz fazowy 
nazwę obrazu fazowego modelu (2). Każdemu punk- modelu 
towi przestrzeni fazowej odpowiada określona para 
wartości zmiennych dynamicznych x i y, a zatem — 
określony stan badanego układu. Należy przy tym 
pamiętać, że współrzędne y i x nie mają nic wspól¬ 
nego ze współrzędnymi przestrzennymi. Można wy¬ 
kazać, że przez każdy punkt płaszczyzny fazowej, 
z wyjątkiem punktów, w których P(x,y) = 0 
i Q(x, y) = 0 (takie punkty nazywamy punktami 
osobliwymi) przechodzi tylko jedna trajektorią. 

Znalezienie punktów osobliwych i zbadanie ich cha¬ 
rakteru (o czym niżej) stanowi istotny element bada¬ 
nia układu dynamicznego. 

Jeżeli analityczne rozwiązanie równania (3) wiąże 
się ze znacznymi trudnościami matematycznymi, to 
zawsze jest możliwe skonstruowanie obrazu fazo¬ 
wego badanego układu przy pomocy rachunków 
numerycznych. Wykorzystuje się wówczas fakt, że 
wartość dy/dx ~ Q(x , y)/P(x, y) odpowiadająca każdej 
parze wartości x i y daje kierunek stycznej do trajek¬ 
torii przechodzącej przez punkt (x,y). Jednak nawet 
bez szczegółowych rachunków numerycznych można 
wykorzystać znajomość funkcji P(x, y) i Q(x , y) dla 
znalezienia ogólnych właściwości obrazu fazowego 
badanego układu. Równanie jP(*,y) = 0 określa izokliny 
pewną krzywą zwaną izokliną stycznych pionowych; 
krzywa ta jest miejscem geometrycznym wszystkich 
punktów, w których styczne do trajektorii układu 
dynamicznego mają kierunek pionowy. Analogicznie 
równanie Q(x,y) = 0 określa izoklioę stycznych 
poziomych. Krzywe te nazywamy głównymi izokli- 
nami obrazu fazowego badanego układu dynamicz¬ 
nego (zob. np. rys. 14). Punkt przecięcia głównych izo- 
klin nazywamy punktem osobliwym (stacjonarnym). 

W stanie odpowiadającym temu punktowi pochod¬ 
ne dxjdt i dyjdt równają się zeru, a zatem zmienne 
x i y są. stałe, nie ulegają zmianom. Stan taki można 
więc nazwać stanem równowagi, przy czym — po¬ 
dobnie jak w zagadnieniach statyki w mechanice — 
stan równowagi może być trwały (stabilny) lub nie¬ 
trwały (niestabilny). Układ wyprowadzony z tego 
stanu (np. przez działanie czynników zewnętrznych) 
lub znajdujący się w chwili początkowej w pobliżu 
tego stanu dąży odpowiednio po odpowiedniej trajek¬ 
torii do stanu równowagi trwałej lub oddala się coraz 
bardziej od stanu równow-agi nietrwałej. Analiza cha- przykłady 
rakteru punktów osobliwych na obrazie fazowym mo- obrazów 
delowanego układu stanowi zatem ważną informację fazowych 
o dynamice układu. Nie wchodząc w szczegóły mate¬ 
matycznych rozważań prowadzących do otrzymania 
obrazu fazowego, podamy poniżej kilka przykładów 
różniących się między sobą charakterem punktów 
osobliwych: 

a) Rysunek 4 przedstawia przykład obrazu fazo¬ 
wego, którego punkt osobliwy jest węzłem trwałym 
(na rysunku naszkicowano kilka spośród nieskończe¬ 
nie wielu trajektorii fazowych); wszystkie trajektorie 
zbiegają się w miarę upływu czasu do węzła trwałego, 
niezależnie od stanu początkowego układu. Stanowi 
to ważną informację w wypadku modelowania kon¬ 
kretnego układu. Stan odpowiadający węzłowi sta¬ 
bilnemu jest stanem równowagi trwałej odpowiada¬ 
jącym określonym wartościom zmiennych dyna¬ 
micznych x i y. 

b) Rysunek 5 przedstawia przykład obrazu fazo¬ 
wego, którego punktem osobliwym jest węzeł nie¬ 
trwały. Z biegiem czasu obydwie zmienne dynamiczne 
oddalają się od tego punktu, odpowiadającego stano¬ 
wi równowagi nietrwałej. Stan układu odpowiadający 
punktowi osobliwemu jest nietrwały, co oznacza, że 
dowolnie mała, przypadkowa fluktuacja wyprowadza¬ 
jąca układ z tego stanu prowadzi do zmian nieod- 
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wracalnych — punkt stanowiący obraz stanu modelo¬ 
wanego układu oddala się po odpowiedniej trajektorii 
do nieskończoności lub do innego, trwałego punktu 
osobliwego, jeżeli taki istnieje na płaszczyźnie fazo¬ 
wej. 

c) Rysunek 6 przedstawia przykład obrazu fazowe¬ 
go, którego punktem osobliwym jest siodło. Liniami 



pogrubionymi zaznaczono separatrysy układu. Łatwo 
zauważyć, że siodło jest nietrwałym punktem osobli¬ 
wym. Przez analogię do poprzednich przykładów 
(a i b) można prześledzić losy punktu — obrazu na 
płaszczyźnie fazowej — w zależności od stanu po¬ 
czątkowego układu. 

d) Na rys. 7a podano przykład obrazu fazowego, 
którego punktem osobliwym jest tzw. środek. Przy 
omawianiu zastosowania maszyn analogowych w pa¬ 
ragrafie poświęconym modelom matematycznym 
pokazano obraz fazowy tego typu otrzymany na 
ekranie oscyloskopu maszyny analogowej. Warto 
zauważyć, że zmienne dynamiczne takiego układu 
oscylują w czasie, periodycznie powracając do punktu 
początkowego, gdy odbędą pełny obieg po cyklu 
zamkniętym. Jeżeli układ modelowany zostanie wy¬ 
prowadzony z tego cyklu (np. przez zwiększenie war¬ 
tości zmiennej x — czy to przez doprowadzenie z zew¬ 
nątrz pewnej ilości substancji, jeżeli x jest jej stęże¬ 
niem, czy też przez doprowadzenie osobników okre¬ 
ślonego gatunku, jeżeli x jest liczebnością jego popu¬ 
lacji), to punkt na płaszczyźnie fazowej rozpocznie 
ruch po nowej zamkniętej trajektorii. O takich tra¬ 
jektoriach mówimy, że są nietrwałe (o czym w roz¬ 
dziale Modele oscylacyjne). Przy modelowaniu pro¬ 
cesów spotykamy się niekiedy z tzw. cyklami gra¬ 
nicznymi. Odpowiada to sytuacji, gdy trajektorie 
układu wychodzące z jakiegoś punktu osobliwego, 
np. niestabilnego węzła, dążą asymptotycznie, po 
dostatecznie długim czasie, do cyklu zamkniętego, 
a po osiągnięciu go obiegają taki cykl, co odpowiada 
trwałym oscylacjom zmiennych x i y. Sytuację taką 
przedstawia schematycznie rys. 7b. 
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e) Na rys. 8a, b podano przykłady obrazów fazo¬ 
wych układów, których punktami osobliwymi są od¬ 
powiednio ognisko trwałe i ognisko nietrwałe. Mamy 
tu do czynienia z oscylacjami obydwu zmiennych. 
Oscylacje te nie są jednak periodyczne, układ nie 
powraca do stanu początkowego, lecz dąży z biegiem 
czasu do punktu trwałego (a) lub do nieskończoności 
(b) czy innych punktów osobliwych. Podane przykłady 
stanowią ilustrację niektórych typów obrazów fazo¬ 
wych. Znajomość funkcji P(x>y) i Q(x,y) oraz od¬ 
powiedniego aparatu matematycznego umożliwia 
przeprowadzenie tzw. jakościowej analizy układu dy¬ 
namicznego, stwierdzenie, czy istnieje i jaki ma cha¬ 
rakter punkt osobliwy, oraz naszkicowanie przebiegu 
trajektorii fazowych, izoklin układu. Nawet gdy 
mamy do czynienia ze złożonym układem dynamicz¬ 
nym, można — nie poszukując jego pełnego, ścisłego 
rozwiązania — uzyskać bogate informacje o bada¬ 
nym układzie przeprowadzając jakościową analizę 
obrazu fazowego modelowanego układu. 

Kilka przykładów zastosowania matematycznych 
modeli punktowych i ich analizy w zagadnieniach 
biologicznych podamy w rozdziale Wybrane przy¬ 
kłady modeli matematycznych w zagadnieniach bio¬ 
logicznych. 


Modelowanie uwzględniające wiek 
obiektów 


wania struktur przestrzennych, takich jak periodyczna 
struktura kręgosłupa czy warstwowa struktura ga- 
struli w embriologii. Ważną właściwość modeli nie- 
punktowych stanowi możliwość opisu przy ich pomocy 
procesu spontanicznego rozbicia pierwotnie jednorod¬ 
nego obszaru na szereg jednorodnych podobszarów. 
Ma to miejsce wówczas, gdy w odpowiednim modelu 
punktowym (bez dodatkowych członów po prawej 
stronie równań) występują nietrwałe punkty osobli¬ 
we. W § Modele przełączania będzie mowa o przy¬ 
kładach takich modeli. 

Znaczenie poszczególnych typów wyżej opisanych 
modeli zależy oczywiście od konkretnego zagadnienia, 
w jakim model jest stosowany, oraz od zadań stawia¬ 
nych przed modelem. Wydaje się jednak, że w obec¬ 
nym stanie rozwoju biologii i biofizyki teoretycznej 
szczególnie ważną rolę odgrywają modele dynamicz¬ 
ne. Kilka takich przykładów podamy w rozdziale 
Wybrane przykłady modeli matematycznych w za¬ 
gadnieniach biologicznych. 


Wybrane przykłady modeli 
matematycznych 
w zagadnieniach biologicznych 

Model hodowli ciągłej 


Modele takie stosuje się wówczas, gdy badane obiekty 
z biegiem czasu zmieniają swe własności. Uwzględ¬ 
nienie tego konieczne jest w zagadnieniach takich 
jak ekologia gatunków, wzrost i rozmnażanie komó¬ 
rek. Odpowiednio równania dynamiczne mają po¬ 
stać: 

3x0, T) - - wx, (5) 

et 8 t 

gdzie x oznacza liczbę osobników w wieku T w chwili 
f, a W — współczynnik śmiertelności, który może 
zależeć od wieku T. (Symbol djdt oznacza tzw. po¬ 
chodną cząstkową względem czasu). Lewa strona 
równania opisuje starzenie się osobników, prawa 
strona — ich śmierć. Uzupełnianie populacji jest 
uwzględnione w tzw. warunku granicznym: 

00 

x(t,0) = $ »(T)x(t,T)dT, (6) 

O 

gdzie n(T) jest współczynnikiem rozmnażania. W pro¬ 
stszych modelach stosuje się często rozkładanie po¬ 
pulacji na grupy wiekowe. Równanie (6) przechodzi 
wówczas w układ równań, w których zmiennymi dy¬ 
namicznymi są liczebności odpowiednich grup. 


Jednym z najprostszych, a zarazem najszerzej stoso¬ 
wanych w praktyce modeli matematycznych jest 
model hodowli ciągłej mikroorganizmów. Model ten 
jest szczególnie przydatny przy planowaniu optymal¬ 
nych warunków hodowli drobnoustrojów, których 
funkcją jest przemiana małowartościowego substratu 
na produkt bardziej dla nas wartościowy (np. para¬ 
finy na jadalne białka). Procesy takie na wielką skalę 
przeprowadza tzw. mikrobiologia przemysłowa. Po¬ 
dobne problemy występują w przemyśle farmaceuty¬ 
cznym oraz przy projektowanu układów umożliwia¬ 
jących długotrwałe przebywanie człowieka w prze¬ 
strzeni kosmicznej. 

W najprostszym wariancie modelu hodowli ciągłej 
uwzględnia się tylko zmiany w czasie stężenia sub¬ 
stratu (5) oraz stężenia produkowanej biomasy ( x ). 
Rnzważany proces ma następujący przebieg: do na¬ 
czynia zwanego kultywatorem (rys. 9), w którym się 
odbywa proces, wprowadza się substrat o stężeniu 
S 0 , z objętościową prędkością D. W kultywatorze 
znajdują się i rozmnażają interesujące nas w danym 
zagadnieniu drobnoustroje, a wypływa z naczynia 
(z taką samą prędkością objętościową D) mieszanina 
zawierająca nie zużyty substrat oraz drobnoustroje. 


Modele niepunktowe, opisujące układy 
przestrzennie niejednorodne 

Badanie zjawisk zachodzących w układach, w których 
zmienne i parametry charakteryzujące układ zależą 
nie tylko od czasu, ale i od współrzędnych przestrzen¬ 
nych, wymaga stosowania modeli niepunktowych. 
Aby uwzględnić niejednorodność przestrzenną i — 
w szczególności — zjawiska dyfuzji, wystarcza w ukła¬ 
dzie równań dynamicznych (1) dodać człony opisu¬ 
jące przepływ substancji w przestrzeni. Układ równań 
przybiera wówczas postać: 

. 

ct 


n 



gdzie Th, ^ 2 , Vz oznaczają współrzędne przestrzenne. 
Modele tego typu wykorzystuje się do opisu powsta- 


Rys. 9. Schemat kultywatora 
przepływowego 



Model matematyczny hodowli ciągłej można zapi¬ 
sać w postaci układu dwóch równań różniczkowych 


gdzie 


dx 

HF 


n(S)x-Dx , 


-=f- = »(S)x-DS+DS 0> 
at 


M(S) = 


a S 

kF+s' 


( 8 ) 

( 9 ) 


model 

hodowli 

ciągłej 

mikroorga¬ 

nizmów 


model 
matematy¬ 
czny hodowli 
w warunkach 
przepływu 


809 















Kształt zależności współczynnika fi od S jest znany 
z eksperymentalnych prac Monoda. Sens fizyczny 
tej zależności jest prosty: przy małych stężeniach 
substratu S współczynnik fi szybko się zmienia wraz 
z S , natomiast przy dużych stężeniach 5, gdy sub- 
strat znajduje się w nadmiarze (S > Ks ) — współ¬ 
czynnik /*(£) staje się praktycznie stały. Omawiana 
zależność jest podobna do znanego w kinetyce reak¬ 
cji chemicznych prawa Michaelisa, opisującego za¬ 
leżność prędkości reakcji enzymatycznych od stężenia 
substratu. Możliwe są także inne postacie zależności 
fi od S. Obraz fazowy układu, którego model mate¬ 
matyczny stanowią równania (8) przedstawia rys. 10. 
Na rysunku zaznaczono główne izokliny I i II, punkt 
osobliwy układu jest węzłem trwałym. Analiza mo¬ 



delu prowadzi ponadto do wniosku, że istnieje pewna 
krytyczna wartość stężenia S 0 , poniżej której hodowla 
ciągła staje się niemożliwa (mikroorganizmy wypłu¬ 
kują się z kultywatora). Analiza modelu pozwala po¬ 
nadto wyznaczyć prędkość przepływu D oraz po¬ 
czątkowe stężenie S Q , odpowiadające z góry danej 
efektywności produkcji, której miarą jest wielkość 
P*s ■ ~ (S 0 --S)/S (w warunkach stacjonarnych). Ana¬ 
lizując dalej model można wreszcie uzyskać optymal¬ 
ny wariant pracy układu w początkowym stadium 
rozruchu. 

Omówiony powyżej model jest modelem uproszczo¬ 
nym. W mikrobiologii przemysłowej stosowane są 
bardziej złożone modele, uwzględniające szereg in¬ 
nych czynników, takich jak efekt ciasnoty (wpływ 
oddziaływania między drobnoustrojami), rozkład 
hodowanych obiektów według wieku, przesunięcie 
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w czasie (opóźnienie) zmian tempa rozmnażania 
w stosunku do wywołujących je zmian stężeń 
substratu. Jednakże u podstaw każdego z tych 
realnie stosowanych złożonych modeli leży przed¬ 
stawiony powyżej uproszczony wariant modelu ho¬ 
dowli ciągłej. 


Modele oscylacyjne 


Typowymi przykładami modeli oscylacyjnych są 
modele dotyczące współistnienia gatunków, znane 
w literaturze pod nazwą modeli Lotki i Voltenry. 
Przedstawiamy poniżej prosty model VoIterry opi¬ 
sujący współistnienie populacji drapieżników i popu¬ 
lacji ofiar przy założeniu, że ofiary (populacja (1)) 
mają pod dostatkiem pożywienia, pokarm zaś dra¬ 
pieżników (populacji (2)) stanowią przedstawiciele 
populacji (1). 

Równania różniczkowe stanowiące model mają na¬ 
stępującą postać: 


_L « tN^yNiNt, 

~ = -w t +sN x N t . 


( 10 ) 


N x oznacza liczebność populacji (1) (ofiar), N 2 — 
populacji (2) (drapieżników). W modelu przyjęto 
założenie, że populacja (1) rozmnaża się ze stałą 
prędkością, ginie zaś w wyniku spotkań z drapież¬ 
nikami ; ponadto — że populacja (2) może się rozmna¬ 
żać tylko w warunkach, gdy nie brak jej pożywienia, 
którym są ofiary, ginie zaś tylko śmiercią naturalną. 
Założenia te łatwo można rozpoznać w poszczególnych 
członach układu równań. 

Analiza zaproponowanego modelu nie jest trudna, 
wynik jej, w postaci obrazu fazowego układu, przed¬ 
stawia rys. 11. Rozważany układ jest układem zacho¬ 
wawczym, ponieważ trajektorie układu są krzywymi 
zamkniętymi. Liczebność każdej populacji oscyluje 
w czasie; wynika to stąd, że procesy rozmnażania 
(zwiększania liczebności) populacji (2) są przesunięte 
w fazie, są opóźnione w stosunku do zmian ilości ich 
pożywienia, czyli populacji (1). 

W przedstawionym tu, bardzo uproszczonym mo¬ 
delu pominięto działanie wszelkich czynników zew¬ 
nętrznych, które w realnych warunkach mogą wy¬ 
wierać istotny wpływ na liczebność obydwu rozważa¬ 
nych populacji. 

Warto zwrócić uwagę, że jednorazowe działanie 
czynników zewnętrznych, zmieniające liczebność jed¬ 
nego z gatunków, przenosi punkt na obrazie fazowym 
na inną trajektorię, przy czym efekt takiego działania 
zależy od fazy. I tak np. zwiększenie liczebności ga¬ 
tunku (1) w fazie A x (trajektoria A) przenosi układ na 
trajektorię wewnętrzną (£), o mniejszych oscylacjach, 
dla której maksymalna liczebność każdego gatunku 
jest mniejsza niż dla trajektorii A. Na odwrót — 
zwiększenie liczebności gatunku (1) w fazie A 2 prze¬ 
prowadzi układ na trajektorię C, gdzie oscylacje 
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osiągają większe amplitudy, a maksymalna liczebność 
każdego gatunku jest większa niż dla początkowej 
trajektorii A. Takie oscylacje zaobserwowano w re¬ 
alnych warunkach, np. oscylacje liczebności populacji 
ryb w Morzu Śródziemnym oraz liczebności rysi 
i królików w Kanadzie. Drugi przykład zilustrowany 
jest wykresem (rys. 12 i 13), gdzie widoczny jest wy¬ 
raźnie oscylujący przebieg liczebności obydwu oma¬ 
wianych gatunków, przy czym maksima liczebności 
ofiar wyprzedzają w czasie maksima liczebności dra¬ 
pieżników. Zauważmy, że zastosowany model mate¬ 
matyczny zawierał szereg upraszczających założeń 
oraz że dane przedstawione na rys. 13 dotyczą liczby 
skór zajęczych i rysich dostarczonych do punktów 



Rys. 12. Zmiany w czasie liczby ofiar (JV,) i drapieżników ( N t ) 
otrzymane w wyniku rozwiązania równania (10) 


skupu przez myśliwych, co nie musi być ściśle pro¬ 
porcjonalne do liczebności populacji. Mimo tych za¬ 
strzeżeń zgodność przewidywań modelu z danymi 
obserwacyjnymi można uznać za jakościowo zadowa¬ 
lającą. 



Rys. 13. Zmiany liczby skórek zajęczych i mysich w Kanadzie 
w latach 1845-1935 


Natomiast porównanie ilościowe przewidywań 
wypływających z modelu z wynikami obserwacji wy¬ 
kazało, że model Volterry w wyżej podanej, najpro¬ 
stszej postaci nie daje dostatecznie dokładnego opisu 
zjawisk obserwowanych w badaniach ekologicznych. 
Wskazuje to na konieczność stosowania modeli bar¬ 
dziej złożonych, uwzględniających w szczególności 
czynniki takie, jak ograniczoność zapasów pożywienia 
ofiar, ograniczoność terenu, na którym współistnieją 
rozważane gatunki (efekt ciasnoty), i wiele innych. 
Modele takie istotnie szeroko się rozwija i opraco¬ 
wuje. Warto jednak podkreślić, że u podstaw tego 
rodzaju modeli leży przeważnie idea prostego, kla¬ 
sycznego modelu Volterry. 

model Model procesu glikolizy stanowi dobry przykład 
procesu procesu wszechstronnie zbadanego, tzn. zarówno 
glikolizy eksperymentalnie, jak i z punktu widzenia modeli 
matematycznych. Glikoliza jest jednym z najpro¬ 
stszych i dobrze zbadanych procesów odbywających 
się w cytoplazmie komórki. Proces ten polega na 
zamianie glukozy w kwas pirowinogronowy. Ponadto 
glikoliza odgrywa ważną rolę wśród procesów związa¬ 
nych z wytwarzaniem spirytusu etylowego. Przepro¬ 
wadzono eksperymentalne badanie oscylacji w pro¬ 
cesie glikolizy zarówno w cytoplazmie, jak i w układzie 


czystych enzymów i substratów glikolizy, przy czym 
w tej drugiej grupie eksperymentów otrzymano wia- 
rogodne ilościowe dane doświadczalne (eksperymenty ekspery- 
Chance’a i Hessa). W wyniku tych eksperymentów menty 
stwierdzono, że występują periodyczne zmiany w cza- Chance'a 
sie stężeń produktów reakcji glikolizy. i Hessa 

Model matematyczny procesu zaproponował 
E. Sielkow. Za podstawę modelu przyjął ścisłe rów¬ 
nania kinetyczne odnoszące się do całego łańcucha 
reakcji chemicznych stanowiących proces glikolizy 
i oparł się na znanych właściwościach enzymów bio¬ 
rących udział w tym procesie. Układ stanowiący 
model matematyczny składał się z wielu równań. Na 
podstawie reguł i procedur matematycznych wspom¬ 
nianych w paragrafie. „Modele punktowe” udało mu 
się zredukować pierwotny model do 2 tylko rów¬ 
nań różniczkowych z dwiema zmiennymi. W uprosz¬ 
czonym wariancie tego modelu, przeanalizowanym 
wcześniej przez Higginsa, zmiennymi dynamicznymi 
są: x , będące miarą stężenia sześciowęglowych cu¬ 
krów, powstających ze stałą prędkością z glukozy 
(na początku łańcucha reakcji w procesie glikolizy), 
oraz y, będące miarą stężenia jednej z substancji — 
produktów końcowej części łańcucha procesu gliko¬ 
lizy. Nie podajemy tu pełnego zapisu modelu nawet 
w prostszym wariancie Higginsa, raczej kładziemy 
nacisk na jakościową stronę zagadnienia. 

Obraz fazowy analizowanego układu po wprowa¬ 
dzeniu bezwymiarowych zmiennych x' i y' (proporcjo¬ 
nalnych odpowiednio do x i y) przedstawia rys. 14. 

Na rysunku zaznaczono główne izokliny / i II oraz 
krzywą zamkniętą III, stanowiącą tzw. cykl graniczny. 

Bardziej wnikliwa analiza modelu pozwoliła stwier¬ 
dzić, że w wyniku zmian wartości parametrów wystę¬ 
pujących w modelu, a w szczególności — szybkości v , 
dopływu glukozy, model przewiduje bądź trwały, 
stabilny przebieg procesu (przy dużych wartościach v ), 
bądź też oscylacyjny charakter procesu (przy małych 
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v ), co odpowiada wspomnianemu już cyklowi gra¬ 
nicznemu. Rysunek 15 ilustruje jakościowo tę za¬ 
leżność przebiegu procesu od parametru v. Wyniki 
modelu porównano z danymi eksperymentalnymi. 
Stwierdzono słuszność przewidywań modelu doty¬ 
czących przechodzenia układu od zachowania stabil¬ 
nego do oscylującego oraz związku tych przejść ze 
zmianami wartości parametrów układu. Analiza 
opisanego modelu ma też bardziej ogólny aspekt; 
stanowi mianowicie pewien krok naprzód w zrozu¬ 
mieniu mechanizmu regulacji procesów biochemicz¬ 
nych. Nieco bardziej złożony wariant modelu zasto¬ 
sowano do opisu związku między procesem glikolizy 
i oddychaniem, co umożliwiło wyjaśnienie efektów 
włączania i wyłączania procesu glikolizy w warunkach 
anaerobowych (beztlenowych) i aerobowych (z do¬ 
stępem tlenu). 

Model generacji impulsu nerwowego zaproponowa¬ 
ny przez Hodgkina i Huxleya w 1953 r. jest przykładem 
modelu, w którym punkt osobliwy jest węzłem. Model 
ten opisuje przechodzenie jonów potasu (K) i sodu 
(Na) przez membranę komórek nerwowych oraz 
zmiany potencjału membrany; zmiany potencjału 
membrany są uwarunkowane prądem elektrycznym, 
a zmiany przewodnictwa — zmianami stanu elemen¬ 
tów przewodzących prąd w membranie. Nośnikami 
prądu są jony potasu i sodu, przy czym zmiany 
przewodnictwa jonów sodu są znacznie szybsze niż 
jonów potasu. 

Wykorzystując reguły matematyczne, które prowa¬ 
dzą do redukcji liczby równań stanowiących model 
procesu, można sprowadzić model do dwóch tylko 
równań, w których zmiennymi będą napięcie E oraz 
przewodnictwo jonów potasu gx. Obraz fazowy roz¬ 
ważanego układu, reagującego na wzbudzenie stan¬ 
dardowego impulsu, przedstawia schematycznie rys. 
16a. Przy zmianie napięcia o wartość E (tzw. wzbu¬ 
dzenie progowe) punkt-obraz na płaszczyźnie fa¬ 
zowej przechodzi do obszaru nietrwałego i porusza 
się po trajektorii oznaczonej krzywą przerywaną, 
po czym wraca do stanu początkowego. Trajektoria 
ta na niektórych odcinkach jest prawie równoległa do 
osi odciętych, co oznacza, że czas zmiany potencjału, 
zależny od elektrycznej pojemności membrany, jest 



znacznie krótszy od czasu charakterystyczngo dla 
zmian przewodnictwa. Rysunek 16a daje zatem obraz 
generacji impulsu nerwowego w normalnych warun¬ 
kach. Przy zmianie parametrów związanych z elek¬ 
trycznymi charakterystykami (np. z charakterystyką 
prądowo-napięciową) izokliny główne (/ i //) na 
obrazie fazowym zmieniają swe położenie tak, że' 
punkt osobliwy może przejść do obszaru nietrwałego. 
Sytuację tę ilustruje rys. I6b. Powstają wówczas nie¬ 
ustające drgania relaksacyjne, odbywające się wzdłuż 
cyklu C, zaznaczonego na rysunku. Zdarza się to 
w warunkach patologicznych. Znaczenie tego modelu 
dla medycyny polega przede wszystkim na tym, że 
umożliwia on opis procesów zarówno w stanach 
normalnych, jak i w sytuacjach patologicznych, 
a zarazem wskazuje na możliwe przyczyny efektów 
patologicznych. 

Opisany powyżej model generacji impulsu nerwowe¬ 
go należy do modeli punktowych, tzn. opisuje lokal¬ 
ną sytuację odpowiadającą małemu odcinkowi włókna 
nerwowego. Analiza zjawisk związanych z rozcho¬ 
dzeniem się impulsu nerwowego wymaga uwzględ¬ 
nienia w modelu matematycznym członu wyższego 
rzędu, odpowiadającego zmianom napięcia wzdłuż 
zmiennej przestrzennej; model staje się wówczas 
niepunktowy. 


Modele przełączenia (tryggerowe) 

Modele tego rodzaju są stosowane przy opisie pro¬ 
cesów przełączeniowych w biologii, a zwłaszcza przy 
opisie sytuacji, w których obiekt biologiczny może 
dokonywać wyboru między dwoma możliwymi sta¬ 
nami (reżimami) pracy. Z modeli tego rodzaju ko¬ 
rzysta się np. przy opisie procesów różnicowania tka¬ 
nek w embriogenezie, procesów powstawania i róż¬ 
nicowania gatunków w ewolucji, procesów związanych 
z powstawaniem informacji biologicznej (we wczes¬ 
nych stadiach ewolucji), a także przy opisie powstania 
asymetrii optycznej w biologii. Najważniejszą cechą 
modeli tego typu jest występowanie w nich co naj¬ 
mniej dwóch stanów stacjonarnych, oddzielonych 
od siebie na obrazie fazowym nietrwałą trajektorią 
(rys. 17). 

Do bardziej szczegółowo zbadanych biologicznych 
modeli przełączania należy model opisujący różnico¬ 
wanie tkanek. Podstawowy problem wczesnej embrio- 



genezy można przedstawić w uproszczonej, wyideali¬ 
zowanej postaci w następujący sposób: dwie (sąsied¬ 
nie) komórki znajdujące się w jednakowych warun¬ 
kach i zawierające identyczną informację genetyczną 
po procesie różnicowania zaczynają pracować w róż¬ 
nych reżimach. Sytuacja wygląda zatem tak, jak gdyby 
została naruszona symetria przestrzenna początkowych 
i granicznych warunków dla stanu początkowego. 
Analiza odpowiedniego modelu matematycznego 
pozwala prześledzić proces różnicowania i wskazać 
przyczynę wspomnianego naruszenia symetrii. Mode¬ 
le matematyczne opisujące to zjawisko wychodzą 


model 
stanu 
patolog i 
cznego 


embriogeneza 










z założenia przełączeniowego (tryggerowego) sche¬ 
matu regulacji procesu biosyntezy, zaproponowanego 
przez Jacoba i Monoda. W schemacie tym przyjmuje 
się, że metabolity związane z jednym reżimem (białka 
oraz mRNA) uniemożliwiają syntezę metabolitów 
związanych z działaniem układu w drugim reżimie — 
i vice versa. Można to określić jako antagonistyczne 
oddziaływanie między metabolitami charakterystycz¬ 
nymi dla dwóch rozważanych reżimów. Analiza od¬ 
powiednio sformułowanego modelu matematycznego, 
w którym zmiennymi są stężenia dwóch wyżej wspom¬ 
nianych grup metabolitów, prowadzi do obrazu fa¬ 
zowego przedstawionego na rys. 17, gdzie zaznaczo¬ 
no schematycznie kształt dwóch głównych izoklin 
oraz linię rozdzielającą (separatiysę) S. Układ biolo¬ 
giczny, którego stanowi odpowiada punkt-obraz po 
prawej stronie separatrysy, dąży nieuchronnie do 
stanu trwałego i, układ zaś w stanie początkowym po 
lewej stronic S dąży do stanu trwałego 2. Komórka 
znajdująca się początkowo w stanie 0 (punkt stacjo¬ 
narny nietrwały), bądź w stanie odpowiadającym ja¬ 
kiemuś punktowi na separatrysie może przejść do 
stanu 1 lub 2 pod wpływem dowolnie słabego czynni¬ 
ka zewnętrznego, przy czym przejście takie jest pro¬ 
cesem nieodwracalnym. 

Losy sąsiedniej (II) komórki, która jest związana 
z poprzednio omawianą (I) przez krążenie i wymianę 
metabolitów i substratów, zależą od tego, w jakim 
z dwóch możliwych reżimów działa komórka (I), 
która porzuciła stan nietrwały. Jeżeli wymiana sub¬ 
stratów jest procesem szybkim, a dopływ ich jest ogra¬ 
niczony, to komórka (II) przechodzi do stanu prze¬ 
ciwnego niż komórka (I). Powstaje w ten sposób 
pewna struktura — układ komórek działających 
w różnych reżimach. W zależności od takich para¬ 
metrów, jak zdolność do przenikania metabolitów 
i substratów między sąsiadującymi z sobą komórka¬ 
mi, mogą powstawać różne struktury, złożone z po¬ 
jedynczych komórek lub ich zespołów, przy czym ko¬ 
mórki w takim zespole pracują w jednym reżimie. 
Powstawanie tego rodzaju struktur nazywamy aktem 
różnicowania tkanek, oczywiście w bardzo schema¬ 
tycznym i uproszczonym ujęciu. Analiza powstawania 
struktur w wypadku bardzo dużej liczby komórek wy¬ 
maga stosowania modeli niepunktowych. Warto pod¬ 
kreślić, że powstanie zróżnicowania, przestrzennej 
niejednorodności, jest wynikiem nietrwałości punktu 
osobliwego w f odpowiednim modelu punktowym, 
model Podobne właściwości charakteryzują modele opi- 
powstaWania sujące powstawanie i różnicowanie gatunków biolo- 
i różnicowa- gicznych. Z nietrwałym symetrycznym stanem stacjo- 
nia gatunków namym spotykamy się, gdy próbujemy skonstruować 
model matematyczny powstawania asymetrii optycz¬ 
nej w przyrodzie. Stwierdzono mianowicie, że amino¬ 
kwasy wchodzące w skład żywych organizmów na 
Ziemi są optycznie prawoskrętne, cukry zaś — lewo- 
skrętne. Wydaje się oczywiste, że żywe organizmy 
zawierające aminokwasy i cukry o przeciwnej aktyw¬ 
ności optycznej mogłyby z równym powodzeniem żyć 
i rozwijać się, niemniej jednak nie występują na Ziemi. 
Tworząc model, który wyjaśnia powstawanie takiej 
asymetrii w przyrodzie, wychodzimy z założenia 
asymetria o antagonistycznym (wzajemnie zgubnym) oddziały- 
w przyrodzie waniu organizmów zawierających odpowiednie sub¬ 
stancje o przeciwnej aktywności optycznej. Stwier¬ 
dzono bowiem, że Iewoskrętne aminokwasy nie tylko 
nie są przyswajane, lecz nawet stanowią jakby truciznę 
dla organizmów zawierających prawoskrętne amino¬ 
kwasy i — oczywiście — na odwrót. Wynika stąd 
nietrwałość stanu, w którym współistniałyby w rów¬ 
nych ilościach lewo- i prawoskrętne żywe obiekty. 
Niewielka choćby przewaga liczbowa jednych nad 
drugimi prowadzi nieuchronnie do całkowitego za¬ 
niku organizmów drugiego typu. Można zatem sądzić, 
że jeżeli nawet we wczesnym stadium ewolucji po¬ 
wstały dwa „zwierciadlane” rodzaje żywych organi¬ 
zmów, to z biegiem czasu musiał pozostać praktycznie 
tylko jeden. 


Analogicznie rozumujemy, gdy chodzi o podsta- uniwersał* 
wowy dla współczesnej biofizyki problem, sprowadza- n ośó kodu 
jący się do pytania, dlączego kod genetyczny jest uni- genetycznego 
wersalny (identyczny w całej przyrodzie), mimo że 
można sobie wyobrazić inne, równoważne kody, 
w których np. aminokwasy byłyby poprzestawiane 
w porównaniu z obecnie istniejącym wariantem kodu 
(najkrócej — kodem można by nazwać ustaloną od- 
powiedniość między aminokwasami a trójkami nu- 
kleotydów). Odpowiedzi na postawione pytanie moż¬ 
na szukać w antagonistycznym oddziaływaniu obiek¬ 
tów charakteryzujących się różnymi kodami. Wyni¬ 
kiem oddziaływań między nimi byłoby naruszenie 
regularnej syntezy białek u obydwu obiektów, co 
z kolei musiałoby być zgubne dla obydwu partnerów. 

Model matematyczny uwzględniający to zjawisko 
przewiduje, że stacjonarny stan symetryczny jest nie¬ 
trwały, co w konsekwencji prowadzi do nieuchron¬ 
nego wyginięcia wszystkich żywych obiektów prócz \ 

pomyślnie rozwijającej się jednej grupy, charaktery¬ 
zującej się jednym określonym kodem. Nie sposób 
jednak z góry przewidzieć, który kod odniesie zwy¬ 
cięstwo; zależy to od rodzaju i kierunku przypadko¬ 
wej fluktuacji, wyprowadzającej zespół żywych or¬ 
ganizmów we wczesnym stadium ewolucji z nietrwa¬ 
łego stanu początkowego, w którym współistniały 
żywe obiekty o różnych kodach. Wybór jednego 
wariantu spośród wielu możliwości jest równoważny 
z powstaniem uniwersalnego alfabetu dla całej żywej 
przyrody, stanowi zatem podstawę powstania infor¬ 
macji biologicznej. Aktowi powstawania informacji 
towarzyszą bowiem dwa podstawowe procesy: wybór 
(decyzja) i zapamiętanie. Obydwa te procesy wystę¬ 
pują w układach przełączania (tryggerowych). 


Inne rodzaje zastosowania 
modelowania matematycznego 

Na zakończenie przeglądu zagadnień związanych 
z modelowaniem matematycznym procesów biologicz¬ 
nych warto poruszyć jeszcze dwa tematy nie omawiane 
w zasadniczym tekście artykułu. 


Układy otwarte 

Uważano dawniej, że termodynamika układów ot¬ 
wartych pomoże w znalezieniu ogólnych zasad formu¬ 
łowania modeli matematycznych w zagadnieniach 
biologicznych. Okazało się jednak, że termodynamika 
układów bliskich stanu równowagi napotyka poważne 
trudności przy próbach zastosowania takiego podej¬ 
ścia do procesów biologicznych (próby takie podej- termodyna- 
mował J. Prigogine, który wraz z grupą innych na- mika 
ukowców pracuje od całego szeregu lat nad próbie- układów 
mami termodynamiki tzw. układów otwartych), otwartych 
zwłaszcza przy opisie reżimów oscylacyjnych. Ter¬ 
modynamika układów dalekich od stanu równowagi 
nie jest jeszcze dostatecznie rozwiniętą dziedziną. 

Można sądzić, że analiza konkretnych modeli, szcze¬ 
gólnie niektórych spośród omawianych w niniejszym 
artykule, będzie pewną pomocą w znalezieniu ogól¬ 
nych zasad termodynamiki układów dalekich od rów¬ 
nowagi. Można mieć nadzieję, że w razie pomyślnego 
rozwoju tego kierunku zasady takie będą pożyteczne 
i owocne przy formułowaniu nowych modeli proce¬ 
sów biologicznych. 


Dziedziny mniej związane z biofizyką 

Przykład tego kierunku badań może stanowić wy- zastosowanie 
korzystanie modeli matematycznych w medycynie, w medycynie 
gdzie sformułowanie i analiza odpowiedniego modelu 
pomaga niekiedy w wyborze optymalnego wariantu 
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procedury leczenia środkami farmaceutycznymi lub 
fizykoterapeutycznymi. Rozkład w czasie dozowania 
stosowanych leków czy działań terapeutycznych ma 
niekiedy podstawowe znaczenie, zwłaszcza gdy prze¬ 
bieg choroby ma charakter oscylujący. W takich wy¬ 
padkach ten sam środek stosowany w różnych mo¬ 
mentach (w różnych fazach) może prowadzić do 
istotnie różnych, a niekiedy wręcz przeciwnych rezul¬ 
tatów. Jako przykład takiej sytuacji można wymienić 
wykorzystanie modelowamia matematycznego w stra¬ 
tegii leczenia periodycznie występujących nawrotów 
np. malarii. 

Często stosuje się modele matematyczne w zagad¬ 
nieniach epidemiologii, gdzie przedmiotem modelu 
jest rozprzestrzenianie się i skutki choroby zakaźnej, 
bądź strategia postępowania przy zwalczaniu choro¬ 
by, np. przez masowe szczepienia ochronne. Jako przy¬ 
kład można tu wymienić modele mające na celu wy¬ 
bór optymalnej strategii szczepień przeciwko różycz¬ 
ce, która — w przypadku kobiet we wczesnym okre¬ 
sie ciąży — może prowadzić do poważnych wad roz¬ 
wojowych u potomstwa. Szczepienie ochronne zapo¬ 
biega zapadnięciu na różyczkę w ciągu pewnego 
ograniczonego czasu po szczepieniu. Skrajne warianty 
strategii stosowania szczepień ochronnych przewidu¬ 
ją poddawanie szczepieniu albo tylko dorastających 
dziewcząt, albo powszechne szczepienia dzieci obojga 
płci; ponadto istnieje szereg wariantów pośrednich, 
takich jak np. szczepienia powtarzane co kilka lat 
w wybranych populacjach dzieci i młodzieży. Uwzglę¬ 
dnienie w modelu matematycznym konkretnego 
wariantu strategii szczepień ochronnych takich efek¬ 
tów, jak zaraźliwość choroby w danej populacji. 


trwałość i skuteczność szczepienia i wreszcie kosztów 
związanych z przeprowadzaniem szczepień, pozwala 
na ocenę skuteczności danego wariantu strategii po¬ 
stępowania; ilościową miarą tej skuteczności może 
być np. średnia wartość prawdopodobieństwa nie- 
zapadnięcia na różyczkę we wczesnym okresie ciąży. 
Wynikiem analizy modelu odpowiadającego okre¬ 
ślonemu wariantowi strategii postępowania jest osza¬ 
cowanie jego skuteczności i kosztu; tego rodzaju 
dane pozwalają na podjęcie decyzji o wyborze lub 
odrzuceniu danej strategii postępowania. 


Inny przykład dziedziny, w której się coraz częściej 
stosuje modelowanie matematyczne, stanowi strategia 
wykorzystywania naturalnych bogactw czerpanych 
z fauny i flory naszego globu (np. optymalizacja od¬ 
łowów rybnych w basenach morskich czy długotermi¬ 
nowe prognozy dotyczące możliwości zagwaranto¬ 
wania pożywienia stale rosnącej liczbie mieszkańców 
Ziemi). 

Rola modeli matematycznych wzrosła ostatnio 
w związku z szybkim rozwojem techniki i przemysłu, 
a co za tym idzie — ze stale wzrastającym wpływem 
działania człowieka na biosferę. Uniknąć katastrofal¬ 
nych skutków tego wpływu można tylko przy właści¬ 
wej strategii gospodarowania człowieka na Ziemi 
i właściwym wpływaniu na biosferę. Nie sposób wyo¬ 
brazić sobie poważnych prac w tej dziedzinie bez 
stosowania modeli matematycznych. 

D. S. Czernawski Model matematyczny powstawania życia 
Post. Fiz., 26, 153 (1975); D. S. Czerna wsxi i in. Co to jest bio¬ 
fizyka matematyczna? Warszawa 1974; I. Prigogine i in. Termo¬ 
dynamika ewolucji , Post. Fiz., 26, 253 (1975); I. Rashevsky Ma- 
tnematical Biophysics; Physico-Mathematical Fundations in Bio- 
logy, New York 1960. 
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Fizyka skorupy i wnętrza Ziemi Fizyka atmosfery Fizyka prze¬ 
strzeni okoloziemskiej • Magnetyzm ziemski • Fizyka morza (dy¬ 
namika, optyka, akustyka) Fizyka wód śródlądowych Geofizyka 
poszukiwawcza • 



Fizyka skorupy i wnętrza Ziemi 


Renata Dmowska 

W latach sześćdziesiątych i siedemdziesiątych naszego 
stulecia nastąpił znaczny rozwój wiedzy o wnętrzu 
Ziemi. Obraz procesów zachodzących w jej wnętrzu 
i kształtujących zjawiska powierzchniowe zaczął się 
nareszcie wyłaniać z gęstwiny danych i teorii, zarówno 
tych znanych od lat Jak i najnowszych. Nastąpiło to 
dzięki wprowadzeniu do geofizyki w ciągu ostatnich 
kilkunastu lat nowych metod doświadczalnych i teo¬ 
retycznych oraz możliwości prowadzenia badań na 
dużo szerszą skalę niż to było możliwe dotychczas. 
Początkiem przełomu było zgromadzenie Międzyna¬ 
rodowej Unii Geodezji i Geofizyki w Helsinkach 
w 1960 r., gdzie postanowiono skoncentrować uwagę 
badaczy na zewnętrznej warstwie Ziemi o grubości 
1000 km, obejmującej skorupę i górny płaszcz. Przed¬ 
stawiony wówczas ogólnoświatowy program badań 
geofizycznych skorupy i górnego płaszcza, tzw. Pro¬ 
jekt Górnego Płaszcza (ang. Upper Mantle Project), 
był stymulatorem wielu interesujących odkryć i teorii. 
Po raz pierwszy przeprowadzono systematyczne ba¬ 
dania różnic w budowie górnego płaszcza, rejonu, 
w którym koncentrują się najistotniejsze procesy geo- 
dynamiczne zachodzące we wnętrzu Ziemi i mające 
bezpośredni wpływ na zjawiska na jej powierzchni. 
Zgromadzona ogromna ilość danych dotyczących 
skorupy i górnego płaszcza umożliwiła powstanie glo¬ 
balnych teorii geodynamicznych. 

Na przełomie lat 1971 i 1972 zamknięto Projekt 
Górnego Płaszcza i przystąpiono do realizacji nowego, 
szerokiego programu badań, nazwanego Projektem 
Geodynamicznym (ang. Geodynamical Project). Ce¬ 
lem programu jest kontynuowanie badań zjawisk za¬ 
chodzących we wnętrzu Ziemi oraz, o ile to możliwe, 
skonstruowanie jednolitej, globalnej teorii, opisującej 
procesy geodynamiczne przekształcające naszą pla¬ 
netę od momentu jej powstania aż do chwili obecnej, 
kształt Kształt Ziemi opisywany jest zwykle przy użyciu 
Ziemi dwu powierzchni: sferoidy, tzn. elipsoidy obrotowej 
możliwie najlepiej odpowiadającej powierzchniom 
morza, i geoidy, tzn. powierzchni jednakowego po¬ 
tencjału siły ciężkości. Spłaszczenie sferoidy / okreś¬ 
lone jest wzorem: 

/ = (a-c)/a, 

gdzie a jest średnim promieniem równikowym i wy¬ 
nosi 6378,160 km, c — promieniem biegunowym 
Ziemi i wynosi 6356,775 km. Spłaszczenie sferoidy 
wynosi 1/298,25. Ta ostatnia wielkość została wyzna¬ 
czona z obserwacji orbit sztucznych satelitów Ziemi. 
Metodami geodezji satelitarnej stwierdzono poza tym, 
że geoida ma kształt gruszkowaty. Gruszkowate od¬ 


chylenia geoidy od sferoidy wynoszą mniej niż 20 m, 
natomiast wybrzuszenie równikowe sferoidy wynosi 
ponad 20 km. Średnie odchylenia geoidy od sferoidy 
wzdłuż dowolnego południka ilustruje rys. 1; nato¬ 
miast rys. 2 pokazuje mapę odchyleń geoidy od sferoi¬ 
dy sporządzoną na podstawie danych satelitarnych 
i powierzchniowych pomiarów grawimetrycznych. 
Przewyższenia geoidy nad sferoidą odpowiadają 
większym gęstościom materiału we wnętrzu Ziemi, 
a obniżenia — obszarom o mniejszych gęstościach 
materiału, przy czym anomalie gęstości dotyczą przy¬ 
puszczalnie płaszcza Ziemi. 


biegun 

północny 



biegun 

południowy 


Rys. 1. Odchylenia geoidy od sferoidy 

Budowa Ziemi 

Gałąź geofizyki, dotycząca powstawania i propagacji 
fal we wnętrzu Ziemi, zwana sejsmologią, dostarczyła 
podstawowych danych o budowie jej wnętrza, pra¬ 
wie całkowicie niedostępnego badaniom bezpośred- sejsmologia 
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nim. Powstała na początku bieżącego stulecia sejsmo¬ 
logia instrumentalna umożliwiła rejestrację, a następ¬ 
nie analizę pola falowego generowanego w ogniskach 
trzęsień Ziemi. Rozkład prędkości fal sejsmicznych 
z głębokością ujawnił podstawowe cechy budowy 
Ziemi ; już w 1910 r. zbudowano trójwarstwowy mo¬ 
del jej wnętrza, składający się ze skorupy, płaszcza 
i jądra. Dalsze prace sejsmologiczne, uzupełnione 
analizą ziemskiego pola magnetycznego i powierzch¬ 
niowych anomalii grawimetrycznych, doprowadziły 
do rozpoznania bardziej subtelnych szczegółów we¬ 
wnętrznej struktury Ziemi i ujawniły cały szereg gra- 
sejsmologia nic oddzielających obszary o różnych własnościach 
współczesna mechanicznych. Sejsmologia współczesna umożliwiła 
wykrycie wielu szczegółów budowy horyzontalnej 
górnego tysiąca kilometrów wnętrza Ziemi, a obecnie 
ujawnia ona, dotychczas częściowo tylko zbadane, 
wielosetkilometrowe anomalie o granicach piono¬ 
wych w górnym płaszczu Ziemi, zarysy których, 
wbrew oczekiwaniom, nie pokrywają się z zarysami 
struktur skorupy ziemskiej. 


Własności fizyczne wnętrza Ziemi 

Określenie budowy i własności fizycznych wnętrza 
Ziemi jest wynikiem rozwiązania tzw. zagadnienia 
odwrotnego, tzn. określenia struktury wewnętrznej 
za pomocą obserwacji dokonywanych na powierzchni 
i, dodatkowo, dzięki wykorzystywaniu wyników la¬ 
boratoryjnych pomiarów własności fizycznych zna¬ 
nych skał i minerałów w warunkach wysokich ciśnień 
i temperatur. Większość informacji pochodzi z analizy 
grawitacyjnego pola Ziemi oraz z obserwacji sejsmo¬ 
logicznych, ponadto z badań powierzchniowego stru- 
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mienia cieplnego i z obserwacji magnetycznego pola 
Ziemi. Dane dotyczące wnętrza Ziemi, a w szczegól¬ 
ności jej najgłębszych warstw, powinny być trakto¬ 
wane z dużą ostrożnością i uważane raczej za pewne 
oszacowania niż dane dokładne. 

Analiza objętościowych i powierzchniowych fal 
sejsmicznych, a także swobodnych drgań Ziemi, ge¬ 
nerowanych przez wyjątkowo silne trzęsienia Ziemi, 
prowadzi do określenia rozkładów modułu ściśliwości 
K, modułu ścinania p i gęstości q w funkcji promienia 
ziemskiego r. Dodatkowo jest wykorzystywane rów¬ 
nanie Adamsa-WiIIiamsona, wiążące prędkości fal 
sejsmicznych vp i rs z gęstością q : 

do _ _ go 

dr v l p - */ z v* s ’ 

równanie to dotyczy jednak ośrodka jednorodnego 
ściskanego adiabatycznie w polu naprężeń hydrosta¬ 
tycznych i nie może być stosowane w obszarach 
przejść fazowych oraz w rejonach, w których rozkład 
temperatury nie jest adiabatyczny. Ze znanych roz¬ 
kładów q obi iczone są rozkłady przyspieszania ziem¬ 
skiego g i ciśnienia p we wnętrzu Ziemi, wszystkie te 
parametry przedstawione są na rys. 3 w funkcji głę¬ 
bokości. Należy tu zauważyć, że konstruowanie mo¬ 
deli dotyczących rozkładu gęstości we wnętrzu Ziemi 
opiera się na różnego rodzaju dodatkowych założe¬ 
niach i hipotezach co do własności fizykochemicznych 
wnętrza Ziemi, gdyż rozwiązanie jednoznaczne tego 
problemu nie jest możliwe. 

Informacje dotyczące rozkładu temperatury we 
wnętrzu Ziemi są silnie ograniczone. Znajomość roz¬ 
kładu temperatury nie jest możliwa bez pełnej znajo¬ 
mości rozkładu źródeł ciepła i mechanizmów przeno- 
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szenia ciepła, których to informacji nie jesteśmy w sta¬ 
nie otrzymać, jednakże określenie w pewnym zakresie 
rozkładu temperatury we wnętrzu Ziemi jest możliwe. 
Jako dane wyjściowe służą wyniki pomiarów po¬ 
wierzchniowego strumienia cieplnego i założone roz¬ 
kłady pierwiastków promieniotwórczych oraz prze¬ 
wodnictwa cieplnego. Ponieważ średni strumień 
cieplny na oceanach i kontynentach jest jednakowy, 
przy równoczesnym różnym rozkładzie pierwiastków 
promieniotwórczych (grubsza kontynentalna skoru¬ 
pa ziemska sugeruje obecność większej ilości tych 
pierwiastków pod kontynentami), rozkłady tempera¬ 
tury dla oceanów i kontynentów są zwykle różne do 
głębokości kilkuset kilometrów, na której to głębo¬ 
kości temperatura jest przypuszczalnie jednakowa 
pod kontynentami i oceanami. 

Ponieważ materiał płaszcza, z wyjątkiem pewnych 
lokalnych inkluzji, znajduje się w stanie stałym, tem¬ 
peratura topnienia materiału stanowi niewątpliwie 
górną granicę rozkładu temperatury w płaszczu. 





Rys. 3. Rozkład we wnętrzu Ziemi: a) gęstości, b) moaułu sprę¬ 
żystości, c) przyspieszenia ziemskiego i ciśnienia 


Teoria ciała stałego wiąże temperaturę topnienia T m 
ośrodka jednorodnego z prędkościami fal w tym 
ośrodku vp i vs relacją: 

Tm = C(l/v% + l/rp-i' 3 . 

Związek ten pozwala na określenie temperatury top¬ 
nienia aż do granicy płaszcz-jądro i pomimo, iż rów¬ 
nanie to nie jest prawdziwe w rejonie przejść fazowych, 
gdyż współczynnik C silnie zależy od masy cząstecz¬ 
kowej, uzyskana krzywa (Uffen, 1952 r.) stanowi do¬ 
syć realistyczne oszacowanie górnej granicy tempera¬ 
tury w dolnym płaszczu Ziemi. 

Temperatura na granicy płaszcz-jądro może być 
określona przez ekstrapolację temperatury topnienia 
żelaza w obszar wysokich ciśnień. Metoda ta opiera 
się na wykorzystaniu empirycznego związku między 
temperaturą topnienia a ciśnieniem (podanego przez 
Simona w 1953 r.): 

p=a[(T-T o y- 1], 

gdzie a i c są stałymi, a T ? jest temperaturą odniesienia. 
Otrzymane wyniki są jednak wątpliwe, gdyż jądro 
Ziemi prawdopodobnie nie jest zbudowane z czystego 
żelaza. 

Rozkład temperatury we wnętrzu Ziemi może być 
również uzyskany z danych o przewodnictwie elek¬ 
trycznym, jednakże przy bardzo silnym i nierealnym 
założeniu co do stałości fizykochemicznego składu 
płaszcza Ziemi. Wszystkie omówione tu oszacowania 
temperatury we wnętrzu Ziemi przedstawiono na 
rys. 4. 



Rys. 4. Oszacowanie rozkładu temperatury w płaszczu Ziemi 


Rozkład przewodności elektrycznej we wnętrzu 
Ziemi, uzyskany przez analizę zmian magnetycznego 
pola ziemskiego oraz przez zastosowanie metody ma- 
gnetotellurycznej, pozwalającej określać przewod¬ 
ność elektryczną skał w' zakresie głębokości 
10-100 km, przedstawiony jest na rys. 5. Ostatnia 
z wymienionych metod polega na równoczesnym po¬ 
miarze pola magnetycznego i indukowanego w Ziemi 
pola elektrycznego. 

Przewodność elektryczna wody morskiej wynosi 
około 4 (Q m)“\ a nasyconych wodą skał osadowych 
od ok. 10" 3 do 1 (Q m) _1 . Przewodność suchych skał 
skorupy, leżących poniżej skał osadowych, wynosi 
od ok. 10- 6 do 10~ 3 (O m)" 1 . Zewnętrzne warstwy 
Ziemi są więc słabo przewodzące, oprócz silnie prze¬ 
wodzącej warstewki stworzonej przez oceany i skały 
osadowe. 


własności 

elektryczne 
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maczyć pewne lokalne anomalie przewodności 
w górnych obszarach płaszcza. 

Przewodnictwo elektronowe jest przypuszczalnie 
dominującym procesem przewodzenia w strefie przej¬ 
ściowej i w dolnym płaszczu. 


Trzęsienia ziemi 


Płaszcz Ziemi do głębokości ok. 400 km jest 
zbudowany prawdopodobnie z krzemianów, wśród 
których dominuje bogaty w magnez oliwin; w dolnym 
płaszczu fazę stabilną tworzą prawdopodobnie tlenki 
magnezu, żelaza i metakrzemiany. Jądro jest złożone 



zachowują się praktycznie jak izolatory, tzn. ich pas¬ 
mo walencyjne jest wypełnione, a pasmo przewodni¬ 
ctwa oddzielone od pasma walencyjnego skończoną 
przerwą energetyczną. Ze względu na aktywacyjny 
zależność charakter przewodnictwa zależność przewodności a 
przewodno- od temperatury jest następująca: 

ŚC * ° d rr — rr ( >- A ! kT 

temperatury o — u 0 c , 

gdzie Tjest temperaturą, k — stałą Boltzmanna, a cr 0 
— pewną stałą. Zależność tę potwierdzono labora¬ 
toryjnie dla skał, przy czym A równe jest 2 E dla prze¬ 
wodnictwa jonowego (E opisuje energię aktywacji) 
i E dla przewodnictwa domieszkowego i elektrono¬ 
wego. <7 i E zwykle zależą od ciśnienia i temperatury. 
Najsilniejszy wzrost przewodności z temperaturą na¬ 
stępuje przy T = E/2k. W temperaturze dużo niższej 
przewodność jest niewielka w porównaniu z wartością 
<r 0 , a w temperaturach wyższych od T = E/k asympto¬ 
tycznie zbliża się do maksymalnie możliwej wartości, 
czyli or 0 . 

przewodność Przewodność oliwinu wzrasta od wartości niższej 
oliwinu od 10~* (£1 m) -1 w temperaturze pokojowej do 10 -2 
w 1000°C. Przewodnictwo domieszkowe (cr 0 = 10~ 4 - 
10 -2 **- 1 nr 1 ) dominuje w zakresie temperatur do 
kilkuset °C. Powyżej około 700°C przewodnictwo elek¬ 
tronowe (<r 0 ^ 5 £2 _1 nr* 1 ) wzrasta silnie i przewyższa 
przewodnictwo domieszkowe. Powyżej ok. 1100°C 
przewodnictwo jonowe (cr 0 » 10~ 4 £2 -1 m _1 ) zaczyna 
silnie dominować. 

Przewodnictwo domieszkowe jest spowodowane 
obecnością obcych atomów w sieci kryształu, co 
powoduje nadmiar elektronów lub dziur, które poru¬ 
szają się w sieci przy przyłożeniu siły elektromoto¬ 
rycznej. Ten typ przewodnictwa przypuszczalnie 
występuje w suchych skałach skorupy i najwyższych 
partii płaszcza. 

Przewodnictwo jonowe jest silnie hamowane przez 
ciśnienie. Przewodnictwo to nie gra prawdopodobnie 
żadnej roli poniżej głębokości 500 km, gdyż prawdo¬ 
podobnie temperatura jest tam zbyt niska na to, by 
przewodnictwo to mogło przewyższyć przewodnictwo 
elektronowe, wywołane ciśnieniem panującym na tej 
głębokości. Jednakże ten typ przewodnictwa może 
tłumaczyć względnie wysoką przewodność warstwy 
zaczynającej się na głębokości ok. 75 km. Warstwa ta 
jest przypuszczalnie identyczna z kanałem niskich 
prędkości, przy czym oba efekty spowodowane są 
bliskością punktu topnienia w tym obszarze. Prze¬ 
wodnictwo jonowe jest przypuszczalnie dominujące 
w magmie, a także w obszarach o temperaturach bli¬ 
skich temperaturze topnienia, co może również tłu- 


W ciągu jednego roku nawiedza Ziemię nie mniej 
niż milion wstrząsów sejsmicznych, z czego ok. 
100 000 rejestrują sejsmografy. Na szczęście są to 
w większości trzęsienia bardzo słabe, wykrywalne je¬ 
dynie przez sejsmografy o powiększeniach przekracza¬ 
jących 100 000 razy. Jedynie kilkadziesiąt trzęsień 
rocznie powoduje widoczne zmiany na powierzchni 
Ziemi (il. 203 i 204. tabl. 54; ii. 205 i 206, tabl. 55), 
a ujmując rzecz staty stycznie — tylko jedno z nich 
ma przebieg katastrofalny (zob. str. 822). 

Mieszkamy na terenie, który należy do obszarów 
Asejsmicznych. W części Karpat leżącej w granicach 
Polski obserwuje się wprawdzie bardzo słabą aktyw¬ 
ność sejsmiczną, ale duże trzęsienia ziemi nam nie za¬ 
grażają. W różnych częściach kuli ziemskiej istnieją 
jednak obszary o silnej sejsmiczności. Tam trzęsienia 
ziemi powodują śmierć setek tysięcy ludzi i ogromne 
zniszczenia na powierzchni. Obok wybuchów wulka¬ 
nów, powodzi, huraganów i tornado zjawiska te na¬ 
leżą do najważniejszych klęsk żywiołowych z uwagi na 
częstość występowania i szerokie rozprzestrzenienie. 
Ocenia się, że w wyniku trzęsień zginęło w obecnym 
tysiącleciu co najmniej 5 milionów ludzi; niektóre 
źródła podają liczby dwukrotnie, a nawet trzykrotnie 
wyższe. Badanie procesów fizycznych zachodzących 
w obszarze ogniska trzęsienia ziemi, a także rejestra¬ 
cja i analiza związanych z tymi procesami anomalii 
pewnych parametrów fizycznych (prędkości fal sej¬ 
smicznych, namagnesowania i przewodności elek¬ 
trycznej skał, koncentracji radonu w wodach grunto¬ 
wych, ilości i gęstości występowania słabych trzęsień 
ziemi itp.), występujących w obszarze przyszłego trzę¬ 
sienia ziemi, stanowi jeden z podstawowych celów 
sejsmologii i jest pierwszym krokiem ku prawidłowym 
prognozom katastrofalnych trzęsień ziemi. 


Procesy fizyczne w ognisku 

Trzęsieniem ziemi nazywamy proces nagłego wyzwo¬ 
lenia energii w stosunkowo niewielkim obszarze we 
wnętrzu Ziemi zwanym ogniskiem trzęsienia. Obszar 
położony bezpośrednio nad ogniskiem jest nazywany obszar 
obszarem epicentralnym i w nim najsilniej dają się od- epicenfralny 
czuć skutki trzęsienia. 

Trzęsienia ziemi klasyfikuje się w zależności od głę¬ 
bokości ogniska w sposób następujący: 0-70 km — 
trzęsienia płytkie, 70-300 km — trzęsienia średniogłę- trzęsienia 
bokie, 300-720 km — trzęsienia głębokie. Na głębo- płytkie, 
kościach większych od 720 km nie wykryto żadnych średniogłę- 
trzęsień ziemi. Ponad 75% energii wyzwala się w trzę- bokie i 
sieniach płytkich i jedynie około 3% — w trzęsieniach głębokie 
głębokich. Średnio rocznie w trzęsieniach ziemi wy¬ 
zwala się ok. 10 18 J, przy czym większość tej energii 
w czasie jednego lub kilku największych trzęsień. Wy¬ 
zwalana energia tylko częściowo przekształca się 
w energię fal sejsmicznych; duża jej część przekształca 
się bezpośrednio w ciepło na skutek tarcia w płasz¬ 
czyźnie rozrywu w ognisku trzęsienia. 

Trzęsienie ziemi trwa zwykle krótko — od kilku se¬ 
kund do kilkunastu minut, często jednak po głównym 
silnym wstrząsie następują wstrząsy następcze (repli¬ 
ki), nieraz przez kilka dni lub nawet kilka miesięcy, 
o sile zwykle malejącej, czasem jednak prawie równej 
sile trzęsienia początkowego. 

Trzęsienia ziemi należą do klasy zjawisk związanych 
z przekroczeniem pewnej granicy krytycznej (w tym 
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wypadku granicy wytrzymałości materiatu skalnego 
we wnętrzu Ziemi) i mogą być wywoływane przez bar¬ 
dzo wiele różnorodnych czynników, takich jak zmiana 
ciśnienia atmosferycznego, naprężenia pływowe, po¬ 
bliskie trzęsienia ziemi, niemożliwe do przewidzenia 
zjawiska pełzania materiału w górnym płaszczu lub 
skorupie ziemskiej, czy też chwilowy wzrost naprężeń 
tektonicznych. 

Energia wyzwalająca się w sposób gwałtowny w cza¬ 
sie trzęsienia została uprzednio nagromadzona w pro¬ 
cesie powolnej akumulacji naprężeń tektonicznych we 
wnętrzu Ziemi. Pierwotnym źródłem tej energii, a tak¬ 
że źródłem energii wielu innych procesów geodyna- 
micznych, jest energia cieplna wnętrza Ziemi. 

Większość trzęsień ziemi to trzęsienia typu tekto¬ 
nicznego, polegające na niestacjonarnym rozwoju jed¬ 
nej lub kilku szczelin; w wypadku trzęsień powierzch¬ 
niowych szczeliny te wychodzą na powierzchnię i są 
obserwowane w postaci głębokich uskoków prze- 
suwczych na powierzchni Ziemi. Przypuszczalnie 
możliwy jest również inny mechanizm powstania og¬ 
niska, sugerowany głównie dla trzęsień głębokich, pole¬ 
gający na szybkim przejściu fazowym materiału skal¬ 
nego w rejonie ogniska ze stanu metastabilnego, w ja¬ 
kim znalazł się na skutek powolnych ruchów mas skal¬ 
nych we wnętrzu Ziemi, do stanu stabilnego, odpo¬ 
wiadającego aktualnie panującym w tym rejonie wa¬ 
runkom temperatury i ciśnienia. 


Pale sejsmiczne 

W ognisku materiał skalny ulega nagłemu przesunię¬ 
ciu i zniszczeniu wzdłuż pewnej płaszczyzny, zwanej 
płaszczyzną ogniskową, a sam proces w ognisku jest 
przyczyną powstania fal sejsmicznych. W czasie trzę¬ 
sień tektonicznych fale emitowane są w trakcie niesta¬ 
cjonarnego rozprzestrzeniania się szczeliny. 

Ze względu na panujące we wnętrzu Ziemi ciśnienie 
już poniżej górnych 20-30 km szczeliny te są wyłącznie 
szczelinami ścinania; w obrębie skorupy ziemskiej 
możliwe bywają również szczeliny otwarte, obserwo¬ 
wane często w rejonach epicentralnych silnych po¬ 
wierzchniowych trzęsień ziemi. 

W ognisku generowane są różnego rodzaju fale, 
głównie fale objętościowe: fale podłużne (zgęszczeń 
i rozrzedzeń), zwane falami P (od łac. primae — 
'pierwsze’, gdyż ich prędkość jest większa niż innych 
rodzajów fal i dochodzą one najwcześniej do miejsca 
obserwacji) i fale poprzeczne (fale ścinania), zwane fa¬ 
lami S (od łac. secundae — 'drugie’). Po dojściu do po¬ 
wierzchni swobodnej Ziemi fale objętościowe mogą 
generować fale powierzchniowe Love’a lub fale po¬ 
wierzchniowe Rayleigha, w zależności od budowy 
warstwy przypowierzchniowej (rys. 6). 

Jak wynika z analizy' pola falowego generowanego 
w trakcie trzęsienia, ruch mas skalnych po przeciw¬ 
nych stronach płaszczyzny ogniskowej może być opi¬ 
sany prawidłowo jako wynik działania pary sił (rys. 
7a) lub podwójnej pary sił bez momentu (rys. 7b). 
Przestrzeń wokół ogniska trzęsienia można podzielić 
na cztery jednakowe obszary, w których na przemian 
pierwszy ruch fali P (znak fazy) odpowiada zgęszcze- 
niu lub rozrzedzeniu. Jedna z płaszczyzn rozdzielają¬ 
cych te obszary to właśnie płaszczyzna ogniska; druga 
z nich jest prostopadła do pierwszej, a obie tworzą 
układ tzw. płaszczyzn nodalnych. Pole falowe fal P 
emitowanych w ognisku trzęsienia jest identyczne dla 
obu modeli mechanizmów trzęsień, tzn. pary sił (rys. 
7c) i podwójnej pary sił bez momentu (rys. 7d), nato¬ 
miast pole falowe fal S jest charakterystycznie różne 
dla obu modeli (rys. 7e, f). Tak więc analiza pierw¬ 
szych ruchów w fali P pozwala wyłącznie na określe¬ 
nie położenia płaszczyzn nodalnych, z których jedna 
odpowiada płaszczyźnie ogniska, ale nie wiadomo 
która, dopiero równoczesna analiza pierwszych ru¬ 
chów fali S umożliwia wydzielenie z płaszczyzn no¬ 
dalnych płaszczyzny ogniskowej. 


W trzęsieniach ziemi wy wołanych szybką przemianą 
fazową znak pierwszej fazy fali P jest jednakowy w ca¬ 
łej przestrzeni, a więc również i na powierzchni Ziemi, 


kierunek ruchu fati 




fala poprzeczna 
o pionowych*drganiach (S) 



fala poprzeczna 
o poziomych drganiach (S) 





fala Rayleigha 


fala poprzeczna Love’a 


Rys. 6. Podstawowe rodzaje fal sejsmicznych 


przy czym znak ten jest określony kierunkiem przej¬ 
ścia fazowego. 

Badanie położeń płaszczyzn ogniskowych trzęsień 
ziemi stanowi źródło cennych informacji o rozkładzie 
naprężeń działających we wnętrzu Ziemi i o współ¬ 
czesnych ruchach geodynamicznych. 

W ośrodku sprężystym mającym powierzchnię swo¬ 
bodną mogą rozprzestrzeniać się — oprócz fal objęto- 



Rys. 7. Układ sił w ognisku trzęsienia: a) pojedyncza para sił 
(układ sił typu I), b) podwójna para sił (układ sił typu II), c) i 
d) pole fal P generowane przez pojedynczą parę sił (c) i podwójną 
parę sił (d), e) i f) pole fał S generowane przez pojedynczą parę 
sił (e) i podwójną parę sił (/) 


ściowych — także fale powierzchniowe. Są to fale dłu¬ 
gie o znacznych amplitudach i one to powodują naj¬ 
silniejszy wstrząs podczas trzęsienia. Amplitudy tych 
fal maleją odwrotnie proporcjonalnie do pierwiastka 
z odległości od epicentrum, podczas gdy amplitudy 
fal objętościowych maleją odwrotnie proporcjonalnie 
do samej odległości, tak więc na dużych odległościach 
fale powierzchniowe zapisywane są wyraźniej, niż fale 
objętościowe. Amplitudy fal powierzchniowych ma- 
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leją z głębokością według prawa wykładniczego. Fale 
powierzchniowe wykazują silną dyspersję (prędkości 
ich silnie zależą od długości fali). Analiza długookre¬ 
sowych fal powierzchniowych jest jedną z najcenniej¬ 
szych metod badania wewnętrznej struktury Ziemi, 
a przede wszystkim budowy skorupy i górnych warstw 
płaszcza. 

Dwa najprostsze typy fal powierzchniowych to fale 
Rayleigha i fale Love ł a (—► Akustyczne fale po¬ 
wierzchniowe i ich zastosowanie). 
fa3e Fale Rayleigha są jedynym rodzajem fal powierzch- 
RayJeigha niowych możliwych w jednorodnej przestrzeni spręży¬ 
stej. Cząstki ośrodka zataczają elipsy w płaszczyźnie 
pionowej równoległej do kierunku rozchodzenia się 
fal (rys. 6). Amplituda fali maleje wykładniczo wraz ze 
wzrostem odległości od powierzchni swobodnej. 
W ośrodku o stałej Poissona równej 0,25 prędkość fal 
Rayleigha vr wynosi 0,92 vs, gdzie vs jest prędkością 
fali S. 

Fale Rayleigha ulegają dyspersji, jeżeli własności 
mechaniczne oraz gęstość ośrodka zmieniają się wraz 
z odległością od powierzchni swobodnej. Fale o dłu¬ 
gości A są czułe na własności sprężyste i gęstość ośrod¬ 
ka do głębokości A/5, tak więc prędkość fal Ray¬ 
leigha na powierzchni Ziemi zależy od długości fali, 
przy czym im większa jest długość fali, tym głębsze 
warstwy wpływają na jej prędkość. 

Każdą falę można rozłożyć na fale płaskie jedno¬ 
rodne i fale niejednorodne, z nich tylko fale niejedno¬ 
rodne powodują powstawanie fal powierzchniowych 
Rayleigha. Płaskie jednorodne fale padając na po¬ 
wierzchnię swobodną nie dają fał powierzchniowych 
i odwrotnie, im większa jest krzywizna frontu fali pa¬ 
dającej, tym silniejsze są fale powierzchniowe. Ponie¬ 
waż przy ogniskach głębokich lub przy dużych odle¬ 
głościach od epicentrum trzęsienia front fali jest pra¬ 
wie płaski, to powstające fale Rayleigha są bardzo 
słabe, natomiast silne fale Rayleigha są obserwowane 
w wypadku ognisk niegłębokich i w rejonach blisko 
epicentrum. 

fale Najprostszym typem struktury, w której mogą roz- 
Love'a chodzić się fale Love ł a, jest jednorodna warstwa 
z jedną powierzchnią swobodną, a drugą leżącą na 
jednorodnej półprzestrzeni sprężystej, przy czym pręd¬ 
kość fali S w warstwie jest mniejsza niż w półprze¬ 
strzeni. Drgania odbywają się w płaszczyźnie pozio¬ 
mej, prostopadłej do kierunku rozchodzenia się fal. 
W obrębie półprzestrzeni amplituda fali maleje wy¬ 
kładniczo z odległością od granicy oddzielającej pół- 
przestrzeń od warstwy. Fale Love’a ulegają dyspersji, 
przy czym ich prędkość fazowa zmienia się od warto¬ 
ści prędkości fali S w warstwie (dla bardzo krótkich 
fal Love ł a) do prędkości fal S w półprzestrzeni (dla 
bardzo długich fal Love’a). Fale Love’a istnieją rów¬ 
nież w ośrodkach o bardziej skomplikowanej budo¬ 
wie, tzn. w ośrodkach o większej liczbie warstw, jeżeli 
tylko prędkość fal S rośnie wraz z odległością od po¬ 
wierzchni swobodnej, przy czym krzywe dyspersji tych 
fal odzwierciedlają strukturę ośrodka. 

Skomplikowana struktura wnętrza Ziemi jest przy¬ 
czyną tego, że rejestrowane pole falowe jest bardzo 
złożone i oprócz fal objętościowych i powierzchnio¬ 
wych obserwowane są również i inne typy fal. Ostat- 
fale nio np. (1974 r.) wykryto fale charakterystyczne dla 
sejsmiczne ośrodków o złożonej strukturze wewnętrznej, jak 
w ośrodkach ośrodki mikromorficzne lub mikropolame. Fale te 
o złożonej rozchodzą się w rejonach bliskich epicentrum niektó- 
strufcturze rych trzęsień, w obszarach o silnie zakłóconej tekto¬ 
nice i wyraźnej strukturze blokowej. Fale te charakte¬ 
ryzuje m.in. rotacja elementów ośrodka przy przejściu 
fali i one to przypuszczalnie wywołują dobrze znane 
efekty skręcenia kolumn, cokołów pomników i tym 
podobnych elementów architektonicznych w obsza¬ 
rach epicentralnych niektórych silnych trzęsień ziemi. 

Analiza pola falowego rejestrowanego na po¬ 
wierzchni Ziemi jest głównym źródłem informacji o 
strukturze wnętrza oraz współczesnych ruchach geody- 
namicznych zachodzących we wnętrzu naszej planety. 


Drgania, które docierają do powierzchni Ziemi 
w wyniku trzęsienia, składają się z ruchów o różnych 
kierunkach, z różnymi amplitudami i różnymi okresa¬ 
mi. Bezpośrednie rejestrowanie takich przestrzennych 
drgań jest niemożliwe i dlatego rozkłada się je na 3 
wzajemnie prostopadłe składowe i notuje oddzielenie. 
Całość zapisu umożliwia w pełni odtworzenie drgań 
przestrzennych cząstek podłoża. 

Zapis trzęsienia ziemi 

Zapis trzęsienia ziemi, zwany sejsmogramem, składa 
się zazwyczaj z trzech zasadniczych części: fazy wstęp¬ 
nej (fale objętościowe), fazy głównej (fale powierzch¬ 
niowe) i „ogona” (rys. 8). 



Rys. 8. Sejsmogram trzęsienia ziemi w Turcji (1909 r.) zareje¬ 
strowany w stacji Pułkowo w Rosji (wg Galicyna) 


Bezpośrednio biegnące fale P docierają jedynie do 
odległości epicentralnej A = 103° (ok. 11 600 km); 
w odległościach większych (do 130°) dają się zauważyć 
jedynie słabe ślady fal ugiętych na powierzchni jądra. 

Dopiero w odległości 142-145° pojawiają się znowu 
bardzo wyraźne fale podłużne, jakkolwiek znacznie 
opóźnione (tzw. fale PKP). Strefa, do której fale sej¬ 
smiczne nie docierają wskutek odchylenia przez jądro 
ziemskie, nazywa się „strefą cienia”. f 

Gdy odległości epicentralne są małe faza wstępna a2a 
trwa krótko: ok. 1 min przy A = 500 km i ok. 2 min ™ s 
przy A — 2000 km, po czym pojawiają się silniejsze 
impulsy pochodzące od fal powierzchniowych. Wraz 
ze wzrostem odległości epicentralnej wzrasta czas 
trwania fazy wstępnej. Maksymalna długość fazy 
wstępnej dochodzi do niespełna 1 h przy A = 20 000 

km. faza 

W fazie głównej najdłuższymi okresami drgań od- g f 5 wna 
znaczają się zawsze fale Love ł a. Gdy odległości epi¬ 
centralne są średnie, ich okresy wynoszą 12-20 s, gdy 
duże — przekraczają nawet 1 min. Przy trzęsieniach 
średniogłębokich i najgłębszych (głębokość ogniska 
700 km) faza główna jest bardzo słabo zaznaczona, 
bywa też czasem zupełnie niedostrzegalna. 

Gdy odległości epicentralne są małe, nie ma zasad¬ 
niczych różnic w zewnętrznym wyglądzie sejsmogra- 
mu trzęsienia płytkiego i głębokiego, prócz tego, że 
grupy fal P i S dla trzęsień głębokich są zwykle wy¬ 
raźniejsze i mają krótszy okres. 

W polu falowym generowanym przez słabe trzęsie¬ 
nia ziemi dominują fale o krótkich okresach rzędu 
1 s lub mniejszym. Wielkie trzęsienia ziemi generują 
fale zarówno krótkie — jak i długookresowe, przy 
czym fale P mogą mieć okresy nawet rzędu 25 s, a nie¬ 
które rodzaje fal powierzchniowych okresy osiągające 
wielkość trzech minut. 

Fale krótkookresowe są tłumione silniej we wnętrzu 
Ziemi niż długookresowe. 

Badanie wewnętrznej budowy Ziemi 

Kształt zapisu pola falowego, generowanego w ogni¬ 
sku trzęsienia ziemi, określony jest przez trzy podsta¬ 
wowe czynniki, a mianowicie: proces w ognisku trzę¬ 
sienia (prędkość rozrywu w ognisku, tarcie w płasz¬ 
czyźnie rozrywu, wielkość naprężeń tektonicznych 
wyzwolonych w czasie trzęsienia, wielkość i kształt 
płaszczyzny rozrywu itp.), własności Teologiczne 
i strukturę ośrodka, przez który przeszły fale na dro¬ 
dze ognisko-rejestrator, a także charakterystykę sa¬ 
mego urządzenia rejestrującego. Przyjęcie pewnych 
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założeń modelowych dotyczących procesu w ognisku 
trzęsienia i znajomość charakterystyk amplitudowych 
i częstościowych sejsmografu pozwala na wyodrębnie¬ 
nie informacji o wewnętrznej budowie Ziemi. 

Prędkość fal sejsmicznych jest funkcją własności 
mechanicznych ośrodka t tzn. gęstości, ściśliwości 
i sztywności skał we wnętrzu Ziemi. Znajomość pręd¬ 
kości fal sejsmicznych (rys. 9) umożliwia określenie 
zmian tych parametrów wraz ze zmianą głębokości 
oraz pozwala na stawianie hipotez dotyczących stanu 
wnętrza Ziemi. 



Rys. 9. Rozkład prędkości fał sejsmicznych P i S we wnętrzu 
Ziemi 


Pierwszym ważnym krokiem w tej dziedzinie było 
wyróżnienie przez R. Oldhama w 1897 r. dwóch ro¬ 
dzajów objętościowych fal sejsmicznych (fal P i S ). 
Analiza zapisów trzęsień ziemi ujawniła istnienie 
ciekłego jądra Ziemi, obszaru o mniejszej prędkości 
fali P, otoczonego grubym, półplastycznym płasz¬ 
czem. Granicę pomiędzy jądrem a płaszczem charak¬ 
teryzuje skokowa zmiana prędkości fal sejsmicznych 
(nieciągłość Gutenberga, rys. 10). Nieciągłość ta może 
być wywołana zarówno różnym składem chemicznym 
poszczególnych warstw jak i zmianą struktury fazo¬ 
wej tego samego materiału skalnego. Skokowa zmiana 
prędkości występuje również pomiędzy skorupą, a 
płaszczem Ziemi (nieciągłość Mohorowićicia), w któ- 


skorupa 



rym prędkości fal P i S są znacznie większe, niż w sko¬ 
rupie. 

Analiza zapisów sejsmicznych umożliwia również 
wykrycie stałego jądra wewnętrznego. 

Ostatnim odkryciem dotyczącym rozpoznania za¬ 
sadniczych elementów struktury Ziemi było wykrycie 
istnienia silnie plastycznej warstwy w górnym płasz¬ 
czu (warstwa ta ma różną grubość dla fal P i S) o 
mniejszych prędkościach fal sejsmicznych — asteno- 
sfery. Analizując zapisy trzęsień zarejestrowane w róż¬ 
nych punktach powierzchni Ziemi można ustalić tory 
fal sejsmicznych w jej wnętrzu (rys. 11), a tym samym 
uzyskać pewne informacje o gęstości i własnościach 
mechanicznych ośrodka, przez który przechodzą. 



o 180° 


Rys. 11. Tory niektórych typów fal sejsmicznych we wnętrzu 
Ziemi, gdzie P — oznacza fale podłużne idące przez wnętrze 
Ziemi bezpośrednio z ogniska; S — analogiczne fale poprzeczne; 
PS — fale odbite od powierzchni Ziemi, biegnące początkowo 
jako podłużne, a po odbiciu jako poprzeczne, SP — fale odbite 
od powierzchni Ziemi, biegnące początkowo jako poprzeczne, 
a po odbiciu jako podłużne, PP — raz odbite od powierzchni 
Ziemi fale podłużne, SS — raz odbite od powierzchni Ziemi fale 
poprzeczne, PPP, SSS, PSP itd. — dwukrotnie odbite fale; 
ich charakter jest podany przez odpowiednie litery, PKP — fala 
podłużna przechodząca przez jądro Ziemi bez odbicia wewnątrz 
jądra, ale załamująca się na jego granicy (litera K —od nie¬ 
mieckiego kernnellen oznacza fale, które przeszły przez jądro), 
PKS — analogiczna fala podłużna wychodząca z jądra jako fala 
poprzeczna, PKKP — fala podłużna przechodząca przez jądro 
z jednym odbiciem wewnątrz jądra (przez jądro przechodzą falc 
zawsze jako P , gdyż jego część jest w stanie ciekłym) 

Cennym źródłem wiadomości o budowie skorupy 
i głównych warstw płaszcza jest analiza krzywych 
dyspersji fal powierzchniowych. 

Współczesna sejsmologia coraz dokładniej rejestru¬ 
je szczegóły wewnętrznej budowy Ziemi i jej warstw, 
ukazuje różnice w strukturze wgłębnej między ocea¬ 
nem a kontynentem, a także między różnymi regio¬ 
nami Ziemi. I tak np. grubość skorupy waha się od 
kilkunastu kilometrów w rejonie oceanów do kilku¬ 
dziesięciu kilometrów w niektórych rejonach konty¬ 
nentalnych, przy czym różnice w strukturze dotyczą 
nie tylko skorupy Ziemi, lecz sięgają również głęboko 
w obszary górnego płaszcza. 

W przeciwieństwie do sejsmografów dawniejszych, 
o wielkich masach, koniecznych ze względu na reje¬ 
strację mechaniczną, ostatnio buduje się sejsmografy 
o masach niewielkich. Jako przykład może służyć stru¬ 
nowy sejsmograf Wooda i Andersona, w którym masa 
wynosi zaledwie 0,7 g. Jest ona przymocowana eks¬ 
centrycznie do struny wolframowej, która działa w tym 
wypadku jak oś obrotu. Sejsmograf ten ma rejestrację 
optyczną i powiększa 400-2000 razy. 

Najstarszą metodą określania wielkości trzęsienia 
była skala intensywności oparta na efektach powierz¬ 
chniowych wstrząsu. Niestety efekty te nie są pro¬ 
porcjonalne do energii trzęsienia, gdyż silnie zależą od 
głębokości ogniska oraz od lokalnych warunków tek¬ 
tonicznych, tak więc skala ta nie nadaje się do prawid¬ 
łowej klasyfikacji trzęsień ziemi. Obecnie w celu skla¬ 
syfikowania energii trzęsienia stosuje się skalę instru¬ 
mentalną, tzw. skalę magnitud. Wielkość zwana mag- 
nitudą określana jest na podstawie amplitudy maksy¬ 
malnych ruchów cząsteczek gruntu i jest związana 
z energią trzęsienia. Dla trzęsień głębokich, generują¬ 
cych niewiele fal powierzchniowych, wprowadzono 
inną skalę magnitud, związanych z maksymalną am- 
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plitudą fal objętościowych. Obie skale są ze sobą zwią¬ 
zane tak, że możliwe jest porównywanie trzęsień płyt¬ 
kich i głębokich. 

Energia najsilniejszych obserwowanych trzęsień 
ziemi jest szacowana na 10 18 dżuli. 

Sejsmiczność Ziemi 

Mapy rozmieszczenia obszarów epicentralnych na ca¬ 
łym świecie wykazują istnienie dwu głównych stref 
strefy sejmicznych: okołopacyficznej oraz śródziemnomor- 
sejsmiczne skiej (rys. 12). 

Strefa okołopacyficzna (tzw. ando-japońsko-malaj- 
ska) biegnie dookoła Oceanu Spokojnego. Do strefy 
tej włączone są nie tylko wybrzeża lądu stałego i wys¬ 
py, ale także znaczne obszary morskie, w których sil¬ 
nym trzęsieniom ulega dno, zwłaszcza w obrębie głę¬ 
bokich rowów oceanicznych. Strefa ta jest siedliskiem 


ziemi było trzęsienie assamskie w 1897 r. o epicentrum leżącym w 
prowincji Assam, między Himalajami a Zatoką Bengalską. Trzę¬ 
sienie trwało niecałe 3 minuty, a obszar całkowitego zniszcze¬ 
nia objął 100 tys. km*. Szereg domów zbudowanych na bardzo 
miękkim gruncie pogrążyło się w nim aż do poziomu dachów. 
W pobliżu epicentrum powstały liczne uskoki, największy z 
nich miał długość 20 km, przy czym jedna jego strona góro¬ 
wała o 10 m nad drugą. Wstrząsy następcze w tym rejonie 
trwały ponad półtora roku. 

Wielkie trzęsienie ziemi, które nawiedziło Kalifornię 18 kwiet¬ 
nia 1906 r. (ii. 205 a, tabl. 55) zasługuje na szczególną uwagę ze 
względu na wyjątkowe rozmiary ruchów tektonicznych, które 
były jego przyczyną. Widoczne na powierzchnj przemieszczenia 
poziome wzdłuż znanego geologom uskoku tektonicznego San 
Andreas (il. 204, tabl. 54) ciągnęły się na przestrzeni około 
430 km, największe z nich wynosiły 6,5 m. Obszar najsilniej zni¬ 
szczony miał kształt wąskiego pasa ciągnącego się wzdłuż usko¬ 
ku. Trzęsienie trwało jedynie ok. 40 s, a wstrząsy następcze 
trwały ok. półtora roku; niektóre z nich osiągnęły duże natężenie. 
Bardzo silnym było również trzęsienie w 1923 r., którego ogni¬ 
sko leżało pod dnem morskim zatoki Sagami, w odległości około 
90 km od Tokio i 65 km od Jokohamy. Jak to miało miejsce 
podczas trzęsienie w San Francisco, rozmiary katastrofy zostały 
kilkakrotnie powiększone przez pożary. W samej Jokohamie 
zginęło 27 tys. osób, 40 tys. osób zostało rannych, a 70 tys. 



Rys. 12. Rejony sejsmiczne 
świata: obszary o silnym na¬ 
tężeniu trzęsień - ciemne, ob¬ 
szary asejsmiczne - szare 


80% trzęsień, w tej liczbie wielu trzęsień katastrofal¬ 
nych, 40% płytkich ognisk, 90% średniogłębokich 
i wszystkich głębokich. 

Strefa śródziemnomorska zorientowana jest prawie 
równoleżnikowo; zawiera ona ogniska średniej głę¬ 
bokości. 

obszary Przeciwieństwem stref sejsmicznych są obszary 
asejsmiczne asejsmiczne, pokrywające wielkie tarcze lądowe spo¬ 
czywające na starych cokołaęh kontynentalnych, w 
których ustały już ruchy górotwórcze. Do obszarów 
asejsmicznych należą: basen Oceanu Spokojnego 
(z wyjątkiem Wysp Hawajskich), płyta kanadyjska, 
płyta brazylijska, płyta eurazjatycka, Afryka (z wy¬ 
jątkiem wybrzeży Morza Śródziemnego i górnego do¬ 
rzecza Nilu), Antarktyda i inne drobniejsze połacie 
kuli ziemskiej. 

trzęsienia w strefach sejsmicznych co jakiś czas zdarzają się trzęsienia 
katastrofalne z*® 111 ’ o przebiegu katastrofalnym. Jedną z najcięższych kata- 
° a c strof sejsmicznych w historii było trzęsienie ziemi lizbońskie 
w 1755 r. Obszar dotknięty zniszczeniami był niezwykle roz¬ 
legły i objął południowo-zachodnią Europę i północno-wschod¬ 
nią Afrykę. Zginęło ok. 60 000 mieszkańców Lizbony, mia¬ 
sta, które liczyło wówczas 235 000 mieszkańców. Zniszcze¬ 
niu uległo 3/4 miasta. Na wodach stawów i jezior, nawet znaj¬ 
dujących się w znacznej odległości od epicentum, trzęsienie 
wzbudziło sejsze (długotrwałe oscylacje poziomu wody o czę¬ 
stościach równych częstościom własnym danego zbiornika); oscy¬ 
lacje jeziora w Loch Lomond w Szkocji trwały półtorej godzi¬ 
ny. Rzeka Trave w Lubece podniosła nagłe swój poziom o 
1,5 m. Obszar, na którym wstrząsy były wyraźnie odczuwalne, 
oceniany jest na co najmniej 1,5-10* km*. 

Katastrofalne trzęsienia ziemi, ze względu na ogrom strat i zni¬ 
szczeń, silnie pobudzały rozwój nauki o trzęsieniach ziemi. Pier¬ 
wszym naukowo dobrze udokomentowanym silnym trzęsieniem 


domów uległo całkowitemu zniszczeniu. Jedenastometrowa fala 
morska (tzw. tsunami) spowodowana trzęsieniem wyrządziła 
wiele szkód na wybrzeżu. Trzęsienie to stanowiło jedną z naj¬ 
cięższych katastrof sejsmicznych w dziejach ludzkości, zginęło 
99 tys. osób. Równocześnie było ono pierwszym z wielkich 
trzęsień dokładnie zarejestrowanych przez nowoczesne sejsmo¬ 
grafy we wszystkich obserwatoriach świata. 

Największe straty ponosi się, gdy epicentum znajduje się w po¬ 
bliżu dużych skupisk ludzkich. W 1960 r. na skutek trzęsienia 
ziemi prawie całkowicie został zniszczony Agadir i zginęła 1/3 
mieszkańców miasta (11 tys. osób). Trzęsienie to było 6 tys. razy 
słabsze, niż trzęsienie z San Francisco, ale epicentrum trzęsienia 
leżało w odległości paru zaledwie kilometrów od granic miasta. 
Ostatnio takie katastrofalne trzęsienie ziemi miało miejsce we 
Włoszech 10 stycznia 1981 r., epicentrum znajdowało się w po- 
blżu miejscowości AveIlino. Zginęło tam ok. 3 tys. osób. 


Prognozowanie trzęsień ziemi, 
sztuczne trzęsienia 

Niektóre zjawiska sejsmiczne w regionach o prostej 
strukturze tektonicznej i dokładnie znanym mechaniz¬ 
mie trzęsień mogą być całkowicie prawidłowo przewi¬ 
dziane, podczas gdy w złożonej sytuacji tektonicznej 
możliwe są jedynie prognozy oparte na probabilistyce 
i dokładnej znajomości historii sejsmicznej danego re¬ 
gionu. Ten ostatni typ prognoz oparty jest na dokład¬ 
nej rejestracji miejsc występowania i siły poszczegól¬ 
nych trzęsień ziemi, co w zestawieniu z tektoniką 
danego obszaru pozwala na wykreślenie map sejsmicz¬ 
ności, z uwzględnieniem rejonów niebezpiecznych 
sejsmicznie. Zakłada się tu stałość reżimu sejsmiczne¬ 
go w obrębie danej jednostki tektonicznej, tzn. zakła- 
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da się, że jeżeli w danym regionie miało miejsce silne 
trzęsienie ziemi, to może się ono powtórzyć z tą samą 
silą w obrębie tej samej jednostki tektonicznej. Ze 
względu na występowanie tzw. cykli sejsmicznych 
mapy sejsmiczności uwzględniają również powtarzal¬ 
ność silnych trzęsień. 

Mapy sejsmiczne umożliwiają obecnie precyzyjną 
prognozę miejsca i siły przyszłego trzęsienia ziemi, 
natomiast jedyną nadzieją na prawidłowe prognozy 
momentu wystąpienia takiego zjawiska jest znalezienie 
zjawisk fizycznych, poprzedzających trzęsienie, czyli 
zjawisk towarzyszących akumulacji naprężeń w rejonie 
ogniska przyszłego trzęsienia ziemi. Zjawiska te są 
obecnie intensywnie badane; mniej systematyczne 
poszukiwania były prowadzone już od prawie stu lat, 
zjawiska jednakże bez widocznych wyników. Zjawiska te są 
poprzedza- związane ze wzrostem naprężeń w pewnym rejonie 
\ące wnętrza Ziemi. Należą do nich: zmiany prędkości fal 
trzęsienie P i S , spowodowane wzrostem ilości drobnych szczelin 
w obszarze przyszłego ogniska (przy czym prędkość 
fal P ulega zmianie nawet do 20%, a prędkość fal 
S — o kilka procent), powolna ciągła deformacja po¬ 
wierzchni Ziemi mająca miejsce przed niektórymi sil¬ 
nymi płytkimi trzęsieniami ziemi, zmiany przewod¬ 
nictwa elektrycznego mas skalnych w rejonie przy¬ 
szłego ogniska, zmiany niektórych parametrów ziem¬ 
skiego pola magnetycznego, anomalne zmiany po¬ 
ziomu wody (rys. 13-15 prezentują rejestracje niektó¬ 
rych z tych efektów przed i w trakcie silnych trzęsień 
ziemi). 

Współcześnie (Nur, 1972 r.) opracowano model wy¬ 
jaśniający wiele z obserwowanych zjawisk poprzedza¬ 
jących silne płytkie trzęsienia ziemi. W modelu tym 
wzrost naprężeń prowadzi do obserwowalnego roz¬ 
szerzenia (dylatacji) naprężonego regionu, co w na¬ 
stępstwie powoduje przepływ wody zawartej w porach 
i szczelinach skał otaczających ten obszar w głąb roz¬ 
szerzonego regionu. Ten przepływ wody powoduje 
wzrost ciśnienia cieczy w porach skał w napreżonvm 
obszarze oraz nasycenie wodą porów i szczelin, co 
może być bezpośrednią przyczyną trzęsienia. Obec¬ 
ność dodatkowej ilości cieczy w naprężonym rejonie 
może wywołać zmianę przewodnictwa elektrycznego 
skał, a globalna deformacja mogłaby być przyczyną 
obserwowanych deformacji powierzchniowych, po¬ 
przedzających niektóre silne płytkie trzęsienia ziemi. 
Model ten tłumaczy również obserwowane zmiany po¬ 
ziomu wód gruntowych. Obecnie prowadzone syste- 



cm 

Rys. 13. Anomalne zmiany wysokości n.p.m. zanotowane przed 
trzęsieniem Ziemi w Niigata w 1964 r. 



Rys. 14. Anomalne zmiany wysokości n.p.m. zarejestrowane 
przed taszkenckim trzęsieniem ziemi w 1966 r., pokazujące trzy 
fazy a, /?, y deformacji skorupy ziemskiej: a) i b) pomiary Pyły 
robione przy samym epicentrum, c) i d) daleko od epicentrum 
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Rys. 15. Zmiany średniej miesięcznej poziomu morza przed 
trzęsieniem ziemi w Niigata w 1964 r. 


matyczne badania nad zjawiskami poprzedzającymi 
silne trzęsienia ziemi mają na celu m.in. udokumen¬ 
towanie prawdziwości tego modelu lub też znalezienie 
innego, właściwego opisu obserwowanych procesów 
fizycznych. 

Seria nieoczekiwanych odkryć, poczynionych w cią¬ 
gu ostatnich kilkunastu lat, a konkretnie od wczesnych 
lat sześćdziesiątych, rzuciła światło na możliwości 
kontrolowania trzęsień ziemi oraz wywoływania sztuczne 
sztucznych trzęsień. Odkrycia te dotyczą zjawisk sej- trzęsienia 
smicznych wyzwalanych przy tworzeniu dużych zbior¬ 
ników wodnych oraz przy wpompowywaniu cieczy 
w głąb szybów (jest to metoda usuwania szkodliwych 
odpadów radioaktywnych i chemicznych). Po raz 
pierwszy zjawiska takie zarejestrowano we wczesnych 
latach 40-ych bieżącego stulecia przy budowie zapory 
wodnej Hoover Dam na jeziorze Mead w USA; po¬ 
wstały zbiornik wodny wyzwolił w uprzednio asej¬ 
smicznym rejonie wiele słabych trzęsień ziemi o epi¬ 
centrach wyraźnie koncentrujących się wokół zbior¬ 
nika. Analogiczne zjawisko wystąpiło w rejonie zbior¬ 
nika Koyna w Indiach, napełnianego w latach 1962- 
65, przy czym w dwa lata po zakończeniu napełniania 
zbiornika (1967 r.) miało tam miejsce silne trzęsienie 
ziemi (177 osób zginęło, a 2300 zostało rannych). To 
ostatnie trzęsienie było potwierdzeniem wcześniej 
zauważonego braku korelacji czasowej pomiędzy po¬ 
ziomem wody w zbiorniku, a powstającymi trzęsie¬ 
niami ziemi; jak obecnie wiadomo, wzmożona sej¬ 
smiczność ma zwykle pewne opóźnienie czasowe w 
stosunku do wzrostu ciężaru wody w zbiorniku, jed¬ 
nakże w niektórych wypadkach to opóźnienie jest 
bliskie zeru. Wyzwalanie zjawisk sejsmicznych w rejo¬ 
nie dużych zbiorników wodnych było obserwowane 
jeszcze wielokrotnie. Obecnie wiadomo już, że nie 
zawsze budowa dużego zbiornika wodnego wyzwala 
w danym rejonie zjawiska trzęsień ziemi (jako przy¬ 
kład służyć może budowa zapory wodnej Grand 
Coulee, USA, gdzie nie zarejestrowano żadnych trzę¬ 
sień ziemi). O ile zjawiska te występują, są one zwią- 
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zane przypuszczalnie z uaktywnieniem istniejących 
w tym obszarze starych uskoków tektonicznych na 
skutek ciężaru wody w zbiorniku oraz przenikania 
cieczy w pory i szczeliny otaczających zbiornik mas 
skalnych. 

Tego samego typu efekty związane są z wpompo- 
wywaniem cieczy w głąb głębokich szybów, co zareje¬ 
strowano po raz pierwszy w Denver w stanie Colora¬ 
do (USA) w latach 1961-65 (głębokość szybu wynosi¬ 
ła ponad 3,5 km). Wyzwalane trzęsienia są zwykle 
trzęsieniami słabymi, co sugeruje możliwość kontro¬ 
lowanego powolnego wyzwalania energii sejsmicznej 
w rejonach o dużym niebezpieczeństwie katastrofal¬ 
nych trzęsień ziemi, jednakże zebrane dotychczas in¬ 
formacje są jeszcze niewystarczające do stosowania 
takich metod w praktyce. 


Globalne teorie geodynamiczne 

Już wiele lat temu zauważono szczególne podobień¬ 
stwo linii brzegowych poszczególnych kontynentów, 
głównie zwrócono uwagę na prawie identyczny zarys 
zachodniego wybrzeża Afryki i wschodniej linii brze- 


odbicie w pracach niem. naukowca A. von Humbold¬ 
ta. Przez cały XJX w. gromadzono dowody ruchu 
kontynentów polegające na przyporządkowaniu sobie 
identycznych warstw skalnych i skamieniałości orga¬ 
nicznych występujących na brzegach obu tak odle¬ 
głych od siebie lądów jak Afryka i Ameryka Południo¬ 
wa, jednakże dopiero w XX w. zaczęto na serio roz¬ 
ważać możliwość ruchu kontynentów jako całości. 

Po raz pierwszy myśl tę zaprezentował geolog ame¬ 
rykański Frank B. Taylor w latach 1908-10, jednakże 
idea ta jest znana głównie z prac meteorologa i teore¬ 
tyka niem. A. Wegenera, z których pierwszą przed¬ 
stawił w 1912 r. W swojej pracy „Pochodzenie konty¬ 
nentów i oceanów”, opublikowanej w 1915 r., Wege- 
ner przedstawił teorię ruchu lekkich granitowych mas 
kontynentalnych po cięższym bazaltowym podłożu 
den oceanicznych, ruchu wywołanego ruchem obroto¬ 
wym Ziemi. Rozpad pierwotnego superkontynentu 
miał miejsce wg Wegenera „miliony lat temu”. Kon¬ 
serwatywnie mysiący geologowie odrzucili zdecydo¬ 
wanie tę teorię. Nie zrażony negatywnym przyjęciem 
Wegener wielokrotnie ponownie przedstawiał udosko¬ 
nalone wersje swej teorii ruchu kontynentów. Zmarł 
w 1930 r. podczas wyprawy meteorologicznej na 
Grenlandię, w czasie, gdy jego teoria była ciągle cał¬ 
kowicie negowana. 



gowej Ameryki Południowej. W 1620 r. F. Bacon wy¬ 
raził pogląd, iż trudno przypuścić, by zbieżność taka 
była całkowicie przypadkowa, chociaż nie mógł on 
sobie wyobrazić mechanizmu, który byłby odpowie¬ 
dzialny za to zjawisko. W połowie XVII w. Francuz 


Sytuacja nie uległa zmianie aż do II wojny świato¬ 
wej, po której, w wyniku rozwinięcia i zastosowania 
nowych technik instrumentalnych badania den oce¬ 
anicznych, a także rejestrowania fal sejsmicznych, 
uzyskano bardzo wiele nowych informacji. Przede 



Rys. 18. Przekrój schematyczny przez skorupę ziemską wzdłuż równika — ukazuje ukształtowanie kontynentów i den oceanicz¬ 
nych. Widać Grzbiet Południowoatlantycki i głębokie rowy w Oceanie Spokojnym. 


F. Placet zasugerował, iż rozbicie kontynentów na 
istniejące obecnie miało miejsce w czasie czterdziesto¬ 
dniowej powodzi opisywanej przez Biblię. Pogląd ten 
utrzymał się aż do początków XIX w. i znalazł swe 


wszystkim zwrócono uwagę na ogromne łańcuchy gór¬ 
skie wyrastające z dna oceanów (zob. rys. 18). Naj¬ 
większym i najciekawszym z nich okazał się Grzbiet 
Śródatlantycki, ciągnący się na przestrzeni 19 tys. km, 
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system większy niż Andy, Góry Skaliste i Himalaje 
wzięte razem. Przebieg podwodnego grzbietu zgadzał 
się z zarysem dodatniej anomalii ziemskiego strumie¬ 
nia cieplnego, grzbietowi towarzyszyła także słaba 
aktywność sejsmiczna i wulkaniczna. Przez środek 
rozsuwanie grzbietu przebiegała długa, wąska dolina, tzw. bruzda 
się dna grzbietowa. Wysunięto hipotezę, że nowa skorupa 
oceanów ziemska powstaje właśnie w rejonie tej bruzdy, wy¬ 
pływając powoli z głębszego wnętrza Ziemi, a następ¬ 
nie oziębia się i rozsuwa na boki, przy czym procesowi 
temu towarzyszą trzęsienia ziemi i wybuchy wulka¬ 
nów. Zgodnie z tą teorią dna oceanów rozszerzają się, 
powodując rozsuwanie się kontynentów z prędkością 
kilku centymetrów rocznie. W innych miejscach tego 
systemu, w rejonie głębokich rowów oceanicznych, 
związanych również z głębokimi trzęsieniami ziemi, 
stara skorupa ziemska znika we wnętrzu Ziemi, jest 
wciągana w głąb, pod kontynenty, 
badania Teoria rozprzestrzeniania się den oceanicznych zna- 
paleo- lazła swe potwierdzenie w badaniach paleomagnetycz- 
magnetyczne nych. Badania paleomagnetyczne to pomiary tej skła¬ 
dowej namagnesowania skały, która powstała w mo¬ 
mencie tworzenia się skały i oddaje wartość i kierunek 
pola magnetycznego w tym momencie czasu. Prowa¬ 
dzone intensywnie w latach sześćdziesiątych badania 
paleomagnetyczne wykazały, że skorupa ziemska rze¬ 
czywiście tworzy się w rejonie bruzdy śródgrzbieto- 
wej, ulegając następnie rozsunięciu na boki; pomiary 
te pozwoliły również na określenie prędkości tego pro¬ 
cesu. Równocześnie analizowanie wieku badanych 
skał pozwoliło na uzyskanie obrazu powolnych, glo¬ 
balnych wędrówek kontynentów. 

Zgodnie z tą teorią jeszcze 200 min lat temu obszary 
Pangea lądowe tworzyły jeden ogromny superkontynent, Pan- 
geę (tak jak postulował Wegener), oblany jednym tyl- 
Panthalassa ko oceanem, Panthalassą. Około 180 min lat temu ten 
gigantyczny kontynent rozpadł się początkowo na dwa 
Laurazja bloki (rys. 16): północny — Laurazję, złożony z Ame¬ 
ryki Północnej, Europy i Azji, oraz południowy — 
Gondwana Gondwanę, złożony z Afryki, Ameryki Południowej, 
Antarktydy, Australii i Indii. 135 min lat temu pojawił 
się grzbiet rozdzielający Afrykę i Amerykę Południo¬ 
wą, które zaczęły oddalać się od siebie. Afryka oddzie¬ 
liła się od Antarktydy, również Indie oderwały się 
i przesunęły o $ tys. km na północ, zderzając się z Azją 
około 40 min lat temu. W wyniku zderzenia uległ wy¬ 
piętrzeniu łańcuch Himalajów. Teoria przewiduje 
również dalszy ruch kontynentów; Australia ma kon¬ 
tynuować posuwanie się na północ, oba oceany: 
Atlantycki i Indyjski mają się nadal rozszerzać, 
a Morze Śródziemne kurczyć. 

Współcześnie najszerzej akceptowaną globalną 
teorią dotyczącą procesów geodynamicznych jest tzw. 
tektonika płyt, powstała w końcu lat sześćdziesiątych, 
a właściwiej ej zmodernizowana wersja, zwana nową te¬ 
ktoniką globalną, opracowywana obecnie. Zasadniczą 
ideą jest istnienie kilkunastu różnej wielkości płyt (lub 


bloków) tektonicznych, na obrzeżach których zew¬ 
nętrzna warstwa Ziemi ulega silnej deformacji. Ry¬ 
sunek 16 przedstawia jak zmieniały się te płyty. 

Grubość poszczególnych płyt szacowana jest na 50- 
100 km. Aktywność tektoniczna koncentruje się w wą¬ 
skich strefach brzegowych, przy czym odróżnia się 
trzy podstawowe rodzaje granic pomiędzy płytami: 
obszary, w których ma miejsce rozszerzanie się grani¬ 
cy i gdzie powstaje nowa skorupa ziemska (grzbiety 
śródoceaniczne), obszary kompresji, gdzie skorupa 
ulega zniszczeniu w wyniku zachodzenia na siebie dwu 
płyt, oraz tzw. uskoki przesuwcze (rys. 17,18), gdzie 
płyty poruszają się równolegle do siebie i skorupa ani 
nie jest produkowana, ani też nie ulega destrukcji. 

Teoria płyt zawiera w sobie wcześniejsze teorie roz¬ 
szerzania się den oceanicznych w wyniku tworzenia 
się nowej skorupy w regionach grzbietów śródoce- 
anicznych oraz teorię wędrówek kontynentów, zasu¬ 
gerowaną przez Wegenera. W swym pierwotnym 
kształcie teoria tektoniki płyt, a także obecna nowa 
tektonika globalna stanowią próbę globalnego opisu 
i interpretacji wielu różnorodnych zjawisk, jednak bez 
wyjaśnienia ich pierwotnego mechanizmu. Jakkolwiek 
dotychczas sugerowano wiele bardzo różnych me¬ 
chanizmów mających stanowić siłę napędową obser¬ 
wowanych zjawisk; sprawa ta jest jeszcze nie wyjaś¬ 
niona i stanowi jeden z najciekawszych otwartych pro¬ 
blemów, przed którymi stoi współczesna nauka. Za 
najciekawsze rozwiązanie uważa się obecnie teorię 
konwekcji cieplnej występującej w niektórych obsza¬ 
rach górnego płaszcza; równocześnie jednak istnieje 
wiele innych teorii. Problem ten powinien uzyskać 
rozwiązanie już w ciągu najbliższych kilku lat, w czasie 
realizowanego obecnie Projektu Geodynamicznego. 
W ramach tego programu prowadzone są intensywne 
badania całości zjawisk geodynamicznych, a także 
szczególnie dokładnie badane są najciekawsze z punk¬ 
tu widzenia tych zjawisk obszary globu, jak np. rejon 
Grzbietu Śródatlantyckiego, tzn. obszar, w któ¬ 
rym powstaje nowa skorupa ziemska (zob. rys. 17). 
W ramach trzyletniego francusko-amerykańskiego 
planu badań, nazwanego FAMOUS (French-Ameri- 
can Mid-Ocean Undersea Study), w latach 1973-1975 
przebadano dokładnie wybrany obszar dna oceanicz¬ 
nego o powierzchni 156 km 2 w rejonie Wysp Azor¬ 
skich. Projekt FAMOUS potwierdził teorię rozszerza¬ 
nia się dna oceanicznego (w tym rejonie prędkość tego 
procesu wynosi 2-3 cm na rok) oraz dostarczył og¬ 
romnej ilości danych, zebranych w trakcie powierzch¬ 
niowych i podwodnych wypraw eksploracyjnych. 
Dane te, opracowywane obecnie, umożliwią być 
może lepsze zrozumienie skomplikowanych procesów 
geodynamicznych. 

K. Bal Ińska-Wuttke Powstanie i budowa kontynentów , Warszawa 
1970; R. Fraser Ziemia, planeta, na której żyjemy , Warszawa 
1968; E.W. Janczewski Zarys sejsmologii ogólnej i stosowanej, 
Warszawa 1955; Planeta Ziemia, Warszawa 1962; E. Stenz, 
M. Mackiewicz Geofizyka ogólna. Warszawa 1964. 


Fizyka atmosfery 

Krzysztof Haman 


Atmosfera ziemska — gazowa otoczka Ziemi jest pod¬ 
stawowym składnikiem środowiska człowieka. Wa¬ 
runki atmosferyczne miały — i w dalszym ciągu ma¬ 
ją — zasadnicze znaczenie dla tak kluczowych dzie¬ 
dzin działalności ludzkiej jak rolnictwo czy transport 
i wyciskają swoje piętno na różnych przejawach życia 
społecznego. Próby poznania praw rządzących za¬ 
równo pojedynczymi zjawiskami pogody jak i ich 
właściwościami statystycznymi czyli klimatem, a także 
próby kształtowania ich w sposób pożądany, towa¬ 
rzyszą chyba całej historii ludzkości niezależnie od 
technicznych możliwości ich realizacji. Badania at¬ 
mosfery prowadzone w ostatnich dziesięcioleciach 
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przyniosły w tej dziedzinie poważne sukcesy, a także 
doprowadziły do wykrycia w atmosferze i wyjaśnienia 
wielu nowych zjawisk wykraczających poza potocznie 
rozumianą pogodę. Jednakże bardzo wiele — czasem 
bardzo pospolitych — zjawisk atmosferycznych jak 
chociażby zwykły deszcz kryje w sobie sporo dotąd 
niewyjaśnionych zagadek. Trzeba też pamiętać, że 
atmosfera ziemska należy do najbardziej zagrożonych 
działalnością człowieka elementów środowiska. 

Wszystko to powoduje rosnące zainteresowanie 
naukami o atmosferze ziemskiej, wśród których na 
czołowe miejsce wysuwa się fizyka atmosfery. 

Przez termin fizyka atmosfery rozumieć będziemy 





całokształt wiedzy o zjawiskach fizycznych zachodzą¬ 
cych w atmosferze ziemskiej. Fizyka atmosfery jest 
nauką złożoną wewnętrznie, odzwierciedlającą za¬ 
równo strukturę samej fizyki jak i strukturę atmosfe¬ 
ry. Mamy więc z jednej strony np. mechanikę, termo¬ 
dynamikę, elektryczność atmosfery, z drugiej zaś — 
działy fizyki atmosfery poświęcone kompleksowym 
badaniom określonych zjawisk atmosferycznych, jak 
np. fizyka chmur lub fizyka wysokich warstw atmo¬ 
sfery. Na szczególne wyodrębnienie ze względu na zna¬ 
czenie praktyczne zasługuje meteorologia — dział fizy¬ 
ki atmosfery zajmujący się zespołem zjawisk potocznie 
zwanych pogodą. Zjawiska te koncentrują się głównie 
w dolnych kilkudziesięciu lub nawet kilkunastu 
kilometrach atmosfery i są natury głównie mechanicz¬ 
nej i termodynamicznej. 

Pomocną przy czytaniu tego hasła, poświęconego 
głównie problemom meteorologii, może być il. 8 z 
tabl. 1, zawierająca szereg informacji o atmosferze. 


Zasady fizycznego opisu 
atmosfery 
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Zjawiska fizyczne w atmosferze opisuje się ilościowo 
podając wartości pewnych parametrów fizycznych 
(np. temperatury, ciśnienia, prędkości wiatru itp.). 
Najczęściej podaje się je w funkcji czasu i przestrzeni, 
czyli w postaci tzw. pól. Pierwotnym źródłem infor¬ 
macji o tych zjawiskach jest —jak we wszystkich nau¬ 
kach przyrodniczych — obserwacja i pomiar. W od¬ 
różnieniu od innych działów fizyki, w których domi¬ 
nują pomiary i obserwacje dokonywane podczas 
eksperymentów laboratoryjnych — kontrolowanych 
i powtarzalnych, zjawiska atmosferyczne bada się na 
ogół obserwując procesy naturalne, nie poddające się 
kontroli obserwatora i powtarzalne o tyle, o ile leży 
to w charakterze zjawiska. Sytuacja taka jest charak¬ 
terystyczna w geofizyce, a także w astrofizyce i astro¬ 
nomii. W geofizyce, a zwłaszcza w licznych działach 
fizyki atmosfery, dochodzi jeszcze jedna trudność — 
wiele zjawisk ze względu na ich rozległość nie mieści 
się w polu widzenia pojedynczego obserwatora i ich 
obraz uzyskuje się dopiero przez syntezę obserwacji 
wykonanych przez różnych obserwatorów. W wyniku 
tej syntezy otrzymuje się mapy lub przekroje pól pa¬ 
rametrów atmosferycznych (w formie graficznej lub 
cyfrowej), których najpospolitszym przykładem może 
być np. mapa ciśnienia przedstawiona w telewizyjnej 
prognozie pogody. Mapy te uzyskiwane są przez in¬ 
terpolację między zwykle dość odległymi w czasie 
i przestrzeni pomiarami. W zależności od gęstości 
tych pomiarów oraz sposobów ich nanoszenia i inter¬ 
polacji otrzymane mapy mogą być bardziej lub mniej 
szczegółowe czyli —jak się to w geofizyce zwykle mó¬ 
wi — mogą przedstawiać składowe pól o różnych ska¬ 
lach, które służą do opisywania zjawisk różnych skal. 
Pojęcie skali pola i ogólnie skali odgrywa wielką rolę 
w naukach geofizycznych. Ścisła definicja tego pojęcia 
jest dość skomplikowana, ale jego sens ogólny spro¬ 
wadza się do charakterystyki przestrzennych rozmia¬ 
rów zjawiska (skala przestrzenna) oraz czasu jego 
trwania (skala czasowa); skala charakteryzuje jedno¬ 
cześnie gęstość sieci obserwacyjnej niezbędnej do do¬ 
statecznie dokładnej obserwacji danego zjawiska. 

Dla przykładu rozpatrzymy skalę czasową tempe¬ 
ratury. Obserwując bieg temperatury przez dłuższy 
czas stwierdzimy, że można przedstawić go jako sumę 
średniej wieloletniej temperatury w danym miejscu 
oraz wahań sezonowych związanych ze zmianami pór 
roku, wahań dobowych związanych z cyklem dnia 
i nocy, a także nieregularnych oscylacji, w których 
przedziały czasu pomiędzy kolejnymi przejściami — 
od wzrostu do spadku temperatury — wynoszą od kil¬ 
ku do kilkunastu minut; za pomocą bardzo czułych 
i szybko reagujących termometrów dałoby się wykryć 


całkiem znaczne wahania temperatury zachodzące w 
czasie kilku sekund lub mniejszym. Jest przy tym rze¬ 
czą oczywistą, że scharakteryzowanie rocznego prze¬ 
biegu temperatury jest możliwe przy pomiarach wy¬ 
konywanych np. raz na dzień, biegu dobowego przy 
pomiarach wykonywanych co godzina, podczas gdy 
wyznaczenie pozostałych wymienionych składowych 
wypadkowego biegu temperatury wymaga pomiarów 
znacznie częstszych — co najmniej kilku w każdym 
okresie o ustalonym kierunku zmian temperatury 
(rys. 1). Liczbę charakteryzującą w przybliżeniu czas, 
w ciągu którego dana składowa biegu temperatury za¬ 
chowuje znak pochodnej — tzn. wzrasta lub maleje — 
będziemy nazywać skalą czasową tej składowej. 



Rys. 1. Obserwowany przebieg parametru meteorologicznego S 
można zwykle rozłożyć (choć nie w sposób jednoznaczny) na 
sumę szeregu składowych o różnych skalach czasowych. Krzywa 
I — skala czasowa rzędu doby, // — skala czasowa rzędu godzin. 
Ul — skala czasowa rzędu minut. Przebieg na rysunku jest 
fikcyjny i stanowi jedynie wyjaśnienie. Podobnie można by przed¬ 
stawić składowe o różnych skalach przestrzennych 


W podobny sposób można wprowadzić pojęcie ska¬ 
li przestrzennej (pionowej lub poziomej) danej skła¬ 
dowej pola temperatury lub innego parametru fizycz¬ 
nego. Zwróćmy uwagę, że tak wprowadzona skala nie 
jest dokładnie określona i składowa pola o danej skali 
może być wyodrębniona na różne sposoby prowadzą¬ 
ce do nieco odmiennych wyników. W badaniach geo¬ 
fizycznych składowe pola o różnych skalach rozpa¬ 
trujemy zazwyczaj jako odrębne obiekty badań, ponie¬ 
waż dysponując ograniczonymi możliwościami zbie¬ 
rania i przetwarzania informacji o polach parame¬ 
trów geofizycznych musimy wybierać pomiędzy do¬ 
kładniejszą analizą mniejszego (w sensie rozciągłości 
w czasie i przestrzeni) obiektu lub mniej dokładną — 
większego. Ponadto składowe te mają zazwyczaj od¬ 
mienne przyczyny fizyczne. Dlatego rozpatrując różne 
prawidłowości należy zawsze brać pod uwagę, do 
jakich skal danego zjawiska one się odnoszą. 

Nakładające się na siebie pola różnych skal można 
porównać do interferujących fal elektromagnetycz¬ 
nych o odmiennych długościach i okresach. W odnie¬ 
sieniu do fal elektromagnetycznych stosuje się na ogół 
zasadę prostego sumowania, tak że rozchodzenie się 
jednej fali nie ma wpływu na rozchodzenie się innych. 
Procesy atmosferyczne różnych skal natomiast na ogół 
na siebie oddziałują, np. pola skali większej zmieniają 
swoje zachowanie, gdy nakładają się na nie pola skali 
mniejszej i odwrotnie. Uwzględnienie tych oddziały¬ 
wań jest jednym z najtrudniejszych problemów w fizy¬ 
ce atmosfery (i w geofizyce w ogóle). 


badanie 

składowych 

pola 

o różnych 
skalach 


Budowa i skład atmosfery 


Atmosfera ziemska znajduje się stale w stanie bardzo 
bliskim lokalnej równowagi hydrostatycznej w tym 
sensie, że różnica ciśnienia atmosferycznego pomiędzy 
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dwoma poziomami jest zawsze bardzo bliska ciężaro¬ 
wi zawartego pomiędzy nimi pionowego słupa powie¬ 
trza o jednostkowej powierzchni przekroju poprzecz¬ 
nego. Dokładność tego przybliżenia wynosi ok. 10 _4 % 
i poważniejsze odchylenia (z reguły nie przekraczające 
1%) zdarzają się jedynie w niewielkich obszarach bar¬ 
dzo intensywnych ruchów powietrza. Wynika to stąd, 
że przyspieszenia w ruchach atmosfery o znaczniejszej 
rozciągłości przestrzennej są z reguły małe w porów¬ 
naniu z przyspieszeniem grawitacyjnym. Fakt ten pro¬ 
wadzi do charakterystycznego pionowego rozkładu 
ciśnienia (a więc i masy) w atmosferze; przykładem 


Typowy wysokościowy rozkład ciśnienia w atmosferze 


Wysokość 
km n.p.m. 

Ciśnienie 

Pa 

% masy atmosfery 
powyżej 

0 

1,01-10* 

100 

10 

2,65-10* 

26,2 

20 

5,5-10* 

5,4 

50 

9- 10 l 

0,1 

100 

1,74-10-* 

1,7-10-* 

200 

1,95-10-* 


500 

2,9-10"* 


1000 

1,9-10-* 



takiego rozkładu mogą być dane przytoczone w tabeli. 
Ogólnie można przyjąć, że ciśnienie do wysokości ok. 
100 km — a wraz z nim i masa atmosfery pozostająca 
ponad danym poziomem — spada dziesięciokrotnie co 
16-20 km. Podobnie przedstawiają się zmiany gęsto¬ 
ści w atmosferze. Zatem troposfera (średnio pierwsze 
10 km atmosfery) zawiera ok. 75% masy atmosfery, 
a wraz ze stratosferą (średnio pierwsze 50 km) — po¬ 
nad 99,9%. Typowy skład suchego powietrza atmo¬ 
sferycznego w pobliżu powierzchni Ziemi przedstawia 
tabela. 


Koncentracja głównych składników atmosfery suchej do 
wysokości 90 km 


Składnik 

% masy po¬ 
wietrza 
suchego 

Składnik 

% masy po¬ 
wietrza 
suchego 

Azot N, 

75,527 

Neon Ne 

1,25.10"* 

Tlen O, 

24,143 

Krypton Kr 

3,3 -10-* 

Argon A 

1,282 

Hel He 

7,24-10-‘ 

Dwutlenek węgla 
CO, 

4,5-6-10-* 

Wodór H 

3,4810-* 


Koncentracja poszczególnych składników atmosfe¬ 
ry kształtuje się lokalnie w wyniku działania procesów 
dwóch typów — produkcji (dodatniej, a także ujem¬ 
nej — czyli likwidacji) oraz transportu. Produkcja jest 
wynikiem działalności źródeł (dodatnich i ujemnych) 
takich, jak reakcje chemiczne, przemiany fazowe, ad¬ 
sorpcja i wydzielanie przez minerały i wodę oceanicz¬ 
ną, fotosynteza itp. Transport jest superpozycją uno¬ 
szenia przez uporządkowany ruch powietrza, miesza¬ 
nia przez nieuporządkowane ruchy różnych skal oraz 
dyfuzji molekularnej. Produkcja przy pominięciu po¬ 
zostałych procesów prowadzi do lokalnych zmian 
koncentracji w obszarze źródeł; mieszanie — do po¬ 
wstania mieszaniny o składzie jednorodnym prze¬ 
strzennie, dyfuzja zaś (której intensywność rośnie 
wraz ze średnią drogą swobodną molekuł) do ustale¬ 
nia równowagi hydrostatycznej każdego składnika 
z osobna, co prowadzi z kolei do względnego wzrostu 
koncentracji składników lżejszych wraz ze wzrostem 
wysokości. 

Stwierdzany pomiarami wysoki stopień jednorod¬ 
ności atmosfery w odniesieniu do jej głównych skład¬ 
ników (0 2 , N 2 , Ar) w warstwie do wysokości 50-60 km 
świadczy o tym, że dominującym czynnikiem trans¬ 
portu jest mieszanie, zaś wydajność źródeł jest sto¬ 
sunkowo mała. Powyżej tej wysokości zaczynają się 
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zaznaczać procesy dysocjacji pod wpływem promie¬ 
niowania Słońca oraz rekombinacji molekuł głównych 
gazów atmosferycznych. Prowadzi to do lokalnych 
zmian składu atmosfery — pojawienia się większych 
ilości tlenu i azotu atomowego. Względna wydajność 
tych procesów traktowanych jako źródła jest znaczna, 
lecz wobec wielkiego rozrzedzenia wysokich warstw 
atmosfery ich udział w łącznym bilansie gazów atmo¬ 
sferycznych jest niewielki. Powyżej 120 km droga 
swobodna molekuł staje się tak duża, że dyfuzja za¬ 
czyna dominować jako mechanizm transportu i w at¬ 
mosferze zaczyna stopniowo wzrastać koncentracja 
gazów lekkich — wodoru i helu, które stają się głów¬ 
nymi składnikami atmosfery na wysokości powyżej 
1000 km. 

Głównymi źródłami azotu, tlenu i dwutlenku węgla 
są procesy fotosyntezy i przemiany materii w szacie 
roślinnej lądowej i morskiej a ewolucja tej szaty jest 
sprzężona z ewolucją składu atmosfery. Na uwagę za¬ 
sługują też ze względu na swoje znaczenie biologiczne 
lub pośredni wpływ na ważne zjawiska atmosferyczne 
niektóre składniki atmosfery występujące w ilościach 
śladowych (0 3 , NH 4 , SO s , N 2 0). 

Szczególnym składnikiem atmosfery jest para wod¬ 
na — jedyny gaz atmosferyczny przechodzący w wa¬ 
runkach atmosferycznych w stan ciekły i stały. W od¬ 
niesieniu do pary wodnej procesy produkcji i likwidacji 
(parowanie i kondensacja wody) często dominują nad 
mieszaniem — stąd znaczne niejednorodności jej kon¬ 
centracji zawierającej się w granicach 0-4%. Dzięki 
dużym wartościom ciepła topnienia i kondensacji 
przemiany fazowe wody są istotnym czynnikiem ener¬ 
getycznym w atmosferze, a związane z nimi zja¬ 
wiska — powstawanie chmur i opadów — należą 
do najważniejszych dla człowieka procesów pogo¬ 
dowych. 

Ważnym składnikiem atmosfery są też mikrosko¬ 
pijne cząstki ciał stałych i cieczy unoszące się w po¬ 
wietrzu — tzw. aerozol atmosferyczny. Choć jego 
koncentracja rzadko przekracza 10 -6 , odgrywa on 
ważną rolę w licznych procesach atmosferycznych 
oraz może mieć bezpośrednie działanie biologiczne. 

W fizyce atmosfery stosuje się różnego rodzaju po¬ 
działy atmosfery na warstwy. Najczęściej stosowanym 
kryterium jest pionowy rozkład tenperatury, według 
którego wyróżnia się kolejno: 1) troposferę — war¬ 
stwę atmosfery ziemskiej, w której temperatura maleje 
wraz ze wzrostem wysokości niemal jednostajnie; roz¬ 
ciąga się ona od powierzchni Ziemi do wysokości ok. 
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Rys. 2. Rozkład temperatury i ciśnienia w atmosferze standardo¬ 
wej 
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7 km w okolicach podbiegunowych, a do ok. 16 km 
w pobliżu równika; 2) stratosferę — warstwę atmo¬ 
sfery ziemskiej o temperaturze prawie stałej (strato- 
sfera dolna) lub rosnącej wraz z wysokością (strato- 
sfera górna); 3) mezosferę — warstwę atmosfery ziem¬ 
skiej, w której ponownie następuje spadek temperatu¬ 
ry wraz z wysokością i 4) termosferę — warstwę atmo¬ 
sfery, w której ponownie wzrasta temperatura (do 
kilku tys. K); rozciąga się ona aż do granic atmosfery. 
Powierzchnie rozgraniczające te warstwy nazywają 
się odpowiednio: tropopauza, stratopauza i mezopau- 
za. Standardowy rozkład temperatury w atmosferze 
przedstawia rys. 2. Rozkłady rzeczywiste mogą dość 
znacznie różnić się od niego w zależności od położenia 
geograficznego, pory dnia lub roku. W atmosferze 
ziemskiej wyróżnia się również warstwy wg innych niż 
temperatura kryteriów fizycznych: np. jonosfera jest 
warstwą powyżej 80 km, którą charakteryzuje znacz¬ 
ny stopień jonizacji, ozonosfera — warstwą na wyso¬ 
kości 25-40 km, która odznacza się znacznie podwyż¬ 
szoną koncentracją ozonu (ok. 10 -6 wobec ok. 10 -8 
przy powierzchni Ziemi); egzosfera — warstwą po¬ 
wyżej 300 km, która charakteryzuje się ucieczką naj¬ 
szybszych molekuł gazów atmosferycznych w prze¬ 
strzeń międzyplanetarną. Wyodrębnia się też tzw. pla¬ 
netarną warstwę graniczną, obejmującą pierwsze 
1,5-2 km atmosfery, w której ruch powietrza w spo¬ 
sób istotny jest zakłócany przez tarcie o powierzchnię 
Ziemi. 


Promieniowanie słoneczne 
źródłem energii w atmosferze 


Pierwotnym źródłem energii, dzięki której zachodzą 
zjawiska fizyczne w atmosferze jest promieniowanie 
słoneczne. Dla pewnej grupy zjawisk (np. zjawisk 
optycznych, zorzy polarnej) jest to bezpośrednie źród¬ 
ło energii, jednak dla większości zjawisk badanych 
obecnie przez fizykę atmosfery jest to głównie źródło 
energii cieplnej, która zostaje następnie zmieniona 
w inne formy energii w różnych procesach termody¬ 
namicznych. Promieniowanie słoneczne docierające 
do górnych granic atmosfery jest w przybliżeniu (do¬ 
syć dokładnym) promieniowaniem ciała doskonale 
czarnego o temperaturze ok. 6000 K nieco zdeformo¬ 
wanym przez zjawiska zachodzące w atmosferze sło¬ 
necznej. Niemal cała energia tego promieniowania jest 
skoncentrowana w promieniowaniu widzialnym i bli¬ 
skiej podczerwieni. Promieniowanie krótkofalowe 
(nadfioletowe i krótsze) oraz promieniowanie korpu- 
skularne, odgrywa znaczną rolę w fizyce wysokich 
warstw atmosfery, lecz stanowi niewielki ułamek całej 
energii słonecznej docierającej do Ziemi. 

W atmosferze ziemskiej promieniowanie słoneczne 
ulega częściowemu pochłanianiu, rozpraszaniu i odbi¬ 
ciu na drobnoskalowych niejednorodnościach gęstości 
powietrza, cząstkach chmurowych i aerozolu atmo¬ 
sferycznym — częściowo zaś dociera do powierzchni 
Ziemi. Pochłaniane jest głównie promieniowanie nad¬ 
fioletowe (przez tlen i ozon. w górnych warstwach at¬ 
mosfery); znaczniejsze pochłanianie w szerokim prze¬ 
dziale widmowym występuje niekiedy przy dużej kon¬ 
centracji aerozolu. Ogólnie pochłanianie promienio¬ 
wania słonecznego w atmosferze jest niewielkie i wy¬ 
nosi ok. 10%. Rozpraszanie przebiega różnie w róż¬ 
nych kierunkach i zależy od długości fali świetlnej. 
W kierunku poprzecznym do padających promieni 
najsilniej jest rozpraszane promieniowanie o falach 
najkrótszych — stąd przewaga niebieskiej części wid¬ 
ma w barwie nieba, które jest barwą światła rozpro¬ 
szonego. Odbicie następuje głównie od cząstek dużych 
w porównaniu z długością fali świetlnej — głównie od 
cząstek chmurowych. Promieniowanie odbite od 
obiektów atmosferycznych i od powierzchni Ziemi 
w przestrzeń kosmiczną oraz promieniowanie rozpro¬ 


szone wstecz, nie bierze udziału w procesach atmo¬ 
sferycznych jako źródło energii. Stosunek natężenia 
tego promieniowania do natężenia promieniowania 
padającego nosi nazwę albedo. Średnie albedo Ziemi 
dla widma słonecznego wynosi ok. 0,3. 

Nie odbite promieniowanie słoneczne zostaje po¬ 
chłonięte przez obiekty atmosferyczne i powierzchnię 
Ziemi stając się składnikiem ich bilansu cieplnego. 
Z kolei Ziemia i atmosfera promieniują same. Skład 
widmowy promieniowania powierzchni Ziemi odpo¬ 
wiada w przybliżeniu (z dosyć dużą dokładnością) 
promieniowaniu ciała doskonale czarnego o tempera¬ 
turze tej powierzchni — niemal cała jego energia przy¬ 
pada na daleką podczerwień (maksimum dla fal o dłu¬ 
gości 10-12 pm). W tym obszarze widmowym leżą 
intensywne pasma pochłaniania pary wodnej i C0 2 
(rys. 3). Przypowierzchniowa warstwa powietrza gru- 
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Rys. 3. Widmo promieniowania ciała doskonale czarnego w tem¬ 
peraturze 6000 K (co w przybliżeniu odpowiada promieniowaniu 
słonecznemu) i 270 K (co w przybliżeniu odpowiada promienio¬ 
waniu Ziemi), oraz położenie pasm pochłaniania najważniej¬ 
szych składników atmosfery. Atmosfera jest przezroczysta dla 
znacznej części promieniowania słonecznego i niemal nieprze¬ 
zroczysta dla promieniowania Ziemi 

bości kilkudziesięciu metrów pochłania niemal całko¬ 
wicie promieniowanie leżące w tych pasmach. Wypro- 
mieniowanie z powierzchni Ziemi może się odbywać 
jedynie w drodze tzw. transferu promieniowania, tzn. 
pochłaniania promieniowania przez kolejne warstwy 
atmosfery i retransmitowania go dalej jako własnego 
promieniowania cieplnego o odpowiednio zmienio¬ 
nym składzie widmowym. Bezpośrednio w przestrzeń 
kosmiczną powierzchnia Ziemi promieniuje jedynie 
w przedziale tzw. okna atmosferycznego — przedzia- ‘ 
łu widmowego ok. 9-12 jim wolnego od pasm po¬ 
chłaniania głównych składników atmosfery. Dopiero 
powyżej 6-10 km możliwe staje się bezpośrednie wy- 
promieniowanie z atmosfery w przestrzeń kosmiczną 
większych ilości energii. Ponieważ retransmisja pro¬ 
mieniowania odbywa się zarówno w kierunku warstw 
leżących wyżej jak i w kierunku powierzchni Ziemi, 
znaczna część energii wypromieniowanej przez po¬ 
wierzchnię Ziemi wraca do niej z powrotem. W rezul¬ 
tacie temperatura powierzchni Ziemi ustala się na po¬ 
ziomie wyższym niżby to zachodziło przy braku atmo¬ 
sfery. Efekt ten wynikający ze znacznej przezroczy¬ 
stości atmosfery dla promieniowania słonecznego 
i nieprzezroczystości dla podczerwonego promienio¬ 
wania Ziemi nosi tradycyjną nazwę efektu inspekto¬ 
wego, ponieważ uważano dawniej (nie całkiem 
słusznie), że jest on analogiczny do procesu podno¬ 
szenia temperatury w szklarniach i inspektach ogrod¬ 
niczych. 

Pionowy rozkład temperatury w atmosferze jest bilans 
wynikiem równowagi pomiędzy transferem promie- cieplny 
niowania podczerwonego, transportem ciepła przez 
konwekcję i turbulencję, wydzielaniem ciepła utajo¬ 
nego w przemianach fazowych wody oraz w pewnym 
stopniu (głównie w wyższych warstwach atmosfery) 
także bezpośrednim pochłanianiem promieniowania 
słonecznego i molekularnym przewodnictwem ciepl¬ 
nym (rys. 4). W troposferze dominują trzy pierwsze 
czynniki, w stratosferze dolnej — transfer promienio- 
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Rys. 4. Schemat średniego bilansu cieplnego Ziemi i atmosfery 
w jednostkach umownych (stała słoneczna = 100); 1 promie¬ 
niowanie słoneczne dochodzące do górnych granic atmosfery, 
2 pochłanianie w atmosferze, 3 pochłanianie na powierzchni 
Ziemi, 4 odbicie od powierzchni Ziemi, 5 i 6 rozpraszanie w atmo¬ 
sferze, 7 odbicie od chmur, 8 promieniowanie powierzchni Ziemi, 
z tego 9 pochłonięte w atmosferze, 10 przepuszczone przez atmo¬ 
sferę, 11 i 12 promieniowanie atmosfery, 13 transport ciepła 
w postaci utajonej, 14 transport ciepła w postaci „odczuwalnej” 
(wg S. P. Chromowa i L. I. Mamontowej) 


wania, do którego w stratosferze górnej dołącza się 
pochłanianie nadfioletowego promieniowania sło¬ 
necznego przez ozon. Wraz ze zmniejszaniem się gę¬ 
stości powietrza, coraz większego znaczenia nabiera 
pochłanianie promieniowania krótkofalowego i kor- 
puskulamego Słońca w procesach fotochemicznych 
oraz przewodnictwo molekularne; czynniki te stają się 
dominującymi w bilansie cieplnym termosfery. Tem- 


albedo, mogą wykazywać znaczne różnice lokalne (np. 
pustynia i ocean). 

Lokalne różnice w dopływie promieniowania sło¬ 
necznego zależą od położenia geograficznego, pory 
dnia i roku oraz od stanu przezroczystości atmosfery 
(zachmurzenia, zapylenia oraz albedo). Pomijając osła¬ 
bienie w atmosferze, największą ilość promieniowania 


N zima wiosna lato jesień 



Rys. 5. Rozkład dopływu bezpośredniego promieniowania sło¬ 
necznego do górnych granic atmosfery w zależności od pory roku 
i szerokości geograficznej (cal/(cm 2 'd» 



geograficzny 

rozkład 

bilansu 


peratura powierzchni Ziemi, która ma zasadnicze 
znaczenie w kształtowaniu się warunków atmosferycz¬ 
nych w troposferze, jest konsekwencją bilansu ciepl¬ 
nego, w którym poza promieniowaniem i wymianą 
ciepła z atmosferą przez przewodnictwo i konwekcję 
istotną rolę odgrywa transport ciepła w głąb podłoża 
oraz jego ciepło właściwe. Parametry te, podobnie jak 


Rys. 6. Geograficzny rozkład rocznego bilansu promieniowania 
powierzchni Ziemi w kcal/cm* (1 kcal ~ 0,41868 *10: 4 J). Zależy 
on nie tylko od szerokości geograficznej, ale także zachmurzenia 
i przezroczystości atmosfery 

w skali doby uzyskują rejony podbiegunowe w czasie 
dnia polarnego — najmniejszą, te same rejony w cza¬ 
sie nocy polarnej (rys. 5). W ciągu roku najwięcej 


830 


































































promieniowania otrzymują obszary międzyzwrotni- 
kowe. Także bilans promieniowania pochłanianego 
i emitowanego wykazuje znaczne zróżnicowanie 
(rys. 6). Obszary podzwrotnikowe (powierzchnia Zie¬ 
mi i atmosfera łącznie) mają natomiast w ciągu roku 
średnio nadwyżki promieniowania, podczas gdy okoli¬ 
ce podbiegunowe — niedobór. Aby lokalnie tempera¬ 
tura utrzymywała się w obserwowanych granicach, 
bilans cieplny musi być wyrównywany inną formą 
transportu energii. Jest nią przede wszystkim tzw. 
unoszenie ciepła przez ruchy powietrza. Ruchy powie¬ 
trza transportują ciepło zarówno w formie „odczuwal¬ 
nej” tzn. związanej bezpośrednio z temperaturą po¬ 
wietrza jak i utajonej w parze wodnej. Ciepło utajone 
jest oddawane atmosferze podczas kondensacji w 
chmurach. Występuje przy tym sprzężenie zwrotne, 
ponieważ właśnie przestrzenne niejednorodności w bi¬ 
lansie cieplnym powodują powstawanie różnic tem¬ 
peratur, które umożliwiają zamianę energii cieplnej 
w inne postaci energii. W szczególności dzięki nim 
funkcjonuje cyrkulacja atmosferyczna i oceaniczna, 
stanowiąca podłoże niemal wszystkich zjawisk będą¬ 
cych przedmiotem badań współczesnej fizyki atmo¬ 
sfery. 


Dynamika atmosfery 


Ruchy powietrza atmosferycznego rozpatruje się 
zwykle w układzie odniesienia związanym z obracają¬ 
cą się wokół osi Ziemią. Są one wynikiem działania 
różnorodnych sił, które zazwyczaj odnosi się do jed¬ 
nostki masy lub jednostki objętości powietrza, 
siły Najważniejsze z nich to: 

działające — gradient ciśnienia, 

w atmosferze —siła ciążenia — mająca największe znaczenie 

w statyce oraz ruchach pionowych atmosfery; 

— siła Coriolisa związana z dobowym obrotem 
Ziemi — skierowana prostopadle do wektora prędko¬ 
ści i do osi obrotu Ziemi. 

Praktyczne znaczenie ma jedynie część jej składowej 
poziomej, która w odniesieniu do jednostki masy jest 
dana wzorem (4njT)v sin <p, gdzie T długość doby, 
v — prędkość pozioma powietrza, <f> — szerokość geo¬ 
graficzna. W dalszym ciągu przez termin „siła Corio¬ 
lisa” rozumieć będziemy właśnie tę wielkość. Jest ona 
skierowana prostopadle do wektora prędkości w pra¬ 
wo na półkuli północnej — w lewo na południowej. 

— tarcie wewnętrzne (lepkość molekularna), które 
jest wynikiem molekularnej dyfuzji pędu makroskopo¬ 
wego. Z energetycznego punktu widzenia prowadzi 
ono ostatecznie do zamiany energii kinetycznej w 
cieplną (dyssypacja energii). 

Efektem działania tych sił jest przyspieszenie ruchu 
powietrza. W pewnych sytuacjach siły te w znacznym 
stopniu się równoważą, tak że ich wypadkowa jest 
znacznie mniejsza od głównych składników; mówi 
się wówczas, że składniki te są w stanie kwazirówno- 
wagi. 

Ponieważ w dynamice atmosfery z reguły rozważa 
się ruchy jedynie powyżej pewnej skali, której repre¬ 
zentację umożliwia zdolność rozdzielcza stosowanej 
mapy, należy uwzględnić wpływ na ruch atmosfery ru- 
lepkość chów mniejszych skal (tzw. ruchów podskalowych). 
turbulencyjna Fizycznie oddziaływanie to jest równoważne pojawie- 
powietrza niu się dodatkowych sił — podobnie jak wzajemne 
oddziaływanie ruchu makroskopowego gazu z ruchem 
molekularnym równoważne jest pojawieniu się sił tar¬ 
cia wewnętrznego. Jeżeli efekty te są spowodowane 
ruchami bardzo małych skal — rzędu kilkuset me¬ 
trów i mniej — analogia ta sięga tak daleko, że można 
wręcz mówić o tzw. lepkości turbulencyjnej powietrza. 
Charakteryzujący ją współczynnik lepkości turbulen¬ 
cyjnej jest z reguły 10M0 5 razy większy od współczyn¬ 
nika lepkości molekularnej. 

Rola poszczególnych sił jest różna w różnych kate¬ 


goriach ruchów. Tak więc np. tarcie molekularne (po¬ 
za wysokimi warstwami atmosfery) ma istotne znacze¬ 
nie jedynie w ruchach bardzo małych skal (centymetry 
i mniej), którymi zajmuje się raczej aerodynamika niż 
geofizyka (choć ma pośredni wpływ również na proce¬ 
sy większych skal). Tarcie turbulencyjne jest istotnym 
czynnikiem w ruchach skal małych i średnich (do 
kilkudziesięciu kilometrów), w ruchach zaś o więk¬ 
szych skalach przestrzennych odgrywa rolę głównie 
w obszarach, w których pionowe gradienty prędkości 
wielkoskalowych są duże (warstwy tarcia). Odbywa 
się to głównie w pobliżu powierzchni Ziemi (plane¬ 
tarna warstwa graniczna), choć zdarza się także na 
wysokościach większych. W obszarach poza warstwa¬ 
mi tarcia czyli w tzw. atmosferze swobodnej, w odnie¬ 
sieniu do ruchów o skalach największych (powyżej 
1000 km w poziomie), występuje na dużych obszarach 
Ziemi tzw. równowaga kwazigeostroficzna, tzn. stan 
kwazirównowagi między siłą Coriolisa i siłą gradientu 
ciśnienia (można pominąć siłę tarcia). 

Wzajemne oddziaływanie ruchów różnych skal jest 
często charakteryzowane przez rozmiary i kierunek 
przekazywania energii kinetycznej od skali do skali. 
Na przykład ruchy o skalach poniżej kilkuset metrów 
(nazywane potocznie turbulencją atmosferyczną) cha¬ 
rakteryzuje przekazywanie energii kinetycznej ku co¬ 
raz mniejszym skalom aż do ruchów molekularnych, 
w których ulega dyssypacji (zamianie na ciepło). 
W tym sensie lepkość turbulencyjna wpływa hamująco 
na ruchy skal większych (odbierając energię kine¬ 
tyczną), podobnie jak lepkość molekularna hamuje ru¬ 
chy makroskopowe. Przy większych skalach (rzędu 
setek i tysięcy kilometrów) obserwuje się jednak także 
przekazywanie energii kinetycznej skalom większym. 
Chcąc w tym przedziale skal traktować oddziaływa¬ 
nie skal mniejszych na większe jako analog lepkości, 
należałoby niekiedy mówić o lepkości ujemnej. 

W oddziaływaniu ruchów skal większych na mniej¬ 
sze ważną funkcję spełnia zjawisko niestabilności. 
Polega ono na tym, że obszary dużych gradientów 
temperatury i prędkości mogą być niestabilne wzglę¬ 
dem ruchów skal mniejszych, tzn. powstające w tych 
obszarach przypadkowe, niewielkie zaburzenia ruchu 
o odpowiedniej skali mają tam tendencje do samorzut¬ 
nej intensyfikacji. Fizyczne mechanizmy zjawiska nie¬ 
stabilności są dość złożone i nie będą tu szczegółowo 
omawiane. 

Analizę dynamiki atmosfery ułatwia występowanie 
w atmosferze stanów kwazirównowagi. Na przykład 
rozkład ciśnienia w atmosferze jest lokalnie bardzo 
bliski rozkładowi hydrostatycznemu, dzięki czemu 
można w wielu zagadnieniach wyznaczać z dostatecz¬ 
ną dokładnością pole gęstości (a za pomocą równania 
stanu także pole temperatury) z pola ciśnienia. W ten 
sposób zmniejsza się liczba parametrów, których 
ewolucję trzeba analizować niezależnie. 

Podobne znaczenie ma równowaga kwazigeostro¬ 
ficzna (rys. 7), dzięki której wiatr rzeczywisty można 
w wielu rozważaniach zastępować tzw. wiatrem geo¬ 
stroficznym, wyznaczonym z warunku równoważenia 
poziomej składowej sił gradientu ciśnienia przez siłę 
Coriolisa (rys. 7). Wiatr geostroficzny wieje równo- 
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Rys. 7. Równowaga geostroficzna — w wietrze geostroficznym 
gradient ciśnienia (spadek na jednostkę odległości w kierunku 
prostopadłym do izobar) jest równoważony przez siłę Coriolisa 
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legie do izobar w ten sposób, że na półkuli północnej 
niskie ciśnienie pozostaje na lewo od kierunku, w któ¬ 
rym wieje wiatr, a na południowej — na prawo. Rów¬ 
nowaga kwazigeostroficzna w atmosferze swobodnej 
jest realizowana z dokładnością 10-15%, a więc znacz¬ 
nie mniejszą niż równowaga hydrostatyczna. W sy¬ 
tuacjach, w których można ją założyć, pole prędkości 
wiatru można wyznaczyć z pola ciśnienia. Znając więc 
ewolucję pola ciśnienia można, korzystając z kwazi- 
hydrostatyczności i kwazigeostroficzności wielkoska- 
lowych ruchów powietrza, wyznaczyć w przybliżeniu 
ewolucję wielkoskalowego pola temperatury i wiatru. 
Stąd wynika znane powszechnie znaczenie ciśnienia 
w prognozie pogody. 

Charakterystycznymi układami wielkoskalowej cyr¬ 
kulacji poziomej są niże i wyże baryczne zwane też 
cyklonami i antycyklonami; są to układy ciśnienia 
z izobarami w postaci krzywych zamkniętych z mini¬ 
mum lub maksimum ciśnienia w środku. Wobec kwa¬ 
zigeostroficzności ruchu cyrkulacja w niżach odbywa 
się niemal dokładnie wzdłuż izobar, przeciwnie do 
ruchu wskazówek zegara (na półkuli północnej), w 
wyżach zaś — zgodnie z tym ruchem. 

W planetarnej warstwie granicznej (pierwsze 1- 
2 km) siły tarcia turbulencyjnego nie mogą już być po¬ 
minięte wobec siły Coriolisa. Pozioma kwazirówno- 
waga sił gradientu ciśnienia, siły Coriolisa i siły tarcia 
(która z reguły ma składową skierowaną przeciwnie do 
kierunku wiatru) prowadzi do odchylenia wektora 
prędkości w tej warstwie w kierunku niższych ciśnień, 
tzn. do środka układu w niżu, na zewnątrz zaś ukła¬ 
du — w wyżu (rys. 8). Spowodowany tym napływ 
względnie odpływ masy powietrza od centrum układu 
musi być skompensowany ruchem pionowym (rys. 
9), jeżeli układ ma się utrzymać przez dłuższy czas. 


niż 



Rys. 8. Równowaga geostroficzna z tarciem. Przy istnieniu rów¬ 
nowagi siły tarcia gradientu ciśnienia i siły Coriolisa wiatr jest 
skręcony w kierunku mniejszych ciśnień 
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Rys. 9. Zachowanie się mas powietrza w niżu (cyklonie): a) zbież¬ 
ność masy spowodowana tarciem w pobliżu powierzchni Ziemi; 
b) spowodowana tym kompensująca ją cyrkulacja pionowa. 
W wyżu (antycyklonie) kierunek obu cyrkulacji jest przeciwny 
niż niżu 


Wynikiem tego efektu są powolne wielkoskalowe ru¬ 
chy powietrza wstępujące — w niżach i zstępujące — 
w wyżach. Ma to ogromne znaczenie dla kształtowa¬ 
nia pogody w tych układach, ponieważ ruchy wstę¬ 
pujące sprzyjają powstawaniu zachmurzenia i opa¬ 
dów, natomiast ruchy zstępujące powodują ich zanik. 
Stąd związek niżu z tzw. złą pogodą, wyżu zaś — 
z dobrą. 


Ogólna cyrkulacja atmosfery 


Ogólną cyrkulację atmosfery możemy rozpatrywać 
jako nakładające się na siebie ruchy różnych skal, 
tworzące całą hierarchię od skali ogólnoplanetarnej do 
mikroturbulencji, w której energia kinetyczna ulega 
dyssypacji (zamianie na ciepło) w wyniku występo¬ 
wania lepkości molekularnej. W węższym sensie, 
przez ogólną cyrkulację atmosfery rozumie się pierw¬ 
sze elementy tej hierarchii, tzn. pola głównych para¬ 
metrów mechanicznych i termodynamicznych uśred¬ 
nione w czasie i wzdłuż równoleżników — a więc za¬ 
leżne jedynie od szerokości geograficznej i wysokości. 

Schemat tak rozumianej ogólnej cyrkulacji atmosfe¬ 
ry w troposferze przedstawia rys. 10. 

Cechą charakterystyczną tej cyrkulacji jest wystę¬ 
powanie na każdej półkuli dwóch komórek cyrkula¬ 
cji południkowo-pionowej: tzw. komórki Hadleya, 
w małych szerokościach geograficznych, oraz tzw. ko¬ 
mórki Ferrela, która obejmuje szerokości średnie 
i duże. W obszarze komórek Hadleya południkowe komórka 
składowe wiatru przy ziemi są skierowane ku ich Hadleya 
wspólnej granicy wewnątrz tzw. międzyzwrotnikowej 
strefy zbieżności, natomiast składowa równoleżniko- 
wajest wschodnia (wiatry są odchylone na zachód). Są 
to znane powszechnie pasaty. Mechanizm działania 
komórki Hadleya polega na tym, że w pobliżu mię¬ 
dzyzwrotnikowej strefy zbieżności troposfera jest in¬ 
tensywnie nagrzewana (głównie w wyniku uwalniania 
ciepła utajonego kondensacji w tym rejonie obfitują¬ 
cym w chmury). Nagrzewanie to wywołuje konwekcję 
termiczną w skali planetarnej (tzn. wznoszenie się 
ciepłego, lżejszego powietrza, a osiadanie chłodniej¬ 
szego) w przekroju południkowo-pionowym i kon¬ 
wekcja ta jest zasadniczym powodem cyrkulacji w tej 
komórce. Wschodnia składowa równoleżnikowa przy 
powierzchni Ziemi jest wynikiem działania siły Corio¬ 
lisa. 

Bardziej skomplikowany jest mechanizm cyrkula- komórka 
cyjny komórki Ferrela. Obecność wiatrów wschód- Ferrela 
nich w komórce Hadleya wymusza w pewnym sensie 
istnienie strefy wiatrów zachodnich w innym obszarze, 
gdyż w przeciwnym razie moment pędu układu 
Ziemia-atmosfera (połączonego siłami tarcia) nie 
mógłby być zachowany i dlatego w komórce Ferrela 
dominują wiatry o zachodniej składowej równoleż¬ 
nikowej ; w związku z tym obszar tej komórki nazywa 
się także strefą wiatrów zachodnich. Wobec istnienia 
równowagi kwazigeostroficznej strefę wiatrów za¬ 
chodnich musi charakteryzować spadek ciśnienia w 
stronę biegunów, tarcie zaś w pobliżu powierzchni 
Ziemi powoduje pojawienie się składowej dobiegu- 
nowej. Tak więc, w komórce Ferrela cyrkulacja po- 
łudnikowo-pionowa nie jest elementem pierwotnym 
całej cyrkulacji w tej komórce, lecz wtórnym wynika¬ 
jącym z istniejącej cyrkulacji równoleżnikowej. W od¬ 
różnieniu od komórki Hadleya, w której ciepłe po¬ 
wietrze unosi się do góry i następuje przemiana 
energii cieplnej i potencjalnej w kinetyczną, w ko¬ 
mórce Ferrela następuje przemiana odwrotna. W tym 
sensie komórka Ferrela nie jest silnikiem cieplnym 
lecz pompą cieplną. 

Źródła takich parametrów fizycznych atmosfery 
jak wilgotność, energia, moment pędu itp., wykazują 
znaczną zależność od szerokości geograficznej. Na 
przykład strefa okołorównikowa ma znaczną nad- 
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Rys. 10. Fragment ogólnej cyrkulacji atmosfery: a) Pionowo-poludnikowy przekrój przez troposferę półkuli północnej przedstawiający 
średnią cyrkulację południkową (kolor niebieski) i równoleżnikową (kolor czarny) w zimie. Prędkość cyrkulacji jest scharakteryzowa¬ 
na za pomocą izotach (linii jednakowej prędkości) składowych: zachodniej w m/s (czarny) i południowej(niebieski);b)Intensywność 
cyrkulacji południkowej jest scharakteryzowana przez zagęszczenie linii prądu przepływu masy (czarny). Odpowiadające jej prędkości 
przedstawione są w postaci izotach składowej południowej przeniesionej z rys. a. Wyraźnie zaznacza się intensywna cyrkulacja połud¬ 
nikowa komórki Hadleya i słaba cyrkulacja komórki Ferreła 


wyżkę parowania nad opadami — przeciwnie niż 
strefa umiarkowana* a moment siły tarcia między 
Ziemią i atmosferą maleje z szerokością geograficzną. 
Ponieważ średni bilans tych wielkości w dużej skali 
czasowej jest wszędzie bliski zeru, musi być wyrówny¬ 
wany południowym transportem przez cyrkulację 
atmosfery i oceanów. 

O ile średnia cyrkulacja południkowo-pionowa w 
komórce Hadleya jest dość intensywna i w znacznym 
stopniu zapewnia ten transport w obszarze swego 
działania, o tyle cyrkulacja południkowo-pionowa 
w komórce Ferrela jest na to za słaba. Transport ten 
musi zapewniać nie cyrkulacja pionowa, lecz pozioma 
realizowana przez zależne od długości geograficznej 
i czasu zakłócenie cyrkulacji równoleżnikowej (tzw. 
„falowanie 1 * strefy wiatrów zachodnich). Dotyczy to 
zwłaszcza momentu pędu, którego stały dopływ 
z niższych szerokości geograficznych umożliwia utrzy¬ 
mywanie stabilnej cyrkulacji zachodniej. Z tego 
punktu widzenia bardzo ważny jest rejon styku ko¬ 
mórki Hadleya i Ferrela. W obszarze tym występuje 
duży poziomy gradient temperatury. W wielu miejs¬ 
cach jest on tak duży, że można mówić o skoku 
rrom temperatury w danej skali—jest to rejon tzw. pla- 
polarny netarnej strefy frontalnej, zwanej niekiedy frontem 
polarnym. Duże poziome gradienty temperatury po¬ 
wodują koncentrację energii osiągalnej (tzn. możliwej 
do zmiany w energię kinetyczną) w związku z tym 
jest to strefa szczególnie intensywnych zjawisk atmo- 
prąd sferycznych. Jednym z nich jest tzw. prąd strumienio- 
strumieniowy wy (jet stream) dość wąski (kilkaset kilometrów sze¬ 
rokości— przy tysiącach kilometrów długości) stru¬ 
mień bardzo silnych wiatrów występujący często w 
pobliżu tropopauzy. Na froncie polarnym pojawiają 


się też zafalowania, które często tracą stabilność 
przekształcając się w cyklony umiarkowanych szero¬ 
kości (nie mylić z cyklonami tropikalnymi), czyli 
niże baryczne kształtujące w znacznym stopniu po¬ 
godę w naszej strefie geograficznej (il. 190, tabl. 49). 
Cyklony i towarzyszące im antycyklony (wyże) są 
głównym mechanizmem transportu południkowego 
w strefie wiatrów zachodnich. 

W klasycznym modelu niżu atmosferycznego wy¬ 
różnia się tzw. wycinek chłodny i wycinek ciepły 
oddzielone od siebie tzw. frontami — ciepłym i chłod¬ 
nym, które łączą się w centrum cyklonu (rys. 11). 
Energię swą cyklon czerpie głównie z obniżania się 
środka ciężkości w wyniku wypierania ku górze lżej¬ 
szego powietrza wycinka ciepłego przez cięższe po¬ 
wietrze wycinka chłodnego. Na powierzchni Ziemi 
proces ten prowadzi do połączenia się frontów — 
zjawisko to nazywa się okluzją. Intensywne ruchy 
pionowe w rejonie frontów i występujące na nich 
nieciągłości parametrów meteorologicznych są przy¬ 
czyną wielu spektakularnych zjawisk meteorologicz¬ 
nych mniejszej skali — głównie chmur i opadów. 

Niezależnie od wędrownych niżów i wyżów, sy¬ 
metryczną równoleżnikową strukturę komórek Ha¬ 
dleya i Ferrela zakłócają mniej więcej stacjonarne 
zaburzenia związane z rozmieszczeniem kontynen¬ 
tów i oceanów oraz wielkich łańcuchów górskich. 

Szczegóły omówionej wyżej struktury cyrkulacyj- 
nej mają wyraźny bieg roczny—międzyzwrotniko- 
wa strefa zbieżności przemieszcza się wraz z rocznym, 
pozornym ruchem Słońca na sferze niebieskiej; po¬ 
nadto w związku z większymi poziomymi gradien¬ 
tami temperatury intensywność zjawisk cyrkulacyj- 
nych jest większa na półkuli zimowej niż na letniej. 
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Rys. 11. Klasyczny model rozwoju niżu w umiarkowanych sze¬ 
rokościach geograficznych, a) fala na froncie, b) fala traci sta¬ 
bilność — jej amplituda rośnie, zaznacza się wyraźnie wycinek 
ciepły, c) niż w pełnym rozwoju — początek okludowania, d) niż 
zokludowany — cieplejsze powietrze zostaje wyparte do góry 


wpływ 

oceanów 


cyrkulacja 
górnej 
stratosfery 
i mezosfery 


Szczególne osobliwości wykazuje też cyrkulacja at¬ 
mosfery w obszarach objętych nocą polarną. 

Brak miejsca uniemożliwia bardziej szczegółowe 
omawianie całego łańcucha procesów o coraz mniej¬ 
szych skalach — cyrkulacji lokalnych, bryz, zespołów 
chmur burzowych czy wreszcie drobnoskalowej tur¬ 
bulencji, które uczestnicząc w wyrównywaniu lokal¬ 
nych bilansów różnych wielkości fizycznych, tworzą 
łącznie to, co się potocznie nazywa pogodą. 

Jakkolwiek cyrkulacja w troposferze i dolnej strato- 
sferze stanowi zasadniczy mechanizm transportu 
(zwłaszcza poziomego) energii i innych wielkości 
fizycznych, nie należy pomijać jej związków z cyr¬ 
kulacją oceaniczną (-► Fizyka morza) oraz cyrku¬ 
lacją w wyższych warstwach atmosfery. Związek 
cyrkulacji troposferycznej z oceaniczną ma charakter 
sprzężenia zwrotnego — prądy morskie transportu¬ 
jące znaczne ilości ciepła, które — oddawane atmo¬ 
sferze — modyfikuje jej cyrkulację, same są w znacz¬ 
nym stopniu wynikiem działania wiatru. Ze względu 
na wielką bezwładność mechaniczną i cieplną wody, 
wpływ oceanu na temperaturę atmosfery jest znacznie 
większy niż wpływy atmosferyczne na ocean. W związ¬ 
ku z tym wpływ oceanu daje się stwierdzić w szero¬ 
kim przedziale skal ruchów atmosferycznych, podczas 
gdy wpływ atmosfery na ruchy oceaniczne — przede 
wszystkim w procesach o bardzo długim czasie trwa¬ 
nia, liczonym w miesiącach i latach (jeżeli pominąć 
wzbudzenie fal wiatrowych i lokalne spiętrzenia 
wody). 

Cyrkulacja górnej stratosfery i mezosfery jest sto¬ 
sunkowo słabo zbadana, ponieważ sondowania ra¬ 
kietowe— jedyne kompletne źródło informacji o 
niej — są bardzo kosztowne. Wpływ tej cyrkulacji 
na zjawiska troposferyczne jest kwestią dyskusyjną; 
wobec bardzo małej masy powietrza zawartej w tych 
częściach atmosfery, bezpośrednie oddziaływanie 
energetyczne na troposferę jest znikome. Górna stra- 
tosfera stwarza jednak warunki brzegowe cyrkulacji 
w niżej leżących warstwach atmosfery i może w ten 
sposób wpływać na procesy troposferyczne. 

Cyrkulacja wysokich warstw atmosfery wykazuje 
silny wpływ rytmów słonecznych — dobowego, rocz¬ 
nego, jedenastoletniego — oraz nieregularnych zmian 
aktywności słonecznej, co wiąże się z tym, że głów- 
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nym źródłem energii w tych warstwach jest pochła¬ 
nianie promieniowania krótkofalowego Słońca. Cyr¬ 
kulacje te odznaczają się też pewnymi osobliwościami, 
np. kierunki wiatru w stratosferze tropikalnej mają 
nieco zagadkowy cykl trwający ok. 26 miesięcy. Inną 
osobliwością są tzw. nagłe ogrzania dolnej strato¬ 
sfery (o kilkanaście K w ciągu kilkunastu godzin) 
związane z kompresją powietrza przy falowych ru¬ 
chach pionowych o dużej amplitudzie. 


Chmury i opady atmosferyczne 


Chmury i opady należą do najważniejszych zjawisk 
atmosferycznych zarówno ze względu na swe bezpo¬ 
średnie znaczenie dla człowieka jak i na powiązania 
z innymi zjawiskami meteorologicznymi. 

Chmura (lub mgła, która jest chmurą stykającą się 
z powierzchnią Ziemi) jest zbiorowiskiem mikrosko¬ 
pijnych kropelek wody lub kryształków lodu o ty¬ 
powych średnicach rzędu 10-30 pm, których pręd¬ 
kość spadania jest tak mała, że zawsze występująca 
w powietrzu mikroturbulencja nie pozwala im opaść 
na ziemię. Powstanie chmury wymaga przesycenia 
atmosfery parą wodną, co następuje najczęściej jako 
rezultat ochłodzenia wskutek adiabatycznego roz¬ 
prężania powietrza w ruchach wstępujących — rza¬ 
dziej w wyniku wypromieniowania ciepła lub w wy¬ 
niku mieszania się dwóch nienasyconych mas po¬ 
wietrza o różnych temperaturach i wilgotnościach. 
Ze względu na mechanizm powstawania, chmury 
można podzielić na: warstwowe, kłębiaste (konwek¬ 
cyjne), warstwowo-kłębiaste oraz orograficzne (gór¬ 
skie), jakkolwiek wobec wielkiej różnorodności chmur 
pewne rzadkie ich formy mogą się znaleźć poza tym 
podziałem. 

Używana w służbie meteorologicznej międzynaro¬ 
dowa klasyfikacja chmur przyjmuje oparty na mor¬ 
fologii podział na rodzaje, gatunki i odmiany. De¬ 
finicje podstawowych rodzajów chmur wg Między¬ 
narodowego Atlasu Chmur podane wraz z nazwami 
łacińskimi, polskimi oraz skrótami międzynarodo¬ 
wymi są w tabeli oraz ukazane na il. 193 (tabl. 50). 

Pionowe wstępujące ruchy powietrza o wielkiej 
skali (setki — tysiące kilometrów) występujące prze¬ 
ważnie w niżach i w pobliżu frontów atmosferycz¬ 
nych są główną, choć nie jedyną, przyczyną powsta¬ 
wania chmur warstwowych, których rozciągłość po¬ 
zioma jest dziesiątki i setki razy większa niż ich 
grubość. Do chmur warstwowych należą rodzaje St, 
Ns, As, Cs. 

Chmury konwekcyjne (rodzaje: Cu i Cb), których 
rozciągłość pionowa i pozioma są zbliżone, powstają 
w wyniku konwekcji o skali od setek metrów do 
dziesiątków kilometrów. Konwekcja ta jest wywołana 
przede wszystkim chwiejnością równowagi hydro¬ 
statycznej atmosfery, która się przejawia wówczas, 
gdy wznosząca się masa powietrza pozostaje lżejsza 
niż jej względnie nieruchome otoczenie. Ponieważ 
głównym czynnikiem, który o tym decyduje, jest róż¬ 
nica temperatur (powietrze cieplejsze jest zazwyczaj 
lżejsze od chłodniejszego), a temperatura powietrza 
wznoszącego się maleje wraz z wysokością na skutek 
rozprężania adiabatycznego o ok. 10 K/km, istnienie 
w powietrzu gradientu pionowego temperatury więk¬ 
szego niż 10 K/km oznacza stan równowagi chwiejnej. 
W razie wystąpienia kondensacji wydzielane ciepło 
utajone zmniejsza tę krytyczną wartość niekiedy na¬ 
wet do 5 K/km. Konwekcja może się także rozwijać 
w wyniku chwiejności dynamicznej spowodowanej 
niejednorodnością przestrzenną pola wiatru, w wyni¬ 
ku niejednorodności pola wilgotności oraz wzajem¬ 
nego współdziałania wszystkich tych efektów. Silnie 
rozbudowane chmury konwekcyjne mogą sięgać na¬ 
wet do stratosfery. Prędkość występujących w nich 
ruchów pionowych może przekraczać 50 m/s. Chmu- 
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Definicje podst 

awowych rodzajów chmur 

Nazwa 0 

Opis 


Cirrus chmury w kształcie oddzielnych, białych, deli- 

(C7, pierzaste) katnych włókien bądź białych lub przeważnie 
białych ławic, czy też wąskich pasm. Chmury 
te mają włóknisty wygląd lub jedwabisty po¬ 
łysk albo obie te cechy jednocześnie 


Cirrocumulus 
(Cc, kłębiasto- 
pierzaste) 


cienka biała ławica, płat lub warstwa chmur 
bez cieni, złożona z bardzo małych członów 
w kształcie ziaren, zmarszczek itp., połączo¬ 
nych lub oddzielonych od siebie i ułożonych 
mniej lub bardziej regularnie. Większość czło¬ 
nów ma pozorną szerokość mniejszą od jedne¬ 
go stopnia 


Cirrostratus 
(Cs, warstwo¬ 
wo-pierzaste) 


przejrzysta, biaława zasłona z chmur o włókni¬ 
stym lub gładkim wyglądzie, pokrywająca nie¬ 
bo całkowicie lub częściowo i zwykle powodu¬ 
jąca występowanie zjawisk halo 


Altocumulus 
(Ac, średnie 
kłębiaste) 


Altostratus 
(As, średnie 
warstwowe) 


biała, szara bądź częściowo biała, częściowo 
szara ławica lub warstwa chmur, wykazująca na 
ogół cienie i złożona z płatów, zaokrąglonych 
brył, walców itp., połączonych ze sobą lub od¬ 
dzielonych od siebie, niekiedy o wyglądzie czę¬ 
ściowo włóknistym lub rozmytym. Pozorna sze¬ 
rokość większości regularnie ułożonych ma¬ 
łych członów chmury zawiera się zwykle w gra¬ 
nicach od jednego do pięciu stopni, 
płat lub warstwa chmur szarawych bądź nie¬ 
bieskawych, o wyglądzie prążkowanym, włók¬ 
nistym lub jednolitym, pokrywająca niebo cał¬ 
kowicie lub częściowo i miejscami tak cienka, 
że słońce jest widoczne jak przez matowe szkło. 
Chmura Altostratus nie powoduje występowa¬ 
nia zjawisk halo 


Nimbostratus 
(Ns, warstwo¬ 
we deszczowe) 


Stratocumulus 
(Sc, kłębiasto* 
warstwowe) 


Stratus 
(5/, niskie 
warstwowe) 


Cumulus 

(Cu, kłębiaste) 


Cumulonibus 
(Cb , kłębiaste 
deszczowe) 


szara warstwa chmur, często ciemna o wyglą¬ 
dzie rozmytym wskutek mniej lub bardziej ciąg¬ 
łego opadu deszczu lub śniegu, w większości 
przypadków dochodzącego do ziemi. Chmura 
ta jest wszędzie tak gruba, że całkowicie prze¬ 
słania Słońce. Poniżej tej warstwy często wystę¬ 
pują niskie, postrzępione chmury, które mogą 
być z nią połączone lub od niej oddzielone 
Szara, biaława bądź częściowo szara, częścio¬ 
wo biaława ławica, płat lub warstwa chmur, po¬ 
siadająca prawie zawsze ciemne części; złożona 
z zaokrąglonych brył, walców itp., połączonych 
ze sobą lub oddzielonych od siebie i nie posia¬ 
dających wyglądu włóknistego. Większość re¬ 
gularnie ułożonych małych członów chmury ma 
pozorną szerokość większą od pięciu stopni 
na ogół szara warstwa chmur o dość jednolitej 
podstawie, mogąca dać opad mżawki, słupków 
lodowych lub śniegu ziarnistego. Jeżeli Słońce 
jest widoczne przez chmurę, jego zarys jest wy¬ 
raźny. Chmura Stratus nie powoduje występo¬ 
wania zjawisk halo, z wyjątkiem być może 
przypadków, gdy temperatura powietrza jest 
bardzo niska. Chmura Stratus występuje nie¬ 
kiedy w postaci postrzępionych ławic 
oddzielne na ogół gęste chmury, o ostrych zary¬ 
sach, rozwijające się w kierunku pionowym 
w kształcie pagórków, kopuł lub wież, których 
górna, pączkująca część przypomina często ka¬ 
lafior. Oświetlone przez Słońce części tych 
chmur są przeważnie lśniąco białe. Podstawa 
ich jest stosunkowo ciemna i prawie pozioma. 
Czasami chmury Cumulus są postrzępione 
potężna, gęsta chmura o dużej pionowej roz¬ 
ciągłości w kształcie góry lub wielkich wież. 
Przynajmniej część jej wierzchołka jest zazwy¬ 
czaj gładka, włóknista lub prążkowana i prawie 
zawsze spłaszczona. Część ta rozpościera się 
często w kształcie kowadła lub rozległego pió¬ 
ropusza. 


* Podana jest nazwa łacińska, skrót międzynarodowy i nazwa 
polska. 


rom takim towarzyszą zwykle intensywne zjawiska 
elektryczne prowadzące do wyładowań atmosferycz¬ 
nych (chmury burzowe). 

Warstwy o małym pionowym gradiencie tempera¬ 
tury (spadku mniejszym niż 5 K/km), a zwłaszcza 
warstwy inwersji, w których temperatura rośnie wraz 
z wysokością, hamują pionowy rozwój konwekcji 
i chmur konwekcyjnych. Chmury konwekcyjne zani¬ 
kają zazwyczaj podczas pojawienia się w nich prą¬ 
dów zstępujących, w których powietrze ulega ogrza¬ 
niu i względnemu wysuszeniu. Czasem w wyniku roz¬ 
padu chmur konwekcyjnych pozostają mniej lub 


bardziej rozległe pola chmur warstwowych lub war- 
stwowo-kłębiastych. 

Chmury warstwowo-kłębiaste (rodzaje: Sc, Ac 
i Cc) powstają głównie na skutek ruchów falowych 
lub konwekcyjnych wewnątrz chmur warstwowych. 

Chmury tworzące się w bardzo niskich temperatu¬ 
rach ok. — 40°C są zbudowane z kryształków lodu, 
co nadaje im charakterystyczny włóknisty wygląd. 
Nazywa się je niekiedy chmurami pierzastymi (ro¬ 
dzaje: Ci, Cs, Cc). 

Chmury orograficzne tworzą się w wyniku ruchów 
pionowych powietrza, wymuszanych przez opływ 
góry. łch cechą charakterystyczną jest zwięzek z te¬ 
renem — nie są one unoszone przez wiatr, lecz po¬ 
wietrze przepływa przez nie. 

Zanik chmur warstwowych i warstwowo-kłębia- 
stych powodowany jest najczęściej wielkoskalowymi 
ruchami zstępującymi, w wyniku których następuje 
ogrzewanie powietrza pod wpływem kompresji, lub 
mieszaniem z otoczeniem bezchmurnym. W pewnym 
stopniu może też mieć na to wpływ ogrzewanie pro¬ 
mieniowaniem słonecznym, które chmury pochłaniają 
w szerokim przedziale widmowym. 

Chmury, zwłaszcza konwekcyjne występują często 
w postaci układów o wyraźnej strukturze mezoskalo- 
wej (skala rzędu dziesiątków i setek kilometrów), 
których wykrycie stało się możliwe dzięki zdjęciom 
satelitarnym (il. 192, tabl. 49). Układy te powstają 
w wyniku stosunkowo powolnych pionowych ruchów 
mezo skalo wy ch, które mogą lokalnie zmienić stopień 
chwiejności równowagi atmosfery. Czasem oddziały¬ 
wanie między rozwijającą się chmurą i otoczeniem 
tworzy sprzężenie zwrotne, na skutek którego w po¬ 
bliżu jednej chmury tworzą się intensywnie następne. 
Mechanizm ten można zaobserwować przy rozwoju 
chmur burzowych i ich zespołów, a także w proce¬ 
sach takich jak powstawanie cyklonów tropikalnych. 
Szczegóły mechanizmów wzajemnego oddziaływania 
chmur na siebie oraz na otoczenie są obecnie przed¬ 
miotem intensywnych badań i mają wielkie znaczenie 
dla wielu gałęzi fizyki atmosfery. 

Poza omówionymi wyżej tzw. makrofizycznymi 
procesami zachodzącymi w chmurach istotną rolę 
odgrywają procesy mikrofizyczne związane ze zjawis¬ 
kami zachodzącymi w pojedynczej cząstce chmuro¬ 
wej lub ich niewielkich zespołach. 

Kondensacyjne powstawanie cząstki chmurowej 
jest procesem skomplikowanym, ponieważ warunku¬ 
jące ją przesycenie pary wodnej zależy nie tylko od 
temperatury, ale także od kształtu i rozmiaru powsta¬ 
jącej cząstki oraz ilości i rodzaju rozpuszczonych 
w niej substancji. Kondensacja pary wodnej w czy¬ 
stym swobodnym powietrzu wymaga przesycenia 
rzędu 500% (w stosunku do prężności pary nasyco¬ 
nej nad płaską powierzchnią czystej wody podawanej 
w tablicach). Kondensacja w atmosferze zachodzi na 
jądrach kondensacji, którymi są głównie cząstki aero¬ 
zolu zawierające substancje rozpuszczalne w wodzie. 
Dzięki nim kondensacja w chmurach i mgłach może 
wystąpić przy wilgotności względnej nawet poniżej 
100%. Ilość, wielkość i skład chemiczny jąder kon¬ 
densacji określa w znacznym stopniu liczbę i rozmia¬ 
ry kropli, które mogą na nich powstać drogą konden¬ 
sacji. Typowe średnice kropli uzyskiwane na drodze 
kondensacji nie przekraczają 30-35 pm. 

Dalszy wzrost kropli zachodzi przede wszystkim 
wskutek koalescencji. Najbardziej typowa jest koa- 
lescencja grawitacyjna. Polega ona na tym, że krople 
różnych rozmiarów spadając z różnymi prędkościami 
zderzają się ze sobą i łączą. 

Skomplikowane oddziaływania aerodynamiczne 
między opadającymi kroplami powodują, że krople 
o średnicach poniżej 40-50 pm nie są zdolne do 
efektywnej koalescencji z kroplami mniejszymi. Wi¬ 
dać więc, że przy typowych rozmiarach kropli po¬ 
wstających w toku kondensacji koalescencja jest mało 
prawdopodobna. Dlatego wiele rodzajów chmur nie 
daje opadów. Zapoczątkowanie koalescencji, która 

835 


chmury 

warstwowo- 

kłębiaste 

chmury 

pierzaste 


chmury 

orograficzne 


układy 

chmur 


kondensa¬ 

cyjne 

powstawanie 

cząstki 

chmurowej 


koalescencja 

















może doprowadzić do powstania opadu, wymaga 
ciepły pojawienia się w chmurze pewnej liczby cząstek du- 
deszcz żych o średnicach powyżej 40 pm. Mogą nimi być 
np. kropelki kondensujące na tzw. jądrach gigan¬ 
tach — stosunkowo dużych kryształach soli morskiej 
lub innych substancji, które w pewnej liczbie mogą 
się znaleźć w powietrzu. Taki mechanizm powstawa¬ 
nia opadu jest znany pod nazwą mechanizmu „ciep¬ 
łego deszczu”. 

mechanizm Często spotykanym mechanizmem kondensacji jest 

trójfazowy tzw. mechanizm lub proces trójfazowy, zw. inaczej 
mechanizmem Findeisena-Bergerona, działający wów¬ 
czas, gdy chmura jest mieszaniną przechłodzonych 
kropelek wody i kryształów lodu. Przesycenie pary 
nad lodem jest większe niż nad wodą, wobec czego 
w takiej mieszaninie kryształy lodu gwałtownie rosną 
kondensacyjnie kosztem kropelek wody i mogą szyb¬ 
ko osiągać rozmiary umożliwiające efektywną koa- 
lescencję. Pojawienie się znaczniejszej liczby krysz¬ 
tałków lodu w chmurach następuje zwykle przy tem¬ 
peraturze poniżej — 12°C. Wynika to siąd, że małe 
kropelki wody ulegają silnemu przechłodzeniu (do 
ok. — 40°C), o ile nie zetkną się z kryształem lodu 
lub jakąś inną substancją, która może zadziałać jako 
tzw. jądro zamarzania. Obecne w aerozolu atmosfe¬ 
rycznym typowe jądra zamarzania zaczynają działać 
właśnie w temperaturze poniżej — 12°C. Powstający 
w wyniku procesu trójfazowego opad stały może 
stopnieć i dotrzeć do ziemi jako deszcz lub — gdy 
temperatura nie jest dość wysoka —jako śnieg, krupa 
(grad miękki) lub grad. Rodzaj i wielkość cząstek 
opadu zależy od bilansu ciepła i wody w procesie ich 
wzrostu oraz od jego długotrwałości. Silne prądy 
pionowe w dużych chmurach kłębiastych nie pozwa¬ 
lają na wypadanie z chmury cząstek zbyt małych — 
stąd charakterystyczne dla tych chmur opady prze¬ 
lotne często zawierają cząstki o znacznych rozmia¬ 
rach. 

W umiarkowanych strefach klimatycznych ok. 90% 
opadów powstaje w procesie trójfazowym. W strefie 
tropikalnej ok. 50% opadów to tzw. ciepły deszcz. 
Poza wspomnianymi tu mechanizmami powstawania 
cząstek dostatecznie dużych, by zapoczątkować sku¬ 
teczną koalescencję grawitacyjną, działają jeszcze cza¬ 
sem inne mechanizmy, których natura nie jest obecnie 
dostatecznie wyjaśniona — być może odgrywają w 
nich pewną rolę efekty elektryczne lub mikroturbu- 
lencja. 

sztuczna Zarówno mechanizm ciepłego deszczu jak i trój- 
modyfikacja fazowy może być stosunkowo łatwo modyfikowany 
opadów przez wprowadzenie do chmur sztucznych jąder kon¬ 
densacji lub zamarzania. Na tej zasadzie opierają się 
próby modyfikacji chmur i opadów zmierzające do 
wywoływania sztucznego deszczu lub zapobiegania 
szkodom gradowym. Pomimo dużych wysiłków i nie¬ 
wątpliwych sukcesów w indywidualnych przypadkach, 
powszechne stosowanie tej techniki nie jest jeszcze 
możliwe; procesy fizyczne w chmurach nie są na tyle 
dobrze poznane, by z dostateczną pewnością można 
było liczyć na pożądane wyniki. 


Główne problemy i kierunki 
rozwoju współczesnej 
fizyki atmosfery 


Główne problemy i kierunki współczesnej fizyki at¬ 
mosfery są wyznaczane przede wszystkim przez spo¬ 
łeczne i gospodarcze potrzeby współczesności. Bada¬ 
nia w tej dziedzinie są bowiem bardzo kosztowne 
i wymagają zorganizowanej na szeroką skalę współ¬ 
pracy międzynarodowej. Wydaje się, że na obecnym 
etapie najważniejszymi są następujące problemy: 
prognozowanie pogody, ewolucja klimatu oraz mo¬ 
dyfikacja pogody i klimatu (celowa lub niezamierzo¬ 
na) w wyniku działalności człowieka. 
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Prognozy pogody 

Prognozy pogody mogą być subiektywne (oparte 
głównie na subiektywnej ocenie sytuacji i doświad¬ 
czeniu meteorologa) lub obiektywne (oparte na usta¬ 
lonych regułach niezależnych od stosującego go me¬ 
teorologa). Prognozy obiektywne mogą być progno¬ 
zami statystycznymi, tj. mogą wykorzystywać empi¬ 
rycznie stwierdzone związki między różnymi zjawis¬ 
kami meteorologicznymi, ustalającymi prawdopodo¬ 
bieństwa występowania ich w pewnych sekwencjach 
czasowych, lub deterministycznymi (czasem nazywa 
się je dynamicznymi), tj. określającymi przyszły stan 
atmosfery na podstawie znajomości stanów prze¬ 
szłych oraz praw fizycznych rządzących ewolucją 
zjawisk atmosferycznych. Do połowy XX w. domi¬ 
nowały w praktyce prognozy subiektywne. Rozwój 
technik obliczeniowych i przetwarzania danych w 
drugiej połowie XX w. spowodował szybki rozwój 
metod dynamicznych i statystycznych. Obecnie sto¬ 
suje się najczęściej metody stanowiące kombinacje 
tych trzech rodzajów prognoz. Ponieważ z metod 
fizyki atmosfery korzysta się najbardziej przy pro¬ 
gnozach deterministycznych, więc nimi się głównie 
zajmiemy. 

Podstawą prognoz deterministycznych jest fakt, 
że znajomość pól ciśnienia, wiatru (dwie składowe 
poziome) i prędkości pionowej oraz temperatury i wil¬ 
gotności pozwala, z wystarczającą dla celów pra¬ 
ktycznych dokładnością, określić występujące zja¬ 
wiska pogodowe. Problem sprowadza się więc do pro¬ 
gnozy pól tych sześciu parametrów. 

Wyrażone w postaci równań różniczkowych zasady 
zachowania pędu energii, masy powietrza, i masy wo¬ 
dy dostarczają w zasadzie sześciu równań do wyzna¬ 
czania sześciu niewiadomych pól. Aby je rozwiązać, 
należy znać warunki początkowe (tzn. stan niewiado¬ 
mych pól w chwili uznanej za początkową), a następ¬ 
nie zastosować odpowiednią procedurę matematycz¬ 
ną w celu wyznaczenia stanu w chwili końcowej. Przy 
wykonywaniu tych działań w praktyce napotyka się 
niemało trudności. Przede wszystkim w równaniach 
występują siły i źródła energii, których postać ma¬ 
tematyczną nie zawsze umiemy ustalić. Następnie 
rozpatrujemy zwykle pewną skalę zjawisk — oddzia¬ 
ływanie ze skalami leżącymi poniżej naszej zdol¬ 
ności rozdzielczej powoduje pojawienie się w rów¬ 
naniach dodatkowych wyrażeń o charakterze sił lub 
źródeł energii, które należy traktować jak „nowe” 
niewiadome i dla których należy ułożyć odrębne rów¬ 
nania, wiążące je ze „starymi”. Szukanie takich rów¬ 
nań nazywa się parametryzacją procesów podskalo- 
wych. Wamaga ona przede wszystkim dobrego rozu¬ 
mienia strony fizycznej wchodzących w grę proce¬ 
sów; można stwierdzić, że znaczna część wysiłku ba¬ 
dawczego, tak teoretycznego, jak i obserwacyjnego, 
współczesnej fizyki atmosfery wiąże się mniej lub 
bardziej bezpośrednio z próbami znalezienia dobrych 
metod parametryzacji procesów podskalowych w ma¬ 
tematycznych modelach zjawisk atmosferycznych. 
Pomimo pewnych sukcesów na tym polu, problem 
jest daleki od rozwiązania i nie jest przy tym wcale 
pewne, czy rozwiązanie go z zadowalającą dokład¬ 
nością jest w ogóle możliwe. 

Trudności nastręcza też formułowanie warunków 
początkowych, Źródłem ich są obserwacje meteorolo¬ 
giczne zawsze obarczone błędami pomiarowymi oraz 
błędami wynikającymi z interpretacji między rzadko 
rozmieszczonymi stacjami meteorologicznymi — nie¬ 
które rejony globu, np. oceany, okolice podbiegu¬ 
nowe i obszary słabo zamieszkałe, nie mają niemal 
zupełnie posterunków meteorologicznych, a zwłaszcza 
posterunków aerologicznych wykonujących pomiary 
w atmosferze swobodnej do wysokości ok. 30 km. To¬ 
też duże nadzieje wiąże się z wykorzystaniem sztucz¬ 
nych satelitów. Np. satelitarne pomiary promienio¬ 
wania podczerwonego atmosfery w różnych przedzia¬ 
łach widmowych pozwalają na wyznaczenie prze- 
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strzennych rozkładów temperatury i wilgotności, 
z których (korzystając z kwazihydrostatyczności 
i kwazigeostroficzności atmosfery) można w przybli¬ 
żeniu wydedukować przestrzenne rozkłady pozosta¬ 
łych interesujących nas parametrów. Jednakże prak¬ 
tyczne wykorzystanie tej techniki wymaga jeszcze po¬ 
konania wielu trudności fizycznych i technicznych. 

Oprócz powyższych występują też problemy natury 
matematycznej (luki w teorii równań różniczkowych 
i ich przybliżonego rozwiązywania) oraz technicznej 
związanej z szybkim wykonywaniem obliczeń i prze¬ 
twarzaniem danych, ponieważ moce obliczeniowe na¬ 
wet największych współczesnych komputerów nie są 
dostateczne dla rozwiązania trudniejszych zagadnień 
prognozy pogody z odpowiednią prędkością. 

Można by sądzić, że trudności prognozy determi¬ 
nistycznej są w gruncie rzeczy natury technicznej, 
tzn. supergęsta sieć bardzo dokładnych pomiarów 
pozwoliłaby uwzględniać procesy o bardzo małych 
skalach minimalizując wpływ efektów podskalowych 
oraz niedokładności danych początkowych, a super- 
sprawne komputery pozwoliłyby w przyszłości poko¬ 
nać trudności obliczeniowe. Eksperymenty numerycz¬ 
ne wykonane na różnych modelach atmosfery zdają 
się jednak sugerować, że istnieje także pewien teore¬ 
tyczny kres dokładności i wyprzedzenia prognozy 
typu deterministycznego. Równania hydrodynamiki 
stosowane w prognozie są bardzo bowiem czułe 
na warunki początkowe, tzn. dwa rozwiązania wycho¬ 
dzące z mało różniących się stanów początkowych 
mogą po dość krótkim czasie bardzo się różnić, przy 
czym narastanie tych różnic jest tym szybsze, im 
mniejsze skale przestrzenne i czasowe uwzględniają 
rozwiązania. Efekt ten może bardzo ograniczyć, a na¬ 
wet zniweczyć korzyści wynikające z wprowadzenia 
bardzo małych skal do równań i warunków począt¬ 
kowych. Jeżeli nie jest to własność samego modelu 
ale także realnej atmosfery, to można się obawiać, 
że działa tu jakby pewna zasada nieoznaczoności: 
im bardziej szczegółowa w sensie przestrzennym jest 
prognoza, tym na krótszy okres można ją opracować. 
Problem istnienia takiego teoretycznego kresu wy¬ 
przedzenia prognozy nosi nazwę problemu przewidy¬ 
walności stanów atmosfery. 

Przypuszcza się, że dla prognoz w skali synop¬ 
tycznej kresem wyprzedzenia prognozy jest kilkanaś¬ 
cie dni. Ponieważ obecnie prognozy te formułuje się 
na 2-3 doby, możliwości postępu, choć ograniczone, 
są jeszcze znaczne. Stworzenie sieci obserwacyjnej 
i środków obliczeniowych — wzajemnie dopasowa¬ 
nych, które pozwoliłyby realizować te zadania w spo¬ 
sób optymalny, jest celem wielkiego, wieloletniego, 
międzynarodowego programu badawczego znanego 
pod nazwą GARP (Global Atmospheric Research 
Project). 

Prognozy długoterminowe — miesięczne czy sezo¬ 
nowe— są z konieczności odpowiednio mniej pre¬ 
cyzyjne. Podejmowane obecnie próby opracowywania 
takich prognoz mają wciążjeszcze dość słabe podstawy 
fizyczne. 


Ewolucja klimatu i modyfikacja pogody 

Klimat jest czynnikiem niezwykle ważnym w dzia¬ 
łalności człowieka, zwłaszcza w jego gospodarce 
żywnościowej i energetycznej. Choć zmiany klimatycz¬ 
ne w skali czasu życia jednego pokolenia są niewiel¬ 
kie, istnieją przekonywające dowody poważnej ewolu¬ 
cji klimatu w dłuższym czasie. Wyjaśnienie mecha¬ 
nizmów tej ewolucji jest jednym z głównych zadań 
współczesnej fizyki atmosfery. Zasadniczym czynni¬ 
kiem powodującym przemiany klimatu są zmiany 
przestrzennego rozkładu bilansu cieplnego Ziemi i at¬ 
mosfery. Przyczyny tych zmian mogą tkwić bądź 
w zmianach dopływu promieniowania słonecznego na 
skutek periodycznych zmian astronomicznych lub 
nieperiodycznych wahań aktywności słonecznej, bądź 


w zmianach własności cieplnych Ziemi i atmosfery 
(zmiany szaty roślinnej, zmiany składu atmosfery, 
przemieszczenia biegunów itp.). 

Szczególnie istotny jest problem stabilności kli¬ 
matu — wyjaśnienie, czy pojawienie się jakiejś szcze¬ 
gólnie silnej jednorazowej fluktuacji pogody nie 
wywoła trwałej i w dodatku stosunkowo szybkiej 
zmiany klimatu Ziemi. Występuje tu pewna analogia 
z równowagą cegły stojącej na płaskim stole. Leżąc 
na którejkolwiek ze swych ścian, cegła znajduje się 
w stanie równowagi i na małe wychylenie zareaguje 
powrotem do położenia pierwotnego. Jednak przy do¬ 
statecznie dużym wychyleniu stan równowagi może 
być osiągnięty już w innym położeniu. Istnieje wiele 
mechanizmów atmosferycznych, do których teoretycz¬ 
nie ta analogia mogłaby się stosować. Na przykład, 
znaczne zwiększenie zawartości pary wodnej w powie¬ 
trzu spowoduje podniesienie temperatury powierzchni 
Ziemi w wyniku spotęgowania efektu inspektowego, 
co wywoła dalsze zwiększone parowanie itd. (do¬ 
datnie sprzężenie zwrotne). Wzrost temperatury na¬ 
ruszy v/ końcu równowagę bilansu cieplnego, co do¬ 
prowadzi do zmiany układu cyrkulacji przywracają¬ 
cej tę równowagę, lecz — być może — przy zmienio¬ 
nych przeciętnych wartościach temperatury, wilgot¬ 
ności i układu wiatrów. Może się jednak zdarzyć, 
że wzrost wilgotności spowoduje od razu np. wzrost 
opadów, który przywróci poprzedni stan równowagi 
(ujemne sprzężenie zwrotne). Powstaje pytanie, który 
z tych wariantów odpowiada rzeczywistości. Rozstrzy¬ 
gnięcie problemów tego rodzaju jest szczególnie istot¬ 
ne w perspektywie dość szybkich zmian w atmosferze 
i powierzchni Ziemi pod wpływem działalności czło¬ 
wieka. Jak wykazała tragiczna w skutkach susza 
w krajach Sahelu w latach 1969-1975, nawet niewiel¬ 
kie przemieszczenie stref klimatycznych może mieć 
lokalnie katastrofalne skutki. 

W chwili obecnej największy niepokój budzą na¬ 
stępujące możliwe procesy. W ostatnim stuleciu 
obserwuje się stały, stopniowy wzrost koncentracji 
C0 2 w powietrzu (rys. 12) w wyniku spalania paliw 
zawierających węgiel, oraz być może także na skutek 
zanieczyszczenia wód oceanicznych ropą naftową (po¬ 
gorszenie warunków rozpuszczania C0 2 w wodzie oce¬ 
anicznej) lub zmniejszenia fotosyntezy w skali świato¬ 
wej. Istnieje obawa, że dalszy wzrost koncentracji 
CÓ 2 , który odgrywa istotną rolę w „efekcie inspek¬ 
towym” może uruchomić dodatnie sprzężenie zwrotne 
omówione wyżej. 

Zwiększona w wyniku procesów spalania koncen¬ 
tracja aerozoli może zmienić albedo Ziemi. Ponadto 
aerozole są często aktywnymi jądrami kondensacji 
i zamarzania, co prowadzi do zmian w zachmurzeniu 
i opadach, i co za tym idzie — do zmiany ilości wy¬ 
dzielanego ciepła kondensacji. Ponadto chmury i po¬ 
krywa śnieżna mają istotne znaczenie w bilansie ra¬ 
diacyjnym (wysokie albedo względem promieniowania 
słonecznego, silna emisja w podczerwieni). W rezul¬ 
tacie może dojść do ogólnej zmiany klimatu. 

W wyniku emisji związków chloru i tlenków azotu, 
które spełniają funkcję katalizatorów w rozpadzie 
ozonu może nastąpić naruszenie równowagi ozono¬ 
wej w górnej stratosferze. Ozon ma duże znaczenie 
w bilansie cieplnym górnej stratosfery, który z kolei 
może mieć pośredni wpływ na cyrkulację troposferycz- 
ną; ponadto ozon pochłaniając aktywne biologicznie 
promieniowanie nadfioletowe ma znaczenie ochron¬ 
ne dla istot żywych. Jednocześnie jego bezwzględna 
zawartość w atmosferze jest tak mała, że już obecna 
aktywność przemysłowa człowieka, a zwłaszcza loty 
samolotów stratosferycznych (wydzielanie pary wod¬ 
nej i tlenków azotu w spalinach) mogą spowodować 
znaczące zmiany jego koncentracji. 

Odpowiedzi na pytania związane z ewolucją i sta¬ 
bilnością klimatu względem różnego rodzaju zakłóceń 
szuka się przeprowadzając eksperymenty obliczeniowe 
na modelach matematycznych atmosfery. Są to mo¬ 
dele w zasadzie podobne do stosowanych w celach 
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Rys. 12. Zmiany koncentracji CO* w okresie 195B-75 r. 


prognozy deterministycznej. Ponieważ czas obliczeń 
nie ma w tym wypadku znaczenia podstawowego, 
można stosować znacznie bogatsze układy równań 
uwzględniające bardziej złożone sprzężenia między 
procesami atmosferycznymi. Ponadto nie jest już 
istotne uzyskanie właściwej prognozy na konkretny 
termin, lecz odtworzenie statystycznych własności 
pogody w dłuższym przedziale czasu, wobec czego 
trudności omówione poprzednio w związku z pro¬ 
blemem przewidywalności atmosfery odgrywają tu 
mniejszą rolę. Obecnie istnieje wiele tego rodzaju mo¬ 
deli, na których przeprowadza się liczne eksperymen¬ 
ty obliczeniowe. Nie dały one dotąd definitywnych 
odpowiedzi na postawione wyżej pytania, ponieważ 
nie wszystkie sprzężenia, które należałoby uwzględnić 
w realistycznych modelach atmosfery, są dostatecznie 
dobrze poznane. Jednakże, wyjaśniając rolę przynaj¬ 
mniej niektórych mechanizmów kształtowania kli¬ 
matu, niewątpliwie uzyskanie tych odpowiedzi przy¬ 
bliżyły. 

Niezależnie od perspektyw globalnych zmian kli¬ 
matu, intensywnie bada się zmiany lokalne powstające 
np. przez zakładanie wielkich zespołów miejskich 
lub kompleksów przemysłowych. W zmianach wa¬ 
runków klimatycznych ma znaczenie nie tylko po¬ 
średni wpływ na naturalne zjawiska atmosferyczne 
(np. własności cieplne asfaltu i betonu, emisja aero¬ 
zoli), ale nawet bezpośrednie efekty energetyczne 
związane z wydzielaniem ciepła i pary wodnej w róż¬ 
nych procesach związanych z życiem i działaniem 
człowieka. 

Poza omówioną wyżej niezamierzoną modyfikacją 
pogody, wiele uwagi poświęca się celowemu oddziały¬ 
waniu na zjawiska atmosferyczne. Kwestia ta miała 
wielu entuzjastów zwłaszcza w latach czterdziestych, 
gdy gwałtowny rozwój różnych gałęzi techniki budził 
czasem zbyt daleko idące nadzieje. W tym czasie po¬ 
wstało niemało projektów ulepszania klimatu czy też 
„poprawiania pogody”. Najbardziej typowymi były 
projekty budowy tam na cieśninach morskich celem 
zmiany cyrkulacji oceanicznej i pośrednio atmosfe¬ 
rycznej, topienie lodów polarnych przez zmianę ich 
albeda lub wielkie prace hydrotechniczno-irygacyjne 
(np. nawodnienie Sahary lub masowe oddziaływanie 
na chmury i opady za pomocą sztucznych jąder kon¬ 
densacji i zamarzania). Proponowano nawet bezpo¬ 
średnie oddziaływanie energetyczne za pomocą energii 
atomowej — co było raczej projektem fantastycznym 
wobec zupełnej dysproporcji między wydajnością do¬ 
stępnych człowiekowi źródeł energii a energią wiel- 
koskalowych procesów atmosferycznych. (Energia 
wyzwalana przy wybuchu bomby wodorowej o mocy 1 
megatony TNT jest rzędu energii wyzwalanej przez 


niewielką burzę). Uświadomienie sobie w latach 
sześćdziesiątych niebezpieczeństw związanych z na¬ 
ruszeniem równowagi środowiska przyrodniczego 
przez uboczne skutki tego rodzaju poczynań technicz¬ 
nych spowodowało odłożenie takich projektów — na¬ 
wet technologicznie realnych —jeżeli nie na zawsze, 
to w każdym razie do czasu znacznie lepszego zrozu¬ 
mienia i przewidywania wszystkich ich konsekwencji. 

Obecnie intensywne badania w dziedzinie modyfika¬ 
cji pogody koncentrują się przede wszystkim na lo¬ 
kalnym oddziaływaniu na chmury i opady (metodami 
wcześniej opisanymi) w celu zapobiegania klęskom 
takim jak: gradobicie, tornado, huragany związane 
z cyklonami tropikalnymi lub w celu poprawienia 
bilansu wodnego na ograniczonych terytoriach. Sama 
technika oddziaływania na chmury jest obecnie prak¬ 
tycznie rzecz biorąc opanowana — niejasny jednak 
pozostaje problem, gdzie i kiedy należy ją stoso¬ 
wać, aby osiągnąć pożądany rezultat, i w jakich wa¬ 
runkach geograficznych i klimatycznych można spo¬ 
dziewać się sukcesów. Reakcje różnych chmur na takie 
oddziaływanie są bowiem wciąż dość nieoczekiwane. 
Jednakże wielki postęp w dziedzinie fizyki chmur 
osiągnięty w ostatnich latach pozwala oczekiwać 
pozytywnych rezultatów również w zakresie operacyj¬ 
nego oddziaływania na chmury i opady. 


Obserwacje i pomiary w atmosferze 

Obserwacje i pomiary zjawisk atmosferycznych — 
poza zjawiskami najmniejszych skal — muszą być 
wykonywane z wielu miejsc i następnie syntetyzowa¬ 
ne w jeden spójny obraz. Oznacza to, że większość 
(są bowiem liczne i ważne wyjątki) obserwacji i po¬ 
miarów musi być wykonywana w ramach systemu, 
w skład którego, poza siecią punktów obserwacyjno- 
pomiarowych, wchodzi organizacja zbierania i prze¬ 
twarzania wyników. Przyrządy pomiarowe są jedynie 
„końcówkami” tego systemu i stanowią w nim za¬ 
zwyczaj najmniej skomplikowane pod względem tech¬ 
nicznym elementy. Przy organizacji sieci konieczne 
jest zapewnienie reprezentatywności obserwacji i po¬ 
miarów (tj. by sposób ich wykonywania zapewniał 
uzyskanie potrzebnej informacji o badanej skali zja¬ 
wiska) oraz ich porównywalności (tj. aby jednakowym 
wynikom pomiaru w różnych punktach odpowiadały 
jednakowe treści fizyczne). 

Rozróżniamy obserwacje i pomiary standardowe 
i specjalne. Obserwacje i pomiary standardowe są to 
obserwacje wykonywane w ramach międzynarodowej 
sieci meteorologicznej i są wykorzystywane przede 
wszystkim przez służby meteorologiczne wszystkich 
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krajów świata. Sieć ta składa się ze stacji meteorolo¬ 
gicznych różnych rzędów o różnym zakresie obser¬ 
wacji i pomiarów — od stacji mierzących jedynie 
opad na ziemi — do stacji aerologicznych, które za 
pomocą tzw. radiosond (ii. 191, tabl. 49), wypuszcza¬ 
nych na balonach i transmitujących swe pomiary na 
ziemię drogą radiową, mierzą pionowe rozkłady tem¬ 
peratury, ciśnienia i wilgotności powietrza oraz wiatru 
do wysokości 20 km i wyżej. Typowe pomiary standar¬ 
dowe obejmują ciśnienie, temperaturę i wilgotność po¬ 
wietrza, wysokość opadu, zachmurzenie, elementy 
promieniowania słonecznego oraz ważniejsze zjawis¬ 
ka pogody. Sposób działania tych stacji jest ściśle 
określony i ujednolicony w ramach danej służby me¬ 
teorologicznej— podejmowane są też wysiłki uzys¬ 
kania daleko posuniętej jednolitości w skali świa¬ 
towej. Jest to jedno z zadań Światowej Organizacji 
Meteorologicznej. 

Standardowe pomiary meteorologiczne muszą być 
przeprowadzane w sposób eliminujący wpływ czynni¬ 
ków ubocznych na pomiar i jednakową metodą na 
wszystkich stacjach w ten sposób, by uzyskać repre¬ 
zentatywną informację o tej skali zjawisk, która ma 
być badana (rys. 13). 



Rys. 13. Klatka meteorologiczna zabezpiecza umieszczone w niej 
przyrządy przed przypadkowymi wpływami zewnętrznymi, ułat¬ 
wiając uzyskanie pomiarów reprezentatywnych i porównywal¬ 
nych 

W wielu rejonach świata występują trudności z za¬ 
pewnieniem odpowiednio kwalifikowanej obsługi dla 
stacji meteorologicznych. Można temu częściowo za¬ 
radzić instalując automatyczne stacje meteorologicz¬ 
ne (rys. 14), które drogą radiową lub kablową prze¬ 
kazują wyniki pomiarów podstawowych parametrów 
meteorologicznych. Do zbierania informacji tych wy¬ 
ników ze stacji położonych w obszarach niezamiesz¬ 
kałych, lub instalowanych na oceanach, można wyko¬ 
rzystać sztuczne satelity telekomunikacyjne. Światowa 
Organizacja Meteorologiczna przywiązuje wielką wa¬ 
gę do rozbudowy sieci stacji tego rodzaju. 

Obserwacje i pomiary specjalne są pomiarami wy¬ 
konywanymi w celach badawczych i sposób ich prze¬ 
prowadzania nie jest zazwyczaj regulowany przepisa¬ 
mi Światowej Organizacji Meteorologicznej lub służby 
państwowej, choć sami naukowcy, którzy je prowa¬ 
dzą, współpracują na ogół z innymi zespołami i starają 
się zapewnić niezbędny stopień porównywalności po¬ 
miarów. Niektóre pomiary i obserwacje specjalne, 
zostają z czasem stopniowo przekształcone w pomiary 
standardowe. 

Pewien przełom w systemie organizacji standardo¬ 
wych obserwacji meteorologicznych zdają się zapo¬ 


wiadać satelity meteorologiczne działające od 1961 r., 
ponieważ są one w stanie zbierać niektóre informacje 
o atmosferze w skali globalnej bez pośrednictwa sieci 
stacji meteorologicznych. Satelity meteorologiczne są 
albo geostacjonarne (ich prędkość kątowa jest iden¬ 
tyczna z prędkością kątową Ziemi, tak że przez cały 
czas znajdują się nad tym samym punktem równika) 
albo mogą poruszać się po różnych orbitach. Zasad¬ 
niczym ich zadaniem jest dostarczenie obrazów za¬ 
chmurzenia (w świetle widzialnym i w podczerwieni), 
które jest ważnym źródłem informacji o różnych zjawi¬ 
skach meteorologicznych. Ilustracja 194 z tabl. 51 
przedstawia mozaikę zestawioną ze zdjęć wykonanych 
przez satelitę Essa 9 poruszającego się na orbicie po¬ 
larnej. Dokonuje się również pomiarów promienio¬ 
wania w wybranych wąskich przedziałach widmo¬ 
wych, w których emitują gazy atmosferyczne — przede 
wszystkim C0 2 i para wodna — na ich podstawie 
próbuje się wyznaczać pionowe rozkłady temperatury 
i wilgotności. Satelity mogą też uzyskiwać informacje 
z obszarów trudno dostępnych (pustynie, oceany),'ma¬ 
jące sieć meteorologiczną niedostatecznie rozwiniętą. 

Wysiłki zmierzające do częściowego zastąpienia sieci 
meteorologicznej (a zwłaszcza bardzo kosztownej w 



eksploatacji sieci aerologicznej) obserwacjami sateli¬ 
tarnymi natrafiają jednak na duże trudności. Wszy¬ 
stkie pomiary wykonywane za pomocą satelitów są 
bowiem pomiarami promieniowania elektromagnety¬ 
cznego. Pomiaryte nie dają się jak dotąd „przetłu¬ 
maczyć” z dostateczną dokładnością na dane o tem¬ 
peraturze, wietrze itp. potrzebne służbie meteorologi¬ 
cznej. Prace w tej dziedzinie są jednak intensywnie 
kontynuowane (il. 195, tabl. 52). 

Za pomocą satelitów uzyskano szereg ważnych in¬ 
formacji o charakterze globalnym (np. dokładne dane 
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Do badań meteorologicznych wykorzystuje się rów¬ 
nież radar. Bada się chmury a zwłaszcza opady, po¬ 
nieważ duże cząstki opadowe silnie odbijają fale ra¬ 
darowe. Obserwacje radarowe pozwoliły m.in. zba¬ 
dać strukturę cyklonów tropikalnych (il. 196, tabl. 52) 
oraz wewnętrzną budowę chmur burzowych, umożli¬ 
wiają też stosunkowo dokładną ocenę ilości opadów 
na niewielkich terytoriach, co ma ogromne znaczenie 
np. dla odpowiedniej gospodarki zbiornikami wod¬ 
nymi. 

Wprowadzone niedawno do użytku w meteorologii 
radary dopplerowskie wyznaczające składowe pręd¬ 
kości namierzanych obiektów w kierunku radaru, 
pozwoliły zbadać rozkład prądów powietrza w chmu¬ 
rach burzowych. Wyznaczono go mierząc prędkości 
ruchu cząstek opadowych z dwóch punktów. Kompu¬ 
ter przekształca następnie te informacje w obraz gra¬ 
ficzny (rys. 16). 

D. Blanchard Od kropel deszczu do wulkanów. Warszawa 
1977; S. P. Chromow Meteorologia i klimatologia , Warszawa 
1977; G. M. B. Dobson Badania atmosfery. Warszawa 1965; 
R.M. Goody Atmosfery planet. Warszawa 1978; T. Kopce w icz 
Atmosfera i hydrosfera w: Ziemia , Warszawa 1977. 


Fizyka przestrzeni okołoziemskiej 

Anarzej Wernik 

przestrzeń Przestrzenią okołoziemską nazywamy obszar wokół 
okołoziemską Ziemi, w którym dominującą rolę odgrywa pole grawi¬ 
tacyjne i magnetyczne Ziemi i który obejmuje jej ga¬ 
zową otoczkę — atmosferę. Pole grawitacyjne Ziemi 
podlega powszechnemu prawu grawitacji, a więc siła, 
z jaką oddziałuje na inne ciała, maleje odwrotnie pro¬ 
porcjonalnie do kwadratu odległości. Teoretycznie 
więc — sfera oddziaływania Ziemi przez pole grawi¬ 
tacyjne rozciąga się do nieskończoności. Jednak na 
bardzo dużych odległościach od Ziemi siła, z jaką jej 
pole grawitacyjne działa na ciało o małej masie, mo¬ 
że być znacznie mniejsza od sił grawitacji innych 
masywnych ciał, takich jak Słońce czy planety. Przyj¬ 
mujemy więc, że granica grawitacyjnego oddziaływa¬ 
nia Ziemi znajduje się w odległości, w której pole gra¬ 
witacyjne innych ciał niebieskich dominuje nad polem 
ziemskim. Warunek ten spełniony jest w odległości ok. 

8* 10 6 km od środka Ziemi. Jeżeli przyjmiemy, że pole 
magnetyczne Ziemi jest polem dipola, to musimy rów¬ 
nież przyjąć, że natężenie jego maleje odwrotnie pro¬ 
porcjonalnie do sześcianu odległości, a więc teore¬ 
tycznie także nie ma granic. Praktycznie, ograniczo- 
magnetosfera ne jest jednak do obszaru tzw, magnetosfery, która 
się rozciąga w kierunku Słońca na odległość równą 
ok. dziesięciu promieniom Ziemi, czyli 6-10 4 km. 

Oprócz pól grawitacyjnego i magnetycznego prze¬ 
strzeń okołoziemską wypełnia materia — atmosfera, 
której struktura zależy od wysokości nad powierzch- 

atmosfera nią Ziemi (tabl. 7, il. 21). Od wysokości zależy jej 
gęstość, temperatura i skład chemiczny. Pod wpły¬ 
wem ultrafioletowego i rentgenowskiego promienio¬ 
wania Słońca pewna liczba molekuł i atomów ulega 
dysocjacji i jonizacji. Na obie składowe: neutralną 
(molekuły, atomy) i zjonizowaną (jony, elektrony) 
działają różnorodne siły, które się zmieniają w czasie 
i przestrzeni, nieraz w bardzo skomplikowany spo¬ 
sób. Jednocześnie w atmosferze, podobnie jak w mag- 
netosferze, występują cząstki naładowane pochodzenia 
słonecznego, meteory z Układu Słonecznego i promie¬ 
niowanie kosmiczne powstające w Galaktyce. Zatem 
w przestrzeni okołoziemskiej zachodzi wiele skompli¬ 
kowanych procesów fizycznych, warunkujących kom¬ 
pleks zjawisk obserwowanych na powierzchni Ziemi 
i na pokładach sztucznych satelitów. Wyjaśnienie wie¬ 
lu problemów fizyki przestrzeni okołoziemskiej zaw¬ 
dzięczamy postępom techniki satelitarnej i rakieto¬ 
wej oraz rozwojowi takich działów fizyki jak fizyka 
plazmy czy fizyka procesów zderzeń cząstek. 
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W dalszym ciągu przedstawimy pokrótce aktualny 
stan badań przestrzeni okołoziemskiej. Nie będziemy 
jednak rozważać struktury warstw atmosfery dostęp¬ 
nych dla pomiarów tradycyjnych z powierzchni Ziemi 
ani procesów w nich zachodzących. Jako poziom roz¬ 
graniczający przyjmiemy wysokość 300-350 km, na 
której koncentracja cząstek naładowanych jest mak¬ 
symalna. Czytelników zainteresowanych fizyką warstw 
atmosfery leżących poniżej tej wysokości odsyłamy 
do artykułu Fizyka atmosfery. Tam też czytelnik znaj¬ 
dzie wyjaśnienie szeregu pojęć używanych w niniej¬ 
szym artykule. 

Atmosfera na wysokości powyżej 300 km 

Gaz otaczający Ziemię, czyli atmosferę, charaktery¬ 
zuje gęstość, ciśnienie, temperatura i skład chemicz¬ 
ny. Do wyznaczenia wartości tych parametrów na 
interesujących nas wysokościach najczęściej stosuje 
się metodę opartą na badaniu zmian kształtu orbit sa¬ 
telitów. Opiszemy pokrótce tę metodę. Satelita poru¬ 
sza się wokół Ziemi nie w próżni, lecz w atmosferze, 
która stawia pewien opór, hamuje satelitę. Oczywiś¬ 
cie hamowanie będzie tym większe, im większy jest sa¬ 
telita i jego prędkość oraz im gęstsza jest atmosfera 
(wpływ hamowania w atmosferze na orbitę satelity 
obrazuje rys. 1). Pomiary zmian okresu obrotu sa¬ 
telity oraz wysokości apogeum i perigeum pozwalają 
na określenie gęstości atmosfery na wysokości, gdzie 
hamowanie jest największe, a więc na wysokości peri¬ 
geum. Badając orbity wielu satelitów (do 1974 r. 



Rys. 1. Zmiana kształtu orbity satelity ina skutek hamującego 
działania atmosfery ( p perigeum, a apogeum 



Rys. 15. Rozkład prądów powietrza w chmurze burzowej wy¬ 
znaczony za pomocą radaru dopplerowskiego. Strzałki przed¬ 
stawiają wektory prędkości prądów powietrznych wg skali prą¬ 
dowej w m/s 

o bilansie radiacyjnym) jak i mezoskalowym — w 
przedziale skal 10-1500 km, które są poniżej zdol¬ 
ności rozdzielczej standardowej sieci meteorologicznej. 
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zbadano przeszło 3000 satelitów) o różnych wysokoś¬ 
ciach perigeum wyznaczono gęstość na wysokościach 
od 120 do kilkuset kilometrów, zbadano również zmia¬ 
ny gęstości w ciągu dnia, jej zależność ód pory roku 
i aktywności Słońca. Znając gęstość i skład chemicz¬ 
ny atmosfery na określonej wysokości i zakładając, 
że atmosfera zachowuje się jak gaz idealny, można 
wyznaczyć jej temperaturę. Rezultatem takich pomia¬ 
rów było stwierdzenie, że gęstość atmosfery jest naj¬ 
większa po południu, a najmniejsza w drugiej połowie 
nocy. Różnica między gęstością w dzień i w nocy roś¬ 
nie ze wzrostem wysokości. Tak np. na wysokości 
200 km gęstość w dzień jest 1,5 razy większa niż 
gęstość v/ nocy, ale na wysokości 600 km dzienna at¬ 
mosfera jest ok. 8-10 razy gęstsza niż nocna. Podobnie 
w ciągu doby zmienia się temperatura, chociaż różni¬ 
ce nie przekraczają 50%. Na interesujących nas wyso¬ 
kościach, tzn. powyżej 300 km, temperatura w nie¬ 
wielkim stopniu zależy od wysokości; waha się ona 
w granicach od ok. 1000 K w nocy do 1300 K w dzień. 
Jednocześnie temperatura w znacznym stopniu zale¬ 
ży od aktywności Słońca, wykazuje więc zmiany z o- 
kresem rotacji Słońca (27 dni) i cyklem 11-letnim. 
W okresie dużej aktywności Słońca temperatura wy¬ 
sokich warstw atmosfery może osiągać w ciągu dnia 
2000 K. 

Różnice gęstości i temperatury między dniem i nocą 
powodują powstawanie wiatrów w atmosferze. Jak 
mówiliśmy, w południe zarówno gęstość, jak i tempe¬ 
ratura są największe, zatem duże też jest ciśnienie. 
Stosując nomenklaturę meteorologów, powiedzieli¬ 
byśmy, że jest to obszar „wyżu”. Jednocześnie, na nie 
oświetlonej części kuli ziemskiej panuje „niż”. Wiemy, 
że gaz napływa z miejsc o wysokim ciśnieniu i stara 
się zapełnić miejsca o niskim ciśnieniu. Ten prze¬ 
pływ gazu jest właśnie wiatrem. Tak więc w górnej 
atmosferze ciągle wieją wiatry. Gdyby oprócz różni¬ 
cy ciśnień nie istniały żadne inne czynniki wpływa¬ 
jące na kierunek i siłę wiatru, wiatr w atmosferze 
miałby przed południem kierunek ku zachodowi, a po 
południu — ku wschodowi. W rzeczywistości ruch 
obrotowy Ziemi ze wschodu na zachód powoduje, że 
wiatry popołudniowe są silniejsze od przedpołudnio¬ 
wych. Istotnym czynnikiem wpływającym na prędkość 
i kierunek wiatru jest tzw. unoszenie jonami. Chodzi 
mianowicie o to, że obie składowe atmosfery, neutral¬ 
na i zjonizowana, nie mogą się poruszać niezależnie 
od siebie; zderzają się ze sobą, przekazując sobie na¬ 
wzajem pewną prędkość. Jednak ruch jonów nie jest 
swobodny. Mogą się one poruszać jedynie wzdłuż linii 
sił pola magnetycznego Ziemi. Na ruch cząstek 
naładowanych wpływa bowiem pole magnetyczne 
Ziemi, wskutek czego poruszają się one po spirali 
„nanizanej” na linie sił pola. Zderzając się ze sobą, 
jony nadają atomom prędkość w kierunku pola ma¬ 
gnetycznego. Składowa prędkości jonów prostopadła 
do pola powoduje jedynie ruch periodyczny pojedyn¬ 
czych atomów wokół linii sił pola, lecz nie przesuwa 
mas gazu. W zderzeniach z atomami jony nadają 
atomom prędkość w kierunku pola magnetycznego. 
W rezultacie wiatr cząstek neutralnych odchyla się 
w kierunku pola magnetycznego. Układ wiatrów 
w atmosferze na wysokości 300 km przedstawiony jest 
na rys. 2. Prędkości wiatrów, zwłaszcza w nocy, są 
bardzo duże, przekraczają niekiedy 200 m/s. Oznacza 
to, że element gazu atmosferycznego może przewędro¬ 
wać tysiące kilometrów w ciągu jednego dnia. 

Co jest przyczyną ogrzewania atmosfery do tem¬ 
peratury wyższej niż 1000 K? Znaczne różnice tem¬ 
peratury między dniem i nocą oraz wyższe temperatu¬ 
ry w dzień sugerują, że źródłem ogrzewania atmosfe¬ 
ry jest Słońce. Na wysokościach powyżej 300 km głów¬ 
nym mechanizmem ogrzewania jest pochłanianie 
(absorpcja) ultrafioletowego promieniowania Słońca. 
Mechanizm przekazywania energii promieniowania 
cząsteczkom gazu jest w zasadzie prosty. Pochłaniane 
promieniowanie słoneczne wzbudza molekuły i atomy 
oraz wywołuje dysocjację molekuł i jonizację atomów. 



czas lokalny 


Rys. 2. Układ wiatrów na wysokości 300 km wraz z układem 
izobar na tej wysokości (W' wyż, N niż). Kierunek i długość 
strzałek obrazuje kierunek i wartość prędkości. Długość odcinka 
(u dołu z lewej strony) odpowiada prędkości 200 m/s 

Wzbudzone, zdysocjowane i zjonizowane molekuły 
oraz atomy zderzają się z otaczającymi cząsteczkami 
gazu i przekazują im nadwyżkę energii uzyskaną w wy¬ 
niku absorpcji promieniowania. Zwiększa się energia 
kinetyczna cząsteczek gazu, co jest równoważne ze 
wzrostem temperatury gazu. 

Na dużych wysokościach gęstość gazu jest mała, 
a zatem ilość pochłanianego promieniowania jest 
niewielka i atmosfera powinna nagrzewać się nieznacz¬ 
nie. A przecież, jak mówiliśmy, temperatura na dużej 
wysokości, powiedzmy 1000 km, prawie się nie różni 
od temperatury na wysokości 100 km. Otóż okazuje 
się, że na dużych wysokościach atmosfera jest bardzo 
dobrym przewodnikiem ciepła. Tak więc ciepło 
nagromadzone w dolnych jej partiach rozprzestrzenia 
się szybko w górę i ogrzewa gaz do temperatury rów¬ 
nej temperaturze na mniejszych wysokościach. 

Jakie cząstki neutralne mogą występować w górnych 
warstwach atmosfery? Odpowiedź na to pytanie daje 
rys. 3, na którym pokazano, jak się wraz z wysokością 
zmienia skład chemiczny atmosfery ziemskiej. Zau¬ 
ważmy, że powyżej 800 km dominują lekkie atomy tle¬ 
nu, helu i wodoru, podczas gdy powyżej 1400 km za¬ 
sadniczymi składnikami atmosfery są już tylko hel 
i wodór. Gęstość ich jest mała, a więc atom helu lub 
wodoru może przelecieć znaczną odległość, zanim się 
zderzy z innym atomem. Odległość ta, tzw. średnia 
droga swobodna, wynosi ok. 180 m na wysokości 
400 km, ale na wysokości 1000 km wynosi aż 7 km. 



Rys. 3. Rozkład z wysokością ważniejszych składników chemicz¬ 
nych atmosfery (podana jest liczba cząstek w 1 cm 3 ) 
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Między zderzeniami atom porusza się jedynie w polu 
ciężkości Ziemi. Zależnie od prędkości tory atomów 
mogą mieć różny kształt. Gdy prędkość atomu jest 
mała, porusza się on po elipsie i jest jakby mikrosko¬ 
pijnym satelitą Ziemi. Gdy prędkość atomu jest duża, 
jego energia kinetyczna może się okazać większa niż 
energia potencjalna, którą ma w polu grawitacyjnym 
Ziemi, a wówczas atom może uciec ze sfery przyciąga¬ 
nia Ziemi i może się stać jednym z atomów przestrzeni 
międzyplanetarnej. Prędkość, przy której obie energie, 
kinetyczna i potencjalna, są równe, nazywa się pręd- 
II prędkość kością ucieczki lub II prędkością kosmiczną i na wy- 
kosmiczna sokości 1000 km wynosi 10,4 km/s. Co najmniej taką 
właśnie prędkość musi mieć nie tylko atom, ale i ra¬ 
kieta kosmiczna, aby dotrzeć do innych planet. 

Cząstki uciekają z całej atmosfery, nie tylko z wy¬ 
sokich jej warstw. Jednak na małych wysokościach 
bardzo małe jest prawdopodobieństwo znalezienia 
cząstki o wystarczająco dużej energii, ponieważ tem¬ 
peratura atmosfery jest zbyt niska. Warunki sprzyjają¬ 
ce ucieczce atomów istnieją jedynie na wysokościach 
powyżej 600 km. Tę część atmosfery nazywamy egzo- 
egzosf era sferą. Wskutek ciągłej ucieczki lekkich atomów z egzo- 
sfery mogłoby po pewnym czasie dojść do tego, że 
w atmosferze w ogóle nie byłoby atomów wodoru i he¬ 
lu. Istnieją jednak bogate źródła tych atomów. Na 
przykład helu dostarcza radioaktywny rozpad ciężkich 
atomów, takich jak uran, tor i rad, występujących 
w pewnej obfitości w skorupie ziemskiej. Tak utwo¬ 
rzony hel dyfunduje w górne partie atmosfery. Źród¬ 
łem wodoru w atmosferze jest para wodna i metan. 
Mimo iż występują one głównie w troposferze i stra- 
tosferze, mogą dyfundować do wysokości, na których 
ultrafioletowe promieniowanie Słońca powoduje ich 
dysocjację. Powstałe czyste atomy wodoru wobec 
małego ciężaru łatwo się rozprzestrzeniają do bardzo 
dużych wysokości. 

cząstki Znaczną część egzosfery stanowią cząstki nałado- 
naładowane wane — jony i elektrony. Ich koncentracja w egzo- 
w atmosferze sferze zmniejsza się znacznie wolniej niż koncentracja 
cząstek neutralnych. Mniej więcej powyżej 1000 km 
jest już w 1 cm 3 więcej jonów i elektronów niż czą¬ 
stek neutralnych. Na tych wysokościach dominują¬ 
cymi cząstkami neutralnymi są atomy helu i wodoru, 
a większość jonów stanowią jony helu He+ i wodoru 
H + (protony). Od pewnej wysokości koncentracja H + 
jest większa od koncentracji He + . Obszar atmosfery 
protonosfera powyżej tej wysokości (ok. 1200 km) nazywamy pro- 
tonosferą. Koncentracja cząstek zjonizowanych w 
protonosferze maleje stopniowo, aby w pewnej od¬ 
ległości od Ziemi gwałtownie spaść z liczby 100 elek¬ 
tronów do 1 elektronu w 1 cm 3 . Miejsce, w którym 
plazmopauza następuje skok koncentracji, nazywa się plazmopauzą. 

O przyczynie skoku koncentracji mówić będziemy 
w następującym rozdziale, poświęconym magneto- 
sferze. Odległość do plazmopauzy jest taka jak odle¬ 
głość do linii siły ziemskiego pola magnetycznego, 
która przecina płaszczyznę równika w odległości 
równej czterem promieniom Ziemi (2-10 4 km). Mó¬ 
wimy, że plazmopauza leży w odległości L = 4. Sy- 



Rys. 4. Schematyczny przekrój przez magnetosferę w płaszczyź¬ 
nie prostopadłej do równika 
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tuację tę obrazuje rys. 4. Naszkicowano na nim kilka 
linii sił pola i zaznaczono obszar poniżej plazmo¬ 
pauzy, tzw. plazmosferę. Plazmosfera obejmuje oczy¬ 
wiście jonosferę, egzosferę i protonosferę. Jak widać 
z rysunku, wysokość plazmopauzy jest mniejsza na 
dużych szerokościach geomagnetycznych. 

Procesem fizycznym o bardzo istotnym znaczeniu 
w fizyce atmosfery jest dyfuzja cząstek naładowanych. 
Elektrony jako cząstki najlżejsze mają tendencję do 
„wypływania” na „powierzchnię” atmosfery. Jednak 
działa na nie przyciągająca siła elektrostatyczna do¬ 
datnio naładowanych jonów. Tak więc elektrony, 
„wypływając”, jednocześnie wyciągają jony na większe 
wysokości. Powoduje to zmianę rozkładu wysoko¬ 
ściowego cząstek naładowanych. Na dużych wyso¬ 
kościach jest ich więcej niż wówczas, gdyby proces 
tej dyfuzji nie odgrywał roli (np. poniżej 300 km). 
Dyfuzja cząstek naładowanych może się odbywać 
tylko wzdłuż linii pola magnetycznego. Stąd wnio¬ 
skujemy, że w pobliżu równika magnetycznego, gdzie 
linie pola są równoległe do powierzchni Ziemi, dy¬ 
fuzja nie zmienia rozkładu wysokościowego cząstek. 
Proces .dyfuzji może powodować przepływ elektro¬ 
nów i jonów między jonosferą i protonosferą. 
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Magnetosfera 

Do 1960 r. sądzono, że ziemskie pole magnetyczne 
mało się różni od pola dipola magnetycznego (—► 

Magnetyzm ziemski), jedynie w okresie dużych roz¬ 
błysków na Słońcu jego kształt ulega zmianie. Roz¬ 
ważania teoretyczne i pomiary wykonywane za po¬ 
mocą aparatury umieszczonej na pokładach sateli¬ 
tów ziemskich zmusiły do zrewidowania pojęć o 
kształcie pola magnetycznego Ziemi. W rzeczywisto¬ 
ści struktura pola magnetycznego wygląda najpraw¬ 
dopodobniej tak, jak to przedstawia prawa strona 
rys. 5. Do odległości równej kilku promieniom Ziemi 
pole geomagnetyczne ma rzeczywiście kształt taki, 
jak pole dipola. W większych odległościach na pole 
magnetyczne oddziałuje strumień cząstek (elektro¬ 
nów, protonów i jonów helu) wypływający ze Słoń¬ 
ca. Strumień ten, napotykając przeszkodę w postaci 
pola magnetycznego Ziemi, „naciska” na nie i de¬ 
formuje je. Ciśnienie wiatru słonecznego jest bardzo 
małe i wynosi ok. 2*10~* Pa. Polu magnetycznemu 
można również przypisać pewne ciśnienie związane 
z naprężeniem linii pola. Maleje ono szybko wraz z od¬ 
ległością. Odległość, na której jest ono równe ciśnie¬ 
niu wiatru słonecznego, określa granicę pola magne¬ 
tycznego Ziemi, tzw. magnetopauzę. Magnetopauza roagnefo- 
nie styka się bezpośrednio z wiatrem słonecznym, p ai » 2 a 
lecz oddzielona jest od niego warstwą, w której prze¬ 
pływ cząstek wiatru ma charakter turbulentny. Obszar 
wewnątrz magnetopauzy nazywamy magnetosferą. 

Od strony Słońca magnetopauza leży w odległości 
ok. 10 promieni Ziemi (6-10 4 km). Po nocnej stronie 
Ziemi odległość do magnetopauzy jest rzędu kilkuset 
promieni ziemskich. Jest to tzw. ogon magnetosfery ogon mag- 
(rys. 5). W obszarze ogona, w płaszczyźnie równika netosfery 
magnetycznego, obserwuje się podwyższenie kon¬ 
centracji cząstek naładowanych — warstwę plazmo¬ 
wą. Pole magnetyczne w warstwie plazmowej jest 
bardzo słabe i na stronie północnej ma kierunek ku 
Ziemi, a na stronie południowej — od Ziemi. W pła¬ 
szczyźnie równika natężenie pola jest równe zeru. 

Po dziennej stronie magnetopauzy, w tzw. punktach 
neutralnych, następuje rozdzielenie linii sił pola 
magnetycznego: część z nich biegnie przez płaszczyznę 
równika ku przeciwnemu biegunowi, część zaś ku 
ogonowi magnetosfery. Wewnątrz magnetosfery 
znajdują się pasy promieniowania, zwane także pa- pasy 
sami Van Allena (od nazwiska uczonego, który je promionio- 
odkrył, mierząc na satelitach strumienie cząstek wania 
o dużych energiach). Umownie rozróżniamy dwa pa¬ 
sy: wewnętrzny, leżący na linii siły pola magnetycz¬ 
nego, która przecina równik w odległości 1,5 pro- 










mienia Ziemi (L # 1,5) i zewnętrzny — w odległości Wiatr słoneczny opływający magnetosferę wywo- 
L sz 3-4). Należy jednak zauważyć, że granica między łuje pole elektryczne skierowane z zachodu na wschód 
pasami nie jest ostro zaznaczona. Wewnętrzny pas 'i zw. polem elektrycznym konwekcji. Ponieważ w róż- 
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Rys. 5. Porównanie kształtu pola magnetycznego Ziemi bez wiatru słonecznego (z lewej strony) i z wiatrem słonecznym (z prawej 
strony) (przekrój płaszczyzną prostopadłą do równika geomagnetycznego, przechodzącą przez linię Słońce-Ziemia) 


promieniowania składa się z protonów o energiach 
równych dziesiątkom i setkom MeV. W zewnętrznym 
pasie dominują elektrony o energiach od dziesiątków 
keV do kilku MeV. Koncentracja cząstek w zewnętrz¬ 
nym pasie jest bardzo mała, całkowita ich masa nie 
przekracza 15 kg. Strumienie elektronów w zewnętrz¬ 
nym pasie promieniowania silnie fluktuują, wskutek 
czego zmienia się natężenie pola magnetycznego na 
powierzchni Ziemi. Cząstki uwięzione są w pasach 
promieniowania i poruszają się po skomplikowanych 
torach (rys. 6), przy tym ruch jonów i ruch elektronów 
odbywają się we wzajemnie przeciwnych kierun¬ 
kach. 



Rys. 6. Tory cząstek w magnetosferze. Protony dryfują na za¬ 
chód, elektrony na wschód 


Przypomnijmy znany fakt, że ruch przewodnika 
w polu magnetycznym prowadzi do powstania pola 
elektrycznego prostopadłego do kierunku ruchu 
i kierunku pola. Natomiast przewodnik umieszczony 
w skrzyżowanych polach elektrycznym i magnetycz¬ 
nym zostaje wprawiony w ruch w kierunku prosto¬ 
padłym do obu pól. Plazma w przestrzeni okołoziem- 
skiej jest przewodnikiem w polu magnetycznym Zie¬ 
mi. Jej ruchowi towarzyszyć więc będzie pole elek¬ 
tryczne i odwrotnie — pole elektryczne spowoduje 
ruch plazmy. 

Po tej uwadze omówimy zjawisko konwekcji mag- 
netosferycznej i przyczyny powstania skoku koncen¬ 
tracji elektronów na granicy plazmosfery. 


nych modelach magnetosfery mechanizm generacji 
tego pola jest różny, nie będziemy go szerzej omawiali. 
Pole elektryczne konwekcji przenosi się bez strat 
wzdłuż linii sił pola geomagnetycznego do wewnątrz 
magnetosfery i plazmosfery. Jego natężenie jest duże 
w pobliżu magnetopauzy, a więc tam, gdzie parametr 
L jest duży. W warunkach spokojnych magnetycznie 
osiąga ono wartość 20 mV/m, a w czasie burz magne¬ 
tycznych nawet 120 mV/m, lecz szybko maleje w mia¬ 
rę oddalania się od magnetopauzy. Pole konwekcji 
wraz z polem geomagnetycznym powodują ciągły 
ruch plazmy wewnątrz magnetosfery w kierunku od 
ogona, czyli od strony nocnej do dziennej. Można 
więc mówić o cyrkulacji plazmy w magnetosferze: 
w pobliżu magnetopauzy wiatr słoneczny unosi plaz¬ 
mę do ogona magnetosfery, skąd dzięki polu kon¬ 
wekcji przedostaje się ona do wnętrza magneto¬ 
sfery. 

W przestrzeni okołoziemskiej oprócz pola elek¬ 
trycznego konwekcji występuje pole elektryczne ko- 
rotacji. Wskutek lepkości plazma w przestrzeni oko¬ 
łoziemskiej rotuje razem z Ziemią. Ruch plazmy 
w polu geomagnetycznym powoduje powstanie pola 
elektrycznego. Charakter zależności zmian natężenia 
tego pola od parametru L jest zupełnie inny niż dla 
pola konwekcji. Natężenie pola korotacji mało za¬ 
leży od L (aż do L x 4) i wynosi ok. 15 mV/m. Ale 
jeśli L jest większe od 4, natężenie pola korotacji 
szybko maleje. 

Istnienie pól konwekcji i korotacji warunkuje po¬ 
wstanie skoku koncentracji elektronów na granicy 
plazmosfery. Tam, gdzie natężenie pola korotacji jest 
większe od natężenia pola konwekcji, gęstość plazmy 
powinna być większa niż w obszarze, w którym do¬ 
minuje pole konwekcji. Istotnie, pole konwekcji jest 
przyczyną cyrkulacji magnetosferycznej, która po¬ 
woduje, że cząstki uciekają do ogona magnetosfery, 
a następnie w przestrzeń międzyplanetarną. Ich kon¬ 
centracja jest więc mniejsza niż koncentracja cząstek 
w obszarze, w którym natężenie pola korotacji jest 
wystarczająco duże. A zatem możemy przyjąć, że 
plazmopauza jest powierzchnią, na której pola elek¬ 
tryczne konwekcji i korotacji są równe. Poniżej pla- 
zmopauzy dominuje pole korotacji, powyżej zaś — 
pole konwekcji. 
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Burze magnetyczne i zorze polarne 

Pole magnetyczne Ziemi często jest zaburzone. Prze¬ 
jawia się to w postaci zmian amplitudy składowych 
pola magnetycznego rejestrowanych na magnetogra- 
mach na powierzchni Ziemi (—► Magnetyzm ziemski). 
Jeżeli amplituda zmian jest bardzo duża, mówimy o 
burzy magnetycznej. Typowym przykładem magneto- 
gramu otrzymanego w czasie burzy magnetycznej 
jest rys. 7. Obrazuje on jedynie zmiany składowej po¬ 
taży burzy ziomej (horyzontalnej) H. Burza często zaczyna się 
magnetycznej skokiem natężenia pola magnetycznego. Mówimy 
wówczas o „nagłym początku burzy” (SC na rys. 7). 
Po nagłym początku, przez kilka godzin natężenie 
pola jest duże. Jest to początkowa faza burzy ( DCF ). 
Po kilku godzinach rozpoczyna się główna faza burzy, 
którą charakteryzuje znaczny spadek natężenia pola 
(Z)/?l). Z chwilą osiągnięcia minimum natężenie pola 
powraca powoli do wartości, jaką miało przed burzą 
(DR2). Niekiedy natężenie pola w czasie głównej fazy 
burzy silnie maleje, dając efekty oznaczone na rysunku 
literami DP. 
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Rys. 7. Przykład magnetogramu uzyskanego w czasie burzy mag¬ 
netycznej (pokazano tylko składową poziomą H pola magnetycz¬ 
nego). Czas Jiczony jest od momentu , .nagłego początku burzy” 
(SC). Skala zmian uwidoczniona jest z prawej strony (1 y = 
= 10-»T) 


Jak wytłumaczyć te zjawiska? Przyczyną burz ma¬ 
gnetycznych są zaburzenia na Słońcu. W wyniku roz¬ 
błysku na Słońcu odrywa się od niego obłok plazmy, 
która jest gęstsza i porusza się szybciej niż plazma 
w spokojnym” wietrze słonecznym. W ciągu 1-2 dni 
obłok taki dociera w pobliże Ziemi. W momencie 
zetknięcia się jego z magnetosferą zostaje ona w spo¬ 
sób nagły, impulsowy zaburzona. Powstaje fala ude¬ 
rzeniowa (-> Fale uderzeniowe), która rozchodzi się 
w magnetosferze, czego efektem jest nagły początek 
burzy (SC). Następnie plazma obłoku opływa magne- 
tosferę i powstają prądy płynące po powierzchni ma- 
gnetopauzy. Prądy te zmieniają natężenie pola magne¬ 
tycznego wewnątrz magnetosfery, co się przejawia 
w postaci początkowej fazy burzy (DCF). Aby wy¬ 
jaśnić główną fazę burzy, należy założyć, że w magne- 
. , P r ą d Y tosferze płyną prądy pierścieniowe. Powinny one 

pierscienio- płynąć ku zachodowi, by się zmniejszyła składowa 
we horyzontalna pola magnetycznego (zgodnie z „regułą 
lewej ręki”). W rzeczywistości musimy przyjąć, że 
istnieją dwa prądy pierścieniowe: silny, odpowie¬ 
dzialny za zmiany DRl, którego natężenie szybko 
wzrasta i który znika w ciągu jednego dnia, oraz słaby 
(DR2), którego natężenie maleje powoli. Przypuszcza 
się, że prądy pierścieniowe są wynikiem wstrzyknięcia 
do magnetosfery protonów o małych energiach, które 
następnie zmuszone są do ruchu po torach przedsta¬ 
wionych na rys. 6. Miejscem, w którym cząstki wstrzy¬ 
kiwane są do magnetosfery, jest prawdopodobnie jej 
ogon, ale problem ten nie jest w pełni wyjaśniony. 
Na rys. 8 prąd pierścieniowy przedstawiony jest w po¬ 
staci grubych strzałek. Rozpływa się on ku obszarom 
polarnym, wzdłuż linii sił pola geomagnetycznego. 
W obszarze polarnym prądy wzdłuż linii pola zamy¬ 
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kają się ńa wysokości jonosferycznej warstwy E , prąd 
tworząc prąd zorzowy (DPI), zaznaczony (rys. 8) zorzowy 
grubą strzałką na powierzchni kuli wyobrażającej 
Ziemię. Płynie on w wąskim (rzędu 400 km) i cienkim 
(kilka km) pasie wokół biegunów magnetycznych. 

Po stronie dziennej prąd płynie ku zachodowi, po 
stronie nocnej — ku wschodowi, a zatem w dzień po¬ 
woduje zmniejszenie się składowej H , w nocy zaś — 
jej zwiększenie. 



Rys. 8. Rozkład prądów w magnetosferze typowy dla burzy mag¬ 
netycznej. Strzałki pokazują prąd pierścieniowy, który rozpływa 
się wzdłuż linii sił pola magnetycznego do jonosfery polarnej, 
tworząc tam prąd zorzowy 


Drugi rodzaj prądu (DP2) — to układy prądów wi- prądy 
rowych w jonosferze płynących po stronie wschodniej wirowe 
i zachodniej, głównie na dużych szerokościach geo¬ 
magnetycznych. Efekt ich widoczny jest również na 
średnich szerokościach. Powstanie tych prądów zwią¬ 
zane jest z konwekcją magnetosferyczną. 

Należy jeszcze wspomnieć o efekcie, który spowo¬ 
dowany jest dużym przewodnictwem elektrycznym 
plazmy, a polega na tym, że linie sił pola magnetycz¬ 
nego poruszają się razem z plazmą, są w nią „wmro- 
żone”. Tak więc z ruchem konwekcyjnym plazmy 
magnetosferycznej związany jest ruch linii sił pola. 

Bierze w nim udział cała linia siły łącznie z częścią 
wnikającą do jonosfery. „Przyczepione” są do niej 
elektrony i jony. Jednak praktycznie biorąc, tylko 
elektrony mogą uczestniczyć w ruchu linii sił. Jony 
bowiem są hamowane przez zderzenia z cząstkami 
neutralnymi. W rezultacie elektrony, unoszone liniami 
sił pola magnetycznego wprawionymi w ruch ruchami 
konwekcyjnymi plazmy magnetosferycznej, poruszają 
się w jonosferze względem prawie nieruchomych jo¬ 
nów. Powstaje więc prąd płynący w kierunku prze¬ 
ciwnym do ruchu linii sił pola. Ponieważ w obszarach 
polarnych konwekcja ma kierunek od Słońca, przeto 
linie sił przemieszczają się od Słońca, a prąd płynie 
ku Słońcu. W miarę przechodzenia do coraz mniej¬ 
szych szerokości geomagnetycznych kierunek ruchu 
plazmy w magnetosferze coraz bardziej odchyla się 
od kierunku od Słońca i na średnich szerokościach 
przybiera już kierunek ku Słońcu. W efekcie również 
prąd w jonosferze zmienia kierunek. Powstają dwa 
układy prądów wirowych. Na rys. 8 są one zaznaczone 
cienkimi strzałkami na powierzchni Ziemi. Układy 
prądów DPI i DP2 wywołują zmiany pola magnetycz¬ 
nego oznaczone na rys. 7 literami DP. 

Bardzo spektakularnym zjawiskiem, występującym 
w okresie burz magnetycznych na dużych szeroko¬ 
ściach geomagnetycznych, są zorze polarne (tabl. 6, zorze 
ił. 20). Zielone i czerwone obłoki, promienie lub dra- polarne 
perie pobudzały wyobraźnię ludzką od najdawniej¬ 
szych czasów. Jednak na wyjaśnienie mechanizmu 
powstawania zórz musieliśmy czekać aż do dwudzie¬ 
stego wieku. Jest rzeczą pewną, że zorze to świecenie 
atmosfery wywołane bombardowaniem elektronami 
o energii rzędu kilkudziesięciu keV. Cząstki te wzbu¬ 
dzają atomy, które — wracając do stanu podstawo¬ 
wego— wypromieniowują energię w postaci kwantów 
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światła. Powstaje pytanie, skąd się biorą cząstki o ta¬ 
kiej energii w atmosferze. Na rys. 5 zaznaczono obszar 
leżący poza pasami promieniowania i łączący się 
z ogonem magnetosfery. Obszar ten, zrzutowany 
wzdłuż linii sił pola magnetycznego na powierzchnię 
Ziemi, daje dwa pasy otaczające bieguny magnetyczne. 
Nazywamy je „owalami zorzowymi 1 '. Owale przy¬ 
bliżają się do bieguna (do ok. 78° szerokości) w dzień, 
a oddalają (do ok. 68° szerokości) w nocy. Położenie 
owalu względem Słońca nie zmienia się. Gdy Ziemia 
rotuje, owal przechodzi przez różne obszary jej po¬ 
wierzchni. Na przykład nocna część owalu zatacza 
okrąg położony na szerokości ok. 68°. Ten pas na 
Ziemi nazywa się strefą zorzową, tu zorze występują 
najczęściej. Nocna część owalu łączy się z ogonem 
magnetosfery. Z ogona, albo nawet spoza magneto¬ 
sfery (ale przez ogon), cząstki przedostają się do bliż¬ 


szych Ziemi obszarów magnetosfery. W czasie wę¬ 
drówki w ogonie są one przyspieszane i gdy dochodzą 
wreszcie do granic atmosfery, mogą mieć energie wy¬ 
starczająco duże na to, aby wywołać zjawisko zorzy 
polarnej. 

Na zakończenie możemy tylko wspomnieć, że 
z burzami magnetycznymi i zorzami polarnymi wiąże 
się wiele zjawisk, np. wzrost pochłaniania fal radio¬ 
wych, powstawanie nieregularności koncentracji jo¬ 
nów i elektronów w jonosferze, okresowe, o małej 
amplitudzie pulsacje pola magnetycznego, spadek 
natężenia promieniowania kosmicznego (efekt For- 
busha —► Promieniowanie kosmiczne). 

A. D. Daniłow Chemia , atmosfera, kosmos. Warszawa 1976; 
F. Delobeau The Environment of the Earth , Dordrecht-Holland 
1971; P. Oberc Magnetosfera , ActaGeophys. Pol. 18,103(1970); 
H. Rishbeth.O. K. Garriott Introduction to lonospheric Physics, 
New York 1969. 


Magnetyzm ziemski 

Magdalena Kądzialko-Hofmokl 


Kilkaset lat przed naszą erą zauważono zjawiska, 
które dzisiaj określa się mianem zjawisk magnetycz¬ 
nych. W miarę upływu czasu i przybywania danych 
obserwacyjnych powstała nauka o magnetyzmie ziem¬ 
skim, z której z kolei wyodrębniły się bardziej szcze¬ 
gółowe dyscypliny, zajmujące się takimi zagadnie¬ 
niami jak stałe pole magnetyczne, paleomagnetyzm, 
zmienne pole magnetyczne, indukcja elektromagne¬ 
tyczna we wnętrzu Ziemi. 

Pierwszych odkryć związanych ze zjawiskami ma¬ 
gnetycznymi dokonali Chińczycy; już w starożytnych 
Chinach znane były przyciągające własności skały 
zawierającej magnetyt. Przypuszcza się również, że 
Chińczycy'znali kierunkowe składowe pola magne¬ 
tycznego Ziemi. Najwcześniejszy, z 720 r. n.e., znany 
opis wyznaczania deklinacji magnetycznej pochodzi 
również z Chin. Pierwszym instrumentem wykorzy¬ 
stującym zjawisko deklinacji był kompas, znany praw¬ 
dopodobnie od czasów starożytnych. Najdawniejszy 
opis tego instrumentu, sporządzony w Europie, po¬ 
chodzi dopiero z 1190 r., a jego autorem jest angielski 
mnich, Aleksander Neckam. 

Przez długie lata uważano, że kąt deklinacji za¬ 
leży od używanego instrumentu. Dopiero dokładne 
pomiary tego kąta, dokonywane w połowie XVI w. 
w różnych punktach kuli ziemskiej przez portugal¬ 
skiego żeglarza Joao da Castro, wykazały ostatecznie, 
że deklinacja zależy od miejsca, w którym się doko¬ 
nuje pomiaru. W XVI wieku zauważono (G. Hart- 
mann, R. Norman), że igła kompasu tworzy pewien 
kąt z płaszczyzną horyzontu — było to odkrycie in¬ 
klinacji magnetycznej. 

Z upływem czasu przybywało informacji o zjawi¬ 
skach związanych z magnetyzmem ziemskim. W1600 r. 
ukazało się dzieło Wiliama Gilberta De Magnete ... 
(O magnesie, ciałach magnetycznych i największym 
magnesie — Ziemi), w którym Gilbert wykazał, że 
pole magnetyczne Ziemi ma takie cechy jak pole jed¬ 
norodnie namagnesowanej kuli, przy czym położenie 
biegunów magnetycznych Ziemi pokrywa się z po¬ 
łożeniem jej biegunów geograficznych. Wnioski Gil¬ 
berta miały ogromne znaczenie dla rozwoju nauki 
o polu geomagnetycznym. Oprócz wyjaśnienia dekli¬ 
nacji i inklinacji Gilbert wykazał, że źródeł pola mag¬ 
netycznego Ziemi należy szukać w jej wnętrzu, a nie 
poza nią. Z czasem okazało się, że wniosek Gilberta 
jest słuszny nie w odniesieniu do całego pola geomag¬ 
netycznego, lecz do jego przeważającej części, zwanej 
stałym polem geomagnetycznym. Na stałe pole mag¬ 
netyczne, pochodzące od źródeł znajdujących się we 
wnętrzu Ziemi, nakłada się bowiem zmienne pole 
magnetyczne, którego źródła znajdują się w prze¬ 
strzeni pozaziemskiej. 


Natężenie pola magnetycznego F mierzone na po¬ 
wierzchni Ziemi jest wielkością wektorową (właściwie 
wielkością mierzoną jest indukcja magnetyczna, lecz 
przyjęto stosować nazwę pole magnetyczne). Można 
je przedstawić (rys. 1) za pomocą trzech wielkości: 
2 składowych — składowej pionowej Z (mierzonej 
pionowo w dół), składowej poziomej H — oraz dekli¬ 
nacji D (deklinacja magnetyczna jest to kąt pomiędzy 


Rys. 1. Składowe 
całkowitego wektora 
polamag netycznego 

Ziemi F 


północ 

geograficzna północ 
/ magnetyczna 



/ 
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południkiem geograficznym a magnetycznym w miej¬ 
scu obserwacji; mierzy się ją w kierunku wschodnim). 
Innym sposobem przedstawienia pola może być po¬ 
danie wartości całego natężenia pola F , deklinacji D 
i inklinacji/(inklinacja jest to kąt, który tworzy wektor 

Fz poziomem; inklinację mierzoną w dół od poziomu 
uważamy za dodatnią). Rzadziej stosuje się składowe 
X, Y y Z skierowane odpowiednio: X —w kierunku 
północnym, Y —w kierunku wschodnim, Z —pio¬ 
nowo w dół. 


Stałe pole geomagnetyczne 

Ukazanie się traktatu W. Gilberta było przełomo¬ 
wym wydarzeniem w historii magnetyzmu ziemskiego. 
Coraz większa liczba prac o zjawiskach magnetyzmu 
oraz większa liczba danych obserwacyjnych pozwoliły 
w 1839 r. uczonemu niemieckiemu Fryderykowi Gaus¬ 
sowi ująć matematycznie główny wniosek Gilberta, 
czyli przedstawić stałe pole magnetyczne Ziemi 
w pierwszym przybliżeniu jako pole dipola umiesz¬ 
czonego w środku Ziemi i skierowanego wzdłuż jej 
osi obrotu. 

Metoda analizy Gaussa—tzw. analiza sferyczno-harmoniczna 
pola magnetycznego Ziemi — polega na przedstawieniu natężenia 
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metoda tego pola w każdym punkcie na powierzchni Ziemi w funkcji 
analizy ws P<Wrzędnych geograficznych tego punktu. Podstawą analizy są 
r ^ wartości nat< ^ n j a Pola otrzymane w wielu punktach, rozmiesz- 
uaussa czonych możliwie regularnie na powierzchni Ziemi. Z obliczeń 
otrzymuje się natężenie całkowitego wektora F lub jego składo¬ 
wych X f Y,Z w postaci nieskończonych szeregów współczynników 
stałych pomnożonych przez funkcje długości i szerokości geogra¬ 
ficznej. Ograniczając się do kilku pierwszych wyrazów tych szere¬ 
gów, otrzymuje się dla poszczególnych składowych pola w punkcie 
P (rys. 2) wzory: X = -g®sin0-Htf£cos2+A£smiOcos0, 

Y = gjsinź—Ajcos2, Z «= 2[gJcos0+(gJ cosA + A}sinA)sin0J, 

gdzie dla epoki 1955, 0 współczynniki liczbowe wynosiły: g? = 
“ -3,05-10 4 T,gJ = -0,23*10 5 T,A£ = 0,58*10 5 T. Wielkość 0 
jest dopełnieniem szerokości geograficznej punktu P,A — dłu¬ 
gością geograficzną punktu P. Wyrażenia te opisują składowe pola 
jednorodnie namagnesowanej kuli,w tym wypadku kuli ziemskiej, 
i zarazem składowe pola dipola umieszczonego w środku Ziemi 
i skierowanego wzdłuż jej osi obrotu (dipol osiowy). Linie sił pola 
takiego dipola układają się jak na rys. 2 —,.wchodzą’' w głąb 
Ziemi i „wychodzą” z niej w punktach zwanych biegunami. Dalsze 
człony szeregów Gaussa opisują składowe pola niedipolowego. 



Rys. 2. Linie sił pola dipola magnetycznego (n-s) umieszczonego 
w środku Ziemi i skierowanego wzdłuż jej osi obrotu. N biegun 
północny, S biegun południowy, P punkt na powierzchni Ziemi 
o szerokości geograficznej <p i dopełnieniu szerokości geograficz¬ 
nej 0. W przypadku dipola osiowego współrzędne geograficzne 
pokrywają się z geomagnetycznymi, a inklinacja I wiąże się 
z dopełnieniem szerokości 0 następującym wzorem: tg 1 = 2 ctg 0 

Natężenie stałego pola geomagnetycznego stanowi 
ponad 99% natężenia całego pola obserwowanego na 
powierzchni Ziemi. Lepiej niż dipol osiowy opisuje 
je dipol umieszczony również w środku Ziemi, ale 
tworzący kąt 11J5 z jej osią obrotu (rys. 3). Moment 
magnetyczny takiego dipola wynosi 8-10 ls Tm 3 . (Mo¬ 
ment magnetyczny kuli o powierzchni 1 m 2 wykona- 
pole nej z miękkiego żelaza wynosi ok. 1 * 10~ 4 Tm 3 ). Pole, 
dipolowe które on wytwarza, opisuje ok. 90% pola stałego. 

Pozostałe 10% to wspomniane już pole niedipolowe, 
o nieregularnym rozkładzie na powierzchni Ziemi. 

Stałe pole magnetyczne, mimo że nosi nazwę sta¬ 
łego, ulega powolnym zmianom. Obecnie istnieje na 
świecie ponad 150 obserwatoriów magnetycznych 
prowadzących ciągłą rejestrację poszczególnych skła¬ 
dowych. Poza tym co kilka lat przeprowadza się po¬ 
miary pola geomagnetycznego w określonych punk¬ 
tach, zwanych wiekowymi. Materiał obserwacyjny 
uzupełniają pomiary dokonywane ze statków na ocea¬ 
nach i morzach oraz z samolotów na różnych wyso- 
punkty kościach nad powierzchnią Ziemi. Dane obserwa- 
wiekowe cyjne są podstawą do sporządzania co kilka lat świa¬ 
towych map poszczególnych składowych pola magne¬ 
tycznego. Wyniki uzyskane w obserwatoriach w po¬ 
staci ciągłego zapisu poszczególnych składowych po¬ 
la geomagnetycznego — magnetogramu (rys. 25) — 
zawierają zarówno część stałą pola, jak i zmienną 
Aby otrzymać składowe tylko pola stałego, uśrednia 
się wyniki obserwacji dotyczące jakiegoś okresu — 
otrzymy- najczęściej jest to okres jednego roku. Tę wartość 
wanie średnią, zwaną w tym wypadku średnią roczną, otrzy- 
wartości muje się obliczając kolejno średnie godzinne, dobowe, 
ćrednich miesięczne i — na końcu — roczne, przy czym odrzu- 
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ca się wyniki obserwacji dokonanych podczas dni 
szczególnie zaburzonych magnetycznie. Otrzymana 
w ten sposób średnia roczna wartość pola nie zawiera 
zmian godzinnych, dobowych ani sezonowych. Po¬ 
nieważ, o czym będzie mowa później, na wymienione 
tu zmiany nakładają się zmiany związane z okreso¬ 
wym występowaniem plam na Słońcu (okres ok. 11 
lat), czasem oblicza się średnie wartości pola dla 
10-letnich przedziałów czasu. Średnie wartości otrzy¬ 
mane dla jakiegoś przedziału czasu przypisuje się 
momentowi wypadającemu w środku tego przedzia- 



Rys. 3. Dipol magnetyczny umieszczony w środku Ziemi, nachy¬ 
lony pod kątem 11°5 względem jej osi obrotu. Na rysunku są 
zaznaczone bieguny geograficzne północny i południowy (N i S) t 
bieguny geomagnetyczne, czyli miejsca przecięcia osi dipola z po¬ 
wierzchnią Ziemi, oraz bieguny magnetyczne, czyli miejsca, w któ¬ 
rych inklinacja magnetyczna / wynosi +90° (biegun północny) 
I —90° (biegun południowy). Południowy biegun dipola jest 
skierowany w stronę półkuli południowej, a biegun północny — 
w stronę północnej. A zatem z punktu widzenia fizyki na półkuli 
geograficznej południowej znajduje się północny biegun magne¬ 
tyczny, a na półkuli północnej — południowy. Jednak ze względu 
na tradycję i wygodę przyjęto nazwy i oznaczenia zgodne z naz¬ 
wami geograficznymi. Na rysunku zaznaczony jest również rów¬ 
nik geograficzny, geomagnetyczny i magnetyczny. Analogicznie 
do współrzędnych geograficznych wprowadzono współrzędne 
geomagnetyczne: szerokość geomagnetyczna punktu jest to kąt, 
który tworzy wektor wodzący poprowadzony ze środka Ziemi 
do tego punktu z płaszczyzną równika geomagnetycznego, a dłu¬ 
gość geomagnetyczna jest to kąt,który tworzy południk geomag¬ 
netyczny przechodzący przez dany punkt z południkiem przecho¬ 
dzącym przez biegun geograficzny. Obecnie bieguny geomagne¬ 
tyczne zajmują następujące położenia: biegun geomagnetyczny 
północny 78°5 N70°1V, biegun geomagnetyczny południowy 
78?5 S UQ°E (bieguny geomagnetyczne leżą naprzeciwko siebie). 
Położenia biegunów magnetycznych były w tym czasie następu¬ 
jące: biegun magnetyczny północny 75?5 N, biegun mag¬ 

netyczny południowy 66 °S lAO°E (bieguny magnetyczne nie leżą 
naprzeciwko siebie) (wg M. W. Mc Elhinny Paleomagnetism and 
piąte tectonics , Cambridge 1973) 


łu; moment taki nazywa się epoką. Przeprowadzając 
analizę sferyczno-harmoniczną pola dla jakiejś epoki, 
wykorzystuje się również, jak wspomniano, wyniki 
jednorazowych pomiarów składowych pola. I tu rów¬ 
nież uwzględnia się poprawki na pole zmienne, ko¬ 
rzystając w tym celu z rezultatów uzyskanych w naj¬ 
bliższych obserwatoriach. Na rys. 4a, b, c, przedsta¬ 
wiono mapę izogon (linie jednakowej deklinacji), 
izoklin (linie jednakowej inklinacji) i izodynam (linie 
jednakowego natężenia składowej H) dla epoki 
1965,0. Widoczne na rys. 4a punkty, w których się 
zbiegają izogony, to bieguny magnetyczne, północny 
N i południowy S. Na biegunie północnym inklinacja 
wynosi -f 90°, a na południowym —90°, składowa po¬ 
zioma H w miejscu biegunów wynosi zero. Charakte¬ 
rystyczną linią widoczną na mapie izoklin jest linia 
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równika magnetycznego (oznaczona kolorem czar¬ 
nym — grubo), wzdłuż której inklinacja jest 0. 

W 1947 r. ukazało się zestawienie danych obserwa¬ 
cyjnych za lata 1905-1945. Autorzy przedstawili wy¬ 
niki analizy numerycznej, przeprowadzonej metodą 
Gaussa, dla wielu epok na zebranym materiale. Od 
tej pory zaczęto wykonywać podobne analizy co kilka 
lat. Jednym z najciekawszych i chyba najistotniejszych 
rezultatów tych prac jest możliwość rozdzielenia sta¬ 
łego pola na części dipolową i niedipolową. Rysunek 
5 przedstawia rozkład pola niedipolowego na po¬ 
wierzchni Ziemi w epoce 1945,0. Cechą tego pola jest 
widoczna na rysunku obecność centrów, wokół któ¬ 
rych układają się izolinie. Pole niedipolowe osiąga w 
centrach maksymalne amplitudy, sięgające 1,5 10~ 5 



4 -*^--V i uuuuiiuw 

pola niedipolowego (wg D. H. Tarling Principles ąnd Applica - 
lions of Paleomagnetism , London 1971) 
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T. Obszary o średnicach wielu tysięcy kilometrów anomalie 
wokół centrów nazwano anomaliami regionalnymi, regionalne 
Szczegółowe pomiary pola geomagnetycznego w po¬ 
szczególnych rejonach kuli ziemskiej wykazują, że 
istnieją obszary, w których wartość pola jest znacznie 
wyższa (lub niższa) niż w obszarach sąsiednich. Są to 
tzw. lokalne anomalie magnetyczne związane z wystę¬ 
powaniem skał o dużej zawartości minerałów magne- 



Rys. 6. Zmiany wiekowe deklinacji magnetycznej w Gdańsku 
wg obserwacji J. Retyka (1539), Anonima (1600), J. Heweliusza 
(1628, 1635, 1642, 1670, 1667?, 1682) i E. Halleya (1679) (wg 
T. Olczak Jan Heweliusz i magnetyzm ziemski , Postępy Astro¬ 
nomii, 3 65,1955) 








































































































































zmiany 

wiekowe 


nacji magnetycznej w Gdańsku zestawiona przez 
T. Olczaka na podstawie obserwacji z lat 1539-1679. 

Wiele cennych danych o deklinacji magnetycznej do¬ 
starczają zegary słoneczne i instrumenty astronomicz¬ 
ne. Zarówno na jednych, jak i na drugich twórcy 
bądź uczeni, którzy z nich korzystali, zaznaczali kąt 
deklinacji właściwy dla miejsca budowy lub użytko¬ 
wania instrumentu. Z wykresów zmian deklinacji czy 
inklinacji w długich okresach czasu widać, że zmiany 
te są cykliczne. Na rys. 7 przedstawiona jest krzywa 
zmian wiekowych deklinacji i inklinacji dla Londynu 
od 1540 do 1960 r. Przebieg krzywej wskazuje, że 
okres zmian wynosi ok. 400 lat. Obecnie wyróżnia się 
kilka typów zmian wiekowych, o okresach rzędu kilku 
tysięcy, kilkuset i kilkudziesięciu lat. Ze szczegóło¬ 
wych badań części dipolowej i niedipolowej stałego 
pola wynika, że ulegają one zmianom wiekowym. 

W ciągu ostatnich 100 lat natężenie pola dipolowego 
malało o ok. 0,04% rocznie i pole przesuwało się 
w kierunku zachodnim ok. 0°05 w ciągu roku. Zja¬ 
wisko to nazwano dryfem zachodnim pola niedipo- cłryf 
lowego. Pole niedipolowe zmieniało swoje natężenie zachodni 
mniej systematycznie, w jednych okresach rosło, 
w innych znów malało. W 1950 r. E. Bullard i in. zau¬ 
ważyli, że pole niedipolowe przesuwa się na zachód 
z prędkością 0°18 rocznie. 

Zmiany wiekowe poszczególnych składowych, po¬ 
dobnie jak same składowe, wygodnie jest przedstawić 
w postaci map izolinii, zwanych izoporami. Mapy izopory 
izopor różnych epok zestawili po raz pierwszy E. 

Vestine i in. w 1947 r. Jedną z wykonanych przez nich 
map przedstawia rys. 8. I tu, podobnie jak na mapie 
pola niedipolowego, zwracają uwagę charaktery¬ 
styczne centra, w środku których zmiany wiekowe 
przybierają szczególnie duże wartości. Centra te na¬ 
zwano ogniskami izopor. W pięciu z nich zmiany 
składowej pionowej przekraczają 10~ 7 T/rok. Po- 




Rys. 8. Zmiany wiekowe składowej pionowej dla epoki 1922,5 w nanoteslach na rok (wg M. H. P. Bott The Interior o) the Earth, London 
1971) 


849 


tycznych. Przykładami takich anomalii są anomalia 
kurska oraz anomalie w północnej Szwecji. Głębo¬ 
kości źródeł wywołujących anomalie lokalne nie prze¬ 
kraczają 25 km, podczas gdy źródła pól niedipolo¬ 
wego i dipolowego znajdują się nieporównanie głę¬ 
biej, bo poniżej 2900 km. O pochodzeniu pola stałego 
będzie mowa przy końcu następnego paragrafu. 

Średnie roczne wartości poszczególnych składo¬ 
wych pola stałego, otrzymywane w opisany wyżej 
sposób, zmieniają się w miarę upływu czasu. Długo¬ 
okresowe zmiany pola nazwano zmianami wiekowy¬ 
mi. W 1634 r. angielski uczony H. Gellibrand zauwa¬ 
żył, że deklinacja mierzona w Londynie zmienia się 
wraz z czasem. Przed Gellibrandem zmiany dekli¬ 
nacji magnetycznej obserwował już Jan Heweliusz 
(1611-1687), wybitny astronom z Gdańska. Na rys. 6 
przedstawiona jest krzywa zmian wiekowych dekli- 


deklinacja 
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równanie map izopor dla różnych epok wykazało, że 
ogniska przesuwają się w kierunku zachodnim z pręd¬ 
kością ok. 0°2 rocznie. A zatem słuszny był wyrażony 
już w 1692 r. przez Edmunda Halleya pogląd, że zmia¬ 
ny wiekowe są wywołane dryfem zachodnim pola 
niedipolowego. 

W tym miejscu należy zauważyć, że przedstawiony 
powyżej podział pola geomagnetycznego na części 
dipolową i niedipolową jest umowny i nie ma sensu 
fizycznego, pozwala jednak na łatwiejsze przedsta¬ 
wienie własności pola stałego. 


Paleomagnetyzm 


Kilkadziesiąt lat temu zaczęła się gwałtownie rozwijać 
nowa dziedzina magnetyzmu ziemskiego — paleo¬ 
magnetyzm, nauka zajmująca się polem magnetycz¬ 
nym Ziemi w przeszłości geologicznej. Przedmiotem 
badań są skały, które w pewnych warunkach mogą 
pałeomagne- przechowywać informacje o natężeniu i kierunku pola 
tyzm i geomagnetycznego panującego w okresie ich powsta- 
archeomag- wania. Dziedziną pokrewną paleomagnetyzmowi jest 
netyzm archeomagnetyzm — nauka zajmująca się ziemskim 
polem magnetycznym w przeszłości historycznej i pre¬ 
historycznej, wykorzystująca wyniki badań wypala¬ 
nych glin. 

Dzięki paleomagnetyzmowi można poznawać nie 
tylko przeszłość pola magnetycznego Ziemi, ale i sa¬ 
mej Ziemi. Wyniki badań są niejednokrotnie podsta¬ 
wą do przyjęcia lub odrzucenia jakiejś hipotezy geo¬ 
fizycznej czy geologicznej. Chociaż paleomagnetyzm 
jako nauka zaczął się rozwijać stosunkowo niedawno, 
to jednak początki jego sięgają czasów starożytnych. 
We wstępie była już mowa o odkryciu w starożytnych 
Chinach skały magnetytowej i jej własności. Jedną 
z najważniejszych dat w historii paleomagnetyzmu 
jest rok 1797, kiedy to wielki uczony niemiecki Alek¬ 
sander Humboldt zauważył, że igła kompasu jest przy¬ 
ciągana przez skały w wierzchołkowych partiach gór 
Palatynatu Reńskiego. A. Humboldt zupełnie słusznie 
przypuszczał, że te silnie magnetyczne skały zawdzię¬ 
czają swoje właściwości uderzeniu piorunu. W 1849 r. 
A. Delesse, a następnie w 1853 r. M. Melloni stwier¬ 
dzili, że młode lawy wulkaniczne są namagnesowane 
równolegle do kierunku pola geomagnetycznego. 
Systematyczne badania namagnesowania skał zapo¬ 
czątkował w dwudziestych latach naszego wieku 
R. Chevallier swoimi pracami nad lawami Etny wy¬ 
lanymi w czasach historycznych. 


Pozostałość magnetyczna skał 

pozostałość Zjawiskiem będącym podstawą paleomagnetyzmu 

magnetyczna J est zdolność pewnych skał do uzyskiwania pozosta¬ 
łości magnetycznej o kierunku pola działającego na 
skałę w okresie jej powstawania. Mierząc wektor po¬ 
zostałości magnetycznej, można otrzymać wartości 
kątów deklinacji i inklinacji dawnego pola w miejscu, 
w którym się znajduje badana skała. Następnie, przy 
założeniu, że pole geomagnetyczne było zawsze po¬ 
lem dipola umieszczonego w środku Ziemi i skierowa¬ 
nego wzdłuż jej osi obrotu, można znaleźć położenie 
bieguna magnetycznego w okresie powstawania skały. 

właściwości * ak w y że J wspomniano, informacje o polu geomagnetycznym 
w dawnych epokach geologicznych są zachowane przez skały. 
Stwierdzenie to należy jednak uściślić: do badań paleomagnetycz- 
Skał nych stosuje się skały zawierające minerały magnetyczne. Właści¬ 
wości magnetyczne skały zależą od ilości i rodzaju zawartych w 
niej minerałów tego typu. W zależności od pochodzenia skały 
można podzielić na: skały magmowe (wylewne, np. bazalt, i głę¬ 
binowe, np. granit), skały osadowe (np. piaskowce, wapienie) 
i skały zmetamorfizowane (np. gnejsy, marmury). Większość skał 
zawiera pewną ilość minerałów magnetycznych. Mianem tym 
określa się minerały o różnej budowie, zarówno ferrimagnetyki, 
jak i nieskompensowane antyferromagnetyki. Minerały ferri- 
magnetyczne zawierają jony żelaza dwu- i trójwartościowego 
ułożone w dwóch regularnych podsieciach w taki sposób, że 
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wektory momentów magnetycznych obu podsieci są antyrówno- 
ległe. Wypadkowy moment magnetyczny ferrimagnetyków jest 
różny od zera, ponieważ momenty magnetyczne tych podsieci nie 
są równe. W nieskompensowanych antyferromagnetykach war¬ 
tości momentów są takie same, ale wektory momentów nie są 
wzajemnie równoległe, lecz nachylone względem siebie pod pew¬ 
nym kątem. Wzajemne ustawienie momentów magnetycznych w 
obu typach minerałów jest przedstawione na rys. 9. 
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Rys. 9. Wzajemne ustawienie momentów magnetycznych: a) w 
ferrimagnetykach, b) w nieskompensowanych antyferromagne¬ 
tykach 


W przyrodzie najczęściej spotyka się następujące minerały 
magnetyczne: 

tytanomagnetyty (ferrimagnetyki) — minerały z szeregu mag¬ 
netyt (Fe a 0 4 )-ulwospinel (ułvit) (Fe 2 Ti0 4 ), 

hemotfmenity — minerały z szeregu hematyt (a-Fe 2 0 3 )-ilme- 
nit (FeTiO*), o strukturze romboedralnej, 

tytanomaghemity — tytanomagnetyty z defektami sieci krysta¬ 
licznej, 

wodorotlenki żelaza, np. getyt, a FeOOH, pirotyny FeS t +* 
(0 ^ x ^ 0,14). 

Spośród wymienionych minerałów największą wartość namag¬ 
nesowania nasycenia ma magnetyt — ok. 4,5* 10-* T. Wartości 
namagnesowania nasycenia tytanomagnetytów są tym mniejsze, 
im więcej tytanu zawiera minerał. Maghemit charakteryzuje nieco 
mniejsze niż magnetyt namagnesowanie nasycenia 4*10-* T. W 
miarę wzrostu zawartości tytanu (czyli w minerałach szeregu 
tytanomaghemitowego) wartość tego momentu maleje. Hematyt, 
jako antyferromagnetyk z pasożytniczym ferromagnetyzmem, ma 
znacznie niższe namagnesowanie nasycenia, 0,5-2,5* 10~ 4 . T. 
Najsilniej magnetyczne są te minerały z szeregu hemoilmenito- 
wego, które zawierają 55-75% ilmenitu, tzw. ferriilmenity (fer¬ 
rimagnetyki). Minerały magnetyczne charakteryzuje, podobnie 
jak wszystkie materiały o własnościach magnetycznych, pewna 
krytyczna temperatura, tzw. temperatura Curie w wypadku fer- 
rimagnetyków lub temperatura Nćela w wypadku antyferroma¬ 
gnetyków. Powyżej tej temperatury materiały stają się parama- 
gnetykami. Temperatura Curie czystego magnetytu wynosi ok. 
575°C i maleje ze wzrostem zawartości tytanu do ok. — 200°C 
dla ulwospinelu. Temperatura Nćela hematytu oraz Curie czy¬ 
stego maghemitu wynosi ok. 675°C. W miarę wzrostu zawartości 
tytanu odpowiednie temperatury minerałów obu szeregów maleją. 
Znajomość temperatury Curie (lub Nćela) badanej skały pozwala 
stwierdzić, jakie minerały znajdują się w jej frakcji magnetycznej. 

Pozostałość magnetyczną, którą uzyskują w czasie 
swojej historii geologicznej skały zawierające mine¬ 
rały magnetyczne, nazwano naturalną pozostałością 
magnetyczną — NRM (ang. natural remanent magne- 
tization). NRM składa się na ogół ze składowej pier¬ 
wotnej, uzyskanej przez skałę w okresie jej powsta¬ 
wania, i ze składowych wtórnych, powstałych w czasie 
historii geologicznej skały. W skałach magmowych 
składowa pierwotna NRM jest przeważnie pochodze¬ 
nia termicznego; ten typ pozostałości powstaje pod¬ 
czas stygnięcia skały w ziemskim polu magnetycznym, 
od temperatur wyższych niż temperatura Curie (lub 
Nćela) minerałów magnetycznych do temperatur niż¬ 
szych od tej wartości. Pierwotna pozostałość magne¬ 
tyczna w skałach osadowych jest wynikiem osadzania 
w ziemskim polu magnetycznym ziaren minerałów 
magnetycznych. Każde ziarno ma już jakąś pozosta¬ 
łość magnetyczną, ziemskie pole jest tylko czynnikiem 
porządkującym. 

W wypadku skał przeobrażonych (zmetamorfizo- 
wanych) trudno mówić o określonym typie pozosta¬ 
łości. Historia tych skał jest zbyt skomplikowana, by 
można ją było odtworzyć na podstawie badań ich wła¬ 
sności magnetycznych. Dlatego przy badaniach 
paleomagnetycznych na ogół nie bierze się ich pod 
uwagę. 

Na pierwotną część naturalnej pozostałości magne¬ 
tycznej nakładają się prawie zawsze składowe wtórne, 
które powstają w wyniku działania różnych czynników 
fizykochemicznych, jak np. gorące roztwory, długo¬ 
trwałe podwyższenie temperatury, utlenianie, magne¬ 
sujące działanie obecnego pola geomagnetycznego. 
Uzyskane w ten sposób wtórne pozostałości mają inne 
kierunki niż kierunek składowej pierwotnej i pierw¬ 
szym krokiem w badaniach paleomagnetycznych jest 
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„oczyszczenie” NRM z tych składowych. W 1958 r. 
J. A. As i J.D.A. Zijderveld zastosowali po raz pierw¬ 
szy metodę usuwania wtórnych składowych działając 
na próbki skał zmiennym polem magnetycznym 
o malejącej amplitudzie. W przeważającej większości 



Rys. 10. Rozkład kierunków NRM po oczyszczeniu dla próbek 
skal bazaltowych z Ligoty Tulowickiej kolo Opola. Położenie 
bieguna dla Ligoty Tulowickiej <p ' = 66°N> A' *= J 8S°JE7. Każde 
kółeczko przedstawia kierunek trwalej pozostałości magnetycznej 
dla jednej próbki. Średni kierunek otrzymany dla całej kolekcji 
wynosi D m : 183°, Im : —44°. Krzyżykiem zaznaczono kierunek 
obecnego pola geomagnetycznego w miejscu pobrania próbek 
(wg J. Kruczyk, M. Kądziałko-Hofmokl, M. Jeleńska Origin 
of Magnetic Minerals and Natural Remanent Magnet ization of 
Basałtic Rocks from Lower Silesia, Roland , Pure and Applied 
Geophysics, vol. 110, IX, 2031, 1973) 


biegun N 



Rys. 11. Wyznaczanie współrzędnych geograficznych bieguna 
paleomagnetycznego P na podstawie średniego kierunku pozo¬ 
stałości magnetycznej Dm, Im skał oraz współrzędnych geogra¬ 
ficznych miejsca pobrania próbek S. X długość geograficzna 
w punkcie S , <p szerokość geograficzna w punkcie 5, X' długość 

geograficzna bieguna, <p' szerokość geograficzna bieguna. M 
dipol magnetyczny Ziemi w okresie powstania badanych skał. 
Jak widać z rysunku współrzędne geograficzne bieguna — dłu¬ 
gość X ' i geograficzna szerokość <p' wiążą się z kierunkiem pola 
Dm> Im czyli średnim kierunkiem pozostałości magnetycznej całej 
kolekcji oraz współrzędnymi geograficznymi miejsca pobrania 
próbek X i <p następującymi wzorami: 

sinA' = sinA cosp + cosA sin/? cos£> (—90° ^ X* < -f90 c ) 
ę* = gdy cos/? ^ sin A sin A' 
lub 

<p’ — p + 180°—/? gdy cos/? < sin A sin A', 

gdzie 

sin/? = sin p sin D/cos X* (—90° < ^ +90°), 

p dopełnienie szerokości geograficznej miejsca pobrania próbek 
w okresie powstawania skały, p wiąże się z inklinacją I wzorem 
tg I = 2ctg p (wg M. W. Mc Elhinny Paleomagnetism and piąte 
tectonics , Cambridge 1973) 


wypadków okazało się, że składowe te są znacznie 
mniej stabilne niż składowa pierwotna. Metoda roz- 
magnesowywania zmiennym polem magnetycznym 
jest obecnie powszechnie stosowana. Jednocześnie 
korzysta się również z metody oczyszczania termicz¬ 
nego, która polega na grzaniu próbek do coraz wyż¬ 
szej temperatury i chłodzeniu do temperatury poko¬ 
jowej. Metoda ta również prowadzi do usunięcia 
wtórnych składowych NRM. 

Pozostała po oczyszczeniu najbardziej stabilna 
składowa NRM jest już na ogół składową pierwotną, 
a jej kierunek jest zgodny z kierunkiem pola geoma¬ 
gnetycznego w okresie, w którym powstała badana 
skała. Aby uzyskać możliwie wiarygodną informację 
o kierunku pola w epoce powstawania badanego kom¬ 
pleksu skalnego, trzeba dysponować kolekcją próbek 
liczącą co najmniej 10 okazów. Otrzymane po oczy¬ 
szczeniu kierunki pozostałości magnetycznej próbek 
badanej kolekcji, czyli wartości kątów deklinacji i in¬ 
klinacji, przedstawia się na kołowym wykresie, który 
jest rzutem jednej z półkul na płaszczyznę równika. 
Deklinacja zmienia się wzdłuż obwodu koła od N 
w kierunku ruchu wskazówek zegara od 0° do 360°, 
a inklinacja — wzdłuż promienia od 0° na obwodzie 
do 90° w środku koła. Rysunek 10 przedstawia otrzy¬ 
maną w ten sposób grupę kierunków pozostałości 
magnetycznej kolekcji próbek skał bazaltowych z Li¬ 
goty Tułowickiej pod Opolem. Średni kierunek pier¬ 
wotnej składowej NRM, obliczony ze wszystkich pró¬ 
bek kolekcji, jest przeważnie szukanym kierunkiem 
dawnego pola ziemskiego. Znając go, można odtwo¬ 
rzyć położenie bieguna geomagnetycznego w epoce 
powstawania badanego kompleksu skalnego. Rysu¬ 
nek 11 przedstawia, jak znaleźć położenie bieguna 
paleomagnetycznego ówczesnego pola, znając średni 
kierunek pozostałości magnetycznej skał w danym 
miejscu, czyli kierunek pola geomagnetycznego, w któ¬ 
rym skała uzyskała tę pozostałość. 


Inwersja pola geomagnetycznego 

Odkrycie skał namagnesowanych w kierunku prze¬ 
ciwnym niż obecny kierunek pola geomagnetycznego 
było bardzo ważne dla poznania przeszłości Ziemi 
oraz rozwoju teorii pochodzenia stałego pola ziem¬ 
skiego. Zjawisko to zauważył po raz pierwszy B. 
Brunhes w 1906 r. Z czasem okazało się, że skały 
o odwrotnej naturalnej pozostałości magnetycznej 
występują równie często jak te, które mają normalną 
pozostałość (czyli zgodną z kierunkiem obecnego 
pola). Oba rodzaje NRM występują zarówno wśród 
skał magmowych, jak i osadowych. A zatem powstało 
pytanie, czy pozostałość magnetyczna skały może się 
odwrócić wskutek jakichś procesów fizycznych (sa- 
moodwrócenie), czy też pole magnetyczne zmieniało 
w przeszłości swój kierunek (inwersja pola). 

Pierwszą skałą, przy badaniu której zaobserwowa¬ 
no samoodwrócenie pozostałości magnetycznej, był 
dacyt z góry Haruna (Japonia). Stwierdzono, że skała 
ta uzyskała odwrotną NRM w normalnym polu ziem¬ 
skim i że obserwuje się odwrócenie pozostałości ma¬ 
gnetycznej tej skały w warunkach laboratoryjnych. 
L. Nćel podał kilka możliwych wyjaśnień zjawiska 
samoodwrócenia. Istotę tego zjawiska bardzo dobrze 
tłumaczy najprostszy model. L. Nćel zakłada, że 
w skale występują przerastające się wzajemnie fazy 
magnetyczne o różnych punktach Curie. Faza o wyż¬ 
szym punkcie Curie, stygnąc, ma w normalnym polu 
magnetycznym pozostałość o normalnym kierunku. 
Faza ta wytwarza w obszarze zajętym przez fazę drugą 
pole o kierunku przeciwnym i niekiedy natężenie tego 
pola może przewyższyć natężenie pola geomagnetycz¬ 
nego. Zatem druga faza, stygnąc do temperatur niż¬ 
szych niż jej temperatura Curie, uzyskuje pozostałość 
odwrotną. Jeżeli ta ostatnia dominuje, mamy do czy¬ 
nienia ze skałą o odwrotnej NRM. Jest to wypadek 
oddziaływania magnetostatycznego. Pozostałe me- 
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chanizmy Nćela są bardziej skomplikowane i nie będą 
tu omawiane. Zjawisko samoodwrócenia zostało nie¬ 
jednokrotnie zaobserwowane, ale najczęściej przyczyn 
obserwowanej odwrotnej pozostałości trzeba szukać 
gdzie indziej. Przyjęto więc hipotezę, zgodnie z którą 
większość skał o odwrotnej naturalnej pozostałości 
magnetycznej uzyskała ją w polu ziemskim o bieguno¬ 
wości przeciwnej niż obecnie, czyli w polu, którego 
biegun północny znajdował się na geograficznej pół¬ 
kuli południowej, a południowy — na północnej. 

Aby możliwie dokładnie poznać historię inwersji 
pola geomagnetycznego, korzysta się obecnie z wy¬ 
ników trzech różnych metod: z badań paleomagne¬ 
tycznych dobrze datowanych potoków lawowych 
o dużej miąższości (grubości) oraz skał osadowych, 
z badań skał z rdzeni podmorskich otrzymanych me¬ 
todą wierceń i z badań oceanicznych anomalii magne¬ 
tycznych. Najlepiej znany jest najmłodszy okres ży¬ 
cia Ziemi, czyli ostatnie 4,5 min lat (wiek skał tego 
okresu można określić z największą dokładnością). 
Dzięki tym trzem metodom ustalono skalę geochro- 
nologiczną inwersji w tym okresie (rys. 12). Jak widać, 
oprócz długotrwałych okresów (epok paleomagne¬ 
tycznych) o biegunowości normalnej (N) i odwrotnej 
(jR) zaobserwowano szereg okresów krótszych, trwa¬ 
jących około 10 5 lat, tzw. zdarzeń. Ostatnio stwier¬ 
dzono, że w czasie trwającej obecnie normalnej epoki 
Brunhesa wystąpiły jeszcze krócej trwające inwersje, 
które nazwano wycieczkami bieguna geomagnetycz¬ 
nego. Wystąpiły one 18, 30 i 49 tysięcy lat temu. 

Ze statystycznych opracowań danych paleomagne¬ 
tycznych wynika, że w czasie inwersji biegunowość 
pola zmieniała się o 180° (w granicach błędu) i że okre¬ 
sy normalny i odwrotny są jednakowo prawdopo¬ 
dobne. Próbowano korelować okresy inwersji z in¬ 
nymi zjawiskami geofizycznymi, np. z gwałtownym 
wzrostem natężenia promieniowania kosmicznego, co 
z kolei powinno się odbić w zmianach fauny, ale bada¬ 
nia nie potwierdziły tej hipotezy. 
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Rys. 12. Geochronologiczna skala inwersji dla ostatnich 4,5 mi¬ 
lionów lat. Kolorem białym zaznaczono okresy o normalnej 
biegunowości, czarnym — o odwrotnej. Nazwy epok pochodzą 
od nazwisk, nazwy zdarzeń — od miejsc, w których stwierdzono 
okres o określonej biegunowości (wg D. H. Tarling Principles 
and Applications of Paleomagnetism , London 1971) 
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Interesujący jest okres przejściowy, kiedy to nastę¬ 
puje zmiana kierunku pola. Obecnie nie ma jednolitej 
teorii co do przebiegu inwersji, ale najsłuszniejsze wy¬ 
dają się sugestie A. Chramowa. Według niego kieru¬ 
nek pola oscyluje kilkakrotnie między obydwoma 
stabilnymi położeniami, aż wreszcie ustala się w kie¬ 
runku przeciwnym do poprzedniego. Wiele analiz 
wskazuje również na to, że natężenie pola w okresie 
przejściowym maleje do 0,1-0,3 swojej normalnej 
wartości, a długość trwania okresu przejściowego wy¬ 
nosi prawdopodobnie kilka-kilkanaście tysięcy lat. 


Dryf kontynentów 

Jeżeli byśmy wszystkie istniejące dane dotyczące po¬ 
łożenia biegunów paleomagnetycznych potraktowali 
tak, jakby pole nie zmieniało zwrotu, to by się oka¬ 
zało, że bieguny w najmłodszej epoce życia Ziemi, 
czwartorzędzie (podział na epoki i okresy geologiczne 
znajduje się w tabeli), grupowały się wokół obecnego 
bieguna geomagnetycznego. Inaczej wyglądała sytua¬ 
cja we wcześniejszych epokach geologicznych. Poło¬ 
żenia biegunów paleomagnetycznych nie tylko ulegały 
przesunięciu w stosunku do położenia obecnego bie¬ 
guna, ale i wyniki otrzymane z badań skał z różnych 


Skala geochronologiczna 
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kontynentów różnią się między sobą. Łącząc ze sobą kr2ywe 
uśrednione położenia bieguna w kolejnych okresach wędrówki 
geologicznych otrzymuje się tzw. krzywą wędrówki bieguna 
bieguna geomagnetycznego. Krzywe takie dla siedmiu 
obszarów (Ameryka Pn., Ameryka Pd., Afryka, Eu¬ 
ropa i pn. część Azji, Australia, Indie) przedstawia 
rys. 13. Należy dodać, że dane, na podstawie których 
sporządza się podobne syntezy, nie są ostateczne. 

W miarę zwiększania się liczby wyników i dokład¬ 
ności ich opracowania wprowadza się poprawki, cza¬ 
sem dość istotne. Mimo to prawdziwe pozostaje zja¬ 
wisko przesuwania się w czasie bieguna geomagne¬ 
tycznego względem skorupy ziemskiej oraz fakt, że 
ruch ten jest różny z różnych kontynentów. Próby 
takiego zestawienia danych, by bieguny z różnych ob¬ 
szarów układały się na jednej, wspólnej krzywej, za¬ 
kończyły się przypomnieniem dawnej, liczącej sobie 
kilkadziesiąt lat hipotezy Wegcnera, zgodnie z którą, 
w górnym paleozoiku istniał jeden ląd — Pangea, 
który w erze mezozoicznej i triasie podzielił się na kil¬ 
ka części. Obecnie, w wyniku szczegółowych badań 
geofizycznych i geologicznych, przyjmuje się raczej hipoteza 
hipotezę du Toit wzajemnego ruchu (dryfu) konty- y OI - t 
nentów. Hipoteza du Toit mówi o istnieniu w paleo¬ 
zoiku nie jednego, jak u A. Wegenera, lecz dwóch 
pralądów. Jeden z nich, Gondwana, grupował obszary 
dzisiejszej Ameryki Pd., Afryki, Madagaskaru, Indii, 

Australii i Antarktydy; drugi, Laurazja, składał się 
z dzisiejszej Ameryki Pn., Grenlandii, Europy i Azji 
(bez Indii). Dane paleomagnetyczne wydają się po¬ 
twierdzać hipotezę dwóch pralądów, które w mezo- 
zoiku zaczęły się dzielić na części odpowiadające wy- 
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krzywa wędrówki 
bieguna 

Rys. 13. Krzywe wędrówki bieguna paleomagnetycznego otrzy¬ 
mane na podstawie wyników badań paleomagnetycznych skat 
z Ameryki Północnej, Ameryki Południowej, Europy i północnej 
części Azji, Indii, Australii, Afryki. Współcześnie wszystkie 
krzywe zbiegają się we wspólnym punkcie-biegunie, tm starsza 
epoka geologiczna, tym bardziej są od siebie odległe (K kambr, 
P paleozoik, J jura, C kreda, M mezozoik, E eocen, T trzeciorzęd) 
(wg H. A. Cook Physłcs oj the Ecarth and Planets, Londyn 1973) 


mienionym kontynentom,a tez kolei w miarę upływu 
czasu przesuwały się w kierunku swoich obecnych 
położeń. Jedną z prób rekonstrukcji dawnego wza¬ 
jemnego ułożenia kontynentów przedstawia rys. 14. 
Taki obraz uzyskano dopasowując numerycznie od¬ 
powiednie linie brzegowe. Dzięki przyjęciu hipotezy 
dryfu kontynentów udało się J.C. Bridenowi i A. 
Hallamowi w 1970 r. dopasować kontynenty w po¬ 
dobny sposób i uzyskać wspólną dla nich wszystkich 
krzywą wędrówki bieguna (rys. 15). 

Z badań paleomagnetycznych wynika jeszcze jedna 
informacja dotycząca dryfu kontynentów: ruchy 
dryfowe nie odbywały się stale z tą samą prędkością. 
Dłuższe okresy kwazistatyczne (późny kambr-ordo- 
wik, dewon-dolny karbon, górny karbon-perm) były 
przerywane epizodami dryfowymi. Przypuszcza się, 
że nasileniu dryfu towarzyszyły ruchy górotwórcze. 
Na podstawie współcześnie prowadzonych badań 
astronomicznych dryfu Eurazji i Ameryki M. Feissel 
obliczył, że obecna prędkość rozsuwania się tych kon¬ 
tynentów wynosi 15-10~ 7 stopni/rok (błąd oznaczenia 
7* 10 ~ 7 stopni/rok). 

Spekulacje dotyczące dryfu kontynentów pozosta¬ 
wały w sferze hipotez do ok. 1950 r. Dzięki wynikom 
badań paleomagnetycznych, w latach 1950-60 zaczęto 
tę hipotezę nazywać teorią, ale wciąż nie był znany 
mechanizm, który mógłby powodować ruchy tak 
wielkich bloków, jakimi są kontynenty. Dopiero od 
rozsuwanie ] 931 r ? gdy przyjęto hipotezę rozsuwania się den ocea- 
się den n j CZ nych, zaczęto wyjaśniać zjawiska dryfu poprzez 
oceanicznych 2 j a wisko rozsuwania się den. 

W 1958 r. po raz pierwszy zauważono, że na obsza¬ 
rze Oceanu Spokojnego, a następnie na oceanach 
Atlantyckim i Indyjskim, występują anomalie magne¬ 
tyczne w postaci pasów anomalii na przemian ujem¬ 
nych i dodatnich, o amplitudach przeważnie 2* 10 ~ 7 T- 
4* I0 " 7 T i szerokości kilkudzięsięciu kilometrów. 
Pasy tworzące „żebrowaty” obraz układają się równo¬ 
legle do grzbietów oceanicznych, symetrycznie po obu 
ich stronach. Taki obraz anomalii zaobserwowanych 



Rys. 14. Zrekonstruowane wzajemne położenie kontynentów 
Ameryki Południowej i Afryki oraz Europy i Ameryki Północnej 
przed mezozoikiem (wg A. H. Cook Physics oj the Earth and Pla- 
nełs , London 1973) 



Rys. 15. Wspólna krzywa wędrówki bieguna południowego dla 
okresu od syłuru S do mezozoiku Af poprzez perm P i karbon C 
(gruba krzywa przerywana oznacza przypuszczalne drogi bieguna 
dla Gondwany i Laurazji przed ich połączeniem się w sylurze. 
Cienkie linie przerywane — kierunki rozdzielania się kontynen¬ 
tów począwszy od mezozoiku) (wg M. W. Mc Elhinny Pałeomag - 
netism and piąte tectonics, Cambridge 1973) 
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po obu stronach grzbietu Reykjanes przedstawiają 
rys. 16, 17, 18, 19. Po upływie kilku lat od pierwszych 
obserwacji R.S. Dietz, a później H.H. Hess wyrazili 
pogląd, że w strefach grzbietów tworzy się nowa sko¬ 
rupa ziemska. Materiał z górnego płaszcza Ziemi wy¬ 
dobywa się na powierzchnię wzdłuż grzbietów. Wsku¬ 


tek nacisku dotychczasowa skorupa pęka i rozsuwa 
się na boki, robiąc miejsce nowej. Jednocześnie ze 
stwierdzeniem istnienia w rejonach oceanicznych że¬ 
browatych anomalii zauważono, że próbki skał pocho¬ 
dzące z obszarów tych anomalii mają normalną lub 
odwrotną pozostałość magnetyczną. W 1963 r. F. 



Rys. 16. Morskie anomalie magnetyczne zaobserwowane po obu stronach grzbietu oceanicznego Reykjanes (na południowy zachód 
od Islandii) (rys. 16-19 wg A. H. Cook Physics of the Earth and Piane ts >Y.oa<ioi\ 1973) 


34° 30° 26° 22° 



Rys. 17. Zmiany natężenia pola geomagnetycznego zarejestro¬ 
wane wzdłuż kilku profili biegnących prostopadle do linii grzbie¬ 
tu. Grzbiet jest zaznaczony literą A. Numery 1...5 oznaczają 
kolejne anomalie dodatnie (powyżej linii zerowej odpowiadającej 
średniej wartości pola w badanym rejonie) i ujemne (poniżej tej 
linii). Z boku przedstawiono skalę wartości natężenia pola wyra¬ 
żonych w gammach (1 y= 1 nT). Linie kreskowane (niebieskie) 
łączą te same anomalie występujące na różnych profilach 



długość geograficzna 

Rys. 18. Anomalie przedstawione w postaci pasów czarnych (do¬ 
datnie) i białych (anomalie ujemne), A grzbiet Reykjanes 


powierzchnia morza 



Rys. 19. Schemat powstawania żebrowatego obrazu anomali 
dodatnich ( + ) i ujemnych ( —) po obu stronach grzbietu ocea¬ 
nicznego. Wzdłuż grzbietu wydobywa się nowy materiał skorupy 
oceanicznej (zaznaczony strzałkami) 


Vine i D. M. Matthews uzupełnili hipotezę Dietza 
i Hessa sugerując, że obserwowane zjawisko łączy się 
z inwersjami pola geomagnetycznego. Ta część sko¬ 
rupy, która powstała w okresie, gdy pole miało nor¬ 
malny kierunek, jest źródłem dodatniej anomalii 
i próbki skał z tego obszaru mają normalną pozo¬ 
stałość magnetyczną. Odpowiednio, anomalie ujemne 
są dowodem na to, że w okresie powstawania tych 
części skorupy pole geomagnetyczne miało kierunek 
odwrotny. W wyniku szczegółowych badań anomalii 
w rejonach grzbietów oceanicznych, próbek z rdzeni 
podmorskich i próbek skał kontynentalnych udało się 
stwierdzić korelację pomiędzy anomaliami i poszcze¬ 
gólnymi epokami paleomagnetycznymi (rys. 20). 
Oszacowano również prędkości rozsuwania się dna 
w różnych obszarach kuli ziemskiej (1-6 cm/rok), 
a zatem — poznano historię dryfu kontynentów do 
ok. 200 milionów lat wstecz. 

Omówione w skrócie hipotezy Dietza-Hessa i Vi- 
ne-Matthewsa są traktowane jako potwierdzenie 
teorii dryfu kontynentów; zwolennicy tej teorii widzą 
mechanizm wywołujący dryf w procesach rozsuwania 
się den oceanicznych. Koncepcja dryfu kontynentów 
ma wśród geofizyków wielu przeciwników, ale jak 
dotychczas nie ma lepszej teorii wyjaśniającej dane 
dostarczane przez paleomagnetyzm. Wnioski wypły¬ 
wające z badań paleomagnetycznych znajdują po¬ 
twierdzenie w wynikach badania klimatów w różnych 
epokach geologicznych (paleoklimatów). 

Pozostaje do wyjaśnienia, co oznacza krzywa wę¬ 
drówki bieguna. I ten problem nie został jeszcze osta¬ 
tecznie rozwiązany. Istnieje kilka hipotez próbujących 
tłumaczyć to zjawisko. Wydaje się, że najbardziej 
prawdopodobna jest hipoteza wychodząca z założe¬ 
nia, że Ziemia nie zachowuje się jak ciało sztywne, 
lecz płynie. W stanie równowagi oś obrotu Ziemi po¬ 
krywa się z osią jej głównego momentu bezwładności. 
Gdy wskutek ruchu kontynentów zmienia się rozkład 
mas w skorupie ziemskiej, wówczas zmienia się rów¬ 
nież moment bezwładności. Ziemia powraca do stanu 
równowagi wówczas, gdy się przesuwa jej oś obrotu, 
a zatem położenia biegunów geograficznych i geoma- 
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Rys. 20. Schematyczna korelacja morskich anomalii magnetycz¬ 
nych z epokami paleomagnetycznymi. Anomaliom dodatnim od¬ 
powiadają epoki o normalnym kierunku pola (pasy czarne), 
anomaliom ujemnym — epoki o kierunku odwrotnym (pasy białe) 
(wg M. W. Mc Elhinny Paleomagnetism and piąte tectonics, 
Cambridge 1973) 



Rys. 21. Zmiany momentu magnetycznego Ziemi w ciągu ostat¬ 
nich 500 milionów lat (wg D. H. Tarling Princples and Appli¬ 
cations of Paleomagnetism, London 1971) 


gnetycznych. Szybkość tego ruchu zależy od lepkich 
własności płaszcza, które nie są jeszcze w pełni zba¬ 
dane. Omówione tu pokrótce zjawiska, sugerujące 
przesuwanie się kontynentów bądź ich części względem 
siebie i osi obrotu Ziemi, zostały ujęte w jedną gałąź 
tektonika wiedzy o Ziemi, nazwaną tektoniką płyt lub tektoniką 
pfyt kier. Dane paleomagnetyczne w ich obecnej postaci, 
podobieństwo linii brzegowych niektórych kontynen¬ 
tów, szereg danych geologicznych wskazują na słusz¬ 
ność hipotez stanowiących podstawę tej dziedziny. 
Wciąż jednak brak opisu mechanizmów, które by 
mogły wywoływać procesy wymagane przez tektoni¬ 
kę płyt. Być może nowe dane geofizyczne zmuszą 
do skorygowania dzisiejszych teorii i wskażą na zu¬ 
pełnie odmienną interpretację obserwowanych do¬ 
tychczas zjawisk. 

Badania paleomagnetyczne pozwalają poznać nie 
tylko zmiany kierunku pola geomagnetycznego w od¬ 
ległych epokach geologicznych, ale i zmiany jego na¬ 
tężenia. 

Na podstawie dostępnych obecnie danych można 
sądzić, że moment magnetyczny Ziemi miał wartość 


^ podobną do dzisiejszej 2,6 miliarda lat temu, na¬ 
stępnie malał i osiągnął minimum 500 milionów lat te¬ 
mu; w ciągu ostatnich 400 milionów lat wartość mo¬ 
mentu wzrastała, jak to widać na rysunku 21. 


Archeomagnetyzm 

Jak już wspomniano, lukę pomiędzy obecnymi ob¬ 
serwacjami pola geomagnetycznego a danymi paleo¬ 
magnetycznymi wypełnia archeomagnetyzm. Archeo¬ 
magnetyzm zajmuje się badaniem zmian pola ziem¬ 
skiego w przeszłości prehistorycznej i historycznej. 

Przedmiotem badań są wypalane gliny (cegły, pale¬ 
niska, wyroby ceramiczne), które podczas procesu wy¬ 
palania uzyskują stabilną pozostałość magnetyczną w 
kierunku istniejącego ówcześnie pola geomagnetycz¬ 
nego. 

Pomiary wartości i kierunku NRM dobrze datowa- badanie 
nych próbek pozwoliły na odtworzenie zmian wieko- zmian pola 
wych pola geomagnetycznego do 5500 lat wstecz. 

Zgromadzone dotychczas dane wskazują, że zmiany 
natężenia pola w tym okresie nie przekraczają 15% 
jego średniej wartości, amplituda zmian kierunku pola 
wynosiła ok. 20°, a okres tych zmian — ok. 1000 lat. 

Rysunek 22 przedstawia zmiany inklinacji i deklinacji 
otrzymane z badań archeomagnetycznych dla Gdań¬ 
ska. Zmiany inklinacji obejmują okres od 1080 r. do 
chwili obecnej. Linią ciągłą zaznaczono zmiany de¬ 
klinacji otrzymane z pomiarów obejmujących okres 
od 1360 r. do. chwili obecnej, a linią przerywaną — 
hipotetyczną zmianę ekstra połowa ną tak, by była po¬ 
dobna do krzywej doświadczalnej. Wyniki pozwalają 
sądzić, że zmiany wiekowe pola geomagnetycznego 
w Gdańsku w czasie objętym badaniami przebiegały 
z okresem ok. 600 lat. 

Badania archeomagnetyczne znajdują praktyczne zastosowanie 
zastosowanie w archeologii; pozwalają na datowanie w 
fragmentów wypalanych glin, których wiek nie jest archeologii 
dokładnie znany, z dokładnością co najmniej 25 lat, 
a stosowane metody nie powodują zniszczenia bada¬ 
nych obiektów. 



Rys. 22. Zmiany inklinacji w Gdańsku od 1080 r. i zmiany de¬ 
klinacji w Gdańsku od 1360 r. do chwili obecnej (wykorzystano 
tu także dane przytoczone na rys. 6). Krzywa ciągła — wyniki 
pomiarów, krzywa przerywana — hipotetyczna ekstrapolacja 
(wg W. Czyszek Archaeomagnetism : A preliminary report. Ma¬ 
teriały i Prace Inst. Geof. PAN, voI. 76, 59, 1974) 
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Teoria pochodzenia stałego pola 
geomagnetycznego 
i zmian wiekowych 

Źródeł stałego pola geomagnetycznego obserwowane- 
go obecnie, w czasach historycznych i w dawnych epo¬ 
kach geologicznych należy szukać we wnętrzu Ziemi. 
Źródłem stałego pola dipolowego mogłaby być np. 
jednorodnie namagnesowana kula ziemska o nama¬ 
gnesowaniu 75-10 -7 T lub jednorodnie namagneso¬ 
wane jądro Ziemi o namagnesowaniu 49-10 -6 T. 
Mógłby to być również pewien stacjonarny układ 
prądów elektrycznych płynących we wnętrzu Ziemi. 
Jednak żaden z tych mechanizmów nie mógłby spo¬ 
wodować ani zjawiska zmian wiekowych, ani inwersji 
pola geomagnetycznego. Jedyną istniejącą obecnie 
teorią, która, jak się wydaje, potrafi wyjaśnić wszystkie 
cechy stałego pola, jest zaproponowana w latach czer- 
dziestych tzw. teoria samowzbudnego dynamo El- 
budowa sassera-Bullarda. Aby ją opisać, trzeba powiedzieć 
wnętrza parę słów o budowie wnętrza Ziemi. Badania fal 
Ziemi sejsmicznych przechodzących przez głębokie (poniżej 
3000 km) warstwy Ziemi pozwoliły stwierdzić, że 
wewnętrzna część kuli ziemskiej, o promieniu ok. 
3500 km, jądro, zachowuje się inaczej niż jej partie 
zewnętrzne. Ustalono, że jądro składa się z dwóch 
warstw, z których jedna, zewnętrzna, jest ciekła, na¬ 
tomiast wewnętrzna jest prawdopodobnie stała (-*■ 
Fizyka skorupy i wnętrza Ziemi). Dane dotyczące 
gęstości i składu chemicznego jądra wskazują, że do¬ 
minuje tam żelazo i nikiel, a zatem powinno być ono 
teoria dobrym przewodnikiem elektryczności. Te własności 
samowzbud- jądra leżą u podstaw działania wewnątrz Ziemi me- 
nego chanizmu Elsassera-Bullarda. Rysunek 23 przedsta 
dynamo wia schematycznie zasadę działania samowzbudnego 



Rys. 23. Schemat działania samowzbudnego dynamo Elsas¬ 
sera-Bullarda 

dynamo. Tarcza A wykonana z dobrego przewodnika 
elektryczności obraca się w kierunku wskazanym 
strzałką. W otoczeniu układu istnieje niewielkie pole 
magnetyczne skierowane wzdłuż osi obrotu tarczy. 
Tarcza jest połączona z osią przez cewkę, przedsta¬ 
wioną na rysunku jako jeden zwój C. Podczas obrotu 
tarczy w zewnętrznym polu magnetycznym indukuje 
się w niej siła elektromotoryczna skierowana wzdłuż 
jej promienia. Przez cewkę C zaczyna płynąć prąd, 
który z kolei jest źródłem dodatkowego pola magne¬ 
tycznego, równoległego do osi obrotu tarczy. Przy 
odpowiednio dobranym kierunku ruchu to nowo po¬ 
wstałe pole dodaje się do istniejącego już pola H. 
Wzrost natężenia pola powoduje wzmocnienie siły 
elektromotorycznej w tarczy, a więc i natężenia prądu 
płynącego przez cewkę — i tak, dalej. A zatem taki 
układ może spowodować znaczne wzmocnienie po¬ 
czątkowego pola magnetycznego o bardzo małym na¬ 
tężeniu. 

We wnętrzu Ziemi rolę obracającej się tarczy prze- 
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wodzącej i cewki odgrywają prądy konwekcyjne pły¬ 
nące w ciekłym, przewodzącym jądrze. Jednakże same 
tylko ruchy konwekcyjne nie wystarczyłyby do wy¬ 
tworzenia układu dynamo; poruszające się do góry 
i na dół cząstki cieczy tworzyłyby zamknięte pętle 
tylko w płaszczyźnie południkowej. Dzięki sile Corio- 
lisa, wywołanej ruchem obrotowym Ziemi, „rurki” 
prądów konwekcyjnych wyciągają się wzdłuż płasz¬ 
czyzn równoleżnikowych, tworząc odpowiednik tar¬ 
czy. Przebieg procesu przedstawia schematycznie rys. 
24. Niezbędne do funkcjonowania dynamo początko¬ 
we pole magnetyczne (w wypadku Ziemi jest to skła¬ 
dowa słabego pola panującego w przestrzeni około- 
ziemskiej) jest skierowane wzdłuż osi obrotu Ziemi. 



Rys. 24. Schemat powstawania toroidalnego pola w obracającej 
się przewodzącej kuli. Cyfry od 1 do 4 oznaczają kolejne etapy 

tego procesu, v wektor prędkości obrotu Ziemi, kierunek obrotu 
jest zaznaczony strzałkami (rys. 23 , 24 wg M. W. Mc EJhinny, 

Paleomagnetism and piąte tectonics, Cambridge 1973) 

Jest to tzw. pole poloidalne, które nie ma składowej pole 
w płaszczyźnie równoleżnikowej. Linie sił tego poła poloidalne 
poruszają się razem z ciekłym materiałem jądra, są i toroidalne 
w nim niejako zamrożone. W ten sposób przez „wy¬ 
ciągnięcie” linii sił pola poloidalncgo powstaje skła¬ 
dowa równoleżnikowa poła, tzw. pole toroidalne, 
wzmacniające prądy elektryczne, co z kolei prowadzi 
do wzmocnienia pola poloidalnego obserwowanego 
na powierzchni Ziemi. 

Z przedstawionej tu schematycznie teorii dynamo 
samowzbudnego wynika, że stałe pole geomagnetyczne 
powstaje w wyniku wzajemnego oddziaływania ru¬ 
chów cieczy przewodzącej i pola elektromagnetycz¬ 
nego. Dziedzina zajmująca się takimi zjawiskami nosi 
nazwę magnetohydrodynamiki, a fale, których opis 
zawiera zarówno elementy hydrodynamiki, jak i elek¬ 
trodynamiki, nazywają się falami magnetohydrody- 
namicznymi. Równania opisujące działanie ziemskie¬ 
go dynamo są bardzo skomplikowane i nie będziemy 
ich tu przytaczać. Próby ich rozwiązania, przy róż¬ 
nych założeniach dotyczących warunków termodyna¬ 
micznych panujących we wnętrzu Ziemi, doprowadzi¬ 
ły do wielu ciekawych wniosków. Stwierdzono np., że 
prędkość obrotu zewnętrznych partii jądra jest mniej¬ 
sza niż jego partii wewnętrznych. Zjawisko to może 
być odpowiedzialne za dryf zachodni pola niedipo- 
lowego i centrów zmian wiekowych. Istnienie tych 
centrów wiąże się z występowaniem na powierzchni 
jądra układów prądów elektrycznych. 

Aby wyjaśnić możliwość zmiany kierunku pola, 

T. Rikitake zaproponował w 1958 r. przyjęcie dwóch 
sprzężonych układów dynamo. W wyniku prac nad 
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układem równań opisujących ten model okazało się, 
że przy pewnych założeniach (co do warunków pa¬ 
nujących we wnętrzu Ziemi) prądy elektryczne wy¬ 
stępujące w równaniach oscylują wokół stanu stacjo¬ 
narnego przez jakiś czas, przy czym w miarę upływu 
czasu rośnie amplituda tych oscylacji. W pewnym 
momencie następuje gwałtowny przeskok do oscylacji 
wokół innego stanu stacjonarnego. A zatem prąd 
elektryczny, a w konsekwencji pole magnetyczne wy¬ 
twarzane przez układ Rikitake, może w pewnych wa¬ 
runkach zmienić swój kierunek. Fizyczna natura im¬ 
pulsów, które by mogły spowodować taki proces, nie 
jest jeszcze znana, ale możliwość oscylacji prądów po¬ 
zostaje w zgodzie z obserwowanymi na powierzchni 
Ziemi oscylacjami pola geomagnetycznego w okre¬ 
sach przejściowych pomiędzy normalnym i odwrot¬ 
nym kierunkiem pola. 


Zmienne poie geomagnetyczne 

Zmienne pole magnetyczne, które stanowi tylko nie¬ 
wielki procent pola obserwowanego na powierzchni 
Ziemi, pochodzi od źródeł znajdujących się poza 
Ziemią. Ta część pola, mimo że tak mała, jest przed¬ 
miotem ciągłych obserwacji oraz analiz i przynosi 
informacje dotyczące nie tylko pola magnetycznego 
Ziemi, ale i własności przestrzeni okołoziemskiej. Wy¬ 
niki ciągłych obserwacji gromadzone od szeregu lat 
w postaci magnetogramów pozwoliły na rozróżnienie 
kilku typów zmian pola. Na rys. 25 przedstawiony 
•est magnetogram otrzymany w Centralnym Obser- 


tach 1836-1841 jednoczesnych pomiarów magnetycz¬ 
nych w istniejących ówcześnie 50 obserwatoriach. 
Następne okresy intensywnych badań zjawisk magne¬ 
tycznych na powierzchni Ziemi to Pierwszy Rok Po¬ 
larny (1882-1883), Drugi Rok Polarny (1932-1933) 
i Międzynarodowy Rok Geofizyczny (1957-1958). 

W Polsce pierwsze obserwatorium magnetyczne 
założył w 1910 r. Stanisław Kalinowski w Świdrze pod 
Warszawą. Działalność tej placówki została w ostat¬ 
nich latach zakłócona przez biegnącą w pobliżu linię 
kolei elektrycznej. Obecnie ciągłą rejestrację składo¬ 
wych pola geomagnetycznego na terenie Polski pro¬ 
wadzą: Obserwatorium Geofizyczne Polskiej Akademii 
Nauk na Półwyspie Helskim w Helu oraz Centralne 
Obserwatorium Geofizyczne Polskiej Akademii Nauk 
w Belsku Dużym (woj. radomskie). Poza tym rejestrację 
magnetyczną o charakterze uzupełniającym prowadzi 
Obserwatorium Sejsmologiczne Polskiej Akademii 
Nauk w Raciborzu. 

Analiza danych obserwacyjnych, gromadzonych 
dzięki pracy obserwatoriów magnetycznych, pozwo¬ 
liła na rozdzielenie pola zmiennego na część zmienia¬ 
jącą się spokojnie (gładko) i na część zawierającą zmia¬ 
ny zachodzące w sposób nieuporządkowany. Zmiany 
płynne — to tzw. zmiany spokojne lub niezaburzone, 
zmiany nieuporządkowane — to tzw. zmiany zabu¬ 
rzone. 

Na magnetogramie zmiany spokojne charaktery¬ 
zują gładkie odcinki krzywych przebiegających po¬ 
niżej lub powyżej średniej wartości danej składowej 
pola w miejscu obserwacji, zaznaczonej na rys. 25 jako 
linia bazy. Wśród zmian spokojnych poszczególnych 
składowych można wydzielić zmiany o okresach: do¬ 
bowym, sezonowym, rocznym, jedenastoletnim. 



Rys. 25. Magnetogram przedstawiający bieg dobowy składowej poziomej H, składowej pionowej Z i deklinacji Z) otrzymany w Belsku 
17.1.-18.1.1975 r. Linie Ha y Z B i Db linie baz poszczególnych składowych, linia Tbieg dobowy temperatury w pomieszczeniu, w którym 
jest prowadzona rejestracja. Na wykresach H i D widoczne są zmiany zatokowe b 


watorium Geofizycznym Polskiej Akademii Nauk 
w Belsku Dużym. 

W 1722 r. londyńczyk G. Graham, obserwując 
przez mikroskop igłę kompasu, zauważył, że wyko¬ 
nuje ona pewne ruchy w płaszczyźnie poziomej. Są to 
pierwsze obserwacje zmian deklinacji; zmiany te były 
czasem regularne i niezbyt szybkie, kiedy indziej znów 
nieregularne i gwałtowne. Nieco później wspólnie 
z A. Celsiusem, który podobne obserwacje prowadził 
w Uppsali, stwierdzili, że często w obu miastach jedno¬ 
cześnie panował magnetyczny spokój lub pojawiało 
się zaburzenie. 

Początkowo obserwowano tylko zmiany deklinacji 
magnetycznej. Dopiero po upływie ok. 100 lat od od¬ 
krycia G. Grahama F. Gauss wykonał w Getyndze 
pierwsze pomiary inklinacji magnetycznej i natężenia 
całkowitego wektora pola. Wkrótce potem pod pa¬ 
tronatem F. Gaussa rozpoczęła działalność Unia 
Magnetyczna, powołana w cełu dokonywania w la- 


Zmiany spokojne o okresie dobowym oznacza się 
symbolem S q i przypisuje się je zmieniającemu się 
z okresem dobowym wpływowi Słońca. Zmiany S Q są 
różne, zależnie od szerokości geograficznej miejsca 
obserwacji i pory roku. Na rys. 26 przedstawione są 
te zmiany na różnych szerokościach geograficznych 
w trzech sezonach dla składowej poziomej, deklinacji 
i inklinacji. W naszych szerokościach geograficznych 
zmiana spokojna deklinacji przebiega w następujący 
sposób: W pierwszej ćwiartce doby liczonej od godzi¬ 
ny 0 czasu miejscowego południk magnetyczny prze¬ 
suwa się powoli na wschód i osiąga maksimum 
wschodnie w godzinach 7-9 czasu miejscowego. Na¬ 
stępnie zawraca szybko ku zachodowi, maksymalne 
położenie zachodnie osiąga ok. godziny 13 30 . Potem 
kieruje się znów na wschód i ok. godziny 22 30 osiąga 
drugie wschodnie maksimum. 

Oprócz spokojnej zmiany słonecznej istnieje rów¬ 
nież spokojna zmiana księżycowa, wywołana wpły- 
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wem Księżyca, o okresie doby księżycowej, oznaczana 
symbolem L i zaobserwowana po raz pierwszy przez 
K. Kreila w 1850 r. Szczegółowe badania zmian L 



Rys. 26. Uśrednione dla całej kuli ziemskiej zmiany S Q składo¬ 
wej poziomej dla różnych szerokości geograficznych dla trzech 
sezonów: D (styczeń, luty, listopad, grudzień), E (marzec, kwie¬ 
cień, wrzesień, październik), J (maj, czerwiec, lipiec, sierpień) 
(wg S. Matsushita Solar quiet and lunar daily variations fields , 
w Physics of Geomagnetic Phenomena, vol. I, New York 1967 


wykazały, że zależą one od szerokości geograficznej 
miejsca obserwacji i od pory roku, podobnie jak zmia¬ 
ny S Q . Maksymalne wartości zmian księżycowych skła¬ 
dowych H i Z wynoszą 1-2*10 -9 T, a deklinacji — 
40". Zmiany S q są kilkadziesiąt razy silniejsze. 

Źródeł powstania zmian spokojnych, zarówno 
słonecznych, jak i księżycowych, upatruje się w wy¬ 
stępowaniu w warstwie fTjonosfery (czyli 100-120 km 
nad powierzchnią Ziemi) prądów elektrycznych 
o szczególnej konfiguracji, związanych ze zjawiskami 
pływowymi, zależnymi odpowiednio od Słońca 
i Księżyca. 

Zmiany zaburzone pola geomagnetycznego składają 
się z szeregu nakładających się na siebie elementów, 
które można poklasyfikować w następujący sposób: 
zmiany periodyczne — zaburzone dobowe zmiany 
słoneczne o okresie doby słonecznej i pulsacje magne¬ 
tyczne, których okres wynosi kilka minut, zmiany za¬ 
tokowe, które na magnetogramie mają kształt zatoki, 
zmiany aperiodyczne, które występują w czasie burz 
magnetycznych przede wszystkim na składowej po¬ 
ziomej. Główną część zaburzeń stanowią nieprawi¬ 
dłowe fluktuacje, które się składają z szeregu następu¬ 
jących po sobie zmian o różnych okresach i amplitu¬ 
dach. 

Burzom magnetycznym towarzyszy niejednokrot¬ 
nie zjawisko zórz polarnych, szczególnie na dużych 
szerokościach geograficznych. Zjawisko to polega 
na świeceniu atomów tlenu i cząsteczek azotu znaj¬ 
dujących się w atmosferze. Zorze przybierają różne 
kształty: spokojnych lub pulsujących łuków, wstęg, 
welonów, promienistych koron. W tym ostatnim wy¬ 
padku promienie układają się wzdłuż linii sił pola 
geomagnetycznego, co zauważył po raz pierwszy 
J.C. Wilckew 1770 r. Związek zórz polarnych ze zja¬ 
wiskami magnetycznymi został stwierdzony właśnie 
dzięki jego obserwacjom. 

A. Humboldt, badając burze magnetyczne, stwier¬ 
dził, że najsilniejsze z nich zaczynają się niemal rów¬ 
nocześnie na całej Ziemi i że powodują zmniejszanie 
się składowej poziomej pola, która następnie rośnie 
powoli do poprzedniej wartości. Charakterystyczną 
cechą większości burz jest nagłość ich pojawiania się. 
Pierwszy, krótki impuls zwiększa natężenie składowej 
poziomej. Ten wzrost trwa krótko, od */ 2 godziny do 



Rys. 27. Zmiany składowych pola —— poziomej H t pionowej Z i deklinacji D — w czasie burzy magnetycznej, otrzymane w wyniku 
uśrednienia zmian zaobserwowanych podczas 40 burz dla trzech grup obserwatoriów: w niskich szerokościach geomagnetycznych (a), 
w średnich szerokościach (b) i w wysokich szerokościach (c) (wg S. Chapman Solar emission and magnetic-aurora! storms on the Earth 
w Magnetism and Cosmos , 3, Edinburgh, London 1965) 
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godziny. Zmniejszanie się natężenia składowej H 
trwa kilka godzin, a powrót do stanu normalnego 
może trwać kilka dni. W czasie burzy amplituda zmian 
pola może osiągnąć kilka tysięcy nanotesli. Na rys. 27 
przedstawiono zmiany H, Z i D podczas burz ma¬ 
gnetycznych o średnim natężeniu. 

aktywność Miarą zaburzenia magnetycznego jest wprowadzo- 
magnetyczna na sztucznie wielkość zwana aktywnością magnetycz¬ 
ną. Jeżeli jakiś czas pole się nie zmienia, to aktywność 
wynosi 0. Aktywność jest tym większa, im większa jest 
amplituda zmian pola i im szybsze są jego zmiany. 
W 1939 r. Międzynarodowe Towarzystwo Magne¬ 
tyzmu Ziemskiego i Elektryczności wprowadziło dla 
określenia stopnia zaburzenia tzw. indeks K y wyrażo¬ 
ny w baliach od K = 0 do K = 9. Każdemu hal¬ 
lowi odpowiada amplituda wahań składowych pola 
geomagnetycznego w trzygodzinnych odstępach cza¬ 
su — z uwzględnieniem poprawki na spokojne zmiany 
dobowe. Za amplitudę przyjmuje się tu maksymalną 
różnicę między największym i najmniejszym odchyle¬ 
niem jednej ze składowych (H> Z lub D) od normalnej 
krzywej biegu dobowego w trzygodzinnym przedziale 
czasu. Ponieważ poziom zaburzeń zależy od szero¬ 
kości geograficznej miejsca obserwacji, więc w każdym 
obserwatorium przyjmuje się nieco inne amplitudy 
zaburzeń przy tych samych wartościach indeksu K , 
np. w Centralnym Obserwatorium Geofizycznym 
w Belsku Dużym przyjmuje się indeks K = 9 dla am¬ 
plitudy 500 nT. Wspólny dla całej Ziemi, tzw. plane¬ 
tarny indeks K y otrzymuje się uśredniając indeksy K 
z obserwatoriów położonych między 50° i 63° szero- 


warstwach. Natężenie zewnętrznego, pierwotnego po¬ 
la geomagnetycznego można przedstawić analitycznie 
jako szereg funkcyjny o wyrazach zależnych od współ¬ 
rzędnych geograficznych miejsca obserwacji oraz od 
promienia ziemskiego a i odległości miejsca obserwacji 
od środka Ziemi r w postaci czynników ( r/a ) n . W wy¬ 
padku wewnętrznej, wtórnej składowej pola ta ostat¬ 
nia zależność jest inna i ma postać (o/r) n+I . Dzięki tej 
różnicy można rozdzielić obserwowane na powierzch¬ 
ni Ziemi zmiany pola na części pochodzące od źródeł 
zewnętrznych i od prądów tellurycznych, a następnie 
otrzymać rozkład przewodności elektrycznej we wnę¬ 
trzu Ziemi. Znaleziony w ten sposób globalny model 
rozkładu przewodności pozwala rozróżnić następu¬ 
jące warstwy: dobrze przewodzącą warstwę przypo¬ 
wierzchniową o kilkukilometrowej miąższości, na¬ 
stępnie źle przewodzącą warstwę o miąższości ok. 

250-300 km, poniżej której przewodność rośnie o dwa 
rzędy wielkości. Zmiany pola geomagnetycznnego 
o okresach nie przekraczających roku pozwalają na 
poznanie rozkładu przewodności do głębokości ok. 

1000 km. O przewodności głębszych warstw można 
sądzić na podstawie prądów indukowanych przez zmia¬ 
ny wiekowe pola. Bardziej szczegółowy obraz rozkła¬ 
du przewodności na mniejszych głębokościach, tzn. 

10-150 km, daje metoda sondowań magnetotellurycz- metoda 
nych zapoczątkowana w 1949 r. przez A. Tichonowa sondowań 
i L. Cagnarda. Polega ona na jednoczesnych obser- magneto- 
wacjach zmian składowych poziomych pola magne- tellurycznych 
tycznego i elektrycznego. Wyniki badań wskazują na 
duże regionalne odstępstwa od globalnego modelu. 



kości geomagnetycznej. Poza tym istnieje wiele in¬ 
nych miar aktywności magnetycznej. Jedna z nich, 
tzw. miara u , uwzględnia wpływ burz magnetycznych. 
Wyznaczenie tego wskaźnika polega na znalezieniu 
różnicy między średnią wartością składowej poziomej 
podczas dwóch kolejnych dni, bez uwzględniania 
znaku składowej. Aktywność magnetyczna pozostaje 
w ścisłym związku z aktywnością Słońca; widać to 
wyraźnie na rys. 28, gdzie przedstawione są krzywe 
zmian obu miar aktywności (aktywność Słońca określa 
się tzw. liczbą Wolffa, czyli wskaźnikiem liczby plam 
na Słońcu). 


Indukcja elektromagnetyczna 
we wnętrzu Ziemi 

Zmiany pola geomagnetycznego o okresach od kilku 
sekund do kilku tysięcy lat indukują prądy elektryczne 
w przewodzących warstwach Ziemi. Prądy te, zwane 
prądy prądami tellurycznymi, są źródłem wtórnych składo- 
telluryczne wych pola, kóre się dodają do składowych pochodzą¬ 
cych od źródeł zewnętrznych. Rozkład i natężenie 
prądów tellurycznych zależą od częstości zmian oraz 
od rozkładu przewodności we wnętrzu Ziemi; zmiany 
o okresach krótszych indukują prądy w płytszych 


Rysunek 29 przedstawia rozkład przewodności elek¬ 
trycznej z głębokością uzyskany na podstawie uśred¬ 
nionych wyników sondowań magnetotellurycznych, 
wyników badań prądów indukowanych przez zmiany 
dobowe pola geomagnetycznego, burze magnetyczne 
i zmiany wiekowe. Zjawiska indukcji elektromagne- 



Rys. 29. Rozkład przewodności elektrycznej we wnętrzu Ziemi 
(wg M. H. P. Bott The Interior of the Earth , London 1971) 
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tycznej we wnętrzu Ziemi przyciągają uwagę geofizy¬ 
ków ze względu na ścisły związek pomiędzy rozkładem 
przewodności elektrycznej a rozkładem temperatury 
we wnętrzu Ziemi. Więcej informacji na ten temat 
można znaleźć w artykule poświęconym fizyce sko¬ 
rupy i wnętrza Ziemi. 

A. N. Chramów Pałeomagnietizm paleozoja, Leningrad 1974; 

A. H. Cook Physics of the Earth and Planets, London 1973; 

B. Lisowski O zmianach dziennych słonecznych deklinacji magne¬ 
tycznej w Świdrze, Acta Geophys. Pol. 3, 35,1955; S. Matsushita 


Fizyka morza 

Dynamika morza 

Czesław Druet 

Około 70% powierzchni ziemskiego globu zajmują 
morza i oceany, olbrzymie masy wód, które są w ciąg¬ 
łym ruchu. Formy tego ruchu zależą od rodzaju czyn¬ 
nika zewnętrznego, wywołującego na powierzchniach 
granicznych zbiornika wodnego (powierzchnia swo¬ 
bodna wód i powierzchnia dna) oraz w jego wnętrzu, 
hydrostatyczne i hydrodynamiczne siły tarcia i ciśnie¬ 
nia. Woda jest ośrodkiem łatwo odkształcalnym 
i praktycznie rzecz biorąc — nieściśliwym. Jej struk¬ 
tura określona jest gęstością, wyrażającą stosunek 
masy m elementu cieczy do jego objętości q. W zbior¬ 
nikach wodnych, których masa rozłożona jest równo- 
gęstość miernie (struktura jednorodna), gęstość jest wielkością 
wody stałą o = m!q = const. Natomiast w dużych zbiorni¬ 
kach oceanicznych rozkład gęstości wody jest z reguły 
rozkładem niejednorodnym, zależnym od tempera¬ 
tury, zasolenia i ciśnienia. Na pewnych głęboko¬ 
ściach, wskutek znacznych różnic gęstości warstw 
wodnych, tworzą się często tzw. powierzchnie skoku 
gęstości. 

zawartość Niezależnie od stanu zasolenia mórz i oceanów pro- 
soli centowy udział poszczególnych rodzajów soli w 1 kg 
wody jest wielkością prawie stałą i znając zawartość 
jednego ze składników (np. chlorku sodu) w 1 kg wo¬ 
dy morskiej, możemy obliczyć przybliżony stan jej 
zasolenia. Stan ten waha się — w zależności od szero¬ 
kości geograficznej, głębokości akwenu — od kilku 
do kilkudziesięciu promili. 

temperatura Temperatura wód morskich zależy również od sze¬ 
regu czynników, spośród których najistotniejsze są 
promieniowanie słoneczne oraz mechanizmy wymiany 
i przenoszenia ciepła wewnątrz zbiornika. Rozkład 
temperatury wód morskich jest znacznie mniej stabil¬ 
ny od rozkładu zasolenia i zależy od szerokości geo¬ 
graficznej, głębokości akwenu oraz pory roku, mie¬ 
siąca, doby. W zależności od tych czynników średnia 
temperatura wód morskich przybiera wartości od zera 
do kilkudziesięciu stopni Celsjusza. 

Wpływ ciśnienia atmosfery i górnych warstw wody 
na gęstość wody morskiej jest niewielki, ponieważ — 
jak powiedzieliśmy — woda jest ośrodkiem prawie 
nieściśliwym. Gdyby jednak wody morskie były ideal¬ 
nie nieściśliwe, wówczas poziom światowego oceanu 
byłby o ok. 30 m wyższy od poziomu obecnego. 


Przyczyny ruchu mas wodnych 

Stałymi czynnikami zewnętrznymi, od których zależy 
ruch mas wodnych w morzu są: 

siła ciężkości Siła ciężkości F 9i będąca wypadkową dwóch skła¬ 
dowych (rys. 1)-—siły grawitacji ziemskiej F 90 , wy¬ 
wołanej zjawiskiem wzajemnego przyciągania się 
masy Ziemi i elementu wody q y oraz siły odśrodkowej 

Fw*, wywołanej obrotem Ziemi dookoła jej osi 
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Solar ąuiet and lunar daily variaiion fields, w Physics of Geo - 
magnetic Phenomena,\o\. 1 ,New York and London 1967; M. W. 
MC Elhinny Palcomagnetism and piąte tectonics, Cambridge 1973; 
A.T. Price Electromagnetic introduction within the Earth , w Phy¬ 
sics of Geomagnetic Phenomena, vol. 1, New York and London 
1967; T. Przypkowski Zabytkowe kompasy magnetyczne na in¬ 
strumentarium astronomicznym Marcina Bylicy z Olkusza z lat 
1480-1487, Acta Geophys. Pol. 4 , 245 (1956); U. Schmdcker, 
J. Jankowski Geomagnetic induction studies and the electrical 
State of the upper manile, w The Upper Mantle Dcvelopments in 
Geotectonics , 4, Amsterdam 1972; R. Sroczyński Rozwój eks¬ 
perymentu, pojęć i teorii magnetycznych. Warszawa 1969. 


Siła pływotwórcza F p , będąca wypadkową rzutów siła 
dwóch sił na linię styczną do krzywizny swobodnej pływotwór- 
powierzchni wód, w punkcie położenia elementu q cza 

(rys. 2) — siły odśrodkowej ( F 0 ), wywołanej ruchem 


N 

t 



Rys. 1. Rozkład sil i przyspieszeń działających na element q, 

zlokalizowany na powierzchni wirującej Ziemi; ~g jest rzeczywi¬ 
stym przyspieszeniem ziemskim 





















siła 

Coriolisa 


ciśnienie 
atmosfe¬ 
ryczne 
i aero¬ 
dynamiczne 
tarcie 


kształt 
i dynamiczna 
aktywność 
akwenu 


okrężnym Ziemi dookoła środka („O”) grawitacyjnej 
równowagi układu Ziemia-Księżyc (wszystkie 
punkty materialne na Ziemi i w jej wnętrzu krążą 
w tym ruchu po orbitach kołowych względem róż¬ 
nych środków obrotu O, ale promienie tych orbit r 

oraz liniowe prędkości ruchu (V — co 0 r) punktów q 
są jednakowe, równe r — r z i V = V z (rys. 2)), oraz 

rzutu siły grawitacji księżycowej ( Fk ) wywołanej zja¬ 
wiskiem wzajemnego przyciągania się elementów 
wody i Księżyca. Analogiczne siły pływotwórcze 
wzbudzane są również w układzie grawitacyjnym 

Ziemia-Słońce. Obliczając siły F P w układzie Ziemia 
-Księżyc i układzie Ziemia-Słońce zobaczymy, że siły 
pływotwórcze księżycowe są 2,2 razy większe od sił 
pływotwórczych słonecznych. 

Na elementy wody q poruszające się w akwenie 

z prędkością postępową u działa siła wywołana ru¬ 
chem obrotowym globu ziemskiego dookoła własnej 

osi, zwana siłą Corliolisa F c = 2oq(uxco z ) (gdzie 
uxa>z jest iloczynem wektorowym, czyli wektorem 
o kierunku prostopadłym do kierunku u i cu 2 , o dłu¬ 
gości równej tfa> 2 sin(<£ u,co z ). Siła ta odchyla kierunek 

wektora prędkości //, na półkuli północnej zgodnie 
z ruchem wskazówek zegara (w prawo), a na półkuli 
południowej w kierunku przeciwnym (w lewo). 

Pozostałe czynniki zewnętrzne, od których zależy 
ruch mas wodnych w morzu związane są z własnoś¬ 
ciami powierzchni granicznych zbiornika, tj. z wa¬ 
runkami panującymi na swobodnej powierzchni wód 
oraz na dnie i brzegach morskiego zbiornika. 

Atmosfera ziemska oddziałuje na swobodną po¬ 
wierzchnię akwenu siłą normalną do tej powierzchni, 
zależną od ciśnienia atmosferycznego i siłą styczną 
do niej zwaną siłą tarcia aerodynamicznego. Ciśnie¬ 
nie atmosferyczne ( p a ), zmieniające się nieregularnie 
w czasie i przestrzeni, zależy głównie od warunków 
termicznych panujących w atmosferze na różnych 
wysokościach. Natomiast styczne siły tarcia aero¬ 
dynamicznego (x a ) wzbudzane są ruchem mas po¬ 
wietrza (wiatrem) w przywodnej warstwie atmosfery 
i wynikają z turbulentnej wymiany pędu między ele¬ 
mentami powietrza i wody w przypowierzchniowej 
granicznej warstwie morza i atmosfery. Siły te są 
proporcjonalne do kwadratu prędkości wiatru 
(ta ^ 3-10~ 6 i/ 2 , gdzie U jest prędkością wiatru). 

Drugą naturalną powierzchnię graniczną morskiego 
zbiornika tworzą dno i brzegi akwenu. Ich kształt 
i aktywność dynamiczna wywołują różnego rodzaju 
procesy brzegowe lub hydrodynamiczne osobliwości. 
Kształt i rodzaj brzegu morskiego oraz jego stromość 
wywierają znaczny wpływ na procesy hydrodyna¬ 
miczne w strefie przybrzeżnej, transformując istnieją¬ 
ce i wzbudzające nowe (np. fale odbite od stromych 
brzegów lub przybrzeżne spiętrzenia mas wodnych). 
Kształt dna morskiego odgrywa także dużą rolę 
w przydennych przepływach mas wodnych oraz zwią¬ 
zanej z nimi dyfuzji pędu, ciepła i zawartych w wodzie 
substancji biernych. Ale najpoważniejsze w skutkach 
są zjawiska wulkaniczne i trzęsienia dna morskiego, 
wywołujące groźne dla życia i mienia ludzkiego po¬ 
wodzie morskie. 


Prawa rządzące ruchem mas wodnych 


prawo zachowania pędu, 

1'jJf eudq = jjpndAĄ- /// oFdą ; 

al ą A q 

prawo zachowania energii, 




*2 

= J [// PnudAĄ- Jjf qFud<Ądt, 


prawa 

zachowania 


gdzie o jest gęstością wody zawartej w elementarnej 
objętości dq , A — powierzchnią objętości q y u — pręd¬ 
kością ruchu elementu dq , t — czasem, p n — ciśnie¬ 
niem (siłą powierzchniową normalną do elementu 
powierzchni dA), u n — prędkością normalną do ele¬ 
mentu powierzchni dA t F —siłą masową zewnętrzną, 
działającą na element objętości dq. 

Prawo zachowania masy wyraża fakt, że zmiana 
masy w objętości q y uwarunkowana zmianą gęstości 
wody w czasie dt , musi równać się masie, która w tym 
samym czasie dopłynie do wnętrza objętości q lub 
wypłynie z niego przez powierzchnię A. Jeżeli zasada 
ta nie jest spełniona to oznacza, że wewnątrz obszaru 
q istnieją źródła produkujące lub pochłaniające wodę. 

Prawo zachowania pędu odwzorowuje podstawową 
zasadę Newtona, dotyczącą równowagi sumy sił 
zewnętrznych działających na ciało (siły powierzch¬ 
niowe i siły masowe — prawa strona równania) i ilo¬ 
czynu masy ciała oraz jego przyspieszenia (lewa strona 
równania). Prawo zachowania energii wyraża zasadę, 
że ilość pracy wykonanej przez siły zewnętrzne w cza¬ 
sie t 2 —t 1 musi być równa różnicy energii kinetycznej 
masy wody w dwóch stanach chwilowych; w momen¬ 
cie ; 2 , w którym masa cieczy ma objętość q 2 i momencie 
/ lt odpowiadającym objętości q x . 

Stanem spoczynkowym morskiego akwenu jest stan 
jstan równowagi hydrostatycznej, w którym elementy równowagi 
wody q nie zmieniają w czasie i przestrzeni swojego hydro- 
położenia. Wówczas jedyną siłą zewnętrzną działa- statycznej 
jącą na elementy wody jest siła ciężkości warunku¬ 
jąca ciśnienie hydrostatyczne. Stan równowagi hy¬ 
drostatycznej możliwy jest oczywiście jedynie wów¬ 
czas, gdy rozkład gęstości wody w morzu jest bądź 
rozkładem jednorodnym w przestrzeni: q(x,y y z) = 

= const, bądź też rozkładem jednorodnym w płasz¬ 
czyźnie poziomej: p(;e, y) = const i stabilnym 
w płaszczyźnie pionowej: q z < q z +jz (rys. 3). W wa¬ 
runkach naturalnych stan taki nie może wystąpić 



Ruch mas wodnych w morzach i oceanach, zależny 
od wyżej wymienionych czynników, przybiera w czasie 
i przestrzeni różne formy, spełniające zawsze trzy 
podstawowe prawa mechaniki ośrodków ciągłych: 
prawo zachowania masy, 

Jff-W dq+ ffe UndA = 0; 

q A 


w czystej postaci, ponieważ astronomiczne siły pływo¬ 
twórcze oraz przestrzenna i czasowa zmienność pól 
atmosferycznego ciśnienia, wzbudzać będą zawsze 
ruch mas wodnych i jedynie w szczególnych okolicz¬ 
nościach (bardzo słabe pływy w małym akwenie, 
jednorodny i stacjonarny układ baryczny, brak wiat¬ 
ru) i tylko chwilowo mogą być spełnione w akwenie 
warunki kwazihydrostatycznej równowagi. 
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ruch W razie naruszenia gęstościowej jednorodności czy 
laminarny stabilności ośrodka wodnego lub zadziałania innego 
czynnika, naruszającego stan równowagi hydrosta¬ 
tycznej akwenu, elementy wody rozpoczną ruch, 
który w fazie początkowej, bez względu na rodzaj 
czynnika wzbudzającego, będzie ruchem laminamym. 
W ruchu tym poruszające się elementy wody q po¬ 
zostaną zawsze w niezniennej względem siebie pozy¬ 
cji, a jedynym mechanizmem przekazywania energii 
ze źródła ruchu w głąb i wszerz zbiornika będzie 
v molekularna wymiana pędu (wymiana pędu między 
molekułami) między sąsiadującymi elementami wody 
(rys. 4), stanowiąca istotę molekularnego tarcia we¬ 
wnętrznego, zwanego lepkością wody. 


warstwa 

wody 



/ 

-►/pionowy rozkład 
'prędkości u ru- 
/chu elementów q 


Rys. 4. Schemat struktury laminamego ruchu wody 


ruch Jeżeli prędkość elementów q przekroczy pewną 
turbulentny wartość graniczną, ruch laminarny wody przechodzi 
w ruch turbulentny, który charakteryzuje się chao¬ 
tyczną wymianą elementów wody między strugami. 
Elementy te poruszają się wówczas po nieregularnych 
krzywoliniowych drogach, tworząc w ten sposób 
różnorodne struktury wirowe, których wymiary (skale 
turbulencji) zmieniają się w oceanie od kilku centy¬ 
metrów do kilku tysięcy kilometrów, w zależności 
od rodzaju czynnika wzbudzającego ruch. Tego typu 
wymiana pędu między sąsiadującymi warstwami 
mas wodnych stanowi istotę tzw. turbulentnego tarcia 
wewnętrznego. 

Siły molekularnego i turbulentnego tarcia wew¬ 
nętrznego i odpowiadające im naprężenia styczne 
do powierzchni elementów wody, łącznie z siłami 
ciśnienia hydrodynamicznego, działającego prosto¬ 
padle do powierzchni tych elementów i wywołującego 
naprężenia normalne, warunkują procesy przekazy¬ 
wania energii mechanicznej mas wodnych wewnątrz 
morskiego akwenu. 


Rodzaje zjawisk hydrodynamicznych 
w morzach i oceanach 

Różnorodność czynników zewnętrznych wzbudzają¬ 
cych i warunkujących ruch mas wodnych w morzu 
oraz różnoskalowy charakter ich oddziaływania po¬ 
wodują powstawanie złożonego mechanizmu prze¬ 
kazywania energii zewnętrznej w głąb morskiego 
zbiornika, od większych ustrojów wirowych do mniej¬ 
szych. Mechanizm ten tworzy pole przepływu, którego 
struktura jest wynikiem przypadkowego (losowego) 
nakładania się i przenikania różnych ruchów składo¬ 
wych. Podstawową wielkością charakteryzującą taki 
przepływ jest prędkość chwilowa u elementów wody, 
która zmienia się w sposób przypadkowy w czasie 
i przestrzeni. Prędkość tę możemy zawsze rozłożyć 



Rys. 5. Wycinek oscylogramu prędkości turbulentnego przepływu 
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charakteryzującą turbulencję (rys. 5). W zależności 
od wielkości przedziału czasu lub obszaru przestrzeni, 
w których wypadkowy ruch mas wodnych jest uśred¬ 
niany, parametry u i w 1 mogą mieć różne znaczenie 
i wartości (ruch makroskalowy, mezoskalowy, mikro¬ 
skalo wy). 

Formy mikroskalowe charakteryzują ruch ćlemen- 
tów wody bezpośrednio i nie podlegają żadnemu 
podziałowi. Natomiast wielko- i średnioskalowe 
ruchy mas wodnych w morzu możemy podzielić na 
różne rodzaje. W zależności od przyjętego kryterium 
podziału może to być ruch oscylacyjny, postępowy, 
cyrkulacyjny itp., lub ruch swobodnej powierzchni 
morza, ruch powierzchni skoku gęstości, termohali- 
nowa cyrkulacja, przepływy geostroficzne, dryfowe, 
gradientowe itp. 

Scharakteryzujmy pokrótce najbardziej znane po¬ 
stacie zjawisk hydrodynamicznych w morzach i ocea¬ 
nach. 


A) Ruch falowy 

Jeżeli poziomy rozkład ciśnienia atmosferycznego fale baryczne 
(układ baryczny) będzie niejednorodny, to zgodnie 
z zasadą naczyń połączonych, powierzchnia swobod¬ 
na jednorodnego gęstościowo akwenu nie będzie 
miała położenia poziomego, lecz przybierze kształt 
równoważący ciśnienie atmosferyczne tak, że na do¬ 
wolnej rzędnej poniżej powierzchni swobodnej ciśnie¬ 
nie będzie stałe (rys. 6). Jeżeli ponadto pole baryczne 
będzie się zmieniać w czasie i przemieszczać w okreś¬ 
lonym kierunku, to procesowi temu będzie towarzy¬ 
szyć odpowiedni ruch odkształcenia swobodnej po¬ 
wierzchni morza zwany falą baryczną. Fale baryczne 
należą do kategorii fal nieokresowych, wymuszonych. 

Ich rozmiary i prędkość rozprzestrzeniania się zależą 
od charakterystyki układów barycznych wzbudzają¬ 
cych te odkształcenia oraz od głębokości i rozmiarów 
morskiego akwenu. 



Innym rodzajem występujących w morzu fal nie- fale tsunami 
okresowych są fale samotne, zwane tsunami, należą¬ 
ce do kategorii falowania swobodnego, a wzbudzane 
najczęściej wybuchem podwodnego wulkanu, trzęsie¬ 
niami dna morskiego lub innymi zjawiskami sejsmicz¬ 
nymi. Tsunami w płytkowodnych rejonach przybrzeż¬ 
nych osiągają nieraz wysokość rzędu kilkudziesięciu 
metrów i są zjawiskiem bardzo groźnym dla życia 
i mienia ludzkiego. Tak np. słynny wybuch wulkanu 
na wyspie Krakatau w 1883 r. był przyczyną kata¬ 
strofalnej powodzi morskiej, wywołanej falą tsunami, 
która zniszczyła szereg miast na Jawie i Sumatrze 
oraz pochłonęła ok. 40 000 istnień ludzkich. Powo¬ 
dzie morskie zdarzają się dość często w rejonach le- 























żących na trasach wędrówki fal tsunami. Z tych 
względów instaluje się tam specjalne systemy ostrze¬ 
gawcze, rejestrujące zachowanie się swobodnej po¬ 
wierzchni wód w strefie przybrzeżnej. Na rys. 7 za¬ 
mieszczony jest typowy oscylogram obrazujący 
przebieg fali tsunami. Podstawowym sygnałem mó¬ 
wiącym o zbliżeniu się tsunami jest chwilowe obniże¬ 
nie się wód, zwane zwiastunem (moment f 0 na rys. 7). 
Później następuje faza przejścia tsunami właściwej t% 
i faza t > t t oscylacji wtórnych. 
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Rys. 7. Oscylogram tsunami (wg Takashicgo) 


spiętrzenia Najczęstszymi przyczynami nieokresowego pod- 
5 S p wyższania się i opadania swobodnej powierzchni wód 

dryfowe w stre fi e przybrzeżnej morza są tzw. spiętrzenia i spły¬ 
wy dryfowe, zwane czasem wiatrowymi lub sztor¬ 
mowymi (przy silnych wiatrach). Wywołany silami 
tarcia aerodynamicznego (wiatrem) ruch mas wod¬ 
nych jest w strefie przybrzeżnej tłumiony konturem 
brzegu, stanowiącym dla przepływu wód naturalną 
zaporę, oraz nierównościami i szorstkością dna, któ¬ 
rych wpływ jest tym większy, im mniejsza jest głę¬ 
bokość akwenu. Dlatego średnia prędkość ruchu mas 
wodnych jest tym mniejsza, im bliżej brzegu znajduje 
się miejsce obserwacji przepływu. Zatem przy brze¬ 
gach, na które wiatr wieje (nawietrznych) masy wodne 
spiętrzają się, a przy brzegach przeciwległych (pod- 
wietrznych) spływają. W pierwszym wypadku ob¬ 
serwujemy podnoszenie się poziomu wód, w drugim — 
obniżenie (rys. 8). 


kierunek wiatru 



Rys. 8. Schemat spiętrzenia i spływu dryfowego 


pływy Główne okresowe oscylacje swobodnej powierzchni 
morza wzbudzane są astronomicznymi siłami pływo- 
twórczymi. Oscylacje te, zwane pływami, należą do 
kategorii zjawisk makroskalowych w skali ziemskiego 
globu. Towarzyszą im zawsze w przybrzeżnej strefie 
morza cykliczne spływy wód i obniżanie się swobod¬ 
nej powierzchni akwenu zwane odpływem oraz spię¬ 
trzanie wód — zwane przypływem. W celu zrozu¬ 
mienia mechanizmu tych procesów przyjrzyjmy się 
jeszcze raz rys. 2. Układ Ziemia-Księżyc pozostaje 
w równowadze dlatego, że średnia siła odśrodkowa 

ziemskiego globu (F 0 )ś r równa jest średniej sile gra¬ 
witacyjnej (Fk)śr. Ponieważ siły cząstkowe F 0 , dzia¬ 
łające na dowolne elementy masy ziemskiego globu 

są sobie równe, więc ( F 0 )śr = F 0 . Natomiast siła 

(Fk)&r równa jest sile cząstkowej F* jedynie w środku 
masy Ziemi. Z tych względów w każdym punkcie 


ziemskiego globu istnieć będzie różnica sił F 0 —F* = 

— AF , przybierająca największe wartości w punk¬ 
tach 1 i J, a najmniejsze w punktach 2 i 4 (rys. 9), 
przy czym siły pływotwórcze na półkuli zorientowanej 
w stronę Księżyca (2 -y 3 4) będą nieco większe 

od sił działających na półkuli przeciwnej (4 1 -+ 2). 

Układ sił uwidoczniony na rys. 9 wywoła odpływ wód 
z obszarów 2 i 4 i obniżenie swobodnej powierzchni 
morza w tych rejonach, przypływ zaś wód i podwyż¬ 
szenie powierzchni w obszarach I i 3. Z kolei oś ob¬ 
rotu Ziemi nachylona jest pod pewnym kątem w sto¬ 
sunku do prostej łączącej środki mas Ziemi i Księżyca. 
Przy założeniu, że Ziemia jest całkowicie pokryta wo¬ 
dą, swobodna powierzchnia wód ukształtowałaby się 
jak na rys. 10. 



Księżyc 


Rys. 9. Schematyczny rozkład sił pły wotwórczych na powierzchni 
Ziemi 



^wierzchnia 

Rys. 10. Schemat odkształcenia swobodnej powierzchni wód pod 
wpływem sił pływotwórczych F v 


Księżyc 
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Gdybyśmy teraz przecięli glob ziemski równoleż- pływy 
nikowo, to obwiednie przekroju (rys. 11) zawierałyby 
jeden wysoki i jeden niski stan wód w przekroju rów- 1 połdobowe 
nołeżnika <p = 45° szerokości geograficznej północ¬ 
nej i południowej oraz dwa wysokie i dwa niskie 
stany wód w przekroju równikowym q> = 0. I dla¬ 
tego w czasie jednego obrotu Ziemi dookoła swojej 
osi obserwujemy równoleżnikowy ruch grzbietów 




Rys. 11. Schematy pływów: dobowego i półdobowego 
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i dolin fali pływowej w prawo względem punktów 
stałych na Ziemi. W obszarach <p — i45° w czasie 
jednej doby pojawia się tylko jeden wysoki stan wód 
i jeden niski, będące tzw. pływami dobowymi księży¬ 
cowymi o okresie 25,82 h. W obszarach równikowych 
natomiast pojawiają się w tym czasie dwa stany wy¬ 
sokie i dwa niskie, będące pływami księżycowymi 
półdobowymi o okresie 12,42 h. Te dwa rodzaje 
pływów przenikają się oczywiście wzajemnie i wystę¬ 
pują w każdej szerokości geograficznej, z tym że 
w rejonach <p = 0 i <p = 45° przybierają wartości 
ekstremalne. Analogiczne pływy (dobowe i półdo- 
bowe) występują w układzie wzajemnego oddziały¬ 
wania Ziemia-Słońce. Obserwujemy zatem na Ziemi 
pływy dobowe słoneczne o okresie 24,07 h i pływy 
półdobowe słoneczne o okresie 12 h. 

Pływy dobowe i półdobowe (słoneczne i księżyco¬ 
we) stanowią główne składowe pływów astronomicz¬ 
nych, ale nie jedyne. Niezależnie bowiem od omówio¬ 
nych już mechanizmów — z faktu, że Ziemia krąży 
wokół Słońca i Księżyc wokół Ziemi po orbitach elip¬ 
tycznych wynikają pływy długookresowe: księżycowy 
pófmiesięczny o okresie 13,661 doby i miesięczny 
o okresie 27,555 doby, oraz słoneczny półroczny 
o okresie 182,621 doby i roczny. Ponadto płaszczyzny 
tych orbit nachylone są w stosunku do płaszczyzny 
równika, z czego wynikają pływy mieszane dobowe 
i półdobowe o okresach 23,93 h i 12,97 h. Inne pływy 
mieszane wynikają z nakładania się i przenikania 
różnych fal pływowych oraz zjawisk transformacji 
tych fal w rejonach kontynentalnych szelfów. Wzajem¬ 
ne położenie Księżyca i Słońca względem Ziemi wy¬ 
wiera również wpływ na zjawiska pływowe. Najwięk¬ 
sze amplitudy fali pływowej wzbudzane są wówczas, 
gdy środki mas Ziemi, Słońca i Księżyca leżą na jednej 
prostej (pływ syzygijny, rys. 12), najmniejsze zaś — 
gdy proste łączące środki mas Ziemi, Słońca i Księżyca 
ustawione są prostopadle do siebie (pływ kwadra- 
turowy, rys. 13). 


Księżyc 



syzygijny 
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Gdyby glob ziemski pokryty był całkowicie wodą, 
maksymalna wysokość fali pływowej księżycowej 
(różnica między najwyższym i najniższym stanem 
wód) nie przekraczałaby 55 cm, a fali pływowej 
słonecznej — 24 cm. Istnienie lądów i związanych 
z nimi płycizn szelfowych, zatok i cieśnin, powoduje 
zmniejszanie się prędkości rozprzestrzeniania się fali 
pływowej w miarę zbliżania się do lądu (wpływ tarcia 
przydennego i ograniczenie głębokości akwenu). 
Ponadto przy brzegach stromych część energii fali 
pływowej zostaje zamieniona na pracę sił wzbudza¬ 
jących falę „odbitą”, rozprzestrzeniającą się w kie¬ 
runku przeciwnym do ruchu fali nabiegającej. Wsku- 
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Rys. 14. Układy amfidromiczne w Morzu Bałtyckim, dla pływu 
półdobowcgo. księżycowego (wg Defartta). Położenia linii naj¬ 
większego spadku podane są w stopniach, a amplitudy wahań 
przybrzeżnych w centymetrach 


tek tych zjawisk powstają procesy transformacji fal 
pływowych w obszarach przybrzeżnych, gdzie wy¬ 
stępuje silny wzrost amplitudy pływów, osiągającej 
średnio wartości od 1,30 do 3,00 m (pływy dobowe), 
a w szczególnych okolicznościach (zwężona zatoka) 
dochodzącej nawet do 18 m. 

Długości fal pływowych są rzędu połowy długości prądy 
obwodowej równika. Nic więc dziwnego, że w przy- pływowe 
brzeżnych rejonach nawiedzanych przez pływy, fazy 
przepływu i odpływu obserwowane są w postaci po¬ 
stępowego ruchu wód zwanego prądem pływowym. 

Prądy te podlegają znacznemu oddziaływaniu sił 
Coriolisa, które odchylają tory ruchu elementów 
wody w kierunku prostopadłym do wektora pręd¬ 
kości prądu, w prawo na półkuli północnej i w lewo 
na półkuli południowej. Zjawisko to wywołuje w ak¬ 
wenach morskich spiętrzenie wód w jednych rejonach 
przybrzeżnych i równoczesne ich opadanie w rejonach 
przeciwległych. Linia największego spadku swobodnej 
powierzchni akwenu, łącząca przeciwległe punkty 
najwyższego i najniższego stanu wód, zatacza w ciągu 
całego okresu pływowego krąg, którego środkiem 
jest punkt amfidromiczny. Stan wód w tym punkcie 
przedstawia poziom średni. Linie największego spadku 
swobodnej powierzchni wraz z punktem amfidro- uktaa 
micznym tworzą układ amfidromiczny (rys. 14), amfidro- 
którego znajomość umożliwia przewidywanie mo- miczny 
mentów występowania ekstremalnych stanów pływo 
wych w danym rejonie. 

Pływy astronomiczne to rodzaj fal grawitacyjnych sejsze 
postępowych. Innym rodzajem okresowych oscylacji 
swobodnej powierzchni morza są tzw. fale grawita¬ 
cyjne stojące. Każdy akwen morski, w którym naru¬ 
szona została równowaga hydrostatyczna mas wod¬ 
nych, wykonuje okresowe ruchy swobodnej powierz¬ 
chni wód, zwane sejszami. Stanowią one odpowiednik 
drgań własnych ciała materialnego, a charakteryzują 
się takimi szczegółami właściwymi falom stojącym 
(rys. 15), jak węzły, w których elementy wody znaj- 












dują się w stanie nieruchomym lub wykonują słabe 
poziome ruchy oscylacyjne względem punktu cen¬ 
tralnego (węzła), oraz tzw. strzałki, w których ruch 
elementów wody jest ruchem oscylacyjnym piono¬ 
wym względem poziomu spokoju. Czas, w którym 
swobodna powierzchnia wód w strzałce powraca do 
swego pierwotnego położenia, nazywamy okresem 
drgań własnych. W zależności od rozmiarów i kształtu 
zbiornika okres ten może przybierać szereg wartości 
dla n = 7, 2, 3 ... itd. punktów węzłowych. Mówimy 
wówczas o sejszy jedno-, dwu- lub /z-węzłowej. Ry¬ 
sunek 15 obrazuje uproszczone schematy sejsz 
fz-węzłowych w kanale prostopadłym o stałej głębo¬ 
kości. 
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Rys. 15. Schemat sejszy w prostokątnym, wydłużonym kanale 


W akwenach szerokich mamy do czynienia z sejsza- 
mi wzdłużnymi i sejszami poprzecznymi; ich charak¬ 
terystyki mogą się znacznie różnić. W naturalnych 
akwenach morskich, których nie można w przybliże¬ 
niu traktować jak prostych kształtów kanonicznych 
(prostokąt, koło, elipsa) i które nie mają stałej głębo¬ 
kości, procesy sejszowe są bardzo złożone i opis ich 
jest bardzo trudny. Na rys. 16 zamieszczone są dla 
przykładu profile sejsz wzdłużnych Morza Bałtyckie¬ 
go w układzie Bałtyk Zachodni-Zatoka Fińska. 

W warunkach naturalnych (morze rzeczywiste) 
omówione oscylacje swobodnej powierzchni akwenu, 
wzbudzane siłami wiatrowego oddziaływania (spiętrze- 



Rys. 16. Wykresy profili sejsz Morza Bałtyckiego dla układu Bał¬ 
tyk Zachodni-Zatoka Fińska (wg Kraussa i Magaarfia) 
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nia i spływy dryfowe), dynamiką dna (fale tsuna¬ 
mi), ciśnieniem atmosferycznym (fale baryczne), 
astronomicznymi siłami pływo twórczym i (fale pły¬ 
wowe) oraz drganiami własnymi akwenu (sejsze), 
nakładają się wzajemnie tworząc wypadkowy stan 
wód w morzu. Charakter przestrzenno-czasowej 
zmienności tego stanu zależy od rodzaju dominującej 
oscylacji składowej. I tak np. jeżeli oscylacją dominu¬ 
jącą będą pływy, zmiany stanu wód będą miały cha¬ 
rakter oscylacji okresowych: jeżeli fale baryczne lub 
spiętrzenia i spływy dryfowe — zmiany te będą zmia¬ 
nami nieokresowymi, o charakterze losowym (przy¬ 
padkowym). 

Na opisane wyżej drgania długookresowe i nieokre- 
sowe swobodnej powierzchni morskiego akwenu na¬ 
kładają się różnorodne oscylacje krótkookresowe, 
wśród których falowanie wiatrowe jest zjawiskiem 
najbardziej powszechnym. Turbulentny ruch mas 
powietrza w dolnych warstwach atmosfery charakte¬ 
ryzuje się obecnością różnowymiarowych wirów, 
przemieszczających się nad swobodną powierzchnią 
morza z różnorodną prędkością. Wskutek przypadko¬ 
wości przestrzennego układu tych wirów oraz ich 
zmienności w czasie ciśnienie atmosferyczne działają¬ 
ce na swobodną powierzchnię morza nie jest wielkoś¬ 
cią stałą, lecz ulega zmiennym przypadkowym pul- 
sacjom. Pulsacje te łącznie z siłami tarcia aerodyna¬ 
micznego wzbudzają ruch swobodnej powierzchni 
akwenu w postaci przestrzenno-czasowych chaotycz¬ 
nych oscylacji, zwanych falowaniem wiatrowym 
(il. 198, tabl. 53). 

Wzrost amplitudy niektórych składowych losowego 
pola fal wiatrowych następuje wskutek mechaniczne¬ 
go rezonansu powstającego wówczas, gdy częstość 
pulsacji ciśnień atmosferycznych, przemieszczających 
się w określonym kierunku z prędkością równą pręd¬ 
kości wiatru, jest równa częstości drgań swobodnej 
powierzchni akwenu, rozchodzących się z prędkoś¬ 
cią fazową równą prędkości wiatru. Gdy warunek ten 
nie jest spełniony, drgania ulegają bardziej lub mniej 
intensywnemu tłumieniu. Wskutek istnienia sił tarcia 
aerodynamicznego możliwy jest również wzrost 
wysokości i długości fali tych składowych falowania 
wiatrowego, których prędkość rozprzestrzeniania się 
jest mniejsza od prędkości wiatru. 

Fizyczną strukturę losowego pola fal wiatrowych 
można odwzorować w postaci czasowo-przestrzennej 
superpozycji nieskończonej liczby regularnych fal 
elementarnych (składowych harmonicznych) o róż¬ 
nych amplitudach i częstościach (stałych w obrębie 
poszczególnych ciągów), rozprzestrzeniających się pod 
różnymi kątami względem kierunku działania wiatru. 
Fale te nakładają się wzajemnie z losowym przesu¬ 
nięciem fazowym, tworząc chaotycznie sfalowaną po¬ 
wierzchnię morza. 

Ruch falowy swobodnej powierzchni morza jest 
w stosunku do akwenu ruchem powierzchni górnej. 
Natomiast w stosunku do atmosfery ziemskiej jest to 
ruch falowy powierzchni dolnej, atmosferycznego 
podłoża. W stosunku do obu warstw swobodna po¬ 
wierzchnia akwenu jest powierzchnią rozdziału dwóch 
ośrodków płynnych o różnej gęstości. Wewnątrz 
morskiego akwenu (szczególnie w akwenie oceanicz¬ 
nym) takie powierzchnie rozdziału występują wszędzie, 
gdzie istnieje pionowe zróżnicowanie (ciągłe lub sko¬ 
kowe) gęstościowej struktury wód. Ruch oscylacyjny 
takiej powierzchni to tzw. falowanie wewnętrzne. 

Przyczynami wzbudzającymi fale wewnętrzne mogą 
być ruchy swobodnej powierzchni akwenu, mechaniz¬ 
my wywołujące przejście układu barotropowego 
w układ barokiinowy, siły pływotwórcze, drgania 
własne zbiornika, zjawiska sejsmiczne itp. Charakte¬ 
rystyki fal wewnętrznych są zatem bardzo różnorodne 
i zależą od rodzaju czynnika wzbudzającego. Ogólnie 
można powiedzieć, że fale wewnętrzne są formą ru¬ 
chu analogiczną do fal powierzchniowych z tym uzu¬ 
pełnieniem, że intensywność tego ruchu w poważnej 
mierze zależy od gęstości górnej warstwy wód. 
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Zjawiskiem mającym duże znaczenie praktyczne 
dla podwodnej żeglugi jest zjawisko rezonansu fali 
wewnętrznej z czynnikiem wymuszającym. W wa¬ 
runkach takich wysokość fal wewnętrznych może 
przybierać bardzo duże wartości (kilkudziesięciu, 
a nawet kilkuset metrów) i może być powodem trud¬ 
ności w podwodnej nawigacji, a nawet awarii pod¬ 
wodnego pojazdu. 


B) Prądy morskie 

Drugim, po falowaniu, powszechnym zjawiskiem 
hydrodynamicznym w morzu jest postępowy ruch 
mas wodnych, zwany prądem morskim. Wśród róż- 
prądy norodnych rodzajów tego zjawiska na t pierwszym 
dryfowe miejscu wymienić należy prądy dryfowe. Żeby zrozu¬ 
mieć, jak powstają takie prądy, załóżmy, że osie 
współrzędnych prostokątnych x , y (rys. 17) leżą 
w płaszczyźnie swobodnej powierzchni akwenu i są 
tak ustawione, że wiatr wieje równolegle do osi y. 
Wektor prędkości ruchu wód w warstwie powierz¬ 
chniowej ( V 0 ) wywołanego siłami aerodynamicznymi 
tarcia (r a ) jest w początkowym okresie skierowany 
zgodnie z kierunkiem wiatru (kierunek siłr G ). W miarę 
wzrostu prędkości przepływu siła Corliolisa (F c ) bę- 



Rys. 17. Schemat rozkładu prędkości prądu dryfowego (spirala 
Ekmana) 

dzie coraz bardziej odchylać wektor V 0 (w prawo na 
półkuli północnej, w lewo na półkuli południowej, 
patrząc zgodnie z kierunkiem ruchu) do położenia, 
w którym składowa siły tarcia aerodynamicznego 

(r^ n ) prostopadła do wektora V 0 zrównoważy siłę F c 
(rys. 18). Stan równowagi wystąpi wówczas, gdy wek¬ 
tor K będzie odchylony o 45° od początkowego po¬ 
łożenia. Ze wzrostem głębokości wpływ siły aerody¬ 
namicznego tarcia będzie stopniowo malał i jedno¬ 
cześnie będzie malał moduł prędkości ruchu mas wod¬ 
nych, a kierunek prądu odchylany będzie przez siłę 
Coriolisa o kąt tym większy, im głębiej będzie się 
znajdować miejsce obserwacji, tj. im mniejszy będzie 
wpływ tarcia aerodynamicznego. Na pewnej głębo¬ 
kości ze, zależnej od prędkości wiatru, kierunek prądu 
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(wektora V z ) będzie przeciwstawny kierunkowi prądu 

powierzchniowego (kierunkowi wektora V 0 ), a moduł 
prędkości \V Z \ będzie tak mały, że z praktycznego 
punktu widzenia prąd dryfowy na głębokości ze, 
zwanej grubością warstwy Ekmana, nie będzie istniał. 



Drugim rodzajem postępowego ruchu mas wod- prądy 
nych w morzu są prądy gradientowe, wzbudzane róż- gradientowe 
nicą ciśnień hydrostatycznych panujących w sąsiadu¬ 
jących ze sobą obszarach akwenu. Przypuśćmy, że 
wiatr, który wywołał spiętrzenie dryfowe, ucichł i spię¬ 
trzone masy wód znajdujących się pod przeważają¬ 
cym wpływem sił ciężkości. Nacnylenie swobodnej 
powierzchni akwenu będzie w przybliżeniu takie, jak 
na rys. 18. Różnica ciśnień hydrostatycznych panują¬ 
cych w dwóch punktach znajdujących się na prostej 
poziomej, równoległej do osi y, zawsze będzie miała 
tę samą wartość, niezależnie od głębokości z. Wy¬ 
wołana tą różnicą ciśnień pozioma siła gradientu 
ciśnienia będzie powodować ruch mas wodnych. Siła 
ta będzie miała taką samą wartość w całym piono¬ 
wym przekroju akwenu od dna do swobodnej po¬ 
wierzchni wód, ale prędkość mas wodnych na różnej 
głębokości będzie różna. Przy samym dnie ruch będzie 
tłumiony siłami tarcia przydennego i jego kierunek 
będzie zgodny z kierunkiem gradientu ciśnienia (kie¬ 
runek osi y). W miarę oddalania się od dna tłumiący 
wpływ sił tarcia maleje, prędkość przepływu rośnie, 
a wraz z nią rośnie siła Cariolisa odchylająca wektor 
prędkości przepływu. Na pewnej głębokości z g , za¬ 
leżnej od wartości gradientu ciśnienia, wektor siły 
Coriolisa skierowany będzie przeciwnie do wektora 
siły wywołanej różnicą ciśnień. Prędkość przepływu 
mas wodnych zorientowana będzie w tym wypadku 
równolegle do osi *. Powyżej głębokości z g prędkość 
prądu będzie stała, prostopadła do kierunku działania 
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Rys. 19. Schemat rozkładu prądów w głębokim oceanie 
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gradientu ciśnienia. Zatem w warstwie akwenu od 
swobodnej powierzchni do głębokości z g prądy gra¬ 
dientowe będą miały charakter przepływów geostro¬ 
ficznych. 

Jeżeli rozkład gęstości wód morskich jest rozkładem 
niejednorodnym w przestrzeni, to wskutek istnienia 
różnicy gęstości powstają poziome siły wywołane 
różnicą ciśnienia, analogiczne do wyżej opisanych, 
wzbudzające ruch mas wodnych w morzu, zwany 
prądem gęstościowym. Fizyczny opis tych prądów 
jest bardzo złożony, ponieważ wraz z przepływem wód 
zmieniają się gradienty gęstości (woda napływająca 
ma często inną temperaturę i zasolenie). 

W warunkach naturalnych prądy dryfowe i prądy 
gradientowe przenikają się i nakładają wzajemnie, 
powodując wzrost lub osłabienie wypadkowego prze¬ 
pływu wód. 

W górnych warstwach akwenu z reguły mamy do 
czynienia z prądami mieszanymi: dryfowymi i gradien¬ 
towymi geostroficznymi (rys. 19). Poniżej warstwy 
Ekmana przepływ ma charakter prądów gradiento¬ 
wych geostroficznych, a jeszcze niżej — gradientowych 
niegeostroficznych. 

Jeżeli w akwenie morskim występuje wewnętrzna 
powierzchnia skoku gęstości (rys. 20), co się często 
zdarza, to przez pewien stosunkowo krótki czas prze¬ 
pływy dryfowe są wzbudzane w obu warstwach. 
Układ taki nazywamy barotropowym. Po pewnym 
czasie różnice ciśnień wywołane spiętrzeniem dryfo- 
wym w górnej warstwie zostają wyrównane w dolnej 
warstwie i dryfowy przepływ mas wodnych odbywa 
się wyłącznie w warstwie górnej. Powierzchnia skoku 
gęstości zmienia przy tym swoje położenie na prze¬ 
ciwstawne. Układ taki nazywamy barokiinowym. 
Przy długotrwałym działaniu wiatru mamy do czynie¬ 
nia prawie wyłącznie z układami ba roki in owymi. 
Zmiany prędkości pola wiatru w okresach krótszych 
od godziny tworzyć będą układy barotropowe. 
W okresach zmienności od godziny do doby mamy 
do czynienia z układami mieszanymi. Okresom zbli¬ 
żonym do okresu tzw. doby wahadłowej towarzyszą 
zawsze układy barokiinowe, a w okresach większych 
od 1 doby a mniejszych od 7 dób akwen reaguje znów 
jak ośrodek jednorodny. 
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Rys. 20. Schemat układów: a) barotropowego i b) baroklinowego 
w uwarstwionym oceanie 
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Rys. 21. Schemat głównych układów cyrkulacyjnych wód w południkowym przekroju środkowej części Oceanu Atlantyckiego 
(wg Defanta) 
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Rys.22. Rozkład prądów powierzchniowych w oceanie światowym w miesiącach luty-marzec (wg Sverdrupa). Strzałki oznaczają wektory prędkości 








































wielko- Postępowy ruch mas wodnych w wielkich zbiorni- 
skalowa kach oceanicznych jest niewspółmiernie bardziej 
cyrkulacja złożony niż prądy w akwenach jednorodnych. Istnie¬ 
nie dwóch biegunów zimna i związany z tym niejedno¬ 
rodny rozkład gęstości wód jest czynnikiem wzbu¬ 
dzającym cyrkulację mas wodnych i zjawiska termo- 
halinowej dyfuzji na wielką skalę, w pionowej płasz¬ 
czyźnie południkowej (rys. 21). Z kolei zmienność 
siły Coriolisa ze zmianą szerokości geograficznej 
oraz oddziaływanie wielkoskalowych poziomych 
układów cyrkulacyjnych atmosfery w warstwie przy- 
wodnej wywołują obszerne zamknięte układy cyrku- 
lacyjne oraz intensyfikują przepływy mas wodnych 
przy wschodnich brzegach kontynentów półkuli pół¬ 
nocnej. Na rys. 22 uwidoczniony jest przykładowy 
rozkład prądów powierzchniowych w oceanie świato¬ 
wym. Widoczna jest na nim wyraźna intensyfikacja 
przepływu w pobliżu wschodnich brzegów kontynen¬ 
talnych półkuli północnej (Golfsztrom, Kuro-siwo, 
1-2 m/s), strefy silnych prądów podzwrotnikowych 
oraz dwa równoległe układy cyrkulacyjne: jeden na 
półkuli północnej, gdzie ruch mas wodnych skiero¬ 
wany jest zgodnie z ruchem wskazówek zegara, i drugi 
na półkuli południowej o orientacji przeciwnej. 


Metody badania morskich procesów 
dynamicznych 

Badanie praw rządzących ruchem mas wodnych oraz 
różnorodnymi jego osobliwościami w morzach i ocea¬ 
nach realizowane jest współcześnie metodami empi¬ 
rycznego i matematycznego modelowania przy wy¬ 
korzystaniu znajomości równań hydrodynamiki (mo¬ 
dele hydrodynamiczne), oraz zasad teorii podobień¬ 
stwa, statystyki matematycznej i teorii funkcji loso¬ 
wych (modele stochastyczne). 

modelowanie Badania na modelach hydrodynamicznych (teore- 
hydro- tyczne i empiryczne) mogą być prowadzone w dwóch 
dynamiczne układach analitycznych: w układzie analizy wędrow¬ 
nej (współrzędne Lagrange’a) opisującej w czasie 
i przestrzeni ruch konkretnego, ciągle tego samego 
elementu wody oraz w układzie analizy lokalnej 
(współrzędne Eulera) opisującej zmiany w czasie 
charakterystyk ruchu różnych elementów w wybranym 
stałym punkcie. 

Modelowanie empiryczne polega na hydraulicznym 
odwzorowaniu w zmniejszonej skali, całego zbiornika 
morskiego, lub jego wycinka, oraz symulowaniu w ta¬ 
kim modelowym akwenie (il. 199, tabl. 53) czynników 
wzbudzających ruch masy wodnej, zgodnie z zasadami 
teorii podobieństwa. Badania prowadzone tą metodą 
dotyczą przeważnie rozpoznawania czasowo-prze- 
strzennych zmian takich charakterystyk jak fluktuacja 
położenia swobodnej powierzchni wód, stany i zmien¬ 
ność ciśnień hydrodynamicznych, prędkości, przy¬ 
spieszeń, drogi ruchu elementów wody, linii prądu 
oraz różnorodnych charakterystyk pochodnych. Za¬ 
rejestrowane za pośrednictwem specjalnej aparatury 
pomiarowej wartości bezwzględne tych charaktery¬ 
styk poddaje się różnorodnej analizie, umożliwiającej 
rozpoznanie praw rządzących przebiegiem badanego 
procesu hydrodynamicznego. 

Modelowanie matematyczne polega na numerycz¬ 
nym lub analitycznym odwzorowaniu procesu, w skali 
1:1, w oparciu o hydrodynamiczne równania ruchu. 
W modelowaniu tym przyjmuje się pewne warunki 
początkowe i warunki brzegowe, określające a priori 
charakterystykę procesu w momencie rozpoczęcia 
badań (obserwacji procesu) oraz jego stanu na gra¬ 
nicznych powierzchniach morskiego akwenu (po¬ 
wierzchnia swobodna wód, dno i brzegi morskiego 
zbiornika). Ponadto przyjmuje się szereg założeń 
upraszczających, jak np. że woda jest nieściśliwa i nie- 
lepka, a wektorowe pole prędkości ruchu elementów 
wody jest polem potencjalnym. 

Rejestrując bezpośrednio w morzu (w stanie na¬ 
turalnym) czasowe i przestrzenne zmiany różnorod¬ 


nych parametrów ruchu .masy wodnej otrzymujemy 
dane opisujące własności empirycznej funkcji odwzo¬ 
rowującej określoną charakterystykę ruchu (kinema¬ 
tyczną lub dynamiczną)zmienną w czasie i przestrzeni. 
Te funkcje empiryczne mają z reguły charakter funk¬ 
cji losowych, których właśności mogą być opisane 
metodami opartymi na teorii prawdopodobieństwa 
i statystyce matematycznej. Charakterystyki morskich 
procesów hydrodynamicznych mają w znacznej więk¬ 
szości rozkład normalny funkcji gęstości prawdopo¬ 
dobieństwa oraz taką własność, że operacje uśred¬ 
niania w zespole realizacji funkcji losowej mogą 
być zastąpione operacją uśredniania w jednej, do¬ 
statecznej długości realizacji czasowej lub przestrzen¬ 
nej. Modelowanie stochastyczne tego rodzaju proce¬ 
sów może być realizowane za pośrednictwem czterech 
charakterystyk: wartości przeciętnej, charakteryzu¬ 
jącej najbardziej prawdopodobną wartość danego pa¬ 
rametru (np. średnią prędkość prądu, średnią wyso¬ 
kość falowania), wariancji charakteryzującej inten¬ 
sywność fluktuacji wartości chwilowych względem 
średniej (np. pulsacje prędkości ruchu elementów 
wody, chwilowe amplitudy falowania wiatrowego), 
funkcji korelacji charakteryzującej związek między 
chwilowymi wartościami danej charakterystyki lub 
wartościami dwóch dowolnych, różnych charaktery¬ 
styk oraz funkcji widmowej gęstości mocy pulsacji 
procesu, charakteryzującej energię falowania lub moc 
fluktuacji dowolnej charakterystyki. Modelowanie 
stochastyczne może być realizowane również w opar¬ 
ciu o teoretyczną postać przyjętej a priori funkcji lo¬ 
sowej. 

Często stosowaną metodą badania morskich pro¬ 
cesów hydrodynamicznych jest modelowanie deter- 
ministyczno-stochastyczne. Przeważnie modele takie 
uzyskuje się przez wprowadzenie do hydrodynamicz¬ 
nych równań ruchu warunków brzegowych w postaci 
funkcji losowej lub jej statystycznych, lub stocha¬ 
stycznych charakterystyk. 

Matematyczne modelowanie (hydrodynamiczne 
i stochastyczne) oraz system badań empirycznych 
prowadzonych na statkach, bojach oceanograficznych 
i różnorodnych stacjach autonomicznych (il. 197, 
tabl. 52), stanowią dziś główne źródło informacji 
o prawach rządzących złożonym, różnowymiarowym 
i wielorodzajowym ruchem mas wodnych w morzach 
i oceanach. 
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Praktyczne problemy dynamiki morza 

Ruch mas wodnych w morzach i oceanach jest zja¬ 
wiskiem ważnym dla technicznej i gospodarczej dzia¬ 
łalności człowieka. Niemal każde przedsięwzięcie 
techniczne w przybrzeżnej strefie morza uzależnione 
jest od intensywności i zasięgu tych procesów hydro¬ 
dynamicznych. Budowle osłonowe nowoczesnych por¬ 
tów morskich, autonomiczne stanowiska przeładun¬ 
kowe i morskie szyby wiertnicze w akwenie odsłonię¬ 
tym, elektrownie pływowe, urządzenia dla zrzutu 
i poboru wód morskich i tym podobne inwestycje 
techniczne uwarunkowane są zawsze zakresem zmien¬ 
ności stanu wód i dynamicznym oddziaływaniem fa¬ 
lowania morskiego. Przenikające do wnętrza portu fale 
wiatrowe są czynnikami generującymi wzmożone 
drgania swobodnej powierzchni portowego akwenu, 
które utrudniają lub wręcz uniemożliwiają przeładun¬ 
kową działalność w porcie. Działanie fal wiatrowych działanie 
jest często przyczyną naruszania stateczności budowli niszczące 
hydrotechnicznej, stałego niszczenia naturalnych brze¬ 
gów morskich i konstrukcji ochronnych (il. 200, 
tabl. 53) oraz zapiaszczenia torów i kanałów żeglugo¬ 
wych. Groźne powodzie morskie, wywołane falą 
tsunami i silnym spiętrzeniem sztormowym, są dla 
nawiedzanych przez nie krajów (np. Japonia lub Ha¬ 
waje) istną plagą, pochłaniają znaczne środki material¬ 
ne, a przede wszystkim narażają życie ludzkie. 

Możliwości wykorzystania mechanicznej energii 
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morza do praktycznych potrzeb człowieka związane 
są dziś głównie z pływami oraz prądami morskimi. 
Wywołane nimi kilkunastometrowej wysokości spię¬ 
trzenia wód w przybrzeżnej strefie morza mogą służyć 
do produkcji energii elektrycznej (elektrownie pływo¬ 
we). Astronomiczne pływy w fazie przepływu umożli¬ 
wiają statkom morskim żeglugę w głąb lądu (np. do 
Londynu). Prądy morskie i termohalinowa cyrkulacja 
wód to w głównej mierze mechanizmy przenoszenia 
zawartych w wodzie substancji biernych (sole, zawie¬ 
siny, zanieczyszczenia). Każdemu rejonowi odpływu 
wód powierzchniowych towarzyszy skierowany ku 
górze napływ wód głębinowych, przenoszących sub¬ 
stancje biogenne. W konsekwencji rejony te charakte¬ 
ryzuje wzmożona produkcja pożywienia dla ryb i wy¬ 
soki stan zarybienia. 

Ponadto konieczność intensyfikacji lądowych źró¬ 
deł surowców żywnościowych stawia dziś przed nauką 
i praktyką zadanie zwiększenia dokładności prognoz 
meteorologicznych i klimatycznych z dowolnym dys¬ 
tansem wyprzedzenia w czasie. Dziś wiemy już, że 
ziemskie lądy wywierają na zjawiska meteorologiczne 
i klimatyczne wpływ niewielki w porównaniu z wpły¬ 
wem mórz i oceanów. Z tych względów dokładne 
poznanie różnowymiarowych procesów wzajemnego 
oddziaływania morza i atmosfery oraz związanych 
z nimi zjawisk hydrodynamicznych, nabiera z roku 
na rok coraz większego znaczenia. 

Turbulentne zjawiska dyfuzji i mieszania wód 
odgrywają dziś w dobie intensywnego zanieczyszcze¬ 
nia wód morskich, które towarzyszy współczesnej 
cywilizacji i pociąga za sobą ekologiczne zmiany 
środowiska, rolę naturalnego mechanizmu oczyszcza¬ 
nia wód. Dzięki tym procesom do dziś jeszcze odpro¬ 
wadza się do morza różnego rodzaju ścieki i odpady 
bez katastrofalnie negatywnych dla siebie skutków 


Optyka morza 

Jerzy Dera 

Optyka morza zajmuje się badaniem rozchodzenia 
się i oddziaływania światła w morzu, a szczególnie 
światła słonecznego, niosącego energię, która pod¬ 
trzymuje życie wszystkich organizmów morskich 
oraz procesy termodynamiczne decydujące o klimacie 
ziemskim. Około 98% energii wchodzącego do morza 
promieniowania słonecznego (głównie o długościach 
fal X < 4 pm) pochłania woda morska, zamieniając 
je na ciepło. Energia ta, dostarczana nierównomiernie 
masom wodnym w przestrzeni oceanu, podtrzymuje 
potężne, międzykontynentalne cyrkulacje tych mas 
i powoduje wyparowywanie z powierzchni oceanu 
do atmosfery średnio ok. metrowej warstwy wody 
rocznie oraz wypromieniowywanie olbrzymich ilości 
ciepła. Pociąga to za sobą również cyrkulacje mas 
powietrza wraź z parą wodną, Odbywające się czasem 
w sposób bardzo burzliwy, w postaci huraganów. 
Masy wodne i powietrze, niosące w ten sposób ciepło 
z mocno nasłonecznionych stref gorących ku biegu¬ 
nom, wyrównują i łagodzą klimat ziemski oraz pod¬ 
trzymują odżywczy obieg wody w przyrodzie. 

Nie mniej ważną rolę w kształtowaniu środowiska 
życia na Ziemi odgrywa pozostała drobna część 
energii światła słonecznego w morzu. Zaledwie ułamek 
procenta wchodzącej do morza energii zostaje zuży¬ 
wany na fotosyntezę materii organicznej w komór- 
fotosynteza kach fitoplanktonu. Ta produkowana z wody, dwu- 
w morzu tlenku węgla i zawartych w wodzie pierwiastków 
chemicznych materia organiczna (węglowodany, 
tłuszcze, białka) jest pierwszym ogniwem łańcucha 
pokarmowego wszystkich organizmów morskich (stąd 
fotosyntezę i towarzyszące jej procesy wzrostu ko¬ 
mórek zwiemy biologiczną produkcją pierwotną). 
Produktem reakcji fotosyntezy jest także wolny tlen, 
który służy do oddychania roślinom i zwierzętom 
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morskim oraz do utleniania nie zużywanych i zanie¬ 
czyszczających wodę substancji organicznych. Znacz¬ 
na część produkowanego w procesie fotosyntezy wol¬ 
nego tlenu ulatnia się z morza do atmosfery, dzięki 
czemu 60-90% (wg różnych oszacowań) wolnego 
tlenu w atmosferze ziemskiej pochodzi z morza. 
Oprócz fotosyntezy materii organicznej, pod wpły¬ 
wem światła w morzu zachodzi wiele innych ważnych, 
mało jeszcze zbadanych reakcji fotochemicznych, 
prowadzących np. do rozpadu niektórych szkodli¬ 
wych związków organicznych, do wydzielania jodu 
czy zabijania niektórych gatunków bakterii. 

Najczystsze morza świata mają w świetle słonecz¬ 
nym wyraźny ciemnobłękitny kolor; jest to skutek 
silnego rozpraszania fioletu na cząsteczkach wody. 
Ze wzrostem głębokości w morzu energia światła 
dziennego znacznie maleje wskutek jego rozpraszania 
i absorpcji przez wodę, oraz przez zawarte w niej 
zawiesiny i rozpuszczone substancje organiczne, któ¬ 
rych ilość zależy od stopnia zanieczyszczenia danego 
akwenu. Zawarta w wodzie sól morska osłabia światło 
widzialne w minimalnym stopniu. Pomimo to nawet 
w najczystszych i najbardziej nasłonecznionych mo¬ 
rzach (np. w Morzu Sargassowym lub we wschodniej 
części Morza Śródziemnego) na głębokości 1000 m 
panuje ciemność. Nie jest to jednak ciemność abso¬ 
lutna, ponieważ wiele organizmów morskich posiada 
zdolność świecenia, zwanego bioluminescencją. 

Wraz z głębokością zmienia się w morzu skład 
widmowy światła, stopień jego rozproszenia, stopień 
polaryzacji, fluktuacje natężenia, wywołane falowa¬ 
niem powierzchni morza, i inne właściwości, do któ¬ 
rych przystosowują się rośliny i zwierzęta żyjące na 
różnych głębokościach. I tak np. barwniki w komór¬ 
kach fitoplanktonu pochłaniające światło potrzebne 
do fotosyntezy są tak dobierane przez naturę, że 
maksymalnie wykorzystują całe widmo światła do¬ 
stępne na danej głębokości. Nie jest też przypadkowe 
zabarwienie ryb; służy im ono przede wszystkim do 
maskowania się w środowisku wodnym (jasne pod¬ 
brzusze ryby jest zwykle słabo widoczne z dołu, na 
tle jasnej powierzchni morza, ciemny zaś grzbiet 
ryby jest źle widoczny z góry, na tle ciemnej toni wod¬ 
nej; czerwony kolor ryb głębinowych jest zupełnie 
niewidoczny w pozbawionym czerwieni świetle na¬ 
turalnym na dużych głębokościach, a to wskutek 
silnego pochłaniania czerwieni przez molekuły wody). 
Skomplikowane są także organy wzroku niektórych 
gatunków zwierząt morskich; dzięki temu są one 
zdolne rozróżniać wiele cech światła, jak barwa, 
kątowy rozkład natężeń, czy kierunek polaryzacji. 
Różne cechy podwodnego światła są wykorzysty¬ 
wane przez ryby i inne zwierzęta morskie do ich 
orientacji podczas wędrówek w przestrzeni wodnej, 
pozbawionej często innych znaków szczególnych; 
wiele organizmów wędruje wraz z dobowymi zmiana¬ 
mi oświetlenia, przemieszczając się na dużą głębokość 
w dzień, a ku powierzchni — w nocy. 

Zasięg widoczności przedmiotów w wodzie, za¬ 
równo gołym okiem, jak i za pomocą przyrządów 
optycznych lub kamer telewizyjnych, nie przekracza 
100 m nawet w najczystszych morzach, a na ogół 
jest dużo mniejszy (w Bałtyku np. od kilku do kilku¬ 
nastu metrów). 
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Badania rozchodzenia się światła w morzu 

Ten rodzaj badań rozpoczęto pod koniec XIX w.; 
używano przy tym klisz fotograficznych naświetla¬ 
nych naturalnym światłem panującym na różnych 
głębokościach. Już wówczas stwierdzono znaczne 
różnice w poszczególnych akwenach morskich. Stop¬ 
niowe udoskonalanie fotograficznych metod badań 
doprowadziło w 1922 r. znanego oceanologa duńskie¬ 
go, M. Knudsena, do zastosowania spektrografu. Za 
pomocą spektrografu stwierdzono, że nie tylko na¬ 
tężenie, ale i widmo światła dziennego zmienia się 




wraz z głębokością w morzu i jest bardzo różne w róż¬ 
nych morzach (rys. 23). W tym samym czasie zasto¬ 
sowano pierwsze detektory fotoelektryczne. Spowo¬ 
dowało to przełom w badaniach, gdyż pozwoliło na 
zdalne dokonywanie pomiarów światła w głębi morza 
za pomocą przyrządu opuszczanego z burty statku, 
a połączonego kablem z miernikiem prądu fotoelek- 
trycznego znajdującym się na pokładzie statku. 



oświetlenie 

0,01 0.10 



zielone) 

Kolejny znaczny skok w postępie badań nastąpił 
dopiero w latach sześćdziesiątych naszego stulecia, 
kiedy to powszechnie wprowadzono do pomiarów 
światła w morzu czułe fotopowielacze i filtry inter¬ 
ferencyjne, pozwalające precyzyjnie wydzielić z wid¬ 
ma światła dowolne, wąskie pasmo badanych fal 
świetlnych. Postęp ten wiąże się oczywiście z ogólnym 
rozwojem fizyki i techniki badań naukowych oraz 
z nowymi, doskonalszymi metodami matematycznej 
analizy procesów fizycznych za pomocą komputerów. 

Współczesne urządzenia do badań optycznych 
w morzu działają prawie wyłącznie na zasadzie wy¬ 
korzystania zjawiska fotoelektrycznego w takich prze¬ 
twornikach jak fotopowielacze, fotokomórki próż¬ 
niowe, ogniwa selenowe i fotooporniki półprzewodni¬ 
kowe. Przetwornik umieszcza się w wodoszczelnej 
morskie zanurzanej części przyrządu, zwanej sondą optyczną. 

sondy Sonda jest ponadto wyposażona w precyzyjny układ 
optyczne optyczny, w skład którego wchodzi wodoszczelne 
okienko (wejście dla światła), układ filtrów optycz¬ 
nych lub monochromator oraz odpowiedni układ 
soczewek i przesłon (zależnie od potrzeb i przezna¬ 
czenia przyrządu). Na ogół niezbędnym elementem 
sondy optycznej jest też precyzyjny wzmacniacz linio¬ 
wy, który wzmacnia prąd fotoelektryczny z przetwor¬ 
nika przekazywany za pośrednictwem kabla do od¬ 
biornika na pokładzie statku. Niektóre przyrządy 
optyczne, służące np. do pomiarów rozpraszania 
światła lub osłabiania wiązki światła, wymagają także 


wyposażenia sondy we własne źródło światła. Jest 
to najczęściej żarówka punktowa z kolimatorem 
optycznym lub laser umieszczony na konstrukcji 
nośnej sondy w oddzielnym, wodoszczelnym pojem¬ 
niku. Bardziej złożone urządzenia mają ponadto 
zdalny elektromechaniczny zmieniacz filtrów lub 
układ sterowania monochromatora (wybierania żą¬ 
danej długości fali), urządzenie do zmiany zakresu 
czułości przyrządu, urządzenie do zamiany prądu fo¬ 
toelektrycznego w impulsy elektryczne, które mogą 
być przesyłane kablem o mniejszej liczbie przewodów, 
a nawet poprzez wodę w postaci impulsów dźwięko¬ 
wych. Gdy w sondzie znajduje się fotopowielacz, 
musi tam również być zasilacz wysokiego napięcia, 
regulowany napięciem niskim (z akumulatora) po¬ 
przez kabel z pokładu statku. Przy wnikliwych po¬ 
miarach rozpraszania światła konieczny jest także 
elektromechaniczny układ do zmiany i zdalnego 
odczytu kąta położenia odbiornika w stosunku do 
rozpraszanej wiązki światła. W badaniach dopływu 
strumieni światła z różnych kierunków w przestrzeni 
wodnej sonda musi być ponadto wyposażona w kie¬ 
runkowy odbiornik światła oraz skomplikowany 
i zdalnie regulowany układ śrub napędowych i sterów, 
aby wisząc na linie na dowolnej głębokości w morzu, 
ustawiała się w żądanym i kontrolowanym kierunku. 

Zależnie od budowy i przeznaczenia rozróżnia się 
sondy zwane przezroczomierzami, miernikami pod¬ 
wodnego oświetlenia, miernikami rozpraszania świat¬ 
ła, miernikami radiacji itp. (rys. 24 i il. 201, 202 z tabl. 

53). 

Drugą część aparatury pomiarowej stanowią zwyk- pokładowa 
le urządzenia zasilające, sterujące i rejestrujące, in- aparatura 
stalowane na pokładzie statku i połączone z sondą rejestrująca 
wodoszczelnym kablem elektrycznym. Ze względu 
na statystyczne fluktuacje mierzonych wielkości 
i wynikającą stąd potrzebę wykonywania dużych 
serii pomiarów, sygnały z sond optycznych coraz 
rzadziej odczytuje się mikroamperomierzem. Używa 
się raczej miliwoltomierzy z automatycznym zapisem 
analogowym na taśmie papierowej, a w najnowszych 
urządzeniach — perforatorów lub rejestratorów mag¬ 
netycznych rejestrujących sygnały w postaci dostoso¬ 
wanej do komputera. Najnowocześniejsze statki 
badawcze, np. polski statek badawczy „Profesor 
Siedlecki”, wyposażone są w komputer, który może 
bezpośrednio odbierać sygnały z sond pomiarowych 
i automatycznie obliczać żądane wielkości, takie jak 
współczynniki absorpcji i rozpraszania światła, 
współczynniki osłabiania oświetlenia z głębokością, 
a także korelacje tych wielkości z innymi wielkościami 
opisującymi stan badanego środowiska wodnego. 

Tak dalece skomplikowana automatyzacja jest jednak 
opłacalna tylko przy masowych pomiarach prze¬ 
strzennych. 

Wszystkie morskie urządzenia pomiarowe, zarów¬ 
no pracujące pod wodą, jak i nad wodą, muszą być 
szczególnie odporne na działanie niszczących czyn¬ 
ników żywiołu morskiego (korozję, przyspieszenia 
wstrząsy i wibracje, ciśnienie hydrostatyczne, sól 
morska itp.). 

Pomimo tych znacznych trudności technicznych, 
praktycznie wszystkie właściwości optyczne wody 
morskiej i mas wodnych w morzu badane są zdalnie 
in situ (w naturalnych warunkach w danym miejscu 
toni wodnej), a nie w laboratorium na próbkach wody. 

Jest to konieczność podyktowana szybkimi zmianami 
zachodzącymi w próbce wody morskiej po jej za¬ 
czerpnięciu, spowodowanymi działaniem bakterii 
i planktonu, obumieraniem komórek planktonu, 
koagulacją i opadaniem zawiesin, zmianami chemicz¬ 
nymi pod wpływem zmian oświetlenia, ciśnienia, 
temperatury itp. Niektóre trudniejsze pomiary mo¬ 
żna wykonać w laboratorium na pokładzie statku 
natychmiast po zaczerpnięciu próbki wody z morza. 

Postęp w rozwoju metod i techniki optycznych osiągnięcia 
badań morza umożliwił rozpoznanie większości skom- naukowe 
plikowanych procesów optycznych w morzu. Zbada- 
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no absorpcję i rozpraszanie energii światła słonecz¬ 
nego w przestrzeni wodnej, powstawanie specyficz¬ 
nych pól podwodnego światła dziennego, o różnych 
właściwościach wfdmowych w różnych wodach i w 
różnych warunkach zewnętrznych (zależnych np. od 
położenia Słońca na niebie, od zachmurzenia, falo¬ 
wania powierzchni morza), zbadano selektywne od¬ 
działywanie różnych składników wody morskiej ze 
światłem, polaryzację podwodnego światła, przeno¬ 
szenie informacji w postaci optycznego obrazu przed¬ 
miotów zanurzonych w wodzie (widoczność pod¬ 
wodna, zastosowanie kamer telewizyjnych i fotogra¬ 


JF 


ficznych), obraz i kolor morza widoczny z przestrzeni 
nadmorskiej (interpretacja zdjęć lotniczych i satelitar¬ 
nych morza) i wiele innych. 

Obecnie trwają intensywne badania i poszukiwania 
ilościowych związków między właściwościami skład¬ 
ników wody morskiej i rozmieszczeniem tych skład¬ 
ników w oceanach a optycznymi właściwościami mo¬ 
rza oraz uzależnieniem tych właściwości od innych 
procesów przyrodniczych zachodzących w środo¬ 
wisku morskim. Opracowuje się modele matematyczne 
tych zjawisk, tak by na podstawie mniej licznych 
pomiarów można było przewidywać przebieg proce¬ 
sów optycznych i ich wpływ na przemiany energii 
słonecznej w olbrzymich przestrzeniach oceanów. 
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promienie padające pod znacznym kątem do osi 
optycznej (a >0,5 ) nie wchodzą do odbiornika 


a) 



- pole widzenia 


okienko optyczne 


filtr interferencyjny 
kolimator optyczny 


przesłony 

przeciwodbiciowe 


obudowa wodoszczelna 


w \ (m 


pole widzenia 
, w kącie bryłowym 2/r 

kolektor Lamberta 
(mleczne szkło) 


1 



osłona ogran,czająca 
kąt widzenia do 2“ 


nasadka na okienko miernika radiacji 
która zmienia go w miernik oświetlenia 


odbiornik światła 
(fotopowieiacz) 


kabel 

doprowadzający 


JL. 



obecne 

badania 


Rys. 24. Sondy optyczne do badań morza: a) Schemat przekroju 
sondy miernika radiacji i oświetlenia w morzu, b) Schemat kon¬ 
strukcji sondy do pomiarów współczynnika osłabiania światła w 
morzu zw. przezroczomicrzcm morskim, c) Schemat konstrukcji 
miernika, funkcji rozpraszania światła w morzu, d) Schemat ukła¬ 
du optycznego miernika radiacji i oświetlenia tzw. spektroradio- 
mctru Scrippsa (od nazwy słynnego Instytutu Oceanografii Scripp- 
sa w Kalifornii) przeznaczonego do bardzo dokładnych pomiarów 
widmowych w morzu. Na schemacie rozróżnić można dwa wejścia 
optyczne otwierane alternatywnie przez ruchome zwierciadło (np. 
dla światła badanego i wzorcowego lub dla radiacji i oświetlenia), 
dwa sprzężone ze sobą monochromatory zbudowane na siatkach 
dyfrakcyjnych, fotopowieiacz jako odbiornik światła oraz dodat¬ 
kowy (przesuwany) filtr optyczny odcinający ślady światła czer¬ 
wonego przy pomiarach w obszarze krótkofalowej części widma. 
Całość wbudowana jest w wodoszczelną obudowę i zdalnie za po¬ 
średnictwem kabla rejestruje automatycznie widma oświetlenia 
lub radiacji w morzu (J. E. Tyler, 1965 r.). e) Szkic konstrukcji 
i ustawienia radiopławy do zdalnych pomiarów optycznych w mo¬ 
rzu zbudowanej w Zakładzie Oceanologii PAN w Sopocie w 1971 r. 


konstrukcja nośna z zawieszeniem 
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Właściwości optyczne morza rzeczywiste 
i pozorne 


właściwości 
rzeczywiste 
i pozorne 


radiacja 


Rzeczywiste właściwości optyczne morza zależą wy¬ 
łącznie od natury samej wody morskiej i zawartych 
w niej składników, nie są zależne od zewnętrznych 
warunków oświetlenia morza. Do rzeczywistych 
właściwości optycznych zalicza się współczynnik zała¬ 
mania światła n , funkcję rozpraszania światła p opi¬ 
sującą kątowy rozkład rozpraszania, całkowity 
współczynnik rozpraszania światła ó, współczynnik 
absorpcji a i współczynnik osłabiania (wiązki) świa¬ 
tła c. Pozorne właściwości optyczne morza zależą 
zarówno od właściwości rzeczywistych, czyli od natury 
wody morskiej, jak i od warunków zewnętrznego 
oświetlenia morza. Pozornymi właściwościami optycz¬ 
nymi morza są np.: współczynnik dyfuzyjnego osła¬ 
biania oświetlenia odgórnego z głębokością Ka, 
współczynnik odbicia światła w toni wodnej (na sku¬ 
tek rozpraszania) Ra i kilkanaście innych. 

Podstawową wielkością fotometryczną .stosowaną 
w optyce morza jest funkcja radiacyjna, zwana w skró¬ 
cie radiacją L, która opisuje wartość strumienia ener¬ 
gii światła Z 7 przychodzącego z dowolnego, lecz okre¬ 
ślonego kierunku w jednostkowym kącie bryłowym 
co wokół tego kierunku i przypadającego na jednostkę 
powierzchni A n prostopadłej do tego kierunku. Jeśli 
ten dowolny kierunek oznaczymy wektorem jedno¬ 


stkowym £, to w myśl definicji i oznaczeń na rys. 25 
radiacja 


L(£) = 


AF(Q 

JAn'Aco(£) ’ 


( 1 ) 


co zapisuje się ściśle stosując różniczki: 

L ©--2 

dAn •<*»(£) 


(la) 



Promieniowanie słoneczne wchodzące do morza 
przenika w głąb toni wodnej, ulegając stopniowemu 
pochłanianiu przez składniki wody morskiej oraz 
rozpraszaniu na molekułach wody i na licznie wystę¬ 
pujących w morzu zawiesinach. W przestrzeni wodnej 
powstaje w rezultacie pole światła o ciekawych i zło¬ 
żonych właściwościach, które najdokładniej można by 
opisać zdefiniowaną wyżej funkcją radiacyjną, gdyż 

zmierzona lub obliczona dla wszystkich kierunków ć, 
funkcja ta informuje po prostu o wartościach liczbo¬ 
wych strumieni światła przychodzących z tych wszy¬ 
stkich kierunków w badanym miejscu. Jeślibyśmy 
znali wartości radiacji ze wszystkich kierunków, w 
każdym miejscu toni wodnej i w dodatku dla wszy¬ 
stkich długości fal światła, mielibyśmy pełną infor- 
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mację o rozkładzie energii światła i jej przenoszeniu 
w morzu. Na ogół takiej informacji nie można uzys¬ 
kać, gdyż radiacja przybiera w morzu bardzo różne 
wartości, zależne od kierunku i głębokości, a rozkłady 
przestrzenne radiacji są bardzo różne w różnych ak¬ 
wenach i zmieniają się w zależności od pory roku, pory 
dnia i warunków meteorologicznych. Często bada się 
względne zmiany wartości radiacji z różnych kierun¬ 
ków ć (pod różnymi kątami 0 do pionu) tylko w płasz¬ 
czyźnie padania promieni słonecznych, które pozwa- 



~ wektor 
jednostkowy 
wyznaczający 
kierunek w prze- 
^ strzeni wodnej 

AfQ)— strumień światła 
z kierunkuj wchodzący 
w kąt bryłowy Aco 

Au{£)- kąt bryłowy wokół _ 
kierunku £ 


AA n ~ składowa powierzchni AA ^ 
prostopadła do kierunku £ 


A - dowolna powierzchnia w morzu 


AA — element tej powierzchni w miejscu badań 


Rys. 25. Szkic wyjaśniający definicję radiacji L(£) zgodnie zc 
wzorem 


kątowy 
rozkład 
radiacji 
w morzu 


pole światła 
asympto¬ 
tyczne 


detektor 

kierunkowy 


łają wyznaczyć tzw. kątowy rozkład radiacji w tej 
płaszczyźnie. Rozkład taki zawiera również wiele 
ścisłych informacji o panującym w morzu polu 
światła oraz o absorpcyjnych i rozpraszających wła¬ 
ściwościach wód, które otaczają badane miejsce. 

Kątowy rozkład radiacji wykreślony we współrzęd¬ 
nych biegunowych dla niedużych głębokości jest 
w słoneczne dni bardzo wydłużony w kierunku, z któ¬ 
rego dochodzą bezpośrednie, załamane na powierz¬ 
chni morza promienie słoneczne (rys. 26); jest przy 
tym znacznie bardziej wydłużony w wodach czystych 
niż w wodach zmętnionych — to wynik rozpraszania 
światła we wszystkich kierunkach w każdym miejscu 
toni wodnej, wskutek czego badane miejsce jest 
oświetlane również rozproszonym światłem ze wszy¬ 
stkich kierunków, lecz z każdego kierunku w stopniu 
zależnym od właściwości rozpraszających wody mor¬ 
skiej. W miarę wzrostu głębokości procentowy wkład 
światła rozproszonego i dyfundującego ze wszystkich 
kierunków rośnie w stosunku do osłabianych wraz 
z głębokością bezpośrednich promieni słonecznych 
i z tej przyczyny rozkład kątdwy radiacji staje się 
na wykresie coraz bardziej zaokrąglony, a jego mak¬ 
simum zbliża się do kierunku pionowego (zenitalne- 
go). Na pewnej głębokości (np. 100, 200 lub 800 m — 
zależnie od przezroczystości wód) rozkład kątowy 
radiacji staje się symetryczny względem pionu, niezale¬ 
żnie od położenia słońca na niebie. Pole światła poni¬ 
żej tej głębokości nazywa się polem asymptotycznym 
lub granicznym. Cechują je swoiste prawa, np. dalsze 
osłabianie radiacji lub oświetlenia z głębokością ma 
przebieg idealnie wykładniczy, jeśli koncentracja 
zawiesin i składników wody morskiej w otaczającej 
przestrzeni wodnej jest stała. Światło rozproszone 
jest też w znacznym stopniu spolaryzowane. 

Pomiary kątowych rozkładów radiacji w morzu 
wymagają właśnie tych wspomnianych wyżej, naj¬ 
bardziej skomplikowanych urządzeń, tj. detektorów 
kierunkowych zaopatrzonych w śruby napędowe i stery 
(ii. 202, tabl. 53) celem zdalnego regulowania ustawie¬ 
nia mierników radiacji w przestrzeni wodnej. Jest to 
bardzo złożone i rzadko spotykane urządzenie, lecz 


zmierzone za jego pomocą rozkłady radiacji pozwa¬ 
lają wyznaczyć wszystkie inne właściwości optyczne 
badanego obszaru morza. 

W ostatnich latach do pomiarów kątowych roz¬ 
kładów radiacji próbuje się zastosować metodę foto¬ 
graficzną z wykorzystaniem specjalnego obiektywu, obiektyw 
zwanego rybim okiem, o kącie widzenia 2jc (bryło- „rybie oko" 
wym). Wykorzystanie tej metody wniesie zasadniczy 
postęp do pomiarów, gdyż pozwoli na jednej foto¬ 
grafii odwzorować rozkład kątowy radiacji z całej 
półsfery. Ciągle jednak istnieje problem dokładności 
takiego odwzorowania z uwzględnieniem widmowych 
właściwości podwodnego światła. Można by oczy¬ 
wiście zamiast kliszy fotograficznej umieścić pod ta¬ 
kim obiektywem odpowiedni zestaw detektorów foto- 
elektrycznych, ale to by znacznie skomplikowało 
konstrukcję i działanie całego urządzenia. 

W teoretycznym opisie właściwości optycznych model 
morza przyjmuje się, najczęściej z dobrym przybli- poziomo 
żeniem, model morza poziomo uwarstwionego, tzn. uwarstwio- 
wychodzi się z założenia, że wielkości optyczne nego morza 
w płaszczyźnie poziomej na dowolnej głębokości są 
stałe, a zmieniają się jedynie z głębokością. W układzie 
współrzędnych prostokątnych, z płaszczyzną xy 
ustawioną poziomo i osią z skierowaną pionowo 
w dół, na dowolnej głębokości składowe radiacji 

przy tym założeniu są L x (0 = Ly(ć) = const, czyli 
radiacja L(x, y , z, £) = L(z, £) jest tylko funkcją 

głębokości i orientacji wektora { w przestrzeni. 

Często zakłada się także, że rozkład przestrzenny stacjonarne 
i kątowy radiacji (pole radiacji) w morzu nie zmienia pole radiacji 
się w pewnym okresie czasu (jest stacjonarny np. 
w ciągu 1 godziny, podczas której niewielkie są zmia¬ 
ny naturalnego oświetlenia powierzchni morza). 

Wówczas zmiany przestrzenne (osłabienie) radiacji 

L (z, ć) z kierunku £ na odcinku drogi r opisuje się tzw. 



Rys. 26. Szkic rozkładów radiacji w morzu w płaszczyźnie pa¬ 
dania promieni słonecznych—w wodach czystych (z lewej) i w wo¬ 
dach zmętnionych (z prawej). Przerywana linia wyznacza we 
współrzędnych biegunowych wartość radiacji (długość strzałki 

obrazującej porównanwezo wartość radiacji L(£) z dowolnego 

kierunku £ (lub pod dowolnym kątem 0 ) w danym punkcie prze¬ 
strzeni wodnej na głębokości z 
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równanie równaniem przenoszenia energii promienistej, uprosz- 
przenoszenia czonym do postaci: 

energii y ' _ 

promienistej aL ^L = _ c L(z,ć) + M^ 0 + L n (z, O- (2) 


W równaniu tym dL(z,£) oznacza nieskończenie ma¬ 
łe osłabienie radiacji na nieskończenie małym od¬ 
cinku drogi dr (różniczka dL po dr), c oznacza rze¬ 
czywisty współczynnik osłabienia światła, L* jest 
tzw. funkcją drogową, która opisuje ilość energii 
światła, jaka się dodaje do radiacji osłabionej na jed¬ 
nostkowym odcinku drogi r w wyniku rozpraszania 
w tym kierunku wszystkich innych strumieni światła 
dopływających z otaczającej przestrzeni wodnej, 
wreszcie L n jest tzw. funkcją źródłową, która opisuje 
zwiększenie radiacji na jednostkowym odcinku drogi 
r spowodowane istnieniem źródeł światła na tej 
drodze, np. świecących mikroorganizmów, których 
wpływ może być znaczny na dużych głębokościach 
(poniżej 300 m) lub w nocy, tj. wówczas, kiedy udział 
bioluminescencji w oświetleniu toni wodnej jest 
znaczny w porównaniu z oświetleniem przez źródła 
zewnętrzne. 

Jeżeli wiązkę światła biegnącą w kierunku ć wzdłuż 
drogi r osłonimy od świateł dochodzących z innych 
kierunków (L* = 0) i przyjmiemy, że nie ma w ba¬ 
danej wodzie źródeł światła (L„ = 0), to równanie 
(2) przybierze prostą postać, którą można zapisać 
w skrócie dL/dr = -cL i która określa najprostszy 
sposób wyznaczania współczynnika osłabiania świa¬ 
tła c. Scałkowanie powyższego równania różniczko¬ 
wego wzdłuż drogi r daje rozwiązanie L r /L® = e~* r , 
gdzie L 0 jest wartością radiacji wchodzącej do war¬ 
stwy wody, a L r — wartością tej radiacji po przejściu 
odległości r w tej wodzie. Stosunek L r fL 0 , który 
można precyzyjnie mierzyć (w sposób pokazany na 
rys. 24b), nazywa się transmisją radiacji (na drodze r) 
transmisja J u b transmisją równoległej wiązki światła, albo krótko 
wiązki — transmisją światła, a wartość tej transmisji dla 
światła warstwy wody r = Im nazywa się przezroczystością 
w wodzie wody. 

Przykładowe widma transmisji L r /L 0 w różnych 
wodach naturalnych ilustruje rys. 27. Krzywa 1 na 
tym rysunku przedstawia typowy przebieg widma 
transmisji wiązki światła w stosunkowo czystej, lecz 
bardzo zasolonej (3,5% soli) wodzie oceanicznej. 



długość fali A 


Rys. 27. Typowe widma 
transmisji światła w róż¬ 
nych wodach natural¬ 
nych. / względnie czy¬ 
sta woda oceaniczna 
(Prąd Zatokowy w Cie¬ 
śninie Florydzkiej), 2-7 
wody szelfowe i przy¬ 
brzeżne (2-6 z okolic 
Florydy, 7 z Zatoki 
Gdańskiej), 8 wody uj¬ 
ściowe Wisły, 9 wody 
przybrzeżne silnie zmę¬ 
tnione w czasie sztormu 
(zatoka Biscayne) 


Widmo to różni się od widma transmisji czystej wody 
destylowanej nieznacznie (w granicach błędu po¬ 
miaru), co świadczy o tym, że osłabianie przez sól 
morską światła w obszarze fal widzialnych i bliskiego 
nadfioletu jest niezauważalne. Z rysunku widać, że 
maksimum transmisji przypada w przedziale długości 
fal 470-550 nm. Spadek transmisji (spadek przezro¬ 
czystości wody) w obszarze fioletu spowodowany jest 
w bardzo czystych wodach przede wszystkim rozpra¬ 
szaniem światła na molekułach wody (rozpraszanie 
molekularne lub Rayleigha), którego natężenie jest 
odwrotnie proporcjonalne do czwartej potęgi długości 
fali (7~1/A 4 ). To rozpraszanie jest np. powodem 
pojawiania się ciemnobłękitnego koloru morza (także 
nieba) wtedy, gdy jego wody są bardzo czyste i panuje 
w nich dzienne światło rozproszone na molekułach. 

Natomiast spadek transmisji światła w obszarze 
czerwieni (długość fal powyżej 600 nm) i podczer¬ 
wieni jest w czystych wodach spowodowany przede 
wszystkim intensywnym pochłanianiem fal o tej ener¬ 
gii przez molekuły wody, w których wzbudzają się 
oscylacje atomów i rotacje całych molekuł — w efek¬ 
cie zwiększa się ruch molekuł, czyli wzrasta tempera¬ 
tura. Jest to pochłanianie rezonansowe, tzn. energia 
pochłanianych kwantów świetlnych musi odpowiadać 
energii określonego sposobu drgań molekuły. Fale 
świetlne różnych długości mogą być przez wodę 
pochłaniane, bo istnieją różne sposoby drgań molekuł 
wody. Woda absorbuje najsilniej fale świetlne dłu¬ 
gości ok. 730 nm i fale świetlne z zakresu podczer¬ 
wieni, co jest uwidocznione na wykresie. Z tej przy¬ 
czyny światło czerwone, a tym bardziej podczerwone, 
pochłonięte zostaje w znacznym stopniu już w po¬ 
wierzchniowej kilkunastocentymetrowej warstwie wód 
w morzu, jak to widać z rys. 23. Tym się tłumaczy na¬ 
grzewanie powierzchniowej warstwy wód w słoneczne 
dni. 

Wracając do przedstawionych na rys. 27 wykresów 
widm transmisji światła w różnych wodach natural¬ 
nych, zwróćmy uwagę na ich zróżnicowanie. Optyczne 
i inne, zarówno fizyczne, jak chemiczne badania 
tych wód wykazały, że przesuwanie się kolejnych 
wykresów w dół, czyli spadek transmisji w całym 
obszarze widma widzialnego, spowodowany jest 
absorpcją i przede wszystkim rozpraszaniem światła 
przez znajdujące się w wodzie zawiesiny. Wykresy 
2-7 przedstawiają widma transmisji światła w wo¬ 
dach o coraz większej koncentracji zawiesin. Wobec 
dużej różnorodności zawiesin w wodach i ich dużych 
rozmiarów (na ogół znacznie większych od długości 
fali światła) rozpraszanie przez te zawiesiny wszy¬ 
stkich długości fal światła jest prawie jednakowo silne, 
co w efekcie obniża transmisję w całym przedziale 
widma światła — niezależnie od osłabiania z przy¬ 
czyn wymienionych powyżej, gdy była mowa o czystej 
wodzie. 

Poszczególne widma na wykresie różnią się także 
średnim nachyleniem po stronie fal krótkich. Jest to 
wyrazem zróżnicowania absorpcji światła w paśmie 
fioletu i ultrafioletu, spowodowanej zawartością 
w wodzie różnych organicznych substancji żółtych 
(humusy, melanoidy i in.). Im więcej żółtych substancji 
zawiera woda, tym mniej przepuszcza światła nie¬ 
bieskiego i fioletowego, co się szczególnie ostro za¬ 
znacza np. w wodach ujść rzecznych — w tym wy¬ 
padku Wisły, a także w wodach Bałtyku (w porów¬ 
naniu np. z Atlantykiem). 

Współczynnik osłabienia światła s(z) na głębokości 
z w morzu jest sumą współczynnika absorpcji a(z), 
czyli pochłaniania, i współczynnika rozpraszania 
b(z), co można zapisać: c(z) = a{ź)Ą-b{z). Wyznacza¬ 
nie współczynników a i b w morzu jest nieco bardziej 
skomplikowane niż wyznaczanie c, przy czym b 
oznacza tzw. całkowity objętościowy współczynnik 
rozpraszania, który jest sumą kierunkowych współ¬ 
czynników rozpraszania, czyli sumą wartości funkcji 

rozpraszania molekularnego /?(£<>, £), opisującej pro- 
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centowy rozkład kątowy rozpraszania strumienia 
światła biegnącego w kierunku £ 0 i rozpraszanego we 

wszystkich poszczególnych kierunkach £ dookoła roz¬ 
praszającego elementu objętości wody. Ze względu na 
znaczenie rozpraszania w transmisji energii światła w 

morzu funkcja rozpraszania /?(£<>, £) jest jedną z pod¬ 
stawowych wielkości charakteryzujących ośrodek 
wodny. Jej sens fizyczny i typowe wykresy ilustruje 
rys. 28. 

Funkcja rozpraszania jest na wykresie symetryczna 
(jednakowe rozpraszanie w tył i w przód), a to dlatego, 
że w myśl teorii Rayleigha bardzo małe zbiory molekuł 
(dużo mniejsze od długości fali światła) zachowują się 
jak pojedyncze dipole elektryczne pobudzane do drgań 
elektrycznych przez fale światła padającego i emitu¬ 
jące we wszystkich kierunkach fale światła rozpro¬ 
szonego (jak antena dipolowa). Takie mikrozbiory 
molekuł powstają w wodzie w wyniku termicznych 
fluktuacji jej gęstości. Funkcja rozpraszania na zawie¬ 
sinach morskich jest na wykresie bardzo wydłużona do 
przodu, gdyż zawiesiny te są na ogół większe od dłu¬ 
gości fali światła, w różne zatem obszary ich objętości 
dochodzi w tym samym czasie różne pole elektryczne 
padającej fali światła (różne natężenie i faza drgań), 
które pobudza te różne obszary do drgań elektrycz¬ 
nych w różnych fazach. Tak więc duża cząstka zacho¬ 
wuje się jak zbiór dipoli drgających w różnych fazach. 
Światło emitowane przez te dipole interferuje (z róż¬ 
nym efektem w różnych kierunkach), dając w rezulta¬ 
cie taki właśnie wydłużony do przodu wypadkowy 
rozkład natężeń, opisany funkcją £. Wokół kierunku 
padającego światła wszystkie funkcje rozpraszania są 




mała cząstka rozpraszająca w polu elektrycznym E 
fali światła drga i emituje światło jak pojedynczy dipol elektryczny 


b) 



duża cząstka rozpraszająca w polu elektrycznym E drga i emituje 
światło jak zbiór dipoli elektrycznych drgających w różnych fazach 


symetryczne, tak że ich wykresy przestrzenne są bry¬ 
łami obrotowymi o takich samych przekrojach jak na 
rysunku. 

Na rys. 28c przedstawiono typowe wykresy funkcji 
rozpraszania w oceanie we współrzędnych prostokąt¬ 
nych. Widać z nich, że w wodzie morskiej występuje 
bardzo silne rozpraszanie w małym kącie do przodu 
(bardzo trudne do zmierzenia) oraz minimum rozpra¬ 
szania w bok pod kątami 90-100° — z przyczyn wyja¬ 
śnionych powyżej. Widać też, że procentowo mniej 
rozpraszane do przodu, lecz w całości bardziej rozpra¬ 
szane (wyżej położona krzywa) jest światło niebieskie, 
co wskazuje na to, iż w całkowitym rozpraszaniu 
światła przez czyste wody Morza Sargassowego 
dużą rolę odgrywa rozpraszanie Rayleigha. 

Dokładny wykres .tej funkcji we współrzędnych 
biegunowych byłby tu w wypadku światła niebieskiego 
mniej wydłużony do przodu niż w wypadku światła 
czerwonego. Niestety — nie jest możliwe zmierzenie 
wartości funkcji rozpraszania, dla bardzo małych 
kątów (< 1°), a dla kątów małych (1, 2, 3°), gdzie 
rozpraszanie jest najsilniejsze, potrzebne jest zastoso¬ 
wanie specjalnej techniki ze światłem laserowym (il. 
201, tabl. 53). 

Całkowity współczynnik rozpraszania na głęboko¬ 
ści z w morzu 6(z) jest sumą, a ściślej — całką funkcji 

P(z, Ćo, f) po wszystkich kierunkach £ sfery Q ota¬ 
czającej rozpraszający element objętości wody: 

b(z) = J 

n 

gdzie dco(£) jest elementem kąta bryłowego wokół 
kierunku £. 



c) 


Rys. 28. Funkcja rozpraszania światła w wodzie morskiej, 
a) Sposób wyznaczania funkcji rozpraszania 0(Z o ^Q ss 0(0) = 
— ^(<D/£(ĆoMw£ 0i gdzie L(ćo) radiacja ze źródła w kierunku £ 0 , 
JL(£) część tej radiacji rozproszona w kąt bryłowy JcoO*) w kie¬ 
runku 0 kąt pomiędzy kierunkami i £. dV oznacza na ry¬ 
sunku badaną objętość rozpraszającą, b) Szkice wykresów (we 
współrzędnych biegunowych) funkcji rozpraszania na moleku¬ 
łach wody (u góry) i na zawiesinach morskich (u dołu) oraz ry¬ 
sunki (z prawej) wyjaśniające mechanizm rozpraszania, c) Funkcje 
rozpraszania zmierzone w Morzu Sargassowym przez G. Kullcn- 
berga (1968 r.) i wykreślone we współrzędnych prostokątnych dla 
3 różnych długości fal światła 


współczynnik 

rozpraszania 





































oświetlenie Wielkością powszechnie mierzoną i stosowaną 
odgórne przy analizie optycznej morza jest tzw. oświetlenie 
odgórne E d {z) panujące na danej głębokości z. 
Charakteryzuje ono moc odgórnego strumienia pro¬ 
mieniowania przenikającego w głąb morza. Oświetle¬ 
nie odgórne na dowolnej głębokości z w morzu jest 
sumą wszystkich składowych radiacji z górnej pół- 
sfery, prostopadłych do elementu płaszczyzny pozio¬ 
mej z otaczającego rozpatrywany punkt w morzu, 
co można krótko zapisać: 

£*(z) = / L„(z,i)cko({), (3) 

*>+ 

gdzie Q+ oznacza półsferę górną wektorów jedno¬ 
stkowych z, Ln(z t Z) — składową radiacji L(z, O pro¬ 
stopadłą do płaszczyzny poziomej na głębokości z. 

Oświetlenie £k(z) można bezpośrednio mierzyć 
sondą wyposażoną w odbiornik światła z wejściem 
optycznym w postaci płytki z odpowiedniego mleczne¬ 
go szkła (lub tworzywa), wystawionej tak, by padało 
na nią światło z całej górnej półsfery (rys. 24a). Taka 
płytka zwana jest kolektorem Lamberta lub kolek¬ 
torem kosinusowym ( L n = Lcos0), ponieważ świa¬ 
tło, które ,,widzi” odbiornik przez taki kolektor, jest 
automatycznie scałkowane z półsfery w myśl równa¬ 
nia (3). 

spadek Przebieg spadku oświetlenia odgórnego w miarę 
oświetlenia wzrostu głębokości zależy od pochłaniania i wielo- 
z głębokością krotnego rozpraszania światła w ośrodku. Z tej 
w morzu przyczyny procentowy spadek oświetlenia wraz ze 
wzrostem głębokości charakteryzuje dany akwen mor¬ 
ski do tego stopnia, że ta okoliczność posłużyła — 
według koncepcji duńskiego oceanologa N. G. Jer- 
lova — do optycznej klasyfikacji mórz i oceanów. 
Wyróżniono mianowicie 2 szeregi typów wód: szereg 
/, IA , IB, II i ///, który nazwano typem wody ocea¬ 
nicznej, oraz szereg 1, 2, 3 ... 9, nazwany typem wody 
przybrzeżnej, i tym sposobem scharakteryzowano 
poszczególne regiony oceanu światowego. Procento¬ 
wy spadek oświetlenia odgórnego wybranej długości 
fali oraz widma transmisji oświetlenia w poszczegól¬ 
nych typach wód ilustruje rys. 29. Na rysunku jest 
także mapka przedstawiająca rozmieszczenie tych 
wód w oceanie światowym. 

Nachylenie linii na wykresie (rys. 29a) wskazuje 
wielkość spadku oświetlenia na jednostkę wysokości 
kolumny wody. Dokładnie spadek ten opisuje się za 


pomocą tzw. współczynnika dyfuzyjnego osłabiania 
oświetlenia odgórnego: 


K d (z y 2 ) 


_1_ dE d (z y X) 

E d (z 9 ).) dz 


o którym wspomniano wyżej jako o jednej z ważnych 
pozornych właściwości optycznych morza. Po raz 


oświetlenie E d (z)/5^(0) dla 465 nm 




b) 



Zwrotnik Paka 


Równik 


IA 

Zwrotnik Kozio różę i 


Rys. 29. Optyczna klasyfikacja wód morskich wg N.G.JerIova<1968 r.): a) Względny spadek oświeUenia zglebokokią(śwUOonicbie: 

skie —465 nm) w wodach oceanicznych typu 1, IA, IB, II i III oraz wodach przybrzeżnych różnychi typów 1,2 .9.b) Widma transmisji 

oświetlenia (tj. zmiany na drodze 1 m) w wodach różnych typów, c) Rozmieszczenie różnych typów wód w oceanie światowym 
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pierwszy wypisano tu wyraźnie, że oświetlenie 
£d(z, X) i współczynnik jego osłabiania Ka(z, X) są 
funkcjami długości fali A, lecz zależność od X dotyczy 

także radiacji L(z,f, X), współczynników c(z, A), 

a(z, X), ó(z, X), P(z,£o,£,X) oraz innych funkcji optycz¬ 
nych, a uproszczony zapis tych funkcji, bez zazna¬ 
czania zależności od A, odnosi się umownie do światła 
monochromatycznego o dowolnie wybranej długości 
fali. 

zróinicowa- Poszczególne typy wód morskich różnią się wieloma 
nie wód właściwościami optycznymi (wyraźne różnice wykazu- 
morskich ją m.in. widma transmisji oświetlenia zilustrowane na 
rys. 29b). Pociąga to za sobą wielkie zróżnicowanie 
dobowych i rocznych bilansów energii światła sło¬ 
necznego o różnej długości fal, dopływającej i zużywa¬ 
nej na procesy fizyczne i chemiczne na różnych głę¬ 
bokościach w morzu. Z tej również przyczyny zróż¬ 
nicowane są warunki życia i samooczyszczania wód 
różnego typu: np. w wodach oceanicznych typu 7 do 
głębokości kilkudziesięciu metrów dociera jeszcze 
silny strumień ultrafioletu, który może uśmiercać 
niektóre mikroorganizmy, podczas gdy w wodach 
przybrzeżnych typu 1 (także w Bałtyku), a tym bar¬ 
dziej typu 2, 5, 4 itd., poniżej 10 m panuje już tylko 
słabe światło zielonożółte, a promieniowanie ultra¬ 
fioletowe zostaje rozproszone i pochłonięte praktycz¬ 
nie w kilkucentymetrowej warstwie wody przypo¬ 
wierzchniowej. 

Główną przyczyną zróżnicowania wód morskich 
pod względem optycznym są, jak już wspomniano, 
rozpuszczone w wodzie substancje organiczne, a głów¬ 
nie ich niektóre grupy (np. substancje humusowe, 
melanoidy i in.), zwane ogólnie substancjami żół¬ 
tymi, oraz zawiesiny morskie. Ogólnie wiadomo, że 
substancje żółte są wynikiem metabolizmu organiz¬ 
mów morskich (także wnoszone są do morza przez 
rzeki) i że charakteryzuje je silna absorpcja ultra¬ 
fioletu i fioletu, wskutek czego nadają wodzie żółta¬ 
wo zabarwienie. Zawiesiny morskie mają wiele źródeł: 
są produktami kruszenia skał, pyłami z atmosfery, 
mikroorganizmami żywymi, szczątkami obumarłych 
roślin i zwierząt itp. Ich oddziaływanie ze światłem 
polega przede wszystkim na znacznym rozpraszaniu 
fal świetlnych wszystkich długości. 

Mechanizm oddziaływania obu tych grup składni¬ 
ków na pole światła oraz na transmisję energii pro¬ 
mienistej w wodzie morskiej jest obecnie przedmiotem 
intensywnych badań. 




Zastosowanie optyki morza w innych 
dziedzinach oceanologii 

Na zakończenie warto wspomnieć, że optyka morza 
jest szeroko stosowana w innych badaniach i pracach 
w morzu. Optyczne właściwości morza są często wy¬ 
jątkowo czułymi wskaźnikami wielu zachodzących 
w oceanie procesów geofizycznych, geochemicznych, 
biologicznych i innych, których dokładne poznanie 
jest niezbędne dla racjonalnego gopodarowania 
w środowisku morskim i zapobiegania jego przeobra¬ 
żeniom w niepożądanym kierunku. Bardzo czułe są 
np. optyczne wskaźniki rozmieszczenia i przenoszenia 
się mas wodnych różnego pochodzenia w- morzu. 

Widać to szczególnie wyraźnie w rejonach ujść rzecz¬ 
nych, gdzie wody rzeczne, zawierające dużo zawiesin badanie 
i substancji żółtych, rozpływają się i mieszają w skom- ujść 
plikowany często sposób z wodami morskimi. Mierząc rzecznych 
rozkład przestrzenny np. współczynnika osłabiania 
światła c (szybko i na dużym obszarze wód), można 



l.■ I 2-4m-> teM > 6m-’ 




funkcji rozpraszania 

Rys. 30. Przykłady optycznych wskaźników rozmieszczenia i ruchu mas wodnych w morzu: a) Przykładowy rozkład wartości współ¬ 
czynnika c osłabiania światła zielonego (X = 0,5 pm) w powierzchniowej warstwie wód Zatoki Gdańskiej w czasie wiosennych wysokich 
stanów spływających wód Wisły. Duże wartości współczynnika c pokazują rozmieszczenie wody wiślanej, nie wymieszanej jeszcze z wodą 
morską, b) Szkic pomiaru pionowego rozkładu funkcji rozpraszania (pod jednym stałym kątem,np. $ — 45°), który informuje o kie¬ 
runku ruchu masy wodnej na podstawie rozpraszania światła przez zawiesiny unoszone z opływanej podwodnej góry 
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łatwo rozpoznać drogi rozchodzenia się wód ujścio¬ 
wych rzeki, a wraz z nimi zanieczyszczeń, ścieków itp. 
Przykład taki, ukazujący skomplikowane rozmieszcze¬ 
nie wód ujściowych Wisły w Zatoce Gdańskiej przy 
wysokim stanie tej rzeki w okresie wiosennym, 
przedstawiono na rys. 30a. Obszary wód, na których 
wartości współczynnika c są duże (6-7 m -1 ), były 
zajęte przez bardzo zanieczyszczone wody wiślane 
nie wymieszane jeszcze z wodą morską. Widać, że 
w sprzyjających warunkach dotarły one aż do wyso¬ 
kości Półwyspu Helskiego (w warstwie powierzch¬ 
niowej). W wyniku późniejszej zmiany wiatru i cyr¬ 
kulacji wód głębinowych domieszka mniej zanieczysz¬ 
czonej wody morskiej była w pobliżu ujścia rzeki 
dużo większa, a w Zatoce Puckiej w tym samym cza¬ 
sie — woda była prawie tak czysta jak na pełnym 
morzu. Podobne pomiary wykonane na różnych głę¬ 
bokościach wskazują na to, że woda wiślana rozpływa 
się w cienkiej warstwie powierzchniowej Zatoki 
Gdańskiej (1-2 m), a poniżej podpływają wody 
z otwartego morza Bałtyckiego. 

badanie Na wielkich przestrzeniach oceanu oprócz wyraź- 
ruchu mas nych prądów morskich występuje bardzo powolne 
wodnych przemieszczanie się olbrzymich mas wodnych; ich 
wykrycie jest także często możliwe za pomocą metod 
optycznych. Kiedy np. taka powoli przemieszczająca 
się masa wodna opływa podwodne góry, to po drugiej 
stronie gór w kierunku przepływu notuje się wyraźny 
wzrost rozpraszania światła, spowodowany zawiesi¬ 
nami unoszonymi z osadów dennych na podwodnej 
górze, jak to obrazuje rys. 30b. 

badanie Od optycznych właściwości wód danego regionu 
strefy morza w znacznym stopniu zależy szybkość, wydaj - 
eufotycznej ność energetyczna i pionowy rozkład produkcji 
materii organicznej, która ma miejsce w procesie foto¬ 
syntezy w komórkach fitoplanktonu morskiego. Gru¬ 
bość wystarczająco naświetlonej powierzchniowej 
warstwy wód, w której się ta produkcja odbywa z prze¬ 
wagą wydzielania tlenu nad jego zużyciem przez 
komórki, nazywa się strefą eufotyczną w morzu. 
Strefa ta dochodzi w czystych morzach do ok. 150 m 
głębokości, podczas gdy np. w Bałtyku zaledwie do 
ok. 20 m, co jest wynikiem różnic we właściwościach 
widmowych tych wód. W dodatku różne widma pa¬ 
nującego w różnych wodach światła przyczyniają się 
do różnicowania nie tylko gatunków żyjącego w nich 
fitoplanktonu, lecz także składu barwników w ko¬ 
mórkach tego samego gatunku. Komórki te mają 
bowiem zdolność fotoadaptacji, tzn. zmieniają skład 
swoich barwników wyłapujących dostępną dla foto¬ 
syntezy energię światła pod wpływem zmian w zew¬ 
nętrznych warunkach oświetleniowych (np. podczas 
zmian zanieczyszczeń w-ody, a także w czasie powol¬ 


nego tonięcia i znajdowania się w coraz głębszych 
wodach, gdzie panuje inne pole światła). Niekiedy 
jednak duże zmiany oświetlenia, spowodowane np. 
ogniskowaniem promieni słonecznych przez fale 
morskie, mogą znacznie hamować proces fotosyntezy. 

Tak więc warunki optyczne mają zasadniczy wpływ 
na wzrost fitoplanktonu, a stąd — na podtrzymywa¬ 
nie wszelkich form życia w morzu, gdyż jak już wspo¬ 
mniano, wyprodukowana przez fitoplankton w pro¬ 
cesie fotosyntezy materia organiczna i tlen są niezbęd¬ 
ne do życia wszystkich organizmów morskich. Bada¬ 
nie pola światła jest zatem również bezpośrednio 
przydatne do określania warunków życia w danym 
morzu i sygnalizowania ich zmian. 

W ostatnich latach coraz częściej wykorzystuje się 
do różnych badań morza zdjęcia powierzchni morza 
wykonane z samolotów i sztucznych satelitów oraz 
pomiary radiacji powierzchni morza. Interpretacja 
tych zdjęć, a zwłaszcza badanie na podstawie radiacji 
powierzchni morza różnych właściwości fizycznych, 
chemicznych i biologicznych dużych przestrzeni 
morskich, wymaga wielu szczególnie dokładnych in¬ 
formacji z optyki morza, w tym bowiem celu po¬ 
trzebna jest dokładna znajomość zależności rozkła¬ 
dów radiacji światła wychodzącego z morza od wielu 
złożonych czynników środowiskowych. Te zdalne 
metody optyczne wnoszą jednak kolosalny postęp 
w rozpoznanie pól temperatur powierzchni morza, 
pól lodowych, rozmieszczenia planktonu (pośrednio 
ryb), prądów morskich i in. na wielkich obszarach 
oceanu. Z tej przyczyny prowadzone w tym kierunku 
badania optyczne rozwijają się obecnie bardzo dy¬ 
namicznie. 

W wielu pracach podwodnych związanych z nowymi 
kierunkami inżynierii morskiej (budownictwo mor¬ 
skie, górnictwo morskie, nowe techniki połowów itp.) 
niezbędne jest wykorzystywanie telewizyjnych i fo¬ 
tograficznych kamer podwodnych oraz świateł i szkieł 
optycznych umożliwiających obserwację różnych 
obiektów. Ze względu na mały zasięg widzenia (rys. 31) 
i zmiany barwy przedmiotów w wodzie konieczne 
jest rozpoznanie danych optycznych warunków śro¬ 
dowiskowych i na tej podstawie dobieranie parame¬ 
trów stosowanych urządzeń optycznych, takich jak 
widmo emisji sztucznych źródeł oświetlenia, filtry 
optyczne i polaryzacyjne w odbiornikach, geometria 
ustawienia układu itp. Odpowiedni dobór tych para¬ 
metrów pozwala znacznie zwiększyć zasięg widzenia 
i kilkakrotnie poprawić kontrast i jakość obrazu. 

Podstawowe znaczenie procesów oddziaływania 
światła słonecznego na środowisko morskie oraz 
praktyczne możliwości wykorzystania optyki morza 
inspirują współcześnie wiele badań doświadczalnych 


zdalne 

metody 

optyczne 


zastosowanie 
optyki 
w inżynierii 
morskiej 



Rys. 31. Zasięg widzenia w wodzie dla oka ludzkiego i dla kamery telewizyjnej (wg R. O. Briggs i G. L. Hatchett, 1965 r.) 
































































i teoretycznych i przyczyniają się do dynamicznego 
rozwoju tej gałęzi fizyki. Badania w tym kierunku 
prowadzą liczne współpracujące ze sobą instytuty 
naukowe w świecie, szczególnie w ZSRR, Danii, 
USA, we Francji, w Japonii i NRD, a także w Polsce 
— w Zakładzie Oceanologii Polskiej Akademii Nauk 
w Sopocie. 
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Akustyka morza 

Antoni Śliwiński 

Akustyka morza, inaczej: akustyka podwodna, hy- 
droakustyka, obejmuje całokształt zjawisk i procesów 
dotyczących rozchodzenia się fal sprężystych w du¬ 
żych zbiornikach wodnych (w hydrosferze). Zjawiska 
akustyczne w morzu odpowiadają bardzo szerokiemu 
widmu fał, o częstościach od rzędu ułamków herca 
(infradźwięki) aż do kilkuset kiloherców (ultra¬ 
dźwięki). Górną granicę tego widma wyznacza natura 
środowiska morskiego, które silnie tłumi fale o du¬ 
żych częstościach, a więc fale krótkie, 
zakres Środowisko morskie bardzo dobrze nadaje się do 
przenoszo- generacji fal akustycznych i przesyłania informacji 
nych za ich pomocą. Pasmo częstości użyteczne ze względu 
fal na komunikację podwodną i hydrolokację rozciąga 
się w granicach 10-100 kHz. Fale takie można wy¬ 
twarzać w morzu za pomocą przetworników elektro¬ 
akustycznych, wykorzystujących zjawiska piezoelek¬ 
tryczne lub magnetostrykcyjne. Często też stosuje się 
impulsowe źródła akustyczne, którymi są podwodne 
eksplozje materiałów wybuchowych, eksplozje sprę¬ 
żonych gazów lub też wyładowania elektryczne dużej 
mocy. 

szumy Niezależnie od pól akustycznych wytwarzanych 
własne celowo istnieją w morzu pola akustyczne stanowiące 
tło, tzw. szumy własne, pochodzące z różnego rodzaju 
źródeł, zarówno naturalnych, jak i sztucznych, zwią¬ 
zanych z działalnością człowieka na morzu. 

Zagadnienia akustyki morza są przedmiotem za¬ 
interesowania od kiludziesięciu lat i poświęca się im 
wiele prac naukowych, bada się fizyczne zjawisko 
rozchodzenia się fal dźwiękowych w morzu i szuka 
się możliwości wykorzystania go. 

Badaniem akustycznych zjawisk w hydrosferze zaj- 
badania w rnuje się obecnie wiele ośrodków na świecie, także w 
Bałtyku Polsce. Badania, które prowadzi się w Bałtyku, obej¬ 
mują głównie następujące zagadnienia: 

charakter i zasięg rozchodzenia się dźwięków w mo¬ 
rzu, 

rozkład prędkości rozchodzenia się dźwięku wywo¬ 
łanego refrakcją i występowanie z tym związanych 
tzw. kanałów akustycznych, 
rozpraspmie fal akustycznych w morzu i pogłos, 
tłumienie fal akustycznych w morzu, 
dyspersja fal akustycznych i jej rola w przenoszeniu 
sygnałów ciągłych i impulsowych, 
szumy własne morza — ich natężenie i skład wid¬ 
mowy, 

wykorzystanie fal akustycznych. 

Istnieją pewne prawidłowości w przebiegu zjawisk 
akustycznych we wszystkich morzach i oceanach, ale 
jednocześnie w każdym zbiorniku wodnym zjawiska 
te mają specyficzny charakter, inny w morzach głę¬ 
bokich, inny w płytkich; przebieg ich zależy od sze¬ 
rokości geograficznej, warunków klimatycznych, pór 
roku, zmian dobowych oraz wielu dodatkowych czyn¬ 
ników naturalnych i modyfikowanych przez człowie- 
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ka. Do różnego rodzaju badań akustycznych, za¬ 
równo podstawowych, jak i stosowanych, skłaniają 
nie tylko rozległe przestrzenie hydrosfery i duża liczba 
czynników wpływających na przebieg zjawisk, ale 
również sama natura fal sprężystych, które jak dotąd 
— stanowią najlepsze narzędzie do przenoszenia 
sygnałów podwodnych na duże odległości, tysięcy 
metrów a nawet tysięcy kilometrów (zależy to od 
częstości sygnału i warunków fizycznych w danym 
akwenie), a więc wielokrotnie większe niż zasięgi fal 
elektromagnetycznych, które w morzu są silnie tłu¬ 
mione. 


Charakter rozprzestrzeniania się dźwięku 

Warunki, w jakich się rozchodzi dźwięk w morzu, 
różnią się znacznie od idealnych, z jakimi mamy do 
czynienia w płynnych środowiskach jednorodnych 
(—*■ Przedmiot i zakres akustyki), przy rozpatrywaniu 
których wychodzi się z założenia, że w całej objętości 
własności sprężyste są takie same. Niejednorodne 
własności sprężyste toni morskiej wypływają ze 
zmian temperatury, zasolenia, ciśnienia hydrosta¬ 
tycznego, ruchu mas wodnych (Rozdz. Dynamika mo¬ 
rza). Ma też znaczenie zmieniająca się zawartość ciał 
obcych w wodzie, np. pęcherzy powietrza, których 
źródłem powstawania w toni morskiej są: falująca 
powierzchnia morza, różne procesy fizykochemiczne, 
a także organizmy żywe. Wszystkie te czynniki de¬ 
cydująco wpływają na prędkość, tłumienie i kierunek 
rozchodzenia się dźwięku w morzu. 

Ponieważ zasięg sygnałów akustycznych rozcho¬ 
dzących się w morzu jest daleki, duży wpływ na cha¬ 
rakter rozchodzenia się dźwięku mają ograniczenia 
zbiorników wodnych, w szczególności brzegi, dno 
i powierzchnia morza. 

Często pole akustyczne w morzu podobnie jak 
w innych ośrodkach opisuje się funkcją zwaną po¬ 
tencjałem prędkości drgań cząstki akustycznej. Po- potencjał 
tencjał akustyczny <P definiuje się jako skalarną funk- akustyczny 
cję określającą pole, której pochodna przestrzenna 
(gradient) daje bezpośrednio mierzalną wielkość 
wytwarzającą to pole. W polu akustycznym wielkością 

tą może być przesunięcie £ (-> Przedmiot i zakres 
akustyki, rozdział Teoria ośrodków ciągłych i fale 

sprężyste), albo prędkość cząstki { = 8£/8t, albo też 
ciśnienie akustyczne p. Jeżeli O oznacza potencjał 

prędkości £, wtedy Z = grad <Z>, co z kolei oznacza, 
że p = pegradd*. 

Potencjał <P(x y y y z, /) spełnia równanie falowe 

8 2 <P , 8 2 <P_ 8 2 <P _ 1 8 z <p 

8x 2 8y z 8 z 2 c 2 8t 2 * ^ 

przy czym c jest prędkością rozchodzenia się dźwięku, 
a symbole 8 z l8x z y 3 2 /8y z ,8 z /8z 2 y 8 2 l3t z oznaczają po¬ 
chodne cząstkowe po odpowiednich zmiennych. Rów¬ 
nanie to jest słuszne tylko w odniesieniu do fali nie 
tłumionej, tzn. że można je stosować tylko w przy¬ 
bliżeniu, gdyż w rzeczywistości, jak już wyżej wspom¬ 
niano, fala akustyczna w toni morskiej ulega tłumie¬ 
niu. Do przybliżonego opisu pola akustycznego w mo¬ 
rzu używa się modelu poziomo uwarstwionych mas 
wodnych, w którym prędkość dźwięku c jest funkcją 
tylko głębokości morza c = c(z). Wynika on stąd, 
że, w toni morskiej zarówno temperatura wody, gęs¬ 
tość i zasolenie, jak i ciśnienie hydrostatyczne za¬ 
leżą regularnie od głębokości (wpływ pola ciężkości 
Ziemi). 

Przy założeniu uwarstwionego modelu potencjał 
akustyczny jest tylko funkcją współrzędnych x i z 
oraz czasu /. Wtedy rozwiązaniem równania falowego 
jest funkcja opisująca falę płaską, a ogólna jej postać 
jest następująca: 

<P(x, z, t) = (p(z)e i ^ <ot±2X > y (5) 


gdzie <f(z) oznacza przestrzenną część potencjału (fun¬ 
kcja ta określa rozkład potencjału wzdłuż osi z), 
(o —częstość kołową fali, znak — lub 4 odpowiada 
dodatniemu lub ujemnemu kierunkowi rozchodzenia 
się fali wzdłuż osi x z prędkością fazową c' - o>/a 
a a jest liczbą falową dla kierunku x (rys. 32). 



Rys. 32. Droga promienia dźwiękowego w ośrodku niejednorod¬ 
nym 


Po podstawieniu do równania (4) rozwiązania (5) 
(biorąc tylko znak —, oznaczający dodatni kierunek 
rozchodzenia się fali) otrzymuje się równanie okre¬ 
ślające funkcję ę?(z): 


d 2 (p 

Hz* 


~\~y 2 <p = 0, 


( 6 ) 


/ c' Z \ 

gdzie = _ - «> = -1 j . 

Rozwiązanie równania (6) ma ogólną postać na¬ 
stępującą: 

<p = 

gdzie A i B są stałymi całkowania. Pierwszy składnik 
opisuje zaburzenie rozchodzące się w dół (w dodatnim 
kierunku osi z), drugi — w górę. Jeśli się ograniczymy 
do zaburzenia w dół, to rozwiązanie (2) można będzie 
napisać w postaci: 

0(x t z, 0 = Ae-^e*^ 1 -**). 

Dla fali rozchodzącej się nie w kierunku osi x y lecz 
w płaszczyźnie x y z rozwiązanie będzie miało postać: 


<P(x y z, 0 = Ac i(wt ~ krz \ 
gdzie r z = ]/x 2 +y 2 y a k z = a 2 4y 2 = w 2 /c 2 , 


A: jest liczbą falową fali wypadkowej, której kierunek 
rozchodzenia się wyznacza wektor falowy k , przy 

czym |fc| = k, a i y są liczbami falowymi ‘fal skła¬ 
dowych biegnących odpowiednio wzdłuż osi x oraz z. 

Wektory a i y są składowymi wektora k dla tych 
kierunków (sytuację ilustruje rys. 32). Zachodzi przy 
tym zależność: a = ksind, y = /;cos0, gdzie 0 

jest kątem między osią z a wektorem k. W środowisku 
poziomo uwarstwionym 6 odpowiada kątowi zała¬ 
mania na granicy dowolnych dwu warstw. 

W środowisku zupełnie jednorodnym, w którym 

c = const, również wektor k jest stały i jego wartość 
k = o/c — Inf/c = 2rc/2, gdzie X — długość fali, / — 
częstość. Natomiast w morzu, dla którego przyjęliśmy 
poziome uwarstwienie i c — c(z), wielkości k y X i y 
są funkcjami głębokości z, podczas gdy a pozostaje 
stałe. Wynika to z wyżej rozpatrzonych zależności 
i z prawa Snella, określającego współczynnik zała¬ 
mania „promienia” dźwiękowego: 

sinO _ c(z) 
sin Ó 0 c 0 


skąd wynika, że 


sinO 

c(z) 


— const. 


Jeśli fala biegnie w kierunku poziomym (0 = k/ 2) 
a — k i y — 0, wtedy (por. rys. 32) 


c' = c (z). 


(7) 


Jeżeli fala biegnie na określonej głębokości z, refrakcja fal 
a wektor k tej fali przybiera kierunek poziomy, dźwiękowych 
to promień fali w dalszym swym biegu zmienia 
zwrot: przestaje biec w dół, zawraca ku górze, lub 
w przeciwnym przypadku — przestaje biec ku górze 
i zawraca w dół. Obydwa te przypadki zachodzą 
w morzu, a zjawisko nazywa się refrakcją fal dźwię- kanały 
kowych i prowadzi do powstawania tzw. kanałów dźwiękowe 
dźwiękowych, zwanych z angielskiego SOFAR (Sound- 
Fixing and Ranging). 


prędkość dźwięku c 




Rys. 33. Pionowe rozkłady prędkości dźwięku w morzu: a) ty¬ 
powy rozkład wg W. W. Szulkina; b) rozmaite rozkłady w morzu 
głębokim; 1 rozkład typowy w oceanie, temperatura wody przy 
powierzchni wyższa niż głębiej, 2 sezon zimowy w strefie umiar¬ 
kowanej, 3 morze arktyczne, c) rozkłady przy powierzchni w mo¬ 
rzach płytkich w zależności od pory roku 


a) 


prędkość 



zasięg powierzchnia 




Rys. 34. Schemat biegu promieni dźwiękowych w morzu głębo¬ 
kim : a) w kanale przypowierzchniowym, b) w kanale głębinowym 
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wzór Wilsona 


Zjawisko to odpowiada znanemu w optyce zjawisku 
całkowitego wewnętrznego odbicia na nieciągłej gra¬ 
nicy dwóch ośrodków przy przejściu światła z ośrod¬ 
ka optycznie gęstszego do rzadszego, co zachodzi 
wtedy, gdy przy danej wartości współczynnika zała¬ 
mania kąt padania w ośrodku optycznie gęstszym 
przekracza wartość kąta granicznego. Tutaj w wodzie 
morskiej sytuacja jest jednak ogólniejsza, a przy tym 
zjawisko może wystąpić na różnych głębokościach 
i przy różnych kątach padania. Wskutek ciągłej zmia¬ 
ny współczynnika załamania wraz z głębokością (ciąg¬ 
ła zmiana prędkości c(z ) związana ze zmianą gęstości 
wynikającej z gradientu temperatury, rys. 33 i 34 
kierunek rozchodzenia się promienia dźwiękowego 
zmienia się od punktu do punktu (rys. 32). 


Prędkość rozchodzenia się dźwięku 

Zróżnicowanie prędkości rozchodzenia się dźwięku 
w toni morskiej na ogół komplikuje i znacznie wy¬ 
dłuża drogę dźwięku od źródła do odbiornika w po¬ 
równaniu z linią prostą. 

Prędkość dźwięku jest bezpośrednio powiązana ze 
ściśliwością i gęstością środowiska, co przy założe¬ 
niu, że rozchodzenie się fal akustycznych ma charak¬ 
ter procesu adiabatycznego, wyraża wzór: 

gdzie /? a( j — współczynnik ściśliwości w procesie 
adiabatycznym, /?i z — współczynnik ściśliwości w 
procesie izotermicznym, * = c p fcv (* wody morskiej 
wynosi 1,00-1,02), c v —ciepło właściwe przy stałym 
ciśnieniu, cv —ciepło właściwe przy stałej objętości, 
Q — gęstość. 

Ściśliwość wody morskiej jest mniejsza od ściśli¬ 
wości wody czystej i maleje zarówno ze wzrostem 
ciśnienia (głębokości), jak i temperatury oraz zasole¬ 
nia. Na przykład przy temperaturze T = 0°C i za¬ 
soleniu S = 34,85%o w warstwie powierzchniowej ściś¬ 
liwość wody morskiej ma wartość 4,658 -lO^cn^/kG, 
a na głębokości 10 000 m — 3,993 TO- 10" 5 cm 2 /kG. 
Gęstość wody morskiej jest w porównaniu z wodą 
czystą trochę większa i maleje ze wzrostem tempera¬ 
tury, natomiast rośnie ze wzrostem zasolenia i ciśnie¬ 
nia. 

Zależność prędkości dźwięku od zasolenia, tempe¬ 
ratury i ciśnienia w wodzie morskiej ujmują różne 
wzory empiryczne, z których najbardziej znany w oce¬ 
anografii jest wzór Wilsona: 

c(S y T, P) = c(35, 0, 0) + cs + cr+c/>4-csrp, 


gdzie c(35, 0, 0) = 1449,22 m/s jest wartością pręd¬ 
kości przy zasoleniu 35% 0 , temperaturze 0°C i ciś¬ 
nieniu atmosferycznym na poziomie morza, dalsze 
zaś składniki po prawej stronie wzoru stanowią 
poprawki, które trzeba uwzględnić przy zmianie każdej 
wielkości z osobna; ostatni wyraz określa poprawkę 
wynikającą z ich wzajemnego wpływu. Poszczególne 
poprawki w postaci wielomianów o różnych współ¬ 
czynnikach liczbowych podane są w literaturze fa¬ 
chowej i oblicza się je dla danych warunków. 

Wzór Wilsona pozwala obliczyć prędkość dźwięku 
w morzu w zakresie temperatur od — 4°C do 30°C, 
ciśnień — od 1 kG/cm 2 do 1000 kG/cm 2 i zasoleniu 
od 0 do 37%o, z dokładnością do 4-0,3 m/s. Dokład¬ 
ność ta jest tego samego rzędu co dokładność pomia¬ 
rów prędkości w wodzie. 

W miarę spadku temperatury wraz z głębokością 
zmniejsza się prędkość dźwięku — głównie wskutek 
wzrostu gęstości. W warstwie przypowierzchniowej 
obniżenie to wynosi ok. 3 m/s na 1°C. Wzrostowi 
zasolenia wraz z głębokością towarzyszy wzrost 
prędkości mniej więcej o 1,3 m/s na 1% 0 — wynika 
to z faktu, że wzrost gęstości przy wzroście zasolenia 
jest powolniejszy niż spadek ściśliwości (zob. wzór 8). 
Wzrost ciśnienia hydrostatycznego wraz z głęboko¬ 
ścią daje wzrost prędkości dźwięku mniej więcej 
o 1,8 m/s na każde 100 m słupa wody. 

Rozkłady prędkości c(z) są więc bardzo zróżnico¬ 
wane w przestrzeni i zmieniają się także w czasie 
(zmiany dobowe i sezonowe). Kilka najbardziej 
charakterystycznych rozkładów przedstawia rys. 33. 
Niektóre z nich wykazują wyraźne minimum pręd¬ 
kości dźwięku na określonej głębokości. W obrębie 
warstw wyznaczonych przez takie minima funkcji 
c(z) wytwarzają się kanały dźwiękowe. Są to obszary, 
w których wskutek refrakcji fale dźwiękowe biegną 
jak w falowodzie, oscylując pomiędzy dwoma gra¬ 
nicznymi powierzchniami, na których zachodzi wa¬ 
runek (7) całkowitego wewnętrznego odbicia. Przy¬ 
kład schematycznego biegu promieni dźwiękowych 
w charakterystycznych wypadkach — w kanale dźwię¬ 
kowym przypowierzchniowym (na głębokości 40-70 
m) oraz w kanale głębinowym (1000-1500 m) — po¬ 
kazuje rys. 34. Na rys. 35 przedstawione są wyniki 
pomiarów wykonanych w oceanie na dużej głębokości. 

Szczególnego rodzaju falowód dla dźwięku może 
stanowić akwen morza płytkiego, gdzie rozchodzące 
się fale dźwiękowe ulegają kolejno odbiciom od dna 
i od powierzchni morza. Ilustrację wyników badań 
kanałów dźwiękowych w Bałtyku przedstawiają rys. 
36 i 37. Na rys. 37 jest uwidoczniona oś kanału dźwię¬ 
kowego c(z) = minimum, oszacowana z pomiarów 
temperatury i zasolenia. 


prędkość 

zasięg o o « 
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Rys. 35. Zmierzone przebiegi sygnałów dźwiękowych w kanale głębinowym SOFAR wg M. Ewinga i in. 
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Rys. 36. Zmiany sezonowe pionowego rozkładu średnich pręd¬ 
kości dźwięku w Głębi Bornholmskiej, wyznaczone na podsta¬ 
wie dziesięcioletniej serii pomiarów temperatury i zasolenia 
wody. Krzywe umieszczono na szarym tle, którego granice sta¬ 
nowią pionowe rozkłady minimalnych i maksymalnych pręd¬ 
kości dźwięku. Cyfry rzymskie oznaczają miesiące (wg P. Ty¬ 
mańskiego) 



Rys. 37. Rozkład poziomy średnich prędkości dźwięku w morzu 
w (m/s) wg danych z sierpnia oraz profil dna morskiego wzdłuż 
przekroju pionowego Głębia Gdańska-Rynna Słupska (P 7 -P 4 ), 
wyznaczony na podstawie wyników serii pomiarów temperatury 
i zasolenia wody, trwającej dziesięć lat (wg P. Tymańskiego) 


Rozpraszanie dźwięku 

Zjawisko rozpraszania dźwięku występuje zarówno 
przy jego odbiciu od pofalowanej powierzchni morza 
oraz nierównego dna, jak i przy odbiciu od niejedno¬ 
rodności wewnętrznych, takich jak pęcherzyki gazów, 
fluktuacje termiczne ośrodka, elementy biologiczne 
i in. Rozpraszaniu sygnałów akustycznych w różnych 
kierunkach towarzyszą fluktuacje amplitudy i fazy 
tych sygnałów, utrudniające w praktyce interpretację 
przy ich rejestracji. Ze względów teoretycznych i prak¬ 
tycznych zjawisku temu poświęca się w fizyce morza 
wiele uwagi. Zagadnienia związane z poszukiwaniem 
odpowiedniego modelu rozpraszania dźwięku przez 
nierówne powierzchnie można podzielić na dwie gru¬ 
py. W pierwszej grupie wychodzi się z założenia, że 
charakter powierzchni rozpraszających jest zdetermi¬ 
nowany (ma np. kształt o przekroju sinusoidalnym 
lub piłowatym), natomiast w drugiej grupie przyjmuje 
się statystyczny rozkład nierówności elementów roz¬ 
praszających i również pole akustyczne opisuje się 
statystycznie. Wiele prac eksperymentalnych prze¬ 
prowadza się na modelach w basenach przeznaczonych 
specjalnie do badań akustycznych. 


Wskutek rozpraszania dźwięku w morzu część 
energii akustycznej rozchodzi się we wszystkich kie¬ 
runkach — także pod kątem 180° (wstecz) — i po¬ 
wraca do źródła dźwięku. Odbiornik umieszczony 
w takim polu akustycznym rejestruje nie tylko falę, 
która do niego dochodzi bezpośrednio od źródła, ale 
również szereg fal rozproszonych przychodzących 
z różnych stron. Jeśli w pewnej chwili źródło dźwięku zjawisko 
zostanie nagle wyłączone, odbiornik po zaniknięciu pogłosu 
fali bezpośredniej będzie jeszcze przez pewien czas 
rejestrować fale rozproszone. Jest to tzw. zjawisko 
pogłosu lub rewerberacji w morzu. Zniekształca ono 
przesyłane w morzu sygnały dźwiękowe, powoduje 
„rozciąganie” ich w czasie i maskowanie sygnału 
dźwięku pożądanego przez powstające sygnały pa¬ 
sożytnicze (rozproszone). 


Tłumienie dźwięku 


Wskutek absorpcji przez ośrodek dźwięk w morzu 
jest tłumiony, czyli zmniejsza się jego amplituda 
w miarę rozchodzenia się sygnału. Wpływają na to 
głównie dwa czynniki. Jeden określa się jako tzw. 
tłumienie klasyczne, w którym decydującą rolę od¬ 
grywa lepkość środowiska, mniejszą — przewodnictwo 
cieplne; drugi wiąże się z tzw. relaksacją strukturalną 
(—► Przedmiot i zakres akustyki, rozdział: Akustyka 
molekularna), a tu główną rolę odgrywa oddziaływa¬ 
nie fali z drobinami rozpuszczonego w wodzie mor¬ 
skiej siarczanu magnezu MgS0 4 . W praktyce do okre¬ 
ślenia współczynnika tłumienia amplitudy fali dźwię¬ 
kowej w wodzie morskiej używa się zwykle empirycz¬ 
nego wzoru, ustalonego przez W. W. Schulkina 
i Marsha, który uwzględnia zarówno istniejące teorie 
absorpcji dźwięku w cieczach, jak i szereg wyników 
doświadczalnych uzyskanych w morzu przez wielu wzór 
autorów. W szczególności wzór ten uwzględnia za- Schulkina-- 
leżność od głębokości (poprzez ciśnienie hydrosta- Marsha 
tyczne) oraz od temperatury: 


a = 8,686-10-V 


/ 2 , 345 -^ 



X 


x (1-6,54-10 -*p\ (9) 


gdzie vt = 21,9-10~*- 1520 / <r+273) , S — zasolenie w % >ny 
T — temperatura bezwzględna, v — częstość fali 
w kHz, p — ciśnienie hydrostatyczne w atm. 

W przestrzeni otwartej (w praktyce — w morzu 
głębokim) natężenie fali dźwiękowej wytworzonej 
przez źródło bezkierunkowe, mierzone w pewnej od¬ 
ległości od tego źródła, wyraża się wzorem 



gdzie / — natężenie w odległości R od źródła, 7 0 — 
natężenie odniesienia w odległości R 0 = 1 m. 

Natężenie dźwięku maleje odwrotnie proporcjonal¬ 
nie do kwadratu odległości od źródła oraz eksponen- 
cjalnie wskutek absorpcji w toni wodnej. Współczyn¬ 
nik absorpcji zależy od częstości fali dźwiękowej, od 
zasolenia, temperatury i ciśnienia hydrostatycznego. 
Poziom natężenia dźwięku (w dB) określony jest jako: 

L = 10 lg-/-. 

i 0O 


Uwzględniając, że natężenie dźwięku jest proporcjo¬ 
nalne do kwadratu amplitudy, otrzymujemy 


Z. = 20 ]g——, 
-4 oo 


gdzie A i A 00 — amplitudy fali akustycznej odpowia- 
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dające natężeniom / i /«> odpowiednio (/ 0O — poziom 
odniesienia, np. 1 W/m 2 ). Zatem 

L = L 0 — (20 lg e) a R — 20Jg R, 

wyznaczanie gdzie e — podstawa logarytmów naturalnych. Na 
współczyn- podstawie tego wzoru wyznacza się współczynnik 
nika tłumienia dźwięku mierząc poziom natężenia fali 
tłumienia w dwóch odległościach R 0 i R od źródła. Współczyn¬ 
nik tłumienia a wyrażany jest w dB/m lub dB/km — 
w zależności od tego, czy R mierzymy w metrach czy 
kilometrach. Ostatni składnik 20 Ig R uważać można 
za regularną poprawkę, wynikającą z kulistego roz¬ 
chodzenia się fali, a liniowa zależność poziomu natę¬ 
żenia L od R pozwala z nachylenia prostej znaleźć 

a = (201ge)a = 8,686a, 

gdzie a — współczynnik tłumienia w dB/km. 

Pomiary takie były w oceanie wielokrotnie przepro¬ 
wadzane i wykazały liniową zależność od głębokości 
(od ciśnienia hydrostatycznego): 

a = oio—ap, 

gdzie a 0 — współczynnik tłumienia w dB/km dla 
ciśnienia odniesienia (na poziomie morza), a — współ¬ 
czynnik ciśnieniowy tłumienia w dB/(km*at). 

Na rys. 38 są porównane wyniki pomiarów wyko¬ 
nane w morzu z wynikami uzyskanymi z obliczeń na 
podstawie wzoru (6). 


m 

•o . 

•</> 

o 

O 
Jo 
or 

05 


3350 

2740 

2130 

1520 

910 

3350 

910 


'“O 260 520 780 1040 m 

odległość 

Rys. 38. Zależność natężenia fali ultradźwiękowej o częstości 
75 kHz od odległości od źródła. Linie ciągłe — zależności wy¬ 
znaczone w Oceanie Spokojnym przy różnych głębokościach 
— linie przerywane — zależności przewidywane przez wzór Schul- 
kina-Marsha (wg Bezdeka) 



dyspersja Zjawisko dyspersji prędkości dźwięku, czyli za- 
prędkości leżność prędkości od częstości fali, pozostaje w związ¬ 
ku głównie z występowaniem wspomnianej wyżej 
relaksacyjnej części absorpcji dźwięku. Ta dyspersja 
wykrywana jest w morzu w zakresie częstości 100- 
150 kHz. Dyspersyjny wpływ, szczególnie w morzach 
płytkich, mają także procesy tłumienia i rozpraszania 
dźwięku przez dno i sfalowaną powierzchnię morza. 
Dyspersyjne własności środowiska morskiego wy¬ 
raźnie mogą wpływać na przesyłane sygnały dźwię¬ 
kowe, gdy te mają szerokie widmo częstości, co ma 
przede wszystkim miejsce przy krótkich w czasie 
przebiegach impulsowych. 


Szumy własne morza 

Szumy własne morza, które ze względu na pochodze¬ 
nie dzielimy, jak już wspomniano, na naturalne 
i sztuczne, stanowią nie mniej bogaty świat dźwięków 
niż otaczający nas bardziej bezpośrednio poznawalny 
świat dźwięków w atmosferze. Jako przykłady źródeł 
naturalnych szumu morza należy wymienić: falowanie 


powierzchni morza, tarcie wiatru o powierzchnię, 
opady atmosferyczne, fluktuacje termiczne, burzliwe 
przepływy mas wodnych oraz aktywność różnych ga¬ 
tunków fauny morskiej (krewetki, ryby, delfiny i wiele 
innych). Szumy pochodzące od technicznej działal¬ 
ności człowieka — to głównie hałasy związane z ru¬ 
chem statków i innymi operacjami na morzu (np. 
poszukiwaniami geologicznymi), a w strefie przy¬ 
brzeżnej — również z działalnością na lądzie, gdyż 
hałasy łatwo się przez ląd przenoszą do wody. 

Pole akustyczne szumów własnych panujące w toni 
morskiej stanowi ciągle — mimo intensywnych ba¬ 
dań — temat mało znany, gdyż jest ono zależne od 
bardzo wielu zmiennych czynników. Jako pewną 
ogólną charakterystykę tego pola często się w litera¬ 
turze przytacza widmo szumów własnych morza 
(rys. 39), w którym się rozróżnia szereg składowych 
pochodzących z rozmaitych źródeł. Rysunek 40 
przedstawia jako przykład dźwięków biologicznych 
w morzu zapis sygnału (i jego widmo) wydawanego 
przez rybę. Ilustracja 26 (tabl. 8) ukazuje hydrofon 
rejestrujący szumy podwodne w toni morskiej. 



Rys. 39. Składowe akustycznego pola szumów własnych w morzu. 
Wykresy przedstawiają uśrednione wyniki wielu badań określa¬ 
jące poziomy ciśnienia akustycznego i obszary widmowe (nie¬ 
bieskie strzałki poziome) przyporządkowane prawdopodobnym 
źródłom szumów w zakresie od 1 Hz do 100 Hz (wg Z. Kluska) 
1 minimalny i maksymalny poziom szumu własnego; 2 szumy 
zależne od prędkości wiatru, niebieskie okółkowane cyfry — siła 
wiatru w skali Beauforta, których źródłem mogą być pęcherzyki 
gazów i bryzgi; linie przerywane określają ekstrapolację danych 
pomiarowych do poziomu szumów cieplnych; 3 tzw. pseudo- 
dźwięki — pulsacje ciśnienia, których prędkość fazowa rozcho¬ 
dzenia się jest mniejsza od prędkości dźwięku w danym środo¬ 
wisku w zakresie małych częstości; 4 szumy rejestrowane przy 
obfitych opadach atmosferycznych; 5 szumy powstające przy 
ożywionym ruchu statków; 6 hałasy statków na wodach płyt¬ 
kich; 7 hałasy statków na wodach głębokich; 8 szumy cieplne; 
9 wybuchy i wstrząsy sejsmiczne; 10 krzywa ekstrapolowana 
składowej zależnej od wiatru; 11 szumy rejestrowane w akwenie 
całkowicie pokrytym lodami 
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Rys. 40. Dźwięk wydawany przez rybę (Opiccphalus argus ) 
w chwili schwytania zdobyczy zarejestrowany w basenie rzeki 
Amur: a) zapis dźwięku na oscylografie i b) jego widmo (wg 
W. R. Protasowa i E. W. Romanienko) 


Zastosowanie 

Całokształt omówionych wyżej zjawisk akustycznych 
w morzu warunkuje możliwości wykorzystania fal 
akustycznych. Są one szerokie i obejmują zastosowa¬ 
nia: komunikacja podwodna, zdalne pomiary wiel¬ 
kości fizycznych charakteryzujących hydrosferę (tem¬ 
peratura, ciśnienie hydrostatyczne, zasolenie, pręd¬ 
kość prądów mas wodnych itp.), echosondaż (po¬ 
miary głębokości, analiza dna i poddennych warstw 
geologicznych, wykrywanie zasobów rybnych, stero¬ 
wanie i obserwacja procesów połowów ryb), sonar 
(przeszukiwanie toni wodnej w określonym sektorze 
azymutalnym i wykrywanie obiektów podwodnych, 
np. przeszkód nawigacyjnych, ławic ryb itp.), nawi¬ 
gacja (np. log dopplerowski do określania szyb¬ 
kości względnej ruchomych obiektów). 

Urządzenia ultradźwiękowe służące do komunika¬ 
cji podwodnej i hydrolokacji, przy korzystaniu z któ¬ 
rych ważny jest zarówno zasięg, jak i kolimacja wiązki 
fal, pracują zwykle w zakresie częstości optymalnych, 
rzędu kilkudziesięciu kHz. Kiedy chodzi o uzyskanie 
dużego zasięgu, stosuje się sygnały o częstościach 
mniejszych (z uwagi na mniejsze tłumienie). W niektó¬ 
rych zagadnieniach specjalnych, jak badanie przepły¬ 
wów czy wykrywanie obiektów małych na podstawie 
zjawiska Dopplera, stosuje się także ultradźwięki o 
większych częstościach — kilkuset kHz, a nawet MHz. 

Po raz pierwszy zastosowano ultradźwięki do celów 
podwodnych podczas I wojny światowej, kiedy to 
P. Langevin, fizyk francuski, zbudował urządzenie 
echolokacyjne — echosondę. Echosonda wysyła syg¬ 
nał (krótki impuls), a następnie odbiera go po odbiciu 
od przeszkody; długość odstępu czasu między wysła¬ 
niem i odebraniem sygnału i zmiana jego natężenia 
daje informacje o przeszkodzie, zwłaszcza o odległo¬ 
ści, w jakiej się znajduje (rys. 41). 

SONAR Układy echolokacyjne oparte na wykorzystaniu fal 
ultradźwiękowych.w morzu określa się obecnie nazwą 
SONAR (Sonic Navigation and Ranging). Współ¬ 
czesne statki wyposażone są w szereg urządzeń ultra¬ 
dźwiękowych do badania i penetrowania hydrosfery; 
najważniejsze z nich przedstawia poglądowo rys. 42. 
W zależności od typu statku, jego wielkości i przezna¬ 
czenia liczba tych urządzeń jest różna. Na statkach 
dużych instaluje się często po kilka echosond, o róż¬ 
nych zasięgach i różnych szerokościach wiązki. Urzą¬ 
dzenia hydro lokacyjne na nowoczesnych statkach, 
szczególnie okrętach wojennych, statkach rybackich 
i pomiarowo-badawczych (np. m/s „Profesor Sie- 



Rys. 41. Schemat i zasada działania echosondy ultradźwiękowej 
na statku: 1 generator impulsów elektrycznych, 2 przetwornik 
nadawczy impulsów ultradźwiękowych, 3 przetwornik odbiorczy 
impulsów ultradźwiękowych, 4 wzmacniacz, 5 układ synchroni¬ 
zujący, 6 rejestrator piszący, 7 rejestrator oscyloskopowy 



Rys. 42.Urządzenia hydroakustyczne na statku morskim: 1 urzą¬ 
dzenie do zdalnego pomiaru wielkości fizycznych — dane reje¬ 
strowane przez czujnik pomiarowy M przekazywane są na statek 
badawczy (lub na ląd) przy pomocy łącza ultradźwiękowego; 
2 hydrotelefon — urządzenie do dwustronnej komunikacji tele¬ 
fonicznej z nurkiem swobodnym lub innym obiektem zanurzo¬ 
nym; 3 echosonda ultradźwiękowa do pomiaru głębokości morza, 
badań struktury dna oraz wykrywania ławic ryb; 4 echosonda 
sieciowa — do określania położenia włoka (zwłaszcza pelagicz- 
nego), jego rozwarcia, naprowadzenia na ławicę i obserwacji 
ryb wpadających do włoka; 5 sonar do przeszukiwania toni wod¬ 
nej w określonym sektorze azymutalnym (zwykle ±120°) celem 
wykrycia i lokalizacji obiektów podwodnych, np. gór lodowych-, 
wraków, ławic ryb itp.; 6 log dopplerowski — do pomiaru pręd¬ 
kości rzeczywistej statku. Jest to jedyny przyrząd umożliwiający 
pomiar prędkości statku względem dna morza bez błędów pow¬ 
stających wskutek prądów, wpływu wiatru itp. czynników (wg 
Z. Jagodzińskiego) 


dlecki”), współdziałają z komputerami, które w bar¬ 
dzo szybki i dokładny sposób przetwarzają rejestro¬ 
wane sygnały akustyczne na pożądane informacje. 

R. D. Bobber Hydroakusticzeskije izmierienija , Moskwa 1974* 
L. M. Brekhowskikh (ed.) Akustika okieana , Moskwa 19741 
J. Dera i in. Wybrane zagadnienia fizyki morza. Część V. Rozprar 
szanie dźwięku na sfalowanej powierzchni morza i dnie morskim* 
Post. Fiz. 25, 175(1974); J. Dera i in. Wybrane zagadnienia fizyki 
morza. Część IV. Fale dźwiękowe w morzu , Post. Fiz. 23, 667 
(1972); Fizyka morza, cz. II — Akustyka morza , Sopot 1974; 
Z. Kowalik i in. Podstawy hydroakustyki, Gdynia 1965; A. B. 
Staszkiewicz Akustika moria , Leningrad 1966; R. W. B.Stephens 
Underwater Acoustics , London 1970; Studia i materiały oceano- 
logiczne 7, 109 (1973); W. W. Szulkin Fizyka moria , Moskwa 
1968. 


885 












































Fizyka wód śródlądowych 

Bohdan Utrysko 


wody Przez pojęcie wód śródlądowych rozumie się w tech- 
śródlądowe nice cieki i zbiorniki naturalne i sztuczne, tzn. stru¬ 
mienie, rzeki, kanały, jeziora i zbiorniki zaporowe. 
W fizyce rozszerzamy pojęcie wód śródlądowych na 
całą tę część obiegu wody w przyrodzie, która się 
odbywa na lądzie. Woda śródlądowa pojawia się 
w postaci opadu lub kondensacji pary wodnej na cia¬ 
łach stałych, a opuszcza ląd parując lub odpływając do 
morza. Woda opadowa częściowo paruje, spływa po 
powierzchni ziemi lub wsiąka w grunt, by zasilić po¬ 
tem znów wody powierzchniowe albo wyparować. 
Wyodrębnić więc można dwa środowiska występowa¬ 
nia wód lądowych: w korytach i zbiornikach otwar¬ 
tych (wody powierzchniowe) oraz w porach gruntów 
i szczelinach skał (wody podziemne). 

Przepływ wody powierzchniowej podlega prawom 
badanym przez dynamikę cieczy (hydrodynamikę, 
hydraulikę), zmiany cieplne obejmuje termika wód, 
efekty oddziaływania płynącej wody na jej koryto — 
dynamika koryt. Całość zagadnień przepływów pod¬ 
ziemnych obejmuje nauka zwana najczęściej teorią 
filtracji. W każdej z tych nauk istnieje szereg proble¬ 
mów, które naukowcy starają się rozwiązać w aktual¬ 
nie prowadzonych badaniach. Aby je zrozumieć, 
konieczne jest wprowadzenie w najogólniejsze pojęcia 
i prawa rządzące w wymienionych dziedzinach. 


Mechanika przepływów wód 
powierzchniowych 

Wody powierzchniowe pozostają w kontakcie z atmo¬ 
sferą całą swą powierzchnią, zwaną zwierciadłem 
albo swobodną powierzchnią wody. Na powierzchni 
tej panuje wszędzie jednakowe ciśnienie. 

Woda znajdująca się w stanie spoczynku w nie¬ 
ruchomym zbiorniku poddana jest działaniu sił cięż¬ 
kości i ciśnienia, równoważących się wzajemnie. 
Z warunku równowagi sił wynika wzór na ciśnienie 
hydrostatyczne : 

P = Po+QgK 

w którym p 0 jest ciśnieniem na powierzchni, h — 
zagłębieniem punktu, w którym ciśnienie wynosi p y 
q — gęstością wody. 

W wodzie płynącej związki są bardziej złożone. 
W dowolnym punkcie obszaru wypełnionego cieczą 
i w dowolnej chwili t występuje pewna prędkość v , 
ciśnienie p y a woda posiada gęstość q. Dla znale¬ 
zienia wartości tych trzech niewiadomych potrzebne 
są trzy równania. Są to: równanie stanu, wyrażające 
zależność gęstości wody od jej ciśnienia i temperatury, 
równanie ciągłości, wyrażające warunek zachowania 
masy, oraz równanie ruchu, wyrażające zależność 
wszystkich sił działających na cząstkę cieczy, 
charakterys- W wielu zagadnieniach praktycznych, szczególnie 
tyka dotyczących przepływów wód powierzchniowych, 
strumienia w rozważaniach traktuje się cały strumień cieczy łącz- 
cieczy nie i bada się parametry opisujące globalnie sytuację 
w danym przekroju strumienia. Do podstawowych 
wielkości charakteryzujących strumień należą: 

— objętościowe natężenie przepływu (krócej prze¬ 


pływ) Q y będące stosunkiem objętości wody dV y 
przepływającej przez pewien przekrój w czasie dt , do 
tego czasu. 

— pole przekroju poprzecznego S. Jeśli chodzi o prze¬ 
pływ w przewodach zamkniętych, jest ono z góry 
znane, natomiast w korytach otwartych zależy od 
napełnienia koryta. Jeśli kształt koryta jest znany, 
pole jest jednoznacznie określone przez rzędną swo¬ 
bodnej powierzchni z. Niekiedy, zwłaszcza gdy prze¬ 
krój koryta jest regularny, wygodniej jest operować 
głębokością średnią, określoną jako h& r = S/B , gdzie 
B jest szerokością strumienia. 

— energia potencjalna płynącej wody, charaktery¬ 
zowana przez h p = z+pj(Qg) y tzw. wysokość energii 
potencjalnej. 

Gdy kierunek ruchu jest niewiele odchylony od 
poziomu, a tak jest przecież w rzekach i kanałach, 
ciśnienie wzdłuż linii pionowych zmienia się niemal tak 
jak w wypadku wody stojącej i h p wszystkich cząstek 
w przekroju jest wtedy identyczne i równe: 


■^•pow I-. 

Qg 

Ponieważ p Q jest jednakowe we wszystkich przekro¬ 
jach, do określenia energii potencjalnej strumienia 
w podanych wyżej warunkach wystarczy znajomość 
rzędnych zwierciadła wody z p0 w 

Wielkościami pochodnymi od wyżej podanych są 
występujące często we wzorach i obliczeniach: 
prędkość średnia w przekroju vs r = QJS y 
promień hydrauliczny przekroju R h = SjO z . Sym¬ 
bolem Oz oznaczono obwód zwilżony, czyli długość 
tej części obwodu przekroju S y na której woda sty¬ 
ka się z ciałami stałymi. Przyjmuje się, że w korytach 
naturalnych, szerokich i płytkich ( B > 30 h śr ) Rn = 
= hśr- 

Najogólniejszym rodzajem ruchu wody jest prze¬ 
pływ nieustalony (zmienny w czasie). W przepływie 
ustalonym parametry ruchu nie zależą od czasu, a na¬ 
tężenie przepływu, przynajmniej między dopływami 
lub rozgałęzieniami kanału, pozostaje stałe. Jeżeli 
kształt koryta jest niezmienny, jego kierunek prosto¬ 
liniowy i głębokość wszędzie jednakowa, to mamy do 
czynienia z ruchem jednostajnym. Jest to najprostszy 
rodzaj ruchu. 

W dynamice przepływów wód powierzchniowych 
zmiany gęstości, wywołane zmianami ciśnienia i tem¬ 
peratury, mają najczęściej znikome znaczenie i do roz¬ 
ważań można przyjąć równanie stanu w postaci: 

o = const. 


Dla koryt otwartych, przy rozpatrywaniu całościo¬ 
wym przekrojów i założeniu q = const, równanie 
ciągłości ma postać 8QI8l+dSI8t = 0. W ruchu usta¬ 
lonym (niezależnym od /) równanie to upraszcza się 
do warunku Q = const. 

W ruchu jednostajnym oraz w zbliżonym do niego 
ustalonym ruchu wolnozmiennym zależności dyna¬ 
miczne wyraża równanie Bernoulliego (rys. 1): 


*1 + 


Pi 

Qg 


2g 


Do 

eg 


ai\ 

2 g 


-\-Ahc. 



linia energii 



poziom porównawczy 



Rys. 1. Interpretacja równa¬ 
nia Bernoulliego: a) ciecz do¬ 
skonała, b) ciecz rzeczywista 
(w równaniu należy wówczas 
uwzględnić straty energii) 


przepływ 
ustalony 
i nie¬ 
ustalony 


równanie 

Bernoulliego 
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wspólczyn- Wielkości z indeksami 1 i 2 dotyczą dwóch kolejnych 
nik przekrojów strumienia. Współczynnik 


Coriolisa 


a = 



vVS, 


zwany współczynnikiem Coriolisa lub Saint-Venanta, 
pozwala na uwzględnienie nierównomiernego roz¬ 
kładu energii kinetycznej w strumieniu. Każdy z wy¬ 
razów równania Bernoulliego ma wymiar liniowy i wy¬ 
raża wysokość odpowiedniego rodzaju energii (po¬ 
tencjalnej i kinetycznej), tzn. stosunek wielkości e- 
nergii do ciężaru cieczy. Ostatni symbol Ah c przedsta¬ 
wia różnicę wysokości łącznej energii mechanicznej 
w obu przekrojach. Ten ubytek energii pochodzi stąd, 
że płynąca ciecz musi pokonać pewne opory, które 
są analogiczne do sił tarcia ale których wielkość 
zależy od prędkości ruchu. 

Bezwymiarowa wielkość: 

1 dE 

J ~ mg dl ’ 

przedstawiająca straty energii mechanicznej E na 
jednostkę długości odniesione do ciężaru płynącej 
wody, nazywana jest spadkiem hydraulicznym. 

Ruch jednostajny w korycie otwartym opisuje 
równanie Bernoulliego zredukowane do: 

z t —z 2 = //. 

Wielkość / jest więc wtedy równa spadkowi zwier¬ 
ciadła wody. 

Określenie ilości energii zużytej na pokonanie o- 
porów ruchu i wyjaśnienie mechanizmu powstawania 
tych strat stanowi jedno z najważniejszych zadań 
dynamiki przepływów. Jeśli prędkość jest bardzo 
mała, cząsteczki wody płyną wzdłuż regularnych to- 
ruch rów, tworząc warstewki posuwające się jedne po dru- 
laminarny gich. Ruch taki nazwano uwarstwionym, czyli lami- 
narnym. 

Wyobraźmy sobie dwie bardzo duże płaskie płyty 
(rys. 2), między którymi znajduje się ciecz. Górna 
płyta przesuwa się względem dolnej równolegle i ze 





Rys. 2. Ruch cieczy lepkiej między płytami ruchomą i nieruchomą 


stałą prędkością v 0 . Cząsteczki wody przylegające 
do obu płyt mają prędkości takie jak płyty, tzn. 
w pobliżu płyty górnej mają prędkość v 0 . Natomiast 
cząsteczki znajdujące się dalej płyną z coraz mniej¬ 
szą prędkością; płyną one warstewkami (stąd nazwa 
uwarstwiony, laminarny) jedna po drugiej. Newton 
podał wzór wiążący występującą między sąsiednimi 
warstewkami siłę tarcia wewnętrznego T z prędkością 
ruchu: 



(S jest powierzchnią, na której działa siła styczna T). 
Występujący we wzorze współczynnik proporcjo¬ 
nalności n zwany jest dynamicznym współczynnikiem 
lepkości. Jest to wielkość charakteryzująca dany 
płyn, np. dynamiczny współczynnik lepkości wody 
w- temperaturze 20°C ma wartość 0,001 Ns/m 2 , oliwy 


zaś 0,084 Ns/m 2 . Maleje on szybko ze wzrostem tem¬ 
peratury; zależność dynamicznego współczynnika 
lepkości wody od temperatury jest przedstawiona na 
rys. 3. 



temperatura 

Rys. 3. Wykres zależności lepkości wody od temperatury 


Przy nieco większych prędkościach obraz ruchu 
bardzo się komplikuje. Cząsteczki wody, poruszając 
się wzdłuż torów chaotycznych i splątanych, tworzą 
mniejsze i większe zawirowania. Nawet w ruchu 
makroskopowo ustalonym chwilowa prędkość i ciśnie¬ 
nie w każdym punkcie podlegają bardzo szybkim 
i przypadkowym zmianom. Ruch taki nazywa się 
burzliwym lub turbulentnym. W ruchu burzliwym tar¬ 
cie wewnętrzne jest o wiele większe niżby to wynikało 
z wzoru Newtona przy założeniu, że v Q jest prędkością 
przeciętną, tzn. średnią w czasie w każdym punkcie. 
Co więcej, z tego wzoru wynika, że straty powinny 
być proporcjonalne do prędkości, natomiast doświad¬ 
czenia wykazują, że w ruchu burzliwym dwukrotny 
wzrost prędkości średniej powoduje prawie cztero¬ 
krotny wzrost strat. Znaczy to, że szukana zależność 
jest zbliżona do parabolicznej. We wszystkich rodza¬ 
jach przepływu wód powierzchniowych interesujących 
ze względu na znaczenie praktyczne występuje roz¬ 
winięty ruch turbulentny. 

W praktyce do obliczeń prędkości średniej najczęściej 
stosuje się wzór Chezy’ego: 

Vśr = c ]/'Rh • / . 

Współczynnik c może być wyznaczony z różnych wzo¬ 
rów empirycznych, np. ze wzoru Manninga: 


gdzie ti jest współczynnikiem szorstkości. Niektóre 
wartości tego współczynnika dotyczące przepływów 
w korytach otwartych podano w tabeli. 


Wartości współczynnika szorstkości n do wzoru Manninga 


Rodzaj koryta 


n 


Kanały betonowe 
Kanały w zwartej ziemi 

Małe kanały ziemne, rzeki o czystym i prostym 
korycie 

Kanały w złym stanie, rzeki o dobrych warunkach 
przepływu 

Rzeki o przeciętnych warunkach przepływu 
Rzeki kręte, częściowo zarośnięte 


0,017 

0,020 

0,025 

0,030 

0,035 

0,040 


W ruchu wolnozmiennym, tzn. takim, w którym za¬ 
równo przekroje 5, jak i rozkłady prędkości wzdłuż 
strumienia zmieniają się płynnie i niezbyt szybko, 
równanie Bernoulliego dotyczące odcinka / ma postać: 


, av i . ocv 

Zl+ 1F = Z2+ '2F +tt 


Z równania tego można wyznaczyć położenie zwier¬ 
ciadła w kolejnych przekrojach (rys. 4). 


ruch 

turbulentny 


wzór 

Chezy'ego 


wzór 

Manninga 
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Rys. 4. Przepływ wolnozmienny w rzece — bilans energii 


Bardzo istotną sprawą, zwłaszcza gdy chodzi o prze¬ 
pływy niejednostajne, jest określenie typu ruchu. 
Ta sama ilość wody może płynąć w danym korycie 
prędzej, mniejszym przekrojem, lub wolniej — kory¬ 
tem o większej powierzchni i głębokości. Zależnie od 
głębokości i prędkości zmienia się energia strumienia: 
gdy przekrój strumienia dąży do zera, prędkość i e- 
nergia kinetyczna rośnie nieograniczenie; natomiast 
gdy głębokość i energia potencjalna dąży do nieskoń¬ 
czoności, prędkość i energia kinetyczna maleje do 
zera (rys. 5). Pomiędzy tymi dwoma skrajnymi ro¬ 
dzajami przepływu mieszczą się przepływy rzeczy- 


tycznym. 2) Po przekroczeniu v k żadne zaburzenia nie 
mogą się już przenosić pod prąd. Prędkość wody jest 
większa od prędkości fal biegnących po jej powierzchni 
w przeciwnym kierunku. 

Ze względu na tę ostatnią cechę dzielimy przepływy 
na dwa rodzaje: przepływy spokojne, v < v ky w któ¬ 
rych zaburzenia przenoszą się w obie strony cieku 
(ruchem spokojnym płynie ogromna większość rzek, 
strumieni i potoków); przepływy rwące, v > v k , w 
których górna część cieku jest izolowana od wpływu 
czynników występujących poniżej (ruch ten występuje 
w niektórych potokach górskich i u podnóża budo¬ 
wli piętrzących wodę). 

Oprócz wymienionego już ustalonego ruchu wolno- 
zmiennego spotyka się w naturze przepływy z gwał¬ 
townymi zmianami warunków ruchu. Jako ciekawy 
przykład takiego przepływu można podać przejście 
z ruchu rwącego do ruchu spokojnego. Strumień pły¬ 
nący ruchem rwącym o niewielkiej głębokości na¬ 
trafia na wodę płynącą ruchem spokojnym, wolniej¬ 
szym, o powierzchni wzniesionej dużo wyżej (rys. 6). 
Powstaje niepodparta ściana wody, z której spływa ona 
w kierunku pod prąd. Woda ta nie może jednak płynąć 
dalej, porywają bowiem i unosi z powrotem strumień 
rwący. Powstaje spłaszczony walec o poziomej osi, 
w którym krąży woda. Strumień przepływający pod 



Rys. 6. ,,Odskok” — przejście strumienia z ruchu rwącego w ruch 
spokojny 



Rys. 5. Zależność energii strumienia od jego głębokości, przy 
stałym natężeniu przepływu 


przepływ wiste, o ograniczonej energii, a wśród nich prze- 
krytyczny pływ o energii minimalnej, nazywany krytycznym. 

Jest to taki przepływ, w którym przy danym Q ener¬ 
gia całkowita (określona sumą wyrazów równania 
Bernoulliego) jest najmniejsza z możliwych. Para¬ 
metry ruchu krytycznego są związane równaniem 

SL 

B g ' 

Odpowiada to prędkości zwanej również krytyczną: 


prędkość 

krytyczna 



Prędkość ta jest niemal równa prędkości rozchodze¬ 
nia się fal powierzchniowych. Ruch krytyczny jest 
istotny z dwóch względów: 1) Szereg zjawisk w przy¬ 
rodzie zachodzi według zasady minimum energii, np. 
przypływy przez progi, przewężenia, jeżeli strumień 
przy tym ulega spiętrzeniu, odbywają się ruchem kry- 
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spodem walca jest hamowany przez różnicę ciśnień do 
prędkości ruchu spokojnego — i dalej znów całym 
przekrojem płynie w kierunku zasadniczym. Zjawisko 
to nazywa się odskokiem i można je często obserwo¬ 
wać, gdy woda spływa po stromej ścianie i trafia do 
zbiornika lub na płaski odcinek koryta. 

W badaniach ruchów nieustalonych wyodrębnić na¬ 
leży przede wszystkim ruchy okresowe i nieokresowe. 
Ruchy okresowe, czyli falowanie, odgrywają w dyna¬ 
mice wód śródlądowych mniejszą rolę, natomiast 
stanowią istotny element dynamiki morza. Ruchy nie¬ 
okresowe można podzielić na przepływy o zmianach 
powolnych i zmianach gwałtownych. Przykładem 
przepływu pierwszego rodzaju jest fala powodziowa; 
długość fali jest tysiące razy większa od jej wysokości, 
prędkość przesuwania się szczytu fali jest nieco więk¬ 
sza niż prędkość przepływu, ale wznoszenie zwierciad¬ 
ła odbywa się bardzo powoli. Z gwałtownymi zmiana¬ 
mi przepływu możemy mieć do czynienia np. w mo¬ 
mencie przerwania zapory piętrzącej wodę. W dół rze¬ 
ki biegnie wtedy potężna i stroma fala o wielkiej 
energii, ale dość szybko rozpływająca się, zwłaszcza 
gdy objętość zbiornika jest niewielka, a dolina — 
szeroka. Jednocześnie w samym zbiorniku powstaje 
gwałtowna fala obniżenia, idąca w górę cieku. Jest 
ona również niebezpieczna (chociaż w mniejszym 
stopniu niż fala przyboru), może bowiem spowo¬ 
dować obsunięcie zboczy zbiornika i zniszczyć jego 
brzegi. 

Prowadzone współcześnie badania w dziedzinie 
przepływów wód powierzchniowych skupiają się na 
następujących zagadnieniach: 

a) zrozumieniu zjawisk zachodzących wewnątrz 
strumienia cieczy, przede wszystkim turbulencji 
i związanego z nią zjawiska dyfuzji; 

b) badaniu zjawisk wzajemnego oddziaływania 
dwóch strumieni, np. wody słodkiej i słonej (ujścia 
rzek), ciepłej i zimnej (zrzuty wody chłodzącej), 
czystej i zanieczyszczonej: 

c) bardzo istotnych i ciekawych doświadczeniach 
na modelach kanałów, rzeki budowli wodnych. Zja- 


przeplywy 
spokojne 
i rwące 


odskok 


badania 

współczesne 






















zdolność 

transportowa 

strumienia 


wiska zachodzące w strumieniu wody płynącym kory¬ 
tem o skomplikowanym kształcie są tak złożone, że 
nie znane są jeszcze metody opisu matematycznego te¬ 
go ruchu ani sposoby rozwiązania. Jeżeli się chce wie¬ 
dzieć, co się będzie działo po zbudowaniu zapory czy 
uregulowaniu rzeki, uciec się trzeba do doświadczeń. 
Oczywiście nie może to być doświadczenie w warun¬ 
kach naturalnych, bo nie do pomyślenia jest wznosze¬ 
nie na próbę kosztownych budowli. Odtwarza się je 
więc w laboratorium w zmniejszonej skali i na takim 
modelu wykonuje się doświadczenia. Zasady odtwa¬ 
rzania zjawisk dynamicznie podobnych, konstruo¬ 
wania modeli i wykonywania na nich badań stanowią 
dziś już odrębny dział mechaniki cieczy. Coraz częś¬ 
ciej badania modelowe wspomaga się aparaturą elek¬ 
tronową i maszynami liczącymi, które rejestrują i o- 
pracowują wyniki pomiarów, a ponadto służą do wy¬ 
konywania —jednocześnie z doświadczeniami fi¬ 
zycznymi — obliczeń tego samego zadania. 

d) technice cyfrowej, która pozwoliła również na 
przeprowadzenie bardzo skomplikowanych obliczeń 
i rozwiązywanie metodami przybliżonymi złożonych 
równań (dotyczących np. ruchu nieustalonego). 


Dynamika koryt 

Woda płynąca korytem rzeki oddziałuje na nie po¬ 
wodując erozję (rozmycie), transport cząstek sta¬ 
łych i ich sedymentację (osadzanie). Energia prze¬ 
pływu zużywana jest nic tylko na pokonanie oporów 
ruchu, ale również na odspojenie materiału, jego tran¬ 
sport i obróbkę (rozdrobnienie i wygładzenie). 
Wszystko to powoduje, że spadek hydrauliczny w ko¬ 
rycie niosącym rumowisko jest większy niż w odpo¬ 
wiadającym mu korycie o dnie stałym. Istnieje zależ¬ 
ność między ilością i jakością (wielkością i gęstością) 
materiału wleczonego i unoszonego a parametrami 
samego przepływu, a więc głębokością wody h i spad¬ 
kiem hydraulicznym J. Każdy strumień posiada pew¬ 
ną zdolność transportową, którą stara się wykorzystać. 
Jeśli więc na jakimś odcinku cieku ilość materiału 
dostarczana przez przekrój początkowy jest mniejsza 
niż zdolność transportowa w dolnej części odcinka, 
następuje erozja i wynoszenie dodatkowych ilości ma¬ 
teriału. Prowadzi to do silnych rozmyć, głównie 
brzegów, rzeka zaczyna meandrować, jej bieg się wy¬ 
dłuża, maleje spadek, a z nim i zdolność transporto¬ 
wa. Jeżeli brzegi są zabezpieczone przed rozmyciem, 
następuje silne pogłębienie koryta. Zjawisko to wy¬ 
stępuje wyraźnie np. po wybudowaniu zapory i stwo¬ 
rzeniu zbiornika. Spadki powyżej zapory są bardzo 
małe i całe rumowisko osadza się w zbiorniku lub 
przy wlocie do niego. Następuje przy tym rozsorto- 
wanie materiału. Im bliżej zapory, tym mniejsza 
prędkość wody i tym drobniejszy materiał osiada na 
dnie. Przez zaporę przepływa już tylko czysta woda 
i strumień stara się jak najszybciej „nasycić” ma¬ 
teriałem rozmywając i pogłębiając koryto poniżej 
budowli. 

Ilości transportowanego materiału mogą być bar¬ 
dzo duże (np. Wisła środkowa przenosi w przybliże¬ 
niu masę 3 min ton rocznie). Sprawy określenia 
bilansu rumowiska, jego ilość i jakość są więc istotne, 
ale i bardzo skomplikowane. Powodem tego jest nie 
tylko niedostateczna jeszcze znajomość mechanizmu 
unoszenia i wleczenia, duża różnorodność kształtu 
i wielkości ziaren oraz form dna, ale i ciągła zmiana 
warunków przepływu: prędkości, głębokości, a nawet 
spadku. Otrzymane z doświadczeń liczne wzory o- 
kreślające ilość rumowiska mają wciąż jeszcze charak¬ 
ter empiryczny i dość wąskie zastosowanie. 

Graniczna prędkość przepływu, poniżej której 
ziarna pozostają nieruchome, zależy od wielkości 
ziaren, z których zbudowane jest dno (od ich średnicy 
d) i wyznacza się ją doświadczalnie. Zależnie od pręd¬ 
kości przepływu materiał dna tworzy różne formy. 
Jeśli prędkość jest mała, ale przekracza prędkość 


graniczną, na płaskim dnie powstają drobne zmarszcz¬ 
ki. Przy wzroście prędkości pojawiają się większe 
fałdy (diuny), pokryte często zmarszczkami. Ziarna 
wtaczają się po łagodnym stoku fałdy i przesypują 
się przez jej krawędź. Przy dalszym wzroście prędkości 
dno znowu staje się płaskie i wszystkie cząstki biorą 
jednocześnie udział w ruchu. Wreszcie przy bardzo du¬ 
żej prędkości wystąpić mogą znowu fałdy (antydiuny). 
Stroną o łagodniejszym stoku są one zwrócone w kie¬ 
runku przepływu i przesuwają się (fałdy, a nie tworzą¬ 
ce je ziarna!) pod prąd. Zależnie od istniejących form 
dennych zmienia się szorstkość dna i opór stawiany 
przepływowi wody. 


Mechanika przepływów wód podziemnych 

Grunty sypkie składają się z ziaren różnej wielkości 
i kształtu. Między ziarnami, w porach gruntu, może 
się znajdować i przepływać woda. Jeżeli woda wy¬ 
pełnia wszystkie pory, mówimy, że grunt jest całko¬ 
wicie nasycony wodą, jeżeli nie — nasycenie jest 
niepełne. Kanaliki, którymi przepływa woda w grun¬ 
cie, mają bardzo skomplikowane i różnorodne formy. 
Nie jest więc możliwe ani konieczne określenie rze¬ 
czywistej prędkości cząstek wody. W rozważaniach 
zastępuje się prędkość rzeczywistą fikcyjną pręd¬ 
kością filtracji. Jest to iloraz przepływu i całkowi¬ 
tego pola przekroju warstwy, tzn. łącznie pola kana¬ 
lików i ziaren: ty = Q/Sw. Oczywiście prędkość 
filtracji jest mniejsza od prędkości rzeczywistej. Z wy¬ 
jątkiem wypadków przepływu wody przez złoża ru¬ 
moszu i bardzo grubego żwiru, gdzie się może pojawić 
turbulencja, przepływ w gruntach odbywa się ruchem 
laminamym. Opory ruchu wyrażają się wtedy wzorem 
Darcy’ego: 

r r i dh 

Vf = kJ = » 

Współczynnik filtracji k zależy od rodzaju gruntu, 
tzn. od wielkości ziaren, ilości porów i temperatury 
wody (lepkości); współczynnik k żwirów wynosi 
ok. 3 *10" 2 m/s, piasków średnioziamistych 10 " * m/s, 
glin 10" 8 m/s. 

Ponieważ h p = z~Vp\{qg) oznacza wysokość energii 
potencjalnej wody, a równanie ciągłości w wypadku 

nieściśliwego gruntu i wody wyraża wzór div v/ = 0, 
złożenie obu tych wzorów, gdy grunt jest jednorodny 
(stałe A), prowadzi do równania Laplace’a: 

V 2 h p = 0. 

Jest to równanie identyczne co do postaci z rów¬ 
naniem określającym przepływ prądu elektrycznego. 
Można mówić o analogii dwóch zjawisk: przepływu 
wody w gruncie i prądu w przewodniku. Wysokość 
energii h p odpowiada napięciu prądu, przepływ wo¬ 
dy Q — natężeniu prądu, a odwrotność k — opornoś¬ 
ci przewodnika. Analogię tę wykorzystuje się dziś 
powszechnie przy badaniu skomplikowanych prze¬ 
pływów wód podziemnych — stosuje się mianowicie 
albo modele AEHD (modele analogii elektro-hydro- 
dynamicznej), albo specjalne urządzenie zwane ana¬ 
lizatorem pola. 

W metodzie AEHD modelami gruntu są przewodni¬ 
ki o kształcie geometrycznie podobnym do badanej 
warstwy. Jeżeli model może być płaski, tzn. gdy prze¬ 
pływ odbywa się w równoległych płaszczyznach (np. 
pionowych), jako przewodnika używa się papieru ele- 
ktroprzewodzącego; wycina się z niego kształt (rys. 
7b) odpowiadający rzeczywistym warunkom przepły¬ 
wu (rys. 7a). Jeśli zadanie jest bardziej złożone, użyć 
można elektrolitu, wypełniającego wanienkę o odpo¬ 
wiednim kształcie. Sondą podłączoną przez galwano- 
metr do dzielnika napięcia wyznacza się przebieg linii 
jednakowego napięcia, odpowiadających liniom jedna¬ 
kowej energii wody. Linie przepływu wody (linie 
prądu) są prostopadłe do linii jednakowej energii, 
a szybkość filtracji — odwrotnie proporcjonalna do 
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odległości między dwoma kolejnymi liniami energii. 
Można więc określić 2arówno przepływ, jak i ciśnie¬ 
nie w całym obszarze. Metoda AEHD została bardzo 
rozwinięta. Przy użyciu tzw. modeli odwrotnych moż¬ 
na wyznaczać w doświadczeniach przebieg linii prą¬ 
du; dołączając do modelu głównego dodatkowe opor¬ 
niki, można rozwiązywać zadania bardziej złożone, 
a nawet — na modelach płaskich — można badać 
pewne przepływy trójwymiarowe. 


modelowanie 

filtracji 



grunt przepuszczalny 


a) 




Rys. 7. Filtracja wody pod budowlą: a) przekrój przez jaz pię¬ 
trzący wodę, przepływ w warunkach rzeczywistych, b) model 
typu AEHD przepuszczalnej warstwy, na której zbudowany 
jest jaz, c) model warstwy przepuszczalnej zbudowany z oporni¬ 
ków w analizatorze pola 


analizator 

pola 


ruch w 
strefie nie¬ 
nasyconej 


Analizator pola jest urządzeniem umożliwiającym 
rozwiązywanie pewnego rodzaju równań różniczko¬ 
wych, między innymi równania przepływu wód pod¬ 
ziemnych. Warstwę wodonośną gruntu dzieli się na 
prostokątne pola, w środku których umieszcza się 
węzły. Przewodność gruntu między dwoma sąsiednimi 
polami zastępują na modelu odpowiednio dobrane 
oporniki, wstawione między węzły (rys. 7c). Warstwę 
wodonośną zastępuje siatka oporników, do której 
na brzegach przykłada się napięcie. Badania na anali¬ 
zatorze pola są szybsze i wygodniejsze niż na modelach 
AEHD, ale wymagają dalej idącej schematyzacji wa¬ 
runków przepływu. 

Wiele ostatnio prowadzonych badań dotyczy ruchu 
wody w strefie niepełnego nasycenia. Siły powodujące 
ruch w tej strefie to ciężar wody, napięcie kapilarne, 
ewentualnie ciśnienie osmotyczne przy zmiennym 
zasoleniu wody w różnych miejscach warstwy. Jeżeli 
wyrazimy te siły przez wysokość energii h Py a ilość 
płynącej wody — przez umowną średnią prędkość 
filtracji v, to i w strefie nienasyconej słuszny będzie 


Współczynnik ko jest jednak zależny nie tylko od 
jakości gruntu, ale i od ilości wody zawartej w jed¬ 
nostce objętości gruntu 0. Również potencjał h za¬ 
leży od 0. Badania przepływów w strefie nienasyconej 
wymaga więc ciągłych badań wilgotności gruntu. 
Najwygodniejszą metodą okazał się pomiar pochłania¬ 
nia promieni gamma emitowanych przez izotop pro¬ 
mieniotwórczy. Pozwala to na badanie próbek bez ich 
suszenia i naruszania struktury, a więc podczas do¬ 
świadczeń. Ruch wody w strefie nie nasyconej ma 
duże znaczenie, woda bowiem wznosząca się w górę 
zasila korzenie roślin, zwilża grunt i zwiększa paro¬ 
wanie. Po deszczu natomiast woda wsiąkająca 
w grunt (infiltrująca) musi przebyć tę strefę, zanim 
osiągnie warstwę wodonośną. 


Termika wód 

Woda znajdująca się w zbiorniku lub między dwoma 
przekrojami cieku posiada w danej chwili ilość cie¬ 
pła Q. Wskutek dopływu ciepła do zbiornika i odpły¬ 
wu ciepła do otoczenia ilość ta zmienia się o AQ y co 
powoduje zmiany temperatury wody. Ilości ciepła 
biorące udział w wymianie w pewnym czasie / ujmuje 
równanie bilansu cieplnego: 

R J rQe-\-Qa J rQv ~ JQ. bilans 

R oznacza ilość ciepła przenoszoną przez promienio- C * ei kf V 
wanie (krótkie i długofalowe), Q e — ciepło zużywane 
w związku z procesem parowania, Q a — ciepło wy¬ 
mieniane z atmosferą przez konwekcję, (2v — ilość 
ciepła transportowaną z wodą wpływającą i wypły¬ 
wającą z badanego obszaru. W okresie letnim woda 
ochładza się głównie przez parowanie, w okresie zi¬ 
mowym większą rolę odgrywa czynnik Q a . 

W wodach płynących i w płytkich jeziorach woda 
ulega często wymieszaniu i znajduje się pod wpływem 
dobowych zmian temperatury. Natomiast w głębo- rozkład 
kich jeziorach wytwarza się pewien typowy rozkład temperatury 
temperatur, zasadniczo różny w okresie letnim i zimo- w jeziorze 
wym (rys. 8). W Iecie temperatura wody w pobliżu dna 
wynosi ok. 10°C (tzn. nieco więcej niż średnia tempe¬ 
ratura w Polsce); powyżej zalega warstwa wody cie¬ 
plejszej, podlegającej wpływom atmosfery. W zimie 




a) b) 

Rys. 8. Wykresy rozkładu temperatury w głębokich jeziorach: 
a) w lecie, b) w zimie 


na powierzchni wody tworzy się powloką lodowa, 
pod nią temperatura wody wynosi 0°C, niżej woda jest 
coraz cieplejsza — aż do 4°C w pobliżu dna. To cieka¬ 
we zjawisko odwrócenia rozkładu temperatur wystę¬ 
puje dzięki anomalii, jaką posiada gęstość wody. Dwa 
razy do roku — na wiosnę i na jesieni — występuje 
przemieszczenie wód w jeziorze i wówczas temperatura 
w całej masie wody jest wyrównana. 

Poważnym problemem technicznym i naukowym zrzucenie 
jest wymiana ciepła w zbiornikach i rzekach, do któ- podgrzanej 
rych zrzuca się podgrzaną wodę z elektrowni lub in- wody 
nych zakładów przemysłowych. Z punktu widzenia 
sprawności chłodzenia aparatury i kosztów inwestycyj¬ 
nych jest to rozwiązanie najwygodniejsze, wymaga 
jednak spełnienia dwóch warunków: woda w rzece 
czy jeziorze nie może być podgrzana powyżej pewnej 
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granicy, przekroczenie której stanów zagrożenie dla 
życia biologicznego (w Polsce ok. 26°C); w zbiorni¬ 
kach pobór i zrzut muszą być tak usytuowane wzglę¬ 
dem siebie, aby do ujęcia dopływała woda odpo¬ 
wiednio ochłodzona. 

Na ogół w rzekach następuje szybkie wymieszanie 
wody na całej głębokości, natomiast jest wyraźne 
zróżnicowanie temperatur w poprzek cieku. Całymi 
kilometrami woda przy jednym brzegu może być wy¬ 
raźnie cieplejsza niż przy drugim (np. na odcinku ok. 
40 km poniżej elektrowni w Kozienicach utrzymuje się 
różnica temperatur ok. 2°C pomiędzy wodą płynącą 
przy brzegu lewym i prawym). Podobnie wygląda 
sytuacja w płytkich jeziorach. W rzekach głębokich 
zjawisko przebiega inaczej, np. poniżej elektrowni 
,,Dolna Odra” przy głębokości rzeki 10 m ciepła woda 
miesza się tylko w górnej 4-metrowej warstwie. Bar¬ 
dziej złożony układ powstaje w głębokich jeziorach. 
Woda ciepła tworzy strumień powoli rozlewający się 
po powierzchni i zmierzający do miejsca poboru wody 
(rys. 9). Strumień ten porywa ze sobą pewne ilości 
wody zimnej i miesza się z nią. Ochłodzenie następuje 
częściowo przez wymieszanie, a głównie przez paro¬ 
wanie i oddawanie ciepła do atmosfery. Na większej 



Rys. 9. Mieszanie się ciepłego strumienia z chłodnymi wodami 
głębokiego zbiornika 


głębokości, pod strumieniem ciepłym, tworzy się po¬ 
wrotny prąd wody zimnej, który uzupełnia wodę po¬ 
rywaną przez prąd ciepły. Zachodzące zjawiska są 
bardzo złożone i trudne do odtworzenia w warunkach 
laboratoryjnych, w skali zmniejszonej. W tym wy¬ 
padku odtworzyć należy procesy dynamiki i termiki, 
które się rządzą różnymi prawami i wymagają spełnie¬ 
nia zupełnie różnych zależności przy odtwarzaniu wa¬ 
runków zewnętrznych powodujących przepływ i ochła¬ 
dzanie. 

E. CzetwertyKjski, B. Utrysko Hydraulika i hydromechanika , 
Warszawa 1969; J. Gruat i in. Teoria i praktyka badań hydraulicz¬ 
nych, Wrocław 1970; Z. Mikulski Zarys hydrografii Polski, War¬ 
szawa 1965. 


Geofizyka poszukiwawcza 

Zbigniew Fajkfewicz 


Geofizyka poszukiwawcza (zwana też stosowaną lub 
geologiczną) jest nauką wyodrębnioną z geofizyki 
ogólnej. Przedmiotem jej są własności fizyczne i bu¬ 
dowa ośrodka geologicznego przypowierzchniowej 
części skorupy ziemskiej oraz zależności między włas¬ 
nościami fizycznymi ośrodka skalnego a występowa¬ 
niem w nim struktur geologicznych i złóż kopalin 
użytecznych. Metodami geofizycznymi wykryto i zba¬ 
dano wiele złóż o znaczeniu światowym. Metody geo¬ 
fizyki poszukiwawczej są obecnie najważniejszymi me- 
zadania todami poszukiwawczymi, oddają one nieocenione 
geofizyki usługi w wykrywaniu złóż ropy i gazu, rud, soli, siarki 
poszukiwa- i innych kopalin użytecznych. 

wczej Do geofizyki poszukiwawczej należy także badanie 
zmian parametrów fizycznych złóż oraz otaczających 
je skał, będących wynikiem prowadzonych w nich 
prac górniczych, jak również poznawanie własności 
fizykotechnicznych podłoża przeznaczonego pod bu¬ 
dowę dużych budowli, a następnie wpływ takich bu¬ 
dowli na własności ośrodka skalnego, Poszukiwanie 
i badanie wód podziemnych to jeszcze jedna dziedzina 
wchodząca w zakres tej nauki. Metody badawcze geo¬ 
fizyki poszukiwawczej stosowane są nie tylko w ge¬ 
ologii i górnictwie, lecz również w budownictwie wod¬ 
nym i lądowym, a nawet w archeologii. 

Ze względu na zakres zastosowań rozróżnia się ze¬ 
społy metod, które tworzą geofizykę: strukturalną, 
złożową, górniczą, inżynierską i techniczną. Specy¬ 
fika pomiarów pozwala wyodrębnić geofizykę po¬ 
wierzchniową i wiertniczą, a także podziemną, lotni¬ 
czą (aerogeofizykę) oraz morską. Natomiast przyjmu¬ 
jąc za kryterium podziału badane wielkości fizyczne 
rozróżnia się następujące metody: grawimetrię po¬ 
szukiwawczą, magnetometrię poszukiwawczą, geo- 
elektrykę poszukiwawczą, sejsmikę poszukiwawczą 
oraz radiometrię poszukiwawczą. 

W zależności od postawionego do rozwiązania za¬ 
dania dobiera się taki zestaw różnych uzupełniających 
się wzajemnie metod, który pozwala osiągnąć cel 
szybciej i przy mniejszych nakładach - wykonuje się 
w ten sposób kompleksowe badania geofizyczne. 
Kompleksowa interpretacja pomiarów geofizycznych 
polega na korelacji wszystkich otrzymanych wyników 
w celu uzyskania rozwiązania optymalnego, ograni¬ 
czającego wieloznaczność rozwiązań metod geo¬ 
fizycznych. 


Grawimetria poszukiwawcza 

Niejednorodny rozkład mas w ośrodku geologicznym 
wpływa na wartość natężenia pola siły ciężkości na 
powierzchni Ziemi. W geofizyce natężenie pola siły 
ciężkości (stosunek siły do masy, na którą działa) 
nazywa się krótko polem siły ciężkości. Struktury 
geologiczne i antropogeniczne (będące wynikiem 
działalności człowieka) oraz złoża kopalin użytecz¬ 
nych nazywa się ciałami zaburzającymi lub anomal¬ 
nymi. Rozkład pola siły przyciągania grawitacyjnego 
ciał zaburzających jest funkcją różnicy między ich 
gęstością i gęstością skał otaczających, a także zależy 
od ich wielkości, kształtu i głębokości występowania. 

Pola tych ciał wpływają na rozkład wartości ziemskie¬ 
go pola siły ciężkości. Wykrywanie tych ciał oraz 
określenie wyżej podanych parametrów należy do gra¬ 
wimetrii poszukiwawczej. Podstawę metody stanowią 
pomiary grawimetryczne, tj. pomiary względne (war- pomiary 
tości) siły ciężkości (wyznaczenie wartości różnicy grawsmetry- 
siły ciężkości między punktami pomiarowymi) wyko- czne 
nywane w punktach położonych na powierzchni tere¬ 
nu lub na innym poziomie pomiarowym. 

Do pomiarów względnych siły ciężkości służą gra¬ 
wimetry (ii. 209, tabl. 56). Zasadniczym elementem 
systemu pomiarowego grawimetru jest ramię ze sku¬ 
pioną na końcu masą. W czasie pomiaru siłę ciężkości grawimetry 
działającą na masę równoważy najczęściej siła spręży¬ 
stości powstała wskutek wydłużenia, skręcenia lub 
ugięcia sprężyny lub układu sprężyn utrzymujących 
ramię. Deformacja sprężyny jest miarą zmiany siły 
ciężkości. 

Dokładność nowoczesnych grawimetrów jest bar¬ 
dzo duża — dochodzi do jednej stumilionowej części 
wartości siły ciężkości na powierzchni Ziemi. Oznacza 
to, że dokładność pomiaru dochodzi do 0,01 mGal 
(jednostką natężenia siły ciężkości stosowaną w gra¬ 
wimetrii jest gal, 1 Gal = 10~ 2 N/kg). 

Punkty pomiarowe na powierzchni terenu są z re¬ 
guły lokalizowane na różnych względem siebie wy¬ 
sokościach i położone są na kompleksie skalnym o nie¬ 
jednakowej grubości, często bardzo zróżnicowanym, 
odmienna jest również rzeźba terenu otaczającego te 
punkty. Z tych względów zmierzone wartości nie są ze 
sobą porównywalne i nie mogą stanowić podstawy do 
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wyciągnięcia wniosków na temat budowy geologicz- 
redukcja nej. Należy zatem wyeliminować wpływ wspomnia- 
pomiarów nych czynników na zmierzone wartości i sprowadzić 
je, czyli zredukować, do jednego poziomu odniesienia. 
Zazwyczaj poziomem takim jest poziom morza (po¬ 
wierzchnia geoidy). 

Wyniki pomiarów grawimetrycznych wykonywa¬ 
nych dla celów poszukiwawczych sprowadza się do 
poziomu odniesienia, stosując redukcję Bouguera, 
która uwzględnia wpływ wysokości punktu pomiaro¬ 
wego nad przyjęty poziom odniesienia oraz wpływ 
grawitacyjny mas występujących nad tym poziomem. 
Redukcja ta zazwyczaj jest uzupełniona poprawką to¬ 
pograficzną do siły ciężkości, która eliminuje składo¬ 
wą pionową siły przyciągania pochodzącą od nierów¬ 
ności terenowych. 

Wnioski dotyczące budowy geologicznej badanego 
obszaru wyciąga się na podstawie wartości anomalii 
siły ciężkości, czyli różnicy między zredukowaną 
anomalie siły wartością siły ciężkości w danym punkcie i odpowia- 
ciężkości dającą jej wartością normalną w tym samym punkcie. 

Jako wartości normalne przyjęto wartości obliczone 
dla wyidealizowanej Ziemi w kształcie elipsoidy z jed¬ 
norodnym rozkładem masy. Anomalie siły ciężkości 
wskazują na stopień niejednorodności rzeczywistego 
rozkładu mas w ośrodku skalnym. Ponieważ sposób 
redukcji pomiarów może być różny, mówi się więc 
np. o anomalii siły ciężkości w redukcji Bouguera. 
Stosuje się również podział anomalii ze względu na 
obszar, w którym występują; można wyodrębnić ano¬ 
malie lokalne i regionalne siły ciężkości. Zmierzony 
rozkład jest zwykle superpozycją obu wymienionych 
typów anomalii. Pierwsze z nich związane są z lokal¬ 
nymi, a drugie — z regionalnymi ciałami zaburzają¬ 
cymi a więc np. strukturami geologicznymi, złożami 
kopalin użytecznych itp. 



wysad solny 
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Rys. 1. Rozkład anomalii siły ciężkości nad wysadcm 
solnym 
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W celu graficznego przedstawienia rozkładu ano¬ 
malii siły ciężkości wykreśla się na mapie izolinie, tj. 
linie łączące punkty o tej samej wartości anomalii. 

Mapy grawimetryczne są syntezą materiału pomiaro- mapy 
wego i stanowią podstawę wnioskowania geologicz- grawS- 
nego. Dla przykładu na rys. 1 został przedstawiony metryczne 
rozkład anomalii siłyciężkości nad jednym z wykrytych 
w Polsce wysadów solnych. Pasmo ujemnych anomalii 
siły ciężkości występujące w centrum zdjęcia grawi¬ 
metrycznego (rys. 2) jest odbiciem jednego z wykry¬ 
tych w naszym kraju złóż węgli brunatnych wypełnia¬ 
jącego rów erozyjny w utworach mezozoiku. 




złoże węgli brunatnych 
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Rys. 2. Rozkład anomalii siły ciężkości nad złożem węgli brunat¬ 
nych (wg Przedsiębiorstwa Badań Geofizycznych w Warszawie) 



Podziemne pomiary grawimetryczne pozwalają 
poznać szczegóły budowy geologicznej eksploatowa¬ 
nego górotworu. Na rys. 3 jest przedstawiony rozkład 
anomalii siły ciężkości zmierzony w chodniku górni¬ 
czym. Na jego podstawie wykryto uskoki przecinające 
pokład węgla kamiennego w jednej z kopalń na Gór¬ 
nym Śląsku. 

W zakres grawimetrii wchodzi również rozwijana 
w ostatnich latach metoda gradientu pionowego siły 






























metoda ciężkości, polegająca na pomiarze za pomocą grawi- 
gradientu metru i specjalnie do tego celu skonstruowanej wieży 
pionowego pomiarowej (ii. 208, tabl. 56), różnicy siły ciężkości 
między dwoma punktami leżącymi na pewnej znanej 
odległości pionowej nad sobą. Służy ona do wykrywa¬ 
nia małych form tektonicznych, erozyjnych i antropo¬ 
genicznych, jak np. stare wyrobiska górnicze. Na il. 
208 (tabl. 56) pokazano rozkład anomalii gradientu 
pionowego siły ciężkości nad takim wyrobiskiem wy¬ 
krytym na terenie jednego z miast w Polsce. 


Magnetometria poszukiwawcza 


Przy poszukiwaniu i eksploatacji niektórych złóż ko¬ 
palin użytecznych cennych informacji dostarcza ba¬ 
danie pól magnetycznych indukowanych w skałach 
przez stałe pole magnetyczne Ziemi. Obserwowane w 
przestrzeni otaczającej Ziemię pole magnetyczne jest 
sumą jej stałego pola naturalnego, które nazywa się 
normalnym, pól zmiennych oraz pól indukowanych 
anomalie w skałach (-*- Magnetyzm ziemski). Różnicę między 
magnetyczne polem mierzonym, z którego zostały wyeliminowane 
zmiany dobowe, a normalnym w danym punkcie 
nazywa się anomalią magnetyczną. Rozróżnia się ano¬ 
malie natężenia całkowitego oraz anomalie elementów 
i składowych pola magnetycznego Ziemi. Ze względu 
na obszar występowania, w magnetometrii poszuki¬ 
wawczej wyróżnia się anomalie regionalne i lokalne. 

Na podstawie map anomalii magnetycznych, wy¬ 
kreślanych analogicznie do map grawimetrycznych, 
można scharakteryzować ciała namagnesowane, po¬ 
dając ich głębokość występowania, rozmiary i kształt. 
Skonstruowanie precyzyjnych przyrządów mierzących 
pole magnetyczne z dokładnością do 1 y (gamma jest 
stosowaną w geofizyce jednostką indukcji magnetycz¬ 
nej, 1 y = 10" 9 T), znacznie poszerzyło zakres zasto¬ 
sowań metody magnetycznej, która nie tylko stała się 
nieodzowna przy poszukiwaniu złóż żelaza czy innych 
ferromagnetyków, ale z powodzeniem można ją rów¬ 
nież stosować w poszukiwaniu złóż metali i surowców 
skalnych o słabych własnościach magnetycznych. Me¬ 
tody magnetyczne stosuje się obecnie również przy 
badaniu zagadnień tektonicznych, np. do wyznaczania 
kontaktów skał osadowych i magmowych. 

Rozwój techniki aparaturowej umożliwił wykony¬ 
wanie pomiarów aeromagnetycznych i hydromagne- 
tycznych, w których odpowiednia aparatura pomia¬ 
rowa jest umieszczona w samolocie lub na statku. 

Powszechnie stosowanymi przyrządami do wykony¬ 
wania pomiarów magnetycznych są wagi magnetyczne 
służące do względnych pomiarów składowych: pio¬ 
nowej Z i poziomej H pola magnetycznego Ziemi oraz 
magnetometr magnetometr protonowy. Magnetometr protonowy 
protonowy jest najnowocześniejszym przyrządem używanym do 
pomiarów bezwzględnych wartości całkowitego na¬ 
tężenia pola magnetycznego Ziemi T, a także jego 
poziomej i pionowej składowej. Zasadniczą częścią 
przyrządu jest sonda — puszka z wodą destylowaną 
umieszczona wewnątrz solenoidu tak ustawionego, że 
stały prąd elektryczny płynący przez solenoid wy¬ 
twarza pole magnetyczne o kierunku w przybliżeniu 
prostopadłym do kierunku pola magnetycznego 
Ziemi. Pole solenoidu polaryzuje swobodne protony 
występujące w wodzie (protony orientują się w ten 
sposób, że osie ich momentów magnetycznych są rów¬ 
noległe do linii tego pola). Po wyłączeniu pola pola¬ 
ryzującego protony poddane działaniu ziemskiego 
pola magnetycznego zaczynają wykonywać ruch pre- 
cesyjny wokół jego kierunku. Częstość precesji jest 
proporcjonalna do natężenia pola magnetycznego 
Ziemi. Mierząc częstość zmian siły elektromagnetycz¬ 
nej powstałej w uzwojeniu solenoidu można wyzna¬ 
czyć wartość tego natężenia. Ilustracja 210 (tabl. 56) 
przedstawia magnetometr protonowy do pomiarów 
naziemnych polskiej konstrukcji. 
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Rys. 4. Rozkład anomalii składowej pionowej pola magnetycz¬ 
nego Ziemi nad złożem kwarcytów żelazistych — Kurska ano¬ 
malia magnetyczna (opracował K. P. Sokolow) 


anomalie natężenia całkowitego 
pola magnetycznego Ziemi 



bazalt zwietrzały 


Rys. 5. a) Rozkład anomalii natężenia całkowitego pola magne¬ 
tycznego Ziemi nad złożem bazaltu, b) złoże bazaltu (opracował 
St. Małoszewski) 

Zmierzone anomalie magnetyczne mogą wskazy¬ 
wać na miejsce występowania złóż rud żelaza (magne¬ 
tytu, tytanomagnetytu, kwarcytów żelazistych, itp.), 
miedzi, ołowiu, glinu, manganu i innych metali, w 
których to rudach mogą występować w postaci do¬ 
mieszek minerały ferromagnetyczne. Przykładowo 
na rys. 4 jest pokazany przekrój geologiczny jednego 
ze złóż kwarcytów żelazistych wykrytych w Związku 
Radzieckim w wyniku wykonanych pomiarów ano¬ 
malii składowej pionowej pola magnetycznego Ziemi. 

Metodę magnetyczną można również z dużym po¬ 
wodzeniem stosować do wykrywania złóż surowców 
skalnych. Zapis anomalii natężenia całkowitego pola 
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magnetycznego w pewnym obszarze na Dolnym Śląs¬ 
ku oraz zarys wykrytego złoża bazaltu, ukazuje rys. 5. 
Interpretacja anomalii doprowadziła nie tylko do 
zlokalizowania złoża, ale również do wyróżnienia 
w nim stref występowania surowca o pożądanych 
własnościach technicznych oraz bazaltu zwietrzałego. 


Geoelektryka poszukiwawcza 


Do geoelektryki poszukiwawczej należy badanie na¬ 
turalnych i sztucznie wzbudzonych pól elektrycznych 
i elektromagnetycznych w ośrodku geologicznym. 
Istnieją różne metody elektryczne (rys. 6), któ¬ 
rych efektywność w poszukiwaniu złóż kopalin uży¬ 
tecznych i badaniu budowy geologicznej ośrodka 
skalnego zależy od zróżnicowania skał pod względem 
oporu właściwego, przenikalności elektrycznej i mag¬ 
netycznej oraz zdolności do polaryzowania się pod 


Serie pomiarów, w których rozstaw elektrod prą¬ 
dowych zmienia się tak, że znajdują się stale na jednej 
linii, a punkt leżący pośrodku między nimi (tzw. 
środek sondowania) pozostaje nieruchomy, stanowią pionowe 
pionowe sondowanie elektrooporowe. Ten system sondowanie 
pomiarowy pozwala, stosując zmianę głębokości pe- elektro- 
netracji (przez zmianę rozstawu elektrod), wyodrę- oporowe 
bnić warstwy skalne różniące się oporem elektrycznym. 

Stosując sondowanie elektrooporowe, np. w po¬ 
szukiwaniu wód podziemnych, można wyodrębnić 
w badanym ośrodku skalnym skały wodonośne, 
określić warunki ich występowania oraz formę geo¬ 
metryczną złoża, co pozwala ocenić jego zasoby. 

Pozorny opór właściwy strefy występowania wód 
podziemnych zawiera się w przedziale 100-300 firn, 
a wapieni kredowych podścielających skały wodo¬ 
nośne— w przedziale 500-1500 Om. Przykład zasto¬ 
sowania metody sondowania elektrooporowego 
przedstawia rys. 7. Należy tutaj nadmienić, że ok. 

90% wszystkich kosztów poszukiwania wód na ca¬ 
łym świecie przypada właśnie na tę metodę. 



wpływem przepływającego przez nie prądu. Większość 
tych metod można stosować nie tylko w badaniach 
naziemnych, ale również lotniczych i podziemnych. 


Metodą elektrooporowa 

W praktyce poszukiwawczej najszersze zastosowanie 
znalazła metoda elektrooporowa. Polega ona na 
wyznaczaniu elektrycznego oporu właściwego kom¬ 
pleksów skalnych; stosuje się ją do poszukiwania 
surowców skalnych, wód podziemnych i badania 
podłoża skalnego będącego przedmiotem zaintereso¬ 
wania budownictwa lądowego i wodnego. 

Warstwy skalne są zwykle niejednorodne pod wzglę¬ 
dem własności elektrycznych, toteż w rzeczywistości 
opór wyznacza się tzw. opór pozorny, czyli opór właściwy 
pozorny warstwy traktowanej jako jednorodna, zależny przy 
tym od geometrii układu pomiarowego. Opór pozorny 
warstwy skalnej wyznacza się przepuszczając stały 
prąd elektryczny o znanym natężeniu między dwiema 
elektrodami prądowymi wbitymi w grunt i mierząc, za 
pomocą dwu elektrod pomiarowych i miernika geo¬ 
elektrycznego. wartość różnicy potencjału wywołanej 
przepływem prądu przez warstwę skalną. 
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Rys. 7. Wyniki zastosowania metody elektrooporowej do poszu¬ 
kiwań wód podziemnych w skrasowiałych wapieniach jurajskich 
w jednym z rejonów w Polsce: a) krzywe pionowych sondowań 
elektrooporowych, b) przekrój geologiczny opracowany na pod¬ 
stawie wykonanych sondowań (opracował A. Iciek) 



- od 300 do 2000 Q m \ 

• — wiercenia stwierdzające występowanie zło^a^ 

O — wiercenia nie stwierdzające występowania złoża \ 
- uskok 

Rys. 8. Rozkład izoom nad wykrytym złożem marmuru wyzna¬ 
czony metodą elektrooporową (opracował St. Małoszewski) 
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Pomiary, w których odległość wzajemna elektrod 
prądowych pozostaje stała, zmienia się zaś ich po¬ 
łożenie, stanowią profilowanie elektrooporowe. Sys¬ 
tem ten (przy ustalonym zasięgu głębokości) umożli¬ 
wia dokładniejsze poznanie budowy geologicznej 
ośrodka lub ustalenie położenia granic warstw geo¬ 
logicznych o różnych oporach elektrycznych. W ten 
sposób jest możliwe wykrywanie złóż surowców skal¬ 
nych występujących płytko pod powierzchnią terenu. 
Wyniki poszukiwań i okonturowanie złoża marmu¬ 
rów metodą profilowania elektrooporowego są przed¬ 
stawione na rys. 8. Widać na nim że rozkład izoom 
jest ściśle związany z odkrytym złożem. 


Inne metody elektryczne 

Górne części złóż rud i kruszców znajdują się — w wy¬ 
niku działania wód podziemnych bogatych w tlen — 
w warunkach utleniających, a części dolne — w warun¬ 
kach redukcyjnych. Powoduje to przeciwstawne na- 
elektryzowanie stropu i spągu, tak że złoże staje się 
naturalnym źródłem prądu elektrycznego. Podobny 
efekt polaryzacji powoduje ruch roztworów wodnych 
w skałach. Z tego względu metoda potencjałów wła¬ 
snych — posługująca się pomiarami potencjałów wła¬ 
snych — służy głównie do poszukiwania przypowierz¬ 
chniowych złóż rud oraz do wyznaczania kierunku 
i szybkości spływu wód podziemnych i miejsc filtracji 
wody. Pomiary potencjału własnego na powierzchni 
terenu wykonuje się za pomocą układu składającego 
się z miernika potencjału i dwu elektrod pomiaro¬ 
wych, z których jedna jest nieruchoma, a druga prze¬ 
mieszczana w terenie. 

Zjawisko chwilowej polaryzacji skał i złóż, wywo¬ 
łanej przepływem impulsu elektrycznego wykorzy¬ 
stuje metoda polaryzacji wzbudzonej. Pozwala ona na 
bezpośrednie poszukiwania złóż będących dobrymi 
przewodnikami elektrycznymi, a więc siarczków żela¬ 
za, miedzi, niklu, ołowiu, srebra, itp. 

Zależność kształtu izopowierzchni potencjału elek¬ 
trycznego od kształtu naelektryzowanego sztucznie 
złoża kopalin użytecznych będących dobrym prze¬ 
wodnikiem elektrycznym, a występujących pośród 
skał o dużym oporze właściwym, wykorzystuje me¬ 
toda ciała naładowanego. Metoda ta służy głównie 
do badania form występowania wykrytych złóż i wy¬ 
znaczania kierunku i prędkości przepływu wód pod¬ 
ziemnych w otworze wiertniczym. 

Fale elektromagnetyczne, których źródłem jest 
jonosfera, rozprzestrzeniają się w ośrodku geologicz¬ 
nym w sposób zależny od oporu właściwego skał 
i częstości drgań. Zależność tę wykorzystuje metoda 
magnetotelluryczna. Wielkościami podlegającymi 
bezpośredniemu pomiarowi są składowe natężenia 
pola elektrycznego i magnetycznego oraz kąt prze¬ 
sunięcia fazowego między tymi składowymi. Za 
wariant tej metody można uznać metodę telluryczną, 
w której pomiar ogranicza się tylko do składowej 
elektrycznej. Obie metody stosuje się do wykrywania 
struktur roponośnych oraz badania wgłębnej tekto¬ 
niki i morfologii podłoża krystalicznego. 

Fala elektromagnetyczna może być również sztucz¬ 
nie wzbudzona w ośrodku geologicznym, co wyko¬ 
rzystuje się między innymi w metodzie sondowań 
elektromagnetycznych. 

Wspomnimy jeszcze o stosowanej do rozwiązywa¬ 
nia problemów geologii strukturalnej metodzie sta¬ 
bilizacji pola, w której wykorzystuje się zależność 
rozprzestrzeniania się impulsu prądowego od oporu 
elektrycznego warstw skalnych. 

Do bezpośrednich poszukiwań złóż kopalin uży¬ 
tecznych będących dobrymi przewodnikami elek¬ 
trycznymi jest jeszcze stosowana metoda indukcyjna, 
polegająca na badaniu sztucznie wzbudzonego indu¬ 
kowanego pola elektromagnetycznego, oraz metoda 
radiofalowa, polegająca na badaniu pochłaniania lub 
odbicia fal radiowych o częstości powyżej 10 5 Hz. 


Sejsmika poszukiwawcza 

O budowie geologicznej i własnościach sprężystych 
ośrodka skalnego można wnioskować na podstawie 
rozchodzenia się w nim fal sprężystych (sejsmicz¬ 
nych). Do sejsmiki poszukiwawczej należy badanie 
rozchodzenia się sztucznie wzbudzonych fal sejsmicz¬ 
nych. Źródłem fal jest detonacja materiału wybucho¬ 
wego umieszczonego w specjalnie przygotowanym 
płytkim otworze lub w otworze wiertniczym. Niekiedy 
do przekazywania drgań cząsteczkom gruntu czy 
skał stosuje się także wibratory elektromagnetyczne 
lub hydrauliczne, udary mechaniczne lub eksplozje 
sprężonych gazów. 

Na każdej granicy sejsmicznej rozdzielającej dwie 
warstwy o różnym oporze akustycznym właściwym 
(zw. w geofizyce twardością akustyczną; jest to 
iloczyn gęstości ośrodka i prędkości rozchodzenia się 
w nim fali sprężystej) powstaje fala odbita, czyli 
refleksyjna. Jeżeli prędkość fal w warstwie nad gra¬ 
nicą jest mniejsza niż w warstwie pod granicą, w tej 
pierwszej może powstać fala refrakcyjna. Pojawiają 
się one wówczas, gdy fala sejsmiczna pada na granicę 
dwóch ośrodków pod kątem krytycznym i fala zała¬ 
mana pod kątem 90° biegnie wzdłuż granicy dwóch 
ośrodków. Inicjuje ona falę sejsmiczną refrakcyjną 
biegnącą od granicy ku powierzchni terenu. 

Fale sejsmiczne są odbierane na powierzchni terenu 
przez specjalne odbiorniki drgań zwane geofonami 
i rejestrowane wraz z ich czasem przyjścia w postaci 
sejsmogramu czyli obrazu falowego. Rejestrację 
można wykonać w postaci analogowej na papierze 
światłoczułym lub na taśmie magnetycznej, stosuje 
się też zapis cyfrowy. W sejsmicznych badaniach po¬ 
szukiwawczych używa się też wielu geofonów poło¬ 
żonych na powierzchni terenu w różnych odległo¬ 
ściach od punktu wzbudzenia fal sejsmicznych, zwy¬ 
kle na jednej linii prostej zwanej profilem sejsmicz¬ 
nym. Analiza sejsmogramu pozwala wyznaczyć czas 
przyjścia fal sejsmicznych do geofonów oraz umożliwia 
porównanie amplitud zarejestrowanych drgań. Zależ¬ 
ność czasu przyjścia fali sejsmicznej od odległości 
między punktem wzbudzenia a geofonami jest zwana 
hodografem fali sejsmicznej. Czas przebiegu fal sejs¬ 
micznych zależy od geometrii układu pomiarowego, 
położenia i kształtu granic sejsmicznych w ośrodku 
skalnym oraz prędkości rozchodzenia się fal sejsmicz¬ 
nych w poszczególnych warstwach skalnych. 

W badaniach sejsmicznych rozróżnia się dwie pod¬ 
stawowe metody: refrakcyjną i refleksyjną. 

Metoda refrakcyjna polega na rejestrowaniu fal 
refrakcyjnych oraz czasu ich dojścia do geofonów. 
Rejestruje się albo tylko pierwsze impulsy, albo reje¬ 
struje się, a następnie koreluje impulsy dalsze (kore¬ 
lacyjna metoda refrakcyjna). Wyniki pomiarów przed¬ 
stawia się w postaci hodografów fal refrakcyjnych, 
na podstawie których, używając specjalnie opracowa¬ 
nych metod obliczeń, wyznacza się w profilu głębo¬ 
kościowym bieg granic sejsmicznych refrakcyjnych. 
Metoda ta jest najczęściej stosowana do wyznaczania 
granic warstw geologicznych znacznie różniących się 
prędkością rozchodzenia się w nich fal sejsmicznych, 
stąd służy do wyznaczania głębokości i kształtu stropu 
podłoża krystalicznego. 

Metoda refleksyjna polega na rejestracji fal odbi¬ 
tych od granic sejsmicznych oraz ich czasu dojścia 
do geofonów. Analiza zarejestrowanych sejsmogra- 
mów pozwala na odtworzenie rzeczywistego położe¬ 
nia i kształtu granic sejsmicznych refleksyjnych. 
W tym celu dokonuje się licznych operacji, które 
przekształcają zarejestrowany sejsmogram w prze¬ 
krój czasowy. Odzwierciedla on rzeczywiste poło¬ 
żenie tych granic w układzie współrzędnych karte- 
zjańskich: długość profilu, wzdłuż którego umieszczo¬ 
ne są geofony i czas przyjścia fal do geofonów, mie¬ 
rzony wzdłuż drogi prostopadłej do granicy odbija¬ 
jącej. Gdy tę ostatnią współrzędną zastąpić głęboko- 
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ścią położenia granic refleksyjnych, otrzymuje się 
przekrój głębokościowy. Wykreślenie tych przekrojów 
wymaga znajomości prędkości średniej fal sejsmicz¬ 
nych w badanym ośrodku skalnym czyli stosunku 
długości całkowitej drogi promienia fali sejsmicznej 
do czasu przebiegu fali wzdłuż tej drogi. 

Określenie położenia i kształtu sejsmicznych granic 
odbijających ma zasadnicze znaczenie przy wykrywa¬ 
niu struktur geologicznych. Stąd metoda refleksyjna 
jest najważniejszą metodą stosowaną do poszukiwań 
struktur gazo- i roponośnych. Charakteryzuje się ona 
dużym stopniem rozdzielczości, dzięki czemu można 
rozróżnić granice refleksyjne występujące blisko siebie. 

Na uwagę zasługuje też duży zasięg głębokościowy 
metody, wynosi on bowiem kilka do kilkunastu km. 
Najlepsze wyniki w wyznaczaniu granic osiąga się, 
gdy nachylenie warstw nie przekracza 10-20°. 

Na il. 207 (tabl. 56)jest przedstawiony przekrój 
czasowy odpowiadający jednemu z profilów sejsmicz¬ 
nych, w którym zostały wykonane badania refleksyjne 
w synklinorium łódzkim koło Uniejowa. Dostarcza 
on bardzo istotnych informacji o budowie geologicz¬ 
nej tego rejonu. Wykryte granice sejsmiczne wskazują 
na narastanie utworów cechsztynu w kierunku mezo- 
zoicznej struktury Uniejowa oraz na niezgodność za¬ 
legania granicy podsolnej cechsztynu w stosunku do 
kompleksu cechsztyńsko-mezozoicznego. 

W celu lepszego rozpoznania budowy geologicznej 
badania sejsmiczne prowadzi się w taki sposób, aby 
można było na ich podstawie wykonać mapy głębo- 
mapy kościowe granic sejsmicznych — tzw. mapy struktu- 
strukturalne ralne. Rysunek 9, to właśnie mapa strukturalna stro¬ 
pu podłoża miocenu w zachodniej części zapadliska 
rzeszowskiego). 



---- — izorytmy stropu podłoża miocenu 

■■i — uskoki i strefy dyslokacyjne 

t f — orograficzny brzeg Karpat 

- U. ;.i i — zasięg występowania ewaporytów w spągu miocenu 

• — wiercenia 

Rys. 9. Mapa strukturalna stropu podłoża miocenu w zachodniej 
części zapadliska rzeszowskiego (ewaporyty są to osady wytrą¬ 
cone z wody morskiej lub jeziornej, przy jej wyparowywaniu). 
Opracował A. Łapinkicwicz, M. Nowicki 
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Zasadniczym przełomem w rozwoju badań sejs- zastosowanie 
micznych było wprowadzenie zapisu cyfrowego do komputerów 
pomiarów polowych oraz do procesów przetwarzania 
wyników otrzymywanych z terenu. Umożliwił on 
zastosowanie komputerów do skomplikowanych 
i czasochłonnych obliczeń mających na celu uzyskanie 
jak największej ilości danych o budowie geologicznej 
ośrodka. Przekrój czasowy przedstawiony na il. 207 
(tabl. 56) opracowany został za pomocą komputera. ' 

Badania sejsmiczne mogą być prowadzone nie tylko 
na lądzie, lecz również na morzu, w celu poznania 
budowy geologicznej dna morskiego. Dobre rezultaty 
przynosi również zastosowanie metod sejsmicznych 
w górnictwie do badania warunków występowania 
złóż stałych kopalin użytecznych. 

Coraz powszechniejsze jest zastosowanie badań 
sejsmicznych w geologii inżynierskiej. Mała przenośna 
aparatura rejestrująca równocześnie przebieg refrak¬ 
cyjnych fal podłużnych i poprzecznych pozwala obli¬ 
czyć parametry sprężyste i wytrzymałościowe skał 
i gruntów, dostarczając tym samym niezbędnych in¬ 
formacji przy projektowaniu lokalizacji budowli 
i zapór wodnych. 


Radiometria poszukiwawcza 

Do radiometrii poszukiwawczej (zwanej też geofizyką 
jądrową lub jądrowymi metodami poszukiwawczymi) 
należy badanie własności promieniotwórczych skał 
oraz efektów działania promieniowania jądrowego na 
badany ośrodek. Na podstawie tych badań wyznacza 
się miejsca występowania złóż pierwiastków promie¬ 
niotwórczych, złóż metali oraz innych kopalin, takich 
jak beryl, bar, siarka, itp. Wyznacza się również 
strefy zaburzeń tektonicznych oraz zróżnicowanie skał. 
Radiometria służy także do wyznaczania gęstości 
i porowatości skał oraz stopnia ich nasycenia wodą 
lub ropą naftową. Metodą atomów znaczonych można 
wyznaczyć kierunki i prędkości przemieszczania się 
wód w ośrodku skalnym. 

Pomiary radiometryczne wykonuje się na powierz¬ 
chni terenu, w kopalniach, na dnie mórz, z pokładów 
samolotów oraz w otworach wiertniczych (geofizyka 
wiertnicza). W badaniach radiometrycznych stosuje 
się metody pasywne, aktywne i otwartych źródeł pro¬ 
mieniowania. 

Metody pasywne polegają na pomiarze promienio¬ 
twórczości naturalnej skał. Podczas badań tereno¬ 
wych mierzy się przede wszystkim natężenie promie- metody 
niowania y (metoda y) lub promieniowania a izo- pasywne 
topów radonu (lotnych) powstających z rozpadu radu, 
toru lub aktynu (metoda emanacyjna). 

Wyodrębnienie obszarów o podwyższonej promie¬ 
niotwórczości y jest szczególnie przydatne przy spo¬ 
rządzaniu map geologicznych. Pomiary na dużych ob¬ 
szarach zwykle wykonuje się z samolotu. Wariant 
tej metody przystosowany do pomiarów natężenia 
promieniowania y w otworach wiertniczych nosi na¬ 
zwę profilowania y. 

Pomiar promieniowania radonu wykonuje się zwy¬ 
kle na powierzchni terenu. Metody emanacyjne 
umożliwiają wykrywanie rud oraz zaburzeń tekto¬ 
nicznych na podstawie wielkości stężenia radonu 
w próbkach powietrza glebowego. 

Metody aktywne polegają na wprowadzeniu do 
ośrodka skalnego (otworu wiertniczego) zamkniętego 
źródła promieniowania y lub neutronów i na pomia- metody 
rze produktów reakcji tego promieniowania z ośrod- aktywne 
kiem skalnym (promieniowanie y, neutrony lub inne 
produkty). Odpowiednio do tego rozróżnia się pro¬ 
filowanie y-y (PGG), y-neutron (PGN), neutron- 
neutron (PNN), neutron-y (PNG) oraz metody 
aktywacyjne. Metody PGG stosuje się do wyznacza¬ 
nia gęstości skał oraz do wydzielania w profilu 
geologicznym otworu wiertniczego złóż węgli kamien¬ 
nych, brunatnych, złóż rud metali, itp. 




Metody PNN służą do określania porowatości prze¬ 
wiercanych skał oraz do poszukiwania złóż manganu, 
boru i innych pierwiastków silnie absorbujących neu¬ 
trony. Metody PNG są stosowane głównie w celu 
wykrywania zbiorników ropo-, gazo- i wodonośnych, 
określenia budowy przewiercanych skał oraz do wy¬ 
krywania złóż rud żelaza, niklu itp. 

Zastosowanie impulsowych źródeł neutronów pręd¬ 
kich wprowadzanych do otworów wiertniczych (tzw. 
odwiertowe generatory neutronów) i pomiar czaso¬ 
wych charakterystyk produktów reakcji tych neutro¬ 
nów ze skałami umożliwia wyznaczenie wielkości 
charakteryzujących ich zbiornikowe własności, a za¬ 
tem wykrywanie kontaktów woda-ropa, gaz ziemny- 
-ropa oraz wyznaczenia roponasycenia. Impulsowe 
źródła neutronów służą również do badania zmien¬ 
ności składu przewiercanych skał oraz do wykrywa¬ 
nia złóż uranu. 

metody Metody, w których stosuje się otwarte źródła pro- 
otwartego mieniowania polegają na pomiarze kierunku i szyb- 
źródta kości przemieszczenia się wód, w których zostały 
rozpuszczone związki pewnych izotopów promienio¬ 
twórczych. Służą one do ustalenia kierunku i pręd¬ 
kości przepływu wód gruntowych, wyznaczania 
współczynnika filtracji, określania wieku i pocho¬ 
dzenia wód, badania szczelności zapór wodnych itp. 


Geofizyka wiertnicza 


Geofizyka wiertnicza, inaczej — geofizyka otworowa, 
jest działem geofizyki poszukiwawczej obejmującym 
metody geofizyczne przystosowane do pomiarów w 
otworach wiertniczych, służące do badania własności 
fizycznych skał, a zwłaszcza ich własności zbiorni¬ 
kowych (porowatość, przepuszczalność, nasycenie 
itp.) jako kolektorów złożowych. Na podstawie 
kompleksu zastosowanych metod prowadzi się także 
badania zmienności składu i wieku przewiercanych 
skał, wykrywa się i bada złoża kopalin użytecznych. 
Do geofizyki wiertniczej zalicza się również metody 
fizyczno-chemiczne mające na celu lokalizowanie na 
podstawie profilu otworu wiertniczego złóż gazu 
i ropy naftowej a także metody badania stanu tech¬ 
nicznego otworów wiertniczych. 

profilowanie Pomiary zmian parametru fizycznego wzdłuż otwo¬ 
ru wiertniczego nazywa się profilowaniem (karota- 
żem). W odróżnieniu od instrumentów pomiarowych 
stosowanych w geofizyce powierzchniowej w tym 
przypadku aparatura składa się z dwóch oddzielnych 
elementów: urządzenia pomiarowo-nadawczego, czy¬ 
li sondy wprowadzanej do otworu wiertniczego, oraz 
z bloku kontrolno-rejestrującego pozostającego na 
powierzchni terenu. Oba te urządzenia są ze sobą 
połączone wielożyłowym przewodem elektrycznym 
przeznaczonym do zawieszenia sondy i przesyłania 
informacji między sondą a aparaturą kontrolno-re¬ 
jestrującą. Sposób wykonywania pomiarów • geofi¬ 
zycznych w otworze wiertniczym jest przedstawiony 
na rys. 10. 

Sonda jako element pomiarowo-nadawczy jest 
sondy wyposażona w detektor wykrywający zmiany natu¬ 
ralnych lub sztucznie wzbudzonych pól fizycznych 
(w drugim wypadku sonda zawiera również nadajnik, 
czyli źródło pola pierwotnego). Sonda kompleksowa 
ma kilka odbiorników, co pozwala na równoczesny 
pomiar wielu parametrów. W zależności od potrzeb 
(badanie warstw o różnej grubości i oporze stosuje 
się różne wzajemne położenia elektrod w sondzie 
pojedynczej, jak również zamienia się ich bieguno¬ 
wość oraz funkcje. Używa się też sondy o różnych 
długościach. 

Najprostsza pojedyncza sonda elektryczna, tzw. 
dwubiegunowa jest wyposażona w trzy elektrody — 
dwie prądowe i jedną pomiarową. Druga elektroda 
pomiarowa jest umieszczona na powierzchni terenu, 



Rys. 10. Zasada geofizycznego profilowania w otworach wiertni¬ 
czych wraz z wynikami profilowań stosowanych do wykrywania 
pokładów węglowych PS krzywa profilowania potencjałów po¬ 
laryzacji naturalnej, PO krzywa profilowania oporności, PG 
krzywa profilowania y, PNG krzywa profilowania neutron-y 
(opracował St. Plewa) 


a więc nie wchodzi w skład sondy. Sonda taka naj¬ 
częściej jest stosowana do profilowania oporu prze¬ 
wiercanych skał (profilowanie ełektrooporowe). 

Po wyłączeniu elektrod zasiłających sondę, można 
wykonywać profilowanie potencjałów polaryzacji na¬ 
turalnej skał (metoda potencjałów własnych w geo- 
elektryce poszukiwawczej). W tym wypadku mierzy 
się różnicę potencjału pola elektrycznego samoistnie 
powstałego w przewiercanych przez otwór warstwach. 
Potencjał pojawia się w wyniku procesów dyfuzyjno- 
absorpcyjnych w ścianach otworu, przez które prze¬ 
nikają wodne roztwory soli, ośrodka skalnego i płucz¬ 
ki, jako rezultat filtracji tych roztworów oraz wsku¬ 
tek procesów utleniająco-redukcyjnych zachodzących 
w pokładach węgli, złóż rud siarczkowych i w struktu¬ 
rach zawierających tlenki metali. 

%V zakres elektrometrn wiertniczej wcnoazą rożne 
warianty profilowania oporu (PO), profilowanie po¬ 
tencjałów polaryzacji naturalnej (spontanicznej, PS), 
profilowanie potencjałów polaryzacji wzbudzonej 
(PW) i profilowanie indukcyjne (PI). 

W radiometrii wiertniczej *do profilowania wyko¬ 
rzystuje się sondy zawierające detektory promienio¬ 
wania y lub neutronów, ewentualnie także źródło 
promieniowania. 

W termometrii wiertniczej wyróżnia się profilo¬ 
wanie cieplnego oporu skał (PTu) i profilowanie 
przewodzenia temperatury (PTn). Metodę PTu sto¬ 
suje się w warunkach ustalonej równowagi cieplnej 
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Rys. 11. Przykład zastosowania radiometrycznego profilowania otworów do określenia litologii przewierconych skal oraz do 
ich korelacji międzyotworowej; PG krzywa profilowania y, PNG krzywa profilowania neutron-y, Ing — natężenie wtórnego 
promieniowania y, Ig natężenie naturalnego profilowania y, B-l,T-3 nazwy otworów wiertniczych (opracował St. Plewa) 
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Rys. 12. Przykład wykrywania horyzontów roponośnych na pod¬ 
stawie profilowania potencjałów polaryzacji naturalnej PS i pro¬ 
filowania oporności PO oraz kontroli stanu zacementowania 
otworu metodą profilowania y (PG) i y izotopowego (PGi), 
Kw współczynnik nasycenia skał wodą, KWR kontakt woda- 
-ropa (opracował St. Plewa) 


w otworze wiertniczym; służy ona do pomiaru stop¬ 
nia geotermicznego i gęstości strumienia cieplnego 
Ziemi. Metoda PTn polega na pomiarze temperatury 
w warunkach nieustalonej równowagi cieplnej; 
wartość temperatury w otworze jest wówczas pro¬ 
porcjonalna do współczynnika przewodzenia tempe¬ 
ratury przewierconych skał. PTu wykonuje się w celu 


wyodrębnienia różnego typu skał i warstw gazo¬ 
nośnych oraz określania stanu zacementowania od¬ 
wiertu. 

Do sejsmometrii wiertniczej należą pomiary pręd¬ 
kości rozchodzenia się fal sejsmicznych w przewier¬ 
conych skałach. Wykonuje się np. profilowanie aku¬ 
styczne prędkości (PAP) na potrzeby sejsmiki poszu¬ 
kiwawczej oraz w celu skorelowania warstw przewier¬ 
conych w różnych miejscach i obliczenia ich współ¬ 
czynnika porowatości. 

W zakres magnetometrii wiertniczej wchodzi pro¬ 
filowanie podatności magnetycznej (PPM) skał, któ¬ 
rego celem jest wykrywanie i lokalizowanie ciał 
o dużej podatności magnetycznej, np. niektórych ty¬ 
pów złóż rud żelaza. Jeżeli tego rodzaju złoże nie 
zostało przewiercone, a może występować w pobliżu 
otworu, to w celu wykrycia stosuje się profilowanie 
pola magnetycznego (PZM), na podstawie którego 
wyznacza się w otworach wiertniczych nachylonych 
zmiany wartości natężenia i kierunku pola. 

W celu ograniczenia wieloznaczności interpretacji 
pojedynczych krzywych pomiarowych, w otworach 
wiertniczych wykonuje się komplet profilowań dobra¬ 
ny odpowiednio do podstawowego zadania geolo¬ 
gicznego. Analiza otrzymanych w ten sposób wyni¬ 
ków w powiązaniu z dostępnymi danymi geologicz¬ 
nymi i górniczymi nosi nazwę kompleksowej inter¬ 
pretacji profilowań. Dla przykładu na rys. 10 przed¬ 
stawiony jest kompleks profilowań stosowany do wy¬ 
krywania pokładów węglowych, a na rys. 11 są poda¬ 
ne wyniki zastosowania metod radiometrycznych do 
określania składu i wykształcenia przewierconych skał 
oraz do ich korelacji międzyotworowej. Na rys. 11 
zwraca uwagę wykryte złoże fosforytów. 

Komplet profilowań wykonany na potrzeby gór¬ 
nictwa naftowego pokazano na rys. 12, podane dane 
stanowią pełną informację o wykrytym złożu ropy 
naftowej. 

G. Dohr, Applied Geophysics. Geołogy of Petroleum y voI. 1, 
Stuttgard 1974; Z. Fajklewicz, Grawimetria poszukiwawcza , 
Warszawa 1973; St. Plewa, Geofizyka wietrnicza y Katowice 1972; 
Przewodnik pracownika służby geologicznej, Warszawa 1971; 
Sostojanije i zadaczi razwiedocznoj gieofiziki, Moskwa 1971; 
Z. Fa JKLEWicz(red.), Zarys geofizyki stosowanej, Warszawa 1972. 
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ASTROFIZYKA I KOSMOCHEMiA 


Kosmologia • Antymateria we Wszechświecie Radioastronomia 
Astronomia promieni X i y -Astronomia w podczerwieni • Ewolu¬ 
cja gwiazd • Galaktyki • Gwiazdy zmienne pulsujące • Kwazary • Pul- 
sary Czarne dziury i zapadanie grawitacyjne - Fale grawitacyjne 
Promieniowanie kosmiczne - Rozpowszechnienie pierwiastków 
chemicznych i molekuł we Wszechświecie - Reakcje jądrowe w 
gwiazdach - Powstawanie pierwiastków chemicznych • 


Kosmologia 

Michał Heller 


Obserwowafny Wszechświat 

Podstawowe znaczenie dla kosmologii współczesnej 
ma doświadczalny fakt, że wszystkie informacje we 
Wszechświecie mogą być przenoszone tylko ze skoń¬ 
czoną prędkością. Istnieje górna, nieprzekraczalna 
granica prędkości przenoszenia informacji, zwana 
prędkością światła i oznaczana przez c. Prędkość 
Wszechświat światła nie zależy — to również fakt doświadczany — 
— zbiór od wyboru układu odniesienia. Jeżeli przyjmiemy, że 
zdarzeń Wszechświat jest największym możliwym zbiorem 
zdarzeń, z których każde scharakteryzujemy przez 
podanie miejsca (.r, y, z) i chwili (/), w której ono 
zaszło (rys. 1), to z faktu istnienia nieprzekraczal¬ 
nej prędkości c rozchodzenia się informacji natych¬ 
miast wynika, że muszą istnieć zdarzenia dla nas nie- 
obserwowalne. Jeżeli bowiem dwa zdarzenia A(xa, 


dojść do miejsca (jcb, ys, zb) przed chwilą tB , czyli: 

(XB-XA) 2 + (jB-yA ) 2 + (ZB-ZA) 2 > C^B-Ia) 1 , 

to zdarzenie 2? jest nieobserwowalne dla A. Mówimy, 
że zdarzenia A i B są oddzielone od siebie w cza¬ 
soprzestrzeni przedziałem przestrzennopodobnym 
(rys. 2). 

Dla zdarzeń, które mogą wymieniać ze sobą 
informację, mamy: 

(xb — X A ) Z + (yB— yA) 2 + (z B — ZaY ^ c\t B — tA). 

Gdy obowiązuje znak <, zdarzenia mogą sobie 
przekazywać informacje za pomocą sygnałów wol¬ 
niejszych od c; mówimy wówczas, że zdarzenia są 
oddzielone od siebie w czasoprzestrzeni przedziałem 
czasopodobnym (rys. 3). Gdy obowiązuje znak =, 


zdarzenia 
obserwował- 
ne i 

naeobserwo- 

walne 



Rys. 1. Zdarzenie, 
którego wszystkie 
współrzędne są rów¬ 
ne zeru: x — y — 
= z = t = 0 


Rys. 2. Dwa zdarze¬ 
nia o różnych współ¬ 
rzędnych przestrzen¬ 
nych, łecz zachodzące 
w tej samej chwili. 
Przedział s między 
tymi zdarzeniami wy¬ 
nosi : j * = ( xb-xa)' + 
+ {yB-yA) l + (zb- 
-zaY > 0. Przedziały, 
dla których s* > 0 na¬ 
zywamy przedziała¬ 
mi przestrzennopodo- 
bnymi 


yA, za, tA ) i B(xb, ys, zb, ta) są tak rozmieszczone, 
że informacja wysłana w chwili / a z miejsca (x a,* 
yx , za), przenosząca się z prędkością c, nie zdąży 


Rys. 3. Zdarzenie, dLa 
którego: x — y — 
= z = 0,/ = f,. Prze¬ 
dział s między tym 
zdarzeniem a zdarze¬ 
niem z rys. 1 wynosi: 
s* = <0. Prze¬ 

działy, dla których 
s* < 0, nazywamy prze¬ 
działami czasopodob- 
nymi 



zdarzenia mogą się kontaktować tylko za pomocą 
sygnałów rozchodzących się z prędkością c (sygnałów 
świetlnych); mówimy wówczas, że zdarzenia są od¬ 
dzielone od siebie przedziałem typu zerowego (zero¬ 
wym, świetlnym). 

Rozważmy zbiór zdarzeń, z którymi zdarzenie O 
(określone przez: xo = yo = z 0 = 0) może kon¬ 
taktować się za pomocą sygnałów świetlnych, tzn.: 

ct — ±}/x 2 -r}' i +z z . 

Równanie to opisuje powierzchnię dwóch cztero- stożki 
wymiarowych stożków stykających się ze sobą wierz- świetlne 
chołkami w początku układu odniesienia (rys. 4). zdarzenia 
Nazywamy je stożkami świetlnymi zdarzenia O. Na 
powierzchni stożków leżą zdarzenia, z którymi O 
może się kontaktować używając sygnałów świetlnych; 
wewnątrz dolnego i górnego stożka leżą zdarzenia, 
z którymi O może się kontaktować za pośrednictwem 
sygnałów wolniejszych niż światło. Poza tymi stoż- 
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stożek kami znajdują się zdarzenia, z którymi O nie może 
przeszłości się kontaktować. Ze stożka dolnego zdarzenie O 
i stożek może odbierać informacje, nazywamy go stożkiem 
przyszłości świetlnym przeszłości zdarzenia 0\ do stożka gór¬ 
nego O może przesyłać informacje, nazywamy go 
stożkiem świetlnym przyszłości zdarzenia O . 



Rys. 4. Stożki świetlne obserwatora O (ziemskiego astronoma). 
Dla jaśniejszego zobrazowania stosunków czasoprzestrzennych 
pominięto dwa wymiary przestrzenne (y i z), zachowując tylko 
wymiar ct i jeden wymiar przestrzenny jc 

Ponieważ za O można przyjąć dowolny punkt w 
czasoprzestrzeni (w dowolnym miejscu można wy¬ 
brać początek układu odniesienia), powiadamy, że 
czasoprzestrzeń ma strukturę stożkową. Dotychczas 
milcząco zakładaliśmy, że czasoprzestrzeń jest płas¬ 
ka — tak czyni się w szczególnej teorii względności — 
ale, jak wiemy z ogólnej teorii względności, tak wcale 
być nie musi. Czasoprzestrzeń może być zakrzywiona 
lub nawet nieregularnie pofałdowana. Wówczas, 
oczywiście, deformują się także stożki świetlne. Może¬ 
my jednak zawsze rozważać tak małe obszary czaso¬ 
przestrzeni, żeby w dobrym przybliżeniu można je 
było uważać za płaskie; w obrębie takich obszarów 
spełnione są wszystkie powyższe wzory. Od dokład¬ 
ności pomiarów, którymi dysponujemy badając dane 
zagadnienie, zależy, jak duże obszary czasoprzestrzeni 
można uważać jeszcze za płaskie. Tak np. R. V. Pound 
i G. A. Rebka (1960 r.) wykorzystując zjawisko rezo¬ 
nansu jądrowego (-► Jądrowy rezonans magnetyczny) 
i efekt Mossbauera (-► Zjawisko Mossbauera), zmie¬ 
rzyli krzywiznę czasoprzestrzeni w obszarach prze¬ 
strzennych zaledwie kilkunastu metrów i w przedziale 
czasu potrzebnym do pokonania tej odległości przez 
promień świetlny. Natomiast w zagadnieniach astro¬ 
nomicznych, przy obecnej technice obserwacyjnej, 
poprawki wynikające z ogólnej teorii względności 
można mierzyć dopiero na granicy odległości, do 
których w ogóle sięgamy. 

czym Przyjmijmy teraz, że O jest ziemskim astronomem, 
dysponuje który bada obecnie Wszechświat. Dla niego obser- 
badacz wowalnym Wszechświatem może być tylko jego sto- 
Wszech- żek przeszłości. Astronom, badając Wszechświat, 
świata posługuje się: a) znajomością fizyki sprawdzonej eks¬ 
perymentalnie na Ziemi i w jej bezpośrednim sąsiedz¬ 
twie (loty kosmiczne) oraz b) obserwacjami polegają¬ 
cymi na rejestrowaniu fal elektromagnetycznych 
(w zakresie optycznym i radiowym) przychodzących 
z przestworzy kosmicznych. A zatem w praktyce nie 
penetrujemy całego naszego stożka świetlnego prze¬ 
szłości, lecz tylko jego obszary zakreślone na rys. 4 
niebieskim kolorem. 

Chcąc na tak małej bazie obserwacyjnej odtworzyć 
strukturę-ewolucję Wszechświata, musimy przyjąć 
pewne uogólnienia, a mianowicie: a) prawa fizyki 
sprawdzone na Ziemi i w jej najbliższym sąsiedztwie 
obowiązują w całym Wszechświecie, b) obserwacje 


astronomiczne wykonane na Ziemi są typowe dla zasada 
całego Wszechświata. Przyjęcie położenia Ziemi we kosmolo- 
Wszechświecie za typowe wiąże się zwykle z nazwis- giczna 
kiem Kopernika. Założenia a) i b) łącznie nazywa się 
zasadą kosmologiczną. 


Obserwacyjne podstawy kosmologii 

Obserwowany Wszechświat wypełniony jest galakty¬ 
kami i gromadami galaktyk (-* Galaktyki). Oszaco¬ 
wania średniej gęstości materii we Wszechświecie dają 
wartości pomiędzy 10“ 28 a 10" 31 g/cm 3 . Zbiór galak¬ 
tyk nie jest zbiorem statycznym. Systematyczne prze¬ 
sunięcia ku czerwieni w widmach galaktyk, zinter¬ 
pretowane jako zjawisko Dopplera oznaczają, że ga¬ 
laktyki oddalają się od obserwatora jednakowo we 
wszystkich kierunkach (czyli izotropowo), z pręd¬ 
kościami v wprost proporcjonalnymi do odległości r 
(od danej galaktyki do obserwatora), tzn. według 
prawa: 

7 = h 7 , (i) 

zw. prawem Hubble ł a, gdzie H — stała Hubble’a prawo 
(rys. 5). Rozszerzanie się przestrzeni 2-wymiarowej Hubble'a 
można przedstawić poglądowo w przestrzeni 3-wy- 



Rys. 5. Zależność prędkości ucieczki galaktyk od odległości 
określona przez Hubblc’a 



Rys. 6 . Powierzchnia balonika zakrzywiona i zamknięta sta¬ 
nowi przykład przestrzeni 2-wymiarowej. Przy równomiernym 
nadmuchiwaniu balonika kropki na jego powierzchni oddalają 
się od siebie zgodnie z prawem Hubble’a. Żadna z nich nie zaj¬ 
muje wyróżnionego położenia. Hubbleowskie rozszerzanie nie 
łamie zasady Kopernika 


Wartość stałej H otrzymana przez różnych badaczy 


Nazwisko 

Rok 

H , (km/s)/Mps* 

E. Hubble 

1936 

526 

W. Baade 

1950 

200 

A. R. Sandage 

1968 

75 3 +I9 

S. Van den Bergh 

1970 

95 + 15 
* 5 -12 

G. De Yaucouleurs 

1970 

50 

A. R. Sandage, G. A. Tamroann 

1975 

55 ±5 

P. Teerikorpi 

1976 

41 ±3 

L. Bottinelli, L. Gouguenheim 

1976 

76±8 


*1 Mps « 10»ps w 3-10“ m. 
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promienio¬ 

wanie 

reliktowe 


miarowej (rys. 6). Poglądowe przedstawienie rozsze¬ 
rzania się przestrzeni 3-wymiarowej nie jest możliwe. 

Wyznaczenie wartości stałej H z danych obserwa¬ 
cyjnych ma zasadnicze znaczenie dla kosmologii. 
Hubblc przyjmował pierwotnie, że wartość stałej H 
równa się ok. 500 (km/s)/Mps. Jego oszacowanie 
oparte na błędnej ocenie odległości do najbliższych 
galaktyk kilkakrotnie poprawiano. Niektóre wyniki 
przedstawia tabela na str. 900. 

Przyjmujemy za Sandagem, że prawdziwa wartość 
stałej H znajduje się pomiędzy 50 a 100 (km/s)/Mps. 
Zgodnie z tym mamy: 

H - /r-100 (km/s)/Mps, 

przy czym zakładamy, że h jest zawarte pomiędzy 
0,5 a 1,0. 

Wielkość przesunięcia ku czerwieni w widmie danej 
galaktyki z definiuje się następująco: 

Aofcs — hs 



gdzie Aods — długość fali zmierzonej przez obserwa¬ 
tora, Xg — długość fali emitowanej przez galaktykę. 

Ponieważ prawo Hubble*a przypisuje jednoznacznie 

galaktyce znajdującej się w określonej odległości r 
przesunięcie z, to w praktyce można przyjąć z jako 
miarę odległości. Z kolei w astronomii ,,głębia od¬ 
ległości” odpowiada „głębi czasu” (galaktykę od¬ 
ległą o 10 min lat świetlnych oglądamy taką, jaka 
była 10 min lat temu), zatem w kosmologii przyjęto 
wyrażać czas poprzez wartości z. 

Obserwacje radioastronomiczne (wykonane po raz 
pierwszy przez A. A. Penziasa i R. W. Wilsona w 
1965 r.) wykazały, że przestrzeń Wszechświata jest 
izotropowo wypełniona promieniowaniem elektro¬ 
magnetycznym, zwanym promieniowaniem relikto¬ 
wym lub promieniowaniem tła. W promieniowaniu 
tła przeważają fale o długościach milimetrowych. 
Jego temperatura wynosi r pr om ^ 2,7 K, a odpowia¬ 
dająca jej liczba fotonów na jednostkę objętości 
/Tprom ^ 1 0 3 /cm 3 i gęstość energii £ pr0 m ^ 4-10" 14 
J/m 3 . Mierząc temperaturę promieniowania tła w 
różnych kierunkach otrzymano jednakowe wyniki 
(odchylenia są rzędu 10“ 4 K); zatem pole promie¬ 
niowania jest izotropowe. 

Zgodnie z zasadą kosmologiczną izotropowość 
ucieczki galaktyk i izotropowość promieniowania tła 
możemy ekstrapolować na cały Wszechświat. Zakła¬ 
damy więc, że obserwator umieszczony w dowolnym 
punkcie przestrzeni widzi wokół siebie materię roz¬ 
mieszczoną izotropowo (gromady galaktyk i promie¬ 
niowanie). Jeżeli rozkład materii jest izotropowy 
względem każdego punktu przestrzeni, to jest on 
również jednorodny (prawo Schura). Izotropowość 
(brak wyróżnionych kierunków w przestrzeni) i jed¬ 
norodność (brak wyróżnionych punktów w prze¬ 
strzeni) są zasadniczą treścią zasady kosmologicznej. 
Innymi słowy, zasada kosmologiczna postuluje sfe¬ 
ryczną symetrię rozkładu materii względem każdego 
obserwatora w przestrzeni. Z obserwacji zaś wynika, 
że średnia gęstość materii w- przestrzeni jest stała, 
jeśli uśrednienia dokonywać po obszarach obejmują¬ 
cych wiele gromad galaktyk (po obszarach o linio¬ 
wych rozmiarach większych niż 100 Mps). Byłoby to 
dodatkowym obserwacyjnym potwierdzeniem zasady 
kosmologicznej i wskazywałoby, że „elementarną 
cegiełką” w kosmologii jest gromada galaktyk. 


Konstrukcja modeli kosmologicznych 

Ze wszystkich oddziaływań (-► Cząstki elementarne 
i ich oddziaływanie) znanych współczesnej fizyce 
(silne, słabe, elektromagnetyczne, grawitacyjne) od¬ 
działywania grawitacyjne, choć najsłabsze, mają naj¬ 
większy (teoretycznie nieograniczony) zasięg (jeśli 
pominąć oddziaływania elektromagnetyczne, których 


efektywny zasięg jest zmniejszony przez to, że ładunki 
dodatnie znoszą się z ujemnymi). Przede wszystkim 
więc one są odpowiedzialne za strukturę Wszechświa¬ 
ta. Dlatego też współczesna kosmologia teoretyczna 
opiera się na einsteinowskiej teorii grawitacji, czyli na 
ogólnej teorii względności; jest więc kosmologią re¬ 
latywistyczną. 

W ogólnej teorii względności pole grawitacyjne 
jest reprezentowane przez zakrzywienie czasoprze¬ 
strzeni. Ilościowy związek między rozkładem materii 
będącej źródłem pola grawitacyjnego a geometrią 
czasoprzestrzeni wyrażają równania pola grawitacyj¬ 
nego: 

Rab \Rgab = “ xT a b» ( 2 ) 

Lewa strona tego równania tensorowego (równo¬ 
ważnego dziesięciu równaniom skalarnym) jest zbu¬ 
dowana z wielkości geometrycznych; reprezentują 
one geometryczną strukturę czasoprzestrzeni. Prawa 
strona to tensor energii — pędu T a b> opisujący roz¬ 
kład gęstości, ciśnień, pędów i energii, jest on pomno¬ 
żony przez stałą grawitacji Einsteina x — SnGfc* t 
gdzie G — newtonowska stała grawitacji. Tak więc 
równania (2) ukazują, w jaki sposób rozkład materii 
określa geometrię czasoprzestrzeni; a czytane w drugą 
stronę informują o tym, jak geometria czasoprze¬ 
strzeni determinuje ruchy materii: swobodne cząstki 
materialne takie, na które nie działają żadne 
siły z wyjątkiem grawitacyjnych) poruszają się po 
liniach najprostszych (tzw. liniach geodezyjnych lub 
geodetykach) w czasoprzestrzeni. 

Z równań (2) nie wynika statyczny model Wszech¬ 
świata, co wydawało się być ich wadą. Bezpośrednio 
po powstaniu ogólnej teorii względności (1917 r.) 
Einstein nie podejrzewał nawet, że Wszechświat się 
rozszerza, sądził, że świat jest statyczny. Aby otrzy¬ 
mać statyczny model Wszechświata dodał do równań 
pola tzw. człon kosmologiczny Ag a b , gdzie A — 
pewna nowa stała o wymiarze [długość]" 2 , zwana 
stałą kosmologiczną. Zmodyfikowane równania pola 
miały postać: 

Rab-*Rgab +Agat, = —xTab. (2a) 

Obecnie, na podstawie danych obserwacyjnych, 
sądzi się, żc wartość stałej kosmologicznej jest równa 
zeru, lub mało od niego różna. Dlatego w dalszym 
ciągu bardziej szczegółowo omówimy modele Wszech¬ 
świata bez stałej kosmologicznej. 

Podstawowe zagadnienie kosmologiczne polega na 
tym, by na podstawie danych obserwacyjnych o roz¬ 
mieszczeniu materii we Wszechświecie i równań pola 
ogólnej teorii względności odpowiedzieć na pytanie, 
jaka jest globalna (w największej skali) geometryczna 
struktura Wszechświata. Informacje zawarte w zasa¬ 
dzie kosmologicznej znacznie ułatwiają znalezienie 
odpowiedzi na to pytanie. Geometryczna treść zasady 
kosmologicznej sprowadza się bowiem do następu¬ 
jących stwierdzeń: a) Można wybrać taki układ od¬ 
niesienia, względem którego materia wypełniająca 
Wszechświat, średnio rzecz biorąc, spoczywa; ina¬ 
czej: ponieważ cząstki materialne (galaktyki, groma¬ 
dy galaktyk) mogą oddalać się od siebie (lub zbliżać), 
układ odniesienia nie jest sztywny, lecz rozszerza się 
(lub kurczy) razem z materią. Nazywamy go współ- 
poruszającym się układem odniesienia. Jego matema¬ 
tycznym odpowiednikiem jest współporuszający się 
układ współrzędnych (współrzędne są jakby przycze¬ 
pione do cząstek materialnych i poruszają się razem 
z nimi), b) We współporuszającym się układzie od¬ 
niesienia czasoprzestrzeń daje się w każdym punkcie 
rozłożyć na uniwersalny czas kosmiczny t i prosto¬ 
padłą do niego 3-wymiarową przestrzeń równocze- 
sności, / = consf. Tak więc z upływem czasu (uniwer¬ 
salnego) zmieniają się w sposób ciągły różne obser¬ 
wowane własności geometryczne 3-wymiarowej prze¬ 
strzeni. Przestrzenie równoczesności są przestrzenia¬ 
mi o stałej krzywiźnie: dodatniej (dwuwymiarowym 
przykładem przestrzeni o stałej dodatniej krzywiźnie 
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jest powierzchnia kuli, rys. 7), zerowej (przestrze¬ 
nie płaskie, rys. 8) lub ujemnej (dwuwymiarowym 
przykładem jest powierzchnia wklęsłego siodła, 
rysunek 9). 



Rys. 7. Powierzchnia 
kuli jest przykładem 
dwuwymiarowej prze¬ 
strzeni o dodatniej 
krzywiźnie. Jest to 
przestrzeń zamknię¬ 
ta: promień światła 
po skończonym czasie 
wraca do punktu wyj¬ 
ścia. Wszystkie linie 
geodezyjne (południ¬ 
ki) ogniskują się na 
biegunach. Suma ką¬ 
tów w trójkącie jest 
większa od 180° 
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gdzie q — gęstość materii, a p — ciśnienie gazu 
galaktyk. 

Musimy teraz przyjąć pewne upraszczające zało¬ 
żenia dotyczące materii we Wszechświecie. Jeśli wy¬ 
obrazimy sobie zbiór galaktyk (ściślej gromad ga¬ 
laktyk) jako gaz o stałej gęstości przestrzennej (gęstość 
gazu w czasie może ulegać zmianom wskutek eks¬ 
pansji), to okazuje się, że ciśnienie tego gazu jest 
pomijalnie małe w porównaniu z jego gęstością. 
Przyjęcie zasady kosmologicznej i założenie, że ciś¬ 
nienie gazu galaktyk jest równe zeru, pozwala z rów¬ 
nań pola otrzymać jedno równanie, zwane równaniem 
Friedmana. 

W rzeczywistym Wszechświecie stosunek pjc 2 Q 
wynosi ok. 10" 6 . Możemy więc przyjąć, że ciśnienie 
znika: 

P = 0. (5) 



Rys. 8. Przykład dwuwymiarowej przestrzeni płaskiej — płasz¬ 
czyzna euklidesowa. Jest to przestrzeń otwarta: promień światła 
wysłany w przestrzeń nie powróci do punktu wyjścia. Do danej 
prostej / istnieje tylko jedna prosta równoległa przechodząca 
przez punkt A nie leżący na prostej 7 (piąty postulat Euklidesa). 
Suma kątów w trójkącie jest równa 180° 


Związek (5) nazwano równaniem stanu dla nieod- 
działującej ze sobą materii pyłowej (gaz galaktyk fizy¬ 
cznie jest podobny do cieczy doskonałej bez ciśnie¬ 
nia). Wstawiając warunek (5) do równania (4b) 
otrzymujemy, po prostych, ale dość żmudnych prze¬ 
kształceniach, równanie Friedmana* 



gdzie występuje stała całkowania £: 

E = gW, (7) 


równanie 

Friedmana 



Rys. 9. Przykład dwuwymiarowej przestrzeni o krzywiźnie ujem¬ 
nej. Jest to przestrzeń otwarta. Do danej prostej (geodetyki) 
7 istnieje nieskończenie wiele równoległych przechodzących 
przez punkt A nic leżący na 7. Suma kątów w trójkącie jest 
mniejsza od 180 


H. P. Robertson i A. G. Walker (niezależnie od sie¬ 
bie) pokazali, że każda czasoprzestrzeń spełniająca 
zasadę kosmologiczną musi mieć następującą metrykę 
(czyli wzór na przedział między dwoma dowolnie 
sobie bliskimi zdarzeniami; metryka jest jednym z naj¬ 
bardziej podstawowych wyrażeń geometrycznych 
charakteryzujących daną przestrzeń): 


ds 2 = c 2 d/ 2 - c K 2 (f) 


dx 2 Ą-dy 2 j rdz 2 

[\+\k(x*+y*+z 2 ))*' 


(3) 


czynnik 
skali 92 


gdzie t — czas kosmiczny, 92(7) — czynnik skali 
(zwany też promieniem Wszechświata). Czynnik skali 
charakteryzuje zmianę odległości między dowolnymi 
punktami przestrzeni: jeśli w pewnej chwili odległość 
między dwoma obiektami wynosi L, to po upływie 
czasu / odległość ta będzie równa K(t)-L. Stała k 
może przybierać jedną z trzech wartości: 0, ±-1. 
Jeśli k = t 1, przestrzenie stałego czasu mają stałą 
dodatnią krzywiznę; jeśli k = 0, przestrzenie te są 
płaskie, i jeśli k = - I —są to przestrzenie o ujem¬ 
nej krzywiźnie. 

Dziesięć równań pola (2a), po uwzględnieniu me¬ 
tryki (3), sprowadza się do następujących dwóch wy¬ 
rażeń : 


KOC 2 = 


A , ^ kc 2 H</92W 
^^—• 


(4a) 


odgrywająca rolę całkowitej, zachowującej się energii 
pyłu (suma energii spoczynkowych wszystkich czą¬ 
stek w określonej początkowo, współporuszającej się 
objętości). 

Równanie (6) określa zmianę 9? w czasie. Każde 
jego rozwiązanie przedstawia ewolucję określonego 
modelu kosmologicznego. 


Modele Friedmana 

Równanie (6) dla A = 0 ma trzy rozwiązania. Bę¬ 
dziemy je nazywać modelami kosmologicznymi 
Friedmana. Modele te przedstawia rys. 10. 

Ewolucja trzech modeli Friedmana rozpoczyna się 
od stanu „osobliwego”, który charakteryzują nastę- 



Rys. 10. Modele kosmologiczne z A — 0 
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pujące zależności: gdy t-> 0, wówczas 92 -> 0 i o -+ oo. 
W pobliżu początkowej osobliwości wszystkie trzy 
rozwiązania przebiegają jednakowo. Plaski model 
Friedmana (określony przez: k — A = p = 0), zwany 
również kosmologicznym modelem Einsteina-de Sit- 
tera (model E-S ), rozszerza się z prędkością ucieczki. 
Jeżeli tempo ekspansji jest mniejsze od prędkości 
ucieczki, jak dla zamkniętego (Jc = -fi) modelu 
Friedmana, model po osiągnięciu maksymalnych roz¬ 
miarów kurczy się do punktu stanowiącego końcową 
osobliwość. Jeżeli tempo ekspansji równa się (jak w 
model E-S modelu E-S ) lub przewyższa (jak w modelu z k = — 1) 
prędkość ucieczki, ekspansja trwa nieograniczenie 
długo i po nieskończenie długim czasie, gdy / -> oo, 
gęstość materii wypełniającej Wszechświat spada do 
zera (q -* 0). 

Jak można tego oczekiwać, prędkość ucieczki jest 
zależna od gęstości materii. W modelu Einsteina-de 
Sittera gęstość q E -s jest równa: 

qe~s = 1,9-10 ~ 29 h 2 g/cm 3 

(wielkość h wprowadziliśmy na str. 901). 

W modelu zamkniętym mamy: q > q e ~s, a w mo¬ 
delu otwartym q < qes- Zależności te są prostym 
testem obserwacyjnym mogącym rozstrzygnąć, który 
z trzech modeli Friedmana odpowiada rzeczywistości. 
Niestety, obecne oszacowania średniej gęstości ma¬ 
terii we Wszechświecie są obarczone tak dużym błę¬ 
dem, że test ten nie daje rozstrzygających wyników. 



Rys. 12. Modele kosmologiczne otwarte płaskie, z k = 0, oraz 
A ^ 0. Model z A = 0 wyróżniono niebieskim kolorem 


Modele Friedmana— Lemattre'a 

Jeżeli przyjmiemy, że stała kosmologiczna A może 
być różna od zera, to otrzymujemy wiele modeli 
kosmologicznych. Będziemy je nazywać modelami 
Friedmana-Lemaitre’a. Przedstawia je rys. 11 i 12. 

Wśród modeli zamkniętych (rys. 11) znajduje się 
jeden model statyczny (bez ewolucji), tzw. statyczny 
model model Einsteina (model E). Jest to historycznie pierw- 
Einsteina szy spośród relatywistycznych modeli Wszechświata, 
podany przez Einsteina w 1917 r. Rok ten można 
uważać za datę powstania kosmologii relatywistycz- 



asymptotyczne A t i A t 


nej. Zauważmy, że w modelu E stała kosmologiczna 
A ^ 0. Właśnie po to Einstein wprowadził do teorii 
stałą kosmologiczną, aby uzyskać model statyczny. 

Historycznie drugim modelem kosmologicznym byl 
model opisywany przez tzw. rozwiązanie de Sittera model 
(model 5). Swoimi, zdawałoby się paradoksalnymi, de Sittera 
własnościami model ten w pewnym czasie sprawił 
teoretykom sporo kłopotów. Świat de Sittera jest 
pusty, a mimo to się rozszerza i jest stacjonarny. 

Pojęcie stacjonarności jest, w pewnym sensie, uogól¬ 
nieniem pojęcia statyczności: układ jest statyczny, 
jeśli nic się w nim nie zmienia; układ stacjonarny 
może ulegać zmianom, ale jako całość średnio pozo¬ 
staje zawsze taki sam. Liczba mieszkańców zamarłego 
w rozwoju miasteczka może być wielkością stacjonar¬ 
ną — mimo że poszczególni ludzie rosną i starzeją 
się — jeśli średnio tyle samo osób rodzi się, ile umiera. 

Stacjonarność świata de Sittera wynika z jego pustki, 
nie ulega on rozrzedzaniu w trakcie ekspansji, gdyż 
średnia gęstość zawartej w nim materii równa się zeru. 

Ale jak może się rozszerzać będąc pustym? Otóż z 
równań opisujących modele kosmologiczne wynika, 
że każdy rozszerzający się nieograniczenie model 
Wszechświata, w miarę gdy czas dąży do plus nie¬ 
skończoności, przechodzi w świat de Sittera. Fizycz¬ 
nie jest to zrozumiałe: w trakcie rozszerzania ilość 
mas zawartych we Wszechświecie pozostaje stała, 
a objętość rośnie, świat staje się rzadszy, gęstość ma¬ 
terii maleje, w granicy — gdy czas trwania ekspansji 
dąży do nieskończoności — gęstość materii dąży do 
zera. Pusty świat de Sittera jest granicą, ku której 
zmierza kosmiczna ekspansja. 

W historii kosmologii ważną rolę odegrał model model 
Lemaitre’a (L na rys. 11). Ewolucja tego modelu Lemaitre'a 
przebiega wyraźnie w trzech etapach: w pierwszym 
i ostatnim tempo ekspansji jest duże, w środkowym — 
wolniejsze. Model ten ma ciekawą własność. Im bar¬ 
dziej zbliżamy się z wartością A do wartości A 
charakterystycznej dla modelu E , tym bardziej wy¬ 
dłuża się środkowy etap ewolucji świata Lemaitre’a 
(rys. 13). Dzięki temu można dowolnie wydłużać 
wiek świata Lemaitre’a (tzn. okres, jaki upłynął od 
początkowej osobliwości). 

Modele otwarte z ujemną krzywizną (k = —1) 
pod względem ewolucji czasowej nie różnią się istot¬ 
nie od modeli płaskich (k — 0). Przedstawiają je 
krzywe jakościowo takie same (rys. 12). 
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modele Modele kosmologiczne mające początkową oso- 
wielkiego bliwość nazywa się niekiedy modelami wielkiego wy- 
wybuchu buchu („Big Bang'’). Zwróćmy uwagę na fakt, że 
wszystkie modele Fnedmana-Lemaitrea, z wyjąt¬ 
kiem stosunkowo nielicznych odznaczających się dużą 
dodatnią wartością stałej kosmologicznej (/I ^ 4), 
są modelami wielkiego wybuchu. 



Rys. 13. Model kosmologiczny Lemaitre’a z A niewiele więk¬ 
szym od 4 (/I = 4 w naszych jednostkach charakteryzuje sta¬ 
tyczny model Einsteina). Zmierzając z wartością lambda do 4, 
okres prawie statyczny, zaznaczony linią przerywaną, można 
dowolnie wydłużać 

Światy promieniste 

Istotną składową materii we Wszechświecie oprócz 
gaz gazu galaktyk jest gaz fotonów. Dlatego z teore- 
fotonów tycznego punktu widzenia ważną klasą modeli ko¬ 
smologicznych są jednorodne i izotropowe modele 
wypełnione samym promieniowaniem, tzw. światy 
promieniste. 

Gaz fotonów można uważać za ciecz doskonałą 
opisaną równaniem stanu: 

P = l U°- (8) 

Konstrukcja modeli promienistych jest zasadniczo 
taka sama jak światów Friedmana-Lemaitre'a, z tym, 
że w miejsce równości (5) przyjmuje się wzór (8). 

Dla dalszych rozważań istotne okaże się porówna¬ 
nie gęstości energii otrzymanych na drodze teorety¬ 
cznych rozważań dla świata wypełnionego materią 
(gazem galaktyk) i dla świata wypełnionego promie¬ 
niowaniem (gazem fotonów). 

W rozważanych modelach kosmologicznych obję¬ 
tość jest proporcjonalna do9?“ 3 , dlatego dla gęstości 
materii pyłowej można napisać: 

1 

2 n,al ^ 7^3 • ( 9 ) 

Związek ten wynika także bezpośrednio z wzoru (7). 
Liczba fotonów w jednostce objętości jest oczywiście 
również proporcjonalna do 72“ 3 , ale obliczając gę¬ 
stość promieniowania należy uwzględnić poprawkę 
wynikającą stąd, że energia każdego fotonu zmienia 
się wraz z ekspansją (lub kontrakcją) Wszechświata 
wskutek efektu Dopplera. Z teorii wynika, że ener¬ 
gia każdego fotonu wskutek tego efektu zmienia się 
proporcjonalnie do R~ l . A zatem gęstość energii pro¬ 
mieniowania : 

i? prom ~ . (10) 

■f* 

Inne modele kosmologiczne 

Omówione modele Wszechświata, spełniające zasadę 
kosmologiczną, są najprostszymi'modelami relatywi¬ 
stycznymi. Z teoretycznego punktu widzenia jest rze¬ 
czą bardzo interesującą studiowanie modeli z odchyle¬ 
niami od izotropowości lub jednorodności. Tym bar¬ 
dziej, że w małej skali świat na pewno nie jest jed- 
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norodny (materia skupia się w galaktyki i gromady 
galaktyk), a w dawniejszych epokach mógł być na¬ 
wet silnie anizotropowy. 

W 1949 r. Kurt Godeł zbudował model obracające¬ 
go się Wszechświata. Model ten jest jednorodny: model 
w każdym punkcie można umieścić początek lokalnie Godła 
inercjalnego układu odniesienia, względem którego 
Wszechświat wykonuje obrót „absolutny”, ale ani¬ 
zotropowy: rotacja wyróżnia pewien kierunek — oś 
obrotu Wszechświata. Model Godła nie tłumaczy 
poczerwienienia w widmach galaktyk, świat gódlow- 
ski się nie rozszerza. Ponadto, we Wszechświecie 
Godła nie można czasoprzestrzeni jednoznacznie 
rozłożyć na czas kosmiczny i przestrzenie chwilowe, 
co więcej — w czasoprzestrzeni Godła istnieją, zam¬ 
knięte krzywe czasowe. Podróżując wzdłuż takiej 
krzywej można by wrócić do swojej przeszłości. 

Dziś znamy wiele modeli kosmologicznych obraca¬ 
jącego się Wszechświata. Okazuje się, że w kosmologii 
relatywistycznej wszystkie modele rolujące są anizo¬ 
tropowe, ale niekoniecznie odwrotnie — istnieją 
modele anizotropowe bez obrotu. 

Zadaniem znacznie bardziej skomplikowanym jest model 
zbudowanie modelu niejednorodnego. Badania w tej niejedno- 
dziedzinie są raczej mało zaawansowane. Zwykle za- rodny 
gadnienie upraszcza się w ten sposób, że w modelu 
jednorodnym, wypełnionym materią o stałej gęstości, 
rozważa się małe zaburzenia gęstości (odchylenia 
od stałej gęstości). Tego rodzaju rozważania wiążą 
się z zagadnieniem powstawania galaktyk (które 
są przecież lokalnymi zaburzeniami gęstości). 

W 1948 r. powstała nowa teoria kosmologiczna. Wszechświat 
zwana teorią Wszechświata w stanie stacjonarnym, stacjonarny 
której twórcami byli H. Bondi i T. Gold. Jej podsta¬ 
wą jest tzw. idealna (zwana również doskonałą lub 
mocną) zasada kosmologiczna, która do postulatów 
jednorodności i izotropowości wymaganych przez 
zwykłą zasadę kosmologiczną dodaje postulat sta- 
cjonarności Wszechświata: obraz Wszechświata jest 
niezależny nie tylko od położenia obserwatora 
w przestrzeni, lecz także od chwili, w jakiej dokonuje 
on obserwacji. Jeżeli świat się rozszerza (co autorzy 
teorii uznali za fakt obserwacyjny) a nie jest pusty, 
to jego obraz jako całości może się nie zmieniać w cza¬ 
sie tylko wtedy, gdy gęstość materii jest stale uzu¬ 
pełniana przez powstającą materię. Materia, zdaniem 
Bondiego i Golda, powstaje w przestrzeni z niczego 
w ilości średnio: masa równoważna masie jednego 
atomu wodoru na jeden litr objętości na 5 • 10 11 lat. 

W ten sposób kosztem odstępstwa od zasady zacho¬ 
wania energii teoria Wszechświata stacjonarnego 
unika kłopotów kosmologii relatywistycznej związa¬ 
nych z występowaniem początkowej osobliwości. 

Relatywistyczną wersję teorii Wszechświata w sta¬ 
nie stacjonarnym stworzył F. Hoyle. Do einsteino- 
wskich równań pola wprowadził on wyrażenie opisu¬ 
jące tzw pole tworzenia materii. Rozwiązania tych 
równań dają modele kosmologiczne przedstawiające 
zasadniczo ten sam obraz Wszechświata, co model za¬ 
proponowany przez Bondiego i Golda. Wszystkie roz¬ 
wiązania Hoyle'a zmierzają asymptotycznie do roz¬ 
wiązania de Sittera, które — jak pamiętamy — przed¬ 
stawia świat stacjonarny. Wprowadzone do równań 
pole tworzenia materii sprawia, że rozwiązanie de 
Sittera nie opisuje teraz świata pustego. 

Odkrycie izotropowego promieniowania tła pod¬ 
ważyło teorię Wszechświata stacjonarnego, która — 
w swojej oryginalnej wersji — nie potrafiła wyjaśnić 
genezy tego promieniowania. Mimo prób uratowania 
tej teorii, czynionych zwłaszcza przez Hoyle ł a, opinia 
naukowców jest jej nadal nieprzychylna. 


Historia Wszechświata 

Dane obserwacyjne przedstawione w paragrafie: Ob¬ 
serwacyjne podstawy kosmologii (jednostajny rozkład 
gromad galaktyk, izotropowe promieniowanie tła 




o temperaturze 2,7 K) świadczą, że Wszechświat w obe¬ 
cnej chwili jest poprawnie opisywany przez któryś z 
modeli Friedmana. 

Wiele danych obserwacyjnych wskazuje na to, że 
świat jako całość podlega ewolucji; prześledźmy jego 
dzieje. W tym celu wykorzystamy modele Friedmana 
(ze stałą kosmologiczną równą zeru). Jak już wspo¬ 
mniano, różnice między trzema modelami Friedmana 
są istotne dopiero w późniejszych stadiach ewolucji. 
Przy cofaniu się wstecz w czasie modele te zmierzają 
do rozwiązania Einsteina-de Sittera. A zatem historia 
Wszechświata jest w przybliżeniu jednakowa dla 
wszystkich trzech modeli Friedmana. Najczęściej 
przeprowadza się obliczenia dla modelu Einsteina-de 
Sittera, gdyż jest on matematycznie najmniej skom¬ 
plikowany (ciśnienie, stała kosmologiczna oraz krzy¬ 
wizna przestrzenna są równe zeru). 

Obecna teoria mówi, że gdy promień Wszechświata 
9? zmierza do zera, to temperatura, ciśnienie i gęstość 
dążą do nieskończoności. Co było przedtem — pozo¬ 
staje wielką niewiadomą. Sądzi się, że przy pewnej 
krytycznej nadgęstości einsteinowska teoria grawi¬ 
tacji przestaje obowiązywać, gdyż zaczynają odgry¬ 
wać rolę kwantowe efekty grawitacji. W obecnych 
teoriach fizycznych istotną rolę odgrywają tzw. pod¬ 
stawowe stałe fizyczne, są to: c — prędkość światła, 
h — stała Plancka i G — newtonowska stała grawi¬ 
tacji, z których można zbudować wielkość o wymiarze 
gęstości: 

fikryt = = 5'10” g/cm 3 . 

Przypuszcza się, że powyżej tej krytycznej gęstości 
świat opisuje kosmologia kwantowa, której dotych¬ 
czas nie znamy. 

era Okres, w którym we Wszechświecie panowała gę- 
Planoka stość krytyczna nazywamy erą Plancka lub epoką 
progu (tabela: Ewolucja Wszechświata). Począwszy 
od tego progu słuszne są znane nam dziś prawa 
fizyki, a szczególnie einsteinowska teoria grawitacji. 
Wszechświat był wówczas wypełniony cząstkami 
elementarnymi, niezwykle stłoczonymi, odznaczają¬ 
cymi się ogromnymi energiami kinetycznymi. A po¬ 
nieważ miarą średniej energii kinetycznej jest tem¬ 
peratura, więc i temperatury panujące wówczas we 
Wszechświecie były niewyobrażalnie wielkie. Tak np. 
można obliczyć, że przy planckowskiej gęstości kry¬ 
tycznej musiały panować temperatury rzędu 10 33 K. 

Chwile następujące bezpośrednio po erze Plancka 
giną w mroku domysłów. Grawitony, czyli kwanty 
pola grawitacyjnego, bardzo słabo oddziałują z in¬ 


nymi cząstkami elementarnymi. Jednakże w ekstre¬ 
malnych warunkach gęstości i temperatur oddziały¬ 
wania takie musiały być znaczące. Czas ustalenia się 
równowagi termodynamicznej między grawitonami 
a innymi cząstkami elementarnymi był bardzo krótki 
i odpowiadał mniej więcej erze Plancka. Oznacza to, 
że zaraz po erze Plancka grawitony oddzieliły się od 
reszty gorącej materii i przestały z nią oddziaływać. 

Jeśli hipoteza ta jest słuszna, to we Wszechświecie do 
dziś powinno znajdować się tzw. tło grawitonowe. tło 
Detekcja grawitonów tła mogłaby, w zasadzie, przy- grawitonowe 
nieść empiryczne informacje o warunkach fizycznych 
panujących w pobliżu ery Plancka. Niestety, prak¬ 
tyczne przeprowadzenie tego obserwacyjnego testu 
wykracza daleko poza nasze obecne możliwości tech¬ 
niczne. 

Przy ogromnych gęstościach (o rzędy wyższych niż 
gęstość 10 14 g/cm 3 charakterystyczna dla materii 
wewnątrz jądra atomowego) i temperaturze ponad 
10 12 K o stanie materii decydowały przede wszyst¬ 
kim oddziaływania silne. Najważniejszym składni¬ 
kiem materii na tym etapie były cząstki silnie od¬ 
działujące— hadrony (bariony i mezony). Najroz¬ 
maitsze odmiany hadronów znajdowały się w równo¬ 
wadze termodynamicznej ze sobą, nie tylko te najbar¬ 
dziej trwałe, znane nam z wielu laboratoriów ziem¬ 
skich, jak nukleony, hiperony, piony, kaony, ale 
i wiele tak krótko żyjących (w warunkach laboraryj- 
nych), że być może jeszcze ich nie zdołaliśmy zaob¬ 
serwować. Poza cząstkami istniały w dużych ilościach 
antycząstki oraz promieniowanie. Nieustannie po¬ 
wstawały pary cząstka-antycząstka w wyniku oddzia¬ 
ływań promieniowania z innymi cząstkami, jednocze¬ 
śnie przebiegały procesy anihilacji par. 

Wraz z rozszerzaniem się Wszechświata zmniejszała 
się gęstość materii i temperatura oraz malała energia 
promieniowania. Warunki równowagi między wy¬ 
sokoenergetycznym promieniowaniem a parami ule¬ 
gały stopniowo zmianie na niekorzyść par, które po¬ 
wstawały coraz rzadziej z uwagi na malejącą energię 
kwantów promieniowania. Równowaga dynamiczna 
przesuwała się wyraźnie na korzyść procesów anihi¬ 
lacji. W końcu wszystkie pary barion-antybarion 
uległy anihilacji. Pozostały tylko te bariony, które 
nie miały z czym zanihilować. Erę powyższą, zwaną 
erą hadronową, trwającą ok. 10“ 4 s, aż do ustalenia 
się gęstości rzędu 10 14 g/cm 3 i temperatury rzędu era 
10 12 K, przeżyć mogły tylko najtrwalsze hadrony: hadronowa 
proton p i neutron n. Obok nich pozostały jeszcze 
leptony, które poprzednio stanowiły nic nie znaczącą 
domieszkę, obecnie wysunęły się na pierwsze miejsce. 


Ewolucja Wszechświata 


Czas 

Gęstość 

g/cm* 

Tempe¬ 
ratura, K 

Procesy fizyczne 

Co pozostało do dziś? 

7 

? 

? 

Kosmologia kwantowa 


Era Planoka 

10-** s 

Era hadronowa 

10»* 

10” 

Oddzielenie się grawitonów (?) 

plazma w równowadze termodynamicznej (nukleony- 

tło grawitonowe (?) 




antynukleony, mezony-antymezony, elektrony-pozytony, 
ncutrina-antyneutrina, kwarki-antykwarki (?)) 
anihilacja pionów-antypionów (mezonów n) 

nukleony 

10-*s 

Era lcptonowa 

10” 

10” 

anihilacja mionów-antymionów (mezonów pi) 
elektrony-pozytony, neutrina-antyneutrina w równowadze 
oddzielenie się neutrin 
anihilacja elektronów-pozytonów 

tło neutrinowe 

10 s 

Era promienista 

10* 

10” 

plazma i promieniowanie w równowadze 
synteza helu i lekkich pierwiastków aż do litu 

hel, lekkie pierwiastki 




rekombinacja wodoru i oddzielenie się promieniowania 

wodór, promieniowanie 




(fotonów) 

tla 

10* lat 

Era galaktyczna 

io- łl 

3000 

powstanie galaktyk 

galaktyki 




powstanie gwiazd 

gwiazdy 




synteza reszty pierwiastków chemicznych 
we wnętrzach masywnych gwiazd 

pierwiastki chemiczne 




powstanie planet i Ziemi 

planety, Ziemia 

10” lat 

io-”-io- 2 * 

2,7 

powstanie życia na Ziemi — kosmiczne „teraz’ * 

życie, człowiek 
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Stąd też nazwa następnej ery: era leptonowa. W tem¬ 
peraturach między 10 12 i 10 10 K (podajemy je w ko¬ 
lejności, w jakiej następowały w czasie po sobie) ma- 
era teria obok nukleonów (p i n ) składała się z leptonów 
leptonowa j ich antycząstek (obecnie znamy ich cztery, ale 
być może istnieje ich sześć lub więcej). Były więc 
pary elektron-pozyton, obok nich dwa ro¬ 

dzaje neutrin i dwa rodzaje antyneutrin oraz fotony. 
Wraz z postępującą ekspansją Wszechświata spadała 
temperatura i gęstość, pary ulegały anihilacji, w końcu 
erę leptonową przetrwały tylko elektrony oraz pro¬ 
mieniowanie. (Przypominamy, że promieniowaniem 
zwykło się nazywać cząstki o zerowej masie spoczyn¬ 
kowej; zalicza się więc do niego promieniowanie 
elektromagnetyczne, jak również neutrina v e > i ich 
antycząstki >v, v u ). Miony, ze średnim czasem zaniku 
rzędu 10" 6 , nie miały większej szansy na przeżycie 
ery leptonowej, trwającej zaledwie ok. 10 sekund. 

Podczas ery leptonowej — w chwili, którą ozna¬ 
czmy / + + —neutrina przestały niemal oddziaływać 
z resztą materii; jako wartość krytyczną temperatury 
poniżej której nastąpiło oddzielenie się neutrin od 
reszty materii przyjmuje się 2- 10 ł0 K. Począwszy od 
chwili, gdy temperatura ta została osiągnięta, plazma 
(złożona przede wszystkim z elektronów, protonów 
i neutronów) jest dla neutrin całkiem przezroczysta. 
Gdyby się nam udało zaobserwować te pierwotne 
neutrina, tworzące tzw. promieniowanie neutrinowe 
tła, to otrzymalibyśmy informację z chwili ostatniego 
ich oddziaływania z materią, tj. o stanie Wszechświata 
w chwili/ + + . Chociaż detekcja tła neutrinowego jest 
teoretycznie łatwiejsza od obserwacyjnego wykrycia 
tła grawitonowego, i ona obecnie leży poza naszymi 
praktycznymi możliwościami. 

Gdy zakończyła się przewaga leptonów, podobnie 
jak przewaga barionów w poprzedniej erze, zaczyna 
. . era się następna era, zwana erą promienistą. Największy 
promienista wkład do gęstości materii (i energii) na początku 
tej ery wnoszą cząstki promieniowania: fotony, 
neutrina, antyneutrina. Ale zgodnie z teorią względ¬ 
ności gęstość energii związanej z cząstkami o zerowej 
masie spoczynkowej maleje ze wzrostem czynnika 
skali 92 jak 92 " 4 , gęstość zaś energii związanej z czą¬ 
stkami o niezerowej masie spoczynkowej (takich jak 
c, p , n) maleje jak 92~ 3 (por. wzory (9) i (10)). Stąd też z 
upływem czasu gęstość promieniowania zmniejsza się 
szybciej niż gęstość materii korpuskulamej. Wresz¬ 
cie — pod koniec ery promienistej — wkład od pro¬ 
mieniowania do całkowitej gęstości energii jest już 
do pominięcia. Wraz z ekspansją Wszechświata oraz 
jego stygnięciem, podczas ery promienistej, maleje 
średnia energia fotonów. Dopóki była ona większa 
od energii wiązania najlżejszego jądra atomówego, 
deuteronu (p+n) y równej 2,2 MeV, nie mogły tworzyć 
się oddzielne jądra atomowe z gęstego gazu nukleo¬ 
nów. Gdy tylko powstał jakiś deuteron, natychmiast 
trafiał weń foton i rozbijał go z powrotem na neutron 
i proton. Dopiero gdy średnia energia fotonu spadła 
poniżej 1 MeV, deuterony stały się trwałe. Mogły 
one jednocześnie reagować z sobą, tworząc dalsze 
jądra, np. 2 2 D -*» 4 He-{-y, a także wychwytywać 
obecne wciąż jeszcze protony i neutrony. Tworzyły 
się pierwsze jądra atomowe, aż do litu włącznie. 

Gdy gęstość materii promienistej stała się równa 
gęstości materii korpuskulamej, temperatura ośrodka 
era wypełniającego Wszechświat wynosiła 3000-30 000 K 
galaktyczna (trudno nam dziś jeszcze podać jej wartość z większą 
dokładnością); było to jeszcze podczas ery promie¬ 
nistej. Wciąż jeszcze nie istniały atomy, jedynie jądra 
atomowe (wodoru, helu i litu) oraz swobodne elek¬ 
trony. Dopiero w temperaturach poniżej 3000 K 
wodór ulega rekombinacji, kończy się okres, podczas 
którego promieniowanie elektromagnetyczne ulegało 
łatwo rozpraszaniu thompsonowskiemu na elektro¬ 
nach swobodnych. Materia staje się plazmą nieprze¬ 
zroczystą dla pozostającego z nią w równowadze (do 
tej chwili!) promieniowania elektromagnetycznego. 
Promieniowanie to oddziela się od materii korpusku- 
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larnej i niemal przestaje z nią oddziaływać. Ma to 
doniosłe konsekwencje obserwacyjne. Promieniowa¬ 
nie tła, jakie dziś obserwujemy (porównaj paragraf: 
Obserwacyjne podstawy kosmologii), jest źródłem 
informacji o stanie świata w okresie, gdy fotony tego 
promieniowania po raz ostatni oddziaływały z ma¬ 
terią korpuskularną, a więc o stanie świata w pewnej 
chwili t + . Obserwatorzy nazywają stan świata w chwi¬ 
li / + powierzchnią ostatniego oddziaływania (pro¬ 
mieniowania z materią korpuskularną). 

Dopiero gdy gęstość energii promieniowania jest 
znacznie mniejsza od gęstości materii korpuskulamej, 
mogą się tworzyć lokalne zagęszczenia materii. 
Ciśnienie promieniowania nie spowoduje już ich na¬ 
tychmiastowego rozbicia. Z zagęszczeń tych mogą 
się tworzyć galaktyki, z mniejszych zagęszczeń ma¬ 
terii w tych ostatnich — gwiazdy. Nastaje era gwia¬ 
zdowa, zwana też erą galaktyczną. Era ta trwa do 
dziś. 


Fizyka w pobliżu osobliwości 

Współczesna kosmologia daje teoretycznie zadowa¬ 
lający obraz ewolucji Wszechświata począwszy od ery 
Plancka. Ale co było przedtem? Początkowa osobli¬ 
wość nakłada ograniczenia na nasze możliwości ba- osobliwość 
dawcze. Dlatego też podejmuje się liczne próby zbu- początkowa 
dowania modelu kosmologicznego bez początkowej 
osobliwości. Teoretycznie można to zrobić wprowa¬ 
dzając do równań pewne nowe elementy (np. tzw. 
spin makroskopowy, lepkość objętościową), jednakże 
oznacza to odejście od pierwotnych — logicznie naj¬ 
prostszych — równań Einsteina i powoduje nowe 
trudności interpretacyjne. S. W. Hawking, R. Penrose 
i R. Geroch udowodnili szereg twierdzeń, z których 
wynika, że przy realistycznych założeniach fizycznych 
równania Einsteina z reguły prowadzą do osobliwości, 
takich jak osobliwość początkowa w kosmologii. 

Ponadto, przyjmowana obecnie interpretacja pro¬ 
mieniowania tła jest silnym argumentem przemawia¬ 
jącym za tym, że świat u początku swojej obecnej 
ewolucji przechodził przez stan nadgęsty, który 
z punktu widzenia naszej dzisiejszej wiedzy fizycznej 
na pewno zasługuje na miano „osobliwego”. 

Znamy dziś wiele modeli kosmologicznych, które 
mogą opisywać historię Wszechświata w nadgęstych 
stanach bliskich osobliwości. Wszystkie one — z wy¬ 
jątkiem tylko „nielicznych” — przedstawiają światy 
anizotropowe. Kosmologowie zwykli mawiać, że w 
zbiorze wszystkich możliwych modeli kosmologicz¬ 
nych modele jednorodne i izotropowe są podzbiorem 
miary zero. Powstaje pytanie: dlaczego właśnie któryś 
z tych nielicznych, a więc mało prawdopodobnych 
modeli, w dobrym przybliżeniu opisuje rzeczywisty 
świat? Wydaje się, że istnieją dwie możliwe odpowie¬ 
dzi na to pytanie, pierwsza: świat od początku jest 
opisywany przez jednorodny i izotropowy model i nie 
należy zadawać pytania, dlaczego akurat przez taki 
model a nie inny; druga: w stanach bliskich osobli¬ 
wości świat był chaotyczny, niejednorodny i nieizo- 
tropowy, dopiero wskutek pewnych procesów fizycz¬ 
nych stosunkowo szybko nastąpił proces wyrówny- friedmaniza- 
wania się niejednorodności i izotropizacji świata cja świata 
(w związku z tym przyjęło się mówić o friedmanizacji 
świata). 

Z obserwacji promieniowania tła wiadomo, że 
świat jest izotropowy przynajmniej od chwili / + . 

Można obliczyć, że jeżeli chwili tej odpowiada z ^ 7, 
to fotony promieniowania tła, jakie rejestrujemy obec¬ 
nie z kierunków na sferze niebieskiej różnych co 
najmniej o 30°, w chwili / + znajdowały się w obszarach 
czasoprzestrzeni fizycznie całkowicie odizolowanych 
od siebie. Aby jakikolwiek sygnał mógł przeniknąć 
z jednego takiego obszaru do drugiego, musiałby się 
poruszać z prędkością większą od prędkości światła. 

A zatem żaden proces fizyczny nie mógł doprowadzić 
do wyrównania się temperatur w obu tych obszarach. 
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co z kolei jest niezbędne, by Wszechświat mógł stać 
się w przybliżeniu friedmanowski. 

Aby pokonać tę trudność, C. W. Misner skonstru¬ 
ował modele kosmologiczne z tzw. wielkim miesza¬ 
niem. Są to anizotropowe modele kosmologiczne ma¬ 
jące zamknięte przestrzenie chwilowe. Proces mie¬ 
szania polega na tym, że we wczesnych stadiach ewo¬ 
lucji promień światła zdąży kilkakrotnie obiec świat 
dookoła, dzięki temu nie ma izolowanych od siebie 
obszarów czasoprzestrzeni i występuje zjawisko wy¬ 
gładzania się Wszechświata. 

Okazało się jednak, że w zbiorze wszystkich mo¬ 
deli kosmologicznych podzbiór modeli z wielkim 
mieszaniem jest także bardzo mały i pytanie, dlaczego 
świat jest jednorodny i izotropowy, pozostaje otwarte. 
Misner zaproponował więc inny mechanizm wygła¬ 
dzania się nierównomiemości Wszechświata. 

Anizotropowa ekspansja Wszechświata powoduje 
występowanie zjawiska lepkości (tarcia sąsiednich 
warstw materii rozszerzającej się z różnymi prędko¬ 
ściami), które z kolei działa wygładzająco. Duży 
wkład do tego procesu mogła dawać lepkość powo¬ 
dowana przez oddziaływanie neutrin z elektronami 
w temperaturze ponad 10 10 K, w stanach bardzo 
bliskich osobliwości. 

Modele anizotropowe jeszcze z innego powodu oka¬ 
zały się przydatne do opisu świata w pobliżu osobli¬ 
wości-J. B. Zeldowicz i A. A. Starobiński wykazali, że 
wskutek działania efektów kwantowych w bardzo 
wczesnych stadiach ewolucji anizotropowych modeli 
kosmologicznych następuje intensywne tworzenie się 
cząstek elementarnych z krzywizny czasoprzestrzeni. 
Mówiąc obrazowo, krzywizna czasoprzestrzeni odpo¬ 
wiada pewnej energii pola grawitacyjnego. Przy bar¬ 
dzo wielkich krzywiznach w pobliżu osobliwości ener¬ 
gia ta może przetwarzać się w cząstki. W modelach 
izotropowych, w zasadzie, proces ten nie występuje. 
Powstawanie cząstek z silnie zakrzywionej czasoprze¬ 
strzeni jest również źródłem pewnego rodzaju lepkości, 
bardzo silnie wygładzającej pierwotną anizotropię 
Wszechświata. W pobliżu osobliwości gęstość energii 
pochodząca od cząstek wypełniających Wszechświat 
nie ma żadnego wpływu na przebieg jego ewolucji, 
dominującą rolę odgrywa krzywizna czasoprzestrzeni 
(okres ten nazywa się stadium próżniowym); z czasem 
jednak gęstość energii, pochodząca od cząstek po¬ 
wstających z próżni, wzrasta i całkowicie determinuje 
dynamikę ekspansji Wszechświata. Jak piszą C. W. 
Misner, K. S. Thorne i J. A. Wheeler, „być może ani¬ 
zotropia stworzyła materialną zawartość naszego 
Wszechświata, sama przy tym ulegając wygładzeniu”. 


Parametr q określa krzywiznę wykresu 92 = 92(/). 
Jeżeli q jest dodatnie, tempo ekspansji maleje z cza¬ 
sem. Wyznaczenie q 0 jednoznacznie wybiera jeden 
z modeli Friedmana. Przedstawia to tabela: 


Modele Friedmana 



Model Friedmana wy¬ 

<ło 

pełniony materią pyłową 


(P = 0) 

< 1/2 

otwarty, k = — 1 

- 1/2 

płaski, k = 0 

> 1/2 

zamknięty, k =» + 1 


Na podstawie każdego modelu kosmologicznego 
można przewidywać wartości liczbowe różnych wiel¬ 
kości obserwowanych. Wymienimy dla przykładu 
kilka takich wielkości: 

(a) przesunięcie ku czerw-ieni w widmach galaktyk; 

( b) liczba obiektów' (galaktyk, radioźródeł) wi¬ 
dzialnych aż do pewnej odległości; 

(c) średnice kątowe obiektów astronomicznych; 

(d) jasność obiektu (mierzona w tzw. wielkościach 



Rys. 14. Odwrotność stałej Hubblc’a T 6 oznacza wiek Wszech¬ 
świata, czyli okres od początku ekspansji / = 0 aż do chwili 
obecnej przy założeniu że ekspansja zawsze odbywała się 
z jednostajną prędkością. W rzeczywistości ekspansja nie mu¬ 
siała być jednostajna 


Testowanie modeli kosmologicznych 

Testowanie modeli kosmologicznych jest odrębnym 
działem kosmologii, który bardzo silnie wiąże ją 
z astronomią pozagalaktyczną. Przedstawimy tu tylko 
samą zasadę testowania. Dla uproszczenia ograniczy¬ 
my się do modeli Friedmana, przyjmując, że stała 
kosmologiczna jest równa zeru. 

W testowaniu modeli ważną rolę odgrywają na¬ 
stępujące wielkości: a) średnia gęstość materii we 
Wszechświecie q ; b) stała Hubble*a H — (d^/dt)/^; 

92 W 2C RJdt 2 ) 

c) parametr hamowania (deceleracji) q = * 

Wartości tych parametrów dla obecnej epoki można 
wyznaczyć obserwacyjnie (oznaczać je będziemy in¬ 
deksem zero). 

Gdyby Wszechświat zawsze rozszerzał się dokład¬ 
nie według prawa Hubble’a (równanie 1), to odwrot¬ 
ność stałej Hubble ł a T 0 = 1/H 0 określałaby wiek 
Wszechświata, tzn. okres czasu, jaki upłynął od po¬ 
czątkowej osobliwości do chwili obecnej. W ogólniej¬ 
szym przypadku, gdy rozszerzanie się Wszechświata 
nie odbywa się dokładnie według prawa Hubb!e*a, 
wiek Wszechświata może być mniejszy od T 0 (rys. 14). 



Rys. 15. Zależność przesunięcia ku czerwieni (z) od wielkości 
gwiazdowej (mi); wykres: a — f(d) 
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wieku 

Wszech¬ 
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gwiazdowych) przyjęta jest za miarę jego odległości: 
im obiekt jest bardziej odległy, tym jego jasność wi¬ 
dzialna jest mniejsza. 

Ponieważ wielkości te nie są na ogół niezależne, 
między wieloma ich parami można określić zależności 
funkcyjne: a=f{d ), c = g(a) itp. Różne modele 
prowadzą do różnych postaci takich funkcji — po¬ 
równanie krzywych teoretycznych z wynikami obser¬ 
wacji daje możliwość wyboru tego modelu (lub tej kla¬ 
sy modeli), który najlepiej zgadza się z danymi obser¬ 
wacyjnymi. Przykłady takich „wykresów testujących” 
(w uproszczeniu) przedstawiają rys. 15, 16 i 17. 

Obserwacyjnych danych potrzebnych do testowania 
dostarcza radioastronomia i astronomia pozagalak- 
tyczna. Precyzja współczesnych obserwacji znajduje 
się na granicy dokładności potrzebnej do testowania. 
W najbliższych dziesiątkach lat — zwłaszcza dzięki 
możliwości przeprowadzania obserwacji poza atmo¬ 
sferą ziemską — należy się spodziewać napływu cie¬ 
kawych informacji. Niezbędny jest także postęp teorii. 
Dziś znacznie więcej wiemy o zależnościach między 
wielkościami dającymi się obserwować, niż o ewolucji 
obiektów, na których przeprowadza się testowanie 
(galaktyk, ich gromad, radioźródeł, kwazarów). Tym¬ 
czasem uwzględnienie efektów ewolucyjnych tych 
obiektów może istotnie zmienić „krzywe testujące” 
w różnych modelach kosmologicznych. 

Dotychczas najskuteczniejszym testem obserwacyj¬ 
nym okazało się odkrycie i zbadanie własności izo¬ 
tropowego promieniowania tła. Istnienie tego promie¬ 
niowania — przy obecnej jegó interpretacji — dowo¬ 
dzi, że nasz świat przynajmniej od epoki / + jest świa¬ 
tem Friedmana — lub prawie friedmanowskim (tzn. 
z dobrą dokładnością jednorodnym i izotropowym) — 
ze stanem nadgęstym u początków swojej ewolucji. 

H. Bondi Kosmologia, Warszawa 1965; H. Bondi Wszech¬ 
świat nieznany. Warszawa 1964; M. Heller Początek świata, 
Kraków 1976; M. Heller Wobec Wszechświata , Kraków 1971; 
D. W. Sciama Kosmologia współczesna, Warszawa 1975; J. B. Zel- 
dowicz, I. D. Nowikow Strojenije i ewolucyja wsielennoj, Mo¬ 
skwa 1975; W. Zonn Kosmologia współczesna. Warszawa 1968. 


Antymateria we Wszechświecie 

Marcin Kubiak 

Z punktu widzenia fizyki współczesnej nie ma zasad¬ 
niczej różnicy między cząstkami i antycząstkami. 

Antycząstki doskonale mieszczą się w schematach 
teoretycznych i obficie występują w laboratoriach. 

Istnienie antycząstek jest przejawem spełnienia przez 
przyrodę pewnych ogólnych praw symetrii (-* Cząstki 
elementarne i ich oddziaływania), które w wypadku 
cząstek trwałych, takich jak elektrony, protony i neu¬ 
trony, sprowadzają się do prawa symetrii ładunkowej. 

Zgodnie z tym prawem, równie prawdopodobne jest 
istnienie elektronu o ładunku ujemnym jak i elektronu 
o ładunku dodatnim (pozytonu). Podobnie proton 
może być nośnikiem zarówno ładunku dodatniego 
(zwykły proton) jak i ujemnego (antyproton). Makro¬ 
skopowe własności materii zbudowanej z antycząstek, 
czyli tzw. antymaterii powinny być identyczne z wła¬ 
snościami materii zbudowanej ze zwykłych cząstek 
elementarnych (dla której szwedzki fizyk H. Alfvćn 
koinomateria zaproponował nazwę koinomaterii, od greckiego sło- 
a antymateria wa koinos oznaczającego rzecz dobrze znaną). Atomy 
antymaterii różniłyby się od atomów materii tylko 
tym, że ich jądra miałyby ujemne ładunki, zobojętnio¬ 
ne przez powłokę dodatnio naładowanych pozyto¬ 
nów. Poza tym wszystkie ich własności fizyczne i che¬ 
miczne byłyby takie same jak zwykłych atomów; anty- 
atomy wysyłałyby np. dokładnie takie same linie wid¬ 
mowe i wchodziłyby w identyczne reakcje chemiczne 
jak zwykłe atomy. 

Lokalnie w sposób trwały może istnieć tylko jeden 
rodzaj materii: spotykające się ze sobą cząstki i anty- 
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cząstki tego samego rodzaju ulegają niemal natych- anihilacja 
miastowej anihilacji, polegającej na zamianie całej materii 
masy obu cząstek (oraz ich łącznej energii kinetycznej * antymaterii 
przed spotkaniem) w energię fotonów promieniowania 
elektromagnetycznego. Materia i antymateria nie 
mogą istnieć obok siebie. Na Ziemi antycząstki poja¬ 
wiają się tylko w bardzo szczególnych okolicznościach 
i żyją do pierwszego spotkania z odpowiednią cząstką 
materii, wraz z którą ulegają anihilacji. Podobny los 
byłby udziałem cząstki naszej materii, która znalazła¬ 
by się w otoczeniu zbudowanym z antymaterii. 

Stwierdzenie pełnej symetrii właściwości materii 
i antymaterii w skali mikroskopowej nasuwa w sposób 
naturalny pytanie, czy symetria ta jest również spełnio- zasada 
na w skali całego Wszechświata, tzn. czy oba jej ro- symetrii 
dzaje występują w nim w jednakowych ilościach, czy materii 
też jest on zdominowany przez jeden tylko rodzaj ma- i antymaterii 
terii. Gdyby okazało się, że cały Wszechświat jest 
zbudowany z jednego rodzaju materii, wówczas nale¬ 
żałoby wyjaśnić, dlaczego przyroda — mając do wy¬ 
boru dwa identyczne rodzaje materii — wybrała tylko 
jeden. Uznanie tego za przypadek byłoby oczywiście 
tylko pozornym wyjaśnieniem; wybór jednego rodza¬ 
ju materii oznaczałby raczej, że własności materii 
i antymaterii nie są tak dokładnie symetryczne jak to 
sobie obecnie wyobrażamy. 

Przy teraźniejszym stanie naszej wiedzy o materii, 
założenie pełnej równoważności materii i antymaterii 
wydaje się bardziej atrakcyjne, zwłaszcza z filozoficz¬ 
nego punktu widzenia, i dlatego warto jest zastanowić 



Rys. 16. Zależność liczby galaktyk N(nu) widzialnych aż do wiel¬ 
kości gwiazdowej m* od danej wielkości gwiazdowej (wykres: 
b - Kd)) 



Rys. 17. Zależność średnic kątowych Q galaktyk od przesunięcia 
ku czerwieni z (wykres: c ** g(a)). 









się przez chwilę nad płynącymi z niego konsekwencja¬ 
mi kosmologicznymi. Warunek symetrii materii i anty¬ 
materii we Wszechświecie może być spełniony w różny 
sposób. Wprawdzie materia i antymateria nie mogą 
istnieć w bezpośrednim sąsiedztwie, ale możemy przy¬ 
jąć, że: 

a) antymateria istnieje w odległych obszarach 
Wszechświata, których nie możemy obserwować, na¬ 
tomiast nasza Metagalaktyka ( > Galaktyki), czyli 
część Wszechświata dostępna obserwacjom, jest zbu¬ 
dowana z materii, 

b) antymateria istnieje również w Metagalaktyce, 
np. średnio co druga galaktyka jest zbudowana z anty¬ 
materii, 

c) antymateria istnieje w obrębie każdej galaktyki, 
tzn. średnio co druga gwiazda jest zbudowana z anty¬ 
materii. 

metody Obecnie brak jest jakichkolwiek danych obserwa- 
rozróżniania cyjnych na temat ewentualnego istnienia lub braku 
materii od antymaterii w obserwowanej przez nas części Wszech- 
antymaterii świata. Wyda się to może zaskakujące, ale nie jesteś¬ 
my w stanie jednoznacznie stwierdzić nawet tego, czy 
najbliższa nas gwiazda, Proxima Centauri, jest zbudo¬ 
wana z materii czy z antymaterii. Zastanówmy się bo¬ 
wiem w jaki sposób moglibyśmy na odległość odróż¬ 
nić gwiazdę zbudowaną z materii od gwiazdy zbudo¬ 
wanej z antymaterii. Teoretycznie możliwe są dwa 
sposoby. Po pierwsze, moglibyśmy starać się wyko¬ 
rzystać zjawisko Zeemana w widmach gwiazd mają¬ 
cych silne pole magnetyczne: atomy materii i anty¬ 
materii, których ładunki są nawzajem wymienione, 
różnie reagują na obecność sił magnetycznych (i elek¬ 
trycznych). Mówiąc dokładniej, obraz rozszczepienia 
zeemanowskiego linii widmowych wysyłanych przez 
antyatomy znajdujące się w polu magnetycznym 
o danym kierunku jest taki, jak obraz rozszczepienia 
zeemanowskiego linii wysyłanych przez zwykłe atomy 
znajdujące się w polu magnetycznym o przeciwnym 
kierunku. Gdybyśmy więc znali kierunek pola magne¬ 
tycznego, moglibyśmy bez trudu stwierdzić, czy pro¬ 
mieniujące atomy są zbudowane z materii, czy z anty¬ 
materii. Niestety, obecnie nie znamy żadnych metod 
określania kierunku pola magnetycznego gwiazd, 
a tym samym nie potrafimy odróżnić namagnetyzowa- 
nej antymaterii od materii namagnetyzowanej w kie¬ 
runku przeciwnym. 

Inną możliwość odróżnienia gwiazd zbudowanych 
z materii i antymaterii mogłyby dać obserwacje stru- 
mir* ■»- m ^ eri * a neutrin opuszczających — jak się powszechnie 
p ^ sądzi — wnętrza gwiazd, w których przebiegają reak- 
neutr c J e Jarowe przemiany wodoru w hel ( > Ewolucja 

gwiazd). Reakcjom tym towarzyszy emisja pewnej licz¬ 
by neutrin, które ze względu na bardzo mały przekrój 
czynny na oddziaływanie z materią bez trudu opusz¬ 
czają miejsce swego pow-stania i swobodnie przebie¬ 
gają ogromne przestrzenie Wszechświata. Oczywiście, 
reakcje takie przebiegające między atomami antyma¬ 
terii byłyby źródłem strumienia antyneutrin. Chociaż 
laboratoryjne odróżnienie neutrina od antyneutrina 
nie nastręcza obecnie większych trudności, to jednak 
obie te cząstki są tak bardzo „nieuchwytne”, że do-, 
tychczas nie udało się nawet uzyskać jednoznacznych 
informacji na temat strumienia neutrin słonecznych; 
tym mniejsze są też nadzieje na zbudowanie w niedale¬ 
kiej przyszłości znacznie czulszego „neutrinowego te¬ 
leskopu gwiazdowego”. 

Tak więc, obecność antymaterii możemy stwierdzić 
tylko wówczas, gdy wchodzi ona w bezpośredni kon- 
anihilacja z maten 3 * ulega anihilacji. Dzięki tej własności 
antymaterii.możemy wykluczyć istnienie większych 
jej skupisk w Układzie Słonecznym, którego niemal 
cała objętość jest wypełniona rozrzedzonym obłokiem 
materii opuszczającej Słońce w postaci tzw. wiatru 
słonecznego (-> Promieniowanie kosmiczne). Gdyby 
cząstki wiatru słonecznego były innego rodzaju niż 
cząstki tworzące planety, wówczas obszar spotkania 
się materii słonecznej z materią planetarną byłby sil¬ 
nym źródłem promieniowania ( Astronomia pro¬ 


mieni X i y) pochodzącego z anihilacji. W Układzie 
Słonecznym źródeł takich jednak nie obserwujemy. 

Z podobnych powodów możemy uznać za mało 
prawdopodobne, by nasza Galaktyka zawierała dużą 
liczbę gwiazd zbudowanych z antymaterii. W tym wy¬ 
padku należałoby oczekiwać anihilacji materii gwiaz¬ 
dowej z otaczającą materią rozproszoną, chociaż samo 
zjawisko przebiegałoby w sposób nieco bardziej zło¬ 
żony i nasze wnioski nie byłyby tak jednoznaczne. 

W warunkach panujących w Galaktyce najprawdo¬ 
podobniejsze jest oddziaływanie na siebie materii 
w stanie rozproszonym. Zetknięcie się ze sobą dwu 
gwiazd (prowadzące w przypadku spotkania się 
gwiazdy zbudowanej z materii z gwiazdą zbudowaną 
z antymaterii do gwałtownej eksplozji o niespotyka¬ 
nej sile) jest wydarzeniem niezwykle mało prawdopo¬ 
dobnym ze względu na małe rozmiary gwiazd w po¬ 
równaniu z ich średnimi odległościami. Znacznie bar¬ 
dziej prawdopodobne jest zetknięcie się ze sobą dwóch 
obłoków materii rozproszonej, przy czym jeden z nich 
może być związany z gwiazdą, np. jako obłok stano¬ 
wiący pozostałość po obłoku materii, z którego po¬ 
wstała gwiazda, lub jako obłok materii wyrzuconej 
z gwiazdy w postaci wiatru gwiazdowego. Z reguły, 
obłoki materii międzygwiazdowej, jak również rozrze¬ 
dzone obłoki materii okołogwiazdowej, są przeniknię¬ 
te słabym polem magnetycznym (np. wiatr słoneczny 
unosi ze sobą nie tylko zjonizowaną materię słonecz¬ 
ną, ale również „wmrożone” w nią pole magnetycz¬ 
ne). Nie tracąc więc nic z ogólności rozważań, może- zderzenie 
my wziąć pod uwagę zderzenie dwóch obłoków roz- obłoków 
rzedzonej materii w obecności pola magnetycznego. materii i 

Zderzenie, o którym mowa, jest przedstawione antymaterii 
schematycznie na rys. 1. W miarę zbliżania się obło¬ 
ków ku sobie, w obszarze ich zetknięcia utworzy się 
warstwa graniczna, w której będą przebiegać procesy 



Rys. 1. Warstwa graniczna powstająca podczas zderzenia się 
obłoków rozrzedzonej materii i antymaterii jest źródłem promie¬ 
niowania neutrinowego, promieniowania y i promieniowania ra¬ 
diowego 

anihilacji. Ponieważ materia we Wszechświecie składa 
się na ogół z wodoru, wystarczy rozważyć tylko ani- 
hilację par elektron-pozyton i proton-antyproton. 

Anihilacja pary elektron-pozyton polega na beżpo- anihilacja 
średniej zamianie masy spoczynkowej (i energii kine- pary 
tycznej) obu cząstek w dwa lub trzy fotony y o łącznej elektron- 
energii ok. 1 MeV (w wypadku zderzenia dwóch obło- pozyton 
ków materii międzygwiazdowej możemy pominąć 
energię kinetyczną cząstek przed zderzeniem). Fotony 
te bez przeszkód opuszczają miejsce pow-stania i do¬ 
dają się do ogólnego tła promieniowania elektroma¬ 
gnetycznego we Wszechświecie. 
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Anihilacja pary proton-antyproton jest zjawiskiem 
nieco bardziej złożonym (rys. 2). Pierwszym produk¬ 
tem anihilacji są głównie mezony rr, które za pośred¬ 
nictwem mezonów // rozpadają się ostatecznie na 
elektrony i pozytony. Bilans energetyczny całej reakcji 
przedstawia się następująco: z 1800 MeV energii 
odpowiadającej masie spoczynkowej pary proton-an¬ 
typroton, 900 MeV unoszą neutrina i antyneutrina, 
600 MeV unoszą kwanty y, a 300 MeV przypada 
na energię kinetyczną elektronów i pozytonów (ich 
masa spoczynkowa odpowiadająca energii ok. 1 MeV 
jest w tym wypadku całkowicie do pominięcia). 
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Neutrina, antyneutrina oraz kwanty y opuszczają 
bez przeszkód miejsce anihilacji, natomiast elektrony 
i pozytony, jako cząstki obdarzone ładunkiem elek¬ 
trycznym, zakreślają spirale wokół linii pola magnety¬ 
cznego, które nie pozwala im oddalić się zbytnio od 
miejsca powstania. Przy energiach rzędu 150 MeV i 
przy natężeniach pola rzędu 10~® T (typowa wartość 
natężenia kosmicznych pól magnetycznych) rozmiary 
spirali są rzędu 10 11 m, czyli ok. 10“ 5 roku świetlnego, 
co w skali kosmicznej jest odległością bardzo małą. 
Pojawienie się cząstek o dużych energiach kinetycz¬ 
nych prowadzi do szybkiego wzrostu temperatury 
gazu w warstwie granicznej. Wzrost temperatury po¬ 
ciąga za sobą wzrost ciśnienia, które doprowadza do 
rozdzielenia obszarów zajmowanych przez materię 
i antymaterię, a tym samym do zmniejszenia tempa 
anihilacji. Zderzenie obłoku materii z obłokiem anty¬ 
materii jest więc zjawiskiem przebiegającym stosun¬ 
kowo spokojnie i wbrew oczekiwaniom nie prowadzi 
do wydzielania się ogromnych — przynajmniej w 
skali kosmicznej — ilości energii. 

Warstwa graniczna, chociaż cienka (jej rozmiary 
są określone przez promienie torów zakreślanych 
przez elektrony i pozytony w polu magnetycznym), 
jest jednak źródłem promieniowania, które mogli¬ 
byśmy starać się wykryć na drodze obserwacji. Jak 
wynika z podanego wyżej bilansu energii, ok. połowa 
energii anihilacji par proton-antyproton jest uno¬ 
szona przez neutrina, jedna trzecia — przez promie¬ 
niowanie y i co najwyżej jedna szósta pozostaje na 
miejscu w postaci energii kinetycznej elektronów 
i pozytonów. Elektrony i pozytony poruszające się 
w polu magnetycznym wysyłają tzw. promieniowanie 
synchrotronowe, tak więc pewna część ich energii 
kinetycznej może również opuścić obszar anihilacji 
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w postaci promieniowania radiowego. Przy obecnym 
stanie techniki obserwacyjnej wykrycie strumienia 
neutrin pochodzących z przeciętnej warstwy granicz¬ 
nej w naszej Galaktyce jest zupełnie niemożliwe. 
Podjęte stosunkowo niedawno obserwacje kosmicz¬ 
nego promieniowania y pozwoliły, co prawda, na 
wykrycie ogólnego tła galaktycznego, ale są jeszcze 
zbyt mało dokładne, by dostarczyć jakichkolwiek 
informacji na temat ewentualnych warstw granicz¬ 
nych w naszej Galaktyce. Jedyne nadzieje można by 
w tej sytuacji wiązać z obserwacjami radiowymi, 
jednak z bardziej szczegółowych obliczeń natężenia 
promieniowania radiowego typowych warstw gra¬ 
nicznych wynika, że warstwy te są zbyt słabymi 
radioźródłami, by mogły być wykryte przez dzisiejsze 
radioteleskopy. Zresztą samo zaobserwowanie źródła 
promieniowania synchrotronowego (a źródeł takich 
znamy dość dużo) nie jest jeszcze dowodem, że pro¬ 
mieniowanie to jest związane z anihilacją materii 
i antymaterii. 

Przeciwko istnieniu antymaterii w Galaktyce prze¬ 
mawia również fakt, że w pierwotnym promienio¬ 
waniu kosmicznym nie udało się wykryć złożonych 
antyjąder. Domieszka takich antycząstek jak anty- 
protony, a zwłaszcza pozytony nie stanowi żadnego 
dowodu istnienia antymaterii, ponieważ są one pro¬ 
duktami oddziaływań wysokoenergetycznego pro¬ 
mieniowania kosmicznego przechodzącego przez 
ośrodek między gwiazdowy. (W celu uniknięcia nie¬ 
porozumień należy podkreślić, że chodzi tu o pro¬ 
mieniowanie kosmiczne w takiej postaci, w jakiej do¬ 
biega ono do nas z przestrzeni kosmicznej). Badania 
promieniowania kosmicznego przyczyniły się w is¬ 
totny sposób do poznania właściwości antycząstek, 
jednak obserwowane antycząstki były cząstkami wtór¬ 
nymi, powstającymi w wyniku zderzeń szybkich czą¬ 
stek pierwotnego promieniowania kosmicznego z ma¬ 
terią ziemską. Wprawdzie nie znamy jeszcze dokład¬ 
nie natury źródeł promieniowania kosmicznego, 
jednak wydaje się bardziej prawdopodobne, że źród¬ 
łami promieniowania kosmicznego złożonego ze zwy¬ 
kłych cząstek są obiekty zbudowane ze zwykłej 
materii aniżeli obiekty zbudowane z antymaterii. 

Jak więc widzimy, obserwacje nie dają nam żadnej 
zdecydowanej odpowiedzi co do istnienia wielkoskalo- 
wych skupisk antymaterii we Wszechświecie i co naj¬ 
wyżej pozwalają przypuszczać, że w obrębie naszej 
Galaktyki antymateria nie występuje w większych 
ilościach. Innymi słowy, obserwacje nie zaprzeczają 
wyraźnie uczynionemu na wstępie założeniu o istnie¬ 
niu symetrii między materią i antymaterią w skali 
kosmicznej. Jeżeli chcemy pozostać przy tym zało¬ 
żeniu, to musimy znaleźć odpowiedź na dwa zasadni¬ 
cze pytania: kiedy powstała materia i antymateria, 
oraz w jaki sposób nastąpiło ich rozdzielenie? Nie 
trzeba chyba specjalnie podkreślać, że oba problemy 
są jeszcze dalekie od rozwiązania i można co naj¬ 
wyżej wskazać ogólne kierunki, w których idą roz¬ 
ważania. Rozważania te muszą być oczywiście zgodne 
z tym co wiemy (lub spodziewamy się, że wiemy) na 
temat powstania i ewolucji Wszechświata. 

Istniejące dane obserwacyjne świadczą o tym, że 
kilkanaście miliardów lat temu Wszechświat przecho¬ 
dził przez fazę dużego zgęszczenia materii. W tzw. 
teorii wielkiego wybuchu (-> Kosmologia) zakłada 
się nawet, że gęstość materii była wówczas znacznie 
większa od gęstości materii tworzącej jądra atomowe. 
Wszechświat o tak dużej gęstości (i odpowiednio 
wysokiej temperaturze) był niestabilny, wskutek czego 
zaczął ekspandować. Za takim właśnie obrazem ewo¬ 
lucji Wszechświata przemawia znany od dawna fakt 
ucieczki galaktyk (opisywanej przez prawo Hubble’a) 
oraz istnienie wykrytego kilkanaście lat temu pro¬ 
mieniowania reliktowego. 

W klasycznym modelu wielkiego wybuchu, w któ¬ 
rym Wszechświat „pojawił się” w postaci gęstego 
i gorącego praatomu, trudno jest znaleźć miejsce dla 
antymaterii: w stanie silnego zgęszczenia materia 
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odległość dwóch punktów Wszechświata 


i antymateria nie mogłyby ze sobą współistnieć (jeśli 
pominiemy dość szczególny przypadek, że materia 
i antymateria pojawiły się od razu rozdzielone). 
Z punktu widzenia naszych rozważań najwłaściwsze 
wydaje się założenie, że materia i antymateria istniały 
początkowo w równych ilościach i były ze sobą do¬ 
kładnie wymieszane; założenie takie spełnia bowiem 
w najbardziej naturalny sposób nasz postulat nie- 
odróżnialności materii i antymaterii. Ma ono jednak 
sens tylko wówczas, jeżeli przyjmiemy równocześnie, 
że gęstość materii była początkowo bardzo mała 
(rzędu jednej cząstki w km 3 ), znacznie mniejsza od 
gęstości dzisiejszej materii międzygwiazdowej. Wbrew 
pozorom, założenie takie nie jest sprzeczne z faktami 
obserwacyjnymi, na których opiera się teoria wielkie¬ 
go wybuchu. Przyjęty model przesuwa po prostu 
Wszechświat znany nam początek Wszechświata o wiele miliardów 
przed lat wstecz, do czasów, gdy Wszechświat miał postać 
wielkim gigantycznego obłoku rozrzedzonej mieszaniny obu 
wybuchem rodzajów materii. Taki stan Wszechświata był rów¬ 
nież niestabilny. Jeżeli, jak się powszechnie przypusz¬ 
cza antymateria ma masę grawitacyjną dodatnią, tzn. 
jeżeli siła grawitacji działająca między cząstkami anty¬ 
materii jest siłą przyciągającą, wówczas wzajemne 
przyciąganie się wszystkich cząstek obłoku powodo¬ 
wało jego kurczenie się. Swobodne kurczenie się obło¬ 
ku trwało dopóty, dopóki gęstość nie osiągnęła war¬ 
tości rzędu jednej cząstki w m 3 . Przy tej gęstości roz¬ 
poczęły się procesy anihilacji prowadzące do poja¬ 
wienia się w obłoku coraz to silniejszego strumienia 
promieniowania y. Promieniowanie to oddziałując 
z materią powodowało pojawienie się siły pochodzącej 
od ciśnienia (termicznego ciśnienia gazu oraz ciśnie¬ 
nia promieniowania), skierowanej odwrotnie do kie¬ 
runku działania sił grawitacji. Postępująca kontrakcja 
obłoku pociągała za sobą wzrost tempa anihilacji, 
a tym samym wzrost ciśnienia przeciwstawiającego 
się kontrakcji. Pozornie pusty i zimny Wszechświat 
sprzed wielu bilionów lat wkroczył wówczas w dra¬ 
matyczną fazę ścierania się siły samograwitacji z prze¬ 
ciwnie skierowaną i stale rosnącą siłą ciśnienia pro¬ 
mieniowania. W pewnym momencie ciśnienie promie¬ 
niowania nie tylko zrównoważyło, ale znacznie prze¬ 
wyższyło siłę przyciągania, powodując w rezultacie 
odwrócenie kierunku ruchu materii. Nasz obłok 
osiągnął wówczas swoje najmniejsze rozmiary, a na¬ 
stępnie zaczął rozszerzać się ze stale wzrastającą 
prędkością. Można teoretycznie wykazać, że ruch na 
zewnątrz powinien odbywać się zgodnie z prawem 
Hubble’a, inaczej mówiąc, dalsza ewolucja naszego 



Rys. 3. Schematyczny przebieg historii Wszechświata wg teorii 
wielkiego wybuchu i w modelu rozrzedzonego obłoku materii 
i antymaterii. Oba modele przewidują taki sam obecny stan 
Wszechświata 

obłoku powinna wyglądać tak samo, jak ewolucja 
Wszechświata powstałego w wyniku wielkiego wybu¬ 
chu (rys. 3). 

Obecny Wszechświat nie jest jednak zbudowany 
z materii rozproszonej, lecz z galaktyk, a więc obiek¬ 


tów o bardzo dużej koncentracji materii. Wprawdzie 
nie wiemy jeszcze, w którym momencie pojawiły się 
galaktyki, jednak musimy założyć, że zanim one po¬ 
wstały, nastąpiło rozdzielenie materii od antymaterii, 
co najmniej w skali odpowiadającej masom gwiazd. 

Problem wielkoskalowego rozdzielania się materii 
i antymaterii nie został jeszcze wystarczająco ściśle 
rozwiązany, jednak mimo to wydaje się celowe przy¬ 
toczenie w tym miejscu jako ilustracji najprostszego 
modelu zjawisk, które do takiego rozdzielenia się 
mogły doprowadzić. 

Rozważmy w- tym celu, znajdujący się w polu gra- rozdzielanie 
witacyjnym, obłok plazmy składającej się z miesza- materii 
niny lekkiego gazu ełektronowo-pozytonowego i zna- | antymaterii 
cznie cięższego gazu protonow'o-antyprotonowego 
(rys. 4). Pole grawitacyjne doprowadzi do wyraźnej 
separacji cząstek cięższych od cząstek lżejszych: pro¬ 
tony i antyprotony znajdą się przede wszystkim „na 
dole”, podczas gdy obszar zajmowany przez cząstki 
lżejsze będzie rozciągał się znacznie wyżej — „na 



■ kierunek przepływu 
prądu elektrycznego 




; pozytony 

\ 

elektrony 
i pozytony 

f 

’ elektrony 

obszar 
skupiania się 
materii 


ś 

i protony 




. ... r >- ,, 

■\ '' !»"* ‘x : * J \. 

protony 
i antyprotony 


f antyprotony 



kierunek siły 
f grawitacji 



Rys. 4. Jeden z możliwych sposobów rozdzielenia materii i anty¬ 
materii 


górze” (oczywiście słowa „dół” i „góra” mają tu 
tylko znaczenie umowne). Nietrudno zrozumieć, że 
prąd elektryczny płynący ku górze spowoduje ruch 
elektronów w dół, a protonów — do góry. Na po¬ 
średniej wysokości, na której protony spotykają się 
z elektronami utworzy się obszar zajęty przede 
wszystkim przez zwykłą materię; obdarzone prze¬ 
ciwnymi ładunkami antycząstki popłyną w kierun¬ 
kach przeciwnych, tzn. pozytony ku górze, a anty¬ 
protony w dół. Oczywiście zmiana kierunku prze¬ 
pływu prądu doprowadziłaby do wydzielenia „czy¬ 
stej” antymaterii. Istnienie pola grawitacyjnego oraz 
prądu elektrycznego wydaje się założeniem zupełnie 
naturalnym: pole grawitacyjne może pochodzić 
z ogólnego pola grawitacyjnego Wszechświata, nato¬ 
miast przepływ prądu zawsze towarzyszy polom ma¬ 
gnetycznym, które we Wszechświecie występują bar¬ 
dzo powszechnie z różnym natężeniem i w różnej 
skali. 

Opisany model jest tylko jakościowym przykładem 
procesów, które mogły prowadzić do pożądanego 
rozdzielenia materii i antymaterii, nie stanowi jednak 
dowodu, że rozdzielenie takie było możliwe w skali 
rzeczywistych obiektów Wszechświata (galaktyk, 
gwiazd). 

Jak wynika z tego, co zostało powiedziane wyżej, 
problem istnienia antymaterii we Wszechświecie, 
choć niezwykle ważny z punktu widzenia naszych 
ogólnych poglądów na budowę Wszechświata i wy¬ 
pełniającej go materii, nie wyszedł jeszcze poza gra¬ 
nice dość ogólnikowych spekulacji. Jest też mało 
prawdopodobne, by nawet istotne rozszerzenie na- 
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szych możliwości obserwacyjnych mogło doprowa¬ 
dzić do zmiany sytuacji, która wydaje się szczególnie 
paradoksalna: pełna symetria własności materii i an¬ 
tymaterii, będąca wyrazem prostoty otaczającego nas 
świata, jest zarazem okolicznością poważnie utrud¬ 


niającą zebranie dowodów na to, że Wszechświat 
jest zbudowany w sposób możliwie najprostszy. 

H. Alven Kosmologia i antymateria , Warszawa 1973; J. No- 
woźyłow Cząstki elementarne. Warszawa 1961; Mezony, grawi¬ 
tacja, antymateria , Warszawa 1962. 


Radioastronomia 

Stanisław Zięba 

Radioastronomia jest nauką badającą ciała niebieskie 
przez odbiór wysyłanych przez nie fal radiowych. 
Należy do grupy tych dziedzin wiedzy, których wła¬ 
ściwy rozwój nastąpił dopiero w ciągu ostatnich 
trzydziestu lat. 

Faktycznie jednak narodziny radioastronomii na- 
początki stąpiły wcześniej, bo w roku 1932, kiedy to amery- 
radioastro- kański inżynier, Karl Jansky, po raz pierwszy za- 
nomii rejestrował fale radiowe pochodzące z przestrzeni po¬ 
zaziemskiej. Odkrycie Jansky ł ego było przypadkowe 
i do czasu zakończenia II wojny światowej radio¬ 
astronomia pozostawała nauką zapomnianą. Pewne 
pionierskie prace w tej dziedzinie prowadzone były 
w tym czasie tylko w Stanach Zjednoczonych przez 
radioamatora Grotę Rebera, który z własnych fun¬ 
duszów konstruował i budował specjalne układy do 
odbioru pozaziemskiego promieniowania radiowego. 
Wyniki swoich prac opublikował on w latach 1940 
i 1942, a więc wtedy, gdy nie było sprzyjającej atmo¬ 
sfery do rozwijania czystej nauki. Mimo to prace 
te nie pozostały niezauważone i wraz z interesują¬ 
cymi obserwacjami dokonanymi przy okazji badań 
związanych z radarem stały się podstawą i począt¬ 
kiem współczesnej radioastronomii: 


Radioteleskopy 

Promieniowanie radiowe dochodzące z kosmosu, 
podobnie jak promieniowanie widzialne, dociera bez 
przeszkód przez atmosferę do powierzchni naszego 
globu. Atmosfera ziemska przepuszcza bowiem z pa¬ 
dającego na nią widma fal elektromagnetycznych 
fale w dwóch zakresach częstości, tworząc jak 
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Rys. 1. Przechodzenie fal elektromagnetycznych przez ziemską 
atmosferę (rys. I, 2, 8 i 13 wg J. D. Kraus Radio Astronomy , New 
York 1966) 


gdyby dwa okna, przez które możemy spoglądać 
we Wszechświat (rys. 1). Rozmiary interesującego 
nas okna radiowego są ograniczone od strony fal 
milimetrowych pochłanianiem przez tlen atmosferycz¬ 
ny i parę wodną, od strony fal dekametrowych zaś 
przepuszczalnością jonosfery, która odbija fale dłuż¬ 
sze. Aby zarejestrować dochodzące do nas promienio¬ 
wanie radiowe, musimy stosować skomplikowane 
układy odbiorcze, zwane radioteleskopami. Schemat 
najprostszego radioteleskopu przedstawiony jest na 
rys. 2. Zasadnicze jego części to antena — zbierająca 
padające na nią fale elektromagnetyczne, oraz od¬ 


biornik — wzmacniający i zapisujący sygnał powsta¬ 
jący w oświetlaczu anteny. Sygnał ten zależy od wiel¬ 
kości promieniowania odbieranego przez antenę ze 
wszystkich „widzianych” przez nią kierunków. Jeżeli 
antena nastawiona jest na obiekt promieniujący ra¬ 
diowo, to z odebranego sygnału można wyznaczyć 
gęstość strumienia fal radiowych wysyłanych przez 
obiekt w określonym przedziale częstości i w określo¬ 
nym kącie bryłowym. Im mniejszy jest kąt bryłowy, 
w którym następuje uśrednienie promieniowania, 



kable kable 

Rys. 2. Współczesny radioteleskop 


tym dokładniej można przebadać strukturę źródła, 
czyli rozkład kierunków silniej i słabiej promieniują¬ 
cych podobszarów. Parametr decydujący o tej włas¬ 
ności radioteleskopu nazwano jego zdolnością roz¬ 
dzielczą, która najczęściej definiowana jest jako naj¬ 
mniejsza odległość kątowa konieczna do odróżnienia 
dwóch bliskich źródeł promieniowania. 

Drugim, poza zdolnością rozdzielczą, podstawo¬ 
wym parametrem charakteryzującym radioteleskop 
jest jego czułość, czyli zdolność do odbierania mo¬ 
żliwie słabych sygnałów. Duże czułości uzyskuje się 
budując anteny o dużych aperturach (tj. o dużych 
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Rys. 3. Układ i charakterystyka prostego interferometru złożo¬ 
nego z dwóch jednakowych anten 


powierzchniach zbierających), jak również stosując 
wzmacniacze o małych szumach własnych, poszerza¬ 
jąc pasma odbiorników i wydłużając czas uśredniania 
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(integracji) sygnału. Dzięki złożonym metodom ob¬ 
serwacji i odpowiednim układom radioteleskopów 
zwanych interferometrami (rys. 3) można znacznie 
polepszyć zdolność rozdzielczą tworzonych syste¬ 
mów, a więc zmniejszyć rozróżniany już przez układ 
odstęp kątowy między dwoma źródłami. Zależy on 
bowiem odwrotnieproporcjonalnie od odległości L 
(długość bazy) między antenami tworzącymi inter¬ 
ferometr. Obecnie w interferometrii o bardzo długich 
bazach (rzędu tysięcy kilometrów) uzyskuje się zdol¬ 
ności rozdzielcze w granicach 0,1-0,001 sekundy łuku, 
zależnie od długości fali, na której prowadzone są 
obserwacje. Najmniejsze wartości otrzymuje się dla 
fal najkrótszych. Ponieważ przy długich bazach 
trudno jest połączyć odległe anteny w jeden system 
odbiorczy, obserwacje wybranego obiektu prowadzi 
się niezależnie, ale jednocześnie, w obu miejscach, 
rejestrując odbierane sygnały na taśmach magnetycz¬ 
nych, na których dodatkowo zapisuje się czas z do¬ 
kładnie zsynchronizowanych zegarów atomowych. 
Po zakończeniu obserwacji otrzymane taśmy umiesz¬ 
cza się w maszynie cyfrowej, która dokonuje wspól¬ 
nego opracowania obserwacji obu pozornie nieza¬ 
leżnych układów. 

metoda Inną metodą, wykorzystującą współczesną technikę 

syntezy obliczeniową, jest metoda syntezy apertury. Jej za- 
apertury sada została opracowana przez radioastronomów 
brytyjskich, Sir Martina Ry!e’a i Anthona Hewisha, 
laureatów nagrody Nobla w dziedzinie fizyki z 1974 r. 
W metodzie tej (rys. 4) radiowy obraz nieba, jaki 
można byłoby otrzymać za pomocą bardzo dużej, 
a więc niemożliwej do zbudowania anteny, uzyskuje 
się zapisując w maszynie cyfrowej obserwacje ustalo¬ 
nego obszaru nieba, wykonane przez układ dwu lub 



Rys. 4. Metoda syntezy apertury. Pojedynczą dużą antenę można 
zastąpić przez dwie mniejsze anteny (interferometr), które ko¬ 
lejno umieszcza się w różnych położeniach względem siebie, 
w obrębie pierwotnej apertury 


więcej małych anten, umieszczanych kolejno w róż¬ 
nych względem siebie położeniach, wybieranych 
z syntetyzowanej apertury. W metodzie tej, oprócz 
, zmian położeń anten, często wykorzystuje się obrót 
Ziemi dookoła własnej osi. Stwarza to bowiem możli¬ 
wość (rys. 5) prowadzenia obserwacji przy różnych 
kierunkach i długościach bazy. Za pomocą stosowa¬ 
nych obecnie układów syntezy apertury można re¬ 
jestrować gęstości strumienia rzędu 10“ 3 Jy (1 Jy = 1 
Jansky — 10~ 2 * W-m -2 - Hz -1 ). 

Przytoczone wielkości liczbowe charakteryzują 
aktualne możliwości pracujących układów odbior- 



biegun północny 


Rys. 5. Zmiany położe¬ 
nia prostego interfero¬ 
metru na powierzchni 
Ziemi w ciągu dnia oglą¬ 
dane z ustalonego punk¬ 
tu w przestrzeni 


czych. Liczby te nie powinny w najbliższej przy¬ 
szłości ulec zasadniczym zmianom, gdyż głównym 
celem w konstruowanych obecnie układach jest zwię¬ 
kszenie efektywności ich pracy, poprzez zmniejszenie 
czasu potrzebnego na wykonanie pełnych obserwacji. 


Mechanizmy promieniowania 

Zanim przejdziemy do omawiania wyników obserwa¬ 
cji radioastronomicznych, zajmiemy się mechaniz¬ 
mami promieniowania prowadzącymi do emisji fal 
radiowych. Obecnie przypuszcza się, że generacja fal 
radiowych w kosmosie powodowana jest przez pro¬ 
mieniowanie synchrotronowe, promieniowanie ter¬ 
miczne, drgania plazmy oraz przez radiowe promie¬ 
niowanie monochromatyczne. Jeżeli w prowadzonych 
badaniach udaje się zidentyfikować mechanizm wy¬ 
wołujący odbierane sygnały radiowe, to istnieje wtedy 
możliwość poznania szczegółów związanych z naturą 
fizyczną emitującego obszaru. Różne mechanizmy 
promieniowania są wytwarzane bowiem w różnych 
warunkach fizycznych. 1 tak np. trzy ostatnie z wyżej 
wymienionych nie wymagają obecności pola magne¬ 
tycznego, które jest konieczne jeżeli generacja fal ma 
być wywołana przez promieniowanie synchrotrono¬ 
we. Właściwie jedyna, jak na razie, droga prowadząca 
do określenia mechanizmu wytwarzania fal sprowa¬ 
dza się do badania widma radiowego promieniują¬ 
cego obszaru, czyli do wyznaczenia zależności gę¬ 
stości strumienia od częstości. Badania polaryzacji 
fal radiowych byłyby tutaj bardzo przydatne, jed¬ 
nakże z powodu dużych trudności, występujących 
przy tego typu pomiarach, nie są one jeszcze stoso¬ 
wane szerzej w radioastronomii. 

Źródłem promieniowania synchrotronowego są 
naładowane cząstki poruszające się w polu magne¬ 
tycznym. Jeżeli energia tych cząstek jest nierelaty- 
wistyczna, promieniowanie to nazywamy promienio¬ 
waniem cyklotronowym, pozostawiając nazwę pro¬ 
mieniowanie synchrotronowe dla cząstek ultrarela- 
tywistycznych, których energia jest znacznie większa 
niż m 0 c 2 . Pojedynczy relatywistyczny elektron krążący 
w polu magnetycznymi? promieniuje fale elektromag¬ 
netyczne w małym stożku o osi skierowanej wzdłuż 
kierunku chwilowej prędkości (rys. 6). Promieniowa- 



promieniowanie 

Rys. 6. Mechanizm synchrotronowy. Elektron poruszając się 
w polu magnetycznym po linii śrubowej wysyła falc elektro¬ 
magnetyczne 


nie to jest silnie spolaryzowane, a wektor elektryczny 
fali leży w płaszczyźnie orbity elektronu. Gdy w polu 
magnetycznym znajdują się elektrony o izotropowym 
rozkładzie prędkości i rozkładzie energii elektronów 
opisanym prawem potęgowym N(E)~E~ V 9 gdzie 
y — wskaźnik energetyczny cząstek, to natężenie pro¬ 
mieniowania synchrotronowego wyraża się wzorem 
J(v) ~ p“ a . Wskaźnik widmowy a jest powiązany z 
wskaźnikiem y zależnością a = (y— 1)/2. Dla elek¬ 
tronów kosmicznych y x 2,5. Jeżeli przyjmie się, że 
elektrony odpowiedzialne za promieniowanie syn¬ 
chrotronowe radioźródeł mają taki sam rozkład 
energetyczny, to l(v) — v 0 * 75 . Wartość a = 0,75 jest 
zgodna z obserwowanym średnim wskaźnikiem wid¬ 
mowym radioźródeł (zob. też il. 211, tabl. 57). 
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promienio- Wszystkie ciała, których temperatura jest większa 
wanie od zera bezwzględnego, emitują fale elektromagne- 
termiczne tyczne o różnych długościach. Wykorzystując równa¬ 
nie promieniowania ciała doskonale czarnego można 
ocenić, ile energii wypromieniuje ciało w poszczegól¬ 
nych przedziałach częstości. Dla fal radiowych uzys¬ 
kuje się dostatecznie dokładną zależność natężenia 
od częstości stosując przybliżenie Rayleigha-Jeansa, 
które prowadzi do wzoru 

/« = 2v*k- Ttlc\ 

gdzie k —stała Boltzmanna, a Tb —tzw. temperatura 
jasnościowa, czyli temperatura jaką posiadałoby ciało 
doskonale czarne wysyłające w przedziale fal radio¬ 
wych energię równą energii wypromieniowywanej 
przez dane ciało. 

Jak widzimy na rys. 7 widmo promieniowania syn¬ 
chrotronowego różni się w sposób zasadniczy od wid¬ 
ma promieniowania termicżnego, którego wskaźnik 
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Rys. 7. Widmo promieniowania termicznego i synchrotronowego 


widmowy a jest równy — 2. Na tej podstawie odróż¬ 
niamy od siebie radioźródła galaktyczne, a więc pro¬ 
mieniujące termicznie obszary zjonizowanego wodoru 
od radioźródeł pozagalaktycznych. 

Sporadyczne promieniowanie radiowe w stosunko¬ 
wo wąskim paśmie częstotliwości, ok. v = (, e 2 N e fm ) lł2 , 
może powstawać w wyniku występowania fluktuacji 
drgania gęstości elektronowej N e w plazmie. Proces taki jest 
plazmy możliwy przy wzbudzaniu niejednorodnej plazmy 
strumieniem cząstek poruszających się z prędkościami 
przewyższającymi prędkość dźwięku. Promieniowanie 
radiowe tego rodzaju generowane jest podczas nie¬ 
których wybuchów radiowych obserwowanych w ko¬ 
ronie słonecznej, którą można uważać za plazmę 
o temperaturze ok. dwóch milionów stopni i gęstości 
10 8 elektronów/cm 3 . Ponieważ materia w kosmosie naj¬ 
częściej występuje w stanie plazmy, promieniowanie 


to może być wytwarzane w wielu obiektach astrono¬ 
micznych. Teoria tych procesów na razie nie jest 
jednak dokładnie ilościowo opracowana. 

Radiowe promieniowanie monochromatyczne po¬ 
wstaje przy przejściach energetycznych między blis¬ 
kimi poziomami energetycznymi atomów i cząsteczek. 
Jest ono scharakteryzowane długością fali oraz jej 
profilem. Spośród kilkudziesięciu odkrytych już w 
kosmosie linii radiowych najbardziej rozpowszech¬ 
niona jest linia neutralnego wodoru o długości fali 
21,1 cm, emitowana przy przejściach między podpo- 
ziomami struktury nadsubtelnej stanu podstawowego. 
Na możliwość występowania takiej linii oraz na jej 
znaczenie w badaniach rozmieszczenia chmur chłod¬ 
nego wodoru w przestrzeni kosmicznej zwrócił uwagę 
w 1944 r. holenderski uczony van de Hulst. Przewi¬ 
dywaną przez niego linię po raz pierwszy zaobserwo¬ 
wano w 1951 r. Obecnie obserwuje się już wiele róż¬ 
nego rodzaju linii radiowych. Dużą grupę wśród nich 
stanowią linie rekombinacyjne, związane z przejścia¬ 
mi pomiędzy sąsiednimi poziomami o dużych głów¬ 
nych liczbach kwantowych oraz linie molekularne 
prostych związków organicznych, których mechaniz¬ 
my powstawania nie są na razie dostatecznie zbadane. 
Niektóre z obserwowanych linii molekularnych przed¬ 
stawia poniższa tabela. 
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Rok 

odkry¬ 

cia 

Nazwa atomu 
lub cząsteczki 

Symbol 

f obserwowa- 
ne linie 
molekularne 

1951 

wodór (neutralny) 

HI 

21,1 cm 

1963 

grupa hydroksylowa 

OH 

18,0 cm 

1964 

wodór (zjonizowany) 

HII 

3,4 cm 

1966 

hel (zjonizowany) 

He 

18,0 cm 

1967 

węgiel (zjonizowany) 

C 

6,0 cm 

1968 

amoniak 

NH, 

1,3 cm 

1968 

woda 

H t O 

1,3 cm 

1969 

formaldehyd 

HjCO 

6,2 cm 

1970 

tlenek węgla 

CO 

2,6 mm 

1970 

cyjanowodór 

HCN 

3,4 mm 

1970 

alkohol metylowy 

CH 3 OH 

36,0 cm 

1970 

kwas mrówkowy 

HCOOH 

18,0 cm 

1971 

siarczek węgla 

CS 

2,0 mm 

1971 

formamid 

HCONHj 

6,5 cm 

1971 

tlenek krzemu 

SiO 

2,7 mm 

1971 

cyjanek metylu 

CH,CN 

2,7 mm 

1971 

metyloacetylen 

CHjCCH 

3,5 mm 

1972 

siarkowodór 

H,S 

1,8 mm 

1973 

tlenek siarki 

SO 

2,9 mm 


Źródła promieniowania radiowego 

Radiowy obraz nieba, jaki możemy sobie wytworzyć 
na podstawie wykonywanych radioteleskopami obser¬ 
wacji, różni się całkowicie od obrazu nieba oglądane¬ 
go w pogodne noce. Obraz ten zmienia się ponadto 
dość znacznie wraz ze zmianą długości fali, gdyż 
w różnych obiektach, zależnie od istniejących w nich 
warunków fizycznych, dominują, w różnych przedzia¬ 
łach częstości, różne mechanizmy promieniowania (il. 
218, tabl. 58 oraz rys. 3 i 4, str. 938). 



Rys. 8. Radiowa panorama nieba, pokazująca obraz nieba „widziany oczyma” czułymi na falc radiowe o częstości 250 MHz (otrzymana 
przez zacieniowanie obszarów między kolejnymi izofotami mapy konturowej) 
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radiowy Obiektem najbardziej charakterystycznym na ra- 
obraz diowym niebie jest Droga Mleczna (rys. 8). Kontury 
nieba jej są nieostre, lecz nie dlatego, że składa się z wielu 
oddzielnych gwiazd. Jest ona po prostu dużą chmurą, 
w której widać kilkanaście jasnych obiektów, znacz¬ 
nie większych od znanych nam dobrze punktów 
świetlnych. Na próżno można szukać na radiowym 
niebie charakterystycznych gwiazd z konstelacji Wiel¬ 
kiego Wozu, Oriona czy Kasjopei. Niebo pokryte 
jest wieloma nowymi obiektami. Po dokładnym po¬ 
równaniu z atlasem gwiazd można przekonać się, że 
niektóre z nich znane są z obserwacji wizualnych. 
Są to takie obiekty, jak np.: Mgławica Krab, Mgławi¬ 
ca Andromedy i inne, z których większość, to poło¬ 
żone daleko w przestrzeni mgławice pozagalaktyczne, 
zwane inaczej galaktykami. Słońce, które wygląda 
jak dziwny przyćmiony obiekt, dookoła którego po¬ 
jawiają się nieregularne kontury korony słonecznej, 
jest w zakresie radiowym tak słabym źródłem, że 
z trudnością „oświetla” Księżyc, który dostrzegamy 
tylko dzięki jego własnemu promieniowaniu. Planety 
są również ledwo „widoczne”. Wyjątkiem jest Jowisz, 
który wysyła impulsowe błyski promieniowania ra¬ 
diowego. 

Już z tego krótkiego i uproszczonego opisu nieba 
radiowego wynika, że w kosmosie występują rozmaite 
obiekty promieniujące radiowo. Przejdźmy teraz do 
bardziej szczegółowego opisu promieniowania ra¬ 
diowego tych obiektów oraz do wniosków, jakie moż¬ 
na stąd wysunąć co do ich budowy fizycznej. 


obszarami plam i pochodni. Odmienne mechanizmy 
powodują rejestrowane wybuchy radiowe, które są 
najsilniejsze i najbardziej złożone w metrowym za- 
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Rys. 9. Widmo promieniowania Słońca 


Promieniowanie radiowe Słońca i gwiazd 

Słońce jest najważniejszym spośród ciał niebieskich 
oświetlających nasze radiowe niebo, chociaż nie do¬ 
minuje na tym niebie tak wyraźnie, jak Słońce wi¬ 
dzialne, a wypromieniowywane przez nie fale radiowe 
nie wpływają bezpośrednio na bieg naszego codzien¬ 
nego życia. Hipotezy, że Słońce promieniuje również 
radiowo wysuwane były już w parę lat po odkryciu 
przez Heinricha Hertza fal radiowych. Wszystkie 
jednak próby detekcji tych fal kończyły się niepowo¬ 
dzeniami. Dopiero w latach II wojny światowej zare¬ 
jestrowano za pomocą urządzeń radarowych, w kilku 
ośrodkach niezależnie od siebie, silne sygnały w po¬ 
staci szumu, który, jak się okazało, emitowany był 
z aktywnych obszarów na Słońcu. Wyniki te zostały 
opublikowane po zakończeniu wojny w 1945 r. Od 
tego czasu prowadzone są systematyczne badania 
promieniowania radiowego Słońca. Obecnie uważa 
się, że na promieniowanie to składa się: stałe promie¬ 
niowanie termiczne spokojnego Słońca oraz promie¬ 
niowanie sporadyczne zależne od stanu aktywności 
Słońca. Promieniowanie sporadyczne można podzie- 
Dmmipnin ^ . na tzw * kładową wolno zmienną — wykazującą 
prumierno- 2m ,any z dnia na dzień z okresem około dwudziestu 
terirńr "! e siedmiu dni, oraz na wybuchy radiowe — charaktery- 
2Ujące się duz y mi zmianami gęstości strumienia w 
i sporadyczne przedziałach czasu rzędu sekund, minut lub godzin. 

Widmo promieniowania Słońca, zarówno w zakre¬ 
sie fal radiowych, jak i optycznych, przedstawia 
rys. 9. Jak widać, termiczne promieniowanie Słońca 
spokojnego nie odpowiada jednej określonej tempera¬ 
turze. Związane to jest z tym, że promieniowanie 
o różnych długościach fal emitowane jest z różnych 
warstw atmosfery Słońca. Fale metrowe wysyłane są 
z gorącej, mającej ponad milion stopni korony, fale 
centymetrowe zaś z chłodnej, dolnej chromosfery 
o temperaturze ok. 10 000 stopni. Składowa wolna 
zmienna jest obserwowana w zakresie fal od 3 do 
ok. 60 cm, a jej maksimum znajduje się w pobliżu 
8 cm. Charakterystyczne zmiany składowej wolno 
zmiennej zgodne są ze zmianami powierzchni plam 
na Słońcu. Źródłem tej składowej jest najprawdopo¬ 
dobniej promieniowanie termiczne powstające w jas¬ 
nych i gęstych kondensacjach koronalnych, o tempe¬ 
raturze, ok. dwu milionów stopni, położonych ponad 


kresie długości fal. Są one z reguły stowarzyszone 
z obserwowanymi w świetle widzialnym rozbłyskami 
chromosferycznymi. Większość z nich rozpoczyna się 
w chwili wyrzucenia strumienia naładowanych cząste¬ 
czek z aktywnych obszarów związanych z plamami. 

Mechanizmy powstawania i rozwijania się wybuchów 
radiowych nie są jeszcze dokładnie poznane. Są to 
bowiem bardzo złożone procesy, w których powstanie 
fal radiowych może być spowodowane zarówno pro¬ 
mieniowaniem synchrotronowym, jak i różnego ro¬ 
dzaju drganiami plazmy. 

Promieniowanie radiowe z innych gwiazd niż Słoń¬ 
ce przez długi okres czasu nie było rejestrowane. 

Przyczyną tego stanu była przede wszystkim zbyt mała 
czułość pracujących układów. W końcu, po wielu 
fałszywych alarmach, w 1963 r. udało się zaobserwo¬ 
wać krótkotrwały impuls promieniowania radiowego 
(rozbłysk) dochodzący do nas od czerwonego karła 
UV Ceti. W latach następnych zaobserwowano jeszcze 
kilkanaście gwałtownych radiowych i optycznych 
rozbłysków z gwiazd tego typu, które w rezultacie 
zyskały nazwę gwiazd rozbłyskowych. W miarę upły- gwiazdy 
wu czasu wzrastała liczba obiektów gwiazdowych, rozbłyskowe 
których promieniowanie radiowe udało się odebrać. 

I tak w 1970 r. zarejestrowano na falach centymetro¬ 
wych promieniowanie dochodzące od dwóch gwiazd 
nowych oraz od trzech znanych układów podwójnych 
a Scorpii B, p Persei (Algol) i p Lyrae. Promieniowa¬ 
nie radiowe tych układów wykazywało w latach 
1970-1972 bardzo osobliwe cechy wskazujące na to, 
że znajdowały się one w tym czasie w okresie silnej 
aktywności powodującej powstawanie rozbłysków 
radiowych. Potwierdzeniem takiego przypuszczenia 
może być fakt, że na 60 badanych w tym czasie ukła¬ 
dów podwójnych tylko w tych zarejestrowano dosta¬ 
tecznie silną emisję radiową. Wartości wskaźnika 
widmowego, otrzymywane z obserwacji na różnych 
długościach fal, wskazywały na termiczną naturę tych 
rozbłysków. Hipoteza ta wymaga jednak dalszych 
potwierdzeń, które możemy między innymi uzyskać 
z obserwacji w paśmie promieni X (-►Astronomia 
promieni X i y). Gdyby bowiem obserwowane roz¬ 
błyski faktycznie powstawały w wyniku wzmożonego 
promieniowania termicznego pewnych obszarów 
w atmosferach tych gwiazd, to warunki fizyczne pa¬ 
nujące w tych obszarach musiałyby również powodo- 
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wać emisję promieniowania X. Prawie w tym samym 
rozbłyski czasie stwierdzono, że niektóre znane źródła promie- 
radiowe niowania X emitują z kolei silne strumienie fal radio¬ 
wych w postaci rozbłysków. Szczególnie silne tego 
typu zjawisko wystąpiło we wrześniu 1972 r. w obiek¬ 
cie znanym jako Cyg X-3. Reasumując, można 
stwierdzić, że badania radiowe gwiazd, w których 
stawiamy powoli pierwsze kroki, przyczynią się do 
dokładniejszego zrozumienia ewolucji i budowy zło¬ 
żonych układów gwiazd. 


wa płaska jest związana z promieniowaniem termicz¬ 
nym cienkiej warstwy obłoków' wodoru między- 
gwiazdowego, zjonizowanego przez gorące gw-iazdy 
koncentrujące się w płaszczyźnie Galaktyki, oraz pro¬ 
mieniowaniem elektronów relatywistycznych w upo¬ 
rządkowanych polach magnetycznych ramion spiral¬ 
nych Galaktyki. Składowa sferyczna oraz synchro¬ 
tronowa część składowej płaskiej decydują o kształcie 
izofot dla długofalowej części widma, termiczna część 
składowej płaskiej zaś dla krótkofalowej części wid- 


Rys. II. Budów? Ga¬ 
laktyki według danych 
radiowych: rozmiary w 
parsekach 
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Badania natężenia promieniowania i profilu linii rozkład 
wodoru neutralnego umożliwiły określenie jego roz- wodoru 
kładu w Galaktyce (ramiona spiralne, rys. 12), jego w Galaktyce 
gęstości (ok. 0,1-100 atomów/cm 3 ) i całkowitej masy, 
temperatury (ok. 100 K) i prędkości radialnych spo- 


Promieniowanie radiowe Księżyca i planet 

Planety, podobnie jak Księżyc, „widoczne” są na 
falach radiowych dzięki własnemu promieniowaniu 
emitowanemu z nagrzanych powierzchniowych 
warstw swych globów. Gdyby warstwy te nagrzewały 
się tylko wskutek promieniowania Słońca, tempera¬ 
tura jasnościowa wyznaczana z obserwacji radiowych 
nie powinna się zasadniczo różnić od temperatury 
mierzonej w zakresie fal optycznych i podczerwonych. 
Taką właśnie zgodność obserwujemy dla Księżyca 
i większości planet. Dla Wenus otrzymywane tempe¬ 
ratury jasności.owe są jednak wyższe, co związane 
jest z obecnością gęstej atmosfery, która może za¬ 
trzymywać wtórne promieniowanie termiczne (efekt 
szklarniowy). Najbardziej złożone promieniowanie 
radiowe wysyła Jowisz. Foza promieniowaniem ter¬ 
micznym wyodrębniamy tu składową nietermiczną 
oraz tzw. błyski dekametrowe składające się z izolo¬ 
wanych grup krótkich impulsów. Błyski te powstają 
prawdopodobnie wskutek oddziaływania strumieni 
prędkich naładowanych cząstek z polem magnetycz¬ 
nym Jowisza. 


Promieniowanie radiowe Galaktyki 

Jednym z dużych osiągnięć radioastronomii było zba¬ 
danie i zrozumienie struktury naszej Galaktyki. Sy¬ 
stematyczne obserwacje Drogi Mlecznej na różnych 
częstościach doprowadziły do utworzenia dokładnych 
izofoty map linii jednakowych jasności (izofoty). Izofoty dla 
różnych długości fal różnią się znacznie między sobą 
zarówno kształtem, jak i wielkością temperatury 
jasnościowej 7&. W paśmie fal dekametrowych pro¬ 
mieniowanie jest izotropowe, a Tb X 100 000 K. 
Przechodząc do fal krótszych 7& maleje (1000-100 K) 
i wyraźnie spada w miarę oddalania się od równika 
galaktycznego (rys. 10). Wskaźnik widmowy a dla fal 
dekametrowych i metrowych wskazuje na promienio¬ 
wanie synchrotronowe. W przedziale fal krótszych 
natomiast ogólne promieniowanie Galaktyki ma cha¬ 
rakter termiczny. Z przebiegu izofot ogólnego promie¬ 
niowania radiowego Galaktyki wynika, że składa się 
ono (rys. 11) z promieniowania sferycznego korony 
składowa galaktycznej (składowa sferyczna) oraz promieniowa- 
sferyczna nia płaszczyzny galaktycznej (składowa płaska — 
i płaska dysk radiowy). Składowa sferyczna pochodzi z hamo¬ 
wania elektronów relatywistycznych w chaotycznych 
polach magnetycznych korony galaktycznej. Składo- 



Rys. 12. Rozkład wodoru neutralnego w Galaktyce (C środek 
Galaktyki, S Słońce) 
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wodowanych obrotem Galaktyki, jak również rucha¬ 
mi własnymi obłoków gazu. Wszystkie przedstawione 
powyżej wyniki uzyskane zostały w żmudnym proce¬ 
sie opracowywania wyników obserwacji. Wykorzy¬ 
stując teoretyczne zależności wiążące parametry 
obserwowane z warunkami fizycznymi, starano się 
określić te ostatnie tak, aby obserwowane natężenia 
i profile linii były jak najlepiej przez nie odtworzone. 

Oprócz termicznych źródeł galaktycznych, jakimi 
są obłoki zjonizowanego wodoru, obserwuje się w Ga¬ 
laktyce wiele źródeł promieniujących synchrotronowo. 
Są to między innymi rozszerzające się otoczki będące 
pozostałościami po wybuchach gwiazd supernowych. 
Nowy typ galaktycznych źródeł punktowych odkryto 
pulsary w 1967 r. Nazwano je pulsarami. Emisja z pulsa- 
rów charakteryzuje się występowaniem silnych krót¬ 
kotrwałych impulsów o zmiennej amplitudzie poja¬ 
wiających się regularnie w równych odstępach czasu, 
których wartości wahają się od 0,01 do kilku sekund 
w zależności od pulsara. Obecnie najczęściej uważa 
się, że pulsary są prawdopodobnie szybko rotującymi 
gwiazdami neutrono^mi z silnym polem magnetycz¬ 
nym, na powierzchni których znajdują się obszary 
będące źródłem impulsów (-► Pulsary). 


Radioźródła pozagafaktyczne 

Odbierając promieniowanie radiowe od mniej lub 
bardziej punktowych źródeł, od początku starano się 
identyfikować obserwowane obiekty radiowe z obiek¬ 
tami optycznymi. Identyfikację taką można przepro¬ 
wadzać w zasadzie tylko na podstawie zgodności 
położeń, co jest zadaniem trudnym a wyniki nie za¬ 
wsze są całkowicie jednoznaczne, pomimo że zdolność 
rozdzielcza tworzonych systemów antenowych została 
w ostatnich latach znacznie polepszona. Pomimo tych 
trudności już w 1949 r. jedne z silniejszych źródeł, 
Virgo A i Centaurus A , zostały zidentyfikowane 
z bliskimi galaktykami M 87 i NGC5128. Dopiero 
jednak identyfikacja bardzo silnego źródła Cygnus A 
z odległą o 600 milionów lat światła galaktyką uzmy¬ 
słowiła wyraźnie pozagalaktyczną naturę wielu źródeł 
i postawiła jasno problem wyjaśnienia ich ogromnych 
źródeł energii. Na początku lat 60-ych niektóre radio¬ 
źródła zostały zidentyfikowane z punktowymi, gwiaz¬ 
dowymi z wyglądu obiektami optycznymi odznacza¬ 
jącymi się bardzo dużymi przesunięciami swoich linii 
kwazary emisyjnych ku czerwieni. Obiekty te nazwano kwaza- 
rami, a ich dalsze badania wykazały, że wiele spośród 
nich jest silnymi radioźródłami ( —► Kwazary). 

W wyniku ogromnej, wieloletniej pracy różnych 
ośrodków radioastronomicznych znamy obecnie po¬ 
nad 10 000 radioźródeł, z których zaledwie kilkaset 
jest w sposób pewny zidentyfikowanych z galaktykami 
lub kw r azarami. Wprawdzie dokładne pozycje radiowe 
znane są dla znacznie większej liczby radioźródeł, 
jednakże nie znajduje się dla nich obiektów optycz¬ 
nych na płytach atlasu Palomarskiego. Dokładne ba¬ 
dania radioźródeł za pomocą interferometrów są pod¬ 
stawą analizy ich struktury, która z reguły jest dość 
złożona. Konfiguracją najczęściej występującą jest 
układ dwu obszarów położonych symetrycznie wzglę¬ 
dem obiektu optycznego (rys. 13) emitujących fale 
radiowe. To symetryczne położenie oraz silniej lub 
słabiej zaznaczone pomosty promieniowania radio¬ 
wego, łączące obszary wzmożonej emisji radiowej 
z centralnie położonym obiektem optycznym, wska¬ 
zują na ich wspólne pochodzenie (rys. 14). W nie¬ 
których przypadkach obserwujemy również bardzo 
zwarte składniki struktur. Często też wśród zwartych 
źródeł można zauważyć silne zmiany wysyłanych 


przez nie strumieni mające jakby charakter burz 
pojawiających się najpierw na falach krótkich. Obser¬ 
wując radioźródła na różnych częstościach można 
badać ich widma, które mimo różnic wskazują na 


Cygnus A ĘT^) ® C~l& 



Virgo A (M 87) 



^wytrysk materii 
[obserwowany 
optycznie i radiowo) 


3C 273 kwaza^ <=£D wytrysk 

i - 1 100000 lat świetlnych 

, 100000 PS _ | 

Rys. 13. Radiowa (kolor niebieski) i optyczna (kolor czarny, 
szary) struktura różnych radioźródeł pozagalaktycznych w przy¬ 
bliżeniu w tej samej skali 



Rys. 14. Struktura radioźródła 3C 452 obserwowana na częstości 
1407 MHz. Krzyżyk oznacza obiekt optyczny— galaktykę 16** 


synchrotronową emisję fal radiowych. Mechanizm 
ten jest więc ogólnie przyjęty, pozostaje jednak nadal 
nie rozwiązany problem źródeł energii dostarczają¬ 
cych relatywistycznych elektronów. Wysuwane są 
różne koncepcje, jak np. zderzenie galaktyk, ich 
eksplozje czy też ich grawitacyjne zapadanie się. Wy¬ 
magają one jednak jeszcze wielu opracowań, tak że 
nie należy się spodziewać szybkiego rozwiązania tego 
problemu. 

J. D. Kraus Radio Astronomy , New York 1967; G. L. Ver- 
schuur, K. I. Kellermann Galactic and Extra-Gałactic Radio 
Astronomy, New York 1974. 
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Astronomia promieni X i y 

Marcin Kubiak 


Przedmiotem zainteresowania tej nowej i szybko roz¬ 
wijającej się gałęzi astronomii jest pozaziemskie pro¬ 
mieniowanie elektromagnetyczne o długości fali 
mniejszej od ok. 10 nm. Promieniowanie X i y wy¬ 
godnie jest charakteryzować za pomocą energii foto¬ 
nów wyrażonej w kiloelektronowoltach (1 keV = 
= 1000 eV = 1,602 • 10~ lfl J). Długość fali X wyra¬ 
żona w nanometrach jest związana z energią fotonu 
wyrażoną w keV za pomocą związku /(nm) = 124/ 
/£■(keV). Umowną granicą między promieniowaniem 
X i y jest energia 0,51 MeV (1 MeV = 1000 keV) od¬ 
powiadająca energii spoczynkowej elektronu. Fizycz¬ 
ną podstawą rozróżnienia obu rodzajów fotonów 
pochodzenie jest ich pochodzenie: fotony X powstają przede 
fotonów wszystkim w procesach atomowych, natomiast źród- 
X i y łem fotonów y są oddziaływania jądrowe. 

Fotony o energii z omawianego zakresu są całko¬ 
wicie pochłaniane w atmosferze ziemskiej i mogą być 
obserwowane w sposób bezpośredni tylko z pokładów 
wysoko wznoszących się balonów, rakiet i sztucznych 
satelitów Ziemi. Wprawdzie fotony o energiach więk¬ 
szych od ok. 10 n eV można obserwować z powierzchni 
Ziemi za pośrednictwem wielkich pęków atmosferycz¬ 
nych (-* Promieniowanie kosmiczne), jednak zasad¬ 
niczo możliwości obserwacyjne astronomii X i y są 
określone przez stan techniki rakietowej i satelitarnej. 


Metody obserwacji 


Technika odbioru promieniowania X i y zależy od za¬ 
kresu energii, w którym prowadzone są obserwacje. 
Granice poszczególnych zakresów są określone przez 
0,1 keV- właściwości detektorów. 

10 keV 0,1 keV-10 keV (miękkie promieniowanie X). Ob¬ 
serwacje w tym zakresie prowadzi się w zasadzie po¬ 
dobnie jak w dalekim nadfiolecie. Detektorami pro¬ 
mieniowania są rentgenowskie emulsje fotograficzne, 
elektronowe przetworniki obrazów oraz liczniki pro¬ 
porcjonalne. W zakresie tym możliwe jest również 
ogniskowanie promieniowania i tworzenie obrazów 
źródeł dzięki wykorzystaniu posiadanych przez nie¬ 
które powierzchnie metaliczne (np. beryl, glin, nikiel, 
złoto) właściwości odbijania promieniowania X pa¬ 
dającego pod bardzo małymi kątami. Zasadę dzia¬ 
łania teleskopu ogniskującego miękkie promienio¬ 
wanie X wyjaśnia rys. 1. Fotografię takiego teleskopu 
przedstawia ii. 212 (tabl. 57). Obecnie kątowa zdol¬ 
ność rozdzielcza teleskopów tego rodzaju jest rzę¬ 
du 2% choć w niedalekiej przyszłości można spo¬ 
dziewać się jej zwiększania aż do 0,3", tj. do granicy 
określonej przez geometryczną aberrację układu. 

W omawianym zakresie promieniowania możliwe 
jest również prowadzenie obserwacji spektroskopo¬ 
wych; jako elementy dyspersyjne służą metalizowane 



Rys. 1. Zasada działania teleskopu ogniskującego miękkie pro¬ 
mieniowanie X. Użycie dwu zwierciadeł pozwala na skrócenie 
ogniskowej układu 


siatki dyfrakcyjne lub kryształy. Stosunkowo mała 
powierzchnia czynna teleskopów rentgenowskich 
sprawia, że jak dotychczas obserwacje takie zostały 
wykonane z powodzeniem tylko w przypadku Słońca. 

Duże znaczenie dla astrofizyki ma możliwość po¬ 
miaru polaryzacji promieniowania X w tym zakresie. 
Wykorzystuje się do tego celu zjawisko nieizotropo- 
wego rozpraszania spolaryzowanej wiązki fotonów X 
w blokach substancji rozpraszających, np. LiH (rys. 2). 


Rys. 2. Zasada działania 
polarymetru rentgeno¬ 
wskiego. Kąt rozpro¬ 
szenia zależy od kierun¬ 
ku polaryzacji promie¬ 
niowania padającego 



1 keV-20 keV. Detektorami fotonów X o energii 
z tego zakresu są liczniki proporcjonalne. Fotony 
wbiegające do takiego licznika wywołują lawinowe 
wyładowanie elektryczne w gazie wypełniającym prze¬ 
strzeń między anodą i katodą. Ponieważ wielkość wy¬ 
ładowania jest proporcjonalna do energii padającego 
fotonu, połączenie licznika z analizatorem wysokości 
impulsów prądu umożliwia określenie energii reje¬ 
strowanego fotonu (spektroskopia niedyspersyjna). 
Zakres pomiarowy urządzenia ustala się z jednej stro¬ 
ny przez zastosowanie odpowiedniego okna wejścio¬ 
wego, absorbującego wszystkie fotony o energii 
mniejszej od wybranej energii progowej, a z drugiej 
strony — przez właściwości gazu wypełniającego ob¬ 
szar między elektrodami: fotony o energiach bardzo 
dużych mają zbyt mały przekrój czynny na oddziały¬ 
wanie z materią, by wywołać jonizację w danej ilości 
gazu. Ograniczenie pola widzenia urządzenia odbior¬ 
czego osiąga się przez zastosowanie odpowiednich 
kolimatorów mechanicznych umieszczonych przed 
oknem wejściowym (rys. 3). 

10 keV-ok. 300 keV (twarde promieniowanie X). 
Detektorami promieniowania w tym zakresie energii 
są liczniki scyntylacyjne. Zasadniczą częścią licznika 
jest kryształ (o możliwie dużych rozmiarach), w któ¬ 
rym fotony X wywołują błyski luminescencyjne. 
Kryształ taki musi zawierać centra luminescencji wy¬ 
chwytujące elektrony swobodne uwalniane z atomów 
zjonizowanych w wyniku absorpcji lub rozpraszania 
komptonowskiego fotonów X; wychwytowi towarzy¬ 
szy emisja fotonu światła widzialnego. Najczęściej 
używa się kryształów NaJ(Tl)—aktywowanych talem 
kryształów jodku sodu — wysyłających promienio¬ 
wanie widzialne w zakresie długości fali od 420 do 
435 nm. Jedna powierzchnia kryształu pozostaje 
w kontakcie optycznym z fotopowielaczem rejestru¬ 
jącym poszczególne błyski światła widzialnego, pod¬ 
czas gdy pozostałe powierzchnie są zazwyczaj pokryte 
substancjami odblaskowymi w celu zwiększenia ilości 
światła zbieranego przez fotopowielacz. ilość światła 
zawarta w błysku jest tylko w przybliżeniu proporcjo¬ 
nalna do energii kwantu padającego, w związku 
z czym energetyczna zdolność rozdzielcza liczników 


1 keV- 
20 keV 


10 keV-ok. 
300 keV 
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scyntylacyjnych jest znacznie mniejsza niż liczników 
proporcjonalnych i wyraźnie pogarsza się ze wzrostem 
energii kwantów. Dlatego też liczniki scyntylacyjne 
są użyteczne tylko do energii kilkuset keV, chociaż 
w zasadzie reagują one również na przelot kwantów 
o znacznie większych energiach. 


pole widzenia 



b) Rys. 3. Przykłady kolimatorów mechanicznych: a) kolimator 
płytkowy, b) obrotowy kolimator siatkowy 


Obserwacje w tym zakresie energii są skompliko¬ 
wane, ponieważ istnieje niepożądane tło kwantów X 
i y powstających w materialnym otoczeniu licznika 
(obudowa, satelita itp.) pod wpływem szybkich czą¬ 
stek promieniowania kosmicznego. W celu wyelimi¬ 
nowania tego tła, a jednocześnie ograniczenia pola 
widzenia układu odbiorczego, licznik scyntylacyjny 
otacza się dodatkowymi licznikami ekranującymi, 

wysokość ok. 0.7 m 



Rys. 4. Schemat ekranującego licznika scyntylacyjnego. Liczni¬ 
kiem zasadniczym jest kryształ NaJ(TI), scyntylatory ekranujące 
są zbudowane z kryształów CsJ(Tl). Zarejestrowany zostanie tylko 
sygnał pochodzący od licznika głównego w nieobecności sygna¬ 
łów z liczników ekranujących i scyntylatora plastykowego 


tworzącymi z licznikiem głównym układ antykoincy- 
dencyjny. Zasadę działania takiego układu wyjaśnia 
rys. 4. 

0,3 MeV-10 MeV (miękkie promieniowanie y). 0,3 MeV- 
Ponieważ kryształy scyntylacyjne są mało wydajnymi 10 MeV 
detektorami kwantów o tak dużych energiach, nato¬ 
miast są dobrymi detektorami cząstek naładowanych 
elektrycznie, używane obecnie teleskopy y są zaopa¬ 
trzone w układ, który zamienia wbiegający kwant y 
w mniej lub bardziej liczną lawinę cząstek wtórnych 
o mniejszych energiach. W najprostszy sposób można 
to osiągnąć umieszczając na drodze kwantu np. płytę 
ołowianą o odpowiedniej grubości. Cząstki wtórne 
wybite z płyty ołowianej są następnie rejestrowane 
przez licznik lub liczniki scyntylacyjne. Łączna energia 
zawarta w błyskach dawanych przez cząstki wtórne 
jest proporcjonalna do energii kwantu pierwotnego. 

10 MeV-kilkaset MeV. Kwanty o tak dużych ener¬ 
giach są źródłem cząstek wtórnych poruszających się 10 MeV- 
z prędkościami bliskimi prędkości światła, co umożli- kilkaset 
wia zwiększenie dokładności określenia kierunku przy- MeV 
lotu poszczególnych kwantów y bez jednoczesnego 
zawężania całkowitego pola widzenia teleskopu. Jest 
to o tyle ważne, że strumień kwantów o tych energiach 
jest już niezwykle mały i teleskop o małym polu wi¬ 
dzenia rejestrowałby kwanty tak rzadko, że wykorzy¬ 
stywanie do takich obserwacji kosztownych rakiet 
i satelitów byłoby pozbawione celu. Zjawiskiem, któ¬ 
re w tym wypadku wykorzystujemy, jest promienio¬ 
wanie Czerenkowa wysyłane przez szybkie cząstki 
wtórne w bloku przezroczystej substancji o odpo¬ 
wiednio dużym współczynniku załamania (prędkość 
światła w takim ośrodku jest istotnie mniejsza niż 
w próżni). Promieniowanie Czerenkowa pojawia się 
wówczas, gdy przez dany ośrodek przebiega cząstka 
z prędkością większą od prędkości światła w tym oś¬ 
rodku i jest skierowane niemal dokładnie wzdłuż 
drogi cząstki. Oprócz licznika Czerenkowa, pozwala¬ 
jącego określić kierunek biegu cząstek, a tym samym 
również kierunek wlotu pierwotnego kwantu y, na 



Rys. 5. Licznik Czerenkowa. Liczby w półkolach oznaczają fo- 
topowielacze. Zarejestrowany zostanie tylko taki przypadek, 
w którym nie będzie sygnału z ekranu (fotopowielaczc 8-15), 
natomiast nadejdzie sygnał z któregoś z fotopowielaczy /, 2, 3, 
sygnał z co najmniej jednego fotopowielacza 7 i 8 oraz sygnał 
z fotopowielacza 4 lub 4 i 5 


drodze cząstek wtórnych umieszcza się również układ 
wielu scyntylatorów lub komór iskrowych, śledzących 
ruch cząstek wtórnych aż do ich całkowitego wyha¬ 
mowania. Długość drogi hamowania cząstek wtór¬ 
nych jest miarą ich energii początkowej, a więc rów- 
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nież miarą energii pierwotnego kwantu y. Schemat 
teleskopu opisanego typu jest przedstawiony na rys. 5. 

10 11 eV-10 13 eV. Strumień pozaziemskiego promie¬ 
niowania y o energii powyżej ok. 10 10 eV jest zbyt 
mały, by można było prowadzić jego obserwacje za 
pomocą opisanych poprzednio przyrządów wymaga¬ 
jących przecięcia się drogi kwantu z detektorem. Uzy¬ 
skanie znaczącej liczby zliczeń wymaga użycia detek¬ 
torów o rozmiarach porównywalnych z rozmiarami 
Ziemi. Dlatego też do obserwacji kwantów o tak du¬ 
żych energiach wykorzystuje się zjawiska zachodzące 
w atmosferze ziemskiej, a dokładniej — wielkie pęki 
atmosferyczne, czyli rozległe kaskady cząstek wtór¬ 
nych powstające w gazie atmosferycznym pod wpły¬ 
wem promieniowania y. Wtórne cząstki pęku, poru¬ 
szające się z prędkościami większymi od prędkości 
rozchodzenia się światła w atmosferze, są źródłem 
promieniowania Czerenkowa. Promieniowanie to, 
przypadające w dziedzinie widzialnej, może być reje¬ 
strowane przez zwykłe teleskopy optyczne wyposażo¬ 
ne w szybkie kamery fotograficzne i umieszczone na 
powierzchni Ziemi nawet w znacznych odległościach 
od wlotu pierwotnego fotonu y do atmosfery. Błyski 
promieniowania Czerenkowa mają na zdjęciach wy¬ 
gląd kolistych lub wydłużonych plamek o rozmiarach 
kątowych rzędu jednego stopnia (il. 214, tabl. 57). 
Chociaż kształt i orientacja błysków zależą od poło¬ 
żenia osi pęku w stosunku do obserwatora, to jednak 
punkt największej intensywności błysku leży w przy¬ 
bliżeniu w tym kierunku, z którego nadbiegł pierwot¬ 
ny foton y. Długotrwałe obserwacje mogą doprowa¬ 
dzić do stwierdzenia ewentualnego grupowania się 
błysków Czerenkowa w pewnych obszarach nieba, 
a tym samym do wykrycia i zlokalizowania dyskret¬ 
nych źródeł pozaziemskiego promieniowania y. Me¬ 
tody tej nie można by jednak użyć do obserwacji pro¬ 
mieniowania y rozłożonego izotropowo na niebie. 

10 14 eV-10 u eV. Wielkie pęki atmosferyczne wy¬ 
tworzone przez cząstki lub fotony o energiach powy¬ 
żej ok. 10 14 eV dobiegają aż do powierzchni Ziemi, 
gdzie określenie ich składu pozwala jednoznacznie 
stwierdzić, czy źródłem ich był nukleon czy foton. 
Dokładniej mówiąc, w pękach pochodzenia fotono¬ 
wego mniejsza jest zawartość mionów, a więcej jest 
elektronów i pozytonów. Obserwacje promieniowania 
y w tym zakresie prowadzi się więc za pomocą układu 
detektorów cząstek pokrywającego stosunkowo duży 
obszar na powierzchni Ziemi. Kierunek osi pęku, 
pokrywający się w przybliżeniu z kierunkiem przylotu 
pierwotnego fotonu, można wyznaczyć na podstawie 
opóźnień czasowych między sygnałami pochodzący¬ 
mi od różnych liczników. Zazwyczaj, jednocześnie 
z obserwacjami strumieni cząstek wtórnych prowadzi 
się również obserwacje optycznych błysków promie¬ 
niowania Czerenkowa. 


Procesy fizyczne prowadzące do 
emisji promieniowania X i y 

Spośród wszystkich możliwych procesów prowadzą¬ 
cych do emisji promieniowania X i y wyliczymy tylko 
te, które mogą przebiegać w źródłach kosmicznych 
dających się bezpośrednio obserwować. 


Termiczne promieniowanie ciała doskonale 
czarnego 

Wszystkie ciała materialne znajdujące się w warun¬ 
kach równowagi termodynamicznej w temperaturze 
T są źródłami promieniowania termicznego. Zgodnie 
z prawem Plancka, liczba fotonów dq wysłana w prze¬ 
dziale energii de jest opisana przez wyrażenie 

dq ~ exp [(e/kT) — 1]" l de. 


Wydajnym źródłem fotonów X są ciała o tempera¬ 
turze 10®-!O 8 K. Ciało będące równie wydajnym 
źródłem fotonów y musiałoby mieć temperaturę więk¬ 
szą od 10 10 K, jest jednak mało prawdopodobne, by 
ciała doskonale czarne o takich temperaturach wystę¬ 
powały we Wszechświecie. 


Promieniowanie synchrotronowe 

Każda cząstka obdarzona ładunkiem elektrycznym 
poruszająca się w poprzecznym polu magnetycznym 
doznaje przyspieszenia, a tym samym jest źródłem 
promieniowania elektromagnetycznego. Promienio¬ 
wanie to może przypadać w zakresie X i y, jeżeli 
prędkości cząstek są bardzo bliskie prędkości światła 
(cząstki ultra-relatywistyczne). Najwydajniejszym źró¬ 
dłem promieniowania synchrotronowego są elektro¬ 
ny. Jeżeli widmo energetyczne elektronów byłoby 
opisane przez wyrażenie dN/dE ~ E~ a , gdzie dN — 
liczba elektronów o energii zawartej w przedziale dE , 
wówczas energetyczne widmo fotonów promienio¬ 
wania synchrotronowego byłoby postaci 



Odwrotny efekt Comptona 

W procesie tym kwant promieniowania o dużej ener¬ 
gii powstaje w wyniku zderzenia relatywistycznego 
elektronu z kwantem promieniowania o małej 
energii. Widmo fotonów promieniowania X i y po¬ 
wstających w tym procesie jest takie samo jak promie¬ 
niowania synchrotronowego (przy takim samym 
widmie energetycznym świecących elektronów). 


Promieniowanie hamowania 
(Bremsstrahlung) 

Promieniowanie to jest wysyłane przez elektrony 
w rzadkiej i gorącej plazmie, doznające przyspieszeń 
w polach elektrostatycznych ciężkich cząstek obda¬ 
rzonych ładunkiem dodatnim. Mechanizm ten różni 
się od omówionych poprzednio pod dwoma ważnymi 
względami. Po pierwsze, elektrony wysyłające pro¬ 
mieniowanie hamowania w zakresie X i y mogą mieć 
energię niewiele przewyższającą energię wysyłanych 
fotonów, innymi słowy mogą być nierelatywistyczne. 
Po drugie, mechanizm ten jest niezwykle wydajny, 
tzn. nawet stosunkowo niewielkie ilości plazmy mogą 
być źródłem intensywnego promieniowania hamo¬ 
wania. W przypadku plazmy znajdującej się w stanie 
równowagi statystycznej, której elektrony mają 
energie opisane przez rozkład Maxwella, widmo 
energetyczne emitowanych fotonów jest postaci 

e -<«/*r>/ £ . 

de 


Procesy jądrowe 

Emisja promieniowania y towarzyszy praktycznie 
wszystkim procesom jądrowym wywoływanym przez 
oddziaływania silne i elektromagnetyczne. Procesy, 
które mogą być źródłami kosmicznego promienio¬ 
wania y, to przede wszystkim rozpad mezonów 7i° t 
anihilacja par cząstek materii i antymaterii, deckscy- 
tacja jąder wzbudzonych oraz rozpad jąder ciężkich. 

Mezony 7i° są cząstkami nietrwałymi, rozpadają¬ 
cymi się na dwa fotony y z połówkowym czasem 
rozpadu 2-10" 18 s. W układzie odniesienia związa¬ 
nym z mezonem oba fotony mają energię W 0 — 67,5 
MeV. W układzie obserwatora, w którym mezony 7i° 


rozpad 
mezonów a° 
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mogą mieć bardzo duże prędkości, ener gie fotonów y 
mogą zawierać się w przedziale od (1 - /?)/(1 +P) 
do ir 0 j/(l ł MO ~ M gdzie /? — stosunek prędkości 
mezonu do prędkości światła. Ponieważ mezony pro¬ 
dukowane w źródłach kosmicznych mają zapewne 
różne prędkości, widmo fotonów y pochodzących 
z ich rozpadu jest rozmyte i ma maksimum w pobliżu 
energii W 0 . Reakcjami, w których mogą się tworzyć 
mezony n° pochodzenia kosmicznego, są przede 
wszystkim zderzenia bardzo szybkich protonów z pro¬ 
tonami, cząstkami a i fotonami o małych energiach, 
anihilacja Zderzenie elektronu z pozytonem prowadzi do 
e anihilacji obu cząstek z jednoczesną emisją dwóch 
fotonów y . W przypadku anihilacji w spoczynku oba 
fotony mają energię 0,51 MeV. W zderzeniach o nie- 
zerowej energii jeden z fotonów unosi niemal całą 
energię kinetyczną cząstek, podczas gdy drugi foton 
unosi tylko energię spoczynkową 0,51 MeV. 
anihalacja pp Anihilacja proton-antyproton prowadzi do pro¬ 
dukcji mezonów n , w tym również mezonów n° f 
które rozpadają się następnie z emisją fotonów y. 
Średnio jeden proces anihilacji proton-antyproton 
jest źródłem 3,5 fotonów y. 


Emisyjne limę XI y 

Oprócz wymienionych wyżej mechanizmów produkcji 
fotonów X i y o ciągłym rozkładzie widmowym istnie¬ 
ją również procesy prowadzące do powstania fotonów 
o ściśle określonych energiach. Źródłem linii widmo¬ 
wych przypadających w rentgenowskim zakresie 
widma są atomy pierwiastków ciężkich, w których — 
np. wskutek zderzeń — zostały wzbudzone elektrony 
z najniższych powłok elektronowych, tzw. powłok K. 
Przejściu elektronu z powłoki wyższej na wolne 
miejsce w powłoce K towarzyszy wysłanie fotonu X 
o ściśle określonej energii. Każdy pierwiastek wysyła 
charakterystyczne dla siebie linie. 

Reakcje jądrowe przebiegające w źródłach kosmicz¬ 
nych lub pojedyncze zderzenia szybkich cząstek z ją¬ 
drami ciężkimi mogą prowadzić do powstania jąder 
wzbudzonych. Kwantowym przejściom jąder ze 
stanów wzbudzonych do stanów podstawowych 
towarzyszy emisja fotonów y o charakterystycznych 
dla danego jądra energiach. Źródłem linii y są również 
rozpadające się jądra pierwiastków promieniotwór¬ 
czych. 


Obserwacje pozaziemskich źródeł 
promieniowania X i y 


Słońce 

Słońce jest najsilniejszym źródłem promieniowania X 
i miękkiego promieniowania y na niebie. Jego obser¬ 
wacje w tych zakresach energii, rozpoczęte przed ok. 
dwudziestu laty, dostarczyły już nam bardzo dużej 
ilości informacji o procesach wielkich energii prze¬ 
biegających w obszarach koronalnych. Spokojne 
Słońce jest źródłem miękkiego promieniowania X 
o widmie ciągłym, wysyłanego przez rozrzedzony gaz 
korony o temperaturze ok. 1,5 min stopni (il. 213, 
tabl. 57). W okresach wzmożonej aktywności na wid¬ 
mo to nakłada się promieniowanie obszarów aktyw¬ 
nych zawierające znacznie twardsze promieniowanie 
ciągłe oraz liczne emisyjne linie widmowe w dziedzinie 
X i y. Widmo liniowe obszarów aktywnych jest naj¬ 
prawdopodobniej promieniowaniem hamowania wy¬ 
syłanych przez strumienie szybkich elektronów poru¬ 
szających się w plazmie korony. Liniowe widmo X po¬ 
chodzi z przejść elektronowych w powłokach wielo¬ 
krotnie zjonizowanych atomów pierwiastków cięż¬ 
kich. W liniowym widmie y zidentyfikowano linię 0,5 


MeV pochodzącą z anihilacji par elektron-pozyton, li¬ 
nię 2,2 MeV pochodzącą z reakcji wychwytu neutronu 
przez jądro wodoru: rt + p -*• dĄ y, gdzie d oznacza 
jądro ciężkiego wodoru — deuteron, oraz linie pow¬ 
stające podczas deekscytacji wzbudzonych jąder 
C 12 (4,4 MeV) i O 16 (6,1 MeV). Przykłady widm roz¬ 
błysków słonecznych są przedstawione na rys. 6. 



b) energia (w jednostkach dowolnych) 

Rys. 6. Widmo promieniowania obszaru aktywnego na Słońcu: 
a) w zakresie miękkiego promieniowania X, b) w zakresie mięk¬ 
kiego promieniowania y 


Pierwsze obserwacje źródeł pozasłonecznych 

Pierwszej udanej obserwacji źródła promieniowania 
X znajdującego się poza Układem Słonecznym doko¬ 
nano 12 VI 1962 r. podczas trwającego 350 s lotu 
rakietowego. Urządzenie odbiorcze (il. 216, tabl. 58) 
stanowił licznik Geigera, którego wlot był przesłonięty 
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wykrycie scyntylatorem tworzącym z licznikiem układ anty- 
źródła koincydencyjny i mającym za zadanie eliminację 
Sco X-1 zliczeń pochodzących od cząstek promieniowania 
kosmicznego. Zależność liczby zliczeń od kąta po¬ 
zycyjnego odbiornika wskazywała na obecność w 
gwiazdozbiorze Scorpius dość silnego źródła miękkie¬ 
go promieniowania X . Mała kątowa zdolność roz¬ 
dzielcza nie pozwalała dokładnie umiejscowić źródła, 
była jednak wystarczająca, by jako źródła odbierane¬ 
go promieniowania można było wykluczyć ciała 
układu planetarnego. Na uwagę zasługiwał również 
fakt, że zliczenia w żadnym kierunku nie malały do 
zera, co świadczyło o istnieniu ogólnego tła promie¬ 
niowania X . Wkrótce potem na podstawie innych 
obserwacji można było stwierdzić, że źródłem pro¬ 
mieniowania X jest również okolica nieba, w której 
znajduje się pozostałość po wybuchu supernowej — 
Mgławica Krab. Obserwacje wykonane 7 VII 1964 r. 
podczas zaćmienia tej okolicy nieba przez Księżyc 
pozwoliły stwierdzić, że źródłem promieniowania 
jest zarówno sama mgławica, jak i obszar o średnicy 
ok. T położony wewnątrz niej. Była to pierwsza 
optyczna identyfikacja kosmicznego źródła promie¬ 
niowania X. Identyfikacji źródła w gwiazdozbiorze 
Scorpius dokonano w 1966 r. Obiektem optycznym 
okazała się niebieska gwiazda 13 m mająca w widmie 
emisyjne linie wodoru i zjonizowanego helu, wykazu¬ 
jąca stosunkowo szybkie i nieregularne zmiany ja¬ 
sności. Źródło to nazwano ScoX-l. (Początkowo 
nazwa źródła składała się ze skróconej nazwy gwiazdo¬ 
zbioru, w którego kierunku znajduje się źródło, oraz 
kolejnego numeru odpowiadającego kolejności od¬ 
krycia, pokrywającej się zazwyczaj z kolejnością 
według natężenia promieniowania; litera X wskazy¬ 
wała na rentgenowski charakter źródła. W miarę 
odkrywania coraz to większej liczby źródeł utarł się 
nazwy zwyczaj tworzenia nazwy źródła z symbolu satelity, 
źródeł który źródło to obserwował, oraz liczb podających 
przybliżone współrzędne równikowe, np. 3U1617-60 
A 0620-00 itp.). Optyczne cechy źródła Sco X-l, 
a zwłaszcza fakt, że w dziedzinie rentgenowskiej 
wysyła ono w przybliżeniu tysiąc razy więcej energii 
niż w dziedzinie widzialnej, dowodziły, że odkryto 
obiekt gwiazdowy, którego istnienia nie można było 
przewidzieć na podstawie dotychczasowych danych 
o źródłach optycznych i radiowych. Ten pierwszy 
wielki sukces astronomii rentgenowskiej spowodował 
jej dalszy szybki rozwój. Przełomowym momentem 
było wysłanie 12X11 1970 r. satelity Uhuru, który 
miał wyłącznie obserwować promieniowanie X. Jego 

szukacz szukacz 
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zadaniem było dokonanie przeglądu całego nieba satelita 
w zakresie energii od 2 do 20 keV. Schematyczny Uhuru 
wygląd takiego satelity jest przedstawiony na rys. 7 . 

Był on wyposażony w dwa niezależne układy odbior¬ 
cze, z których każdy składał się z licznika proporcjo¬ 
nalnego przesłoniętego oknem berylowym i kolima- 
torem mechanicznym. Jedno urządzenie odbiorcze 
miało pole widzenia 1/2° x 5° i rejestowało fotony 
do 30 keV, drugie miało pole widzenia 5°x5° i reje¬ 
strowało fotony do 10 keV. Każdy detektor był wy¬ 
posażony w ośmiokanałowy analizator impulsów, 
dzięki czemu można było uzyskać ośmiopunktowe 
widma obserwowanego promieniowania. Czasowa 
zdolność rozdzielcza zliczeń mogła być w ograniczo¬ 
nym zakresie zmieniana i wynosiła 0,096 s, 0,192 s 
lub 0,384 s. Detektory mogły wykrywać źródła dające 
ok. 2 - 10 -3 zliczeń na cm 2 i sekundę, co odpowiada 
strumieniowi energii rzędu 10 “ 15 J -cm " 2 • s" 1 . W ciągu 
ok. 2 lat działania aparatury pomiarowej satelita 
dokonał przeglądu całego nieba, a uzyskane wyniki 
posłużyły do sporządzenia katalogu źródeł promie¬ 
niowania X obejmującego 161 obiektów, których 
położenia pa niebie są określone z dokładnością rzędu 
jednej dziesiątej stopnia kwadratowego. 

Ostateczny katalog źródeł rentgenowskich obser¬ 
wowanych przez satelitę Uhuru, tzw. katalog 3U. jest 
podstawą dalszych prac obserwacyjnych i teoretycz¬ 
nych. 


Rozkład źródeł promieniowania X na niebie 

Rysunek 8 przedstawia rozkład źródeł rentgeno¬ 
wskich we współrzędnych galaktycznych. Już na 
pierwszy rzut oka sugeruje on istnienie dwu rodzajów 
źródeł. Część ich wyraźnie skupia się wokół płaszczyz¬ 
ny Galaktyki, co pozwala przypuszczać, że są to 
źródła galaktyczne i że tworzą one podsystem płaski 
( 7 * Galaktyki). Pozostałe źródła są rozmieszczone na 
niebie mniej więcej izotropowe i najprawdopodobniej 
są pochodzenia pozagalaktycznego. Przypuszczenia te 
znajdują potwierdzenie zarówno w statystycznych 
badaniach, jak i w istniejących identyfikacjach optycz¬ 
nych. Źródła skupione wokół płaszczyzny Galaktyki 
mają średnio większe obserwowane jasności rentge¬ 
nowskie niż źródła o rozkładzie izotropowym. Wyzna¬ 
czenie ich rentgenowskiej jasności absolutnej wymaga 
znajomości ich odległości od nas. Wówczas gdy od¬ 
ległość tę możemy ocenić w sposób pośredni otrzy¬ 
mujemy jasność absolutną rzędu 10 31 J s" 1 , co jest 
zgodne z wynikami wyznaczeń jasności absolutnej 
źródeł w Wielkim Obłoku Magellana, którego od¬ 
ległość jest znana. Oceniona na tej podstawie łączna 
jasność rentgenowska Galaktyki jest rzędu 2-10 32 J • 
•s -1 (dla porównania, energetyczną jasność absolutną 
Galaktyki we wszystkich zakresach widmowych oce¬ 
nia się na 10 37 J *s“ 1 ). Podobną absolutną jasność 
rentgenowską ma również galaktyka M31 w gwiazdo¬ 
zbiorze Andromedy. 


Tło promieniowania XI y 

Rozmyte i najprawdopodobniej izotropowe promie¬ 
niowanie X i y zostało wykryte już w najwcześniejszych 
eksperymentach i od tej chwili było przedmiotem 
wielu obserwacji. Na rys. 9 zebrane są wyniki róż¬ 
nych obserwacji dotyczących widma tego promienio¬ 
wania. Jak dotychczas nie udało się jeszcze wyjaśnić 
w sposób zadowalający pochodzenia tego promienio¬ 
wania. Może ono być zarówno pochodzenia lokalne¬ 
go, tzn. powstawać w naszej Galaktyce, jak i pocho¬ 
dzenia pozagalaktycznego, tzn. powstawać albo 
w przestrzeni międzygaiaktycznej, albo być sumą 
wielu nierozdzielonych źródeł pozagalaktycznych. 
Wydaje się jednak, że ta ostatnia możliwość jest 
najmniej prawdopodobna, choć nie można wyklu¬ 
czyć istnienia pewnej składowej pozagalaktycznej, 









Rys. 8. Rozkład źródeł katalogu 3U we współrzędnych galaktycznych 



Rys. 9. Widmo tła rentgenowskiego. Różne symbole odpowia¬ 
dają różnym eksperymentom 


nakładającej się na tło produkowane w naszej Galak¬ 
tyce. Jednoznaczne rozwiązanie problemu pochodze¬ 
nia tła rentgenowskiego będzie miało duże znaczenie 
dla poznania warunków fizycznych panujących w od¬ 
ległych obszarach przestrzeni międzygalaktycznej 
i międzygwiazdowej. 


Źródła podwójne 

Kilka spośród znanych źródeł wykazuje periodyczne 
zmiany jasności rentgenowskiej. Okresy tych zmian, 
od 4,8 h (Cyg X-3) do 8,95 d (Ve!aX-l) świadczą 
o tym, że obiekty te mogą należeć do klasy ciasnych 
układów podwójnych (-> Ewolucja gwiazd). Przy¬ 
puszczenie to znalazło pełne potwierdzenie po doko¬ 
naniu identyfikacji dwu spośród tych źródeł (Cen X-3 
i HerX-l) z układami zaćmieniowymi o okresach zać¬ 
mień optycznych równych okresom zaćmień rentge¬ 
nowskich (2,067 d dla CenX-3 i 1,7 d dla Her X-l). 
Oba te źródła są tym bardziej interesujące, że ich 
składniki rentgenowskie są jednocześnie pulsarami 
rentgenowskimi (-> Pulsary), tzn. wysyłają promie¬ 
niowanie X w postaci bardzo krótkich impulsów po¬ 
wtarzających się co 4,8 s (Cen X-3) i 1,24 s (Her X-l). 
Liczne i różnorodne dane obserwacyjne — zarów¬ 
no rentgenowskie, jak i optyczne — pozwoliły opra¬ 
cować dość prawdopodobny model tych źródeł: 
Układ podwójny złożony jest z normalnej gwiazdy 
o cechach charakterystycznych dla gorącego olbrzyma 
i masie kilku lub kilkunastu mas Słońca, wokół które¬ 
go po ciasnej orbicie kołowej krąży obracająca się 
szybko gwiazda neutronowa o masie rzędu 1 masy 
Słońca. Rozrzedzony strumień materii wypływający 
z pierwszej gwiazdy (np. w postaci wiatru gwiazdowe¬ 
go) jest częściowo wychwytywany przez gwiazdę 
neutronową i wzdłuż linii sił pola magnetycznego 
spływa w jej obszary biegunowe. Ze względu na małe 
rozmiary gwiazdy neutronowej (rzędu kilku kilomet¬ 
rów) pole grawitacyjne w jej pobliżu ma ogromne 
natężenie. Cząstki rozrzedzonego strumienia materii 
opadające na gwiazdę neutronową mogą wyzwalać 
ogromne ilości energii grawitacyjnej, która ulega 
przemianie w energię cieplną, a następnie — za 
pośrednictwem jednego z mechanizmów wspomnia¬ 
nych na wstępie — w energię promieniowania X. 
Szybki obrót gwiazdy neutronowej wokół osi nachy¬ 
lonej względem osi pola magnetycznego sprawia, że 
promieniowanie wysyłane przez obszary biegunowe 
dobiega do nas w postaci regularnych impulsów. 

Innym źródłem niezmiernie interesującym, a zara¬ 
zem zagadkowym, jest Cyg X-l. Wykazuje ono bar¬ 
dzo skomplikowane zmiany jasności rentgenowskiej. 


„niebo 

rentge¬ 

nowskie" 


źródła 
CenX-3 i 
Her X-1 


model: 
gorący 
olbrzym 
i gwiazda 
neutronowa 
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źródło optycznej i radiowej. Zostało ono zidentyfikowane ze 
Cyg-X1 zmienną spektroskopową o okresie 5,6 d. Okresowość 
ta nie występuje jednak w zmianach jasności optycz¬ 
nej i rentgenowskiej. Promieniowanie X dobiega do 
nas w postaci ciągów impulsów trwających od 1 ms 
do 100 ms, które jednak nie powtarzają się ściśle perio¬ 
dycznie. Analiza obserwacji w dziedzinie optycznej, 
wielkość amplitudy prędkości radialnych oraz cechy 
widmowe gwiazdy widocznej prowadzą do wniosku, 
że jeżeli jest to zwykły układ podwójny, wówczas 
składnik niewidoczny musi mieć masę co najmniej 
kilku mas Słońca. Jedynym trwałym obiektem o bar¬ 
dzo małych rozmiarach i o takiej masie może być 
tylko czarna dziura (—► Czarne dziury i zapadanie 
grawitacyjne). Wprawdzie interpretacja ta nie jest ko¬ 
nieczna (Cyg X-1 może być np. układem potrójnym), 
mimo to obecnie Cyg X-1 jest najbardziej prawdo¬ 
podobnym układem zawierającym taki obiekt. 


Pozostałości supernowych 

Emisję promieniowania rentgenowskiego obserwuje 
się z kilkunastu mgławic będących niewątpliwie po¬ 
zostałościami po wybuchach supernowych w naszej 
Galaktyce. Najlepiej poznanym obiektem tego typu 
mgławica jest mgławica Krab i znajdujący się wewnątrz niej 
Krab Pulsar (radiowy, optyczny i rentgenowski) NP0531. 
Źródłem emisji X jest obszar mgławicy mający śred¬ 
nicę ok. 100" (il. 215, tabl. 58). Ok. 15% energii zawar¬ 
te jest w pulsach o okresie 33 ms, przy czym pulsy rent¬ 
genowskie są zgodne w fazie z pulsami optycznymi 
i radiowymi. Mgławica Krab jest również źródłem 
promieniowania y o energii większej od 10 11 eV 
(obserwowany strumień 4-10 -11 r otonów cm~ 2 -s _1 ). 
W przedziale 2-20 keV od mgławicy Krab dobiega 
do nas strumień równy 2-10~ 15 J^cm" 2 ^" 1 , co przy 
znanej odległości 2 kps daje absolutną jasność rent¬ 
genowską 1,5-10 30 J*s~ 1 . Stwierdzone w dziedzinie 
radiowej spowalnianie obrotu pulsara wskazuje na 
utratę energii rotacyjnej rzędu 3 -10 31 J-s" 1 . Wystar¬ 
cza to do podtrzymywania jasności samego pulsara 
jak i otaczającej go mgławicy. Nawiasem mówiąc, 
pulsar NP0531, odkryty najpierw jako pulsar ra¬ 
diowy a następnie optyczny, jest przede wszystkim 
pulsarem rentgenowskim, wysyłającym w zakresie X 
sto razy więcej energii niż w dziedzinie widzialnej 
i sto tysięcy razy więcej w dziedzinie radiowej, 
mgławica Równie interesującym obiektem tego typu jest 
Vela X mgławica Vela X, zawierająca pulsar radiowy 
PS R 0833-45. Jest ona pozostałością supernowej 
nieco starszą od mgławicy Krab. Źródłem promienio¬ 
wania X jest zarówno rozległa mgławica, jak i pulsar 
(il. 217, tabl. 58). Część energii promieniowania A^jest 
modulowana z okresem radiowym pulsara. Chociaż 
mgławica Vela X ma wiele cech wspólnych z mgławi¬ 
cą Krab, to jednak ze względu na swą większą roz¬ 
ległość w przestrzeni i starszy wiek może dostarczyć 
wielu interesujących informacji na temat oddziały¬ 
wania rozszerzającej się powłoki supernowej z materią 
międzygwiazdową. Efekty te, nie dające się jeszcze 
zauważyć u mgławicy Krab, są już dość silnie zazna¬ 
czone w promieniowaniu mgławicy VelaX. 


Chwilowe źródła promieniowania X 
(nowe rentgenowskie) 

Obserwacje prowadzone w latach 1971-75 doprowa¬ 
dziły do wykrycia pięciu interesujących źródeł o wy¬ 
raźnie aperiodycznym charakterze zmian jasności 
rentgenowskiej. Wspólną cechą tych źródeł jest 
szybki wzrost jasności o kilka rzędów wielkości w cią¬ 
gu dnia lub kilku dni, a następnie stosunkowo po¬ 
wolny spadek w skali czasowej rzędu miesięcy. Wzro¬ 
stowi jasności towarzyszy na ogół zmiana widma. 
Najwięcej obserwacji zebrano dla źródła A0620-00, 
a ponadto jego położenie zostało określone z tak dużą 
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dokładnością, że udało się dokonać jego identyfikacji nowa 
optycznej z gwiazdą, która w okresie wzrostu jasności Monocerotis 
rentgenowskiej zwiększyła swą jasność optyczną 
z 18™ do ll m . Jednocześnie, na podstawie archiwal¬ 
nych zdjęć nieba stwierdzono, że ta sama gwiazda 
zwiększyła w podobny sposób swoją jasność opty¬ 
czną ok. 70 lat temu. Pozwoliło to zaliczyć obiekt 
do kategorii gwiazd nowych powrotnych. Nowa 
Monocerotis (jak nazwano to źródło) różniła się 
jednak w istotny sposób od innych gwiazd tej grupy; 
po pierwsze — jej widmo optyczne różniło się od 
widm nowych powrotnych; a po drugie,w maksimum 
jasności promieniowała ona ok. tysiąca razy więcej 
energii w dziedzinie rentgenowskiej niż w dziedzinie 
optycznej, czego nie obserwowano u nowej Cygni 
1975 (zresztą jedynego innego obiektu, dla którego 
prowadzone były takie obserwacje). Mechanizm 
wybuchów nowych rentgenowskich nie iest jeszcze 
znany. Przypuszcza się tylko, że obiekty te są ukła¬ 
dami podwójnymi o dość dużych orbitach, a poja¬ 
wienie się emisji rentgenowskiej jest wynikiem akrecji 
materii przez jeden ze składników, wzmożonej w wy¬ 
niku np. okresowej aktywności drugiego składnika. 

Rozbłyskowe źródła promieniowania X i y 

Istotny wzrost czasowej zdolności rozdzielczej urzą¬ 
dzeń odbiorczych oraz coraz większa liczba satelitów 
prowadzących obserwacje w zakresie X i y dopro¬ 
wadziły do odkrycia w ciągu ostatnich kilku lat 
kilkunastu źródeł wysyłających promieniowanie w po¬ 
staci impulsów trwających od kilku sekund do kilku¬ 
dziesięciu milisekund. Impulsy te pojawiają się nie¬ 
periodycznie i różnią się między sobą całkowitą 
ilością zawartej w nich energii. W niektórych wypad¬ 
kach stwierdza się istnienie korelacji między energią 
zawartą w impulsie i czasem, po którym pojawia się 
następny impuls: im większa energia impulsu, tym 
później pojawia się następny impuls. Pierwsze identy¬ 
fikacje optyczne tych źródeł wskazywały, że obser¬ 
wowane rozbłyski pochodzą z gromad kulistych. 9 r omady 
Obecnie znane są jednak również źródła rozbłyskowe kuliste 
nie dające powiązać się z tymi obiektami. Podobne 
rozbłyski obserwowane były również przez urządze¬ 
nia odbierające promieniowanie y. Ponieważ obser¬ 
wacje w zakresie y są prowadzone zazwyczaj nieza¬ 
leżnie od obserwacji promieniowania X y początkowo 
sądzono, że oba rodzaje rozbłysków mają różne 
pochodzenie. Obecnie przeważa przypuszczenie, że 
źródłami obu rodzajów rozbłysków są te same obiekty. 

Pochodzenie rozbłysków nie zostało jeszcze wyjaśnio¬ 
ne. Przypuszcza się tylko, że mogą one być następ¬ 
stwem okresowego opróżniania się „rezerwuarów’* 
plazmy istniejących w pobliżu obiektów masywnych 
o małych rozmiarach (np. gwiazd neutronowych lub 
czarnych dziur) i prawdopodobnie wchodzących 
w skład układów podwójnych. 

Źródła pozagalaktyczne 

Pozagalaktyczne źródła promieniowania X mają nie¬ 
wielką obserwowaną jasność rentgenowską i są znacz¬ 
nie trudniejsze do wykrycia. Trudniejsze jest również 
określenie ich pozycji na niebie z taką dokładnością, 
by możliwe było dokonanie ich identyfikacji optycz¬ 
nych. Spośród 60 źródeł z katalogu 3U leżących 
w dużych szerokościach galaktycznych i będących 
prawdopodobnie źródłami pozagalaktycznymi więk¬ 
szość nie została jeszcze zidentyfikowana. Źródłami 
promieniowania X są natomiast z pewnością najbliż¬ 
sze nas galaktyki: Wielki i Mały Obłok Magellana 
(w których zidentyfikowano również źródła punkto¬ 
we) oraz M31. Ich absolutna jasność rentgenowska 
jest niewielka i zbliżona do jasności rentgenowskiej 
naszej Galaktyki; jako źródła rentgenowskie obser¬ 
wujemy je tylko ze względu na małą odległość. Wśród 
obiektów leżących w znacznie większych odległoś- 
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ciach, promieniowanie rentgenowskie stwierdzono 
u jednej galaktyki Seyferta (NGC 4151), u kilku galak¬ 
tyk aktywnych (będących jednocześnie silnymi radio¬ 
źródłami lub wykazującymi inne oznaki aktywności), 
u najjaśniejszego kwazara (3C 273) oraz u kilku¬ 
nastu gromad galaktyk. Obserwacje gromad galaktyk 
mogą przynieść szczególnie interesujące wyniki, jeżeli 
tylko uda się stwierdzić pochodzenie wysyłanego 
przez nie promieniowania X. Jeżeli jego źródłem 


okaże się np. rozproszona materia międzygalaktyczna obserwacje 
w obrębie gromady, fakt ten będzie miał istotny gromad 
wpływ na rozstrzygnięcie problemu dynamicznej galaktyk 
stabilności gromad galaktyk. 

H. Bradt, R. Giacconi (cd.) X - and gamma-Ray Astronomy , 

Dordrecht 1973; R. Giacconi, H. Gursky (cd.) X-Ray Astrono¬ 
my, Dordrecht 1974; S. Kane (cd.) Solar gamma , X and EUV 
Radiation, Dordrecht 1975; F. McDonald, C. Fichtel (cd.) 

High Energy Particles and Quanta in Astrophysics , Cambridge 
1974. 


Astronomia w podczerwieni 

Marcin KubiaK 


Nazwą podczerwieni obejmujemy promieniowanie 
elektromagnetyczne o długościach fal zawartych 
w przedziale od ok. 1 pm (10 000 A) do ok. 1000 pm 
(1 mm). Podczerwień jest przedłużeniem widma wi¬ 
dzialnego w kierunku fal dłuższych i podlega tym 
samym prawom optyki geometrycznej; do skupiania 
promieniowania podczerwonego używa się zwykłe 
teleskopy optyczne. Możliwość obserwowania w pod¬ 
czerwieni z powierzchni Ziemi jest ograniczona przede 
wszystkim przez absorpcyjne właściwości jej atmo¬ 
sfery. Poszczególne składniki atmosfery, a zwłaszcza 
para wodna (H 2 0), dwutlenek węgla (COJ oraz 
ozon (0 3 ), mają silne pasma absorpcyjne w omawia¬ 
nym przedziale widmowym. Pomiędzy tymi pasmami 
istnieje jednak kilka zakresów, tzw. okien, w których 
atmosfera ziemska jest niemal zupełnie przezroczysta. 
Zależność przepuszczalności atmosfery ziemskiej od 
długości fali promieniowania podczerwonego, odno¬ 
sząca się do średniej atmosfery (zawierającej normalną 
ilość pary wodnej, dwutlenku węgla i ozonu), jest 
przedstawiona na rys. 1. Chwilowe zmiany składu 
chemicznego atmosfery, a zwłaszcza jej wilgotności, 
powodują zmiany szerokości oraz przezroczystości 
poszczególnych okien. Innym zjawiskiem decydują¬ 
cym o wielkości osłabienia promieniowania pod- 



całkowitą absorpcję promieniowania. Literami zaznaczone jest 
przybliżone położenie poszczególnych pasm fotometrii szeroko¬ 
pasmowej opisanych dokładniej w tabeli 


czerwonego w atmosferze ziemskiej jest rozpraszanie 
na cząstkach materialnych (mgła, smog, pył). Wiel¬ 
kość tego rozpraszania zależy od rozmiarów cząstek 
i ich koncentracji, natomiast nie zależy prawie od 
długości fali. Obserwacje w podczerwieni należy 
więc prowadzić przede wszystkim z miejsc położo¬ 
nych wysoko nad poziomem morza, w okolicach 
bardzo suchych i wolnych od zanieczyszczeń pyło¬ 
wych. Z obserwacyjnego punktu widzenia zaletą 
promieniowania podczerwonego jest fakt, iż nie ulega 
ono rozproszeniu na atomach i cząsteczkach gazów 
rozpraszanie znajdujących się w atmosferze (tzw. rozpraszanie Ray- 
promienio- leigha, którego wynikiem jest barwa nieba w dzień). 

wania W zakresie podczerwonym nie ma zatem różnicy 
podczerwo- między jasnością nieba nocnego i dziennego, co spra¬ 
nego wia, że obserwacje w podczerwieni można prowadzić 


również w ciągu dnia. Przy obserwacjach spoza 
atmosfery ziemskiej lub spoza jej najgęstszych warstw 
(z pokładów wysoko lecących samolotów, balonów 
stratosferycznych, rakiet i sztucznych satelitów) 
dostępny jest oczywiście cały zakres promieniowania 
podczerwonego. 

Rejestracja promieniowania podczerwonego wy- detektory 
maga specjalnych urządzeń odbiorczych (detektorów) promienio- 
odznaczających się dużą czułością oraz niskim po- wania 
ziomem szumów w interesującym nas zakresie długo- podczerwo- 
ści fal. Brak takich odbiorników był głównym powo- nego 
dem, dla którego obserwacje w podczerwieni na dużą 
skalę zostały podjęte stosunkowo niedawno. Chociaż 
pierwsze pomiary promieniowania podczerwonego 
Słońca, Księżyca, planet i niektórych najjaśniejszych 
gwiazd zostały wykonane w latach 30-ych XX w., to 
jednak za datę narodzin astronomii w podczerwieni 
należy uznać początek lat 60-ych, gdy dzięki rozwo¬ 
jowi techniki półprzewodnikowej oraz techniki otrzy¬ 
mywania niskich temperatur uzyskano detektory 
o czułości wystarczającej do rejestracji promienio¬ 
wania nawet słabych źródeł pozaziemskich. Na rys. 2 
przedstawiona jest czułość widmowa niektórych 
stosowanych obecnie fotokatod. W zakresie tzw. 
bliskiej podczerwieni (długość fali od 1 pm do ok. 



Rys. 2. Widmowa czułość kilku substancji będących detektorami 
promieniowania podczerwonego. Podane są również tempera¬ 
tury, w których detektory te pracują 


5 jtm) energia niesiona przez fotony promieniowania 
jest wystarczająca do wywołania zjawiska foto- 
elektrycznego w substancji pokrywającej fotokatodę 
(Pbs, InSb). Energia niesiona przez fotony o długości 
fali większej od ok. 5 pm (przeciętnie kilkaset razy wewnętrzne 
mniejsza od energii fotonów promieniowania wi- zjawisko 
dzialnego) jest wystarczająca do spowodowania tzw. fotoelektry- 
wewnętrznego zjawiska fotoelektrycznego. (zmiany czne 
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przewodnictwa kryształu półprzewodnikowego pod 
wpływem promieniowania podczerwonego) w pół¬ 
przewodnikach, do których zostały wprowadzone 
odpowiednie domieszki (Ge:Hg, Ge:Cu, Ge:Ga 
itp.). Wszystkie substancje czułe na obecność pro¬ 
mieniowania podczerwonego są detektorami wydaj¬ 
nymi dopiero w bardzo niskich temperaturach (po¬ 
danych również na rys. 2). Chłodzenie detektorów 
ma na celu odpowiednie zmniejszenie poziomu szu¬ 
mów, czyli chaotycznych sygnałów będących następ¬ 
stwem termicznych ruchów cząstek materii samego 
detektora. Obecnie możliwości detekcji promienio¬ 
wania podczerwonego sa określone wyłącznie przez 
poziom szumów mierzonego promieniowania. 

Podstawową trudnością przy obserwacjach w pod¬ 
czerwieni jest wyodrębnienie promieniowania poza¬ 
ziemskiego spośród promieniowania wysyłanego 
przez otoczenie detektora. Źródłem promieniowania 
podczerwonego jest każde ciało o temperaturze 
wyższej od zera bezwzględnego, a zwłaszcza ciała 
o temperaturze kilkuset stopni K. Niepożądane 
promieniowanie podczerwone wysyła więc zarówno 
atmosfera ziemska (promieniująca jak ciało o tempe¬ 
raturze rzędu 0°C), jak i poszczególne elementy 
teleskopu znajdującego się w polu widzenia detektora 
(obiektyw, zwierciadła wtórne itp.). Wpływ promie¬ 
niowania otoczenia na uzyskane wyniki można wy¬ 
datnie zmniejszyć lub całkowicie wyeliminować przez 
staranne i częste wzorcowanie urządzenia obserwa¬ 
cyjnego lub przez zastosowanie sygnału modulowa¬ 
nego w zadany sposób. 

Obserwacje pozaatmosferyczne nie zostały jeszcze 
podjęte na szerszą skalę, pomimo szybkiego rozwoju 
techniki lotów satelitarnych, i ograniczają się na 
razie do krótkotrwałych lotów rakietowych, które 
zresztą, ze względu na krótki efektywny czas obser¬ 
wacji — rzędu kilku minut — są stosunkowo kosz¬ 
towne. Główną przeszkodą w podjęciu znacznie eko- 
nomiczniejszych pod tym względem obserwacji 
z pokładów sztucznych satelitów ziemi jest trudność 
utrzymania odpowiednio niskiej temperatury w wa¬ 
runkach długotrwałego lotu kosmicznego. Obserwa¬ 
cje promieniowania podczerwonego z przestrzeni 
kosmicznej wymagałyby chłodzenia nie tylko detekto¬ 
ra ale również całego teleskopu, co pociągałoby za 
sobą konieczność ciągłego dostarczania stosunkowo 
dużych ilości energii. 

Obecnie astronomia w podczerwieni jest jedną 
z najaktywniej rozwijających się dziedzin astronomii; 
jej możliwości nie ustępują w zasadzie możliwościom 
obserwacyjnym w klasycznej dziedzinie widzialnej. 


Fotometria szerokopasmowa 

Pierwszym, a zarazem stosunkowo najprostszym 
rodzajem obserwacji podjętych w dziedzinie podczer¬ 
wonej byta fotometria szerokopasmowa. Przepusz¬ 
czalność atmosfery ziemskiej w powiązaniu z czułością 
detektorów i właściwościami istniejących filtrów 
promieniowania podczerwonego określa w sposób 
naturalny zakres długości fal, w których możemy od¬ 
bierać pozaziemskie promieniowanie podczerwone. 
Wynikający stąd system fotometryczny został powią¬ 
zany z tradycyjnym systemem fotometrii trójbarwnej 
UBV {U —nadfiolet, B —przedział fal niebieskich, 
V — zakres widzialny) w dziedzinie widzialnej w jeden 
system obejmujący dwanaście pasm. Bliższa charakte¬ 
rystyka poszczególnych pasm tego systemu jest 
podana w tabeli. Obserwacje w tym systemie są nie¬ 
kiedy uzupełniane przez obserwacje w pasmach po¬ 
średnich. W wypadku pasm niedostępnych z po¬ 
wierzchni Ziemi, obserwacje w ich zakresie są wyko¬ 
nywane z wysoko lecących samolotów, z rakiet lub 
balonów. 

Fotometria szerokopasmowa jest najszybszą meto¬ 
dą uzyskiwania informacji o rozkładzie energii w wid¬ 
mie ciągłym w szerokim zakresie długości fal. 
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Charakterystyka wielobarwnego systemu fotometrii 
szerokopasmowej 


Pasmo 

Act, nm 


0 mag, 

U 

0,36 

0,066 

4,35-10-“ 

B 

0,44 

0,098 

7,20-10- 1 * 

V 

0,55 

0,087 

3,92-10*“ 

R 

0,70 

0,21 

1,76-10*“ 

I 

0,90 

0,23 

8,35* I0 -ia 

1 

1,25 

0,30 

3,40* 10“ 13 

H 

1,60 

0,30 

1,28-10- 13 

K 

2,20 

0,58 

3,90-10-“ 

L 

3,40 

0,70 

8,10-10-“ 

M 

5,00 

1,13 

2,20-10-“ 

N 

10,20 

4,33 

1,23-10"“ 

Q 

22,00 

7,5 

7,70-10-“ 


Aei — efektywna długość fali, Jż — szerokość pasma, 0 mag — 
bezwględna wartość strumienia energii odpowiadającego zerowej 
wielkości gwiazdowej w danym paśmie. 


Spektrofotometria (fotometria 
wąskopasmowa) 

Dzięki opanowaniu technologii wytwarzania filtrów 
interferencyjnych o zmiennej charakterystyce widmo¬ 
wej, stały się możliwe również obserwacje fotome- 
tryczne w bardzo wąskich zakresach długości fal. 
Na przykład detektor germanowy (z domieszką 
miedzi) w połączeniu z filtrem interferencyjnym pozwa¬ 
la uzyskać spektrofotometr mierzący promieniowanie 
w zakresie 3-14 pm z widmową zdolnością roz¬ 
dzielczą rzędu 0,1 pm. Dokładność takiego urządze¬ 
nia jest porównywalna z dokładnością spektrogra¬ 
fów, natomiast zakres jego zastosowania jest znacz¬ 
nie szerszy. 


Spektroskopia 

W krótkofalowym zakresie promieniowania podczer¬ 
wonego, będącego naturalnym przedłużeniem zakresu 
widzialnego, technika obserwacji spektroskopowych 
nie różni się niczym od spektroskopii światła widzial¬ 
nego. Widma podczerwone w dużej dyspresji można 
uzyskać za pomocą zwykłych siatek dyfrakcyjnych 
oraz emulsji fotograficznych czułych na promienio¬ 
wanie podczerwone. Obserwacje tego rodzaju nie 
wykraczają jednak poza długość fali ok. 1,2 pm 
(przy rejestracji fotograficznej) lub ok. 2,5 pm (przy 
rejestracji fotoelektrycznej, zwłaszcza w obserwacjach 
rakietowych). W ęałym zakresie podczerwieni duże 
zdolności rozdzielcze — rzędu 0,05 pm lub wyjątkowo 
nawet 0,01 pm — można uzyskać przez zastosowa¬ 
nie interferometrów (np. Fabry’ego-Perota lub Mi- 
chelsona). Technika interferometryczna, chociaż 
stosunkowo czasochłonna, została z powodzeniem 
zastosowana w niemal całym zakresie promienio¬ 
wania podczerwonego dostępnego z powierzchni 
Ziemi. 


Obserwacje bolometryczne 

Urządzenie odbierające promieniowanie z bardzo 
szerokiego przedziału widmowego, a w idealnym 
wypadku — całe promieniowanie padające — nazy¬ 
wamy bolometrem. Celem obserwacji bolometrycz- 
nych jest pomiar całkowitego strumienia energii 
promienistej dobiegającej do nas od danego ciała 
niebieskiego. Przy znanej odległości tego ciała, łączna 
energia dobiegająca do nas w jednostce czasu jest 
bezpośrednią miarą jego temperatury efektywnej. 
W praktyce wystarcza, jeżeli używany przez nas bolo- 
metr rejestruje promieniowanie w tym zakresie wid¬ 
mowym, w którym przypada większość promienio¬ 
wania wysyłanego przez obserwowane ciało niebie¬ 
skie. Urządzeniem czułym w szerokim zakresie pro- 


interfero- 

metry 


bolometry 











mieniowania podczerwonego — od ok. 2 pm, do ok. 
1000 jim —jest np. bolometr germanowy chłodzony 
ciekłym helem do temperatury poniżej 2 K. Odbiornik 
taki może spełniać rolę bolometru przy obserwacjach 
bolometr źródeł o temperaturach efektywnych zawartych w 
germanowy przedziale od kilkunastu do ponad tysiąca K. Przy 
obserwacjach z powierzchni Ziemi bolometr germa¬ 
nowy lub bolometr indowo-antymonowy, którego 
czułość widmową ilustruje rys. 2, może być wyko¬ 
rzystywany do obserwacji promieniowania w tzw. 
podmilimetrowym zakresie fal (obszar przejściowy 
między promieniowaniem podczerwonym i radio¬ 
wym), w którym atmosfera ziemska staje się ponow¬ 
nie stosunkowo przezroczysta. 

Jak już wspominaliśmy, zależnie od temperatury 
ciała maksimum promieniowanej przez niego energii 
przypada w różnych obszarach widmowych. W pod¬ 
czerwieni świecą przede wszystkim ciała o tempera¬ 
turach od ok. 3500 K (maksimum w pobliżu 1 pm) 
do ok. 3 K (maksimum w pobliżu 1000 jim). Zatem 
obserwacje w podczerwieni umożliwiają badanie 
obiektów, które w dziedzinie widzialnej są bardzo 
słabo albo w ogóle niewidoczne. Ponadto, z obser¬ 
wacji spektroskopowych uzyskuje się informacje 
o tych atomach i cząsteczkach, które występują 
w atmosferach gwiazd i planet (zarówno chłodnych, 
jak i gorętszych), ale które nie mają linii widmowych 
w dziedzinie widzialnej. Należy również pamiętać, 
że istnieją obiekty astronomiczne, których promie¬ 
niowanie nie ma charakteru wyłącznie termicznego, 
i które w związku z tym, obok dużych ilości promie¬ 
niowania widzialnego, mogą wysyłać również silne 
promieniowanie podczerwone. 

Chociaż obserwacje w podczerwieni zostały podjęte 
stosunkowo niedawno, to jednak przyniosły one już 
wiele interesujących wyników i znacznie rozszerzyły 
naszą znajomość zarówno stanu materii we Wszech- 
świecie, jak i procesów fizycznych, które w niej prze¬ 
biegają. Poniżej podany jest krótki przegląd najważ¬ 
niejszych wyników uzyskanych dzięki obserwacjom 
w podczerwieni. 


Absorpcja międzygwiazdowa 

Z obserwacji w dziedzinie widzialnej wiadomo, że 
materia rozproszona (gaz i pył) w płaszczyźnie Galak¬ 
tyki wywołuje osłabienie przechodzącego przez nią 
światła gwiazd. Osłabienie to zależy od długości fali 
i jest tym mniejsze, im większa jest długość fali (stąd 
poczerwie- też nazwa — poczerwienienie międzygwiazdowe). 
* a nie ? ie dzięki obserwacjom w podczerwieni zależność 
międzygwia- absorpcji międzygwiazdowej od długości fali została 
zdowe wyznaczona w szerokim zakresie widmowym. Wyzna¬ 
czono ją przez porównanie przebiegu widma ciągłego 
poczerwienionych i niepoczerwienionych gwiazd 
takiego samego rodzaju. W dziedzinie widzialnej 
wykorzystuje się w tym celu przede wszystkim jasne 
gwiazdy gorące, a w dziedzinie podczerwonej —jasne 
gwiazdy chłodne. Dokładna znajomość krzywej 
absorpcji międzygwiazdowej jest niezbędna do wielu 
pośrednich metod wyznaczania odległości ciał nie¬ 
bieskich. Jednocześnie na jej podstawie można uzy¬ 
skać wiele cennych informacji na temat stanu fizycz¬ 
nego i składu chemicznego materii, która tę absorpcję 
wywołuje. Obecnie wiadomo, że osłabienie światła 
gwiazd powodują drobne ziarenka materii w stanie 
stałym (pył) o charakterystycznych rozmiarach 1 jim. 
Skład chemiczny pyłu nie jest jeszcze dokładnie znany, 
jest jednak bardzo prawdopodobne, że zawiera on 
takie pierwiastki i związki chemiczne, jak tlenek 
krzemu, żelazo, lód, glin, magnez i wapń. Ocenia się, 
że łączna masa składowej pyłowej wynosi ok. 1% 
masy gazu międzygwiazdowego. Na podstawie 
obserwacji podczerwonego promieniowania gwiazd 
można przypuszczać, że ziarna pyłu powstają w atmo¬ 
sferach gwiazd chłodnych, skąd przedostają się do 
przestrzeni międzygwiazdowej. 


Obserwacje gwiazd 

Pierwsze obserwacje gwiazd polegały przede wszy¬ 
stkim na wyznaczeniu przebiegu ich widma ciągłego 
za pomocą szerokopasmowej fotometrii wielobarwnej, 
oraz na poszukiwaniu obiektów promieniujących 
wyłącznie w dziedzinie podczerwonej. Obserwacje 
obejmowały zarówno gwiazdy gorące (wystarczająco 
jasne, by można było spodziewać się również mierzal¬ 
nego strumienia promieniowania podczerwonego), 
jak i gwiazdy chłodne. Interesujące było stwierdzenie, 
że stosunkowo dużo gwiazd gorących, zwłaszcza gwiazdy 
gwiazd z liniami emisyjnymi, świadczącymi o istnie- gorące 
niu wokół nich rozległych otoczek gorącej i prawdo¬ 
podobnie ekspandującej materii, wykazuje nadwyżki 
(w stosunku do termicznego promieniowania ciała 
doskonale czarnego) promieniowania w zakresie fal 
dłuższych od 3,5 jim. Biorąc pod uwagę, że gorące 
jasne gwiazdy są na ogół gwiazdami młodymi, nad¬ 
wyżkę tę można wiązać z promieniowaniem cieplnym 
pyłu otaczającego gwiazdy młode i będącego pozo¬ 
stałością po pierwotnym obłoku materii gazowo-pyło- 
wej, z którego gwiazdy te powstały. Niezależnym 
potwierdzeniem tego wniosku jest fakt, że duże nad¬ 
wyżki promieniowania podczerwonego zostały rów¬ 
nież stwierdzone przy obserwacji niektórych rodzajów 
chłodniejszych gwiazd zmiennych (np. tzw. gwiazd 
typu TTauri i R Monocerotis), które według naszych 
dzisiejszych poglądów są gwiazdami znajdującymi się 
w początkowych fazach ewolucyjnych. Wyraźne 
nadwyżki promieniowania podczerwonego zostały 
stwierdzone również dla wielu normalnych gwiazd 
chłodnych (np. gwiazd węglowych). Ich widma (w po¬ 
bliżu 10 jim i 20 jim) wykazują pasma absorpcyjne 
charakterystyczne dla tlenku krzemu i niektórych 
związków węgla. Przypuszcza się, że górne warstwy 
atmosfer tych gwiazd są miejscem tworzenia się 
ziaren materii w stanie stałym. 

Spektroskopowe obserwacje gwiazd chłodnych gwiazdy 
w bliskiej i średniej podczerwieni (do ok. 10 jim) do- chłodne 
starczyły interesujących informacji na temat zawarto¬ 
ści w ich atmosferach cząsteczek takich związków 
chemicznych, jak np. CO lub H 2 0. Cząsteczki te 
mają w podczerwieni wiele linii oscylacyjnych i oscy- 
lacyjno-rotacyjnyćh, które w niskich temperaturach 
powodują nieprzezroczystość atmosfer gwiazdowych. 

Obserwacje linii rotacyjnych cząsteczek dostarczają 
ponadto informacji dotyczących względnej obfitości 
izotopów niektórych pierwiastków (np. węgla) w ma¬ 
terii gwiazdowej. 


Obiekty podczerwone 

Podczas wstępnych przeglądów nieba wykryto wiele 
obiektów, które wysyłają bardzo silne promieniowa¬ 
nie podczerwone, natomiast nie mają odpowiedników 
w dziedzinie optycznej lub dają się zidentyfikować 
z obiektami optycznymi o bardzo małej jasności 
(rys. 3). Podczerwone widma trzech najsłynniejszych 
obiektów tego rodzaju są pokazane na rys. 4. 

NML Cyg jest jednym z najjaśniejszych obiektów NML Cyg 
podczerwonych na niebie. Najprawdopodobniej jest 
to nadolbrzym o cechach promieniowania charaktery¬ 
stycznych dla gwiazdy typu widmowego A/, wokół 
którego znajduje się gęsta otoczka gazowo-pyłowa 
będąca źródłem promieniowania podczerwonego. 

Optycznym odpowiednikiem źródła NML Cyg jest 
obiekt 18 wielkości gwiazdowej; niewielka jasność 
optyczna jest spowodowana silną absorpcją około- 
gwiazdową. Przypuszcza się, że NML Cyg jest pro- 
togwiazdą, w której wnętrzu nie rozpoczęły się jeszcze 
przemiany jądrowe (czyli nie osiągnęła ona jeszcze 
ciągu głównego). 

Obiekt Becklina jest to jasny obiekt podczerwony obiekt 
o bardzo małych rozmiarach kątowych, znajdujący Becklina 
się prawdopodobnie wewnątrz rozciągłej mgławicy 
podczerwonej Kleinmanna-Lowa stanowiącej część 
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mgławica 
IC 1795 <W3) 



Rys. 3. U góry — zdjęcie mgławicy IC 1795 (W3) wykonane 
w świetle widzialnym (o długości fali odpowiadającej linii wo¬ 
doru H a ). Obszar wewnątrz mniejszego prostokąta zawiera liczne 
źródła promieniowania podczerwonego i radiowego. U dołu 
konturowe mapy tego obszaru wykonane w promieniowaniu pod¬ 
czerwonym (2,2 pm i 20 pm) i radiowym (6 cm). Zwróćmy 
uwagę, że obiekty podczerwone nie mają widocznych odpowied¬ 
ników optycznych. Źródła promieniowania podczerwonego są 
oznaczone symbolem I RS; duże litery (>ł-D) oznaczają obszary 
intensywnego promieniowania radiowego (wg L.N. Mavridis 
(ed.), vol. 2 Stars and the Miłky Way System , Berlin 1974) 


gazowo-pyłowej Mgławicy Oriona. Przypuszcza się, 
że obiekt Becklina jest zwykłym nadolbrzymem typu 
widmowego F (temperatura ok. 7000 K), którego 
światło widzialne ulega ogromnej absorpcji ok. 80 
wielkości gwiazdowych. Pasma absorpcyjne w widmie 



Rys. 4. Względny rozkład natężeń w podczerwonych widmach 
NML Cyg, obiektu Becklina i podczerwonej Mgławicy Klein- 
manna-Lowa (krzyżykami zaznaczone są punkty obserwacyjne) 


obiektu Becklina są produkowane przez pył znajdu¬ 
jący się w mgławicy Kleinmanna-Lowa. 

Poczerwona Mgławica Kleinmanna-Lowa jest Mgławica 
rozciągłym źródłem długofalowego promieniowania Kleinmanna- 
podczerwonego o rozmiarach kątowych rzędu 30-40 Lowa 
sekund łuku. Mgławica ta nie wysyła dającego się 
zmierzyć promieniowania w zakresie fal krótszych 
od ok. 20 urn, jest natomiast jeszcze stosunkowo 
jasna w zakresie podmilimetrowym (900 jim). Obser¬ 
wowany rozkład natężenia w w'idmie jest w przybli¬ 
żeniu taki, jak oczekiwany rozkład promieniowania 
ziaren pyłu o temperaturze 50-70 K. Mgławica ta 
jest prawdopodobnie stosunkowo dużym i gęstym 
obłokiem pyłu międzygwiazdowego, wewnątrz któ¬ 
rego przebiegają procesy powstawania gwiazd. 


Centrum Galaktyki 

Dzięki temu, że absorpcja międzygwiazdow’a jest 
odwrotnie proporcjonalna do długości fali, jądro 
Galaktyki, całkowicie przesłonięte w dziedzinie 



Rys. 5. Konturowa mapa okolic centrum Galaktyki wykonana 
w promieniowaniu podczer>vonym o długości fali 100 jxm. Liczby 
oznaczają natężenie w jednostkach względnych. Przerywaną linią 
(prostą) zaznaczony jest przebieg płaszczyzny symetrii Galaktyki, 
(wg V. Manno and J. Ring (cd.) Infrared Techmąues for Space 
Research, Dordrecht 1972) 
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widzialnej, staje się widoczne w promieniowaniu 
podczerwonym. Fotometryczne obserwacje okolic 
centrum Galaktyki (rys. 5) ujawniły, że jądro Galak¬ 
tyki w podczerwieni jest obiektem rozciągłym (o roz¬ 
miarach rzędu 1° dla fal z przedziału 75-125 pm 
i rzędu 30" dla fal 10 i 20 pm), wysyłającym stosun¬ 
kowo silne promieniowanie. Na tle promieniowania 
ciągłego widoczne jest pasmo absorpcyjne SiO (9,7 
pm) (rys. 6). Pochodzenie tego promieniowania nie 
jest jeszcze wyjaśnione. 



długość fali Rys. 6. Widmo promieniowania centrum Galaktyki. Kółka — 
wyniki obserwacji w szerokich pasmach, linia ciągła — wyniki 
obserwacji spektrofotometrycznych. Natężenie przedstawione 
jest w skali logarytmicznej, w jednostkach umownych 


Obiekty pozagaSaktyczne 

Źródłami promieniowania podczerwonego są nie¬ 
które galaktyki oraz kwazary. Zwykłe galaktyki 
oraz galaktyki Seyferta mają widmo promieniowania 


Ewolucja gwiazd 

Józef Smak 

Termin ewolucja oznacza w astronomii rozwój po¬ 
jedynczego obiektu lub grupy obiektów, a nie odnosi 
się do zmian określonych cech danego typu obiektów 
zachodzących z pokolenia na pokolenie. Ewolucja 
gwiazdy obejmuje zatem proces powstania gwiazdy 
z materii międzygwiazdowej, następnie zachodzące 
w jej wnętrzu procesy termojądrowe i związane z nimi 
zmiany parametrów fizycznych i składu chemicznego 
materii gwiezdnej, kończące się wyczerpaniem źródeł 
energii i ewentualnym zwrotem części materii do 
ośrodka międzygwiazdowego, oraz osiągnięcie przez 
gwiazdę końcowego stadium ewolucji. 

Ewolucję gwiazdy można rozważać w aspekcie 
źródeł jej energii. Słońce, które może być uważane za 
przeciętną gwiazdę, wypromieniowuje w ciągu se¬ 
kundy energię równą w przybliżeniu 3,86- KFM. Masa 
Słońca równa jest 1,98* 10 30 kg. Wynika stąd, że tempo 
produkcji energii słonecznej wynosi średnio ok. 
2-10“ 4 J/(kg*s). Równocześnie zaś z danych geo¬ 
logicznych, odnoszących się do wieku najstar¬ 
szych zbadanych śladów życia organicznego na Ziemi, 
wynika, że Słońce dostarczało Ziemi światła i ciepła 
w tych samych — w przybliżeniu—jak obecnie 
ilościach przez co najmniej ostatnie kilkaset milio¬ 
nów lat. 

energia Pierwszej próby zidentyfikowania źródeł energii 
grawitacyjna gwiazd dokonali w połowie XIX w. H. Helmholtz 
gwiazdy i W. Thomson (Kelvin). Zwrócili oni uwagę na za¬ 
soby energii grawitacyjnej gwiazdy: w wypadku sta¬ 
łego, powolnego kurczenia się gwiazdy, jej energia 
potencjalna przechodzi w energię cieplną, pokrywając 
przy tym straty powstające przez wypromieniowanie. 


podczerwonego przypominające typowe widma pod¬ 
czerwone gorących i gęstych obłoków zjonizowanej 
materii międzygwiazdowej występujących w naszej 
Galaktyce. 

Nasuwa się przypuszczenie, że mechanizm powsta¬ 
wania emisji jest w obu wypadkach taki sam (termicz¬ 
ne promieniowanie pyłu, linie emisyjne niektórych 
pierwiastków zjonizowanych lub promieniowanie nie- 
termiczne). Wyraźną a ponadto zmienną w czasie 
nadwyżkę promieniowania podczerwonego stwierdzi¬ 
ły również obserwacje najjaśniejszego kwazara 3C 273. 


Słońce i planety 

Dla badania Słońca i Księżyca (dwu najsilniejszych 
źródeł promieniowania podczerwonego na niebie) 
obserwacje w podczerwieni odgrywają przede wszy¬ 
stkim rolę uzupełniającą w stosunku do obserwacji 
prowadzonych w innych dziedzinach widma. Są one 
jednak bardzo ważne dla badania planet, które ze 
względu na stosunkowo niską temperaturę, główną 
część swej energii wysyłają w podczerwieni. Istotną 
rolę dla określenia bilansu energetycznego planet bilans ©ner- 
mają obserwacje bolometryczne; szczególnie intere- getyczny 
sujące jest stwierdzenie, że Jowisz wysyła nieco więcej Jowisza 
energii niż jej otrzymuje od Słońca: dowodzi to, że ma 
on własne źródło energii. Celem spektroskopowych 
obserwacji planet jest przede wszystkim wyznaczenie 
składu chemicznego ich atmosfer, a zwłaszcza obfito¬ 
ści cząsteczek (np. CO z , NH 3 , CH*) mających silne 
pasma absorpcyjne w podczerwieni i występujących 
w atmosferach planetarnych. 

P. J. Brancazio, A. G. W. Cameron Infrared Astronomy, New 
York 1968; H. L. HackPorth Infrared Radia don, New York 1960; 

V. Manno, J. Ring (ed.) Infrared Detection Techniąues for Space 
Research , Dordrecht 1972; L.N. Mavridis (ed.), voI. 2, Stars and 
the Milky Way System, Berlin 1974. 


Jeżeli gwiazda znajduje się w stanie równowagi me¬ 
chanicznej, wtedy jej energia wewnętrzna (cieplna) U , 
energia potencjalna Q oraz energia całkowita E = 
= U+ spełniają związki: 


gdzie G — stała grawitacji, M — masa gwiazdy, R — 
promień gwiazdy, zaś C, i C 2 — stałe rzędu 1, zależ¬ 
ne — odpowiednio — od stanu materii i rozkładu gę¬ 
stości we wnętrzu gwiazdy. Korzystając z powyż¬ 
szych zależności można oszacować, jaka była całko¬ 
wita ilość energii wypromieniowanej przez kurczące 
się pra-Słońce przy przejściu od konfiguracji początko¬ 
wej, o nieskończenie dużych rozmiarach (Q = 0, 

E = 0), do stanu obecnego. Otrzymujemy w przy¬ 
bliżeniu AE = 5 -10 41 J. Jeżeli przyjmie się, że w trak¬ 
cie procesu kurczenia się Słońce promieniowało rów¬ 
nie intensywnie jak obecnie, to otrzymuje się, że osza¬ 
cowane powyżej zasoby energii grawitacyjnej mogły 
wystarczyć zaledwie na ok. 40 min lat. Zatem mecha¬ 
nizm Helmholtza-Kelvina, jakkolwiek odgrywa istot¬ 
ną rolę na pewnych szczególnych i krótkotrwałych 
etapach ewolucji gwiazd, nie może być głównym 
źródłem ich energii. 

Już w latach dwudziestych obecnego stulecia po¬ 
dejrzewano (m.in. J. H. Jeans), że głównym źródłem 
energii gwiezdnej są reakcje jądrowe, połączone reakcje 
z wydzielaniem znacznych ilości energii, zgodnie 'ątfrowe 
z einsteinowską zależnością E = mc z . Datą przeło¬ 
mową był jednak dopiero rok 1938, kiedy to H. A. 

Bethe wykazał możliwość zamiany wodoru w hel 
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we wnętrzach gwiazd w tzw. cyklu węglowo-azoto- 
wym. Wreszcie w 1952 r. E. E. Salpeter opisał inny 
cykl zamiany wodoru w hel (tzw. cykl proton-proton) 
oraz zwrócił uwagę na tzw. reakcję 3a, polegającą na 
zamianie helu w węgiel. Wkrótce potem rozwinęły 
się badania reakcji jądrowych we wnętrzach gwiazd 
na różnych etapach ich ewolucji, a równocześnie 
powstały teoria ewolucji gwiazd i teoria powstawania 
pierwiastków chemicznych (—► Powstawanie pier¬ 
wiastków chemicznych). 

Wydajność energetyczną reakcji jądrowej określa 
tzw. niedobór masy, tj. różnica mas jąder atomowych 
stanowiących elementy wejściowe i produkty końcowe 
reakcji. Na przykład wynikiem cyklu węglowo-azoto- 
wego lub cyklu proton-proton jest zamiana 4 proto¬ 
nów w jądro helu; niedobór masy wynosi tu: 4 -1,685 • 

. 10“ 27 —6,694-10“ 27 = 4,6-10“ 29 kg, zaś odpowiadają¬ 
ca mu ilość energii jest równa w przybliżeniu 4-10” 12 J. 
Zamieniając na hel 1 gram materii wodorowej otrzy¬ 
mujemy ok. 6,3- 10 u J. Proces zamiany wodoru w hel 
ma zatem wydajność energetyczną mogącą zapewnić 
świecenie Słońca przez czas rzędu 3 -10 18 s = 10 11 lat 
(przy założeniu, że zamianie wodoru w hel ulegnie 
cała masa Słońca). Wydajność reakcji z udziałem 
jąder helu i jąder cięższych jest znacznie niższa. Na 
przykład, w procesie 3a wydajność wynosi ok. 
6-10 10 J/g. 

Tempo zachodzenia określonej reakcji jądrowej we 
wnętrzu gwiazdy zależy od lokalnych wartości para¬ 
metrów fizycznych, głównie temperatury i gęstości, 
oraz składu chemicznego. Reakcje zachodzą naj¬ 
szybciej, a energia wydzielana jest najobficiej w cen¬ 
tralnych częściach gwiazdy, tj. tam, gdzie panuje 
najwyższa temperatura. 

Sytuacja przedstawia się jednak odmiennie, gdy 
wewnętrzne obszary gwiazdy pozbawione są już okre¬ 
ślonego paliwa jądrowego: wtedy maksimum zacho¬ 
dzenia reakcji przypada na warstwę pośrednią, sta¬ 
nowiącą przejście do obszarów zewnętrznych gwiaz¬ 
dy, bogatych w paliwo. 

Reakcje jądrowe zachodzące we wnętrzu gwiazdy 
pokrywają wydatek energetyczny gwiazdy na pro¬ 
mieniowanie, dzięki czemu zachowana jest równowaga 
termiczna. Spadek tempa produkcji energii, wywo¬ 
łany np. wyczerpywaniem się zapasów paliwa, wy¬ 
wołuje zachwianie równowagi termicznej, kurczenie 
się gwiazdy prowadzące do podwyższenia tempera¬ 
tury wewnętrznej i wzrostu tempa produkcji energii, 
aż do odzyskania równowagi. Po całkowitym wy¬ 
czerpaniu się zapasów paliwa proces kurczenia się 
gwiazdy może się stać na krótko jedynym znaczącym 
źródłem energii oraz może — a nawet musi — pro¬ 
wadzić do wzrostu temperatury i gęstości materii aż 
do wartości, w których mogą zachodzić reakcje 
jądrowe z udziałem następnego, obfitego paliwa. 
Taki autoregulujący mechanizm umożliwia gwieździe 
kontrolowanie jej zapasów energetycznych oraz 
przestawianie się z jednego typu paliwa jądrowego na 
następne. 

Ważnym zjawiskiem związanym z zaawansowa¬ 
nymi stadiami ewolucji jest proces utraty materii 
przez gwiazdy, zachodzący bądź przez powolny 
wypływ, bądź też jednorazowe wyrzucenie w prze¬ 
strzeń międzygwiazdową znacznej części masy całej 
gwiazdy, jak r*p. w przypadku gwiazd supernowych. 
Utrata materii przez gwiazdę stanowi zwrot tej 
materii do ośrodka międzygwiazdowego. Ponieważ 
przynajmniej część wyrzuconej przez gwiazdę ma¬ 
terii brała uprzednio udział w procesach jądrowych, 
zatem skład chemiczny zwracanej do ośrodka mię¬ 
dzygwiazdowego materii różni się od pierwotnego 
składu materii, z której powstała gwiazda. Oznacza 
to, że ubocznym wynikiem ewolucji gwiazd jest stałe 
wzbogacanie materii międzygwiazdowej w Galaktyce 
w produkty wewnątrzgwiezdnych reakcji jądrowych. 
Jest to jeden z najważniejszych mechanizmów pow¬ 
stawania pierwiastków chemicznych we Wszechświe- 
cie. 
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Powstawanie gwiazd 

Proces powstawania gwiazd nie jest zjawiskiem jedno¬ 
razowym, ale zachodził nieprzerwanie w różnych, 
epokach istnienia —> Galaktyki i zachodzi obecnie. 
Dowodem tego jest obecność w Galaktyce młodych 
gwiazd, których wiek wynosi ok. 10 fl lat, podczas 
gdy wiek Galaktyki wynosi ok. (1-1,5)-10 10 lat. 
Przykładem młodych gwiazd są tzw. gwiazdy typu O , 
wyróżniające się bardzo dużymi jasnościami. Gwiazda 
typu O, której masa jest dwudziestokrotnie większa 
od masy Słońca, wypromieniowywuje 10 5 razy więcej 
energii niż Słońce; innymi słowy, tempo zużywania 
zapasów energii (w przeliczeniu średnio na 1 gram 
materii) jest tu ok. 5000 razy większe niż w przypadku 
Słońca. Zatem — nawet gdyby cała masa gwiazdy 
mogła zostać wykorzystana jako paliwo jądrowe — 
zapasów tych mogłoby wystarczyć zaledwie na kilka¬ 
dziesiąt milionów lat; z dokładniejszych rozważań 
wynika, że wiek tych gwiazd nie może być większy 
od podanego wyżej, tzn. rzędu 10 6 lat. Niezależnym 
potwierdzeniem tej oceny jest fakt, że gwiazdy typu O 
tworzą w przestrzeni luźne zgrupowania — tzw. 
asocjacje — które są niestabilne dynamicznie: po 
upływie czasu rzędu 10M0 7 lat muszą ulec rozpa¬ 
dowi, zaś wchodzące w ich skład gwiazdy — ulec 
wymieszaniu z innymi, starszymi gwiazdami w Galak¬ 
tyce. Młodymi gwiazdami są także tzw. gwiazdy typu 
T Tauri, występujące również w asocjacjach, często 
z gwiazdami typu O, a z reguły — w obszarach bo¬ 
gatych w materię międzygwiazdową. 

Gwiazdy powstają z materii międzygwiazdowej. 
Prawdziwość tego stwierdzenia wynika z jednej 
strony z braku jakichkolwiek dowodów na istnienie 
jakiegoś innego „tworzywa przedgwiazdowego”, 
z drugiej zaś — z wielu faktów obserwacyjnych. Oto 
najważniejsze z nich. Młode gwiazdy występują 
wyłącznie w obszarach bogatych w materię między¬ 
gwiazdową (il. 221, tabl. 59). Obserwuje się je zarówno 
w dostępnych do obserwacji częściach naszej Galak¬ 
tyki, jak też i w innych galaktykach; bogate w materię 
międzygwiazdową galaktyki nieregularne zawierają 
dużo młodych gwiazd, a ubogie w materię między¬ 
gwiazdową galaktyki eliptyczne wyróżniają się rów¬ 
nocześnie brakiem gwiazd młodych. 

Materia międzygwiazdową, występująca jako gaz 
i pył, wypełnia przestrzeń międzygwiazdową w sposób 
niejednorodny, z wyraźną tendencją do koncentracji 
w obłokach. Masy obłoków zawarte są w bardzo 
szerokich granicach, od ok. 1 masy Słońca (== 1,98* 
• 10 s ? kg) v/ przypadku najmniejszych, możliwych do 
zaobserwowania kondensacji materii, do KP-10 4 mas 
Słońca, w przypadku największych tego typu obiektów 
w Galaktyce. Jeszcze bardziej zróżnicowane są para¬ 
metry opisujące fizyczny stan materii w obłokach. 
O ile średnia gęstość materii międzygwiazdowej 
w pobliżu płaszczyzny Galaktyki (wliczając w to 
obłoki i rozrzedzony ośrodek między obłokami) 
wynosi ok. 10“ 23 g/cm 3 (co w przybliżeniu odpowiada 
kilku atomom wodoru na cm 3 ), to gęstość w typowych 
obłokach równa jest ok. 10“ 21 g/cm 3 , zaś w najgę¬ 
stszych obłokach, z których obserwuje się m.in. 
promieniowanie radiowe rodników OH, osiągać 
może wartość rzędu 10“ 14 g/cm 3 (co odpowiada w przy¬ 
bliżeniu gęstości 10 10 atomów wodoru na cm 3 ). Śred¬ 
nia gęstość materii we wnętrzu przeciętnej gwiazdy 
w początkowym etapie ewolucji jest rzędu 1 g/cm 3 , co 
oznacza, że przejściu od średniej gęstości typowego 
obłoku materii międzygwiazdowej do gęstości we- 
wnątrzgwiezdnej musi odpowiadać zmiana rozmia¬ 
rów liniowych o czynnik rzędu 10" 7 . 

Obłok materii międzygwiazdowej może kurczyć 
się pod wpływem własnego przyciągania grawitacyj¬ 
nego tylko wtedy, gdy jego parametry fizyczne speł¬ 
niają tzw. kryterium Jeansa. Z kryterium tego wynika, 
że masa obłoku nie może być mniejsza od: 
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gdzie G — stała grawitacji, V s —prędkość dźwięku 
w obłoku, q — gęstość. Przy typowych wartościach 
parametrów m 0 jest rzędu setek lub nawet tysięcy 
mas Słońca; oznacza to, że tylko najmasywniejsze 
obłoki spełniają kryterium Jeansa i tylko one mogą 
brać udział w procesie tworzenia się gwiazd oraz że 
zjawiska prowadzące do powstawania masywnych 
obłoków są pierwszym ogniwem procesu powstawa¬ 
nia gwiazd. 

Kurczenie się obłoku materii międzygwiazdowej 
jest procesem złożonym, nie dającym się opisać za 
pomocą prostego modelu. Wzrost gęstości i tempera- 
ratury sprzyjają tworzeniu się złożonych rodników 
i cząsteczek; z tą fazą procesu identyfikuje się super- 
gęste obłoki, będące źródłami emisji radiowej rod¬ 
ników OH i in. Wzrost gęstości powoduje, że lokalne 
zagęszczenia w obłoku zaczynają spełniać kryterium 
Jeansa, co prowadzi do rozpadu pierwotnego obłoku 
na wiele kurczących się zgęszczeń, których masy mogą 
już być porównywalne z masami gwiazd; zagęszcze¬ 
nia takie można uważać za protogwiazdy. W tym 
stadium stan fizyczny materii różni się znacznie od sta¬ 
nu początkowego, tj. takiego, jaki panuje w prze¬ 
ciętnym obłoku materii międzygwiazdowej; w wyniku 
zgęszczania się i ogrzewania powstają nie tylko czą¬ 
steczki, ale także i pył. Gdy na dalszym etapie roz¬ 
woju jedna (lub więcej) z protogwiazd staje się gorącą 
gwiazdą typu widmowego O lub B , ciśnienie jej pro¬ 
mieniowania spowoduje „wydmuchanie” pyłu w prze¬ 
strzeń międzygwiazdową. Naszkicowany tu mecha¬ 
nizm może tłumaczyć pochodzenie pyłu w materii 
międzygwiazdowej. 

Ważnym czynnikiem w procesie powstawania 
gwiazd jest występowanie momentu obrotowego. 
Z prawa zachowania momentu pędu wynika, że w pro¬ 
cesie kurczenia się pierwotnego obłoku, gdy jego 
rozmiary zmieniają się o czynnik rzędu 10" 7 (por. 
wyżej), nawet chaotyczne ruchy materii wewnątrz 
obłoku z prędkościami rzędu kilku cm/s mogłyby do¬ 
prowadzić do powstania szybkorotujących gwiazd; 
istnienie zaś bardziej systematycznego (choć nawet 
bardzo powolnego) ruchu obrotowego obłoku wy¬ 
kluczałoby powstanie jakiejkolwiek stabilnej kon¬ 
figuracji gwiazdopodobnej, ze względu na nadmiar 
momentu obrotowego. Kurcząca się protogwiazda 
może pozbyć się nadmiaru momentu obrotowego 
albo przekazując go otaczającej ją materii, albo po¬ 
zbywając się części własnej materii. Pierwszy z tych 
procesów może zachodzić, gdy protogwiazda ma pole 
magnetyczne, którego linie sił — „wmrożone” w ota¬ 
czający ośrodek — są elementem sprzęgającym ha¬ 
mowaną protogwiazdę i otaczającą ją materię. 
W drugim wypadku, wyrzucana jest ta część jej 
materii, dla której siła odśrodkowa nie może już być 
równoważona siłami grawitacji; jeżeli protogwiazda 
już ma wyraźną symetrię osiową, to wyrzucane są 
najszybciej obracające się, równikowe części konfigu¬ 
racji. W związku z tym uważa się, iż „produktem 
ubocznym” powstawania gwiazd są układy plane¬ 
tarne. 

Charakterystyczną cechą materii protogwiazdy jest 
duża przezroczystość dla promieniowania podczer¬ 
wonego (-► Astronomia w podczerwieni). Wydzie¬ 
lona we wnętrzu konfiguracji energia jest więc niemal 
w całości wypromieniowywana na zewnątrz, co spra¬ 
wia, że kurczenie się konfiguracji nie powoduje 
znaczniejszego wzrostu temperatury ani ciśnienia 
gazu. Kurczenie się ma więc charakter swobodnego 
spadku, który może zostać zahamowany dopiero 
przez wzrost ciśnienia. Następuje to wtedy, gdy w 
ostatniej fazie swobodnego spadku temperatura we 
wnętrzu konfiguracji osiąga od kilku do kilkunastu 
tys. stopni, rośnie gwałtownie stopień jonizacji ma¬ 
terii i jej nieprzezroczystość, wzrasta też ciśnienie 
osiągając wartości od kilkudziesięciu do kilkuset 
barów. Od tego momentu dalsze kurczenie się będzie 
zachodziło przy zachowaniu równowagi mechanicz¬ 
nej : ciśnienie gazu w danej warstwie musi równoważyć 


ciężar warstw położonych wyżej. Można przyjąć, że 
w tym momencie dotychczasowa protogwiazda staje 
się gwiazdą. Rozpoczynający się w tym momencie 
wstępny etap ewolucji gwiazdy nazywa się etapem 
kontrakcji (kurczenia się) lub fazą przed ciągiem 
głównym. Na początku tego etapu w całej gwieździe 
występuje konwekcja, czyli mieszanie się materii; 
jest ona głównym mechanizmem transportującym 
energię z coraz gorętszego wnętrza gwiazdy na ze¬ 
wnątrz. Później konwekcja we wnętrzu gwiazdy zani¬ 
ka i w gwieździe można rozróżnić: wnętrze (w równo¬ 
wadze promienistej), w którym energia przenoszona 
jest wyłącznie przez promieniowanie, oraz zewnętrzną 
otoczkę, w której nadal panuje konwekcja. 

Kurczenie się gwiazdy ulega chwilowemu zaha¬ 
mowaniu, gdy w jej wnętrzu osiągnięta zostaje tem¬ 
peratura wystarczająco wysoka, aby mogły zajść 
reakcje jądrowe z udziałem tzw. lekkich pierwiast¬ 
ków: litu, berylu i boru, a także ciężkiego izotopu 
wodoru — deuteru. Na przykład deuter ulega spa¬ 
laniu w reakcji : 

D 2 -f H 1 - He 3 +y+5,49 MeV, 

co następuje już w temperaturach powyżej 0,5 min 
stopni. Ponieważ obfitości tych pierwiastków są zni¬ 
komo małe, ich wypalanie trwa krótko i nie wpływa 
na dalszą ewolucję gwiazdy. 

Etap kontrakcji trwa — w zależności od masy 
gwiazdy —od ok. 100 tys. lat (dla gwiazd najma- 
sywniejszych) do kilkudziesięciu milionów lat (dla 
gwiazd takich jak Słońce) i tylko dla najmniej ma¬ 
sywnych gwiazd (rzędu 0,1 masy Słońca) może być 
porównywalny z wiekiem Galaktyki (ok. (1-1,5) -10 10 
lat). 


Stadium spalania wodoru i helu 

Etap kontrakcji kończy się, gdy w centralnych czę¬ 
ściach gwiazdy temperatura osiąga ok. 10 min stopni. 
W tym momencie rozpoczynają się reakcje jądrowe 
z udziałem najobfitszego i najwydatniejszego paliwa, 
jakim jest wodór. W gwiazdach o masach rzędu 1 ma¬ 
sy Słońca spalanie wodoru zachodzi w tzw. cyklu 
protonowym: 

H 1 +H 1 -*• D 2 +e + +v+l,44 MeV, 

D 2 +H x -> He 3 -f-y-j-5,49 MeV, 

He 3 +He 3 - He 4 +H 1 +H 1 +12,85 MeV. 

(W temperaturach powyżej 16 min stopni cykl pro¬ 
tonowy kończy się innymi reakcjami niż podana 
powyżej, ale i one prowadzą do wyprodukowania 
He 4 i wyzwolenia energii). W gwiazdach masywnych, 
o masach rzędu kilku, lub więcej, mas Słońca, kon¬ 
trakcja ustaje dopiero w chwili osiągnięcia temperatur 
rzędu 20 min stopni, w których wodór spala się w tzw. 
cyklu węglowo-azotowym: 

C 12 + H 1 — N 13 +y+1,95 MeV, 

N 13 _ c i3 +<? + +v+2,22 MeV, 

C^ + H 1 -> N 14 +747,54 MeV, 

N^ + H 1 o is 47+7,35 MeV, 

O 15 -y N 15 +e + +v+2,71 MeV, 

N i5 +H i c i2 + He 4 +4,96 MeV. 

Ten cykl polega więc także na zamianie 4 protonów 
na jądro helu oraz wydzielaniu energii. 

Moment zakończenia się procesu kurczenia i roz¬ 
poczęcia we wnętrzu gwiazdy reakcji spalania wodoru 
określany jest umownie jako wiek zero. Gwiazda 
wieku zero jest jednorodna chemicznie. Ma ona jas¬ 
ność i rozmiary określone jednoznacznie jej masą 
i składem chemicznym. Wyniki obliczeń teoretycz¬ 
nych dotyczących ewolucji gwiazd przedstawia się na 
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wykres H-R wykresie jasność absolutna-temperatura efektywna, 
którego obserwacyjnym odpowiednikiem jest wykres 
jasność absolutna-barwa (lub typ widmowy), czyli 
tzw. wykres Hertzsprunga-Russella (H-R). Rysunek 
1 pokazuje wyniki obliczeń ewolucyjnych dla gwiazd 
o różnych masach, od 0,25 do 15 mas Słońca. Punkty 
oznaczone numerem 1 odpowiadają gwiazdom o wie¬ 
ku zero; punkty te tworzą tzw. ciąg główny wieku 
zero na wykresie H-R. 

etapy Początkowe etapy ewolucji prześledzimy na przy- 
początkowe kładzie gwiazdy o masie 5 mas Słońca (rys. 1 i 2). 
ewolucji Pierwszy, najdłuższy etap ewolucji polega na spalaniu 
się wodoru w centralnych częściach gwiazdy. Z wy- 
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Rys. 1. Zmiany ewolucyjne gwiazd o różnych masach przed¬ 
stawione na tzw. wykresie Hertzsprunga-Russella. L jest jasnością 
absolutną gwiazdy w jednostkach Słońca, Te temperaturą po¬ 
wierzchni gwiazdy. Numery l-l0 oznaczają kolejne stadia ewo¬ 
lucji. Słońce znajduje się obecnie w punkcie 2 na torze ewolucyj¬ 
nym gwiazdy o 1 masie Słońca 



czas wlO 7 lat 

Rys. 2. Zmiany w czasie struktury gwiazdy o masie 5 mas Słońca. 
Na osi pionowej — masa w jednostkach całej gwiazdy; MrfM = 1 
na powierzchni gwiazdy. Grube, poprzeczne kreski oznaczają 
obszary, w których zachodzą reakcje jądrowe; cienkie, zawiro¬ 
wane kreski — obszary konwekcji; punkty — obszary, w których 
skład chemiczny jest wynikiem zachodzenia reakcji jądrowych 
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jątkiem gwiazd o małych masach, spalanie odbywa 
się w cyklu węglowo-azotowym, przy czym ilość 
wyzwalanej energii jest tak duża, że jedynym dosta¬ 
tecznie wydajnym sposobem przekazywania tej energii 
na zewnątrz jest gwałtowne mieszanie się (konwekcja) 
materii w centralnych częściach gwiazdy, tworzących 
tzw. jądro konwektywne. Spalanie się wodoru oraz 
mieszanie się materii sprawia, że w całym obszarze 
jądra obfitość wodoru maleje, obfitość zaś helu 
rośnie. Gdy wyczerpują się zapasy paliwa w jądrze, 
gwiazda gwałtownie się kurczy (przejście od punktu 
2 do 3 na rys. I), dopalają się resztki wodoru w jądrze 
i zaczyna się spalać wodór w warstwie pośredniej, na 
granicy pomiędzy pozbawionym już wodoru jądrem 
a bogatymi w wodór warstwami zewnętrznymi. 
Warstwa ta jest początkowo dość gruba, ale wkrót¬ 
ce— wskutek wypalania się wodoru—jej wewnętrz¬ 
ne części dołączają się do bezwodorowego jądra. 
Wyprodukowanie dostatecznych ilości energii w cien¬ 
kiej warstwie wymaga odpowiednio wysokiej tempe¬ 
ratury; wzrost temperatury pochodzi stąd, że we¬ 
wnętrzne części gwiazdy kurczą się, podczas gdy 
równocześnie warstwy zewnętrzne — rozszerzają się. 
Przejściu od punktu 4 do punktu 5 (na rys. 1) odpo¬ 
wiada przemiana gwiazdy ciągu głównego w czerwo¬ 
nego olbrzyma — gwiazdę o ok. dziesięciokrotnie 
większych rozmiarach i 3-4-krotnie niższej tempera¬ 
turze efektywnej. Na tym etapie w zewnętrznych 
obszarach gwiazdy rozpoczyna się mieszanie materii — 
tworzy się rozległa tzw. zewnętrzna warstwa kon- 
wektywna. Jest ona charakterystyczną cechą wszy¬ 
stkich chłodnych gwiazd, a zwłaszcza olbrzymów 
i nadolbrzymów. Ilekroć gwiazda, w trakcie ewolucji, 
staje się olbrzymem, w jej zewnętrznych warstwach 
pojawia się natychmiast konwekcja. W niektórych 
wypadkach konwekcja przenika na tyle głęboko, 
że może spowodować wydostanie się na powierzchnię 
gwiazdy produktów reakcji jądrowych. W stadium 
czerwonego olbrzyma temperatura centralnych części 
gwiazdy osiąga wartość rzędu 100 min stopni. Wtedy 
rozpoczyna się proces spalania helu w węgiel w re- 
akcji 3a: 3He < _ c l2 +7,3 MeV. 

(Na rys. 1 odpowiada temu punkt 6). Od tej chwili 
w gwieździe istnieją dwa źródła energii: centralne — 
helowe, i warstwowe — wodorowe. Spalanie helu 
odbywa się podobnie jak spalanie wodoru. Początko¬ 
wo zachodzi ono w centralnym jądrze konwektywnym, 
w którym maleje obfitość helu, a wzrasta obfitość 
węgla. Wkrótce (rys. 2) tworzy się jądro węglowe 
(pozbawione zarówno wodoru, jak i helu), na gra¬ 
nicy którego hel spala się w źródle warstwowym. 
Tej fazie odpowiada punkt 10 na rys. 1. Zmianom 
we wnętrzu gwiazdy od momentu zapalenia się helu 
do tworzenia jądra węglowego towarzyszą zmiany 
struktury warstw zewnętrznych. Rozmiary gwiazdy 
ulegają najpierw zmniejszeniu, a potem ponownemu 
zwiększeniu, tak że na wykresie H-R gwiazda zatacza 
charakterystyczne pętle (rys. 1). W tym stadium 
gwiazda przechodzi kilkakrotnie przez pas niesta¬ 
bilności pulsacyjnej (-* Gwiazdy zmienne pulsujące) 
i staje się wtedy gwiazdą zmienną — cefeidą. 

Dla gwiazd o różnych masach różne jest przede 
wszystkim tempo procesów ewolucyjnych. Wynika 
to z prostych rozważań dotyczących bilansu energe¬ 
tycznego gwiazdy. Tempo wypromieniowywania 
energii, czyli jasność absolutna L y jest silnie zależna 
od masy m gwiazdy; w przybliżeniu L — const-w”, 
gdzie — przykładowo — dla mas rzędu 5 mas Słoń¬ 
ca n — 3. Zapasy paliwa są oczywiście proporcjonalne 
do masy gwiazdy. A zatem tempo zużywania paliwa, 
czyli tempo ewolucji jest w przybliżeniu dane wyra¬ 
żeniem o postaci: const-m”" 1 , tzn. zależy silnie od 
masy gwiazdy. Poniższa tabela podaje czasy ewolucji 
pomiędzy poszczególnymi punktami na wykresie 
H-R dla kilku wybranych mas. 

Druga ważna różnica między przebiegiem ewolucji 
gwiazd o różnych masach wiąże się z występowaniem 
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Tempo ewolucji gwiazd o różnych masach (masy gwiazd 
podane są w jednostkach masy Słońca, czas — w jednost¬ 
kach JO 7 lat) 


Punkty 

Masa 

9 

5 

2,25 

1.25 

1-2 

2,144 

6,547 

46,02 

280,3 

2-3 

0,060 

0,217 

1,647 

18,24 

3-4 

0,009 

0,137 

3,696 

104,5 

4-5 

0,015 

0,075 

1,310 

14,63 

5-6 

0,@06 

0,049 

3,829 

40,0 

6-7 

0,049 

0,605 



7-8 

0,010 

0,102 



8-9 

0,328 

0,900 



9-10 

0,016 

0,093 




różnic gęstości materii i wynikającą stąd odmienno¬ 
ścią równania stanu. We wnętrzu typowej gwiazdy 
ciągu głównego, takiej jak np. Słońce, materia spełnia 
równanie stanu gazów doskonałych, które przestaje 
jednak obowiązywać w warunkach dużej gęstości 
materii (przykładowo: powyżej 100 g/cm* przy tem¬ 
peraturze ok. 10* K, powyżej 10* g/cm* przy tempera¬ 
turze ok. 10* K itd). Powodem tego jest tzw. zwyrod¬ 
nienie elektronów wchodzących w skład materii 
gwiezdnej. Zgodnie z zakazem Pauliego, zwyrodniałe 
elektrony mają (średnio) większe prędkości niżby to 
wynikało z panującej w materii temperatury. Ciśnie¬ 
nie elektronów jest znacznie większe od ciśnienia 
jonów i ono określa ciśnienie gaztL Równanie stanu 
takiej materii wiąże ze sobą tylko gęstość i ciśnienie, 
nie zawiera zaś temperatury; np. gdy gęstość wynosi 
poniżej 10 7 g/cm* mamy p ~ e 6/3 , gdy zaś powyżej — 
p ~ Q*t*. W stadium ciągu głównego efekty zwyrod¬ 
nienia są istotne tylko w wypadku gwiazd o skrajnie 
małych masach, poniżej 0,5 masy Słońca. W trakcie 
ewolucji, gdy wskutek kurczenia się gwiazdy rośnie 
w jej wnętrzu zarówno gęstość, jak i temperatura, 
może w pewnym momencie dojść do zwyrodnienia 
(elektronów). W gwiazdach o masach mniejszych od 
ok. 2 mas Słońca następuje to już wkrótce po wypa¬ 
leniu się wodoru w centralnych częściach gwiazdy. 
Dalsze kurczenie się bczwodorowego jądra, konieczne 
dla uzyskania odpowiednio wysokiej temperatury 
w warstwie spalania wodoru, powoduje dalszy wzrost 
gęstości i „pogłębianie** się zwyrodnienia. Rośnie 
jednak także temperatura tego zwyrodniałego, bez- 
wodorowego jądra. W pewnym momencie zostaje 
osiągnięta temperatura wystarczająca do zapalenia 
się helu. I tu zjawisko przebiega zupełnie inaczej niż 
w gwiazdach masywnych, w których wnętrzach 
elektrony nie są zwyrodniałe. Gdy materia spełnia 
równanie stanu gazów doskonałych, jej ogrzanie 
wskutek pojawienia się nowych źródeł energii powo¬ 
duje wzrost ciśnienia i natychmiastowe rozkurczenie 
się konfiguracji, a w konsekwencji spadek gęstości 
i temperatury. Ustala się szybko stan równowagi z 
uwzględnieniem nowych źródeł energii. Gdy materia 
składa się m.in. ze zwyrodniałych elektronów, wzrost 
temperatury nie wywołuje rozkurczenia się konfigu¬ 
racji, rosnąca temperatura powoduje natomiast 
gwałtowny wzrost wydajności reakcji jądrowych 
i trwa to dopóty, dopóki temperatura nie osiągnie 
wartości, przy której (przy danej gęstości) elektrony 
przestają być zwyrodniałe; wtedy dopiero włącza się 
samoregulujący mechanizm opisany powyżej i dalszy 
przebieg reakcji jądrowych ma charakter kontrolo¬ 
wany. Zapalenie się helu w gwiazdach o masach 
poniżej ok. 2 mas Słońca ma więc przebieg gwałtowny; 
nosi ono nazwę błysku helowego. 


Późne stadia ewolucji 

Po wypaleniu się helu w centralnych częściach 
gwiazdy, jej strukturę można opisać następująco: 
We wnętrzu gwiazdy istnieje jądro węglowe, o stale 
rosnącej masie; w jądrze tym, wskutek wcześniejszego 


zachodzenia reakcji jądrowych, występuje także zna¬ 
czna obfitość tlenu, stąd nazwa —jądro węglowo-tle- 
nowe. Energia produkowana jest w dwu warstwach, 
w których pali się wodór i hel, a które w miarę zuży¬ 
wania paliwa przemieszczają się na zewnątrz. W tym 
stadium jasność gwiazdy zależy niemal wyłącznie 
od masy zawartej w węglowo-t len owym jądrze: 

L/L® = 59250 (A/jądra/A/© —0,522), 

gdzie L/L® —jasność w jednostkach jasności Słoń¬ 
ca, A/jttfra/A/© — masa jądra w jednostkach słonecz¬ 
nych. W gwiazdach o masach mniejszych od 8 mas 
Słońca z biegiem czasu (tj. wskutek wzrostu gęstości) 
w węglowo-tlenowym jądrze następuje zwyrodnienie 
elektronów, tak jak w przypadku helowych jąder 
gwiazd o małych masach. 

Na tym etapie ewolucji gwiazda, niezależnie od 
jej masy, jest chłodnym olbrzymem lub nadolbrzy- 
mem. Zarówno dane obserwacyjne, jak i rozważania 
teoretyczne dotyczące stabilności takich gwiazd 
wskazują, że na tym etapie ważnym czynnikiem 
jest utrata materii przez gwiazdę. 

Obserwacje dostarczają wielu przykładów utraty 
materii przez gwiazdy znajdujące się na zaawansowa¬ 
nych etapach ewolucji. Mgławice planetarne (tabl. 59, 
il. 222) są szczególnym przykładem tego syawiska, 
ponieważ wyrzucona przez gwiazdę otoczka gazowa 
świeci na ogół bardzo silnie, co pozwala na szczegóło¬ 
we badanie jej struktury. Gwiazdy zmienne długo¬ 
okresowe typu Mira tracą materię w tempie 10“* mas 
Słońca na rok. Tak szybka utrata materii jest cha¬ 
rakterystyczna dla wszystkich olbrzymów i nadolbrzy- 
mów późnych typów widmowych. 

Dalszy przebieg ewolucji gwiazdy zależy zatem 
od rozmiarów i parametrów fizycznych jądra węglo- 
wo-tlenowego oraz od tempa utraty materii. Jakkol¬ 
wiek szczegóły opisu pozostają jeszcze niepewne, to 
wyodrębnić można trzy typy ewolucji, w zależności 
od początkowej masy gwiazdy. 

Gwiazdy o masach małych, tj. mniejszych od ok. 
1,4 masy Słońca, nigdy nie osiągają stanu, w którym 
temperatura jądra węglowo-tlenowcgo byłaby wy-, 
starczające duża do zachodzenia reakcji spalania 
węgla. Końcowe etapy ewolucji takich obiektów 
polegają więc na przesuwaniu się ku powierzchni 
i stopniowym wygasaniu warstw spalania wodoru 
i helu. Równocześnie wskutek niestabilności dyna¬ 
micznej warstw zewnętrznych ulegają one wyrzuce¬ 
niu, najprawdopodobniej w postaci mgławicy pla¬ 
netarnej. Gwiazda kończy ewolucję jako stygnący 
biały karzeł. Podobny przebieg ma ewolucja gwiazd 
o początkowych masach zawartych w przedziale 
od 1,4 do ok. 3 mas Słońca, w przypadku których 
następuje utrata znacznej części masy początkowej, 
tak że temperatura jądra węglowo-tlenowego nie 
osiąga wartości krytycznej „zapłonu** węgla oraz 
końcowa masa gwiazdy jest mniejsza od 1,4 masy 
Słońca. 

Białe karły, będące jednym z możliwych produktów 
końcowych ewolucji gwiazd, mają gęstości materii 
w granicach 10 4 -10* g/cm 3 . W tych gęstościach na¬ 
stępuje zwyrodnienie elektronów i obowiązuje rów¬ 
nanie stanu zwyrodniałego gazu elektronowego 
(por. wyżej). Gwiazda zbudowana z takiej materii 
może tworzyć konfigurację stabilną jedynie wtedy, 
gdy jej masa jest mniejsza od pewnej wartości kry¬ 
tycznej, będącej funkcją składu chemicznego. Jeśli 
materia jest pozbawiona wodoru, to wartość krytycz¬ 
na nosi nazwę granicy Chandrasekhara i wynosi ok. 
1,4 masy Słońca. Istnienie tej granicy oznacza, że 
gwiazda mająca zakończyć swą ewolucję jako biały 
karzeł musi — przynajmniej w końcowym stadium 
ewolucji — mieć masę mniejszą od granicy Chandra¬ 
sekhara. 

Gwiazdy o masach pośrednich, tj. zawartych w gra¬ 
nicach od ok. 1,4 do ok. 8 mas Słońca, ewoluują wg 
podobnego schematu. Początkowo energia produ¬ 
kowana jest w dwu warstwach spalających wodór 
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i hel, przy równoczesnym powiększaniu się masy ją¬ 
dra węglowo-tlenowego (rys. 3). W jądrze tym za¬ 
czynają się pojawiać neutrina powstające w proce¬ 
sach zachodzących dzięki istnieniu uniwersalnych 
oddziaływań Fermiego (np. tzw. fotoneutrina pow- 



warstwa spalania wodoru 


twa spalania helu 


Rys. 3. Schemat struktury gwiazdy o masie mniejszej od ok. 8 mas 
Słońca, przed zapaleniem się węgla w jądrze 


stające w procesie: yĄ-e* -► e~+v+v). Neutrina te 
wynoszą na zewnątrz energię i powodują chłodzenie 
się jądra. Wskutek kurczenia się jądra, w warstwie, 
w której spala się hel, utrzymuje się wysoka tempera¬ 
tura i gęstość, co prowadzi do zwyrodnienia elektro¬ 
nów. Gwiazdy z przedziału mas od ok. 3 do ok. 8 mas 
Słońca ewoluują podobnie, zmierzając do konfigu¬ 
racji, w której jądro węglowo-tlenowe ma masę rów¬ 
ną ok. 1,4 masy Słońca, zaś gęstość i temperatura 
centralna są równe — odpowiednio — ok. 2 -10* g/cm 3 
i ok. 3 -10® K. W tych warunkach następuje zapalenie 
się węgla, przy czym — ze względu na zwyrodnienie 

— zjawisko to ma charakter gwałtowny, jeszcze gwał¬ 
towniejszy niż w przypadku błysku helowego. Proces 

błysk zapalenia się węgla prowadziłby do rozerwania całej 
węglowy gwiazdy, gdyby nie działały jakieś dodatkowe pro¬ 
cesy chłodzenia. Ilość wyzwalanej energii oraz czę¬ 
stość zachodzenia takich zjawisk w Galaktyce są 
zgodne z danymi obserwacyjnymi odnoszącymi się 
do gwiazd supernowych. Z drugiej strony wiadomo 
jednak, że pozostałościami po wybuchach superno¬ 
wych są gwiazdy neutronowe, co nie pozwala na 
przyjęcie modelu, w którym rozerwaniu ulega cała 
konfiguracja. Równocześnie wiadomo, że w cyklu 
reakcji zapoczątkowywanych zapaleniem się węgla 
produkowane są znaczne ilości żelaza; gdyby wszy¬ 
stkie gwiazdy o masach od 3 do 8 mas Słońca ulegały 

— na tym etapie ewolucji — całkowitemu rozpyleniu 



Ry*. 4 . Schemat struktury gwiazdy o masie większej od ok. 8 mas 
Słońca na zaawansowanym etapie ewolucji 


w przestrzeń międzygwiazdową, to obfitość żelaza 
w materii międzygwiazdowej musiałaby być wielo¬ 
krotnie wyższa od obserwowanej. Wyjście z tego dy¬ 


lematu musi polegać na poszukiwaniu odpowiedniego 
mechanizmu chłodzenia, łagodzącego przebieg błysku 
węglowego. Sądzi się, że chłodzenie jest konsekwencją 
tzw. procesów Urca, polegających na tym, że w gazie 
zawierającym zwyrodniałe elektrony, przy określonej 
temperaturze może ustalić się równowaga między 
dwoma procesami: rozpadem /?, polegającym na prze¬ 
mianie jądra o ładunku Z w jądro o ładunku Z-J-1 
przy równoczesnej emisji elektronu i antyneutrina, 
oraz odwrotnym rozpadem /?, polegającym na wy¬ 
chwycie elektronu przez jądro o ładunku Z-fl i jego 
przemianie w jądro o ładunku Z przy równoczesnej 
emisji neutrina. Zatem więc produkowane w takich 
procesach neutrina i antyneutrina, unosząc energię na 
zewnątrz, mogą skutecznie chłodzić jądro węglowo- 
tlenowe. 

Gdy występuje chłodzenie, błysk węglowy nieko¬ 
niecznie powoduje rozerwanie całej konfiguracji. 
Jeżeli chłodzenie jest dostatecznie wydajne, to gę¬ 
stość centralna może osiągnąć wartość rzędu 10 10 
g/cm 3 , przy której wewnętrzne obszary jądra stają się 
dynamicznie niestabilne. Wybuch supernowej może 
zatem polegać na wyzwoleniu znacznych ilości ener¬ 
gii i wyrzuceniu w przestrzeń warstw zewnętrznych 
gwiazdy, w tym zewnętrznych obszarów jądra, ale 
przy równoczesnym „zapadnięciu” się wewnętrznych 
obszarów jądra. Produktem wybuchu jest więc roz¬ 
szerzająca się otoczka gazowa oraz gwiazda neutro¬ 
nowa (-* Pulsary). 

Gwiazdy masywne, tj. o masach większych od ok. 8 
mas Słońca, odznaczają się na tyle wysokimi tempera¬ 
turami centralnymi, a równocześnie względnie ma¬ 
łymi gęstościami centralnymi, że zapalenie się węgla 
— przy braku zwyrodnienia — ma przebieg łagodny. 
Po zapaleniu się i wypaleniu węgla następuje zapala¬ 
nie się i wypalanie następnych pierwiastków. Ewolu¬ 
cja prowadzi do konfiguracji, której jądro jest złożone 
z żelaza, zaś kolejne koncentryczne warstwy — z co¬ 
raz lżejszych pierwiastków, aż do bogatej w wodór 
warstwy powierzchniowej (rys. 4). Przebieg ewolucji 
zależy od procesów mieszania materii we wnętrzu 
gwiazdy oraz procesów utraty materii z warstw zew¬ 
nętrznych. Jeżeli chodzi o ewolucję żelaznego jądra, 
to oprócz wzrostu masy jądra zachodzi także wzrost 
jego temperatury centralnej i gęstości. Ten etap ewo¬ 
lucji kończy się w momencie osiągnięcia temperatury 
krytycznej, w której jądra żelaza ulegają rozpadowi 
na jądra helu i neutrony. W tym momencie jądro 
gwiazdy się zapada i przekształca bądź w gwiazdę 
neutronową, bądź w czarną dziurę (-* Czarne dziury 
i zapadanie grawitacyjne). Otoczka gwiazdy ulega 
wyrzuceniu na zewnątrz. Ponieważ jednak większa 
część materii z warstw zewnętrznych uległa wyrzu¬ 
ceniu już wcześniej, przeto opisany tu proces koń¬ 
cowy nie może być utożsamiany z wybuchem 
supernowej. 

Ewolucja gwiazd — składników układów podwój¬ 
nych przebiega identycznie jak gwiazd pojedynczych 
tylko do momentu, w którym rozpoczyna się wymiana 
materii między składnikami. Przyczyna tego zjawiska 
jest następująca. Kształt gwiazdy spełniającej waru¬ 
nek równowagi hydrostatycznej opisują powierzchnie 
jednakowego potencjału, które dla gwiazdy pojedyn¬ 
czej są koncentrycznymi sferami; jedna z nich określa 
powierzchnię gwiazdy. Gdy gwiazda wchodzi w skład 
układu podwójnego, powierzchnie jednakowego po¬ 
tencjału określane są siłami przyciągania grawitacyj¬ 
nego obydwu składników oraz siłą odśrodkową. 
Szczególne znaczenie ma tzw. granica Roche’a, która 
jest największą, nie wspólną dla obydwu gwiazd, po¬ 
wierzchnią jednakowego potencjału (rys. 5a). Gwia¬ 
zda, której rozmiary są mniejsze od granicy Roche’a, 
różni się nieznacznie — pod względem budowy i ewo¬ 
lucji— od gwiazdy pojedynczej. Gdy gwiazda wypeł¬ 
ni granicę Roche’a (rys. 5b) następuje wypływ materii 
przez tzw. wewnętrzny punkt Lagrange’a L, (rys. 5a) 
i jej przepływ do drugiego składnika. Proces ten trwa 
od I0 4 do 10* lat. W tej fazie gwiazda tracąca materię 
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Rys. 5. Schemat wczesnych 
stadiów ewolucji ciasnego uk¬ 
ładu podwójnego (a-c). Linią 
\ przerywaną zaznaczona jest 
' granica Roche’a. Strzałki na 
i rys. b) i c) oznaczają przepływ 
/ materii z gwiazdy i do gwiazdy 
2. Rys. d — ciasny układ po¬ 
dwójny typu nowej. Składnik 
2 jest białym karłem i wokół 
niego wiruje gazowy dysk. 
W przypadku układów będą¬ 
cych źródłami promieniowa- 
^ nia rentgenowskiego składnik 
2 jest gwiazdą neutronową 




przekazuje drugiej gwieździe znaczną część swojej 
pierwotnej masy. Po zakończeniu tego procesu (rys. 
5c) gwiazda wypełniająca powierzchnię Roche’a jest 
mniej masywna od drugiej gwiazdy układu oraz różni 


się od jakiejkolwiek gwiazdy pojedynczej na dowol¬ 
nym etapie ewolucji zarówno budową wewnętrzną 
(występowanie obszarów o różnym składzie chemicz¬ 
nym) jak i parametrami zewnętrznymi (jasność, tem¬ 
peratura efektywna). Ścisły, modelowy opis przebiegu 
naszkicowanego tu procesu pozwala na wyjaśnienie 
obserwowanych własności układów podwójnych 
typu Algola oraz pochodzenia ewolucyjnego tych 
układów. 

Dalsze etapy ewolucji układów podwójnych nie 
zostały dotąd dokładnie zbadane. Rozważania jako¬ 
ściowe dotyczące przebiegu ewolucji obydwu skład¬ 
ników oraz związanych z tym procesów wymiany 
i utraty materii oraz momentu pędu przez układ 
pozwalają na wytłumaczenie pochodzenia układów 
podwójnych, w których jeden ze składników osiągnął 
końcowy stan ewolucji i jest białym karłem lub 
gwiazdą neutronową. Drugi składnik znajduje się 
nadal na wcześniejszym etapie ewolucji, wypełnia 
granicę Roche ł a i przekazuje materię składnikowi 
pierwszemu. Rozmiary białego karła lub gwiazdy 
neutronowej są bardzo małe w porównaniu z roz¬ 
miarami układu, wskutek czego struga materii, mają¬ 
ca znaczny moment pędu względem gwiazdy docelo¬ 
wej, nie spada bezpośrednio na jej powierzchnię, ale 
musi utworzyć wokół niej wirujący dysk (rys. 5d). 
Tego typu gazowe dyski są charakterystyczną cechą 
układów podwójnych typu nowych oraz układów bę¬ 
dących źródłami promieniowania rentgenowskiego 
(-► Astronomia promieni X i y). 

I. Iben Stełlar evolution within and off the main seąuence , Ann. 
Rev. of Astr. and Astrophys. 5. 57! (1967); I. Iben Post main 
sequence evolution of single stars, Ann. Rev. of Astr. and Astrophys. 
12, 125(1974); B. Paczyński Późne stadia ewolucji gwiazd. Post. 
Astr.21, 9 (1973); R. J.TAYLER(ed.) artykuły w tomie: Late Stages 
of Stellar\Evolution,\. A.U. Symposium.No. 66, 1974. 


Galaktyki 


Michał Różyczka 

Wyspy Wszechświata 

Nazwa „galaktyka”, wywodząca się od gr. wyrazu 
gala (mleko), wprowadzona została w II połowie 
XVIII w. przez Wiliama Herschela. Z obserwacji 
Herschela wynikało, że wszystkie gwiazdy (wśród 
nich i Słońce) rozmieszczone są w skończonej obję¬ 
tości i tworzą w otaczającej pustce „wyspę” materii. 
Oglądane z Ziemi, czyli z wnętrza wyspy, skupiają 
się na sferze niebieskiej w świecącym pasie Drogi 
Mlecznej. 

W końcu XVIII w. obserwacje astronomiczne 
sprowadzały się na ogół do pomiarów pozycji ciał 
należących do Układu Słonecznego. Szczególnie chęt¬ 
nie obserwowano komety, które początkujący obser¬ 
watorzy często mylili z mgławicami, obiektami —jak 
komety — rozmytymi, ale nie zmieniającymi poło¬ 
żenia wśród gwiazd. By zmniejszyć prawdopodo¬ 
bieństwo popełniania takich pomyłek, sporządzono 
w 1784 r. pierwszy katalog mgławic, który ma obecnie 
znaczenie wyłącznie historyczne. Wprowadzone w 
nim oznaczenia są jednak powszechnie używane i tak 
np. widoczna gołym okiem w gwiazdozbiorze Herku¬ 
lesa gromada kulista znana jest jako M 13, zaś po¬ 
zostałość po wybuchu supernowej w gwiazdozbiorze 
Byka — jako M 1. 

Nawet po ukazaniu się katalogu mgławice nie zys¬ 
kały popularności wśród astronomów, zajęli się nimi 
natomiast filozofowie. Według Kanta wszystkie mgła¬ 
wice były Wyspami Wszechświata — tj. niezwykle 
odległymi zbiorowiskami gwiazd rozdzielonymi pustą 
przestrzenią. Wyprzedzając Herschela Kant twierdził, 
iż Słońce jest jedną z gwiazd Drogi Mlecznej. Każda 
mgławica miała według niego składać się z tylu 


gwiazd, ile jest skupionych w Drodze Mlecznej i każ¬ 
da powinna dać się rozdzielić na gwiazdy za pomocą 
odpowiednio dużego teleskopu. Hipoteza Kanta cze¬ 
kała na pełną weryfikację obserwacyjną prawie 150 
lat. Tymczasem W. Herschel, który dysponował naj¬ 
potężniejszym wówczas teleskopem, stwierdził, iż nie¬ 
które z mgławic na pewno nie są zbiorowiskami 
gwiazd. W innych, które udawało mu się rozdzielać 
na gwiazdy, znajdował tyle zaledwie świecących 
punktów, ile zawiera drobna cząstka Drogi Mlecznej. 
Przez cały XIX w. galaktyka pozostała jedyną Wyspą 
Wszechświata, której istnienie uznawano za dowie¬ 
dzione. 

Nowe jakościowo dane o mgławicach zebrano do¬ 
piero kilkadziesiąt lat po śmierci Herschela. W 1845 r. 
Wiliam Parsons (lord Rossę) zaobserwował w pani 
mgławicach strukturę spiralną. Czternaście lat później 
Wiliam Huggins rozpoczął pierwsze obserwacje spek¬ 
troskopowe ciał niebieskich. Najciekawsze wyniki 
otrzymano z obserwacji mgławic nie dających się 
rozdzielić na gwiazdy. Znaleziono wśród nich obiekty 
o widmach niemal identycznych z widmami zwykłych 
gwiazd. Zgodnie z jedną z postawionych hipotez — 
widmo takiej mgławicy miało powstawać w wyniku 
nakładania się dużej liczby widm bardzo dalekich 
gwiazd. Zdobyto pierwszy argument przemawiający 
za tym, iż niektóre z wgławic mogą być Wyspami 
Wszechświata. Szczególną uwagę zwrócono na odkry¬ 
te przez lorda Rossę wglawice spiralne, które mając 
widma podobne do widm gwiazd nie dawały się roz¬ 
dzielać na gwiazdy, mimo budowania coraz większych 
teleskopów. 

W końcu lat siedemdziesiątych ubiegłego wieku 
rozpowszechniły się obserwacje fotograficzne. Wyko¬ 
nano na ich podstawie obszerne katalogi mgławic 
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(NGC, IC), a także kontynuowano badania spektro¬ 
skopowe. Porównując zdjęcia wykonane w dużych 
odstępach czasu opisano ruchy gwiazd w galaktyce. 
Na początku XX w. rozpoczęto badania rozmieszcze¬ 
nia przestrzennego gwiazd, możliwe do przeprowa¬ 
dzenia dzięki nowym metodom wyznaczania odleg¬ 
łości. W miarę napływu informacji zmieniały się wy¬ 
obrażenia o kształcie i rozmiarach galaktyki. Stwier¬ 
dzono, że nazywane niegdyś mgławicami gromady 
kuliste i otwarte, które rozdzielił na gwiazdy już 
Herscheł, znajdują się w odległościach nie większych 
niż odległości pojedynczych gwiazd. W 1918 r. Har- 
modol Iow Shapley przedstawił kolejny model galaktyki, 
galaktyki sporządzony na podstawie badań rozmieszczenia 
Shapleya przestrzennego gromad kulistych. Wyznaczona przez 
Shapleya wartość średnicy galaktyki była dziesięcio¬ 
krotnie większa od przyjmowanych poprzednio, 
a Słońce, które we wszystkich dotychczasowych mo¬ 
delach umieszczano w centrum galaktyki, znalazło się 
prawie na jej skraju. Próby przeniesienia wyobrażeń 
o galaktyce na mgławice skończyły się niepowodze¬ 
niem. Kilka lat przed ukazaniem się pracy Shapleya 
wykonano w jednym z obserwatoriów serię zdjęć paru 
mgławic spiralnych. Popełniając wykryty znacznie 
później błąd zmierzono na nich zerowe w rzeczy¬ 
wistości przesunięcia kątowe i wyznaczono prędkości 
kątowe obrotu mgławic. Po przemnożeniu ich przez 
promień galaktyki Shapley otrzymał prędkości linio¬ 
we obrotu wielokrotnie większe od prędkości światła. 
Założenie, że mgławice spiralne są Wyspami Wszech¬ 
świata podobnymi do galaktyki, prowadziło zatem 
do absurdu. Shapley musiał je odrzucić i uznać 
galaktykę za twór unikalny. 

Problem mgławic doczekał się ostatecznego roz¬ 
wiązania dopiero kilka lat później, gdy Edwin Hubble, 
za pomocą 2,5-metrowego teleskopu na Mount Wil¬ 
son, zdołał rozdzielić mgławicę spiralną M 31 na 
gwiazdy i wyznaczyć ich odległości. Okazało się, że 
M31 (Mgławica Andromedy) leży daleko poza gra¬ 
nicami naszej Galaktyki. Z następnych prac Hubble’a 
wynikało, że obiektami pozagalak tycznym i są wszyst¬ 
kie mgławice, które dają się ułożyć w pewien ciąg 
typów morfologicznych i których widma podobne są 
ciąg do widm zwykłych gwiazd. Ciąg ów znany jest obec- 
Hubb!c'a nie jako ciąg Hubble’a, natomiast zaproponowana 
przez niego nazwa mgławice pozagalaktyczne nie 
przyjęła się. Obiekty te nazywa się obecnie po prostu 
galaktykami. Naszą Galaktykę wyróżnia się pisząc ją 
wielką literą bądź nazywając Układem Drogi Mlecz¬ 
nej. Termin „mgławice” zachowany został do ozna¬ 
czania gazowych i pyłowych obłoków materii między- 
gwiazdowej znajdujących się w Galaktyce. 


Układ Drogi Mlecznej 


Najsilniej świecąca część Układu Drogi Mlecznej 
przypomina kształtem silnie spłaszczony dysk. Nie 
można jednak określić granicy układu: Galaktyka 
przechodzi w sposób ciągły w przestrzeń międzyga- 
laktyczną. Za umowną granicę Galaktyki, obejmującą 
wszystkie podsystemy, można przyjąć powierzchnię 
kuli o średnicy ok. 200 000 lat świetlnych (l.św.). 
Średnica świecącego dysku nie przekracza 90 000 l.św., 
a największa grubość — 10 000 l.św. Znajduje się 
w nim ok. 10 12 gwiazd, a całkowitą jego masę ocenia 
się na WMO 12 mas Słońca. Przeważająca część masy 
emitującej promieniowanie skupiona jest w zagęsz¬ 
czeniu centralnym — kulistym tworze (ii. 223 i 224, 
tabl. 60) o średnicy zaledwie 5000 l.św. Tworzą je gwia¬ 
zdy populacji II, których łączna masa stanowi l / 6 masy 
Galaktyki. Gęstość materii w zagęszczeniu central¬ 
nym jest kilkaset razy większa niż w bezpośrednim 
otoczeniu Słońca i wynosi ok. 20-30 mas Słońca/l.św. 3 

Rozkład przestrzenny gwiazd w Galaktyce ma dwie 
symetrie: zwierciadlaną — względem płaszczyzny Ga- 
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laktyki, i osiową — względem osi Galaktyki ustawio¬ 
nej do płaszczyzny Galaktyki prostopadle i prze¬ 
chodzącej przez obszar największej gęstości. Obszar zagęszczenie 
ów zwano dawniej jądrem, obecnie — coraz powsze- centralne 
chniej używa się nazwy zagęszczenie centralne. Pła¬ 
szczyzna Galaktyki (także: płaszczyzna równikowa 
lub równik) przecina sferę niebieską wzdłuż pasa 
Drogi Mlecznej. Zagęszczenie centralne leży w kie¬ 
runku wyznaczonym przez gwiazdozbiór Strzetca. 

Z Ziemi jest niewidoczne — zasłaniają je obłoki ma¬ 
terii międzygwiazdowej nieprzezroczyste dla-promie¬ 
niowania widzialnego. 


Rozmieszczenie i ruchy gwiazd 

Powierzchnie jednakowych gęstości przestrzennych 
gwiazd (przez gęstość przestrzenną gwiazd należy 
rozumieć liczbę gwiazd w jednostce objętości) są 
współosiowymi elipsoidami obrotowymi o różnych 
stopniach spłaszczenia i różnych rozmiarach (rys. 1). 
W latach czterdziestych XX w. W. Baade zauważył, 
że powierzchnie jednakowej gęstości gwiazd o danym 
typie widmowym tworzą rodzinę elipsoid podobnych. 



tysiące lat świetlnych 

Rys. I. Przenikanie się podsystemów: powierzchnie stałych gę¬ 
stości podsystemów Układa Drogi Mlecznej w modelu Galak¬ 
tyki Oorta (przekrój płaszczyzną prostopadłą do równika Ga¬ 
laktyki i przechodzącą przez środek Galaktyki oraz Słońce). 
Kółeczko oznacza położenie Słońca. Model Oorta składa się 
z trzech podsystemów: płaskiego (dwie wewnętrzne silnie spłasz¬ 
czone elipsy), pośredniego (trzy zewnętrzne słabiej spłaszczone 
elipsy) i sferycznego (dwie wewnętrzne najsłabiej spłaszczone, 
zacieniowane elipsy) 


tzn. mających jednakowe stopnie spłaszczenia, i po- podsystemy 
dzielił Galaktykę na podsystemy (populacje). Wyróż- gwiazd 
niamy obecnie pięć podsystemów: 

1) Skrajny podsystem płaski — 3% masy Galak¬ 
tyki, ok. 2 mld gwiazd (skrajna populacja I): błę¬ 
kitne nadolbrzymy, gwiazdy typu T Tauri, cefeidy, 
materia międzygwiazdowa. 

2) Podsystem płaski. — 8% masy Galaktyki, ok. 5 
mld gwiazd (starsza populacja 1): gwiazdy ciągu 
głównego od karłów do typu widmowego A włącznie. 

3) Dysk (populacja II): mgławice planetarne, gwia¬ 
zdy nowe, zmienne typu RR Lyrae z okresami zmian 
blasku mniejszymi od dziesięciu godzin, zmienne dłu¬ 
gookresowe z okresami większymi od 140 dni. 

4) Podsystem pośredni — wraz z dyskiem zawiera 
ok. 50 mld gwiazd, czyli 67% masy Galaktyki (po¬ 
średnia populacja II): zmienne długookresowe z okre¬ 
sami mniejszymi od 140 dni. 

5) Halo — 22% masy Galaktyki, ok. 16 mld gwiazd 
(skrajna populacja II): gwiazdy typu RR Lyrae 
z okresami większymi od dziesięciu godzin, gromady 
kuliste, podkarły zawierające minimalne ilości pier¬ 
wiastków cięższych od helu. 

Im silniej spłaszczony jest podsystem, tym wyraź¬ 
niej jest w nim zaznaczona płaszczyzna Galaktyki. 










W podsystemach słabo spłaszczonych (tzw. podsys¬ 
temach sferycznych) płaszczyzna Galaktyki nie jest 
wyróżniona, wyraźne maksimum gęstości pojawia się 
natomiast w centrum. 

W podsystemach płaskich przeważają gwiazdy za¬ 
wierające dużo pierwiastków cięższych od helu (na¬ 
zywanych powszechnie metalami), zaś w podsyste¬ 
mach sferycznych — gwiazdy zawierające bardzo 
mało metali. Metale powstają w reakcjach syntezy 
jądrowej zachodzących we wnętrzach gwiazd. Za¬ 
obserwowano, iż gwiazdy w trakcie ewolucji tracą 
część swej masy. Wynika stąd, że gwiazdy podsystemu 
pośredniego i halo (populacja II) musiały powstać 
we wcześniejszych etapach ewolucji Wszechświata, 
tj. wtedy, gdy pierwiastków ciężkich było mało. Te 
z nich, które ewoluowały szybciej, zwróciły przetwo¬ 
rzoną i wzbogaconą w metale materię do ośrodka 
międzygwiazdowego. Materia międzygwiazdowa sku¬ 
piona jest obecnie w płaszczyźnie równikowej i tylko 
sporadycznie występuje w dużych odległościach od 
równika. W okolicach równika powstają gwiazdy 
młodszej generacji (populacja I) z bogatych w metale 
obłoków. Młoda gwiazda porusza się początkowo 
w płaszczyźnie równikowej, w której działają słabe 
siły zakłócające. W efekcie ich działania po dosta¬ 
tecznie długim czasie zaawansowana już ewolucyjnie 
gwiazda przechodzi do podsystemu mniej spłaszczo¬ 
nego, rozpraszając część swej masy w płaszczyźnie 
Galaktyki. 

Podsystem płaski ma strukturę spiralną zaznaczoną 
najwyraźniej w płaszczyźnie równikowej. Tworzą ją 
ramiona trzy ramiona spiralne: Perseusza, Oriona i Strzelca 
spiralno (wg ostatnich, nie potwierdzonych jeszcze obserwacji. 
Galaktyki Galaktyka ma cztery ramiona spiralne). W ramionach 
spiralnych skupione są niemal wszystkie gwiazdy 
młode i jasne oraz świecące obłoki gazowe (tzw. 
mgławice emisyjne). Płynące z obserwacji innych 
galaktyk wrażenie dominowania ramion nad pozo¬ 
stałymi częściami podsystemu płaskiego jest w znacz¬ 
nej mierze wrażeniem pozornym. W rzeczywistości 
gęstość materii w ramionach jest zaledwie trzykrotnie 
większa od średniej gęstości podsystemu płaskiego. 
W zewnętrznej części ramienia Oriona, w odległości 
około 30 000 lat świetlnych od środka Galaktyki i oko¬ 
ło 30 lat świetlnych nad jej płaszczyzną równikową, 
znajduje się Układ Słoneczny. Słońce należy do żółtych 
karłów często spotykanych w Galaktyce i niczym się nie 
wyróżnia spośród gwiazd leżących w jego otoczeniu. 

Wszystkie gwiazdy obiegają centrum Galaktyki po 
mniej lub bardziej spłaszczonych orbitach. Na po- 
ruchy czątku naszego wieku stwierdzono, iż średni ruch 
gwiazd gwiazd należących do pewnych grup kinematycznych 
można zinterpretować jako rotację owych grup. 
W końcu lat czterdziestych grupy kinematyczne 
utożsamiono z podsystemami. Najszybciej rotują 



odległość r 

Rys. 2. Prędkość liniowa obrotu Galaktyki (v) w funkcji odleg¬ 
łości od centrum (r). Podobnie, tzn. w sposób opisany III pra¬ 
wem Keplera, obracają się pierścienic Saturna. Dla r < 10 000 
ł.św. (linia przerywana) dane obserwacyjne nie są zbyt pewne 

podsystemy płaskie, w których orbity gwiazd są 
prawie kołowe, zaś ruchy własne gwiazd rozumiane 
jako odchylenia od średniego ruchu całego podsys¬ 


temu— niewielkie (prędkości ich nie przekraczają 
20-30 km/s). W podsystemach sferycznych orbity 
gwiazd są silnie wydłużonymi elipsami, dowolnie 
nachylonymi do równika Galaktyki. Ruch obrotowy 
całości jest powolny, natomiast ruchy własne — szyb¬ 
kie (300-500 km/s) i nieuporządkowane. Podsystemy 
rotują różniczkowo, tzn. z prędkością kątową zależną 
od odległości od osi obrotu (w podobny sposób obra¬ 
cają się pierścienie Saturna). Nawet w płaszczyźnie 
Galaktyki, w której opisywane ruchy są najprostsze, 
zależność owa jest dość skomplikowana (rys. 2). 

Kształt funkcji i<r) zależy od rozkładu przestrzennego 
masy. W małych odległościach od centrum v jest 
proporcjonalne do r. Oznacza to, iż zagęszczenie 
centralne jest na tyle silnie powiązane siłami grawi¬ 
tacji, że obraca się jak ciało sztywne. Kierunek obrotu 
Galaktyki można określić podając, że ramiona „na¬ 
wijają się” na oś. Wydaje się to być cechą wspólną 
wszystkich galaktyk spiralnych. 

Natura ramion spiralnych, a zwłaszcza ich stabil¬ 
ność (teoretycznie powinny one wskutek rotacji róż¬ 
niczkowej i istnienia ruchów własnych, rozpłynąć się 
już po 1-2 obrotach Galaktyki) nie są w pełni wyja¬ 
śnione. Teoria fal gęstościowych sformułowana przez teoria fał 
B. Lindblada, a rozwinięta przez C. Lina i F. Shu, gęstościo- 
zyskała obecnie największe uznanie. Zgodnie z nią wych 
ramię spiralne jest wędrującym przez dysk zaburze¬ 
niem (falą gęstości). Gwiazdy, które obecnie należą 
do ramion, po upływie pewnego czasu znajdą się 
w przestrzeni między ramionami, by jeszcze później 
trafić znowu do ramion, lecz już w innych miejscach. 

Stabilność takich fal gęstościowych została wykazana 
w wielu eksperymentach numerycznych. Sposób po¬ 
wstawania fal i czynniki determinujące ich liczbę są 
nadal nieznane. 

Gwiazdy należące do dysku tworzą często małe gromady 
skupienia, zwane asocjacjami, gromadami ruchomy- gwiazd 
mi, bądź gromadami otwartymi. Składniki takich 
skupień są ze sobą powiązane genetycznie (powstają 
z jednego dużego obłoku materii międzygwiazdowej), 
a wektory ich prędkości są do siebie równoległe. 

Najbogatsze z wymienionych skupień zawierają po 
kilka tysięcy gwiazd należących z reguły do populacji 
I. O wiele bogatsze (do 10 5 gwiazd) gromady kuliste 
utworzone są z gwiazd populacji II. Obszarem maksy¬ 
malnej koncentracji gromad kulistych jest centrum 
Galaktyki. 


Materia rozproszona 

Najważniejszym źródłem danych o materii rozpro¬ 
szonej są obserwacje radiowe. Promieniowanie radio¬ 
we Galaktyki zostało wykryte w 1932 r. przez Karla 
Jansky’ego. Początki radioastronomii przypadają 
jednak dopiero na drugą połowę lat czterdziestych 
naszego wieku (-► Radioastronomia). 

Wygląd „nieba radiowego” widzianego z Ziemi 
przedstawia rys. 3. Większość promieniowania ra¬ 
diowego pochodzi z obszarów maksymalnej koncen¬ 
tracji materii rozproszonej, czyli z okolic równika 
Galaktyki. Maksimum główne natężenia leży w cen¬ 
trum Galaktyki. Szereg maksimów pobocznych obser¬ 
wuje się w miejscach, w których promień widzenia 
obserwatora styczny jest do jednego z ramion spiral¬ 
nych. Wyrastające z płaszczyzny równikowej tzw. 
ostrogi radiowe (największa z nich ciągnie się wzdłuż 
południka galaktycznego 30°) najprawdopodobniej 
są tworami lokalnymi. Wiąże się je obecnie z niejed¬ 
norodnościami ramienia Oriona, albo z dawnymi 
wybuchami bliskich supernowych. Tło radiowe Ga¬ 
laktyki jest mieszaniną promieniowania synchrotro¬ 
nowego i termicznego. Wykazano niedawno, że skła¬ 
dowa termiczna tła powstaje w wyniku nałożenia się 
słabych obrazów licznych źródeł dyskretnych. Pas 
emisji termicznej jest bardzo wąski, grubość jego na 
ogół nie przekracza 2-3° (na częstości 2,7 GHz). 
Nieco szerszy pas emisji synchrotronowej ma miejsca- 
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„niebo mi grubość 5°. Cechą charakterystyczną promienio- Według niektórych obserwatorów podsystemy płas- 
radiowe" wania tła jest szybkie zwężanie się pasa emisji ze kie otoczone są rozciągłym halo radiowym wysyłają- 
wzrostem częstości rejestrowanych fal. cym promieniowanie synchrotronowe. Struktury po- 


+ 90° 



źródła Nazwą źródła dyskretne obejmuje się obłoki ma- 
dyskretn© terii międzygwiazdowej, pulsary i radiogwiazdy. 

Najbardziej interesująca grupa silnych źródeł dys¬ 
kretnych leży w centrum Galaktyki (rys. 4). Termicz- 
no-synchrotronowe źródło Sagittarius A (SGR A) 
uważane jest za właściwe jądro Galaktyki. Pozostałe 
z widocznych na rys. 4 radioźródeł są obłokami py¬ 
łowo-gazowymi i mają widmo czysto termiczne. 



Rys. 4. Mapa radiowa centrum Galaktyki na częstości 8 GHz 
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dobne do halo wykryto także w dwóch sąsiednich 
galaktykach. 

Najdokładniejsze informacje dotyczące rozmiesz¬ 
czenia i składu materii rozproszonej pochodzą z ob¬ 
serwacji radiowego widma liniowego. Prócz znanej 
od dawna linii 21 cm wodoru neutralnego H I, obszar H I 
w ostatnich latach wykryto wiele linii prostych związ¬ 
ków chemicznych. Ostre maksimum gęstości wodoru 
neutralnego (10 atomów/cm 3 ) leży w centrum Galak¬ 
tyki. Już w odległości 2000 l.św. od centrum gęstość 
H I wynosi zaledwie 0,2 atomów/cm 3 . Rośnie następ¬ 
nie powoli, by w odległości 15 000 l.św. osiągnąć 0,6 
atomów/cm 3 . Na tym poziomie utrzymuje się przez 
dalsze 2000 l.św., po czym ponownie opada. Części 
centralne Galaktyki są zatem otoczone wyraźnym 
pierścieniem wodoru neutralnego. Całkowita masa 
pierścienia stanowi ok. 10% masy Galaktyki. Jego 
grubość waha się od 450 do 600 l.św. Począwszy od 
odległości 30 000 l.św., płaszczyzna pierścienia zaczy¬ 
na się odchylać od płaszczyzny równikowej Galaktyki 
w stronę bieguna północnego Galaktyki w przedziale 
długości galaktycznych 20-140° i w stronę południo¬ 
wego w przedziale 200-240°. Na zewnętrznej krawędzi 
pierścienia odchylenie to osiąga wartość 2000 l.św. 
Zniekształcenie pierścienia H I wywołane jest prawdo¬ 
podobnie przez siły grawitacyjne pochodzące od naj¬ 
bliższych galaktyk (Obłoków Magellana). 

Ośrodek międzygwiazdowy, który składa się głów¬ 
nie z y/odoru, jest niejednorodny: są to obłoki o róż¬ 
nych rozmiarach. Średnica przeciętnego obłoku wy¬ 
nosi 30 l.św., gęstość — ok. 25 atomów /cm 3 , tempe¬ 
ratura — ok. 100 K. Średnia gęstość ośrodka między 
obłokami jest stukrotnie mniejsza. Najgęstsze ze zna¬ 
nych obłoków, tzw. globule (gęstość do 10 000 ato- globule 
mów/cm 3 ) uważane są przez niektórych badaczy za 
gwiazdy znajdujące się w fazie kondensacji przed 
zapaleniem wodoru. 

Zaledwie 3% masy wodoru międzygwiazdowego 
wysyła promieniowanie widzialne. Są to tzw. obszary obszar H II 




































































H II wodoru zjonizowanego. Z obłokami H I i H II 
sąsiadują często obłoki pyłowe złożone prawdopo¬ 
dobnie z ziaren lodowo-grafitowych, widoczne nie¬ 
kiedy jako ciemne plamy na tle jasnych mgławic 
emisyjnych. Pył kosmiczny jest katalizatorem umo¬ 
żliwiającym powstawanie różnych cząsteczek che¬ 
micznych. Liczba zidentyfikowanych cząsteczek i rod¬ 
ników sięga obecnie 30; do występujących najczęściej 
należą OH, H 2 0, CO i H 2 CO. Gęstą chmurę pyłowo- 
gazową zawierającą rodniki OH i cząsteczki CHOH 
wykryto niedawno w centrum Galaktyki, w pobliżu 
źródła SGR A. Niektóre obłoki dostatecznie gęste 
i zawierające odpowiednio dużo OH łub H 2 0 emitują 
niezwykle duże ilości energii w postaci promieniowa¬ 
nia odpowiadającego liniom widmowym tych czą¬ 
steczek powstającym na Ziemi w zjawisku masero¬ 
wym. Próby wytłumaczenia mechanizmu pompowa¬ 
nia cząsteczek obłoku na wyższe poziomy energe¬ 
tyczne nie dały dotychczas rezultatu i zasada dzia¬ 
łania „masera międzygwiazdowego” pozostaje nie¬ 
wyjaśniona. 

ruchy Materia rozproszona bierze udział w ruchu obroto- 
obłoków wym Galaktyki. W odległościach od centrum więk¬ 
szych niż 12 tys. l.św. obłoki poruszają się po dobrze 
określonych, prawie kołowych orbitach. Bliżej cen¬ 
trum (5-6 tys. l.św.) prędkości ruchów radialnych są 
porównywalne z prędkościami orbitalnymi i pojęcie 
orbity obłoku traci sens. W obszarze tym kilkanaście 
obłoków wodorowych, o łącznej masie ok. 10 7 mas 
Słońca, oddala się z dużymi prędkościami od środka 
Galaktyki. Wektory ich prędkości leżą w płaszczyźnie 

ramię równikowej tub są do niej nachylone pod niewielkimi 
ekspa- tylko kątami. Największy z obłoków nazywany bywa 
ndujące ramieniem ekspandującym. W bezpośrednich okoli¬ 
cach jądra ruchy radialne zanikają. Materia między- 
gwiazdowa tworzy tu wraz z gwiazdami populacji II 
dwie struktury: zewnętrzny pierścień o promieniu 
2000 l.św. i szerokości 1500 l.św. oraz wewnętrzny 
dysk o promieniu 350 l.św. Masa pierścienia i dysku 
oceniana jest na 10 10 mas Słońca, z czego na materię 
międzygwiazdową przypada zaledwie 0,1%, a więc 
o wiele mniej niż w okolicach Słońca. 

Analiza zaburzeń ruchu obrotowego materii mię- 
dzygwiazdowej prowadzi do przypuszczenia, iż przed 



Rys. 5. Ilustracja niepewności wiedzy o Galaktyce. Takim zmia¬ 
nom ulegały w ciqgu trzydziestu lat wyobrażenia o kształcie 
funkcji świecenia gwiazd w otoczeniu Słońca — czyli w najlepiej 
zbadanym obszarze Galaktyki 


mniej więcej trzynastoma milionami lat w jądrze 
Galaktyki nastąpił wybuch. Uwolniła się przy tym 
energia równa mocy promieniowania miliardów 
Słońc. Materia z okolic jądra została wyrzucona pod 
kątem ok. 30° do płaszczyzny równikowej i częścio¬ 
wo ściągnięta do niej na powrót przez siły grawita¬ 
cyjne Galaktyki i pole magnetyczne. 

Dokonane różnymi metodami oceny średniego na- pole 
tężenia pola magnetycznego Galaktyki dały zgodne magnetyczne 
wartości 3-5 *10” 10 T (lokalne pole może być nawet Galaktyki 
dziesięciokrotnie słabsze lub silniejsze od średniego). 

Dzięki badaniom polaryzacji światła gwiazd wiado¬ 
mo, że linie sił pola układają się wzdłuż ramion spi¬ 
ralnych. Energia zawarta w polu elektromagnetycz¬ 
nym jest nikłym ułamkiem energii grawitacyjnej 
Galaktyki, lecz nawet tak słabe pole wystarcza w zu¬ 
pełności do utrzymania w Galaktyce -* Promienio¬ 
wania kosmicznego — strumieni cząstek elementar¬ 
nych o dużych energiach. Źródłem promieniowania 
kosmicznego są najprawdopodobniej wybuchy super¬ 
nowych i — być może —jakieś nie znane jeszcze pro¬ 
cesy zachodzące w jądrze Galaktyki. 

Nasza wiedza o Galaktyce jest jeszcze bardzo nie¬ 
pełna i obraz Galaktyki ulega ciągłym zmianom. 

Najlepszym dowodem tego jest rys. 5, przedstawiający 
tzw. funkcję świecenia gwiazd tak jak się przedstawia- funkcja 
ła w latach 1938, 1968 i 1972. Mimo że do wyznacza- świecenia 
nia funkcji świecenia używano gwiazd leżących w bez¬ 
pośrednim otoczeniu Słońca, a więc w najlepiej po¬ 
znanym rejonie Galaktyki, różnice są olbrzymie. 


Ciąg Hubble'a 


Klasyfikacja morfologiczna galaktyk, wprowadzona 
przez Edwina Hubble’a, jest jeszcze powszechnie 
stosowana, choć całkowicie straciła przypisywane jej 
niegdyś znaczenie teoretyczne. Ciąg Hubble’a jest 
uporządkowany wg rosnącej symetrii (il. 225, tabl. 61). 
Poniższe zestawienie obejmuje nazwy i skrótowe ozna¬ 
czenia typów hubble’owskich oraz ich charaktery¬ 
styki morfologiczne. 

1) Galaktyki nieregularne (Z 1). Brak jakiejkolwiek 
symetrii. Wyglądem przypominają jasne obłoki ma¬ 
terii międzygwiazdowej. Typową galaktyką nie¬ 
regularną jest Mały Obłok Magellana (il. 225a, tabl. 
61). . . 

2) Galaktyki spiralne (5). Niepełna symetria osiowa. 
Materia świecąca tworzy cienki dysk i eliptyczne za¬ 
gęszczenie centralne, z którego wybiegają wtopione 
w dysk ramiona. W galaktykach oglądanych z boku 
widoczny jest ciemny pas materii pyłowej skupionej 
w płaszczyźnie równikowej. Zależnie od wielkości 
zagęszczenia centralnego i stopnia rozwoju ramion 
spiralnych, galaktyki S zalicza się do jednego z trzech 
podtypów: Sc (Mgławica Trójkąta, il. 225b, tabl. 61), 
Sb (Mgławica Andromedy, il. 225c, tabl. 61) oraz 
Sa (M 104, il. 225d, tabl. 61). Galaktyką spiralną ty¬ 
pu Sb jest także Układ Drogi Mlecznej. 

3) Galaktyki spiralne z poprzeczką (SB). Niepełna 
symetria osiowa. Ramiona spiralne zaczynają się 
w pewnej odległości od zagęszczenia centralnego. 
Początki ich połączone są przechodzącym przez śro¬ 
dek galaktyki pomostem świecącej materii —tzw. 
poprzeczką. Przyczyny formowania się poprzeczek 
nie są jeszcze znane. Typ SB dzieli się na trzy pod- 
typy, analogiczne do podtypów S: SBc , SBb i SBa 
(il. 225 e-g, tabl. 61). 

4) Galaktyki soczewkowate (S0). Pełna symetria 
osiowa. Zagęszczenie centralne otoczone jest niezbyt 
rozległym, lecz grubym dyskiem. Galaktyki SB nie 
mają ramion spiralnych. W żadnej z nich nie stwier¬ 
dzono obecności materii pyłowej (il. 225h, i, tabl. 61). 

5) Galaktyki eliptyczne ( E ). Symetria osiowa prze¬ 
chodząca w sferyczną. Brak dysku. Na sferze niebie¬ 
skiej widoczne są jako elipsy o różnych stopniach 
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spłaszczenia. Miarą obserwowanego spłaszczenia jest 
stosunek 10 '(a—b)!a, gdzie a i b — wielka i mała 
półoś elipsy. Obserwowane stopnie spłaszczenia za¬ 
wierają się w przedziale (0-7) — stąd podział typu E 
na osiem podtypów: od El do EO. Rzeczywiste stop¬ 
nie spłaszczenia można wyznaczać bądź grupowo 
(metodami statystycznymi), bądź indywidualnie (me¬ 
todami fotometrycznymi). Ostatnia metoda pozwala 
także na odróżnienie galaktyk E od galaktyk 50, 
widzianych od strony bieguna (por. il. 2251, h, tabl. 61) 
Z badań częstości występowania obserwowanych 
stopni spłaszczenia wynika, iż istnieją galaktyki o sto¬ 
pniu spłaszczenia równym 0, czyli o pełnej symetrii 
sferycznej. W galaktykach E bardzo rzadko obser¬ 
wuje się materię pyłową. Do przedstawicielek typu E 
należą towarzyszki Mgławicy Andromedy galaktyki 
M 32 (£5, il. 225j, tabl. 61) i NGC 185 (£2, il. 225k, 
tabl. 61) oraz ogromna galaktyka sferyczna M 87 (£0, 
il. 2251, tabl. 61). Pozostałe 0,5% stanowią galaktyki 
osobliwe (pekuliame), nie należące do żadnego z wy¬ 
mienionych typów. Jest o nich mowa w rozdziale 
Jądra galaktyk. 


Typy galaktyk 

częstość 
występowa- 
nia różnych ^ 

Częstość 
występowa¬ 
nia, % 

typów 


E0 + EI + ... + E7 + S0 

17 

Sa + SBa 

19 

Sb + SBb 

25 

Sc + SBc 

36 

I\ 

2,5 


Kilkanaście lat po ukazaniu się prac Hubble’a jego 
klasyfikację uzupełniono karłowatymi galaktykami 
eliptycznymi 12, które mają cechy strukturalne ga¬ 
laktyk eliptycznych, różnią się od nich nikłymi roz¬ 
miarami i bardzo małą gęstością gwiazd. Wyjątkowo 
małe jasności powierzchniowe utrudniają, a przy nie¬ 
znacznym pogorszeniu warunków atmosferycznych 
wręcz uniewożliwiają, obserwacje galaktyk 12. Od¬ 
kryto ich zaledwie kilka, istnieją jednak podstawy 
by przypuszczać, że typ 12 jest w Kosmosie repre¬ 
zentowany bardzo licznie. Typowi przedstawiciele 
galaktyk 12 to tzw. systemy Sekstans i Fomax (il. 225 
m, n, tabl. 61). 


Rozmieszczenie przestrzenne 
galaktyk 

Niejednorodności w rozkładzie galaktyk na sferze 
niebieskiej znane były już Herschelowi, jednak do¬ 
kładnie zostały zbadane dopiero przez Hubble’a. 
Związane z nimi problemy są dziś uważane za jeden 
z najważniejszych w kosmologii i teorii ewolucji 
galaktyk. 

pas Nie obserwuje się zupełnie galaktyk leżących w 
unikania obrębie tzw. pasa unikania, ciągnącego się wzdłuż 
równika Galaktyki: ich światło jest całkowicie po¬ 
chłaniane przez materię międzygwiazdową. Jest to 
przykład pozornej niejednorodności rozkładu, wy¬ 
wołanej niedoskonałością obserwacji. Prawdziwy 
rozkład galaktyk na sferze niebieskiej, otrzymany po 
uwzględnieniu zafałszowań spowodowanych absorp¬ 
cją, jest nadal niejednorodny. Galaktyki grupują się 
na sferze w układach zwanych (zależnie od iiczeb- 
grupy i ności) grupami bądź gromadami. Z badań statystycz- 
gromady nych wynika, że widoczne na niebie grupy i gromady 
galaktyk nie powstają w wyniku przypadkowego zlewania się 
bliższych galaktyk z dalszymi, lecz są odbiciem rze¬ 
czywistych niejednorodności rozkładu przestrzennego. 
Na realność fizyczną bogatych gromad wskazuje ich 
regularna budowa (il. 229, tabl. 63). Ponadto w nie- 
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których mało liczebnych grupach zaobserwowano mo¬ 
sty świecącej materii, łączące poszczególne galaktyki. 

Większość obserwatorów zdaje się obecnie skłaniać ku 
stwierdzeniu, iż w ogóle nie istnieją galaktyki po¬ 
jedyncze, nie należące do żadnej gromady. Nie za¬ 
obserwowano natomiast, aby gromady galaktyk two¬ 
rzyły ugrupowania wyższego rzędu, tj. gromady gro¬ 
mad. Oznacza to, że dostępna obserwacjom część 
Kosmosu jest jednorodna w skali gromad. 

Niewiele dotychczas wiadomo o przeciętnej groma¬ 
dzie. Najlepiej zbadane są gromady liczące po kilka¬ 
set i więcej galaktyk (il. 229, tabl. 63). Są to zwykle 
układy niezbyt zwarte. Gęstość przestrzenna galaktyk 
w gromadzie rośnie jednak znacząco w miarę zbliżania 
się do centrum, w którym często można znaleźć galak¬ 
tykę przewyższającą znacznie jasnością i rozmiarami 
wszystkie pozostałe składniki gromady. Galaktyka 
centralna jest zazwyczaj galaktyką aktywną (patrz roz¬ 
dział Jądra galaktyk). Z centralnych okolic paru gro¬ 
mad odebrano promieniowanie rentgenowskie inter¬ 
pretowane jako promieniowanie termiczne gazu mię- 
dzygalaktycznego. Jest to jedyny, jak dotąd, dowód 
istnienia materii międzygalaktycznej. 

Zakładając, że gromada jest tworem stabilnym, 
który istnieje w niezmienionej postaci od paru mi¬ 
liardów lat, i mierząc prędkości radialne jej składni¬ 
ków można (z twierdzenia o wiriale) wyznaczyć jej 
masę. Otrzymane wartości przewyższają dziesięcio¬ 
krotnie masy ocenione na podstawie zsumowania 
przybliżonych mas poszczególnych galaktyk. Zatem— 
albo gromady nie są stabilne (czemu jednak przeczy 
sam fakt ich obserwowania), albo błędne są wyobra¬ 
żenia na temat mas- pojedynczych galaktyk. Według 
najbardziej prawdopodobnej hipotezy „brakująca’’ 
w galaktykach masa skupiona jest w czerwonych 
karłach ciągu głównego, należących zarówn© do 
pierwszej, jak i do drugiej populacji gwiazd. Teoria 
ewolucji gwiazd przewiduje ich istnienie, lecz z po¬ 
wodu znikomych jasności są one niemożliwe do zaob¬ 
serwowania. 

Największą w naszym otoczeniu Wszechświata gro- gromada 
madą jest gromada Virgo licząca kilkaset jasnych Virgo 
i kilka tysięcy słabszych galaktyk. Środek jej leży 
w odległości ok. 35 000 000 l.św. od Słońca. W jego 
pobliżu znajduje się dominująca w gromadzie galak¬ 
tyka M 87 typu £0, niezwykle masywna (ok. 10 ł3 Af®) 
i otoczona wyjątkowo liczną chmurą gromad kuli¬ 
stych. Niektórzy obserwatorzy zaliczają do gromady 
Virgo Układ Lokalny Galaktyk, zawierający Układ 
Drogi Mlecznej. 

Układ Lokalny (jak i większość dokładniej zbada- Układ 
nych małych grup galaktyk) jest tworem niestabil- Lokalny 
nym: jego składniki rozbiegają się. Do Układu Lokal- Galaktyk 
nego zalicza się wszystkie galaktyki położone w odle¬ 
głości mniejszej od 2 000 000 l.św.; znamy ich dwa- 












wyznaczanie 

odległości 

galaktyk 


prawo 

Hubble'a 


dzieścia parę. Nasza Galaktyka, której towarzyszą 
dwie galaktyki satelitarne (Obłoki Magellana), jest 
największa w Układzie. Dorównuje jej prawie roz¬ 
miarami Mgławica Andromedy, także mająca dwie 
galaktyki satelitarne. Reszta składników Układu to 
galaktyki pojedyncze, wielokrotnie mniejsze od naszej. 
Badania Układu Lokalnego Galaktyk prowadzą za¬ 
tem do wniosku, iż najliczniej reprezentowane są we 
Wszechświecie galaktyki o małych masach, a wśród 
nich — karłowate galaktyki 72. Krótkie charaktery¬ 
styki składników Układu Lokalnego zawarte są w ta¬ 
beli, a ich rozmieszczenie przedstawia rys. 6. 

Galaktyki nie objęte zestawieniem (w 1975 r. było 
ich 4) należą do klasy 12. Zostały one odkryte w ostat¬ 
nich latach i brak o nich na razie dokładniejszych 
danych. Jedna z nich, odkryta w połowie 1975 r., 
leży w odległości zaledwie 60 000 I.św., a więc bliżej 
niż Obłok Magellana. Numer galaktyki w tabeli od¬ 
powiada oznaczeniom na rys. 6, który przedstawia 
Układ Lokalny w rzucie na płaszczyznę Galaktyki. 
Ilustracja 230 (tabl. 63) przedstawia fotografię ciasnej 
grupy wzajemnie oddziałujących galaktyk zw. Kwin¬ 
tetem Stefana — inny przykład niestabilnego układu 
galaktyk. Jego składniki rozbiegają się z dużymi pręd¬ 
kościami. 


Układ Lokalny Galaktyk 


Nu¬ 

mer 

Nazwa 

Typ i 

Odleg¬ 

łość 

tys. l.św. 

Jasność 

widoma 

Wiel¬ 

kość 

gwiaz¬ 

dowa 

abso¬ 

lutna 

1 

Układ Drogi Mlecznej 

Sb 

0 

_ 

-19,8 

2 

Wielki Obłok Magellana 

71 

150 

2,8 

-17,4 

3 

Mały Obłok Magellana 

71 

150 

1,2 

-16,0 

4 

System U Ma 

72 

220 

10,0 

-9,0 

5 

System Sculptor 

72 

300 

8,8 

-12,1 

6 

System Draco 

72 

330 

10,0 

-10,0 

7 

System Leo 1 

12 

680 

12,0 

-9,7 

8 

System Leo 2 

n 

680 

12,0 

-9,7 

9 

System Fornax 

72 

910 

9,1 

-13,4 

10 

NGC6S22 

71 

1100 

9,1 

-13,9 

11 

NGC147 

E3 

1250 

10,5 

-13,4 

12 

NGC185 

El 

1250 

10,2 

-13,7 

13 

NGC205 

E5 

1500 

8,9 

-15,0 

14 

NGC221 (M 32) 

E2 

1500 

9,1 

-14,8 

15 

Mgławica Andromedy 

Sb 

1500 

4,3 

-19,8 

16 

IC1613 

11 

i 1500 

10,0 

-13,5 

17 

Mgławica Trójkąta 

Sc 

16C0 

6,0 

-17,6 


Galaktyki wchodzące w skład Układu Lokalnego 
porozrzucane są po całej sferze. By stwierdzić, czy 
dana galaktyka należy do Układu — trzeba wyznaczyć 
jej odległość. Najdokładniejszą z metod wyznaczania 
odległości galaktyk jest metoda cefeid zastosowana 
już przez Hubble ł a. Zaobserwowawszy w galaktyce 
cefeidę (ii. 226, tabl. 62), którą łatwo jest rozpoznać po 
charakterystycznej krzywej zmian blasku, mierzy się 
okres owych zmian, związany dość jednoznacznie 
z jasnością absolutną gwiazdy. Znając jasność wido¬ 
mą otrzymuje się już łatwo odległość. Niestety, metodą 
cefeid można wyznaczyć tylko odległości niezbyt duże, 
nie większe niż 7 min l.św. Galaktyki z centralnych 
części gromady Virgo leżą już poza obszarem jej sto¬ 
sowalności. Inne metody pozwalają sięgnąć w Kosmos 
nieco dalej, dają jednak mniej dokładne wyniki. Na¬ 
leżą do nich metoda gwiazd nowych, wykorzystu¬ 
jąca założenie o stałej jasności absolutnej nowych 
w maksimum blasku, i metoda obszarów H II, wyko¬ 
rzystująca założenie o stałości rozmiarów liniowych 
mgławic emisyjnych. Obliczając opisanymi metodami 
odległości bliskich galaktyk E. Hubble dokonał 
w 1929 r. odkrycia, które pozwoliło wyznaczyć od¬ 
ległości nieporównywalnie większe. Stwierdził, że 
prędkości radialne galaktyk v , wyznaczone z przesu¬ 
nięć widm galaktyk ku czerwieni, rosną proporcjo¬ 
nalnie do odległości od obserwatora r: 

v = Hr. 



Rys. 7. Zależność prędkości oddalania się galaktyk od ich od¬ 
ległości od obserwatora — oryginalny diagram Hubble’a z 1929 r. 
Różne symbole odpowiadają różnym metodom opracowania 
obserwacji. Miarą niedokładności obserwacji jest rozbieżność 
między prostą ciągłą i przerywaną 

Zależność v(r) otrzymana przez Hubble ł a na podsta¬ 
wie obserwacji bliskich galaktyk przedstawiona jest 
na rys. 7. Zatem, aby zmierzyć odległość dzielącą nas 
od jakiejś galaktyki, wystarczy uzyskać jej widmo. 
Najdalsza z galaktyk, dla której otrzymano widma, 
leży w odległości kilku miliardów lat świetlnych. 


Parametry fizyczne galaktyk 

Galaktyki należące do różnych typów morfologicz¬ 
nych różnią się znacznie parametrami fizycznymi. Za¬ 
leżności te mają oczywiście charakter statystyczny i nie 
są związkami ścisłymi. 

Widma galaktyk podobne są na ogół do widm po¬ 
jedynczych gwiazd. Typ widmowy zmienia się od póź¬ 
nego Fw typie 71 do G5-G6 w typie E. Różnice typów 
widmowych spowodowane są różnymi wkładami po¬ 
szczególnych populacji. W galaktykach eliptycznych 
przeważają późne typy widmowe zaawansowanych 
ewolucyjnie gwiazd populacji II, zaś w galaktykach 
nieregularnych — młode gwiazdy populacji I o wcze¬ 
snych typach widmowych. Jednak we wszystkich 
dokładniej zbadanych galaktykach zaobserwowano 
gwiazdy bardzo stare. 

Średnia w danym typie morfologicznym masa galak¬ 
tyki i średnia jasność rośnie wyraźnie z przejściem od 
typu I do E. Największe z galaktyk eliptycznych ważą 
kilkanaście razy więcej niż Układ Drogi Mlecznej, 
zaś karłowate galaktyki 72 — do 10 000 razy mniej. 
Podobnie jest z jasnościami. Dwie stosowane obecnie 
metody wyznaczania mas (z obserwacji radiowych 
i optycznych) dają rażąco niezgodne wyniki Gest to 
tzw. problem „brakującej” masy — patrz str. 940). We 
wszystkich typach morfologicznych większość masy 
skupiona jest w gwiazdach. Na wodór neutralny H I 
(jedyną składową materii rozproszonej badaną po¬ 
wszechnie w innych galaktykach) przypada od 0,5% 
(typ S0 ) do 20% masy (typ 71). W galaktykach 71 
maksimum gęstości wodoru neutralnego pokrywa się 
ze środkiem geometrycznym układu. Galaktyki spi¬ 
ralne natomiast otoczone są pierścieniem wodorowym, 
tak że w środku geometrycznym wypada u nich mini¬ 
mum gęstości H I. Częstokroć pien&ień ten jest dużo 
wyraźniejszy niż w naszej Galaktyce. Przyczyny 
tworzenia się pierścieni H I nie są znane. W galakty¬ 
kach eliptycznych nie zaobserwowano wodoru neu¬ 
tralnego. Nie znaczy to jednak, że nie zawierają one 
materii rozproszonej w innych postaciach. Znaczny 
ich procent emituje promieniowanie synchrotronowe, 
świadczące o obecności zjonizowanego gazu, skupio¬ 
nego w obszarach centralnych. W niektórych widać 
ciemne obłoki pyłowe (il. 225j, k, tabl. 61). 

Największe prędkości rotacji obserwowano w syste¬ 
mach spłaszczonych, należących do typów SO-Sc. 
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Równowaga mechaniczna jest w nich utrzymywana 
dzięki równoważeniu się sił grawitacyjnych i odśrod¬ 
kowych. Galaktyki EO nie obracają się w ogóle, a rów¬ 
nowagę mechaniczną utrzymują dzięki bezładnym 
ruchom gwiazd obiegających centrum po silnie spłasz¬ 
czonych orbitach. Tak więc dość jednoznaczną funk¬ 
cją typu morfologicznego jest rozkład momentu pędu 
(tzn. funkcja, która podaje procent masy galaktyki 
mający dany moment pędu). Galaktyki SO-Sc za¬ 
wierają duże ilości materii z dużym momentem pędu 
(maksimum rozkładu — w obszarze dużych wartości), 
zaś galaktyki EO zawierają wyłącznie materię z ma¬ 
łym momentem pędu (maksimum rozkładu — w ob¬ 
szarze małych wartości). 

Ostatnim parametrem związanym z typem morfo¬ 
logicznym jest liczba gromad kulistych towarzyszą¬ 
cych galaktyce. Wybrawszy z typów Sc , Sb, Sa, £0 i E 
galaktyki o jednakowych masach można łatwo stwier¬ 
dzić, że najwięcej gromad skupia się przy galaktykach 
eliptycznych. 

Galaktyki karłowate są jeszcze na tyle słabo zba¬ 
dane, że nie wiadomo, czy w ogóle zawierają materię 
rozproszoną. Tylko niektórym z nich towarzyszą 
nieliczne i niewielkie gromady kuliste. Większość ga¬ 
laktyk 72 zbudowana jest prawie wyłącznie z gwiazd 
populacji II, jednak np. galaktyki 72, leżące w gwiaz¬ 
dozbiorze Sekstansu składają się prawie wyłącznie z 
gwiazd młodych, należących do populacji I. 


Jądra galaktyk 

JącSro a Jeszcze kilkanaście lat temu wyrazem „jądro” okreś- 
cagęszczenie lano centralną, najjaśniejszą część galaktyki. Zgodnie 
centralne z ówczesnymi pojęciami galaktyki składały się wy¬ 
łącznie z gwiazd i z materii rozproszonej. 

Stopniowo zrozumiano jednak, że dwuskładnikowy 
model galaktyki jest zbyt prymitywny. Na trop tego 
wniosku naprowadziły znane od czasów Hubb!e’a 
galaktyki osobliwe (il. 227, tabl. 62, ii. 231, 232, tabl. 
63), wyłamujące się z ciągu klas morfologicznych. 
Wiele z nich nazywano galaktykami wybuchającymi. 
Proste oszacowania ilości energii potrzebnej do wpra¬ 
wienia w ruch ogromnych mas wyrzucanych z wybu¬ 
chających galaktyk dawały wartości 10 50 J, prze¬ 
kraczające wszystko, z czym się dotychczas we 
Wszechświecie spotkano. Dość oczywisty wniosek, iż 
energia wyzwalana jest w obiektach kosmicznych 
jeszcze nauce nie znanych, wyciągnięto jednak do¬ 
piero po wprowadzeniu nowych metod obserwacji 
w różnych zakresach fal radiowych i w podczerwieni. 
Obserwacje pewnej szczególnej klasy galaktyk osobli- 
galaktyki wych (galaktyk Seyferta) pozwoliły na ocenę rozmia- 
Soyferta rów obszaru, w którym wyzwalana jest energia. Zna¬ 
jąc całkowitą energię wytwarzaną przez hipotetyczny 
obiekt centralny oszacowano ilość energii wydzielanej 
w jednostce objętości. Ta ostatnia wartość była na 
tyle duża, że nie potrafiono przez długi czas podać me¬ 
chanizmu produkcji energii ani wyobrazić sobie wa¬ 
runków fizycznych panujących w źródle. Własności 
nowych obiektów nie dawały się pogodzić z aktualnym 
stanem wiedzy. W ich istnienie uwierzono ostatecznie 
dopiero wtedy, gdy radioastronomowie dokonali nie¬ 
zależnych ocen gęstości produkcji energii i gdy za¬ 
częto masowo odkrywać równie dziwne obiekty 
(-* Kwazary). Znaczenie nazwy jądro uległo zmianie. 
Większość autorów oznacza nią obecnie nowo od¬ 
kryte obiekty centralne galaktyk i w takim też zna¬ 
czeniu jest używana w niniejszym rozdziale. To, co 
dawniej nazywano jądrem, określa się dziś jako za¬ 
gęszczenie centralne. 

Na naświetlanych odpowiednio krótko zdjęciach 
centralnych części najbliższych galaktyki (il. 228, tabl. 
62) można spostrzec punktowe lub niemal punkto¬ 
we obiekty, różniące się od zwykłych gwiazd włas¬ 
nościami fotometrycznymi. Bezpośrednie ich obser- 
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wacje są niezmiernie utrudnione przez gwiazdy nale¬ 
żące do zagęszczeń centralnych. Nie udało się jeszcze 
uzyskać takich widm tych obiektów, które nie byłyby 
zafałszowane przez widmo otoczenia. Mimo to uwa¬ 
żane są one za jądra galaktyk znajdujące się w fazie 
spoczynku. Najprawdopodobniej wszystkie galaktyki 
masywne mają co najmniej jedno jądro, natomiast nie 
obserwuje się jąder w galaktykach karłowatych. 

Galaktyki, których jądra znajdują się w fazie aktyw¬ 
ności, nazywane bywają w skrócie aktywnymi. Ozna¬ 
kami aktywności galaktyki mogą być zmiany blasku, 
obecność linii emisyjnych w widmie, silne promienio¬ 
wanie ultrafioletowe lub podczerwone, intensywna 
emisja radiowa, wreszcie — wypływ materii (il. 227, 
tabl. 62, il. 231, 232, tabl. 63). Różne rodzaje aktyw¬ 
ności galaktyk mają to samo źródło — niestacjonarne 
procesy zachodzące w jądrach. Fazy aktywności naj¬ 
prawdopodobniej powtarzają się okresowe. Skala ak¬ 
tywności ma bardzo dużą rozpiętość, i to co w jednych 
galaktykach uznać należałoby za fazę aktywności — 
w innych byłoby fazą spoczynku. 

Typowym przykładem fazy spoczynku jest obecny jądro 
stan jądra Mgławicy Andromedy (M 31). Optyczne mgławicy 
własności okolic jądra nie są w żadnym stopniu ano- Andromedy 
malne. Gęstość przestrzenna gwiazd zasłaniających 
samo jądro (il. 228, tabl. 62) oceniana jest na 30 000/1. 
św. 3 — przewyższa zatem wielokrotnie gęstości gro¬ 
mad kulistych, najbardziej zwartych z dotychczas 
znanych obiektów. Wszystkie te gwiazdy należą do 
populacji II, są zatem stare. W okolicach jądra nie 
zaobserwowano gwiazd młodych, choć znajdują się 
tam pewne ilości wodoru neutralnego. Nieznane czyn¬ 
niki, prawdopodobnie szybka rotacja i silne pole mag¬ 
netyczne, zapobiegają kondensacji materii między- 
gwiazdowej i uniemożliwiają powstawanie nowych 
gwiazd. Jądro Mgławicy Andromedy można bezpo¬ 
średnio obserwować dopiero w ultrafiolecie i na falach 
radiowych. Obszar emisji radiowej jest bardziej roz¬ 
myty niż centralne źródło naszej Galaktyki, zaś emi¬ 
towane promieniowanie — znacznie słabsze. 

Jądro Układu Drogi Mlecznej znajduje się w fazie jądro 
przejściowej po okresie wzmożonej aktywności, przez Układu 
który przechodziło kilkanaście milionów lat temu. Drogi 
Jest ono utożsamiane z radioźródłem SGR A. Parę Mlecznej 
lat temu stwierdzono, że SGR A jest silnym źródłem 
promieniowania podczerwonego (emituje ok. 10 7 razy 
więcej energii niż Słońce we wszystkich długościach 
fal). Rozmiary obszaru aktywnego w podczerwieni 
wynoszą zaledwie 3-4 lata świetlne. Z analiz widma 
promieniowania podczerwonego wynika, iż źródło 
SGR A otoczone jest chmurą gwiazd o gęstości milion 
razy większej niż gęstość w okolicach Słońca. Pozo¬ 
stałością po fazie aktywności jest ramię ekspandują¬ 
ce — ogromny obłok wyrzucony z jądra o masie 10 7 
mas Słońca. Wypływ masy z jądra trwa po dziś dzień. 

Dowodem tego jest emitowane przez jądro promienio¬ 
wanie synchrotronowe, którego podtrzymywanie wy¬ 
maga nieustannego dostarczania szybkich cząstek 
naładowanych. W epoce wybuchu nasza Galaktyka 
mogłaby zapewne być sklasyfikowana jako jedna ze 
wspomnianych galaktyk Seyferta. Ich bardzo jasne 
jądra przewyższają wielokrotnie swym blaskiem po¬ 
zostałe części galaktyk. W ledwo widocznych dyskach 
można dostrzec ślady ramion spiralnych. Widmo 
optyczne jądra takiej galaktyki złożone jest z nieter- 
micznej składowej ciągłej i wielu szerokich linii emi¬ 
syjnych wzbronionych. Duże ilości energii emitowane 
są w ultrafioletowej i podczerwonej części widma. 

Wiele galaktyk Seyferta wysyła także promienio¬ 
wanie rentgenowskie i gamma (-* Astronomia pro¬ 
mieni X i y). Ich jasności optyczne zmieniają się nie¬ 
regularnie, w ciągu kilku miesięcy mogą wzrastać lub 
maleć nawet kilkakrotnie. Nie jest jeszcze wyjaśnione, 
czy zmiany owe są wynikiem redystrybucji energii do 
innych obszarów widma, czy odbiciem zmian wydaj¬ 
ności źródeł energii. Przypuszcza się, że nietermiczne 
kontinuum pochodzi z obszarów leżących najbliżej 
jądra. Nad nimi, tzn. nieco dalej od jądra, znajduje 



się prawdopodobnie ośrodek dużo rzadszy, produ¬ 
kujący zwykłe linie emisyjne. Są one poszerzone w wy¬ 
niku złożenia się przesunięć dopplerowskich wywoła¬ 
nych bardzo szybkimi ruchami obłoków gazu. Jeszcze 
wyżej, gdzie gęstość powinna być jeszcze mniejsza, 
powstają wąskie linie wzbronione. Masa całego gazu 
emitującego widmo liniowe nie jest zbyt wielka: nie 
przekracza 10* mas Słońca. Natomiast jądro, utrzy¬ 
mujące gaz siłami ciążenia mimo jego szybkich ru¬ 
chów, musi mieć masę ok. 10M0® mas Słońca; jego 
rozmiary nie przekraczają przy tym 5 lat świetlnych. 

Prócz galaktyk Seyferta istnieje wiele innych typów 
galaktyk aktywnych. Należą do nich galaktyki będące 
galaktyki N silnymi radioźródłami, galaktyki typu N, które różnią 
się od galaktyk Seyferta pewnymi cechami widmowy¬ 
mi i jeszcze większym stosunkiem jasności jądra do 
lacertydy dysku, wreszcie — odkryte kilka lat temu lacertydy, 
nazywane czasem ogniwem pośrednim między galak¬ 
tykami i kwazarami. Na zdjęciach kilku spośród ok. 
30 znanych obecnie lacertyd można dostrzec ślady 
otoczki świecącej niezwykle słabo w porównaniu 
z jądrem. Pozostałe obiekty różnią się od kwazarów 
tylko własnościami spektralnymi: w dziedzinie radio¬ 
wej wysyłają o wiele więcej promieniowania krótko¬ 
falowego, zaś ich widma optyczne są całkowicie poz¬ 
bawione charakterystycznych dla kwazarów linii emi¬ 
syjnych i absorpcyjnych. Jasność optyczna lacertyd 
zmienia się nieregularnie w dużym zakresie; w ciągu 
jednej nocy może wzrosnąć lub zmaleć nawet o kilka¬ 
dziesiąt procent. Na tej podstawie przypuszcza się, iż 
jądro lacertydy jest mniejsze niż jądro kwazara, a jego 
rozmiary nie przekraczają paru dni świetlnych. Fale 
elektromagnetyczne wysyłane przez lacertydy są silnie 
spolaryzowane, przy czym zarówno stopień jak i 
i płaszczyzna polaryzacji zmieniają się w czasie. Włas¬ 
ności widmowe jąder lacertyd są nadal nieznane 
(brak linii); natomiast uzyskane niedawno widma 
otoczek okazały się niemal takie same jak widma ga¬ 
laktyk. Fakt ten oraz cechy morfologiczne otoczek 
przesądziły o uznaniu lacertyd za olbrzymie galaktyki 
eliptyczne z aktywnymi jądrami. Galaktykami spiral¬ 
nymi o aktywnych jądrach są natomiast obiekty kla¬ 
syfikowane jako galaktyki Seyferta, galaktyki N 
oraz — prawdopodobnie — kwazary. 
jądra w fazie Całkowitą ilość energii wyzwolonej w jądrach w fa- 
aktywności zach aktywności ocenia się na 10* 9 -10 53 J. Jest to 
energia, jakiej mogłaby dostarczyć anihilacja kilkuset 
tysięcy Słońc. W fazie aktywności jądro musi więc 
utracić znaczną część masy. Prowadzi to zapewne do 
zaniku aktywności. 

Wyjątkowo gwałtowne procesy zdają się prowadzić 
do rozpadu jąder: znane są galaktyki o jądrach pod- 
dwójnych. Inne (wśród nich najokazalsza w gromadzie 
Virgo M 87 — il. 227, tabl. 62) ukazują obserwatorom 
wybiegające z centrów słupy materii, w których tkwią 
bardzo podobne do jąder zagęszczenia. Dobrym przy¬ 
kładem aktywności polegającej na rozpadzie jąder są 
radio- radiogalaktyki klasyczne. Mają one po kilka zwartych 
galaktyki centrów emisji radiowej leżących na jednej prostej. 

Należy do nich m.in. galaktyka NGC 5128 (Centaurus 
A; il. 232, tablica 63). Moc promieniowania radioga- 
łaktyk jest dziesiątki i setki milionów razy większa niż 
moc promieniowania Słońca we wszystkich zakresach. 
Centra emisji radiowej, ułożone na jednej prostej, mo¬ 
gą oddalać się od galaktyki macierzystej na odległości 
wielokrotnie przekraczające jej rozmiary, zawsze 
jednak jedno z centrów pokrywa się ze środkiem ga¬ 
laktyki. Jest ono prawdopodobnie jądrem pierwotnym, 
które w fazie aktywności wyrzuciło szereg jąder wtór¬ 
nych, obserwowanych dziś jako pozostałe centra ra¬ 
diowe. Przy znikomo małych rozmiarach jąder cał¬ 
kowitą tajemnicą pozostaje nadal mechanizm wyzwa¬ 
lania energii. 

Zgodnie z hipotezami roboczymi jądra galaktyk 
mogą być czarnymi dziurami, supermasywnymi dys¬ 
kami bądź supermasywnymi gwiazdami mającymi sil¬ 
ne pola magnetyczne (-*■ Czarne dziury i zapadanie 
grawitacyjne). 


Współczesne poglądy na temat 
ewolucji galaktyk 

Wszystkie galaktyki zawierają gwiazdy populacji 
II powstałe bardzo dawno. Nie zaobserwowano żad¬ 
nego obiektu, który można by uznać za galaktykę 
powstającą. Oznacza to, iż epoka formowania się ga¬ 
laktyk już się skończyła i że wszystkie galaktyki mają 
mniej więcej ten sam wiek. Miejsce zajmowane przez 
galaktykę na ciągu Hubble’a zależy tylko od warun¬ 
ków panujących w czasie i miejscu jej powstania, a nie 
od czasu, jaki upłynął od chwili powstania. Jej typ 
morfologiczny zostaje określony przez warunki po¬ 
czątkowe i pozostaje niezmieniony w trakcie ewolucji. 

Galaktyki powstały najprawdopodobniej wskutek 
istnienia niestabilności w jednorodnym pierwotnie 
ośrodku kosmicznym. Innej możliwości zapropono¬ 
wać obecnie nie można, chociaż żadna z licznych teorii 
kosmologicznych nie potrafiła dotychczas podać me- \ 
chanizmu powstawania takich niejednorodności 
ośrodka, których masy byłyby równe masom galak¬ 
tyk. Najmniejsze niejednorodności otrzymywane w 
różnych modelach Wszechświata mają masy bogatych 
gromad galaktyk. Problem powstawania niejednorod¬ 
ności o odpowiednich masach (tzw. protogalaktyk) protogalak- 
jest nadal otwarty. Pomijając tę zasadniczą trudność tyks 
dalszy ciąg ewolucji można opisać dość logicznie, 
choć na razie tylko jakościowo. Protogalaktyka jest 
opisana takimi parametrami i funkcjami jak: masa, 
rozkłady momentu pędu, gęstości i temperatury, pole 
magnetyczne oraz turbulencja (czyli mikroskopowe 
ruchy wirowe, powstające samorzutnie na pewnym 
etapie ewolucji ośrodka kosmicznego). Niestabilności 
turbulentne zabezpieczają protogalaktyki przed nie¬ 
ograniczonym zapadaniem się grawitacyjnym, mogą¬ 
cym doprowadzić do powstania czarnej dziury i dają 
początek wszechobecnemu w galaktykach ruchowi 
obrotowemu. Im większa jest masa protogalaktyki, 
tym szybsza jest kontrakcja i tym łatwiej dochodzi do 
rozpadu protogalaktyki na mniejsze obiekty, dające 
być może początek galaktykom satelitarnym i groma¬ 
dom kulistym. Pole magnetyczne utrudnia rozpad 
protogalaktyki, zaś wysoka temperatura i duża tur¬ 
bulencja spowalniają kontrakcję Wyzwalająca się 
podczas kontrakcji energia grawitacyjna jest prze¬ 
kształcana w energię termiczną i promienistą. Część 
jej zostaje zużyta na dysocjację cząstek i jonizację 
atomów. Jednocześnie trwa proces separacji materii 
obdarzonej różnymi wartościami momentu pędu. 

W centralnych częściach protogalaktyki, które zapa¬ 
dają się najszybciej, grupuje się materia o małej 
energii i niewielkim momencie pędu. Materia o du¬ 
żych wartościach momentu pędu (o ile w ogóle znaj¬ 
duje się w protogalaktyce) tworzy dysk otaczający 
kuliste centrum. W całej masie protogalaktyki lokalne 
niestabilności grawitacyjne prowadzą do powstania 
gwiazd o bardzo dużych masach i bardzo krótkim 
czasie życia. Promieniowanie ich jest dodatkowym 
czynnikiem hamującym kontrakcję i źródłem wtór¬ 
nych niestabilności, które zapoczątkowują powstawa¬ 
nie nowych gwiazd, o znacznie mniejszych masach. 

Są to najstarsze z obecnie obserwowanych gwiazd II 
populacji. 

Okres kontrakcji protogalaktyki i formowania się wiek 
gwiazd II populacji jest bardzo krótki w porównaniu galaktyk 
z resztą życia galaktyki i wynosi zaledwie 100 min lat. 

Po tym okresie typ morfologiczny galaktyki jest już 
ustalony. Wiek galaktyk ocenia się na 10-15 miliar¬ 
dów lat. 

Dobierając różne zestawy parametrów początko¬ 
wych można otrzymać modele galaktyk różniące się 
kształtem, zawartością materii międzygwiazdowej 
i składem populacyjnym, czyli odtworzyć wszystkie 
obserwowane typy morfologiczne. Przedstawiony 
obraz ewolucji ma jednak zasadniczą wadę: nie znaj¬ 
dują w nim miejsca jądra galaktyk. Okresy aktyw¬ 
ności jąder i wytwarzana w nich energia nie mogą nie 
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zaważyć na przebiegu ewolucji. Dlatego też wszystko, 
co się obecnie na temat ewolucji galaktyk mówi, na¬ 
leży traktować jako pierwsze przybliżenie, z pewnością 
dalekie jeszcze od rzeczywistości. 

T.A. Agiekjan Zwiezdy, Galaktiki, Metagalaktika, Moskwa 
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Gwiazdy zmienne pulsujące 

Kazimierz Stępień 


Prowadząc systematyczne obserwacje gwiazd astro¬ 
nomowie zauważyli, że jasność wielu z nich zmienia 
się w sposób regularny. W początkach XIX w. znano 
już kilkanaście takich gwiazd i sądzono, że są to 
układy dwóch gwiazd krążących wokół siebie, i okre¬ 
sowo zasłaniających jedna drugą. Nazwano je gwiaz¬ 
dami podwójnymi zaćmieniowymi. W drugiej połowie 
XIX w. podjęto nowy typ obserwacji — fotograficzne 
badania widm gwiazdowych. Okazało się wówczas, 
że linie widmowe niemal wszystkich badanych gwiazd 
zmiennych ulegają okresowym przesunięciom wywo- 
. . łanym efektem Dopplera, potwierdzając hipotezę 

ODserwacje zaćmieniowości. Obserwacje jednej gwiazdy — ó 
Cepne. Cephei — wykazywały wprawdzie również okresowy 
efekt Dopplera, ale nie były zgodne z modelem 
gwiazdy podwójnej. W początkach XX w., gdy umia¬ 
no już określać rozmiary gwiazd, okazało się z obli¬ 
czeń, że hipotetyczna orbita S Cephei musiałaby być 
10 razy mniejsza od jej promienia. Ta sprzeczność 
ostatecznie obaliła hipotezę o podwójności <5 Cephei. 
A więc przesunięcie linii widmowych oznaczało okre¬ 
sowe rozszerzanie się i kurczenie gwiazdy. W ten spo¬ 
sób odkryto nową klasę gwiazd zmiennych — gwiazdy 
pulsujące. Określimy je jako gwiazdy, które zmieniają 
swoją jasność oraz inne parametry fizyczne w sposób 
regularny, spowodowany zmianami swoich rozmiarów 
lub kształtu. W późniejszych łatach okazało się, że 
istnieje wiele typów gwiazd pulsujących zasadniczo 
różniących się od siebie. Nazwę cefeidy z dodatkiem 


Dane obserwacyjne 

Informacje zawarte w tym paragrafie pochodzą 
z obserwacji fotometrycznych i widmowych. Obserwa¬ 
cje fotometryczne polegają na pomiarach w różnych 
barwach strumienia promieniowania docierającego do 
nas od gwiazdy i jego zmian czasowych (krzywa 
zmian jasności). Światło gwiazdy można również 
rozszczepić za pomocą pryzmatu lub siatki dyfrakcyj¬ 
nej i zarejestrować np. na kliszy fotograficznej. Otrzy¬ 
mując wiele takich widm dla gwiazdy pulsującej wy¬ 
znaczymy skład chemiczny, temperaturę i krzywą 
zmian prędkości radialnej. Przy wykorzystaniu mo¬ 
deli gwiazd oba rodzaje obserwacji umożliwiają wy¬ 
znaczenie promieni, mas i jasności absolutnych (cał¬ 
kowitej ilości energii wy promieniowanej przez gwiaz¬ 
dę w ciągu sekundy). 

Omówimy teraz poszczególne typy gwiazd pulsu¬ 
jących. Ich średnie parametry fizyczne podaje pierw¬ 
sza tabela. Jasność absolutna, masa i promień podane 
są w stosunku do jasności, masy i promienia Słońca, 
traktowanych jako jednostki. W drugiej tabeli podane 
są typowe amplitudy zmian parametrów fizycznych 
gwiazd pulsujących. 

Cefeidy klasyczne. Należą do najjaśniejszych gwiazd cefeidy 
nieba. Są nadolbrzymami I populacji (-► Galaktyki), klasyczne 
a więc zawartość pierwiastków ciężkicn w ich atmo¬ 
sferach sięga paru procent. Amplituda zmian blasku 
wynosi najczęściej czyli gwiazda jest w maksi- 


Średnie parametry fizyczne gwiazd pulsujących radialnie 


Wielkość 

Cefeidy klasyczne 

Cefeidy typu W 
Wirginis 

RR Lyrae 

Cefeidy karłowate 

Gwiazdy typu 

Okres (dób) 

Jasność absolutna (L/L@) 

Masa (Af/Af(^) 

Promień (RIR^) 

Temperatura (K) 

1-50 

380-31000 

3,7-14 

14-200 

6900-5400 

1-50 

100-8000 
0,5-1,0 
14-200 

6500 

0,25-1 

40 

0,5-0,7 

4-10 

7400-6400 

0,06-0,2 

2-6 

7 

2-4 

7500^ 

0,06-0,2 

2-6 

1,5-2,5 

2-4 

7500 


Ty powe amplitudy zmian parametrów fizycznych gwiazd pulsujących radialnie 


Amplituda 

Cefeidy klasyczne 

Cefeidy typu W 
Wirginis 

RR Lyrae 

Cefeidy karłowate 

Gwiazdy typu 

S Scuti 

Jasności (wielkość gwiazdowa) 

1-1,5 

1-1,5 

0,5-1,8 

0,2-1,0 

0,05-0,10 

Prędkości radialnej (km/s) 

40 

60 

20-60 

20-40 

10-20 

Temperatury (K) 

1000 

1000 

500-1500 

500 

< 500 

Promienia (%) 

10-15 

20 

5-15 

5 

<5 


klasyczne zachowano dla gwiazd pulsujących podob¬ 
nych do S Cephei. Ponadto wprowadzono nazwy: 
cefeidy typu W Wirginis, gwiazdy typu RR Lyrae, 
cefeidy karłowate i gwiazdy typu S Scuti. Wszystkie te 
gwiazdy leżą w tzw, klasycznym pasie niestabilności 
(o czym powiemy dalej), pulsują radialnie i one będą 
głównym tematem niniejszego artykułu. Oprócz nich 
znamy jeszcze gwiazdy typu fi Cephei, których pul- 
sacje polegają na zmianie kształtu (pulsacje niera- 
dialne), a ich mechanizm jest zupełnie inny niż 
u klasycznych gwiazd pulsujących. Wspomnimy jesz¬ 
cze krótko o gwiazdach typu R V Tauri i typu Mira 
Ceti, które też zmieniają swoje rozmiary, ale zmiany 
ich nie są regularne i powodowane mało znanym me¬ 
chanizmem. 
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mum 3-4 razy jaśniejsza niż w minimum, chociaż 
istnieją też cefeidy o amplitudzie zaledwie kilku set¬ 
nych wielkości gwiazdowej (np. Gwiazda Polarna). 
Druga tabela podaje również amplitudy zmian in¬ 
nych parametrów fizycznych, a rys. 1 przedstawia te 
zmiany w formie graficznej. 

W 1912 r. amer. astronom H. S. Leavitt odkryła 
ważną zależność między okresem zmian blasku 
i jasności absolutnej cefeid. Zależność ta w swej współ¬ 
czesnej postaci jest przedstawiona na rys. 2. Jeżeli więc 
kiedykolwiek zaobserwujemy cefeidę i wyznaczymy 
dla niej okres (co można zrobić bez trudu z dużą do¬ 
kładnością), to z tej zależności możemy od razu od¬ 
czytać, jaką ma ona absolutną wielkość gwiazdową M. 
Z drugiej strony, łatwo możemy wyznaczyć widomą 




























wielkość gwiazdową m. Obie te wielkości powiązane 
są ze sobą prostą zależnością: 

m = M+5 Ig r—5+A(r). 

We wzorze tym r jest odległością do gwiazdy, a A 
jest wartością ekstynkcji międzygwiazdowej. Ekstynk¬ 
cja ta wywołana jest przez materię międzygwiazdową, 
która pochłania „po drodze” część światła wysyła¬ 
nego przez gwiazdę. Wielkość A wyznacza się indy¬ 
widualnie dla każdej gwiazdy. Dla cefeid istnieje 
prosta i dokładna metoda wyznaczania A z pomiarów 
jasności gwiazdy w określonych obszarach widmo¬ 
wych wycinanych za pomocą filtrów barwnych. W ten 
sposób znając w, M i A możemy wyznaczyć odległość 
do badanej cefeidy. Ponieważ, jak wspominaliśmy, 
cefeidy należą do najjaśniejszych gwiazd nieba, wi¬ 
doczne są z olbrzymich odległości. Wiele z nich obser¬ 
wujemy w sąsiednich galaktykach i dzięki zależności 
okres-jasność można było wyznaczyć ich odległości. 


Wszechświata. Zatem związek między jasnością i okre¬ 
sem cefeid jest podstawą wyznaczania skali odległości 
we Wszechświecie. W ciągu ostatnich kilkudziesięciu 
lat związek ten był wielokrotnie rewidowany i po¬ 
prawiany w miarę napływu coraz dokładniejszych 
obserwacji, a wraz z nim odpowiednio „kurczyła się” 
i „rozszerzała” znana nam część Wszechświata. 

Cefeidy typu W Wirginis. Przez długi czas cefeidy cefeidy 
tego typu rozpatrywano łącznie z cefeidami klasycz- typu ^ 
nymi. Spowodowane to było faktem, że obserwacyj- W Wirginis 
nie wyglądają one bardzo podobnie. Okresy i ampli¬ 
tudy zmian blasku są takie same, a kształt krzywych 
blasku zbliżony, co przy fotograficznych metodach 
wykrywania cefeid uniemożliwiało rozróżnienie oby¬ 
dwu typów zmiennych. Łączne ich traktowanie spo¬ 
wodowało olbrzymi rozrzut na diagramie okres-jas¬ 
ność i wydawało się, że tak niedokładna zależność 
będzie bezużyteczna. Dopiero dokładniejsze obser¬ 
wacje widmowe wykazały, że między cefeidami kla¬ 
sycznymi i cefeidami typu W Wirginis istnieją duże 


Am 



Rvs. I. Zmiany jasności Am (w wielkościach gwiazdowych). temperatury T (w kelwinach) i prędkości radialnej V r (w km/s) oraz obliczcmc 
na ich podstawie zmiany promienia R gwiazdy S Cephei. Punkty odpowiadają obserwacjom w różnych fazach okresu pulsacji.Faza po¬ 
dana jest w ułamkach okresu 



-0,5 0 0,5 1,0 1,5 Ig P 

0, d 3 l d 3 d 10 d doby 30 d P 


Rys. 2. Zależność między logarytmem okresu P i absolutną wiel¬ 
kością gwiazdową M dla cefeid i gwiazd typu RR Lyrae. Zakre- 
skowane są obszary, w których układają się punkty obserwacyjne 

Obserwacje tych najbliższych galaktyk pozwoliły na¬ 
stępnie znaleźć zależności między prędkością ucieczki 
galaktyki mierzonej z przesunięcia prążków w widmie 
gwiazdy ku czerwieni, a odległością do niej. Jest 
prawo to tzw. prawo Hubble’a. Prawo Hubble’a stosuje 
Hubb!e'a się do wyznaczania odległości dalszych obiektów 


różnice. Krzywe prędkości radialnych tych ostatnich 
wyglądają zupełnie inaczej, gdyż mają nieciągłość 
spowodowaną okresowym rozszczepianiem się nie¬ 
których linii widmowych na dwa składniki o różnych 
prędkościach. Analiza widmowa oraz analiza rozkła¬ 
du tych gwiazd w Galaktyce wykazały, że należą one 
do II populacji i są bardzo ubogie w pierwiastki cięż¬ 
kie, gdyż ich zawartość w atmosferach gwiazd typu 
W Wirginis jest rzędu 0,1%. Po rozróżnieniu obu 
typów na diagramie okres-jasność okazało się, że \ 

dają one dwie zależności odległe o ok. 1?*4 i że we¬ 
wnątrz każdej zależności rozrzut jest już niewielki 
(rys. 2). 

Gwiazdy typu RR Lyrae. Są to podolbrzymy II gwiazdy 
populacji. Mają znacznie krótsze okresy od cefeid typu 
i rozróżniamy wśród nich dwa podstawowe typy RR Lyrao 
określane symbolami ab i c. Symbol ab pochodzi stąd, 
że pierwotnie rozróżniano trzy typy: a y b i c, lecz póź¬ 
niej okazało się, że gwiazdy typów a i b nie różnią się 
między sobą fizycznie. Zmienne typu c mają okresy 
zawarte pomiędzy 0?25 i 0?4 i niemal sinusoidalne 
krzywe blasku o amplitudzie około 07*5 (rys. 3). 

Zmienne typu ab mają okresy między 0?3 i 1?0 i asy¬ 
metryczne krzywe blasku o amplitudach od 0?7 do 
1?8 (rys. 4). 

Niektóre z gwiazd typu ab wykazują długookresowe 
zmiany kształtu krzywej blasku, a nawet okresu pod¬ 
stawowego (tj. okresu pulsacji). Przykładowo, gwiaz¬ 
da RR Lyrae — prototyp omawianej grupy zmien¬ 
nych — ma podstawowy okres zmian nieco ponad pół 
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Rys. 3. Krzywa zmian jasności i prędkości radialnej T Sextansis, 
gwiazdy typu RRc 


A m 



Rys. 4. Krzywa zmian jasności i prędkości radialnej SU Draconis 
gwiazdy typu RRab 


doby, lecz długość tego okresu oraz kształt i amplitu¬ 
da krzywych blasku i prędkości radialnej zmieniają 
się z okresem około 41<*. Przyczyny tych długookreso¬ 
wych zmian, określanych mianem efektu Błażko, są 
dotychczas zupełnie nieznane. 

cofeidy Cefeidy karłowate albo gwiazdy typu Al Velorum. 
karłowate Zmienne te mają jeszcze krótsze okresy niż gwiazdy 
typu RR Lyrae. Są gwiazdami populacji pośredniej. 
Wykazują silny efekt Błażko. Niestety, znamy sto¬ 
sunkowo niewiele gwiazd należących niewątpliwie do 
tego typu i dlatego nasza wiedza o parametrach fizycz¬ 
nych tych gwiazd jest dość fragmentaryczna. Najbar¬ 
dziej niepewne są wartości ich mas, gdyż zależą one 
od modeli teoretycznych i przyjętej fazy ewolucyjnej. 
Wielu astronomów uważa, że cefeidy karłowate są 
fizycznie identyczne z gwiazdami typu 3 Scuti i podział 
na typy jest sztuczny. Inni jednak uważają, że są one 
w różnych fazach ewolucyjnych i mają różne masy. 

946 


Gdyby tak było, masy cefeid karłowatych wynosiłyby 
zaledwie około 0,2M®. 

Gwiazdy typu S Scuti. Charakterystyki obserwa- gwiazdy 
cyjne tych gwiazd są bardzo podobne do cefeid karło- typu 
watych — różni je tylko amplituda zmian blasku, S Scuti 
która jest rzędu kilku procent, choć zdarzają się wy¬ 
jątki. Gwiazd typu 3 Scuti znamy niewiele i dlatego 
dane o nich są dość niepewne. Co do ich mas panuje 
jednak raczej zgodna opinia, że wynoszą one 1,5- 
2,5 A 'f @. 

Gwiazdy typu fi Cephei albo fi Canis Majoris. 

Wszystkie omówione dotychczas typy gwiazd pulsu¬ 
jących tworzą jakby jedną wspólną klasę ze względu 
na identyczny mechanizm pulsacji, natomiast gwiazdy 
typu fi Cephei należy rozpatrywać oddzielnie. Wiemy, 
że zachodzą w nich pulsacje nieradialne (polegające 
nie na kurczeniu się i rozszerzaniu, lecz na okresowym 
odkształcaniu się gwiazd). Niestety wszelkie próby 
wskazania mechanizmu, który mógłby takie pulsacje 
podtrzymywać kończyły się dotychczas niepowo¬ 
dzeniem. Wiemy jednak na pewno, że nie może to 
być ten sam mechanizm, co we wcześniej omawianych 
gwiazdach. 

Gwiazdy typu fi Cephei mają okresy rzędu kilku gwiazdy 
godzin (od O?15-0?25) i amplitudy zmian blasku rzę- typu 
du kilku procent. Krzywe blasku zmieniają się fi Cophei 
w dłuższej skali czasowej, a zmiany te można interpre¬ 
tować jako nałożenie się dwu bliskich okresowości 
(np. w przypadku fi Canis Majoris— o okresach 
6 h 00™ i 6 h 02 m ). Są one raczej gorące, gdyż ich tempe¬ 
ratury sięgają 25 000 K, i jasne —parę tysięcy jaś¬ 
niejsze od Słońca. Należą do I populacji i mają masy 
kilkanaście razy większe od Słońca. Absolutna wiel¬ 
kość gwiazdowa gwiazdy typu fi Cephei rośnie przy 
dłuższych okresach, podobnie jak w przypadku cefeid. 

Gwiazdy typu RV Tauri i Mira Ceti. Jasności gwiazdy 
gwiazd należących do tych typów nie zmieniają się re- typu 
gularnie i dlatego nie są objęte zakresem tematycznym RV Tauri 
artykułu. Ponieważ jednak zmienność ich wiąże się i Mira Ceti 
zapewne ze zmianami promienia, przedstawimy krót¬ 
ko ich charakterystyki obserwacyjne. Są to chłodne 
olbrzymy i nadolbrzymy o temperaturach 2000-4000 K 
należące do populacji pośredniej, lub nawet II 
o kwaziokresach rzędu 100 dni (RV Tauri), czy rzędu 
roku lub więcej (Mira Ceti), dużej amplitudzie zmian 
blasku i masach prawdopodobnie ok. 1,5-2M®. 


Teoria pulsacji 

Postaramy się wyjaśnić dlaczego niektóre gwiazdy 
zmieniają okresowo swoje rozmiary, a wraz z nimi 
inne parametry fizyczne. Rozpatrzmy w tym celu 
zewnętrzne warstwy typowej gwiazdy. Na powierzchni 
jej panuje temperatura kilku tysięcy stopni. W tej 
temperaturze praktycznie cały wodór i hel są niezjo- 
nizowane. Natomiast w coraz głębszych warstwach 
temperatura gazu jest coraz większa. Wraz z tempera¬ 
turą rośnie stopień jonizacji gazu, aż w temperaturze 
ok. trzydziestu tysięcy stopni cały wodór i hel jest 
zjonizowany. Przeszliśmy więc przez warstwę częścio¬ 
wej jonizacji wodoru i pierwszej jonizacji helu. Prze¬ 
suwając się dalej w głąb gwiazdy natrafiamy na jeszcze 
wyższe temperatury, aż w okolicy 50 000 K, przecho¬ 
dzimy przez warstwę drugiej jonizacji helu. Oczywiście 
przy przesuwaniu się w głąb rośnie również, i to szyb¬ 
ko, gęstość. Wskutek tego w warstwie drugiej joni¬ 
zacji helu znajduje się znacznie więcej materii niż 
w rzadkiej warstwie jonizacji wodoru i pierwszej helu. 
W jeszcze głębszych warstwach cały wodór i hel są 
całkowicie pozbawione elektronów. 

Temperatura każdej kolejnej warstwy określona 
jest przez równowagę między energią pochłoniętą od 
dołu i wysłaną do góry. Odbywa się to tak: we wnętrzu 
gwiazdy produkowana jest w reakcjach jądrowych 
energia w postaci wysokoenergetycznych kwantów 
promieniowania elektromagnetycznego. Warstwa le¬ 
żąca bezpośrednio nad jądrem jest nieprzezroczysta 






przemiana 
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miczna gazu 
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przemiana 
termodyna¬ 
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dla tego promieniowania i pochłania je. Aby nie 
ogrzewać się w nieskończoność, musi dokładnie tyle 
samo energii wypromieniować ile pochłonęła. Pro¬ 
mieniuje zaś zgodnie z prawem promieniowania dla 
ciała doskonale czarnego, przyjmując taką temperatu¬ 
rę, jaka zapewnia jej równowagę cieplną. Następna 
warstwa jest też nieprzezroczysta i pochłania pro¬ 
mieniowanie warstwy spodniej emitując je w nieco in¬ 
nym zakresie widmowym (gdyż jej temperatura jest 
nieco niższa niż warstwy leżącej pod nią). Proces po¬ 
chłaniania i reemisji zachodzi w ten sposób w kolej¬ 
nych warstwach gwiazdy mających coraz to niższą 
temperaturę, aż wreszcie ostatnia warstwa wysyła 
promieniowanie w przestrzeń. 

Zastanówmy się, co będzie, jeśli część gazu gwiaz¬ 
dowego znajdującego się w różnych miejscach gwiazdy 
poddamy przemianie termodynamicznej polegającej 
na ściśnięciu i następnie rozprężeniu. Gorący i zjoni- 
zowany gaz leżący głęboko można traktować jak gaz 
niemal doskonały, tak że ściśnięcie i rozprężenie go 
jest przemianą adiabatyczną. Przy takiej przemianie 
nie tracimy ani nie zyskujemy energii mechanicznej. 
Zachowanie się gazu z warstw zewnętrznych jest inne. 
Z dokładnych badań wynika, że nieprzeźroczystość 
maleje ze wzrostem temperatury, a ponieważ ściśnię¬ 
cie gazu spowoduje jego ogrzanie, tym samym będzie 
on pochłaniał mniej energii niż poprzednio, nato¬ 
miast emitować będzie więcej. Stan taki nie może 
trwać długo — gaz ęmitując ochłodzi się, ale do tem¬ 
peratury wyższej niż miał przed ściśnięciem, i przejdzie 
w nowy stan równowagi cieplnej, w którym tyle emi¬ 
tuje, co pochłania. Jeżeli teraz pozwolimy mu się roz¬ 
prężyć, odda nam mniej energii niż włożyliśmy w jego 
sprężenie. Przy wielokrotnym ściskaniu i rozprężaniu 
gaz będzie pochłaniał energię mechaniczną zamienia¬ 
jąc ją na ciepło. 

Rozpatrzmy podobnie gaz znajdujący się w war¬ 
stwie częściowej jonizacij. Gdy ściśrJemy go adabia- 
tycznie, temperatura wzrośnie o wiele mniej niż w po¬ 
przednim przykładzie. Energia, którą włożyliśmy ści¬ 
skając gaz, zostanie w znacznej części zamieniona na 
energię jonizacji wielu dodatkowych atomów, a tylko 
niewielka jej część wywoła wzrost temperatury. Na¬ 
wet gdyby nieprzezroczystość tej warstwy malała wraz 
z temperaturą w tym samym stopniu co dla gazu zjc- 
nizowanego, to przebieg przemiany termodynamicz¬ 
nej byłby inny. Tymczasem zależność ta jest odwrot¬ 
na— im gaz częściowo zjonizowany jest gorętszy, 
tym silniej pochłania promieniowanie. Ściśnięty gaz 
będzie pochłaniał coraz więcej promieniowania, bę¬ 
dzie ogrzewał się (równocześnie będzie rósł stopień jo¬ 
nizacji), co wywoła jeszcze silniejsze pochłanianie itd. 
W efekcie energia dostarczana od dołu będzie groma¬ 
dzona w warstwie częściowej jonizacji. Proces taki nie 
może przebiegać nieskończenie długo — ograniczą go 
różne zjawiska dodatkowe (tzw. efekty nieliniowe), 
np. fakt, że w pewnym momencie gaz zjonizuje się 
całkowicie. Gdy pozwolimy, by ściśnięty gaz rozprężył 
się i wykonał pracę, jego temperatura w trakcie roz¬ 
prężania będzie niemal stała, a więc i ciśnienie będzie 
znacznie większe niż w przypadku gazu spoza strefy 
częściowej jonizacji. Dzięki temu otrzymamy więcej 
pracy mechanicznej niż jej włożyliśmy. Nadwyżka 
powstanie wskutek przemiany: energia promienista — 
energia jonizacji — energia wewnętrzna — energia 
mechaniczna. Wystarczy więc, by warstwę częściowej 
jonizacji ścisnąć dowolnie mało, a rozpręży się znacz¬ 
nie silniej. W gwieździe, jak w każdym układzie fizycz¬ 
nym, wszystkie wielkości fizyczne ulegają stale drob¬ 
nym wahaniom, czyli tzw. fluktuacjom — nietrudno 
zatem o powstanie „pierwszego pchnięcia”. Rozprę¬ 
żająca się warstwa częściowej jonizacji ciśnie na 
warstwy leżące pod nią i unosi w górę warstwy 
wierzchnie (też zresztą je ściskając). Obydwie te war¬ 
stwy pochłaniają część przekazanej im energii, a jed¬ 
nocześnie rozprężając się cisną ponownie na warstwę 
częściowej jonizacji, która oddaje im energię mecha¬ 
niczną z nadwyżką powiększając amplitudę wahań. 


W ten sposób będą stopniowo narastać pulsacje. 

Oczywiście ich amplituda nie będzie wzrastać nieskoń¬ 
czenie. Wystąpią różne efekty nieliniowe i w końcu 
ustali się taka amplituda pulsacji warstw zewnętrznych 
gwiazdy, przy której energia generowana w warstwie 
częściowej jonizacji będzie dokładnie równa energii 
pochłanianej w innych warstwach biorących udział 
w ruchu. 

W pulsacjach radialnych biorą udział tylko war- warstwy 
stwy zewnętrzne (rys. 5). Amplituda drgań szybko pulsujące 
maleje przy przechodzeniu do głębszych warstw, tak 
że wnętrze gwiazdy nie bierze w ogóle udziału w ru¬ 
chu. We wnętrzu jest skupiona niemal cała masa 
gwiazdy, a w warstwach biorących udział w ruchu 
znajduje się zaledwie 0,1% masy całej gwiazdy, mimo 
iż rozciągają się one do połowy promienia gwiazdy. 



strefa jonizacji wodoru 

drugiej jonizacji helu 

strefa pochłaniania 
energii mechanicznej 

strefa adiabatyczna 

me jądro 

trefa reakcji jądrowych 


Rys. 5. Rozmieszczenie warstw biorących udział w pulsacjach 
gwiazdy pulsującej 


Narzuca się pytanie, dlaczego nie pulsują wszystkie warunki 
gwiazdy? Przecież wszystkie mają warstwy częściowej pulsowania 
drugiej jonizacji helu, a większość (takie, które nie gwiazd 
są zbyt gorące na powierzchni) warstwę częściowej 
jonizacji wodoru i pierwszej helu. Jeżeli warstwy te są 
niestabilne pulsacyjnie, to powinny pobudzić do pul¬ 
sacji każdą gwiazdę. Odpowiedź na to pytanie dają 
dokładne obliczenia modeli gwiazd pulsujących. Wy¬ 
nika z nich, że decydująca dla niestabilności pulsacyj¬ 
nej gwiazdy jest głębokość, na jakiej występuje war¬ 
stwa drugiej jonizacji helu. W gwiazdach gorących 
leży ona płytko pod powierzchnią i obejmuje niewielką 
ilość masy, dlatego jej pojemność cieplna (określona 
przede wszystkim energią jonizacyjną wszystkich ato¬ 
mów tej warstwy) jest zbyt mała, by móc wytworzyć 
dostateczną ilość energii mechanicznej zdolnej do 
„rozhuśtania” sporej części gwiazdy i zrównoważenia 
strat energii. Im gwiazda jest chłodniejsza, tym głębiej 
znajduje się jej warstwa jonizacyjna i zdolność gwiazdy 
do wytwarzania energii mechanicznej szybko rośnie. 

Przy pewnej temperaturze energia ta wystarcza do 
wywołania pulsacji gwiazdy. Przy jeszcze niższej tem¬ 
peraturze gwiazdy warstwa jonizacyjna znajduje się 
jeszcze głębiej, ale ilość energii mechanicznej genero¬ 
wanej przez nią rośnie znacznie wolniej, natomiast 
straty energii stają się wyraźnie większe. Warstwa jo¬ 
nizacyjna znów nie jest w stanie wywołać pulsacji 
gwiazdy. A więc pulsują tylko te gwiazdy, w których 
warstwa częściowej jonizacji helu znajduje się w ściśle 
określonym zakresie głębokości, czyli tylko w ściśle 
określonym zakresie temperatur gwiazd. Zakres ten 
różni się nieco dla różnych wartości jasności absolut¬ 
nych, co daje na tzw. diagramie Hertzsprunga-Rus- 
sella, na którego osiach mamy jasność i temperatury 
gwiazd, skośnie nachylony pas niestabilności (rys. 6). pas nie- 
Gdy w czasie ewolucji gwiazda osiągnie wartość tem- stabilności 
peratury i jasności z pasa niestabilności, zacznie pul¬ 
sować. Wychodząc z tego pasa stanie się znów gwiaz¬ 
dą o stałym blasku. Należy dodać, że warstwa częścio¬ 
wej jonizacji wodoru i pierwszej helu znajduje się 
zawsze bardzo płytko, o ile w ogóle istnieje, i dlatego 
jej rola w podtrzymywaniu pulsacji jest niewielka. 

Być może w niektórych typach gwiazd (typu R KTauri, 
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Rys. 6. Diagram Hertzsprunga-RusscUa z zaznaczonymi grani¬ 
cami pasa niestabilności oraz położeniem głównych typów gwiazd 
pulsujących 


czy Mira Ceti) warstwa ta ma decydujące znaczenie 
dla ich zmienności, ale przypuszczenie to nie jest do¬ 
tychczas poparte odpowiednimi obliczeniami modelo¬ 
wymi. 

okres Zastanówmy się jeszcze, od czego zależy okres pul- 
pulsacji sacji. Wiemy, że dla struny drgającej okres zależy od 
jej długości i siły naciągu. Analogami tych wielkości 
fizycznych dla gwiazdy jest jej promień R i siła graw- 
tacji wywołana jej masą M. Z obliczeń wynika, że 
okres zależy od stosunku M}K* y który z dokładnością 
do stałej jest równy średniej gęstości gwiazdy 
Mamy więc: 

p~Vq*> , 

gdzie P jest okresem pulsacji. Wyznaczając go w 
dniach i odnosząc średnią gęstość gwiazdy do średniej 
gęstości Słońca dostajemy: 

p = QVq®Jq*- 

stafa Stała proporcjonalności Q wyrażona jest w dniach 
pulsacyjna i nazwana stałą pulsacyjną. Zależy ona do wewnętrz¬ 
nej struktury gwiazdy, ale zmienia się niewiele od 
gwiazdy do gwiazdy. 

Patrząc na ten wzór łatwo zrozumiemy, dlaczego 
cefeidy — silnie rozdęte nadolbrzymy o małej gęstości 
średniej — mają tak długie okresy pulsacji, a np. 
gwiazdy typu 3 Scuti o rozmiarach kilkadziesiąt razy 
mniejszych, a więc i odpowiednio większej gęstości 
średniej, mają okresy zaledwie rzędu kilku godzin. 
Gdybyśmy do ostatniego wzoru wprowadzili średnią 
gęstość białego karła — gwiazdy o masie porówny¬ 
walnej ze Słońcem i promieniu porównywalnym 
z Ziemią — to okazałoby się, że okres jego pulsacji 
należy mierzyć w sekundach. 

Przypomnijmy sobie jeszcze jedną własność drgają¬ 
cej struny. Może ona drgać w tonie podstawowym, 
gdy na strunie mamy dwa węzły w punktach zamoco¬ 
wania i strzałkę pośrodku, oraz w tonie wyższym 
(tzw. pierwszym tonie harmonicznym), gdy mamy 



Rys 7. Struna drgająca w tonie podstawowym (góra) i pierw¬ 
szym tonie harmonicznym (dół) 
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trzeci węzeł pośrodku i dwie strzałki (rys. 7). Okres 
drgań będzie wtedy oczywiście krótszy. Gwiazdy 
również mogą pulsować zarówno w tonie podstawo¬ 
wym, jak i w pierwszym, a nawet wyższych tonach 
harmonicznych. Jeżeli okres podstawowy wynosi dla 
gwiazdy P 0t to okres drgań w pierwszym tonie harmo¬ 
nicznym wynosi w przybliżeniu: 

P == 3 / 4 P 0 • 

Który ton jest najbardziej niestabilny (i który tym 
samym „wybierze” gwiazda), zależy od jej budowy 
wewnętrznej. Gwiazdy RR Lyrae typu c pulsują w 
pierwszym tonie harmonicznym, podczas gdy typu ab 
w tonie podstawowym. Oczywiście amplitudy wszyst¬ 
kich zmian w gwiazdach typu c są mniejsze niż w 
gwiazdach typu ab. Podany powyżej związek między 
okresem pulsacji i średnią gęstością jest słuszny dla 
pulsacji w dowolnym tonie harmonicznym, tylko 
stałą Q należy odpowiednio przeskalować. 


Faza ewo!ucyj‘na gwiazd pulsujących 

Drogę ewolucyjną gwiazdy najlepiej można prześle¬ 
dzić na diagramie Hertzsprunga-Russella (H-R). 

Na osi odciętych tego diagramu mamy temperaturę 
gwiazdy (w skali logarytmicznej) lub inny parametr 
związany z logarytmem temperatury (np. typ widmo¬ 
wy). Na drugiej osi mamy jasność absolutną gwiazdy, 
również w skali logarytmicznej, lub absolutną wiel¬ 
kość gwiazdową, proporcjonalną do logarytmu jas¬ 
ności gwiazdy. Jasność i temperatura dobrze opisują 
gwiazdę, a równocześnie najłatwiej porównać je 
z obsenyacjami. Gwiazda o danej jasności i tempera¬ 
turze jest przedstawiona na diagramie H-R przez 
punkt. Gdy w czasie ewolucji gwiazdy parametry te tor 
zmieniają się, punkt zatacza krzywą zwaną torem ewolucyjny 
ewolucyjnym. 

Typowa gwiazda „spędza” większość swego życia 
w fazie, w której w jej wnętrzu zachodzi przemiana 
wodoru w hel. W tej fazie jasność i temperatura nie¬ 
mal nie zmieniają się i są jednoznacznie określone 
przez masę gwiazdy. Punkty odpowiadające gwiaz¬ 
dom o różnych masach nie są chaotycznie rozsypane 
po całym diagramie, lecz układają się w jedną linię 
nazwaną ciągiem głównym (rys. 8). Czas przebywania ciąg 
gwiazdy na ciągu głównym zależy od jej masy i wynosi główny 



Rys. 8. Diagram Hertzsprunga—Russella 


np. od 100 000 lat dla gwiazd masywnych (rzędu 
20A/©) do 10 miliardów lat dla gwiazd o masie rzędu 
masy Słońca. 

Gdy we wnętrzu gwiazdy wypali się wodór, wcho¬ 
dzi ona w burzliwy okres ewolucji, w którym kolejne 

















fazy trwają znacznie krócej niż czas życia na ciągu 
głównym. Losy gwiazdy zależą teraz bardzo od jej 
masy. Gwiazdy masywne żyją znacznie krócej niż 
gwiazdy lżejsze, zatem gwiazdy o masach równych 
wielu masom Słońca, które powstały wiele miliardów 
lat temu, są już bardzo stare w sensie ewolucyjnym 
i dawno zakończyły swą drogę rozwoju stając się bia¬ 
łym karłem, gwiazdą neutronową lub czarną dziurą 
(-► Czarne dziury i zapadanie grawitacyjne). Jeżeli 
obecnie obserwujemy gwiazdy masywne (a do takich 
należą np. cefeidy klasyczne), to na pewno są to 
gwiazdy, które powstały stosunkowo niedawno (ok. 
kilkudziesięciu milionów lat temu). Mimo to są one 
znacznie bardziej zaawansowane ewolucyjnie niż np. 
Słońce mające wiek rzędu 5 miliardów lat. 
obszar Wszystkie gwiazdy, niezależnie od masy, po wypa- 
czerwonych leniu wodoru w centrum „wędrują” na diagramie 
olbrzymów H-R na prawo od ciągu głównego, do obszaru czer¬ 
wonych olbrzymów. W tym czasie następuje przebu¬ 
dowa wnętrza gwiazdy—jądro pozbawione wodoru 
kurczy się, a warstwy zewnętrzne rozszerzają się. Spa¬ 
lanie wodoru zachodzi w tym czasie w warstwie ota¬ 
czającej jądro. Czas przejścia do fazy czerwonego 
olbrzyma jest bardzo krótki dla gwiazdy masywniej 
i dlatego szansa zaobserwowania jej w tej fazie jest 
znikoma. Czas ten jest znacznie dłuższy dla gwiazd 
o masach równych 1-2 masom Słońca. Zwróćmy 
uwagę, że w czasie swej wędrówki ku obszarowi dia¬ 
gramu H-R, zajmowanemu przez czerwone olbrzy¬ 
my, gwiazdy przecinają pas niestabilności, czyli po¬ 
winny przechodzić przez fazę gwiazdy pulsującej. Nie 
udało się nam dotychczas zaobserwować masywnych 
gwiazd pulsujących w tym stadium ewolucyjnym, na¬ 
tomiast wszystkie dane obserwacyjne i rachunki mo¬ 
delowe wskazują na to, że gwiazdy typu S Scuti są 
gwiazdami odchodzącymi od ciągu głównego i spala¬ 
jącymi wodór w grubej warstwie otaczającej bezwo- 
dorowe jądro. Byłyby to więc najmłodsze ewolucyjnie 
gwiazdy pulsujące. 

ewolucja Przyjrzyjmy się teraz dalszej ewolucji mało masyw- 
gwiazd mało nyc ^ 8 w i az ^» ° masach nie przewyższających jednej 
masywnych mas y Słońca. Gdy znajdą się w obszarze czerwonych 
olbrzymów powiększają swe rozmiary dalej, podczas 
gdy jądro kurczy się, aż w centrum powstanie tempe¬ 
ratura dostatecznie wysoka do zapoczątkowania 
reakcji przemiany helu w węgiel. W fazie ewolucyjnej 
czerwonego olbrzyma siła przyciągania na powierzch¬ 
ni gwiazdy jest bardzo mała, a obserwacje wskazują 
na silne ruchy chaotyczne w atmosferze i stąd przy¬ 
puszcza się, że gwiazda traci w tej fazie sporo masy 
„posiewając” ją ze swej powierzchni. Nie mamy 
wprawdzie ścisłych obliczeń, które powiedziałyby nam 
dokładnie, ile masy i w jakim tempie będzie tracone, 
ale sam fakt utraty masy nie budzi obecnie wątpli¬ 
wości. 

W momencie zapalenia się helu (błysk helowy) 
gwiazda robi nagły zwrot na diagramie H-R, kurczy 
gałąź się nieco i trafia na tzw. gałąź horyzontalną (rys. 9). 
horyzontalna Gałąź horyzontalna rozciąga się od obszaru czerwo¬ 
nych olbrzymów, przecina pas niestabilności i sięga 
daleko na lewo od tego pasa. Miejsce, na które trafia 



Rys. 9. Fragment diagrarau H-R z teoretyczną gałęzią horyzon¬ 
talną (linia ciągła) oraz torami (linie przerywane) pokazującymi 
dalszą ewolucję gwiazd. Liczby oznaczają masy gwiazd (w jed¬ 
nostkach masy Słońca) lądujących w różnych miejscach gałęzi 
horyzontalnej 


gwiazda zależy od wielu czynników: masy jądra helo¬ 
wego, całkowitej masy gwiazdy i składu chemicznego 
(a szczególnie zawartości pierwiastków ciężkich). Gdy 
utworzymy diagram H-R dla gromady kulistej (gę¬ 
stego skupiska setek tysięcy gwiazd, które powstały 
równocześnie wiele miliardów lat temu) widzimy, że 
część gwiazd rzeczywiście układa się w gałąź hory¬ 
zontalną (rys. 10). Porównanie obserwowanej pozycji 
gwiazd gałęzi horyzontalnej na diagramie H-R z mo¬ 
delami teoretycznymi wskazuje, że masy tych gwiazd 
wynoszą 0,6-0,7M®. 

Gwiazdy znajdujące się na gałęzi horyzontalnej 
spalają we wnętrzu jądra hel, a w warstwie ota¬ 
czającej jądro — wodór. Ta faza ewolucyjna jest 
względnie spokojna — gwiazda przez dłuższy czas 
niemal nie zmienia swej jasności i temperatury. 

Jeżeli gwiazda z gałęzi horyzontalnej znajdzie się 
w pasie niestabilności, powinna pulsować. Istotnie 
obserwujemy takie gwiazdy. Są to gwiazdy typu RR 
Lyrae. Z rys. 10 wynika, że przejście od gwiazd 
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Rys. 10. Diagram Hertzsprunga-Russella dla gromady kulistej 
M 15. Krzyżykami zaznaczone są gwiazdy typu RR Lyrae 



zmiennych do stałych jest ostro zarysowane. Stąd dla 
wielu gromad kulistych możemy wyznaczyć obserwa¬ 
cyjne granice pasa niestabilności. Z danych teoretycz¬ 
nych wynika, że lewa granica pasa (wysokotempera¬ 
turowa) jest na danym poziomie jasności absolutnej 
silnie zależna od ilości helu znajdującego się w otoczce 
gwiazdy pulsującej. Porównując dane teoretyczne 
i obserwacyjne można wyznaczyć zawartość helu 
w gromadzie. Otrzymany wynik obarczony jest dość 
dużym błędem, ale nie znamy obecnie lepszych metod. 
Dla wszystkich zbadanych gromad otrzymano, że 
zawartość helu wynosi ok. 25%. Przemawia to za 
powstaniem helu na początku istnienia Wszechświata, 
a nie za stopniowym zwiększaniem się jego zawartości 
w miarę ewolucji. 

Drugim ważnym osiągnięciem teorii pulsacji jest 
opracowanie metody wyznaczania z obserwacji masy 
gwiazdy zmiennej. Daje to możliwość sprawdzenia 
poprawności teoretycznie wyznaczonych torów ewo¬ 
lucyjnych na diagramie H-R dla gwiazd o różnych 
masach. Okazuje się, że zgodność jest dobra, chociaż 
miejsce zajmowane przez gwiazdy typu RR Lyrae 
powinny zajmować gwiazdy o nieco większej masie 
niż to obserwujemy. Może to być potwierdzeniem 
faktu utraty masy w fazie czerwonego olbrzyma. 

Gwiazda z gałęzi horyzontalnej przesuwa się na 
diagramie H-R w trakcie spalania helu w jądrze ku 
górze, a gdy cały hel w środku spali się i pali się tylko 
w warstwie otaczającej węglowe jądro, gwiazda wraca 
do obszaru czerwonych olbrzymów. Wędruje w tym 
czasie wzdłuż tzw. gałęzi asymptotycznej znajdującej 
się na prawo od pasa niestabilności. Z dokładnych 
obliczeń wynika, że w tej fazie ewolucyjnej tempo 
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przemian jądrowych nie jest stałe, lecz podlega okre¬ 
sowym niestabilnościom. Jednak obliczenia są ciągle 
jeszcze niewystarczające, ze względu na ograniczone 
możliwości maszyn matematycznych, ale z już istnie¬ 
jących wiemy, że mniej więcej co kilkaset tysięcy lat 
puls tempo produkcji energii w warstwie spalającej hel 
helowy gwałtownie narasta (tzw. puls helowy), co ma silny 
wpływ na jasność i temperaturę gwiazdy. Wskutek 
tego gwiazda zatacza pętlę na diagramie H-R rozcią¬ 
gającą się poza pas niestabilności (rys. 11). Powinniś¬ 
my więc obserwować gwiazdy pulsujące o niedużych 



Rys. 11. Schemat pętli powstającej' na diagramie H-R wskutek 
niestabilności spalania się helu w gwiazdach z gałęzi asympto¬ 
tycznej 


masach leżące w tym obszarze diagramu. Gwiazdami 
takimi są cefeidy typu W Wirginis i dlatego przypusz¬ 
czamy, że są one w trakcie pulsu helowego. Byłyby 
więc ewolucyjnie starsze od gwiazd typu RR Lyrae. 
W tym miejscu warto podkreślić, że niestabilność 
modeli spalających wodór i hel w dwu warstwach 
została odkryta zaledwie ok. 10 lat temu. Do tego 
czasu faza ewolucyjna, w jakiej gwiazda staje się ce- 
feidą typu W Wirginis była jeszcze bardziej niejasna. 

Gwiazdy przechodzące do obszaru czerwonych 
olbrzymów wzdłuż gałęzi asymptotycznej tracą za¬ 
pewne jeszcze część masy i w końcu przechodzą do 
obszaru białych karłów. Nie jest wykluczone, że 
niektóre gwiazdy typu W Wirginis znajdują się w 
trakcie tego przejścia. 

Niektóre mało masywne gwiazdy mają prostszą 
drogę ewolucyjną. Aby w jądrze nastąpiło zapalenie 
się helu, musi ono mieć minimalną masę rzędu 0,45 
M<p. Jeżeli gwiazda wypali w centrum wodór i przej¬ 
dzie do obszaru czerwonych olbrzymów, mając masę 
jądra wyraźnie mniejszą niż ta minimalna wartość 
(np. wskutek małej masy początkowej lub silnej 
utraty masy w trakcie ewolucji), to hel nie zapala się, 
a po zakończeniu kurczenia się jądra gwiazda ewo¬ 
luuje do obszaru białych karłów spalając wodór w 
cienkiej warstwie otaczającej helowe jądro. W tym 
czasie musi ponownie przeciąć pas niestabilności. 
Przypuszcza się, że w tej fazie ewolucyjnej znajdują 
się cefeidy karłowate. Jak już wspominaliśmy, wielu 
astronomów uważa, że podział na gwiazdy typu <5 
Scuti i cefeidy karłowate jest niepotrzebny. Jeżeli 
jednak różnią się one, to w tym obszarze diagramu 
H-R mogą wystąpić obok gwiazd typu <5 Scuti tylko 
gwiazdy o masach około 0,2A/® spalające wodór 
w cienkiej warstwie i ewoluujące do stadium białego 
karła. 

Pozostało nam jeszcze wyjaśnienie fazy ewolucyj¬ 
nej masywnych gwiazd pulsujących. Gwiazdy o ma¬ 


sach równych kilku masom Słońca po przejściu do ewolucja 
obszaru czerwonych olbrzymów również zapalają hel gwiazd 
w jądrze. Jednak sam proces spalania helu przebiega masy wnych 
nieco inaczej. Gwiazda najpierw spala hel będąc 



w obszarze czerwonych olbrzymów, po czym zmienia 
swoją budowę wewnętrzną wędrując równocześnie 
w lewo na diagramie H-R i wchodzi w drugą „nie¬ 
bieską” fazę spalania helu. Rysunek 12 pokazuje roz¬ 
kład tych dwóch głównych faz dla określonego składu 
chemicznego odpowiadającego gwiazdom I populacji. 

Należy dodać, że dokładna lokalizacja „niebieskiej” 
fazy spalania helu zależy od wielu założeń przyjętych 
podczas rachunków i dlatego nie jest jeszcze zbyt do¬ 
kładnie znana. Będąc w tej fazie (lub w czasie przejścia 
do niej) gwiazdy mogą się znaleźć w pasie niestabil¬ 
ności. Stają się wtedy cefeidami klasycznymi. 

Jeżeli chodzi o stan zaawansowania ewolucyjnego 
innych gwiazd, o których wspominaliśmy, to gwiazdy 
typu p Cephei są to gwiazdy, które właśnie kończą 
(albo dopiero co skończyły) spalanie wodoru w cen¬ 
trum i „szykują się” do wędrówki do obszaru czer¬ 
wonych olbrzymów. Są więc gwiazdami bardzo mło¬ 
dymi, również ewolucyjnie. Gwiazdy typu Mira Ceti 
są już w końcowych stadiach ewolucji. Wzdłuż gałęzi 
asymptotycznej zawędrowały do obszaru czerwonych 
olbrzymów i obecnie spalają wodór i hel w dwu war¬ 
stwach, tracąc jednocześnie masę. Czeka je jeszcze 
przejście do obszaru białych karłów. 

Najmniej możemy powiedzieć na temat tego, w ja¬ 
kiej fazie ewolucyjnej znajdują się gwiazdy typu RV 
Tauri. 

Sumując, należy podkreślić, że obserwacje gwiazd test 
pulsujących były od początku jednym z najważniej- dla teorii 
szych testów dla teorii ewolucji. Dzięki swej zmień- ewolucji 
ncści pozwalały na dokładne wyznaczenie para¬ 
metrów fizycznych i dopiero w ostatnich latach zbu¬ 
dowano wystarczająco dobre modele ewolucyjne 
pozwalające śledzić dzieje gwiazdy krok po kroku, 
od narodzin aż do końca drogi ewolucyjnej, i z do¬ 
stateczną dokładnością odtwarzające obserwowane 
wielkości gwiazd pulsujących. Jest to duży triumf 
teorii ewolucji. Zgodność tej teorii z obserwacjami 
w wypadkach, w których porównanie jest możliwe, 
utwierdza nas w przekonaniu, że opisuje ona również 
dobrze sytuacje trudniejsze do porównania z obser¬ 
wacjami. 

W. P. CESEwrcz Zwiozdy tipa RR Liry , Kijew 1966; J. S. Glasby 
Variabie Stars, Cambridge, Massachussetts 1969; B. W. K ukarkin 
(red.) Pulsirujuszczijc zwiazdy , Moskwa 1970; W. Strohmeier 
Variablc Stars, Oxford 1972; O. Struve, V. Zebergs Astronołnia 
XX wieku. Warszawa 1967. 
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Kwazary 

Marcin Kubiak 


Odkrycie kwazarów było jednym z największych 
osiągnięć współczesnej astronomii obserwacyjnej. 
W końcu lat pięćdziesiątych w wielu obserwatoriach 
radioastronomicznych na świecie realizowane były 
programy obserwacyjne mające na celu sporządzenie 
możliwie kompletnych katalogów pozaziemskich 
katalogi źródeł promieniowania radiowego. Powstały wów- 
radioźródef czas katalogi oznaczane symbolami: MSH — od 
nazwisk australijskich radioastronomów: B.Y Millsa, 
O. B. Slee i E. Hilla, którzy zestawili katalog źródeł 
występujących na południowej półkuli nieba; PKS — 
katalog radioźródeł na niebie południowym sporzą¬ 
dzony na podstawie obserwacji za pomocą radiotele¬ 
skopu Parkesa; seria katalogów 1C, 2C, 3C, 4C 
i 5C — sporządzonych przez grupę radioastronomów 
z angielskiego uniwersytetu w Cambridge; CTA 
i CTD — katalogi zestawione przez radioastrono¬ 
mów z California Institute of Technology; AO — 
katalog sporządzony za pomocą radioteleskopu 
Arecibo w Puerto Rico, NRAO — katalog sporzą¬ 
dzony w National Radio Astroriomy Observatory, 
BI — katalog zestawiony w Bolonii. 

W miarę zwiększania dokładności określania współ¬ 
rzędnych źródeł radiowych możliwe stało się dokony¬ 
wanie ich identyfikacji z obiektami optycznymi. W du¬ 
żych szerokościach galaktycznych, tzn. w dużych od¬ 
ległościach kątowych od płaszczyzny Galaktyki, ra¬ 
dioźródła identyfikowano zazwyczaj z galaktykami. 
Jednak w wielu wypadkach w miejscach radioźródeł 
brak było galaktyk, natomiast w pobliżu znajdowano 
słabe obiekty gwiazdowe. Pierwszej niewątpliwej iden¬ 
tyfikacji źródła promieniowania radiowego z obiek¬ 
tem gwiazdowym dokonano w 1960 r. Źródłem tym 
było źródło z katalogu 3C oznaczone symbolem 
3C 48, a jego odpowiednikiem optycznym był obiekt 
podobny do gwiazdy o jasności I6 m . Obserwacje 
spektroskopowe wykazały, że obiekt optyczny wysyła 
widmo ciągłe, na którego tle występują szerokie linie 
emisyjne nie dające zidentyfikować się z żadnymi linia¬ 
mi występującymi zazwyczaj w widmach gwiazd. 
Wkrótce potem dokonano identyfikacji optycznej 
źródła 3C 273, któremu odpowiadał obiekt o jasności 
12™8 (najjaśniejszy spośród znanych obiektów tego 
rodzaju). Odkryte obiekty nazwano kwazarami od 
angielskich słów ąuasi-stellar radio sources (kwazi 
gwiazdowe radioźródła). 

Zasadniczym przełomem w historii kwazarów było 
zidentyfikowanie w 1963 r. linii emisyjnych w widmie 
kwazara 3C 273. Okazało się, że są to linie serii Bal- 
mera wodoru oraz linia magnezu o laboratoryjnej 
długości fali 279,8 nm, znacznie przesunięte ku czer- 
przesunięcie wieni. (Przesunięciem ku czerwieni nazywamy wiel- 
ku czerwieni kość z = (A—A 0 )/Ao, gdzie A — długość fali mierzona 
w widmie, a A 0 — długość fali tej samej linii mierzona 
w laboratorium ziemskim). Dla kwazara 3C 273 
przesunięcie ku czerwieni okazało się równe 0,158. 
Podobna identyfikacja linii w widmie kwazara 3C 48 
dała przesunięcie ku czerwieni z = 0,368. Od tej 
chwili liczba kwazarów o znanych przesunięciach ku 
czerwieni zaczęła szybko rosnąć, przy czym okazało 
się, że kwazary mogą mieć przesunięcia ku czerwieni 
większe niż obserwowano poprzednio u innych obiek¬ 
tów znanych astronomii. Kwazary stały się też przed¬ 
miotem intensywnych i wszechstronnych badań za¬ 
równo obserwacyjnych, jak i teoretycznych. 


Obserwacyjne cechy kwazarów 

Ponieważ nie wiadomo jeszcze, czym w istocie są 
kwazary (znamy ich obecnie ok. kilkuset), nie można 
podać ich ścisłej definicji. Tym większe znaczenie ma 
wyodrębnienie tych cech obserwacyjnych, które od¬ 


różniają kwazary od innych obiektów astronomicz- cechy 
nych. Obecnie znamy następujące cechy kwazarów: kwazarów 

1) są to obiekty, których obraz optyczny jest taki 
jak gwiazdy i które są często identyfikowane z radio¬ 
źródłami; 

2) jasność optyczna jest zmienna; 

3) promieniowanie ich ma, w porównaniu z pro¬ 
mieniowaniem gwiazd, znaczną nadwyżkę nadfiole¬ 
tową i podczerwoną; 

4) w ich widmach występują szerokie linie emisyjne 
oraz niekiedy linie absorpcyjne; 

5) linie są znacznie przesunięte ku czerwieni. 

Początkowo kwazary były wykrywane jako źródła wykrywanie 
promieniowania radiowego odznaczające się stosun- i identyfi- 
kowo małymi rozmiarami kątowymi i nie dające kacja 
zidentyfikować się ze zwykłymi radiogalaktykami. kwazarów 
Istotną rolę w identyfikacji optycznej odgrywała do¬ 
kładność, z jaką możliwe było określenie współrzęd¬ 
nych radiowych. Fotoelektryczne pomiary promie¬ 
niowania widzialnego zidentyfikowanych kwazarów 
wykazały, że na diagramie dwuwskaźnikowym w sy¬ 
stemie UBV (-*- Astronomia w podczerwieni) zajmują 
one obszar leżący powyżej ciągu normalnych gwiazd 
Galaktyki (rys. 1), co oznacza istnienie w ich promie¬ 
niowaniu dużej nadwyżki promieniowania nadfiole¬ 
towego. Wykorzystując tę właściwość podjęto próby 



Rys. 1. Diagram dwuwskaźnikowy dla kwazarów (punkty). Linią 
ciągłą przedstawiona jest standardowa zależność dla gwiazd 
Galaktyki 

wykrycia kwazarów metodami wyłącznie optycznymi 
przez poszukiwanie na dwubarwnych zdjęciach nieba 
słabych obiektów gwiazdowych mających dużą nad¬ 
wyżkę nadfioletową. Należy jednak dodać, że duże 
nadwyżki nadfioletowe mogą mieć niektóre gwiazdy 
szczególnego rodzaju, takie jak białe karły, stare 
gwiazdy nowe lub inne gwiazdy będące w późnych 
stadiach ewolucji. Ostateczne potwierdzenie, czy dany 
obiekt jest kwazarem, mogą przynieść tylko obserwa¬ 
cje spektroskopowe, ujawniające ewentualną obec¬ 
ność linii o dużym przesunięciu ku czerwieni. Mimo 
to, pierwsze próby ograniczone do niewielkich obsza¬ 
rów nieba doprowadziły do odkrycia kwazarów meto¬ 
dami wyłącznie optycznymi, przy czym okazało się, 
że niektóre spośród nich nie dają się zidentyfikować 
ze znanym źródłem promieniowania radiowego, kwazary 
Obiekty te nazwano kwazarami spokojnymi radiowo, spokojno 
Oczywiście brak promieniowania radiowego może radiowo 
być tylko wynikiem ograniczonej czułości stosowa¬ 
nych obecnie odbiorników; niektóre spośród kwaza¬ 
rów spokojnych radiowo zostały z czasem zidentyfi¬ 
kowane z bardzo słabymi źródłami promieniowania 
radiowego. Jeżeli wyniki te są reprezentatywne dla 
całej populacji kwazarów, to można oczekiwać, że 
kwazarów spokojnych radiowo jest ok. 100 razy więcej 
niż kwazarów radiowych. Możliwość dalszego udo¬ 
skonalenia tej metody wynika z faktu, że kwazary 
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oprócz nadwyżki fioletowej mają również znaczną 
nadwyżkę promieniowania podczerwonego. Metoda 
trójbarwna, polegająca na wykrywaniu obiektów 
o dużych nadwyżkach nadfioletowych i podczerwo¬ 
nych, zmniejszy znacznie prawdopodobieństwo fał¬ 
szywych identyfikacji, a jednocześnie pozwoli na 
ewentualne wykrycie kwazarów pozbawionych nad¬ 
wyżki fioletowej wskutek dużego przesunięcia ku 
czerwieni. (Nadwyżka ta w wyniku efektu Dopplera 
przejawi się w promieniowaniu odbieranym jako nad¬ 
wyżka promieniowania widzialnego lub nawet pod¬ 
czerwonego). Metoda ta nie przyniosła jeszcze oczeki¬ 
wanych wyników. 

W tym miejscu należy jeszcze dodać, że w katalo¬ 
gach istnieje dość dużo radioźródeł, których nie udało 
się dotychczas zidentyfikować z jakimikolwiek obiek¬ 
tami optycznymi. Przebieg zależności Ig N-]gS 
(paragraf: Interpretacja teoretyczna) dla tych źródeł 
sugeruje ich podobieństwo do kwazarów wysyłają¬ 
cych promieniowanie radiowe. 

optyczne Optyczne obrazy kwazarów są w zasadzie punktowe 
obrazy i nie dają odróżnić się od obrazów słabych gwiazd, 
kwazarów Wprawdzie istnieją powody, by przypuszczać, że 
liniowe rozmiary kwazarów są niewielkie, to jednak 
trudno jest obecnie powiedzieć, w jakim stopniu brak 
jakiejkolwiek struktury obrazu optycznego jest rze¬ 
czywistą cechą kwazarów, a w jakim — jest wynikiem 
dużej odległości. Na przykład w obrazie optycznym 
kwazara 3C48 (rys. 2) można wyróżnić niewielką 



otoczkę mgławicową, a kwazar 3C273 ma w swej 
. . A . . budowie wyraźną strugę (rys. 3). Z drugiej strony, 
galaktyki tzw. galaktyki typu N (-* Galaktyki), będące źródła- 
typu /V mi promieniowania radiowego i wykazujące w wid¬ 
mach linie emisyjne przesunięte ku czerwieni (choć 
o mniejszą wartość niż kwazary) są zbudowane 
z małego i jasnego jądra otoczonego bardzo słabą 
otoczką gwiazd i materii rozrzedzonej. Nie jest wy¬ 
kluczone, że galaktyki typu N oglądane z dużej od¬ 
ległości, z której widoczne byłoby tylko jasne jądro, 
wyglądałyby podobnie jak kwazary. Właściwości 
jąder galaktyk typu N są pod wieloma względami 
pośrednie między właściwościami zwykłych galaktyk 
i kwazarów. 

radiowe Obrazy radiowe kwazarów są natomiast znacznie 
obrazy bardziej złożone. Obserwacje interferometryczne, 
kwazarów pozwalające osiągnąć kątową zdolność rozdzielczą 
rzędu sekundy łuku, wykazały, że obrazy radiowe 
mogą zawierać następujące elementy: dwa dobrze 
rozdzielone obszary emitujące promieniowanie radio¬ 
we położone symetrycznie po obu stronach obiektu 
optycznego; dwa obszary radiowe, z których jeden 
pokrywa się z obiektem optycznym; kilka obszarów 
radiowych. Pod tym względem kwazary nie różnią się 
zasadniczo od radioźródeł innych rodzajów. Ostatnio 
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Rys. 3. Optyczny (u góry) j radiowy (u dołu) obraz kwazara 
3C 273. Zdjęcie jest przceksponowane w celu uwidocznienia 
słabej strugi. A i B oznaczają źródła radiowe. Obserwacje inter¬ 
ferometryczne wykazały, że radioźródło B ma składową o roz¬ 
miarach mniejszych od 10“* sekundy łuku (wg F. D. Kahn and 
H. Palmer, Quasars , Manchester 1967) 


udało się również wykryć istnienie interesującej 
struktury subtelnej w obszarach emisji radiowej oraz 
wykryć różnice w widmach radiowych wysyłanych 
przez elementy radioźródeł zidentyfikowanych z kwa- 
zarami. 

Promieniowanie ciągłe kwazarów we wszystkich widma 
zakresach długości fal, w których obserwacje były kwazarów 
wykonywane, można opisać w przybliżeniu prawem 
potęgowym F(v) ~ gdzie F — strumień promie¬ 
niowania, v — częstość. W dziedzinie radiowej a 
jest równe średnio 0,7 i słabo zależy od częstości. 

Widma poszczególnych kwazarów mogą jednak róż¬ 
nić się znacznie między sobą. Niektóre kwazary wy¬ 
kazują szybki spadek natężenia w widmie w obszarze 
fal dłuższych (tzw. obcięcie długofalowe, interpreto¬ 
wane jako wynik samoabsorpcji promieniowania 
synchrotronowego) lub mają widma złożone, nie da¬ 
jące opisać się prostym prawem potęgowym. Jak wi¬ 
dać na rys. 4, widma kwazarów nie różnią się od widm 
radiowych zwykłych galaktyk. Widma niektórych 
kwazarów zmieniają się w czasie, podobnie jak to 
obserwuje się u innych radioźródeł. Odróżnienie 
kwazara od radiogalaktyki na podstawie tylko obser¬ 
wowanych cech promieniowania radiowego jest więc 
niemożliwe. 

W dziedzinie widzialnej i w bliskiej podczerwieni 
wykładnik a jest średnio równy ok. 1, co wyraźnie 
odróżnia kwazary (oraz jądra niektórych galaktyk 
zwartych, w tym również galaktyk typu N) od gwiazd 
i wyraźnie wskazuje na nietermiczny rodzaj promie¬ 
niowania. Przebieg widma w podczerwieni nie jest 
jeszcze dokładnie znany, wiadomo tylko, że natężenie 
widma ciągłego w tym zakresie silnie wzrasta. 

Widmo rentgenowskie jest znane tylko dla najjaś¬ 
niejszego kwazara 3C 273. W przedziale od 1 do 
15 keV wykładnik a ma wartość 0,89. Po stronie ma- 
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c j częstość promieniowania 

Rys. 4. Przykłady radiowych widm kwazarów i galaktyk: a) ty¬ 
powe widma, b) widma z obcięciem długofalowym (samoabsorp- 
cia?), c) widma złożone 


linie 

emisyjne 


linie 

absorpcyjne 


łych energii obserwuje się obcięcie widma, będące 
najprawdopodobniej wynikiem absorpcji promienio¬ 
wania X w materii rozproszonej znajdującej się na 
drodze między Ziemią i kwazarem. 

Charakterystyczną cechą kwazarów jest występo¬ 
wanie w ich widmach optycznych silnych linii emisyj¬ 
nych, których szerokości zawierają się w przedziale 
od 0,1 nm do ponad 10 nm, ze średnią wartością ok. 
5 nm. Wśród linii emisyjnych obserwuje się linie wo¬ 
doru, jednokrotnie zjonizowanego magnezu (Mg II) 
oraz wzbronione linie tlenu (O II i O 111) i neonu 
(Ne III i Ne IV). Wszystkie linie emisyjne są przesu¬ 
nięte ku czerwieni o taką samą wartość z. 

Niezwykle interesującą cechą kwazarów jest wystę¬ 
powanie niekiedy w ich widmach stosunkowo wąs¬ 
kich i słabych linii absorpcyjnych. Liczba linii absorp¬ 
cyjnych jest na ogół tym większa, im większe jest 
przesunięcie ku czerwieni (wyznaczone z linii emisyj¬ 
nych). Przesunięcie ku czerwieni wyznaczone z linii 
absorpcyjnych jest zwykle mniejsze od przesunięcia 
ku czerwieni wyznaczonego z linii emisyjnych. 
W widmach wielu kwazarów o dużym z linie absorp- 
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cyjne mają kilka składowych, które mają różne 
przesunięcia ku czerwieni. Kwazar 4C 05.34, mający 
największe znane obecnie przesunięcie ku czerwieni 
z = 2,877, ma w widmie ok. 100 linii absorpcyjnych 
rozpadających się na co najmniej pięć układów o róż¬ 
nych z*i>s, z których największe jest równe 2,785, 
a najmniejsze 2,473. Wśród kwazarów mających kilka 
układów linii znanych jest kilka obiektów, dla któ¬ 
rych obok układów o z a < z em występuje również 
układ o zabs > zem. Przypuszcza się, że linie absorp¬ 
cyjne powstają w warstwach chłodnej i rzadkiej ma¬ 
terii wyrzucanych z kwazarów z dużymi prędkościami. 

Istnienie wielu układów linii absorpcyjnych wskazy¬ 
wałoby na możliwość wielokrotnego wyrzucania 
materii przez kwazary. Niektóre układy linii absorp¬ 
cyjnych powstają zapewne w obłokach materii mię- 
dzygalaktycznej nie związanej bezpośrednio z kwaza- 
rami; w ten sposób można wyjaśnić istnienie przypad¬ 
ków Żaba > Zem. 

Charakterystyczną cechą kwazarów jest zmienność zmienność 
ich jasności zarówno w dziedzinie optycznej, jak i ra- kwazarów 
diowej. Określenie najkrótszego czasu /, w którym 
zmiany te mogą zachodzić, pozwala ocenić górną 
granicę rozmiarów R obszaru, z którego wysyłane 
jest promieniowanie. Pomijając pewne szczególne 
przypadki, możemy oczekiwać, że R <. ct y gdzie c 
jest prędkością światła. (Nawet nagła zmiana jasności 
rozległego źródła będzie przez nas obserwowana jako 
zmiana powolna, zachodząca w czasie, w ciągu 
którego światło zdąży dobiec do nas od wszystkich 
punktów źródła). Ponieważ w dziedzinie widzialnej t 
jest rzędu tygodni lub dni, górna granica rozmiarów 
obszarów wysyłających promieniowanie widzialne 
jest rzędu dziesiątych, a nawet setnych części parseka. 

Zmiany jasności radiowej są powolniejsze i następują 
z okresem charakterystycznym rzędu lat. Obszary 
wysyłające promieniowanie radiowe mogą mieć roz¬ 
miary rzędu parseków. Na rys. 5 przedstawione są 
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Rys. 5. Optyczne i radiowe zmiany kwazara 3C 345 w latach 
1962-1970 


wyniki jednoczesnych obserwacji kwazara 3C 345 
w dziedzinie widzialnej (w barwie niebieskiej B) 
oraz w różnych długościach fal radiowych. Podobne 
zmiany jasności wykazują również inne radiogalak- 
tyki, w tym galaktyki typu N. 


interpretacja teoretyczna 

Najbardziej charakterystyczną cechą kwazarów są 
ich duże przesunięcia ku czerwieni. W zasadzie ist¬ 
nieją dwie następujące możliwości wyjaśnienia tych 
przesunięć: 

1. Są one przesunięciami dopplerowskimi, tzn. 
odpowiadają dużym prędkościom v r oddalania się 
kwazaró w od obserwa tora zgodnie z zależnością 
z-f 1 = j/(v r -f*c)/(tV“c). (Dla małych przesunięć ku 
czerwieni, czyli dla prędkości radialnych dużo mniej¬ 
szych od c spełniona jest przybliżona zależność 
klasyczna z = v/c). 

2. Są one pochodzenia grawitacyjnego, tzn. że 
obserwowane przez nas światło zostało wysłane przez 
ciała o bardzo dużej masie, a opuszczając ich silne 
pola grawitacyjne doznało dużego przesunięcia ku 
czerwieni, które zgodnie z ogólną teorią względności 
jest określone wzorem z^+l = /1 —2 (GMfRc 2 ), 
gdzie G — stała grawitacji, M — masa, R — promień 
ciała wysyłającego kwanty. 

Obecnie istnieje wiele argumentów za tym, że 
przesunięcia ku czerwieni w widmach kwazarów są 
przesunięciami dopplerowskimi. Zakładając, że jest 
tak naprawdę, stajemy wobec dwu możliwości: 

1. Duża prędkość ucieczki jest wynikiem ogólnej 
ekspansji Wszechświata. Zgodnie z prawem Hubble’a, 
prędkość ucieczki v jest wprost proporcjonalna do 
odległości, co zapisujemy jako v = Hr t gdzie r — 
odległość, H —stała Hubble’a, równa według ostat¬ 
nich wyznaczeń ok. 50 km/s-Mps. Innymi słowy, 
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kwazary są obiektami kosmologicznymi, tzn. znaj¬ 
dują się w ogromnych odległościach rzędu tysięcy 
Mps (hipoteza kosmologiczna). 

2. Duże prędkości oddalania się kwazarów wyni- hipoteza 
kają z wielkich prędkości własnych kwazarów w sto- lokalna 
sunku do ich najbliższego otoczenia. Duże prędkości 
mogą oznaczać, że kwazary zostały wyrzucone w wy¬ 
niku potężnej eksplozji, która nastąpiła w naszym 
pobliżu (hipoteza lokalna). Ponieważ nie obserwuje 
się wśród kwazarów przesunięć ku fioletowi (choć 
kwazary takie byłyby łatwiejsze do wykrycia niż kwa¬ 
zary z przesunięciem ku czerwieni), hipoteza ta w spo¬ 
sób niemożliwy do przyjęcia wyróżnia naszą Ga¬ 
laktykę lub jej najbliższe otoczenie. Hipotezę kos¬ 
mologiczną wzmocniło jeszcze odkrycie kwazara 
PKS 225+II leżącego w kierunku jednej z gromad 
galaktyk i mającego takie samo przesunięcie ku 
czerwieni, jakie ma jedna z galaktyk gromady. 

Przekonanie, że kwazary są obiektami kosmolo¬ 
gicznymi, jest przyczyną szczególnego zainteresowa¬ 
nia nimi współczesnej atronomii. Biorąc pod uwagę, 
że rekordowa wartość przesunięcia ku czerwieni wśród 
radiogalaktyk jest równa 0,46, łatwo można zrozu¬ 
mieć, że kwazary o przesunięciach ku czerwieni 
większych od 2 dostarczają nieoczekiwanej możli¬ 
wości sięgnięcia do odległości ponad dwukrotnie 
większych z jednoczesnym „cofnięciem się” w czasie 
o kilka miliardów lat (tyle czasu biegnie bowiem 
światło od najodleglejszych kwazarów). W związku 
z tym z badaniami kwazarów wiązano duże nadzieje 
na rozstrzygnięcie wielu zasadniczych problemów 
kosmologicznych. Niestety nadzieje te zawiodły po 
stwierdzeniu, że kwazary wykazują bardzo duży roz¬ 
rzut jasności absolutnych i to zarówno optycznych, 
jak i radiowych. Wykres zależności jasności obserwo¬ 
wanych od przesunięcia ku czerwieni, będący odbi¬ 
ciem tych różnic, jest przedstawiony na rys. 6. 



Rys. 6. Zależność przesunięcia ku czerwieni od jasności obser¬ 
wowanej nu dla 136 kwazarów (punkty). Linia prosta przed¬ 
stawia tę samą zależność dla najjaśniejszych galaktyk w groma¬ 
dach 


Mimo to, obserwacje kwazarów przyczyniły się do wnioski 
wysunięcia pewnych interesujących wniosków na na temat 
temat ewolucji Wszechświata. Istotną rolę odegrała ewolucji 
tu zależność Ig N- Ig5, czyli wykres przedstawiający Wszech- 
liczbę źródeł o jasnościach większych od danej jas- świata 
ności S w funkcji S. W przypadku źródeł rozłożonych 
w przestrzeni w sposób jednorodny (nawet przy 
uwzględnieniu ekspansji Wszechświata) nachylenie 
zależności IgW-Igó 1 powinno być bliskie -1,5. 

(Wartość — 1,5 odpowiada jednorodnemu rozkładowi 
źródeł statycznych). Nachylenie takie stwierdzono 
dla zidentyfikowanych radiogalaktyk, których prze¬ 
sunięcia ku czerwieni są na ogół niewielkie. Taki sam 
wykres dla kwazarów zidentyfikowanych optycznie 
ma nachylenie wyraźnie większe, ok. 1,8. Z drugiej 
strony, znając przesunięcia ku czerwieni kwazarów 
oraz przyjmując któryś z modeli kosmologicznych 
(przy czym wybór konkretnego modelu nie ma za- 















































sadniczego znaczenia), możemy określić ich odleg¬ 
łości, a następnie ocenić przestrzenną gęstość kwaza- 
rów w funkcji odległości (przesunięcia ku czerwieni). 
Z rozważań takich wynika, że istnieje nadmiar kwaza- 
rów o dużych przesunięciach ku czerwieni w stosun¬ 
ku do tego, czego powinniśmy oczekiwać dla rozkładu 
jednorodnego. Wielkość i kierunek tej rozbieżności 
jest zgodny z zależnością Ig /V- Ig S. Ich gęstość 
przestrzenna w odległości odpowiadającej z — 1 jest 
ok. 100 razy większa niż w naszym najbliższym oto¬ 
czeniu. Wniosek ten przemawia silnie za stałą 
ewolucją we Wszcchświecie. 

Niezależnie od znaczenia jakie kwazary mogłyby 
mieć dla kosmologii, są one obiektami interesującymi 
również z innych powodów. Jeżeli znajdują się one 
rzeczywiście w odległościach kosmologicznych, tj. 
zgodnych z prawem Hubble’a, wówczas ich jasność 
absolutna musi być ok. 100 lub więcej razy większa 
od jasności absolutnej najjaśniejszych spośród zna¬ 
nych galaktyk. Biorąc zaś pod uwagę niewielkie roz¬ 
miary liniowe obszarów wysyłających te ilości energii, 
stajemy wobec pasjonującego problemu wyjaśnienia 


procesów fizycznych, które mogą być jej źródłem, problem 
Nie ulega wątpliwości, że promieniowanie kwazarów źródła 
ma charakter nietermiczny; jest ono najprawdopo- promienio- 
dobniej promieniowaniem synchrotronowym z do- wania 
mieszką promieniowania powstającego w tzw. od- kwazarów 
wrotnym efekcie Comptona ( ► Astronomia promieni 
X i y). W obu wypadkach źródłem kwantów promie¬ 
niowania są bardzo szybkie, relatywistyczne elek¬ 
trony. Pochodzenie szybkich strumieni elektronów 
u kwazarów nie zostało jeszcze wyjaśnione. Do bar¬ 
dziej interesujących hipotez należy zaliczyć hipotezę 
anihilacji materii i antymaterii oraz hipotezę wybu¬ 
chów supernowych, będących następstwem „zlepia¬ 
nia” się gwiazd w obszarach, w których przestrzenna 
gęstość gwiazd jest rzędu 10 10 na ps 3 . Kwazary nie 
wniosły więc istotnego wkładu do rozwiązania pro¬ 
blemów kosmologicznych, ale okazały się obiektami 
niezwykle interesującymi z punktu widzenia procesów 
fizycznych, które mogą w nich przebiegać. 

G. Burbidge and M. Burbidge Quasi-S:e!!ar Objects, San 
Francisco 1976; D. Evans(c<1.) External Galaxies andQuasi-Ste!lar 
Objects , Dordrccht 1972. 
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Marek Demiańskł 

Latem 1967 r. grupa radioastronomów pod kierun¬ 
kiem Anthony Hewisha, prowadziła obserwacje da¬ 
lekich -*• Kwazarów. Ich celem było zbadanie szyb¬ 
kich zmian sygnałów fal radiowych, emitowanych 
przez te źródła. Spójne fale radiowe przechodzące 
przez chmury plazmy ulegają zniekształceniom wywo¬ 
łującym charakterystyczne, szybkie i nieregularne 
fluktuacje w ich natężeniu. To „migotanie” obserwuje 
się tylko w wypadkach zwartych źródeł promienio¬ 
wania, których rozmiary kątowe są mniejsze od jed¬ 
nej sekundy. Zwykłe radiogalaktyki są znacznie więk¬ 
sze, natomiast kwazary mają małe rozmiary kątowe. 
Migotanie było więc pierwszym testem na to, czy dane 
radioźródło może być kwazarem. Podobnie jak jono- 
sfera, obszary wypełnione plazmą uginają bardziej 
fale długie niż krótkie. Zatem migotanie jest wyraź¬ 
niejsze dla fal o metrowej długości niż dla fal centy¬ 
metrowych. Do tych badań używano radioteleskopu, 
który pracował na długości fali 3,7 metra (rys. I). 



Rys. 1. Radioteleskop używany do badania kwazarów i pulsarów 


Analiza danych obserwacyjnych wskazywała na 
istnienie bardzo dziwnego obiektu. Pojawiał się on 
wówczas, kiedy migotanie innych źródeł było małe 
a natężenie promieniowania bardzo nieregularne. 
Paralaksa tego źródła była zbyt mała, aby ją zmierzyć, 
co oznaczało, że znajduje się ono daleko poza grani¬ 
cami Układu Słonecznego. Najwłaściwsze wydawało 
się przypuszczenie, że jest to wybuchająca gwiazda. 
Zaczęto więc badać, czy sygnały pochodzące od tego 
źródła są podobne do sygnałów, jakie wysyła Słońce 
w okresie wzmożonej aktywności radiowej. Najważ¬ 
niejsze było zatem zbadanie zmienności sygnału. 
Tymczasem aktywność źródła znacznie zmalała i trze¬ 
ba było czekać dwa miesiące, aby pojawiło się znowu. 
28 IX 1967 r. przeprowadzono najważniejsze obser¬ 
wacje. Okazało się, że źródło wysyła sygnały w postaci 
krótkich, powtarzających się co 1,3 s impulsów, jakich 
dotychczas nie obserwowano. 

Na podstawie zmienności sygnału można ocenić 
rozmiary źródła. Jeżeli okres zmienności sygnału 
wynosi /, wówczas rozmiary źródła nie mogą być 
mniejsze od cl , gdzie c —prędkość światła. Źródłem 
zaobserwowanych impulsów mógł być zatem bardzo 
mały obiekt, raczej planeta niż gwiazda. Wówczas 
powstała fantastyczna hipoteza, że sygnały te są 
wysyłane przez pozaziemską cywilizację. Jednak 
hipotezę tę odrzucono, gdy okazało się, że sygnały nie 
zawierają żadnej informacji — nie doszukano się bo¬ 
wiem jakiejkolwiek korelacji między sygnałami ani 
prawidłowości w ich przebiegu prócz niezwykłej ich 
periodyczności. W tym czasie odkryto również inne 
źródła tego typu i w ten sposób przekonano się, że 
są to obiekty astronomiczne zupełnie nowego rodzaju. 


Dane obserwacyjne 

Obecnie znamy ok. trzystu dwudziestu pulsarów. Naj¬ 
bardziej charakterystyczną cechą ich promieniowania 
jest zmienność impulsów przy zachowaniu niezwykle 
stabilnej periodyczności. Amplituda oraz kształt 
impulsu, jak to widać na rys. 2, ulegają zmianom, 
zarówno w ciągu krótkich odstępów czasu, a więc 
nawet od impulsu do impulsu, jak też w ciągu dłuż¬ 
szych okresów czasu. Dużą stabilnością cechuje się 
natomiast średni odstęp pomiędzy impulsami, który 
nazywa się okresem pulsara. Poszczególne impulsy okres pulsara 
mają złożoną strukturę i bardzo często składają się 
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struktura z dwóch a nawet kilku podimpulsów. Ze względu na niego impulsu At jest w prosty sposób związany z okre- 
impulsów strukturę impulsu pulsary można podzielić na dwie sem pulsara P. Empirycznie po uśrednieniu otrzymuje 
grupy: takie, u których zmiany impulsu są przypad- się przybliżoną zależność At = 0,04/*. Dla różnych 
kowe, i takie, gdzie zmiany te są mniej lub bardziej pulsarów stosunek Al do P zawiera się w granicach 
wyraźnie periodyczne. od 0,01 do 0,12. Przy interpretacji tych wyników 
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Rys. 2. Picrwsz* obserwacje impulsów pulsarów. U góry — fragment sygnału wysyłanego przez pulsara CP 1919. W każdym dwudzie- 
stosekundowym odstępie można wyróżnić 15 impulsów. U dołu — zmiany amplitudy pulsara CP 0950 


kształty Analiza wielu (kilkuset) impulsów prowadzi do 
impulsów wniosku, że każdy pulsar ma charakterystyczny średni 
kształt impulsu. Niektóre z nich przedstawiono na 
rys. 3. Podobnie jak pojedynczy impuls — średni 
impuls może mieć jedno lub kilka maksimów. Z da¬ 
nych obserwacyjnych wynika, że czas trwania śred- 
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Rys. 3. Średnie kształty impulsów niektórych pulsarów. Z boku 
podano numery pulsarów 



Rys. 4. Kształt im¬ 
pulsu niektórych pul¬ 
sarów ulega perio¬ 
dycznym zmianom. 
Dotyczy to głównie 
pulsarów o złożonym 
kształcie impulsu. 
Prócz podstawowego 
okresu pulsara P moż¬ 
na wyróżnić okresy 
P, i P 9 . P t jest to naj¬ 
mniejszy odstęp cza¬ 
su, po którym impuls 
przyjmuje pierwotny 
kształt. Odstęp czasu 
pomiędzy pod im pul¬ 
sami oznaczono przez 
P, 


trzeba pamiętać, że At zależy od częstości, na jakiej 
prowadzone są obserwacje. 

F.D. Drakę i H.D. Craft zauważyli periodyczne 
zmiany kształtu impulsu. Śledzili oni dokładnie mo¬ 
ment pojawienia się podimpulsu w pulsarze CP 1919 
(początkowo pulsary oznaczano podając miejsce od¬ 
krycia oraz rektascensję pulsara, np.: CP 1919 to 
pulsar odkryty w Cambridge, o rektascensji 19 h 
i 19 min, MP0034 to pulsar odkryty w Mulłard 
w Australii, o rektascensji 34 min; obecnie powszech¬ 
nie stosuje się oznaczenie PSR 1919, co oznacza pul¬ 
sar o rektascencji 19 h i 19 min) i stwierdzili, że okres 
tych zmian jest bardzo krótki, rzędu 10 ms (rys. 4). 
Ponadto doszli do wniosku, że szybkie oscylacje są 
niezależne od głównego sygnału i występują jak gdyby 
na tle głównego impulsu, co sugeruje, że zachodzą 
w sposób ciągły. Stąd wynika, że mechanizm odpo¬ 
wiedzialny za powstawanie szybkich zmian jest różny 
od tego, który wywołuje podstawową okresowość pul¬ 
sara. Okres szybkich zmian nie jest stały, a zatem co 
pewien czas sytuacja może się powtarzać. Istotnie 
periodyczność taka występuje i okres tych zmian 
waha się od kilku do kilkunastu sekund. 

Podstawowy okres pulsara jest bardzo stabilny. 
Dla większości znanych pulsarów wyznaczono dP/dt , 
przy czym wielkość ta jest mniejsza od 4,2*10~ 13 , 
a na ogół jest rzędu 10~ 16 . W ciągu ostatnich lat okres 
pulsarów zmienił się co najwyżej o 10 -< swej pier¬ 
wotnej wartości. Są one zatem bardzo dobrymi ze¬ 
garami. Prócz powolnych zmian okresu zauważono 
kilka szybkich zmian, w czasie których okres gwał¬ 
townie malał. Nie udało się jednak dokładnie prześle¬ 
dzić tych zmian, ale przypuszcza się, że zachodzą one 
w ciągu kilku godzin. 

Sygnały wysyłane przez pulsary były obserwowane 
w szerokim zakresie fal od 40 MHz do 8,1 GHz, 
a pulsary występujące w mgławicach Krab i Żagiel 
prócz sygnałów radiowych wysyłają również sygnały 
w obszarze widzialnym, rentgenowskim i w obszarze 
promieni y. 

Zauważono trzy główne efekty, które zależą od 
częstości, mianowicie: dyspersję impulsów, rozmywa¬ 
nie impulsów i zmiany natężenia impulsów. Pierwsze 
dwa efekty są związane z tym, że sygnał na swej 
drodze napotyka na materię międzygwiezdną, a trzeci 
efekt jest zapewne właściwością samego źródła. 

Dyspersja impulsów, tzn. zależność prędkości roz¬ 
przestrzeniania się sygnałów od częstości, wywołana 
przejściem impulsów przez obszary plazmy między¬ 
gwiezdnej, umożliwia oszacowanie odległości od 
pulsarów. Znajdują się one daleko poza granicami 
Układu Słonecznego i większość pulsarów jest w od¬ 
ległości kilkuset parseków. Plazma międzygwiezdna 
może wywoływać zmianę natężenia impulsów. Trud- 
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no sobie jednak wyobrazić, aby plazma międzygwiezd¬ 
na powodowała zmiany amplitudy kolejnych sygna¬ 
łów. Muszą one być wywoływane przez procesy fizycz¬ 
ne zachodzące w źródle. 

widmo Widma energii pulsarów są różne, mają jednak 
energii wspólną cechę. Wydaje się, że dla wszystkich pulsa- 
pulsarów rów energia wypromieniowywana gwałtownie maleje 
zarówno dla bardzo dużych, jak też i dla małych czę¬ 
stości (rys. 5). 


PSR 0328 



Rys. 5. Widmo energii 
niektórych pulsarów. 
Energia wypromieniowa- 
na maleje zarówno dla 
małych jak i dla dużych 
częstości 



Wiele danych o mechanizmie promieniowania pul¬ 
sarów można otrzymać badając polaryzację sygnałów. 
Stopień polaryzacji jest duży i dochodzi do 95%. 
Niektóre impulsy są spolaryzowane kołowo. W wielu 
wypadkach stopień polaryzacji zmienia się w czasie 
trwania impulsu. Własności polaryzacyjne sygnałów 
bardzo nieznacznie lub w ogóle nie zależą od częstości. 
Zmiany polaryzacji impulsów pułsara PSR 0833 
przedstawia rys. 6. 

Najdokładniej zbadany jest pulsar PSR 0532 
w Mgławicy Krab (rys. 7), która powstała w wyniku 
wybuchu supernowej w 1054 r. Pulsar ten wysyła 
sygnały w zakresie fal radiowych, w widzialnej części 
widma (rys. 8) oraz w obszarze rentgenowskim. 
Stwierdzono, że kształty impulsów rentgenowskie 
i optyczne pokrywają się z dokładnością do jednej 
milisekundy. Impulsy występują też w obszarze pro¬ 
mieni y. 

Jak dotychczas nie stwierdzono impulsów w obsza¬ 
rze y o energii większej od 50 MeV. Bardzo dokładne 
obserwacje nie doprowadziły do odkrycia żadnych 
linii ani pasm w widmie pulsarów. Próby odkrycia 
krótkotrwałych periodycznych zmian impulsów w ob¬ 
szarze widzialnym też zawiodły. 

Pulsar w Mgławicy Krab jest jedynym jak do tej 
pory pulsarem, dla którego stwierdzono sporadyczne 
(raz na ok. 10 4 impulsów) krótkotrwałe wzrosty 
energii impulsu o mniej więcej 1000 razy w porów¬ 
naniu ze średnią energią impulsów. Impulsy są spo¬ 
laryzowane. W obszarze widzialnym stopień polary¬ 
zacji liniowej zmienia się od 20 do 30%, a stopień 
polaryzacji kołowej jest mniejszy od 10%. Płaszczyz¬ 
na polaryzacji szybko się obraca, stale w tym samym 
kierunku. Okres pułsara PSR 0532 zmierzono bardzo 
dokładnie; jego zmiany można opisać wzorem em¬ 
pirycznym: 

P = b 0 +b x t+b z t\ (1) 

gdzie b 0y b x i b z są stałymi. Za początek liczenia czasu 
wybrano północ 17 III 1969 r. (czas t mierzony jest 
w tygodniach). Dane obserwacyjne prowadzą do 

P = [ 33095563,9268 ± (3652256 ± 0,00050) /— 


Rys. 6. Zmiany polaryzacji impulsów: a) zmiana polaryzacji 
impulsu pułsara PSR 0833, b) zmiana kąta polaryzacji pułsara 
PSR 0833 


- (0,55 ± 0,13) 10-U 2 ] ±0,037 ns. (2) 
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Rys. 8. Pulsar w Mgławicy Krab periodycznie „mruga” i w wi¬ 
dzialnej części widma. Na zdjęciu wykonanym w momencie 
maksimum amplitudy jest widoczny (a), natomiast nie pojawia 
się na zdjęciu wykonanym o pół okresu później (b) 


Proszę zwrócić uwagę na niezwykłą dokładność, 
z jaką znamy okres tego pulsara. Przyjmuje się, że 
zmiany prędkości kątowej o pulsarów są opisywane 
zależnością: 

d(x> 

-w - (3 > 

gdzie K i n — stałe; dla pulsara w Mgławicy Krab 
n = 2,515 ±0,005. 

straty Wydłużenie się okresu oznacza, że pulsar PSR 0532 
energii traci część swojej energii rotacyjnej. Przyjmując, że 
moment bezwładności I nie ulega zmianie, szybkość 
strat energii można zapisać w postaci: 


dJErot 

~dT 


= 4ti 2 


/ dP 
P 3 dt 


(4) 


Oszacowanie strat energii wymaga znajomości mo¬ 
mentu bezwładności pulsara. Do tych rozważań 
wrócimy, gdy będziemy rozpatrywali modele pulsa¬ 
rów. 

Dla kilku pulsarów zauważono gwałtowną zmianę 
okresu P, po czym dPjdt znowu przyjmowało stałą 
wartość, choć nieco różną od wartości przed skokiem. 


Zjawisko to obserwowano wielokrotnie. Na przykład 
zmiany takie wystąpiły u pulsara PSR 0833 (przed¬ 
stawiono je na rys. 9). 



Rys. 9. Gwałtowna zmiana okresu pulsara PSR 0833. Między 
24 II a 3 III 1969 r. okres zmniejszył się o 200 ns 


Dotychczas tylko dla pulsarów w mgławicach Krab 
i Żagiel i pulsara rentgenowskiego Her X-1 zareje¬ 
strowano impulsy w obszarze widzialnym. Poszuki¬ 
wania pulsarów w obszarze rentgenowskim też za¬ 
kończyły się powodzeniem. Znaleziono kilka takich 
obiektów. Prócz PSR 0532 impulsy w obszarze rent¬ 
genowskim wysyłają między innymi Her X-1 i Cen 
X-3. Rentgenowski pulsar Her X-1 ma okres 1,24 s 
i jest najszybciej zmiennym pulsarem rentgenowskim. 
Okres pulsara Cen X-3 wynosi 4,8 s i 90% energii 
wypromieniowuje w postaci impulsów. Oba te pulsary 
wchodzą w skład układów podwójnych (—► Ewolucja 
gwiazd) o okresach zmienności odpowiednio dla 
Her X-1 1,7 dnia i dla Cen X-3 2,08 dnia. 

Obecnie znamy ok. 320 pulsarów. Można już więc 
próbować przeprowadzić statystyczną analizę ich 
własności, niektóre z nich zestawiono w tabeli. Okresy 
pulsarów radiowych zawierają się w zakresie od 
0,033 s do 4,3 s, przy czym najwięcej pulsarów ma 
okresy od 0,5-1,0 s. Odległości pulsarów od Ziemi 
wynoszą najczęściej kilkaset parseków i zawierają się 
w granicach 60-11 000 ps. Interesujące jest zestawienie 
odległości pulsarów od płaszczyzny Galaktyki 
(rys. 10), z którego wynika, że grupują się one w jej 
płaszczyźnie. Przestrzenny rozkład pulsarów w Galak¬ 
tyce, który przedstawia rys. 11, jest podobny do roz¬ 
kładu gwiazd pierwszej- populacji (-* Galaktyka) 
i supernowych drugiego rodzaju. 

Wiosną 1974 r. grupa radioastronomów korzysta¬ 
jąc z największego obecnie na świecie radioteleskopu 
w Arecibo (Porto Rico) odkryła kilkadziesiąt nowych 


Własności niektórych pulsarów 
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_ 
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_ 
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MP 
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40 

40 
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_ 
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_ 

_ 
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PP 
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43 
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10 

05 

33 
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707 


_ 

_ 

15,35 

CP 

09 

50 

30,85 

08 

09 
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0,238 
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MP 

09 

59 

51 
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37 
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CP 

11 

33 
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MP 
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54 
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prędkość kątowa liczba pulsarów 



Rys. 10. Rozkład pulsarów w zależności od ich odległości od 
płaszczyzny Galaktyki 


ten wchodzi w skład układu podwójnego. Jest to pulsar 
pierwszy pulsar radiowy występujący w układzie radiowy w 
podwójnym. Jego odkrycie ma duże znaczenie. Być układzie 
może korzystając z dokładniejszych danych obser- podwójnym 
wacyjnych na temat tego układu będzie można wyz¬ 
naczyć masę gwiazdy neutronowej. Byłaby to pierw¬ 
sza bezpośrednia obserwacyjna informacja o pod¬ 
stawowych parametrach charakteryzujących gwiazdy 
neutronowe. Układ ten można również stosować do 
sprawdzenia różnych efektów szczególnej i ogólnej 
teorii względności. 

Dane obserwacyjne pozwalają na podanie wielu 
ograniczeń na modele pulsarów. Krótki czas trwania 
impulsów oznacza* że źródło promieniowania jest 
małych rozmiarów. Niezwykła stabilność okresu pul¬ 
sarów wskazuje na to, że proces odpowiedzialny za 
periodyczność powinien być związany z mechanicz¬ 
nymi własnościami układu. 

Początkowo przypuszczano, że pulsary są pulsują¬ 
cymi białymi karłami, stąd zresztą myląca nieco ich 
nazwa. Jednak z dokładnej analizy wynika, że białe 
karły nie mogą pulsować z tak krótkim okresem. 

Obrót białego karła, jako mechanizm zapewniający 
periodyczność, należało też odrzucić, gdyż wymagana 
prędkość kątowa obrotu dla krótkookresowych pul¬ 
sarów byłaby za duża i siły grawitacyjne nie mogłyby 
równoważyć sił odśrodkowych. 



~30° 


-60° 

b = - 90° 

Rys. 11. Przestrzenny rozkład pulsarów. Mają one wyraźną 
tendencję do skupiania się w płaszczyźnie Galaktyki; b szerokośó 
galaktyczna 


6=90° 


pulsarów. Okres jednego z nich (pulsar PSR 1923, 
odkryty przez J. H. Taylora i R. A. Hulse’a) zmieniał 
się periodycznie co 0,3230 dnia pomiędzy 0,058967 
a 0,059045 s (rys. 12). Z danych tych wynika, że pulsar 



oznacza, że wchodzi on w skład układu podwójnego 


Gwiazdy neutronowe 


Bardzo szybko po odkryciu pulsarów zdano sobie 
sprawę z tego, że jedynie gwiazda neutronowa może 
być podstawą wszelkich modeli mechanizmu zapew¬ 
niającego periodyczność pulsarów. Jedynego konku¬ 
rencyjnego kandydata — białego karła — trzeba było 
odrzucić. Białe karły nie mogą ani pulsować, ani ob¬ 
racać się z tak krótkimi okresami. Obecnie nie ulega 
już wątpliwości, że pulsar to obracająca się gwiazda 
neutronowa. Nie można wprawdzie podać bezpo¬ 
średniego dowodu, ale inne modele musiałyby być 
znacznie bardziej skomplikowane. 

Hipotezę o istnieniu gwiazd neutronowych zapro- hipoteza 
ponował w latach trzydziestych L. L. Landau, a nie- gwiazd 
zależnie od niego W. Baade i F. Zwicky. Baade neutrono- 
i Zwicky przeprowadzali systematyczne obserwacje wych 
wybuchów supernowych. Obliczając energię, która 
zostaje wydzielona w czasie wybuchu, doszli do wnios¬ 
ku, że stanowi ona tylko pewien procent całkowitej 
energii i po wybuchu powinna jeszcze pozostawać 
centralna, bardzo gęsta część tworząca gwiazdę neu¬ 
tronową. Zainteresowanie gwiazdami neutronowymi 
wzrosło, gdy zaczęto badać ostatnie etapy ewolucji 
gwiazd. Okazało się wówczas, że zależnie od masy 
mogą istnieć dwie różne stabilne konfiguracje (rys. 13). 



Rys. 13. Zależność masy gwiazdy od promienia dla gwiazd o du¬ 
żej gęstości centralnej. Występują dwie stabilne konfiguracje; 
białe karły i gwiazdy neutronowe 
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Gwiazda, która wyczerpała już swój zapas paliwa 
jądrowego i kurcząc się powoli ostyga, stanie się 
w końcu białym karłem, jeżeli jej masa nie przekracza 
krytycznej wartości 1,4M®. Gwiazdy bardziej masyw¬ 
ne przechodzą przez stadium wybuchu supernowej 
i z ich centralnych części w wyniku dalszego kurcze¬ 
nia może powstać gwiazda neutronowa. W białych 
karłach siła grawitacyjnego przyciągania jest równo¬ 
ważona przez ciśnienie gazu elektronowego. W gwiaz¬ 
dach neutronowych siły grawitacyjne są równoważone 
przez ciśnienie gazu neutronowego. Należy podkreś¬ 
lić, że ciśnienie zarówno w gazie elektronowym jak 
i neutronowym jest wywołane nie przez zderzenia, 
jak w przypadku zwykłego gazu, lecz przez efekty 
kwantowe. Elektrony i neutrony są fermionami i dla 
nich obowiązuje zakaz Pauliego. Dwa elektrony lub 
dwa neutrony nie mogą znajdować się w takim samym 
stanie kwantowym. 

Gdy gęstość materii przekracza 5-10 11 g/cm 3 na¬ 
stępuje gwałtowna zmiana składu chemicznego ma¬ 
terii; jądra rozpadają się i jako składniki materii po¬ 
zostają protony, neutrony i elektrony. Przy mniejszych 
gęstościach charakterystyczny czas tego procesu zale¬ 
ży od temperatury. Temperatura w obszarach cen¬ 
tralnych gwiazdy neutronowej, powstałej w procesie 
wybuchu supernowej, jest bardzo wysoka, często wyż¬ 
sza od 10 10 K. Reakcje jądrowe sprowadzające układ 
do stanu równowagi przebiegają wówczas bardzo 
szybko. Gdy gwiazda neutronowa ostygnie, jej skład 
chemiczny nie ulega już zmianie, reakcje jądrowe prze¬ 
biegają bowiem tak wolno, że można je pominąć. 
Skład chemiczny materii w gwieździe neutronowej w 
różnych jej obszarach powinien zatem odpowiadać 
stanowi równowagowemu. 

Dzięki znacznym różnicom gęstości pomiędzy cen¬ 
trum 10 1 * g/cm 3 a powierzchnią, gwiazda neutronowa 
powinna być podzielona na obszary wyraźnie rozgra¬ 
niczone i różniące się własnościami fizycznymi. Moż¬ 
na wyróżnić trzy takie obszary (rys. 14). 



Rys. !4. Przekrój przez gwiazdę neutronową. Centralne jądro 
hipernowe jest otoczone cieczą neutronową. Dalej na zewnątrz 
znajduje się krystaliczna powłoka, a nad nią bardzo cienka war¬ 
stwa gęstej atmosfery 


a) Powłoka. Jej grubość zależy od całkowitej masy 
gwiazdy i zmienia się od ok. 100 m dla gwiazd o du¬ 
żej masie do ok. 10 km dla lekkich gwiazd. W pow¬ 
łoce gęstość stopniowo wzrasta i na wewnętrznej 
granicy osiąga wartość 4,3-10 11 g/cm 3 . Poza tym 
powłoka jest złożona z elektronów i jąder tworzą¬ 
cych strukturę krystaliczną. W głębszych warstwach, 
gdzie gęstość jest większa od 10* g/cm 3 , najbardziej 
stabilne są jądra żelaza, na dolnej zaś granicy jądra 
cyrkonu Z = 40, A = 127. W normalnych warun¬ 
kach jądra te były niestabilne ze względu na rozpad p. 

K* Ciecz neutronowa. W głębszych warstwach 
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w miarę zbliżania się do centrum, wzrasta gęstość 
materii. Z energetycznego punktu widzenia korzystna 
jest w tych warunkach reakcja odwrotna do rozpadu P 
swobodnego neutronu: 

p+e -► n+v 9 

prowadząca do jąder o coraz to większej zawartości 
neutronów. W końcu przy gęstości 10 12 g/cm 3 jądra 
rozpadają się i przy większych gęstościach występuje 
już tylko mieszanina neutronów, protonów i elektro¬ 
nów. W stanie równowagi stosunek ilości neutronów 
do protonów i do elektronów wynosi 8:1:1. Warunki 
fizyczne panujące w tym obszarze, a więc zakres 
gęstości i temperatur, jest taki, że neutrony stanowią 
ciecz neutronową w stanie nadciekłym. 

c) Hiperonowe jądro. Gdy masa gwiazdy neutrono¬ 
wej przewyższa 0,5M®, to gęstości w centralnych 
częściach mogą przewyższać 10 1 * g/cm 3 . Wtedy prócz 
neutronów, protonów i elektronów mogą występo¬ 
wać w równowadze hiperony. W takich warunkach 
fizycznych konfiguracją o najniższej energii jest układ 
krystaliczny. Należy zauważyć, że rozważania doty¬ 
czące własności tego obszaru są dość spekulatywne. 
Nie mamy bowiem pewności, czy równanie stanu, 
za pomocą którego opisujemy własności materii przy 
tak dużych gęstościach, znamy dostatecznie dokład¬ 
nie. 

Zależnie od postaci równania stanu, a więc od tego, 
jakie procesy fizyczne uwzględnia się przy bardzo 
dużych gęstościach, otrzymuje się różne wartości 
parametrów charakteryzujących gwiazdę neutronową. 
Na ogół przyjmuje się, że masy gwiazd neutronowych 
wynoszą 0,1-2M®, a ich promienie mogą być zawarte 
pomiędzy 10 a 1000 km. Pole grawitacyjne na po¬ 
wierzchni gwiazdy neutronowej jest bardzo silne 
i konstruując modele takich gwiazd stosuje się rów¬ 
nania ogólnej teorii względności. Poprawki relaty¬ 
wistyczne mogą stanowić aż kilkanaście procent. Pod¬ 
stawowe parametry gwiazd neutronowych zestawiono 
w tabeli (masa gwiazdy neutronowej nie jest sumą mas 
wszystkich cząstek. Sumę mas wszystkich cząstek 
wchodzących w skład gwiazdy neutronowej nazywa¬ 
my jej masą właściwą). 

Gwiazdy neutronowe mogą wykonywać radialne 
drgania i początkowo przypuszczano, że właśnie one 
będą odpowiednim mechanizmem zapewniającym 
periodyczność pulsarów. Przypuszczenie to jednak 
odrzucono. Okazało się bowiem, że typowy okres 
pulsacji gwiazd neutronowych jest bardzo krótki 
i wynosi kilka milisekund. 

Maksymalna wartość prędkości kątowej, z jaką 
może się obracać gwiazda neutronowa o) kr = 
= | /Gq ~ 3000 rad/s, gdzie q — gęstość materii 
jądrowej równej 2* 10 l * g/cm 3 . Wartość ta jest znacz¬ 
nie większa od prędkości kątowej najszybszych pul¬ 
sarów; na przykład dla PSR0532 wynosi ona 190 
rad/s. 


Podstawowe parametry modeli gwiazd neutronowych 


lg gęstości 
centralnej 

Masa 
10 5 * kg 

Masa 

właściwa 

10 30 kg 

Promień 

km 

Energia 
wiązania 
10 30 kg 

15,6 

3,45 

4,69 

8,74 

1,24 

15,5 

3,44 

4,56 

9,13 

1,12 

15,4 

3,35 

4,31 

9,54 

0,96 

15,3 

3,17 

3,95 

9,92 

0,78 

15,2 

2,88 

3,46 

10,2 

0,58 

15,1 

2,48 

2,87 

10,5 

0,40 

15,0 

2,01 

2,25 

10,6 

0,25 

14,9 

1,53 

1,68 

10,7 

0,14 

14,8 

1,09 

1,16 

10,7 

0,07 

14,7 

0,73 

0,77 

11,0 

0,03 

14,6 

0,52 

0,54 

11,6 

0,02 

14,5 

0,37 

0,38 

12,5 

0,01 

14,4 

0,25 

0,25 

15,1 

0,004 

14,3 

0,14 

0,14 

47,9 

0,001 

14,2 

0,37 

0,45 

341 

0,03 

14,1 

0,95 

1,03 

401 

0,0? 

14,0 

1,10 

1,17 

349 

0,02 


własności 

gwiazd 

neutrono¬ 

wych 
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Gwiazdy neutronowe mogą mieć silne pola magne¬ 
tyczne. Oszacowanie natężeń tych pól można prze¬ 
prowadzić stosując zasadę zachowania strumienia. 
Pole magnetyczne B na powierzchni typowej gwiazdy 
wynosi kilka mikrotesli, zatem korzystając z zasady 
zachowania strumienia BR 2 — const można przy¬ 
puszczać, że pole magnetyczne na powierzchni gwiaz¬ 
dy neutronowej będzie bardzo silne, rzędu 10* T. 


Model mephanizmu zegarowego 

Zmierzono dokładnie prędkość wydłużenia się okresu 
wielu pulsarów. Stosując wzór (4) można oszacować 
straty energii rotacyjnej w czasie najdokładniej zba¬ 
danego pulsara w Mgławicy Krab. Moment bezwład¬ 
ności / gwiazd neutronowych o masach zbliżonych do 
masy Słońca szacuje się na 10 44 g/cm 2 . Podstawiając 
dane dla pulsara PSR 0532 otrzymujemy dErotldt = 
= 5-10 30 J/s = 2-10 4 L®, gdzie L® jest jasnością 
Słońca. Stąd wynika, że energia kinetyczna ruchu 
obrotowego może być źródłem energii pulsarów. 
Problem polega teraz na tym, aby energię mechanicz¬ 
ną rotacji zamienić na energię promieniowania pola 
elektromagnetycznego. 

W jednej z pierwszych prac teoretycznych, jakie 
się pojawiły na temat pulsarów, T. Gold zapropono¬ 
wał prosty model takiego mechanizmu. Według Golda 
pulsar to obracająca się gwiazda neutronowa mająca 
dipolowe pole magnetyczne. Oś obrotu gwiazdy two¬ 
rzy pewien kąt z kierunkiem dipola magnetycznego, 
dzięki czemu pole magnetyczne zmienia się periodycz¬ 
nie w czasie (rys. 15). Energię pola magnetycznego 
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promieniowanie cząstki 


Rys. 15. Model pulsara zaproponowany przez T. Golda. Kie¬ 
runek dipolowego pola magnetycznego nie pokrywa się z kie¬ 
runkiem osi obrotu. Obrót pola magnetycznego powoduje obrót 
plazmy otaczającej gwiazdę neutronową. Im dalej od osi obrotu 
z tym większymi prędkościami liniowymi poruszają się nałado¬ 
wane cząstki. Gdy prędkości ich są bliskie prędkości światła, pro¬ 
mieniują one'bardzo silnie. Promieniowanie to jest skupione 
wokół kierunku prędkości, co przy obrocie układu powoduje 
efekt impulsu 


wypromicniowaną w jednostce czasu można oszaco¬ 
wać w prosty sposób. Powinna ona mieć wymiar 
J/s; najprostszą wielkością o tym wymiarze, jaką 
można zbudować z momentu magnetycznego d , 
prędkości kątowej o> i prędkości światła w próżni c 
jest dW/ć 3 . Dokładne obliczenia prowadza do wzoru: 

dE 2 d*a>* ( 

dt 3 c 3 K} 

Podstawiając tutaj dane dla typowej gwiazdy neutro¬ 
nowej, a więc średnie natężenie pola magnetycznego 
B — 10 8 T, promień gwiazdy J? = 10* cm i (o — 
= 200 s" 1 oraz pamiętając o tym, że możemy przy¬ 
jąć d — BR 3 , otrzymamy: 

dE/dt - 2-10 31 J/s = 10 5 L®. (6) 
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Wartość ta jest zgodna z obserwowanym strumieniem 
energii wysyłanym przez pulsar z Mgławicy Krab, 
która promieniuje 4-10 30 J/s w obszarze rentgenow¬ 
skim i 2-10 29 J/s w widzialnej części widma. War¬ 
tość ta zgadza się też dobrze z oszacowanymi stra¬ 
tami energii rotacyjnej. Różnicy o czynnik 5 nie na¬ 
leży się dziwić, dokonywaliśmy bowiem jedynie 
grubszych oszacowań. 

Model obracającej się, namagnesowanej gwiazdy 
neutronowej zapewnia periodyczność oraz wyjaśnia 
pochodzenie energii promieniowania pulsarów. Istnie¬ 
je duże prawdopodobieństwo, że przestrzeń wokół 
obracającej się namagnesowanej gwiazdy neutronowej 
jest wypełniona plazmą. W pobliżu gwiazdy pole mag¬ 
netyczne będzie dostatecznie silne i plazma będzie 
się obracała wraz z gwiazdą. Jednak w pewnej odle¬ 
głości od powierzchni gwiazdy wpływ sił zewnętrznych 
zacznie dominować i plazma nie będzie już obracać 
się z gwiazdą. Dla szybko obracającej się gwiazdy 
neutronowej z silnym polem magnetycznym obszar, 
w którym plazma obracać się będzie wraz z gwiazdą, 
rozciągać się może niemal do promienia, na którym 
liniowa prędkość cząstek osiąga prędkość światła. 
Promieniowanie takiej relatywistycznej plazmy ma 
być według Golda źródłem sygnałów. Model ten na¬ 
zwano modelem latami morskiej. Wyjaśnia on w ogól¬ 
nych zarysach ideę mechanizmu promieniowania, nie 
prowadząc do żadnych szczegółowych przewidywań. 
Teraz należy jeszcze udowodnić, że namagnesowana, 
szybko rotująca gwiazda neutronowa może być oto¬ 
czona plazmą. 

Jeżeli pominąć rotację gwiazdy neutronowej i jej 
pole magnetyczne, to gęstość atmosfery gwiazdy opi¬ 
suje znany wzór barometryczny: 

e(z) = e,>e- mgzlkT . (7) 

Wysokość atmosfery H można określić jako wyso¬ 
kość, na której gęstość jest e-krotnie mniejsza, niż 
przy powierzchni (wykładnik potęgowy równy 1). 
Mamy zatem: 

H — kT/mg, ( 8 ) 

gdzie k — stała Boltzmanna, m — masa cząsteczek 
atmosfery, a g — przyspieszenie grawitacyjne. Pod¬ 
stawiając dane dla gwiazdy neutronowej T — 10® K, 
m = 3 • 10~ 24 g oraz g = GMjR 2 « 3 TO 13 cm/s 2 do 
wzoru (8) otrzymujemy H — 1 cm. Żadna gwiazda 
neutronowa nie powinna mieć atmosfery, sądzono 
więc, że jest po prostu otoczona próżnią. P. Goldreich 
i W. Julian wykazali, że tak nie jest. Rozpatrzyli oni 
prosty model obracającej się gwiazdy neutronowej 
z polem magnetycznym o dipolu ustawionym równo¬ 
legle do osi obrotu. Założyli przy tym, że zarówno ma¬ 
teria wewnątrz gwiazdy jak i atmosfera są doskona¬ 
łymi przewodnikami. Analizując własności pola elek¬ 
tromagnetycznego w otoczeniu gwiazdy neutronowej, 
a szczególnie warunki, jakie muszą być spełnione na 
granicy między atmosferą a pustą przestrzenią na 
zewnątrz, zauważyli, że gwiazda neutronowa nie może 
być otoczona przez próżnię. Pomimo, że w pobliżu 
powierzchni istnieje silne pole grawitacyjne, gwiazda 
neutronowa musi być otoczona przez obłoki zjoni- 
zowanego gazu, tworząc tzw. magnetosferę. Gaz 
tworzący magnetosferę jest zjonizowany. Zatem struk¬ 
tura magnetosfery zależy od własności pola grawita¬ 
cyjnego i pola magnetycznego wytwarzanego przez 
gwiazdę neutronową. 


Jak powstają impulsy7 

Na to pytanie do dziś nie ma zadowalającej odpo¬ 
wiedzi. Istnieje wiele konkurencyjnych teorii, ale każ¬ 
da z nich ma jeszcze słabe strony. Prawdopodobnie 
mechanizm powstawania impulsów jest złożony i wiele 
procesów fizycznych jest odpowiedzialnych za ich 
powstawanie. Zaproponowane modele, wyjaśniające 
powstawanie impulsów, wykorzystują następujące 
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procesy fizyczne: a) promieniowanie relatywistycznych 
naładowanych cząstek, b) efekty kwantowe wystę¬ 
pujące w silnych polach magnetycznych, c) laserowe 
. . promieniowanie plazmy. Można je zatem podzielić na 

p te 10 - trz y g rU py. promieniowanie relatywistycznych nała- 
I t Wa r dowan y ch cząstek jako źródło sygnałów wykorzystał 
atywisiy* j q 0 ]^j w SW oim modelu latarni morskiej. Przyjął on, 
CZ ”tk Że po ^ e ma S^etyczne obracające się wraz z gwiazdą 
najado a neutronową unosi ze sobą naładowane cząstki. 
* a owa- obszarze, gdzie prędkości liniowe cząstek są po- 
r 5 wnywa j ne z prędkością światła, a więc w odległości 
R od pulsara, takiej że c = cdR (na powierzchni tak 
zwanego cylindra świetlnego), wysyłają one silne pro¬ 
mieniowanie elektromagnetyczne skoncentrowane 
wzdłuż kierunku ruchu cząstki. Promieniowanie to 
charakteryzuje duży stopień polaryzacji (rys. 16). 
Trudności w dopasowaniu tego modelu do faktów 
obserwacyjnych są dwojakiego rodzaju. Po pierwsze, 
nie wiadomo, w jaki sposób byłaby zapewniona do¬ 
statecznie duża koncentracja cząstek w pobliżu cylin¬ 
dra świetlnego, a tym samym uzyskane odpowiednie 
natężenie promieniowania. Po drugie, model ten nie 
tłumaczy złożonej struktury sygnałów pulsarów. 



Rys. 16. Mechanizm promieniowania relatywistycznych nałado¬ 
wanych cząstek. Elektron poruszający się z bardzo dużą pręd¬ 
kością w polu magnetycznym zakreśla linię śrubową wzdłuż linii 
sił pola magnetycznego. Emitowane fale radiowe, przedstawione 
liniami falistymi, są spolaryzowane w płaszczyźnie prostopadłe 
do linii sił pola magnetycznego 
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Analizując zachowanie się plazmy w silnych polach 
magnetycznych H. Chiu i V. Canuto zauważyli, że 
promień linii śrubowej, po której zwykle porusza się 
naładowana cząstka w polu magnetycznym, nie może 
być dowolny, lecz jest skwantowany, to znaczy może 
przyjmować tylko określone wartości. Uważają oni, 
że promieniowanie pulsarów powstaje w pobliżu 
powierzchni gwiazdy neutronowej w okolicach jej 
biegunów magne.ycznych. W tych obszarach mogłyby 
powstawać silne impulsy promieniowania przy jedno¬ 
czesnym przeskoku elektronów lub protonów z jed¬ 
nej dopuszczalnej linii śrubowej na inną o mniejszym 
promieniu. Ze względu na trudności z pogodzeniem 
przewidywań tego modelu z danymi obserwacyjnymi 
był on wielokrotnie ulepszony, ale nadal nie wyjaśnia 
wielu ważnych obserwowanych własności pulsarów. 
Zgodnie z przewidywaniami tego modelu sygnały 
powstają w pobliżu powierzchni gwiazdy, ale gęsta 
plazma otaczająca gwiazdę neutronową może silnie 
zaburzyć sygnały. 

Aby zrozumieć nadzieje, jakie wiązano z możliwoś¬ 
cią laserowego promieniowania plazmy, przypomnij¬ 
my równanie opisujące transport promieniowania 
elektromagnetycznego w ośrodku materialnym. Jeżeli 
przez / oznaczamy natężenie promieniowania, wów¬ 
czas: 

dl/dx = (9) 


gdzie x — odległość mierzona wzdłuż kierunku roz¬ 
chodzenia się fali, A i B — współczynniki spontanicz¬ 
nej i wymuszonej emisji, ti — współczynnik pochła¬ 
niania. Gdy przyjmujemy, że wszystkie te wielkości 
są stałe, to rozwiązanie tego równania można zapisać 
w postaci: 

1 = -^r[l -e <fl -‘‘ ) *]+/oe <fl -‘‘>*, (10) 

IŁ — tS 


gdzie / = I(x = 0). Zauważmy, że jeżeli B ^ 0, co 
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odpowiada absorpcji, to natężenie będzie asympto¬ 
tycznie malało do wartości Aj(^-B). Jeżeli natomiast 
B > n, występuje efekt laserowy, i natężenie wzrasta 
wykładniczo. Gdyby zatem istniały takie warunki 
fizyczne, które zapewniałyby, że B > //, wówczas 
można by wyjaśnić wiele własności promieniowania 
pulsarów. Takie warunki można zapewnić jednak 
co najwyżej w pobliżu powierzchni gwiazdy i wobec 
tego napotykamy tutaj takie same trudności jak po¬ 
przednio. 

Ostatnio dużą popularnością cieszy się model za¬ 
proponowany przez M. Rudermana i P. Sutherlanda. 
Zbadali oni własności magnetosfer pulsarów i zauwa- 
.żyli, że w pobliżu biegunów magnetycznych wzdłuż 
linii sił pola magnetycznego powstaje różnica po¬ 
tencjałów uwożliwiająca kreację par elektron-pozy¬ 
ton. Elektrony i pozytony są przyspieszane do rela¬ 
tywistycznych prędkości, a następnie ulegają grupo¬ 
waniu dzięki niestabilnościom plazmy. Takie grupy 
ładunków, poruszające się po zakrzywionych liniach 
sił pola magnetycznego, emitują fale radiowe. 

Jak dotychczas nikomu nie udało się podać pełnego 
i zadowalającego modelu promieniowania pulsarów 
i zapewne nie nastąpi to szybko. Nie są też jeszcze 
dokładnie zbadane właściwości magnetosfery ota¬ 
czającej gwiazdę neutronową. Poznanie ich jest pierw¬ 
szym krokiem na długiej drodze do zrozumienia me¬ 
chanizmu promieniowania pulsarów. 

Omawiając dane obserwacyjne wspomnieliśmy 
o dziwnym zjawisku zaobserwowanym u kilku pulsa¬ 
rów, a mianowicie — o raptownej zmianie okresu. 
U niektórych pulsarów nastąpiło to już kilkakrotnie, 
przy czym okres pulsara zawsze uległ skróceniu. 
Stosując model obracającej się gwiazdy neutronowej 
F. Dyson podał bardzo przekonujące wyjaśnienie. 
Przypomnijmy, że w gwieździe neutronowej można 
wyróżnić trzy obszary — powłokę, ciekły obszar 
pośredni i krystaliczne jądro. Choć ciecz wypełniająca 
obszar pośredni znajduje się w stanie nadciekłym, to 
jednak warstwa cieczy granicząca z powłoką obraca 
się z taką samą prędkością kątową co i powłoka. 
Kiedy w wyniku straty energii rotacyjnej gwiazda 
zaczyna się obracać wolniej, maleje też wartość siły 
odśrodkowej i powierzchnia swobodna cieczy przyj¬ 
muje nowy, bardziej sferyczny kształt. W płaszczyźnie 
równikowej pomiędzy powłoką a powierzchnią swo¬ 
bodną cieczy wytwarza się próżnia. Narastają również 
naprężenia w powłoce. W końcu struktura krystalicz¬ 
na powłoki nie może zrównoważyć naprężeń, pęka 
i przyjmuje nowy kształt, pokrywający się z powierz¬ 
chnią swobodną cieczy. W czasie tego procesu maleje 
moment bezwładności. Zgodnie jednak z zasadą za¬ 
chowania momentu pędu iloczyn momentu bezwład¬ 
ności i prędkości kątowej powinien być stały, a więc 
prędkość kątowa wzrasta, co odpowiadałoby gwał¬ 
townemu skróceniu okresu impulsu. Korzystając 
z tego modelu można przewidzieć, kiedy nastąpi ko¬ 
lejny taki wstrząs. Przewidywania są w zasadzie zgod¬ 
ne z obserwacjami. 


Pulsary rentgenowskie 

Bardzo interesującą grupą pulsarów są pulsary rent¬ 
genowskie. Satelita UHURU, który okrążał Ziemię 
(-*■ Astronomia promieni X i y), dostarczył wiele in¬ 
formacji o źródłach promieniowania rentgenowskiego. 
Niektóre z nich okazały się źródłami pulsującymi. 
Ich natężenie zmienia się o czynnik dwa lub więcej 
z okresem krótszym od kilku sekund. Widmo energii 
jest płaskie i występują obcięcia od strony niskich 
energii. Kilka z tych źródeł udało się zindetyfikować 
z układami gwiazd podwójnych. 

Najdokładniej zbadanymi pulsującymi źródłami 
rentgenowskimi są Cyg X-2, Cen X-3 i Her X-l. Ener¬ 
gia wypromieniowywana w jednostce czasu przez te 
źródła jest zawarta pomiędzy 1Q 2 M0 31 J/s, czyli 
pomiędzy 10 2 -10 5 L© i jest tak duża, że trudno przy- 


model 
Rudermana 
i Sutherlanda 


mechanizm 

zmian 

okresu 





puszczać, aby ich źródłem mogły być reakcje jądrowe. 
Słońce na przykład wysyła mniej niż 10 _< całkowitej 
wypromieniowywanej energii w rentgenowskim ob- 
model szarze widma. 

pulsara Dane obserwacyjne wskazują na to, że pulsary 
rentgenów- rentgenowskie są układami gwiazd podwójnych, 
skiego Model takiego pulsara powinien wyjaśniać, skąd sję 
biorą znaczne ilości energii wypromieniowywane przez 
te obiekty. Obecnie powszechnie przyjęty jest nastę¬ 
pujący model takiego pulsara. Gwiazda neutronowa 
lub czarna dziura wchodzi w skład układu podwój¬ 
nego ze zwykłą gwiazdą ciągu głównego lub czerwo¬ 
nym olbrzymem (rys. 17). Część materii ze zwykłej 
gwiazdy przepływa i zostaje wychwytywana przez 
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Rys. 17. Gwiazda neutronowa w układzie podwójnym. Materia 
przepływa od zwykłej gwiazdy ku gwieżdzie neutronowej. W sil¬ 
nym polu grawitacyjnym gwiazdy neutronowej cząstki są przy¬ 
spieszane do bardzo dużychr prędkości. W wyniku zderzeń ule¬ 
gają jonizacji i gdy osiągają prędkości zbliżone do prędkości 
światła wysyłają promieniowanie rentgenowskie 


gwiazdę neutronową lub czarną dziurę. Ten proces 
wychwytu nazwano akrecją. Przyspieszona do znacz¬ 
nych prędkości materia przyciągana przez gwiazdę 
neutronową lub czarną dziurę wypromieniowuje 
znaczne ilości energii. Natężenie promieniowania 
będzie takie jak obserwowane, jeżeli strumień masy 
spadającej na gwiazdę neutronową w ciągu roku 
wynosi ok. 10~ u masy Słońca. Strumień ten może być 
jeszcze mniejszy w przypadku czarnej dziury. Przewi¬ 
dywania tego modelu jak dotychczas są zgodne z da¬ 
nymi obserwacyjnymi. 


Astrofizyczne znaczenie pulsarów 

Odkrycie pulsarów miało ogromne znaczenie przede 
wszystkim jako ostateczny argument świadczący 
o istnieniu gwiazd neutronowych. Teoria ostatnich 
faz ewolucji gwiazd uzyskała pierwsze obserwacyjne 
potwierdzenie. Rozważania dotyczące procesów pro¬ 
wadzących do powstania gwiazd neutronowych są 
dzięki temu jednym z głównych zagadnień astrofizyki. 


Bardzo ważne są badania struktury gwiazd neutrono¬ 
wych i procesów fizycznych w pobliżu ich powierzchni, 
choć nadal fascynującym jest problem mechanizmu 
promieniowania pulsarów, który nie znalazł dotych¬ 
czas zadowalającego rozwiązania. Dzięki odkryciu 
pulsarów zaczęto badać własności plazmy w silnych 
polach magnetycznych, własności pola magnetycz¬ 
nego wokół rotującej namagnesowanej gwiazdy neu¬ 
tronowej i procesy fizyczne zachodzące w pobliżu 
cylindra świetlnego. 

Za pomocą pulsarów można dokonywać nowych 
obserwacji dostarczających informacji o stanie i włas¬ 
nościach materii międzygwiezdnej. Porównując kształt 
impulsu dla różnych częstości można otrzymać infor¬ 
macje o rozkładzie elektronów wzdłuż promienia 
widzenia. W ten sposób oceniono rozmiary obszarów 
turbulentnych w kilku obłokach gazu międzygwiezd¬ 
nego. Wysuwane są propozycje pomiaru koncentracji 
cząsteczek i rodników, takich jak H*, SH, OH i CH, 
występujących w materii międzygwiezdnej, przez po¬ 
wiązanie jej z czasem przybycia tego samego sygnału 
na różnych częstościach, czyli z dyspersją. Mierząc 
różnicę czasów przybycia sygnału na różnych 
częstościach można obliczyć średnią ilość elektronów, 
jaką napotkał on na swej drodze. Z pomiarów radio¬ 
wych można też wyznaczyć koncentrację wodoru 
w tych samych obszarach. Znając te dwie wielkości 
łatwo już wyznaczyć stopień jonizacji, a tym samym 
temperaturę gazu międzygwiezdnego. Zawiera się ona 
pomiędzy 10 3 a 10 4 K. 

Wkrótce po odkryciu pulsarów stwierdzono, że 
mierząc kąt polaryzacji sygnału na różnych częstoś¬ 
ciach można wyznaczyć średnią wartość pola mag¬ 
netycznego wzdłuż promienia widzenia. Okazało się, 
że w przestrzeni międzygwiezdnej istnieje niemal jed¬ 
norodne pole magnetyczne o natężeniu 3 10 -10 T. 

Pulsary mogą być również źródłem promieniowania 
kosmicznego. Obecnie trudno jeszcze mierzyć anizo¬ 
tropię tego promieniowania. Promieniowanie kos¬ 
miczne jest bowiem bardzo silnie zaburzone przez pole 
magnetyczne Ziemi. Na dokładne dane obserwacyjne 
trzeba będzie zatem jeszcze poczekać, a tymczasem 
pulsary można traktować jako gigantyczne akcelera¬ 
tory zapełniające przestrzeń międzygwiezdną wyso¬ 
koenergetycznymi cząstkami promieniowania ko¬ 
smicznego. 

Odkryte niedawno pulsary, wchodzące w skład 
układów podwójnych, mogą dostarczyć wielu infor¬ 
macji o ewolucji takich układów. Za ich pomocą 
można też będzie sprawdzić przewidywania ogólnej 
teorii względności. 

M. Demiański Astrofizyka relatywistyczna , Warszawa 1978; 
A. Hewish Pulsars , Ann. Rev. of Astr. and Astrophys., Pało Alto 
1970; J. P. Lasota Magnciosfery pulsarów , Post. Astr. 24. 173 
(1976); Pulsating Stars — a Naturę Reprints, London 1969; M. 
Ruderman* Pulsars: Structure and Dynamics, Ann. Rev. of Astr. 
and Astrophys., Pało Alto 1972. 


Czarne dziury i zapadanie 
grawitacyjne 

Marek Demiański 


Ciała, które nas otaczają, zawdzięczają swoje wła¬ 
sności oddziaływaniom elektrycznym między ele¬ 
mentarnymi składnikami—elektronami, jądrami, a- 
tomami i cząsteczkami. Siły grawitacyjne, które zgod¬ 
nie z prawem powszechnego ciążenia są siłami przy¬ 
ciągającymi, można w odniesieniu do ciał o małej 
masie całkowicie pominąć. Dają one o sobie znać do¬ 
piero wówczas, gdy masy ciał są odpowiednio duże. 
Sił grawitacyjnych nie można pominąć, jeżeli chce się 
wyjaśnić strukturę ciał niebieskich. Ziemia, planety, 
Słońce i pozostałe gwiazdy mają kształt zbliżony 


do kuli dzięki równowadze pomiędzy siłami grawita¬ 
cyjnymi starającymi się ścisnąć te ciała i siłami 
ciśnienia wewnętrznego przeciwdziałającymi ściska¬ 
niu. Ciśnienie wewnętrzne może być wywołane naprę¬ 
żeniami w ciele stałym, może to być ciśnienie cieczy, 
jak w przypadku Ziemi i innych planet, lub ciśnienie 
plazmy — w przypadku gwiazd. Temperatury i gęstoś¬ 
ci panujące we wnętrzach gwiazd są bowiem tak duże, 
że atomy są częściowo lub całkowicie zjonizowane 
i tworzą plazmę — mieszaninę dodatnio i ujemnie 
naładowanych cząstek. W niektórych typach gwiazd 
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Ostatnie fazy ewolucji gwiazd 

Kolejne stadia ewolucji gwiazdy zależą od jej masy. 
Dla gwiazd o masach mniejszych od 1,4 masy Słoń¬ 
ca gęstość w centrum wzrasta na tyle, że elektrony 
zostają oderwane od atomów i tworzą gaz elektro¬ 
nowy. Siła grawitacyjna jest wówczas równoważona 
przez ciśnienie gazu elektronowego. Ciśnienie to 
nie jest wynikiem zderzeń między cząsteczkami, ale 
tzw. zakazu Pauliego, według którego dwa elektrony 
nie mogą się znajdować w takim samym stanie kwan¬ 
towym. W miarę ściskania ciśnienie gazu elektrono¬ 
wego rośnie znacznie szybciej niż ciśnienie plazmy, 
natomiast temperatura gazu prawie nie ulega zmia- 
biale nie. Gwiazda w takim stadium, zwana białym kar- 
karty łem, stygnąc nie kurczy się, gdyż wraz z obniżeniem 
się temperatury nie zmniejsza się ciśnienie. 

Dla gwiazd o masach większych od 1,4 masy Słoń¬ 
ca ciśnienie gazu elektronowego nie wystarcza, aby 
zahamować proces kurczenia. Możliwe są tu trzy 
warianty ewolucji, które zależą od masy gwiazdy i jej 
układu chemicznego: a) gwiazda zostaje całkowicie 
rozerwana przez potężny wybuch wywołany gwałtow¬ 
nym wydzieleniem energii przy spalaniu cięższych 
pierwiastków np. tlenu, b) gwiazda przechodzi przez 
stadium supernowej (rys. 1). Zewnętrzne części wraz 
z otoczką zostają odrzucone, a bardzo gęste i gorące 
jądro podlega dalszej ewolucji, c) gwiazda katastro¬ 
ficznie się kurczy, gęstość materii w centrum wzrasta 
na tyle, że do dalszego opisu procesu kurczenia trzeba 
stosować relatywistyczną teorię grawitacji. W dal¬ 
szym ciągu zajmiemy się przypadkami b) i c). 

Jeżeli masa gorącego i bardzo gęstego jądra po¬ 
zostającego po wybuchu supernowej nie przekracza 
krytycznej wartości, która zawiera się w granicach 
od 1,6 do 3 mas Słońca, to proces dalszego kurczenia 
się zostaje zatrzymany przez ciśnienie gazu neutro¬ 
nowego (cieczy neutronowej). Należy dokładniej 
wyjaśnić, w jaki sposób we wnętrzu gwiazdy powstają 
swobodne neutrony. Proces syntezy termojądrowej 
prowadzi do powstania ciężkich jąder o liczbach 
atomowych zbliżonych do żelaza. Przy dalszym ści¬ 
skaniu takiego układu z energetycznego punktu wi¬ 
dzenia korzystny jest wychwyt jednego elektronu przez 
jądro i utworzenie neutronu z elektronu i protonu. 
Powstające w ten sposób jądra są w normalnych wa¬ 
runkach nietrwałe ze względu na rozpad & jednak 
przy bardzo dużych gęstościach (10 9 g/cm 3 ) nie roz¬ 
padają się, gdyż poziomy energetyczne, które mogłyby 
zająć elektrony emitowane przy rozpadzie /?, są już 
zajęte. Przy jeszcze większych gęstościach (3 -10 11 


Rys. 1. Wybuch supernowej. Początkowo gwiazda rozbłyskuje 
(rys. a). Po kilku dniach na zdjęciach o krótkim czasie naświe¬ 
tlania nie jest już widoczna (rys. b), natomiast na zdjęciach o dłu¬ 
gim czasie naświetlania pojawia się rozszerzająca się otoczka 
(rys. c) 

i coraz mniejszej energii wiązania, a w końcu jądra 
rozpadają się na swobodne protony i neutrony. W re¬ 
zultacie materia w centralnych częściach gwiazdy 
składa się z elektronów, protonów i neutronów, przy 
czym główny wkład do ciśnienia pochodzi od neutro¬ 
nów. Takie gwiazdy nazwano gwiazdami neutrono- gwiazdy 
wymi. Podobnie jak białe karły gwiazdy neutronowe neutronowa 
mogą stygnąć nie ulegając już dalszemu kurczeniu się. 

Jeżeli masa jądra gwiazdy po wybuchu supernowej 
przekracza 3 masy Słońca lub gdy masywna gwiazda 
kurczy się katastroficznie, to gęstości w centrum 
wzrastają na tyle, że do opisu dalszego procesu kurcze¬ 
nia należy stosować ogólną teorię względności. Aby 
wyjaśnić, jakich efektów można wówczas oczekiwać, 
porównamy warunki równowagi sferycznych gwiazd 
wg teorii grawitacji Newtona i ogólnej teorii względ¬ 
ności. 

Według Newtona sferyczna gwiazda pozostaje warunki 
w równowadze, jeżeli w każdym punkcie wewnątrz równowagi 
gwiazdy siła grawitacyjna jest równoważona przez gwiazdy 
siły ciśnienia, czyli spełnione jest równanie 

dpi dr = — [Gm(r)lr 2 ]o, 

T 

gdzie m(r) — 4 k f Q(r)r z dr. Relatywistyczne równanie 

, o 

równowagi, które ma postać 

dp = __ G[m(r)+ 4 rc (p/c 2 )r 3 ] (o+/>/c 2 ) 


dr 


istotną rolę odgrywa też ciśnienie promieniowania 
wywołane strumieniami termicznych fotonów prze¬ 
nikających z centralnych części gwiazdy ku po¬ 
wierzchni. Planety nie mają wewnętrznych źródeł 
energii i ich struktura nie ulega zmianie od chwili 
ich uformowania. Gwiazdy natomiast promieniują 
w otacźającą przestrzeń ogromne ilości energii i trwa¬ 
ją przez bardzo długi czas w nie zmienionym stanie 
dzięki temu, że w ich centralnych częściach prze¬ 
biegają termojądrowe reakcje spalania wodoru i helu, 
które uzupełniają wypromieniowaną energię (-* Ewo¬ 
lucja gwiazd). Co się dzieje z gwiazdą, która wyczer- 
gwiazde po pała cały zapas wodoru i helu? Zachwiany jest wów- 
wypaleniu czas jej bilans energii: energia wypromieniowana 
H i Ho 2 powierzchni nie jest uzupełniana i gwiazda zaczyna 
stygnąć. Temperatura, a więc i ciśnienie we wnętrzu 
gwiazdy zmniejsza się, co powoduje jej kurczenie 
się wywołujące z kolei wzrost temperatury, ciśnienia 
i gęstości w centrum. Tak więc gwiazda kurcząc się za¬ 
mienia grawitacyjną energię potencjalną na energię 
cieplną. Ciśnienie plazmy nie narasta wystarczająco 
szybko na to, aby przeciwdziałać kurczeniu się. 
Powolne kurczenie się może zostać powstrzymane 
przez odpowiednio szybki przyrost ciśnienia w cen¬ 
trum gwiazdy w wyniku jakiegoś innego procesu. 


g/cm 3 ) energia wiązania kolejnego neutronu maleje do 
zera i zostaje on oderwany od jądra. Powstają w ten 
sposób jądra o coraz mniejszej zawartości neutronów 
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zawiera poprawki związane ze zmianą własności geo¬ 
metrycznych przestrzeni w obszarach, w których gęs¬ 
tość materii jest bardzo duża, oraz z wkładem do 
gęstości energii pochodzącym od energii wzajemnego 
oddziaływania między elementarnymi składnikami 
materii (jeśli przyjmiemy, że c —*■ oo, to relatywistycz¬ 
ne równanie równowagi przechodzi w równanie 
nierelatywistyczne). Porównując te dwa równania wi¬ 
dzimy, że w równaniu relatywistycznym ciśnienie wy¬ 
stępuje również po prawej stronie, a w mianowniku 
pojawił się dodatkowy czynnik 1 — (2 Gm(r)lc 2 r). Z re¬ 
latywistycznego równania równowagi wynika, że 
ciśnienie odpowiadające stanowi równowagi gęstej 
gwiazdy jest w każdym punkcie wyższe niż powinno 
być wg teorii Newtona. Efekt ten nazywa się samo- 
wzmacnianiem się ciśnienia, bowiem im większe jest 
ciśnienie, tym większy powinien być gradient ciśnienia 
{dpjdr) y aby utrzymać gwiazdę w równowadze. 

Na to, aby znaleźć strukturę gwiazdy w równo¬ 
wadze posługując się czy to teorią względności, czy 
teorią Newtona, należy znać równanie stanu (rys. 2). 
Dla gęstości mniejszych od gęstości materii jądrowej 
(2,45 10 14 g/cm 3 ) równanie stanu znane jest dość do¬ 
kładnie, natomiast przy wyższych gęstościach stosuje 
się różne przybliżenia, wynikające z konieczności o- 
pisania słabo jeszcze zbadanych oddziaływań między 
hadronami, tak że zależnie od stosowanej metody przy¬ 



gęstość 


10 2 °r 

g/cm 3 




******* 





0,5 


1.0 


M/M© 


10 10 2 10 4 10 6 10 8 10 10 10 12 10 14 10 16 10 18 10 2 ° 10 22 

g/cm 3 

Rys. 2. Równanie stanu (zależność ciśnienia od gęstości) gęstej 
materii zaproponowane przez Harrisona i J. Wheclera 


Rys. 3. Zależność między masą układu M mierzoną w jednostkach 
masy Słońca M <•> a gęstością centralną p e dła gęstej, chłodnej ma¬ 
terii spełniającej równanie stanu Harrisona-Wheelera. Pierwsza 
część krzywej poczynając od początku układu współrzędnych aż 
do punktu a opisuje stabilne gwiazdy — białe karły i planety. 

Punkt a odpowiada maksymalnej masie białych karłów 
Część krzywej między punktami a i b opisuje niestabilne konfigu¬ 
racje. Między punktami b i c położone są stabilne gwiazdy neu¬ 
tronowe. Punkt c odpowiada maksymalnej masie gwiazdy neu¬ 
tronowej zbudowanej z materii spełniającej równanie stanu Har¬ 
risona-Wheelera. Powyżej punktu c nie ma już stabilnych kon¬ 
figuracji 

nia w centrum. Proces katastroficznego kurczenia się grawitacyjne 
pod wpływem niezrównoważonych sił grawitacyjnych zapadanie 
. nazywamy grawitacyjnym zapadaniem. 


Czarne dziury 

Stosując prawa grawitacji Newtona i pamiętając 
o tym, że prędkość światła jest maksymalną pręd¬ 
kością, z jaką może się poruszać cząstka, łatwo 
można przewidzieć, że z nieograniczenie kurczącą się 
gwiazdą dzieją się dziwne rzeczy. Z zasady zachowania 
energii wynika, że aby cząstkę oderwać od powierz¬ 
chni ciała o masie M i promieniu R i oddalić do nie¬ 
skończoności, trzeba jej nadać prędkość nie mniejszą 


,/2 GM 

y—* 
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bliżeń otrzymuje się różne wyniki. Badając konfigura¬ 
cje gęstej materii trzeba się zatem ograniczyć do 
pewnych prostych równań stanu opisujących własnoś¬ 
ci układów cząstek poruszających się z prędkościami 
zbliżonymi do prędkości światła. Pomocne są tu o- 
graniczenia nakładane przez teorię względności; gę¬ 
stość masy powinna być dodatnia, a prędkość dźwięku 
nie może być większa od prędkości światła. Przyjmu¬ 
jąc zależność między ciśnieniem i gęstością postaci: 

P = (y- 

o y należy założyć, iż 1 < y < 2. Dla układu nie- 
oddziałujących cząstek poruszających się z prędkością 
światła y — 4 / 3 . 

Korzystając z tej ogólnej postaci równania stanu 
otrzymano wiele istotnych wniosków dotyczących sta¬ 
bilności bardzo gęstych konfiguracji. Okazało się, 
niezależnie od wartości y, że jeżeli gęstość masy 
w centrum gwiazdy przewyższa 10 17 g/cm 3 , to układ nie 
może się znajdować w stanie stabilnej równowagi 
(rys. 3). Taka gwiazda kurczy się nieograniczenie 
pod wpływem sił grawitacyjnych i tego procesu nie 
może zahamować nawet bardzo szybki wzrost ciśnie- 


zwaną prędkością ucieczki. Jeżeli nie zmieniając masy 
ciała będziemy je ściskali zmniejszając jego promień, 
to wówczas gdy osiągnie on wartość 

„ 2 GM 

R - r « —• 

prędkość ucieczki staje się równa prędkości światła. 

Z powierzchni sferycznego ciała, którego masa i pro¬ 
mień spełniają ten związek, nie można wysłać do 
nieskończoności żadnej cząstki. Charakterystyczny 
promień r Q nazywamy promieniem Schwarzschilda lub promień 
promieniem grawitacyjnym ciała. Dla zwykłych ciał, Schwarz- 
cząstek elementarnych, planet i gwiazd ich promie- schilda 
nie są znacznie większe od promienia Schwarzschilda 
i tak np. promień grawitacyjny Ziemi wynosi 1 cm. 

Słońca 2,95 km, natomiast promień Schwarzschilda 
naszej Galaktyki — ok. 5 10|° km, czyli jest zaledwie 
350 razy większy od średniej odległości Ziemi od 
Słońca. 

W ogólnej teorii względności na promień Schwarz¬ 
schilda otrzymujemy taki sam wzór. W tym wypadku 
jednak proces kurczenia się gwiazdy z punktu widze¬ 
nia dalekiego spoczywającego obserwatora, którego 
dalej będziemy nazywać obserwatorem w nieskończo- 
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ności, wygląda inaczej niż w teorii Newtona. Aby wy¬ 
jaśnić te różnice, wyobraźmy sobie następujący ekspe¬ 
ryment: z bardzo daleka wysyłamy radialnie w kierun¬ 
ku gwiazdy cząstkę próbną. Z jego punktu widzenia 
w ciągu czasu At cząstka przemieści się o Ar, Inny 
spoczywający obserwator, którego cząstka właśnie 
mija powie, że na jego zegarze odstępowi czasu At 
odpowiada okres czasu j/l -r a /rAt (co wynika z wła¬ 
sności sferycznie symetrycznego pola grawitacyjnego 
w ogólnej teorii względn ości) i w tym czasie cząstka 
przebywa odległość Ar /j/1 —rgjr, W obu tych wzorach 
{V *o promień grawitacyjny gwiazdy. Zatem spoczywa¬ 
jący obserwator, którego cząstka właśnie mija, przy¬ 
pisze jej prędkość 

1 

Vr = -:—‘ V„ 


1 -r g (r 

gdzie v ao —- prędkość cząstki mierzona przez obser¬ 
watora w nieskończoności. Prędkość v r można wyzna¬ 
czyć z zasady zachowania energii, która dla radial¬ 
nego ruchu cząstki w sferycznym polu grawitacyjnym 
przyjmuje postać 

F _ _ 

r 1 ~ r ffl r = const. 


Jeżeli w chwili początkowej cząstka spoczywa w od¬ 
ległości r 0 od centrum, to 


V 1 -r,fr /|/1 = j/l -r e lr 0 , 

skąd ostatecznie mamy 


v r 
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Cząstka spadająca radialnie na zwykłą gwiazdę zosta¬ 
nie przyspieszona do bardzo dużych prędkości, ale 
mniejszych od prędkości światła, gdyż otrzymany wy¬ 
żej związek obowiązuje tylko dla r > R (R — po¬ 
wierzchnia gwiazdy), przy tym R > r g . Natomiast gdy 
gwiazda kurczy się i jej powierzchnia zbliża się do 
powierzchni Schwarzschilda, to w granicy dla cząs¬ 
tki znajdującej się na powierzchni r r g , v r -► c. 

Daleki obserwator przypisze tej samej cząstce 
prędkość v ao równą 

1 -r g jr 

'Cf 


AUbc * 1 own^ 

> = 0 ~r,lr)v r = (1 -r„lr) j/1 - -Iz 




a więc z jego punktu widzenia prędkość cząstki zbli¬ 
żającej się do powierzchni Schwarzschilda maleje 
1 u 8d i y f r °* to v 0. Co więcej, jeżeli dokładnie 
zbadać ruch cząstki z punktu widzenia obserwatora 
w nieskończoności, to okazuje się, że cząstka zbliży 
się do powierzchni Schwarzschilda dopiero po nie¬ 
skończonym czasie. Efekt ten jest związany ze zwol¬ 
nieniem tempa biegu zegarów w polu grawitacyjnym. 

Jak przebiega sferyczne zapadanie gwiazdy z punktu 
widzenia obserwatora znajdującego się na jej po¬ 
wierzchni? Moment przenikania przez powierzchnię 
Schwarzschilda nie jest dla niego niczym wyróżniony 
(rys. 4). Po przekroczeniu powierzchni Schwarzschil¬ 
da gwiazda nadal się kurczy, aż do chwili, kiedy skur¬ 
czy się do punktu, przy tym gęstość materii rośnie do 
nieskończoności. Taki punkt nazywamy osobliwością. 

Wspominaliśmy już o tym, że dla gwiazd, planet 
i innych ciał niebieskich promień Schwarzschilda jest 
bardzo mały i gdyby je skurczyć do rozmiarów po¬ 
równywalnych z ich promieniem Schwarzschilda, to 
gęstość materii wzrosłaby znacznie powyżej gęstości 
materii jądrowej (~ 10 14 g/cm 3 ). Istotnie, gdyby 
Ziemię skurczyć do rozmiarów promienia Schwarz¬ 
schilda, to średnia gęstość wynosiłaby pk. 10 2tt g/cm 3 , 
a dla Słońca byłaby równa I0 22 g/cm 3 . Własności ma¬ 
tem o takiej dużej gęstości nie są znane. Nie jest to 
jednak ogólna prawidłowość. Ciała o bardzo dużej 
masie mogą osiągać rozmiary porównywalne z pro¬ 
mieniem Schwarzschilda, przy średniej gęstości bardzo 
małej, np. dla naszej Galaktyki wynosi ona zaledwie 
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10“ 4 g/cm 3 , czyli jest mniejsza od gęstości powietrza. 
Z oszacowań tych wynika, że ciała o rozmiarach 
zbliżonych do swego promienia Schwarzschilda mogą 
być zbudowane z materii, której własności znamy 
bardzo dobrze. 



Rys. 4. Grawitacyjne zapadanie sferycznie symetryczne! gwiazdy. 
Linie r “ const są liniami, po których poruszają się sygnały świetlne 
skierowane ku centrum. Sygnał wysłany z powierzchni gwiazdy 
po niedługim czasie dotrze do obserwatora znajdującego się w ra¬ 
kiecie poruszającej się ku centrum, ale dopiero po bardzo długim 
czasie dotrze do obserwatora znajdującego się w rakiecie w stałej 
odległości od centrum. Im bliżej powierzchni Schwarzschilda zo¬ 
stanie wysłany sygnał, tym dłużej będzie on biegł do obserwatora 
znajdującego się w stałej odległości od centrum. W obszarze r<r 9 
stożki świetlne są nachylone tak, że żaden sygnał nie może się wy¬ 
dostać z tego obszaru do dalekiego obserwatora 


Czy można zatrzymać proces grawitacyjnego zapa¬ 
dania? Okazuje się, że jeśli gwiazda przeniknie poza 
swój promień grawitacyjny, to procesu katastroficz¬ 
nego kurczenia zatrzymać już nie można. Ilustruje 
to rys. 5, na którym przedstawiono zapadającą się 
gwiazdę. Od momentu gdy powierzchnia gwiazdy 
przekroczy powierzchnię Schwarzschilda, wszystkie 
sygnały, nawet sygnały świetlne wysyłane radialnie na 
zewnątrz, są przyciągane przez silne pola grawitacyj¬ 
ne i zamiast oddalać się do nieskończoności, zbiegają 
ku centrum. Powierzchnia Schwarzschilda odgrywa 
teraz rolę półprzepuszczającej membrany, przez którą 
cząstki i sygnały niosące informację mogą przenikać 
do środka, ale nie mogą wydostawać się przez nią na 
zewnątrz. Taką powierzchnię nazywamy horyzontem. 
Pole grawitacyjne pod horyzontem nie jest polem 
statycznym. W tym obszarze żaden obserwator nie 
może spoczywać i niezależnie od tego czy porusza się 
swobodnie, czy też znajduje się w rakiecie zaopatrzo¬ 


no wierzchnia 
horyzontu 

























horyzont r m r g 



Rys. 5. Czasoprzestrzen¬ 
ny obraz grawitacyjne¬ 
go zapadania gwiazdy. 
Sygnały świetlne roz¬ 
chodzą się po prostych 
nachylonych pod kątem 
45° do osi czasu. Linią 
falistą zaznaczono syg¬ 
nały świetlne wysyłane 
z powierzchni gwiazdy 
radialnie na zewnątrz. 
Gdy promień gwiazdy 
jest większy od r ff , syg¬ 
nały świetlne wysyłane 
z jej powierzchni docie¬ 
rają do dalekiego ob¬ 
serwatora, natomiast 
gdy promień gwiazdy 
jest mniejszy od r*, 
wszystkie sygnały zbie¬ 
gają do centralnej osob¬ 
liwości 


czarna nej w potężne silniki, po skończonym czasie zosta- 
dziura nie przyciągnięty ku centrum, ku osobliwości. Taki 
niezwykły obiekt ograniczony zamkniętym, regular¬ 
nym horyzontem nazywamy czarną dziurą. 

Obraz, jaki przedstawiliśmy wyżej, dotyczył obiek¬ 
tu sferycznie symetrycznego. Obserwowane gwiazdy 
nie są dokładnie sferycznie symetryczne, przeważnie 
obracają się i mają, czasem nawet silne pola magne¬ 
tyczne. Jak te dodatkowe czynniki wpływają na proces 
zapadania? Dokładnie można zbadać tylko sytuację, 
gdy odchylenia od sferycznej symetrii nie są duże 
(rys. 6). Wtedy, jak to pierwsi pokazali J. Zeldowicz, 
I. Nowikow i A. Doroszkiewicz, małe początkowe 
zaburzenia narastają w czasie zapadania, ale są 
jeszcze skończone w momencie przekraczania po¬ 
wierzchni Schwarzschilda. Dla dalekiego obserwato- 


powinny przebiegać w następujący sposób: gwiaz¬ 
da, która wyczerpała zapas paliwa jądrowego, za¬ 
czyna kurczyć się, co powoduje ściskanie w jej 
centrum elektronów i fotonów. Przy dużych gęstoś¬ 
ciach elektrony i fotony zaczynają intensywnie od¬ 
działywać z jądrami powodując ich rozpad. Maleje 
przy tym liczba elektronów i fotonów, które są 
głównym źródłem ciśnienia, co prowadzi do powsta¬ 
nia niestabilności. W ciągu ułamka sekundy rozpoczy¬ 
na się proces gwałtownego zapadania. Centralne 
części gwiazdy zapadają się pociągając za sobą zew¬ 
nętrzne warstwy. Z punktu widzenia dalekiego ob¬ 
serwatora powierzchnia gwiazdy zbliża się do po¬ 
wierzchni Schwarzschilda, przy czym w miarę prey- 
bliżania się do niej prędkość zapadania maleje i gwiaz¬ 
da jak gdyby zastyga, gdy osiągnie rozmiary swego 
promienia grawitacyjnego. Współporuszający się 
obserwator powie natomiast, że zapadająca się gwiaz¬ 
da przenika przez powierzchnię Schwarzschilda i na¬ 
stępnie bardzo szybko powstaje osobliwość — obszar, 
w którym gęstość materii i siły grawitacyjne są nie¬ 
skończenie wielkie. Proces zapadania można podzielić 
na cztery etapy: powstanie niestabilności, zapadanie 
się, powstanie horyzontu i powstanie osobliwości, 
której jednak nie może widzieć daleki obserwator. 

Zapadanie grawitacyjne jest końcowym etapem 
ewolucji gwiazd o masach większych od kilku mas 
Słońca. Sądzi się, że pewne etapy ewolucji galaktyk 
zachodzą też przez grawitacyjne zapadanie. 

Czy można obserwować proces grawitacyjnego za- możliwość 
padania? Aby odpowiedzieć na to pytanie, trzeba zna- obserwacji 
leźć asymptotyczne wyrażenie na zależność promie- zapadania 
nia oraz całkowitej jasności gwiazdy od czasu ob¬ 
serwacji t 0 . Różnica między czasem obserwacji f<> 
a czasem wysłania sygnału / będzie równa czasowi 
potrzebnemu na przebycie sygnału świetlnego od 
punktu emisji r(/) (powierzchnia gwiazdy) do punktu 
obserwacji. Biorąc to pod uwagę otrzymujemy 


/ 



ra asymetryczne składowe pola grawitacyjnego wy¬ 
twarzanego przez zapadające się ciało znikają w cza¬ 
sie i pole grawitacyjne asymptotycznie nie zależy od 
czasu. Stwierdzono też, że gwiazda obracająca się 
niezbyt szybko, wytwarzająca słabe pole magnetycz¬ 
ne, też może ulegać procesowi zapadania. 

Interesujące jest pytanie, czy każdy proces gra¬ 
witacyjnego zapadania prowadzi do powstania hory¬ 
zontu, a więc czy z każdej zapadającej się gwiazdy 
powstanie czarna dziura. Niestety, nie ma na nie 
zadowalającej odpowiedzi. Wszystkie dotychczasowe 
próby podania przykładu takiej realistycznej sytu¬ 
acji, w której w procesie zapadania nie powstaje 
horyzont, skończyły się niepowodzeniem. Na tej pod- 
hmoteza stawie R. Penrose wprowadził „hipotezę kosmicznego 
kosmicznego cenzora”, według której każdy realistyczny proces 
cenzora" zapadania prowadzi do powstania horyzontu. 

Ostatnie etapy ewolucji gwiazd o dostatecznie dużej 
masie (przypuszczalnie większej od 1,4 masy Słońca) 


r(/ 0 ) = r g +(f*i —r ff )e~ c ( t o-*£>/ 2r fl>, 

gdzie r-j = r(f'), a t' 0 -*-cms odpowiadający momen¬ 
towi rozpoczęcia się procesu zapadania. Związek ten 
można uważać za równanie ruchu powierzchni gwiaz¬ 
dy widzialnej przez dalekiego obserwatora. Wynika 
z niego, że powierzchnia gwiazdy z punktu widzenia 
dalekiego obserwatora dopiero po nieskończonym 
czasie / 0 -> oo osiągnie powierzchnię Schwarzschilda 
i powstanie wówczas horyzont. Czas, po jakim odleg¬ 
łość r zmniejszy się o e ss 2,7, równy odwrotności 
współczynnika przy 2r^/c, jest bardzo krótki i rozmia¬ 
ry gwiazdy stają się porównywalne z jej promieniem 
grawitacyjnym już po upływie setnych części sekundy 
od momentu rozpoczęcia procesu zapadania. Równie 
szybko zanika całkowita jasność gwiazdy, spełniona 
jest bowiem zależność 

L(/ 0 ) = LiOe-nito-KWzrg. 

Charakterystyczny czas zaniku jasności dla gwiazd 
o masach zbliżonych do masy Słońca wynosi 10" 4 s. 
Wydawać by się mogło, że bardzo łatwo jest stwier¬ 
dzić, czy jakaś wybrana gwiazda uległa grawitacyjne¬ 
mu zapadaniu czy nie. Należałoby w tym celu co 
pewien czas fotografować te same fragmenty nieba 
i sprawdzać, czy przypadkiem z pola widzenia nie 
zniknęła wybrana gwiazda. Tak jednak nie jest. Za¬ 
padająca się gwiazda jest otoczona świecącą atmos¬ 
ferą, której jasność może jeszcze przez długi czas me 
ulegać zmianie. Zanik jasności, o którym mowa wyżej, 
dotyczy tylko jasności powierzchniowej tej części 
gwiazdy, która się zapada. 


Pol© grawitacyjne czarnych dziur 

Z definicji czarnej dziury wynika, że powierzchnia 
horyzontu jest powierzchnią zerową, tzn. że jest 
ona „utkana” z granicznych promieni świetlnych, 
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które nie zbiegają się do centrum. Wynika stąd ważny 
wniosek, mianowicie że pole powierzchni horyzontu 
może rosnąć, ale nigdy nie maleje. Wykazano też, 
że czarne dziury mogą łączyć się ze sobą, natomiast 
nie mogą się rozpadać. 

Z analizy zaburzeń sferycznych czarnych dziur 
wynika, że z punktu widzenia dalekiego obserwatora 
zaburzenia bardzo szybko gasną i czarna dziura asym¬ 
ptotycznie dąży do stanu niezależnego od czasu, czyli 
do stanu stacjonarnego. 

Początkowo przypuszczano, że podobnie jak dla 
zwykłych gwiazd pole grawitacyjne wytwarzane przez 
obracającą się (stacjonarną) czarną dziurę będzie 
bardzo złożone i aby go opisać, trzeba podać wiele 
parametrów, takich jak masa, moment pędu i wszyst¬ 
kie momenty charakteryzujące rozkład masy i mo¬ 
mentu pędu. Okazało się, że pole grawitacyjne obra- 
pole cającej się czarnej dziury jest bardzo proste i zależy 
grawitacyjne tylko od dwóch parametrów: od masy czarnej dziury 
obracającej i jej momentu pędu. Jeżeli moment pędu czarnej dziu- 
się czarnej ry jest równy zeru, to jest ona sferycznie symetryczna 
dziury i wytwarza sferycznie symetryczne pole grawitacyjne. 
W ogólnej teorii względności takie pole zostało po 
raz pierwszy opisane przez Schwarzschilda. Natomiast 
pole grawitacyjne obracającej się czarnej dziury jest 
opisywane za pomocą podanego przez Kerra rozwią¬ 
zania równań ogólnej teorii względności. Promień 
powierzchni horyzontu obracającej się czarnej dziury 
o masie m i momencie pędu na jednostkę masy 
a — J/mc wynosi 

r = Gm/c* + V(Gm/c i Y-a\ 

z czego wynika, że czarna dziura nie może obracać 
się zbyt szybko, gdyż wówczas wyrażenie pod pier¬ 
wiastkiem mogłoby być ujemne. 

Bardzo ważnym zagadnieniem jest zbadanie zacho¬ 
wania się małych zaburzeń sferycznie symetrycznej 
(statycznej) i obracającej się (stacjonarnej) czar¬ 
nej dziury. Jeżeli zaburzenia te nie narastają z bie¬ 
giem czasu, to czarne dziury są stabilne. Tylko wów¬ 
czas można przypuszczać, że czarne dziury wystę¬ 
pują w przyrodzie. Stabilność sferycznie symetrycz¬ 
nego pola grawitacyjnego zbadano już niemal dwa¬ 
dzieścia lat temu. Analizując zaburzenia w liniowym 
przybliżeniu wykazano, że te zaburzenia, które opi¬ 
sują rozchodzące się fale grawitacyjne, gasną bar¬ 
dzo szybko w czasie, a spośród zaburzeń stacjonar¬ 
nych jedynie zaburzenia związane z obrotem spełnia¬ 
ją warunki regularności w nieskończoności i w oto¬ 
czeniu horyzontu. Sferycznie symetryczne czarne 
dziury są zatem stabilne ze względu na małe zabu¬ 
rzenia. 

Znacznie trudniej było zbadać problem stabilności 
obracających się czarnych dziur. Z powodu złożo¬ 
ności równań opisujących małe zaburzenia trzeba się 
było ograniczyć do analizy numerycznej, którą prze¬ 
prowadzono już dla bardzo szerokiej klasy zaburzeń. 
Dotychczasowe wyniki świadczą o tym, że obracające 
się czarne dziury są stabilne. 

Wszystko wskazuje na to, że czarne dziury powin¬ 
ny istnieć w przyrodzie, ale oczywiście w pełni prze¬ 
konywającego argumentu mogą dostarczyć tylko 
obserwacje. Zanim odwołamy się do danych obserwa¬ 
cyjnych zajmijmy się ogólnymi własnościami czarnych 
dziur. 


zachowanie 
się zaburzeń 


nośnikiem ładunku elektrycznego i ładunku magne¬ 
tycznego, gdyby się okazało, że taki istnieje. Linie 
sił pola elektrycznego i pola magnetycznego wokół 
takiej czarnej dziury przedstawione są na rys. 7. 
Zatem masa, moment pędu oraz ładunek elektryczny 
i magnetyczny są to jedyne parametry charakteryzu¬ 
jące czarną dziurę. John Wheeler powiada lapidarnie, 
że czarna dziura nie ma włosów (rys. 8). 


Obracające się czarne dziury 

Początkowo przypuszczano, że pole grawitacyjne 
wokół czarnej dziury jest podobne do pola grawita¬ 
cyjnego na zewnątrz zwykłej gęstej obracającej się 
gwiazdy. Okazało się jednak, że pole grawitacylne 
na zewnątrz czarnej dziury ma bardzo specyficzne 
własności. Jest ono całkowicie scharakteryzowane 
przez dwa parametry: masę i moment pędu. Z ogól¬ 
niejszych rozważań wynika, że czarna dziura może być 
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pole magnetyczne 


pole elektryczne 


Rys. 7. Linie sił pola magnetycznego i elektrycznego wokół czar¬ 
nej dziury z ładunkiem elektrycznym i magnetycznym 



moment pędu 
masa 


fale elektro - 
magnetyczne 



moment pędu 

Rys. 8. Wyidealizowany obraz czarnej dziury. Stacjonarną czarną 
i ł* 1 ^ ^arakteryzują jedynie trzy parametry: masa, ładunek 
elektryczny i moment pędu. Innych parametrów opisujących ma¬ 
terię, z której powstała czarna dziura, nie jesteśmy w stanie wy¬ 
znaczyć 


Omówimy teraz ogólne własności stacjonarnej czar¬ 
nej dziury. Jak juz stwierdziliśmy promień horyzon¬ 
tu jest dany równaniem r = Gmfc 2 -f /(Gm/c 2 ) 2 —a a , 
a więc przy takiej samej masie m promień powierzchni 
horyzontu obracającej się czarnej dziury jest mniej¬ 
szy od promienia horyzontu czarnej dziury Schwarz¬ 
schilda. Nasza intuicja tutaj zawodzi, wydawać by się 
mogło, że obrót spowoduje spłaszczenie czarnej dziury 
i powiększenie promienia horyzontu. 

Wokół obracającej się czarnej dziury istnieje obszar 
o promieniu r E = C7w/c 2 -f-)/(Gm/c 2 ) 2 --fl 2 cos 2 0, w któ¬ 
rym żadna cząstka ani żaden obserwator nie może 
spoczywać. 

Obszar między powierzchnią horyzontu a powierz¬ 
chnią r = r E (6) nazwano ergosferą. Zauważmy, że 
ergosfera w dwóch punktach wzdłuż osi obrotu jest 
styczna do powierzchni horyzontu (rys. 9). Istnienie 
ergosfery odgrywa ważną rolę w procesach zachodzą¬ 
cych w otoczeniu czarnej dziury. Na przykład dzięki 


ergosfera 





















ergosferze można wykorzystywać energię rotacyjną 
obracającej się czarnej dziury. Metoda polega na tym, 
że daleki obserwator wyrzuca w kierunku czarnej dziu¬ 
ry cząstkę złożoną z dwóch części A i 2?, która po prze¬ 
niknięciu do ergosfery rozpada się (rys. 10). Cząstka 
A wraca do obserwatora, natomiast cząstka B , mająca 
z punktu widzenia dalekiego obserwatora energię 
ujemną, wpada pod horyzont. Okazuje przy tym, 
że energia cząstki A jest większa od energii cząstki 
złożonej. Oczywiście, nie ma tu żadnej sprzeczności 
i zasada zachowania energii i momentu pędu jest 
spełniona. Cząstka B wpadając do czarnej dziury 
zmniejsza jej moment pędu i jej energię ruchu obro¬ 
towego. Tego procesu nie można powtarzać nieskoń¬ 
czenie wiele razy, kiedy bowiem czarna dziura prze¬ 
staje się obracać, nie można już z niej czerpać energii, 
własności Badając własności czarnych dziur sformułowano 
czarnych ogólne prawa dynamiki tych obiektów. Po pierwsze 
dziur okazuje się, że siła grawitacyjna działająca na ciało 
znajdujące się na horyzoncie jest taka sama w każ¬ 
dym punkcie horyzontu. Po drugie pole powierzchni 
horyzontu nie może maleć. Po trzecie przy zaburze¬ 



niach czarnej dziury jej zmiany energii będą takie sa¬ 
me, jak dla zwykłej obracającej się gwiazdy, inaczej 
mówiąc zmiana całkowitej energii czarnej dziury = 
= zmiana energii powierzchniowej-f zmiana energii 
wewnętrznej + zmiana energii rotacyjnej. 

Omówimy wnioski wynikające z praw dynamiki 
stacjonarnych czarnych dziur. Powierzchnia horyzon¬ 
tu obracającej się czarnej dziury wynosi: 

A = 8rt[(Gm/c 2 ) 2 +}/(C/n/c 2 ) 4 - (C7/c 3 ) 1 ]. 

Korzystając z tego wzoru wprowadzono pojęcie niere- 
dukowalnej masy czarnej dziury m fl , czyli masy jaką 
miałaby nie obracająca się czarna dziura o takiej 
samej powierzchni horyzontu, zatem 



Procesy, w których może brać udział czarna dziura, 
można podzielić na dwie klasy: procesy odwracalne 
i nieodwracalne. W procesie odwracalnym może ule¬ 
gać zmianie masa i moment pędu czarnej dziury, ale 
tylko w taki sposób, aby masa nieredukowalna pozo¬ 
stała nie zmieniona. Według praw dynamiki czarnych 
dziur ich masa nieredukowalna nie może maleć. Pro¬ 
cesy, w których masa nieredukowalna wzrasta, nazy¬ 
wamy procesami nieodwracalnymi. Część energii 
która została zużyta na zmianę wartości masy nie- 
redukowalnej, jest energią straconą i nie można jej 
odzyskać. Warto tu zauważyć, że w przypadku sta¬ 
tycznej, nie obracającej się czarnej dziury wszystkie 
procesy, które przeprowadzają ją znowu w inny stan 
statyczny, są procesami niodwracalnymi. 

Kiedy istnieje więcej niż jedna czarna dziura 
można by z takiego układu czerpać nie tylko energię 
rotacyjną, ale również energię grawitacyjną. Roz¬ 
patrzmy dwie czarne dziury odpowiednio o masach m x 
i m 2 oraz o momentach pędu J x i J z . Przypuśćmy, że 
następuje zderzenie pomiędzy nimi i w efekcie po¬ 
wstaje czarna dziura o masie m 3 i momencie pędu J 3 . 
W czasie zderzenia część energii grawitacyjnej, a mia¬ 
nowicie (/Wj-f m 2 —m 3 )c 2 , zostanie wypromieniowa- 
na w postaci fal grawitacyjnych. Pole powierzchni 
powstałej czarnej dziury nie może być mniejsze od 
sumy pól powierzchni zderzających się czarnych 
dziur, więc stosunek energii wypromieniowanej do 
energii grawitacyjnej przed zderzeniem E = ( m !+ 
-f/w 2 —w 2 ) nie może być większy od 1 / Z9 
czyli w trakcie zderzenia można uzyskać co najwyżej 
50% energii grawitacyjnej. Jeżeli zderzają się nie obra¬ 
cające się czarne dziury, to stosunek ten jest mniejszy 
i wynosi l—2~ 1,2 . Wtedy wyzwała się jedynie 29% 
energii. Są to jednak tylko maksymalne wartości 
i w realnym procesie zderzenia uzyskane energie 
będą mniejsze. 

Stacjonarna czarna dziura jest obiektem bardzo 
trudnym do wykrycia. Daleko od niej pole grawita¬ 
cyjne jest takie samo jak pole grawitacyjne zwykłej 
gwiazdy o tej samej masie. Różnice występują w po¬ 
bliżu horyzontu. Na przykład, na cząstkę poruszają¬ 
cą się w pobliżu obracającej się czarnej dziury działa 
dodatkowo odśrodkowa siła bezwładności, którą 
można opisać podając prędkość kątową obrotu, 
wynosi ona 

2 Gmarjc 2 


(r 2 + a 2 ) 2 -a 2 \r 2 - — r + a 2 jsi n 2 0 

Z taką prędkością kątową obraca się względem dale¬ 
kiego obserwatora oś spadającego swobodnie girosko- 
pu. Dla zwykłych gwiazd efekt ten jest pomijałnie 
mały. 
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Z własności symetrii pola grawitacyjnego wytwa¬ 
rzanego przez obracającą się czarną dziurę wynika, 
że energia cząstki próbnej oraz rzut momentu pędu 
na oś obrotu są zachowane. Zupełnie nie spodziewanie 
okazało się, że zachowana jest też wielkość mająca 
pewne własności całkowitego momentu pędu, dzięki 
czemu udaje się rozwiązać równania ruchu cząstek 
próbnych w polu grawitacyjnym obracaącej się czar¬ 
nej dziury. 


Czarne dziury jako obiekty astronomiczne 

W jaki sposób można zaobserwować czarną dziurę? 
Na pozór wydaje się, że jest to w ogóle niemożliwe. 
Czarna dziura nie promieniuje w pustej przestrzeni, 
a jej pole grawitacyjne dla dalekiego obserwatora 
nie różni się od pola grawitacyjnego zwykłej gwiaz¬ 
dy. Obserwacyjnie czarna dziura może się ujawnić 
tylko wówczas, gdy jest otoczona przez materię. Na¬ 
wet jednak w takich sytuacjach, kiedy mamy czarną 
dziurę zanurzoną w obłoku pyłu i następuje sferyczny 
proces akrecji — spadania materii na czarną dziurę — 
wydzielona energia nie jest zbyt wielka. Nie wiado¬ 
mo też dokładnie, jakie jest widmo powstającego wów¬ 
czas promieniowania. Wielkość wyzwolonej energii 
niewiele się zmieni, jeżeli czarna dziura porusza się 
względem obłoku materii. 

Inną sytuację mamy wówczas, gdy cząstki materii 
spadają na czarną dziurę z różnym od zera momentem 
pędu. Wtedy cząstki spadają tylko do odległości, 
na której siła odśrodkowa jest równoważona przez 
siły grawitacyjne. Ze względu na osiową symetrię 
pola grawitacyjnego spadająca materia tworzy dysk 
wokół czarnej dziury. Dzięki lepkości cząstki tra¬ 
cą moment pędu i promienie ich orbit powoli maleją. 
Zatem lepkość odgrywa podwójną rolę; wpływa na 
zmniejszenie momentu pędu i powoduje ogrzanie się 
dysku. Cząstka spadając powoli w kierunku czarnej 
dziury ma teraz wystarczająco dużo czasu, aby prze¬ 
kazać otoczeniu znaczną część swojej energii. Dzięki 
temu energia wydzielona w dysku jest znacznie większa 
niż przy sferycznej akrecji. Obliczając ilość wydzielo¬ 
nej energii w dysku można oszacować jasność obiektu. 
Dla szybko obracającej się czarnej dziury, gdy 
JcIGtrr = 0,998, efektywność zamiany energii masy 
spoczynkowej na energię cieplną dochodzi do 35%. 
Znaczna część tej energii jest wypromieniowana 
w rentgenowskim obszarze widma elektromagnetycz¬ 
nego. Należy podkreślić, że promieniowanie jest emi¬ 
towane nie przez czarną dziurę, a przez gorący gaz, 
który ją otacza. 

Dyski materii powstają wokół czarnej dziury wów¬ 
czas, gdy istnieje źródło zapewniające ciągły do¬ 
pływ materii. Występuje to wtedy, gdy czarna dziura 
wchodzi w skład układu podwójnego gwiazd i dzięki 
obecności towarzysza ma zapewniony stały dopływ ma¬ 
terii (rys. 11). Układ taki powinien być silnym perio¬ 
dycznie zmiennym źródłem promieniowania X (-+» 
Astronomia promieni X i y). 

Kiedy słynny już satelita Uhuru zaczął przekazy¬ 
wać dane o źródłach promieniowania X, największe 


/ 

\ 



gwiazda czarna dziura 

Rys. 11. Czarna dziura w układzie podwójnym. Materia z gwiazdy 
towarzyszącej powoli spada do czarnej dziury wydzielając znacz¬ 
ne ilości energii 
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zainteresowanie wzbudziło źródło Cyg X-1 znajdujące źródło 
się w konstelacji Łabędzia. Jest to silne źródło pro- Cyg X-1 
mieniowania X, którego jasność jest ok. 10 tys. razy 
większa od jasności Słońca. Dochodzące do nas 
z Cyg X-1 sygnały fluktuują z okresem mniejszym od 
0,1 s, co oznacza, że rozmiary źródła są małe i nie 
przekraczają 3 10 4 km. Udało się dokonać identyfi¬ 
kacji Cyg X-1 ze źródłem promieniowania widzial¬ 
nego i okazało się, że istotnie jest to układ podwójny, 
przy czym okres obiegu wynosi 5,6 dnia (rys. 12). 

Zmiany jasności tego układu pozwalają oszacować 



Rys. 12. Zależność prędkości radialnej V r od czasu t dla układu 
podwójnego Cyg X-1 


masę nie świecącego składnika — powinna ona być 
większa od czterech mas Słońca. Ponieważ nie może 
to być gwiazda neutronowa ze względu na zbyt dużą 
masę wielu astronomów sądzi, że jest to właśnie 
czarna dziura. ^ . . 

Jeżeli czarne dziury istnieją, to powinny mieć jeszcze proro*© 01 © - 
jedną ciekawą własność. Podstawowe prawo dyna- wan,e . 
miki czarnych dziur powiada, że pole powierzchni © z ? rne J 
horyzontu nie może maleć. Inną wielkością fizycz- dziur Y 
ną, która nie może maleć, jest entropia. Biorąc pod 
uwagę tę bardzo luźną analogię pomiędzy polem po¬ 
wierzchni czarnej dziury a entropią wywnioskowano, 
że powinna istnieć wielkość, którą można interpre¬ 
tować jako temperaturę. Jeżeli jednak czarnej dziu¬ 
rze można przypisać temperaturę, to powinna ona 
promieniować, tak jak każde inne nagrzane ciało. Do 
tego samego wniosku doprowadziła analiza rozprasza¬ 
nia fal grawitacyjnych i fal elektromagnetycznych 
na obracającej się czarnej dziurze. Obliczono, że przy 
pewnych częstościach rozpraszane fale unoszą więcej 



Rys. 13. Fale elektromagnetyczne rozpraszane na obracającej 
się naładowanej czarnej dziurze mogą unosić więcej energii niż 
energia jaką miała fala padająca. Ta nadwyżka cr.crgii jest uzys- 
skiwana kosztem energii ruchu obrotowego czarnej dziury 


energii niż miała jej fala padająca (rys. 13). Stąd już 
tylko krok do przypuszczenia, że czarna dziura 
może spontanicznie emitować cząstki. Przy czym im 
większa jest masa czarnej dziury, tym mniejsza jest 
jej temperatura i tym mniejsze prawdopodobieństwo 
emisji. W miarę jak masa promieniującej czarnej 
dziury maleje, jej temperatura rośnie, więc emituje 
ona coraz więcej energii. Proces ten jest coraz to 
szybszy i w końcu, po wypromieniowaniu całej swojej 
energii czarna dziura przestaje istnieć. Proces ten nie 
jest sprzeczny z twierdzeniem o niezmniejszaniu się 
pola powierzchni horyzontu. Przy wyprowadzeniu 
tego twierdzenia pominięto bowiem efekty kwanto¬ 
we, które w procesie emisji czarnej dziury odgrywają 
istotną rolę. 













Tempo emisji zależy od masy czarnej dziury i proces 
emisji nie odgrywa żadnej roli w ewolucji czarnych 
dziur o masach zbliżonych i większych od masy 
Słońca. 

Czarne dziury powinny też odgrywać pewną rolę 
w procesach ewolucji galaktyk, kwazarów i innych gęs¬ 
tych układów gwiezdnych. Teoria ewolucji takich 


układów jest jednak bardzo daleka od doskonałości 
i wiele punktów jest w niej jeszcze niejasnych 
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Fale grawitacyjne 

Marek Demiański 


Zaburzenia pola elektromagnetycznego — fale ele¬ 
ktromagnetyczne — rozchodzące się z prędkością 
zwaną prędkością światła są nam dobrze znane z co¬ 
dziennego życia. Radio, telewizja, światło — to tylko 
kilka przykładów praktycznego wykorzystania tych 
fal. Fale elektromagnetyczne mogą się rozchodzić w 
próżni, ponieważ ich propagacja nie wymaga istnie¬ 
nia ośrodka materialnego. Falować może samo pole 
elektromagnetyczne, a w każdym ustalonym punkcie 
będzie ulegać zmianom wektor natężenia pola elek¬ 
trycznego i magnetycznego. 

Podstawowym warunkiem występowania ruchu fa¬ 
lowego jest skończona prędkość rozchodzenia się syg¬ 
nałów. Wyjaśnijmy to dokładniej. Z równań opisują- 
prędkość cych własności pola elektromagnetycznego wynika 
rozchodzenia np., że jeżeli raptownie zmienimy położenie ładunku 
się sygnałów w punkcie A, to informacja o tej zmianie stanu pola 
dotrze do obserwatora oddalonego od punktu A o r 
po upływie czasu t = r/c, gdzie c jest prędkością 
światła. Powiadamy, że oddziaływania elektromagne¬ 
tyczne w próżni rozchodzą się ze skończoną prędkoś¬ 
cią, równą prędkości światła. 

Według teorii grawitacji Newtona, która tak dobrze 
opisuje ruchy pod wpływem siły grawitacyjnej na 
powierzchni Ziemi i w Układzie Słonecznym, informa¬ 
cje o zmianie stanu pola rozchodzą się z nieskoń¬ 
czoną prędkością. Przemieszczanie jakiejś masy po¬ 
woduje natychmiastową zmianę pola grawitacyjnego 
w całej przestrzeni. Fakt ten jest oczywiście sprzecz¬ 
ny z postulatami szczególnej teorii względności, 
według której prędkość światła jest maksymalną 
możliwą prędkością przekazywania informacji. W 
1916 r. A. Einstein sformułował relatywistyczną 
teorię grawitacji — ogólną teorię względności. Wiąże 
ona rozkład materii z geometrycznymi własnościami 
przestrzeni. Można powiedzieć, że im większą ilość 
energii zawiera pewna objętość, tym bardziej jest za¬ 
krzywiona przestrzeń w tym obszarze (rys. !)• Na- 



Rys. 1. Kulka ugina ela¬ 
styczną membranę. W teorii 
grawitacji Einsteina masy 
powodują zakrzywienie 
przestrzeni 


tężenie pola grawitacyjnego zależy od krzywizny 
przestrzeni. Wiadomo, że lokalnie, w małych obsza¬ 
rach przestrzeni, nie można za pomocą doświadczeń 
mechanicznych odróżnić siły grawitacyjnej od sił 
bezwładności działających w nieinercjalnych układach 
odniesienia. W geometrycznym języku ogólnej teorii 
względności oznacza to, że w małych obszarach prze¬ 
strzeni można wprowadzić prostokątny kartezjański 
układ współrzędnych. 

Własności fal grawitacyjnych 

Według ogólnej teorii względności informacje o zmia¬ 
nach stanu pola grawitacyjnego rozchodzą się ze 
skończoną prędkością. Zatem powinny istnieć po¬ 


la grawitacyjne o właściwościach podobnych do fal 
elektromagnetycznych. A. Einstein wykazał, że jeżeli 
pole jest bardzo słabe, to istnieją rozwiązania rów¬ 
nań pola w ogólnej teorii względności. Tym samym 
wykazał, że można mówić o falach grawitacyjnych, 
jeżeli pola są słabe. Nie oznacza to jednak, że do¬ 
wolne pole grawitacyjne dopuszcza możliwość wy¬ 
stępowania fal grawitacyjnych. Wyjaśnienie, czy tak 
jest istotnie, nie jest proste. Jedną z trudności jest nie¬ 
liniowość równań opisujących własności pola grawi¬ 
tacyjnego. Jeżeli np. mamy dwa źródła, A i B wytwa¬ 
rzające pola grawitacyjne, to pole wytworzone jedno¬ 
cześnie przez oba źródła nie jest po prostu sumą pól 
wytwarzanych przez źródła A i B z osobna. Powia¬ 
damy, że relatywistyczne pole grawitacyjne nie speł¬ 
nia zasady superpozycji. Równania opisujące pole 
elektromagnetyczne są liniowe, a pole spełnia zasadę 
superpozycji. Zatem fale grawitacyjne nie będą 
miały wszystkich własności fal elektromagnetycznych. 
Jakie więc pola grawitacyjne można nazywać falami 
grawitacyjnymi? Przy rozstrzyganiu tej kwestii 
skorzystajmy z analogii do własności fal elektroma¬ 
gnetycznych. Okazało się, że pole grawitacyjne wy¬ 
twarzane przez ograniczony układ ciał daleko od tego 
obszaru też można przybliżyć przez falę kulistą o am¬ 
plitudzie malejącej odwrotnie proporcjonalnie do 
odległości (rys. 2). Układ taki promieniuje fale gra¬ 
witacyjne. Jeszcze raz skorzystajmy z analogii doty¬ 
czącej własności fal elektromagnetycznych. Podobnie 
jak układ ładunków promieniujący, fale elektromagne¬ 
tyczne traci energię, a jej straty są równe energii uno¬ 
szonej przez fale, tak i ograniczony układ ciał od¬ 
działujących grawitacyjnie traci energię, jeżeli pro¬ 
mieniuje fale grawitacyjne. 

Z analogii tych wynika, że o tym, czy dane pole 
grawitacyjne można nazwać falą grawitacyjną czy nie, 
decydują własności pola bardzo daleko od źródeł. 
Jest to istotne ograniczenie, dotyczy bowiem tylko 
takich sytuacji, w których materia występuje w obsza¬ 
rach o skończonych rozmiarach. O falach grawitacyj¬ 
nych można mówić i w ogólniejszym wypadku. Jak 
już wspominaliśmy, zakrzywienie przestrzeni w jakimś 
obszarze zależy od ilości zawartej w nim energii. 
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Rys. 2. Promieniowanie ograniczonego układu ładunków 
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Zakrzywienie przestrzeni, podobnie jak zakrzywienie 
dwuwymiarowych powierzchni, można opisywać za 
pomocą wielkości zwanej krzywizną. Skalarną wiel¬ 
kością określającą zakrzywienie przestrzeni jest pro¬ 
mień krzywizny. Rozpatrzmy obszar przestrzeni, 
w którym promień krzywizny jest nie mniejszy od 
R . Zaburzenia pola grawitacyjnego w obszarach 
znacznie mniejszych od R można traktować jako fale 
grawitacyjne rozchodzące się w krzywej przestrzeni. 
Ten drugi punkt widzenia umożliwia rozważanie wy¬ 
stępowania i analizowanie fal grawitacyjnych w prze¬ 
strzeniach z nieograniczonym rozkładem materii, 
które są wykorzystywane jako proste modele Wszech¬ 
świata. 

Za pomocą tych dwóch sposobów opisu fal grawi¬ 
tacyjnych można klasyfikować pola grawitacyjne na 
pola stacjonarne (bez promieniowania) i pola pro¬ 
mieniste. Ścisłe rozwiązania równań ogólnej teorii 
względności opisujące pola promieniste znane są w 
najprostszych wypadkach, opisują one płaską falę 
grawitacyjną i rozchodzącą się falę kulistą. W elektro¬ 
dynamice każde pole promieniowania można dzięki 
liniowości równań — rozłożyć na sumę fal płaskich 
lub kulistych, przy czym różne składniki tej sumy nie 
oddziałują ze sobą. Inaczej jest w ogólnej teorii 
względności: jeżeli się nawet rozłoży grawitacyjne 
pole promieniowania na sumę fal płaskich lub kuli¬ 
stych, to różne składniki tej sumy oddziałują ze 
sobą. Innymi słowy, współczynniki rozkładu pola 
promieniowania grawitacyjnego, np. na fale kuliste, 
zależą od czasu. Aby opisać pole promieniowania gra¬ 
witacyjnego, trzeba podać, w jaki sposób te współ¬ 
czynniki zależą od czasu. Jest to problem bardzo 
trudny i do tej pory nikomu się nie udało znaleźć 
ścisłych rozwiązań opisujących pole promieniowania 
nawet bardzo prostych układów fizycznych, np. 
gwiazd podwójnych. 

Z elektrodynamiki wiadomo, że układ ładunków 
promieniuje wówczas, gdy moment dipolowy zmienia 
się w czasie (jeżeli tylko stosunek ejm dla różnych ła¬ 
dunków jest różny). Średnia moc promieniowania 
w najprostszym wypadku (kiedy moment dipolowy 
d zmienia się periodycznie z częstością kołową ct>, 
a więc gdy d = d 0 sin w/) jest dana wzorem: 

dE = 2 / d*d\ __ 1 

dt ~ 3c 3 ' dt 2 ' ~ 3 c 3 d °' 

gdzie < y oznacza wartość średnią w ciągu okresu 
T = 2k/<o. Jak widać, moc promieniowania zależy 
od drugiej pochodnej po czasie momentu dipolowego. 
Promieniowanie dipolowe jest dominującym rodza¬ 
jem promieniowania układu ładunków. Inaczej jest 
w wypadku układu mas. Rozpatrzmy prosty układ 
dwóch mas, Af i w, połączonych sprężyną (rys. 3), 
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Rys. 3. Oscylator z dipolowym rozkładem mas 


który może drgać tylko wzdłuż jednej osi. Z zasady 

zachowania pędu wynika, że M -f m = — = 

dt d dt 

= const, zatem druga pochodna po czasie momentu 
dipolowego jest równa zeru. Wniosek ten jest bardzo 
ważny, oznacza bowiem, że grawitacyjne promienio¬ 
wanie dipolowe nie występuje. Moc promieniowania 
grawitacyjnego układu ciał zależy od trzech pochod¬ 
nych po czasie kolejnego wyższego momentu multi- 
polowego. Kolejny moment multipolowy jest ma¬ 
cierzą, której składowymi są sumy iloczynów mas 
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przez iloczyny dwóch współrzędnych określających 
ich położenie, np. Q X y = £ mtxtyt. Nazywamy go 

i 

momentem kwadrupolowym. Układ ciał promieniuje 
grawitacyjnie wówczas, gdy moment kwadrupolowy 
zmienia się w czasie. Średnia moc promieniowania 
takiego układu, którego moment kwadrupolowy zmie¬ 
nia się w czasie z częstością kołową co, wynosi 


dE 

dt 



gdzie G — stała grawitacyjna, c — prędkość światła, 
Q — średni w czasie moment kwadrupolowy. Czyn¬ 
nik G/c 5 ma wartość 2,75 10 -60 , zatem w ogólnym 
wypadku moc promieniowania grawitacyjnego bę¬ 
dzie bardzo mała. 


Źródła fal grawitacyjnych 

Fale grawitacyjne może emitować nie tylko układ ciał, 
ale i pojedyncze ciało, nawet traktowane jako ciało 
punktowe, jeżeli się porusza z bardzo dużym przy¬ 
spieszeniem. Wyobraźmy sobie, że chcemy zbudować 
generator fal grawitacyjnych. W tym celu należy 
zmieniać w czasie moment kwadrupolowy układu 
mas. Można to osiągnąć np. obracając jakieś ciało 
względem osi, która nie jest jego osią symetrii. 
Przypuśćmy, że mamy do dyspozycji stalowy walec 
o promieniu 1 m i długości 20 m, ważący ok. 500 t. 
Obracajmy go wokół osi prostopadłej do osi walca 
i dzielącej ją na połowę (rys. 4). Maksymalną pręd- 



Rys. 4. Laboratoryjny generator fal grawitacyjnych — na przy¬ 
kład stalowy walec obracający się ze stałą prędkością kątową 
względem osi prostopadłej do osi symetrii walca 


kość obrotu wyznaczamy z warunku równości od¬ 
środkowej siły bezwładności i siły sprężystej. Stąd 
otrzymujemy, że maksymalna prędkość kątowa 
obrotu wynosi 28 s -1 . Obracający się z maksymalną 
możliwą prędkością kątową walec emituje fale 
grawitacyjne o mocy dEjdt = 2* 10“ 29 J/s. Jest to więc 
bardzo słabe źródło. Żaden inny laboratoryjny gene¬ 
rator nie jest bardziej efektywny. 

Oczywiste jest zatem, że silnymi źródłami promie¬ 
niowania grawitacyjnego mogą być tylko obiekty 
astronomiczne, które się poruszają z bardzo dużą 
prędkością i mają bardzo silne poła grawitacyjne. 
Obiektami takimi mogą np. być białe karły, gwiazdy 
neutronowe i czarne dziury. 

Każda wybuchająca gwiazda supernowa czy też 
gwiazda zapadająca się grawitacyjnie powinna być 
silnym źródłem fal grawitacyjnych. Ostatnie fazy gra¬ 
witacyjnego zapadania różnych gwiazd powinny 
przebiegać podobnie. Można więc przypuszczać, że 
zapadająca się gwiazda emituje fale grawitacyjne 
o kształcie charakterystycznym dla tego procesu. 
Niestety nie znamy dokładnie dynamiki procesu za¬ 
padania gwiazd i trudno jest ocenić moc promienio¬ 
wania, a tym bardziej kształt wysyłanych impulsów. 

Innym silnym źródłem fal grawitacyjnych są ukła- 
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podwójny dy podwójne gwiazd (rys. 5). W miarę jak układ pod- 
układ dwójny traci energię, gwiazdy zbliżają się do siebie, 
gwiazd Energia układu gwiazd poruszających się po orbitach 



Rys. 5. Układ gwiazd po¬ 
dwójnych. O oznacza śro¬ 
dek masy 


kołowych o promieniu a wynosi E — — \GmxmJa, 
natomiast straty energii wynoszą 

dE 32 G 22 / . \ _6 

—j- --=- r m 1 m 2 (m 1 +m 2 )a \ 

dt j c 9 

zatem odległość między gwiazdami ciągle się zmniej¬ 
sza zgodnie z wzorem 

a = tf 0 (l — //*o) !/ \ 
gdzie a 0 = a(0), a 

5 _ c s ao _ 

T ° ~~ 256 G*m 1 m z (m l +mJ * 

Jeżeli tylko siły niegrawitacyjne nie zaburzą ruchu 
układu, to po czasie / = r 0 gwiazdy spadną na siebie. 
Czas r 0 typowych układów podwójnych jest porów¬ 
nywalny z wiekiem Wszechświata i wynosi ok. (1- 
-1,5)*10 10 lat. Moc promieniowania takich układów 
wynosi 10 23 J/s, co daje strumień na powierzchni 
Ziemi ok. 10 -2 ° J/cm 2 s. 

pulsar Innym źródłem fal grawitacyjnych może być obra¬ 
cająca się gwiazda neutronowa — pulsar. Strumień 
promieniowania zależy od momentu kwadrupolo- 
wego, który w wypadku pulsarów można ocenić tylko 
co do rzędu wielkości. Prócz fal grawitacyjnych, wy¬ 
syłanych z częstością równą okresowi obrotu, obser¬ 
wowane nagłe zmiany okresu obrotu pulsara, zwią¬ 
zane ze zmianą kształtu powierzchni, mogą też powo¬ 
dować powstanie silnych impulsów promieniowania 
grawitacyjnego. Oszacowanie lości wy promień i owy- 
wanej energii jest bardzo trudne ze względu na frag¬ 
mentaryczne wiadomości o budowie gwiazd neutro¬ 
nowych. 

Pole grawitacyjne w pobliżu czarnej dziury jest 
bardzo silne i rośnie nieograniczenie w miarę zbli¬ 
żania się do horyzontu (-*■ Czarne dziury i zapadanie 
grawitacyjne). Każda cząstka, która zostanie złapana 
przez czarną dziurę, będzie — zanim przeniknie przez 


/ 

/ 

/ 



Rys. 6. Schematyczny dwuwymiarowy obraz zmian krzywizny 
przestrzeni wywołany przez cząstkę wpadającą do czarnej dziury. 
Zakrzywienie przestrzeni w otoczeniu czarnej dziury można wy¬ 
obrażać sobie jako rodzaj lejka, który rozszerza się i staje się 
płaski bardzo daleko od czarnej dziury. Tor cząstki zaznaczono 
linią przerywaną, linie faliste reprezentują rozchodzącą się falę 
grawitacyjną 


horyzont — przyspieszona do bardzo dużych pręd¬ 
kości i w momencie przenikania przez horyzont osiąg¬ 
nie prędkość światła. Taka cząstka wyśle silny impuls 
fal grawitacyjnych. Szacuje się, że mały obiekt o ma¬ 
sie /w, wpadając do czarnej dziury (rys. 6) o masie 
A/, wypromieniujeok. 0,01 mc 2 (m/M) energii w po¬ 
staci impulsu fal grawitacyjnych w czasie t~10~ 4 
(m/M) s. 

Cząstka poruszająca się po zamkniętej orbicie 
kołowej bardzo blisko czarnej dziury też doznaje 
dużych przyspieszeń. Wysyła ona grawitacyjne pro¬ 
mieniowanie synchrotronowe. Aby się cząstka mogła 
po takiej orbicie poruszać, musi mieć bardzo dużą 
energię kinetyczną, porównywalną z energią spoczyn¬ 
kową mc 2 . Nie znamy jednak naturalnych procesów, 
które by mogły dostarczyć cząstkom takich dużych 
energii. 

Spośród wszystkich rozpatrywanych dotychczas zdarzenie 
hipotetycznych źródeł fal grawitacyjnych najbardziej dwóch 
interesujące jest zderzenie dwóch czarnych dziur, czarnych 
Z oszacowań wynika, że jeżeli się zderzają dwie nie dziur 
obracające się czarne dziury o jednakowych masach 
A/, to energia wypromieniowana w postaci fal gra¬ 
witacyjnych może sięgać 0/aMc*, a jeśli się te czarne 
dziury obracają — aż x Umc 2 . 

Nagłe wybuchy, które obserwujemy w innych galak¬ 
tykach, oraz procesy zderzeń w centrum naszej Galak¬ 
tyki są zapewne źródłami fal grawitacyjnych. Natura 
tych źródeł jest prawie nieznana. Niektóre własności 
astrofizycznych źródeł fal grawitacyjnych zebrano 
w tabeli. 


Astrofizyczne źródła promieniowania grawitacyjnego 


Źródło 

Widmo 

Stru¬ 

mień 

J/m*s 

Ampli¬ 

tuda 

Gwiazdy podwójne w Galakty¬ 
ce są monochromatycznym 
źródłem promieniowania gra¬ 
witacyjnego 

Nasilniejsze źródło (i Boo) 

P » 1 h 

io-» 

10“*® 

Strumień od wszystkich gwiazd 
podwójnych 

J®m»x ~ 8 h 

jO-io 

10“*® 

Pulsar w Krabie (PSR 0532) 
Promieniowanie ciągłe 

v = 60 Hz 

3* 10 -lł 

10-” 

Gwałtowne zmiany prędkości 

v a 10 3 Hz 

io- 3 

10"“ 

obrotu 

Supernowa i zapadanie 

w Galaktyce raz na 100 lat 

e w 10 3 - 

10 7 

10- 17 

wybuchy trwające od 10“ 3 do 

1 s 

we wszystkich galaktykach 
leżących bliżej niż gromada 
galaktyki Virgo 

-10* Hz 

10 

10-*® 

Szybko obracająca się gwiazda 
neutronowa 

v * 10 3 Hz 

10-» 

10-** 

Wybuchy w jądrach galaktyk 
i kwazarów 

P * 100 d 

10"“ 

10-“ 

Czarna dziura 
o masie !0 ł -l0*A/© w cen¬ 
trum Galaktyki, do której 
wpada gwiazda o masie 1 M © 
Krótki impuls 

Pa 10-10* s 

10-® 

10- lł 


Ostatnio rozważa się inną możliwość generacji fal 
grawitacyjnych, a mianowicie wytwarzanie fal gra¬ 
witacyjnych przez szybkozmienne i bardzo silne 
pola elektromagnetyczne. W tym celu należałoby 
zbudować potężny kondensator o polu powierzchni 
płytki ok. 100 m 2 i między okładkami wytwarzać 
szybkozmienne pole o natężeniu ok. 10 s V/m. Nie¬ 
stety w warunkach laboratoryjnych nie umiemy jesz¬ 
cze otrzymywać pól o takich natężeniach. 


Wykrywanie fal grawitacyjnych 

Oddziaływanie grawitacyjne jest bardzo słabe i z za¬ 
sady zachowania pędu wynika, że nie występuje pro¬ 
mieniowanie dipolowe. Generowanie i detekcja fal 
grawitacyjnych związana jest więc ze zmianami mo- 
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mentu kwadrupolowego. Zatem generacja fal grawita¬ 
cyjnych o mierzalnym natężeniu nie jest w laborato¬ 
ryjnych warunkach praktycznie możliwa. Aby reje¬ 
strować fale grawitacyjne, trzeba by umieć mierzyć 
bardzo małe zmiany momentu kwadrupolowego an¬ 
teny. Równanie opisujące zmiany w czasie momentu 
kwadrupolowego anteny przypomina równanie oscy¬ 
latora tłumionego, na który działa siła wymuszająca, 
przy czym człon z siłą wymuszającą zawiera infor¬ 
macje o zmianach krzywizny przestrzeni. 

Joseph Weber nie zraził się wspomnianymi trud¬ 
nościami i od kilkunastu lat prowadzi badania w celu 
wykrycia fal grawitacyjnych. Aby rejestrować fale 
grawitacyjne i wyznaczać ich natężenie, trzeba umieć 
mierzyć bardzo słabe zmiany krzywizny przestrzeni. 
Mierzymy krzywiznę, np. śledząc zmiany odległości 
dwóch położonych blisko siebie i spadających swo¬ 
bodnie cząstek. Oczywiście taka metoda jest mało 
efektywna i nikt jej w praktyce nie stosuje, 
antena J. Weber zaproponował, aby jako antenę wykorzy- 
Webera stać walec aluminiowy długości 1,5 m, o średnicy 
0,6 m i całkowitej masie 1400 kg. Walec zawieszono 
za pomocą lin stalowych na metalowej ramie odpo¬ 
wiednio izolowanej od wszelkich zewnętrznych 
wstrząsów (rys. 7). Środkowa część walca została 



Rys. 7. Walce alumi¬ 
niowy używany przez 
J. Webera jako antena 
fal grawitacyjnych. 
Strzałka wskazuje pie¬ 
zoelektryczne krysz¬ 
tały 


oblepiona piezoelektrycznymi kryształami. Kiedy 
prostopadle do osi walca pada na niego fala grawita¬ 
cyjna, zmienia się moment kwadrupolowy, co wywo¬ 
łuje drgania mechaniczne. 

Drgania mechaniczne są za pomocą kryształów 
piezoelektrycznych przetwarzane na drgania elek¬ 
tryczne, które się następnie bardzo wzmacnia i w koń¬ 
cu rejestruje. Podstawowa częstość tego detektora wy¬ 
nosi 1660 Hz. Dzięki temu pomysłowemu urządzeniu 
Weber mógł mierzyć względne naprężenia rzędu 10~ w , 
czemu odpowiada przesunięcie końców walca o 2 • 

* 10 -14 cm, a więc mniej niż o ł /io klasycznego 
promienia elektronu. To jest fantastyczna dokład¬ 
ność! 

Stosując dwa takie detektory, odległe od siebie 
o 1000 km, Weber badał koincydencje pomiędzy 
sygnałami dochodzącymi z obu anten. Sygnały z jed¬ 
nej anteny, umieszczonej w pobliżu Chicago, były 
przekazywane za pomocą linii telefonicznej do Ma¬ 
ryland, gdzie pracowała druga antena. Sygnały, które 
dochodziły jednocześnie z dokładnością do 0,4 s, 
były liczone jako koincydencyjne. Weber twierdzi, że 
od 1969 r. obserwuje dziennie ok. 4 koincydencji. 
Zapis sygnałów pochodzących z obu anten przedstawia 
rys. 8. Odnosząc swoje dane do czasu gwiazdowego 
Weber w 1970 r. stwierdził, że obserwuje więcej syg¬ 
nałów w koincydencji, gdy anteny skierowane są 
ku centrum Galaktyki. Jeśliby się przypuściło, że 
źródło promieniowania znajduje się w centrum Galak¬ 
tyki, to obserwowaną liczbę koincydencji mogłoby 
dawać źródło przetwarzające na fale grawitacyjne 
energię masy spoczynkowej ok. 1000A/® w ciągu roku. 

Liczba ta wydawała się astronomom zbyt duża. 
Przeprowadziii oni oszacowania energii, która może 
być wypromieniowana z centrum Galaktyki nie po¬ 
wodując zauważalnych ruchów gwiazd. Na górną 
wartość tej energii otrzymano 70M© w ciągu roku, 
a więc wynik Webera jest o czynnik czternaście za 
duży. 

Od 1970 r. pracuje kilka innych anten. Zbudowali 
je, wzorując się na modelu Webera, R. Drever 
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w Glasgow, J. A. Tyson w Holmdel, W. Braginski 
w Moskwie i in. (il. 219, tabl. 58). Choć wszystkie uk¬ 
łady działały na bardzo podobnej zasadzie jak antena 
Webera, żadnej innej grupie nie udało się potwierdzić 
obserwacji Webera. Trzeba przyznać, że nikt nie zbu¬ 
dował dokładnie takiej samej pary anten, ale sądzi się 
powszechnie, że anteny Webera są wzbudzane przez 
jakieś inne czynniki, nie przez fale grawitacyjne. 

W tym czasie powstały nowe projekty anten grawi¬ 
tacyjnych. W. Fairbank buduje antenę, która będzie 
pracowała w bardzo niskiej temperaturze, ok. 2* 

*10~ 3 K. Już samo obniżenie temperatury pozwoli na 
zwiększenie czułości anteny o dwa rzędy wielkości. 

Znacznemu zmniejszeniu ulegną bowiem szumy ante¬ 
ny związane z termicznym ruchem atomów. Fairbank 
chce też zastosować nową metodę przetwarzania drgań 
mechanicznych cylindra na drgania elektryczne, wy¬ 
korzystując obwody nadprzewodzące; przypuszcza, 
że w ten sposób podniesie czułość anteny o dalszy rząd 
wielkości. Jego antena powinna zacząć działać w koń¬ 
cu lat osiemdziesiątych. Fairbank ma nadzieję, że za 
pomocą swojej anteny będzie mógł obserwować wy¬ 
buchy supernowych w otaczających nas bliskich galak¬ 
tykach. 

Już w 1960 r. Weber wystąpił z projektem użycia metody 
Ziemi jako detektora fal grawitacyjnych. W tym celu detekcji 
należałoby dokładnie mierzyć zmiany natężenia pola fal grawi- 
grawitacyjnego w kilku punktach na powierzchni facyjnych 
Ziemi. Pomiary takie są bardzo trudne, gdyż po¬ 
ziom szumów sejsmicznych jest na Ziemi niezwykle 
wysoki. Postanowiono więc potraktować Księżyc 
jako detektor. Załoga statku Apollo 17 umieściła 
na Księżycu grawimetr (niestedy układ nie działa). 

Od pewnego czasu trwają też dokładne pomia¬ 
ry odległości pomiędzy Ziemią i Księżycem. Mogą 
one być wykorzystane do wykrywania fal grawi¬ 
tacyjnych o bardzo dużej długości fali. 

Rozważa się też kilka innych wariantów anten 
grawitacyjnych, w których by się wykorzystywało 
interferencje dwóch strumieni laserowych do bada¬ 
nia zmian odległości między dwoma zwierciadłami. 

Braginski zamierza zbudować antenę, w której pod¬ 
stawowym elementem będzie olbrzymi, ważący ok. 

5 kg sztuczny diament. 

Bardzo trudno jest przewidzieć, które z tych ekspe¬ 
rymentów zakończą się powodzeniem. Być może 
jesteśmy na progu nowych możliwości i za kilka lat 
dysponować będziemy nowymi danymi obserwacyj¬ 
nymi o otaczającym nas Wszechświecie. Może isę 
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jednak okazać, że podniesienie czułości anten — 
nawet o cztery rzędy wielkości —jeszcze nie wystarczy 
a wówczas trzeba będzie czekać na kolejną rewolucję 
technologiczną, aby eksperymentalnie potwierdzić 
istnienie fal grawitacyjnych. 

Pośrednio na istnienie fal grawitacyjnych wskazują 
obserwacje pulsara PSR 1913 -f 16. Jest to pulsar ra¬ 
diowy wchodzący w skład układu podwójnego, przy 
czym drugim składnikiem jest najprawdopodobniej 
też gwiazda neutronowa. Obserwowane zmiany okre¬ 


su orbitalnego tego układu dobrze zgadzają się z przy¬ 
puszczeniem, że wywołuje je emisja fal grawitacyj¬ 
nych. 

W. B. Braginskij, A. B. Manukin Izmierienije małych sił wfi- 
ziczeskich ekspierimientach , Moskwa 1975; M. Demiański Astro¬ 
fizyka relatywistyczna , Warszawa 1978; M. Rees, R. Ruffini, 
J. A. Wheeler Black Holes, Gravitationał Wcves and Cosmołogy , 
New York 1974; J. Weber Generał Relativity and Gravitational 
Waves t New York 1961; W. D. Zacharów Grawitacjonnyje wotny 
w tieorii tiagoilcnija Einsztejna, Moskwa 1972; J. B. Zeldowicz, 
I. D. Nowikow Tieorija tiagotienija i ewolucyja zwiozd, Moskwa. 
1971. 


Promieniowanie kosmiczne 


Marcin Kubiak 

Promieniowaniem kosmicznym nazywamy strumień 
cząstek o bardzo dużych energiach, 10 7 -10*° eV, 
dobiegający do Układu Słonecznego z przestrzeni 
międzygwiazdowej. Cząstki promieniowania kosmicz¬ 
nego wbiegające w atmosferę ziemską z prędkością 
bliską prędkości światła są źródłem cząstek wtórnych, 
których rodzaj i energia zależą od wysokości w atmo¬ 
sferze. Promieniowanie kosmiczne nie dociera do 
powierzchni Ziemi i w swej pierwotnej postaci może 
być obserwowane tylko na dużych wysokościach 
(w idealnym wypadku — poza Ziemią, a nawet poza 
granicami Układu Słonecznego). Aby podkreślić, 
o który rodzaj cząstek chodzi, używa się niekiedy 
pojęć: pierwotne i wtórne promieniowanie kosmiczne. 

Wynikiem oddziaływania promieniowania kos¬ 
micznego z atmosferą jest wzrost jej przewodnictwa 
elektrycznego; w nieobecności jakichkolwiek czyn¬ 
ników jonizujących gaz tworzący atmosferę powinien 
mieć właściwości dielektryka. Fakt, że atmosfera 
ziemska jest ośrodkiem przewodzącym, znany był od 
1900 r., jednak dopiero w 1912 r. V. F. Hess wykazał 
obserwacyjnie, że przewodnictwo atmosfery wzrasta 
z wysokością i wysunął potwierdzoną później hipo¬ 
tezę, że zjawisko to jest następstwem jonizacji wy¬ 
wołanej przez przenikliwe promieniowanie pocho¬ 
dzenia pozaziemskiego. Korpuskulamy charakter 
tego promieniowania stwierdzono w 1929 r. Dalsze 
obserwacje wykazały, że promieniowanie kosmiczne 
zawiera trzy wyraźnie różne składowe: stały w czasie 
i niezależny od kierunku strumień cząstek pochodzący 
spoza Układu Słonecznego, zmienny w czasie stru¬ 
mień cząstek pochodzący ze Słońca, wykazujący 
wyraźny związek z rozbłyskami na jego powierzchni, 
oraz mniej intensywny strumień fotonów y pocho¬ 
dzenia pozasłonecznego. Do czasu wprowadzenia 
laboratoryjnych akceleratorów cząstek, promienio¬ 
wanie kosmiczne było dla fizyków jądrowych natu¬ 
ralnym źródłem cząstek i kwantów y o bardzo dużych 
energiach. W ostatnich latach promieniowanie kos¬ 
miczne stało się przedmiotem szczególnego zaintere¬ 
sowania astrofizyków zajmujących się proęesami 
wielkich energii. Jednocześnie pojęcie promieniowania 
kosmicznego uległo zawężeniu; promieniowanie kor- 
puskularne, którego źródłem są rozbłyski słoneczne, 
stało się przedmiotem zainteresowania heliofizyki, 
natomiast obserwacje kwantów y rozwinęły się w 
nową gałąź dzisiejszej astrofizyki obserwacyjnej 
(-* Astronomia promieni X i y). Całkowicie nowe 
możliwości obserwacji promieniowania kosmicznego 
pojawiły się wraz z rozwojem techniki rakietowej i sa¬ 
telitarnej. 


Metody obserwacji promieniowania 
kosmicznego 

Najważniejsze sposoby obserwacji cząstek promie¬ 
niowania kosmicznego w różnych zakresach ich ener¬ 
gii kinetycznej podane są w poniższej tabeli. Celem 
tych obserwacji jest dokonanie jednoznacznej iden¬ 


tyfikacji cząstek, określenie ich widma energetycz¬ 
nego (tzn. względnej liczby cząstek danego rodzaju, 
o energii zawartej w jednostkowym przedziale wokół 
danej energii E) oraz kierunku przylotu. 


Metody obserwacji promieniowania kosmicznego w różnych 

zakresach energii 


Zakres energii 


Metoda obserwacji 


2* 10 7 -3* 10 8 cV 


210*-5-10 lo eV 
10 ł *-10 14 eV 


10 l, -10 18 eV 
10 l *-10 ,c eV 


detektory umieszczone na pokładach 
sztucznych satelitów o orbitach ekscen¬ 
trycznych, wybiegających poza magneto- 
sferę 

bloki emulsji i liczniki Czerenkowa wy¬ 
noszone przez balony stratosferyczne 
spektrometry jonizacyjne i bloki emulsji 
rejestrujące reakcje jądrowe, umieszczone 
na pokładach satelitów i balonów strato¬ 
sferycznych 

podziemne pomiary strumienia mionów 
obserwacje wielkich pęków atmosferycz¬ 
nych 


Jednoznaczna identyfikacja cząstki wymaga okre- identyfikacja 
ślenia jej ładunku elektrycznego oraz masy. Wszy- cząstek 
stkie cząstki promieniowania kosmicznego są jądra¬ 
mi atomowymi pozbawionymi całkowicie powłok 
elektronowych; określenie ładunku jest więc równo¬ 
znaczne z określeniem liczby atomowej jądra (czyli 
liczby znajdujących się w nim ładunków dodatnich). 

Określenie znaku ładunku pozwala na odróżnienie 
materii od antymaterii. Do identyfikacji cząstek 
można wykorzystać pewne właściwości ich oddziały¬ 
wania z materią. Cząstka promieniowania kosmicz¬ 
nego przechodząca przez gęsty ośrodek traci część 
swej energii na jonizację lub wzbudzenie tworzących 
go atomów. Straty te nazywamy stratami jonizacyjny- straty 
mi. W ogólnym wypadku zależą one od ładunku oraz jonizacyjne 
prędkości cząstki; tak więc oprócz określenia strat 
jonizacyjnych (czyli ubytku energii na jednostkowej 
drodze) do identyfikacji cząstki potrzebne są również 
niezależne informacje o jej prędkości. W przypadku 
cząstek relatywistycznych (poruszających się z pręd¬ 
kością bliską prędkości światła) straty jonizacyjne 
zależą praktycznie tylko od ładunku. 

Innej możliwości identyfikacji cząstek dostarcza promtenio- 
analiza tzw. promieniowania Czerenkowa. Promie- wanie 
niowanie to pojawia się zawsze, gdy prędkość cząstki Czerenkowa 
obdarzonej ładunkiem elektrycznym, poruszającej 
się w przezroczystym ośrodku o współczynniku zała¬ 
mania n, przekracza wartość c/n, czyli jest większa 
od prędkości światła w tym ośrodku (pozostając jed¬ 
nak mniejsza od prędkości światła w próżni). Natę¬ 
żenie oraz barwa promieniowania Czerenkowa emi¬ 
towanego na jednostkowej drodze zależy od ładunku 
cząstki i od jej prędkości. Gdy cząstki poruszają się 
z prędkością dużo większą od prędkości granicznej 
cjn, właściwości promieniowania Czerenkowa zależą 
-tylko od ładunku cząstki. 

Wymienione wyżej zjawiska, tzn. straty jonizacyjne 
oraz promieniowanie Czerenkowa, są — w takiej 
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czy innej odmianie — zasadą działania wszystkich 
urządzeń stosowanych do obserwacji promieniowania 
kosmicznego. 

pomiar w zakresie energii mniejszych od około 3-10 8 eV 
energii straty jonizacyjne mogą doprowadzić do całkowite- 
cząsteK go zatrzymania cząstki zanim oddziaływania jądrowe 
zamienią ją w cząstkę lub cząstki innego rodzaju. 
Całkowita energia cząstki może być wówczas okre¬ 
ślona np. na podstawie analizy jej śladu w bloku emul¬ 
sji jądrowej (rys. 1). Innym rodzajem analizatora 
energii jest urządzenie składające się z dwóch scyn¬ 
tylatorów, którego zasada działania jest wyjaśniona 
na rys. 2. 

Do określenia energii cząstek o większych ener¬ 
giach wykorzystuje się następujące urządzenia, me¬ 
tody oraz zjawiska. 

Liczniki Czerenkowa — załeżnie od współczynnika 
załamania użytej substancji rejestrują tylko cząstki 
o energiach większych od określonej energii progo- 

Spektrometry magnetyczne — urządzenia, w któ¬ 
rych wykorzystuje się fakt, że cząstka o pędzie p 
i ładunku Z, poruszająca się w poprzecznym polu 
magnetycznym o natężeniu B , zakreśla koło o pro¬ 
mieniu r = pjZB. Urządzenia tego rodzaju są za¬ 
zwyczaj używane w połączeniu z układami komór 
iskrowych lub z blokami emulsji, pozwalającymi 
dokładnie określić tory cząstek. 

Spektrometry jonizacyjne — urządzenia, w których 
pierwotna cząstka traci swą energię w grubej war- 





Fe 

Z = 2 6 


Ti 

Z—22 


stwie absorbującej wskutek oddziaływań jądrowych, 
prowadzących do powstania kaskad mezonowych! 
Ostatecznie, niemal cała energia kinetyczna cząstki 
zamienia się w energię kaskady elektronów i może 
być zmierzona. 



Rys. 2. Zasada działania najprostszego „teleskopu” do obser- 
Promieniowania kosmicznego, będącego zarazem analiza- 
Rcjestrowanc S5 t tylko cząstki, które przejdą prawie 
jednocześnie przez scyntylator A i B , cząstki przechodzące przez 
wszystkie trzy scyntylatory nie są rejestrowane. W układzie ta¬ 
kim są więc rejestrowane tylko takie cząstki, których energia jest 
calkow |ci e tracona w scyntylatorze B. Jednocześnie stosunki 
geometryczne układu określają „pole widzenia” teleskopu, za¬ 
znaczone na rysunku niebieską linią przerywaną 
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Wielkie pęki atmosferyczne są wykorzystywane do 
obserwacji cząstek o energiach większych od ok. 
10 eV; cząstek o takich energiach nie potrafimy 
jeszcze rejestrować w sposób bezpośredni. Wielkie 
pęki atmosferyczne powstają wskutek zderzeń czą¬ 
stek promieniowania kosmicznego o dużych ener- 
£; ach z jądrami atomów tworzących atmosferę ziem¬ 
ską. Cząstki wtórne produkowane w pęku dobiegają 
do powierzchni Ziemi, a nawet wnikają pod jej po¬ 
wierzchnię. Układy detektorów, takich jak liczniki 
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Rys. 3. Schemat wie 
kiego pęku atmosfc 
ryczncgo zapoczątkc 
wanego przez szybfc 
proton (rys. 3 i 5 wi 
O. C. Allkofer, Jnłro 
duction to Cosmi* 
Radiation, Miinchei 
J975) 

















































liczba i scyntylacyjne lub liczniki Geigera-Miillera, rozmiesz- 
rodzaj czone na powierzchni od kilkuset metrów do kilku- 
cząstek nastu kilometrów kwadratowych (pod ziemią, na 
pierwotnych poziomie morza lub na szczytach gór) pozwalają 
określić zarówno rodzaj cząstek pierwotnych, jak 
i ich energię i kierunek przylotu (rys. 3 i 4). Rozwojo¬ 
wi wielkiego pęku atmosferycznego towarzyszy krót¬ 
kotrwały błysk promieniowania Czerenkowa w dzie¬ 
dzinie widzialnej, który może być zarejestrowany przez 
fotomnożnik, kliszę fotograficzną lub inny element 
światłoczuły umieszczony w ognisku niewielkiego 
nawet teleskopu. Analiza błysków Czerenkowa poz¬ 
wala na określenie energii cząstki pierwotnej oraz jej 
kierunku, nie daje jednak informacj i na temat rodzaju 



cząstki będącej źródłem pęku (wyjątek stanowią tylko 
błyski pochodzące od pęków zapoczątkowanych przez 
kwanty y; można je stosunkowo łatwo odróżnić od 
błysków pochodzących od pęków zapoczątkowanych 
przez cząstki; -*■ Astronomia promieni X i y). Za¬ 
stosowanie układów teleskopów optycznych reje¬ 
strujących atmosferyczne promieniowanie Czeren¬ 
kowa rokuje nadzieje na podniesienie dokładności 
pomiarów strumienia cząstek o dużych energiach. 


Oddziaływanie promieniowania kosmicznego 
z magnetosferą i materią międzyplanetarną 

Pole magnetyczne, a dokładniej jego składowa po¬ 
przeczna, wywiera istotny wpływ na ruch cząstek 
obdarzonych ładunkiem elektrycznym. Tory cząstek 
promieniowania kosmicznego są więc określone za¬ 
równo przez rozkład pola magnetycznego w Galakty¬ 
ce (natężenie pola rzędu 10" 10 T), jak i przez znacznie 
silniejsze pole magnetyczne otaczające Ziemię w po¬ 
staci tzw. magnetosfery lub geokorony (-* Fizyka 
przestrzeni okołoziemskiej). Gdy obserwacje wykony¬ 
wane są w pobliżu Ziemi kierunek przylotu cząstki 
promieniowania kosmicznego o energii mniejszej 
od ok. 10 12 eV nie daje żadnych informacji na temat 
kierunku, z którego dana cząstka wbiegła do układu 
planetarnego. Chwilowy wzrost natężenia pola mag¬ 
netycznego otaczającego Ziemię może spowodować, 
że promieniowanie kosmiczne o energii mniejszej od 
pewnej energii granicznej w ogóle nie dobiegnie do 
efekt Ziemi. Od 1937 r. znany jest tzw. efekt Forbusha, 
Forbusha polegający na tym, że ogólny strumień promienio¬ 
wania kosmicznego ulega znacznemu zmniejszeniu 
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w okresach burz geomagnetycznych. Efekt Forbusha 
tłumaczy się działaniem tzw. butelki magnetycznej 
(rys. 5): obszar, w którym pole magnetyczne jest 
wzmocnione, odbija dobiegające z zewnątrz cząstki 
promieniowania kosmicznego. Efekt Forbusha jest 


kierunek obrotu 
> Słońca 


obszar aktywny 


Ziemia 


Rys. 5. Model „butelki magnetycznej" wy¬ 
jaśniający osłabienie strumienia promienio¬ 
wania kosmicznego (o stosunkowo małych 
energiach) w okresie wzmożonej aktywności 
słonecznej 



jednym z przejawów znacznie ogólniejszego zjawiska 
modulacji promieniowania kosmicznego w 11-letnim 
cyklu aktywności słonecznej. Modulacja ta polega na 
okresowych zmianach natężenia promieniowania 
kosmicznego, przy czym wielkość tych zmian zależy 
od energii promieniowania kosmicznego. Zjawisko 
modulacji słonecznej jest wynikiem oddziaływania 
cząstek promieniowania kosmicznego z materią 
i polem magnetycznym, unoszonymi ze Słońca w po¬ 
staci tzw. wiatru słonecznego. Cząstki promieniowania 
kosmicznego, dyfundujące poprzez nieregularności 
pola magnetycznego w wietrze słonecznym, są wyno¬ 
szone wraz z tymi nieregularnościami z układu pla¬ 
netarnego. Istniejące teorie tego zjawiska pozwalają 
przewidzieć w sposób ilościowy osłabienie strumienia 
promieniowania kosmicznego (zależnie od energii) 
oraz zmianę widma energetycznego cząstek w wyniku 
oddziaływania z wiatrem słonecznym. 


Skład i widmo energii promieniowania 
kosmicznego 

Promieniowanie kosmiczne w pobliżu Ziemi (ponad 
atmosferą) składa się w 86% z protonów, w 13% 
z cząstek alfa (jąder helu); około 1% stanowią elek¬ 
trony i jądra pierwiastków cięższych (o liczbie ato¬ 
mowej Z > 3). 

Na rys. 6 porównano skład promieniowania kos¬ 
micznego ze składem chemicznym materii w Układzie 
Słonecznym. Wodór i hel występują w promienio¬ 
waniu kosmicznym mniej obficie, natomiast pier¬ 
wiastki o liczbie atomowej 18 < Z < 24 znacznie 
obficiej niż w materii Układu Słonecznego. Najbar¬ 
dziej uderzający jest jednak fakt, że pierwiastki lit, 
beryl i bor mają w promieniowaniu kosmicznym roz¬ 
powszechnienie pięć rzędów wielkości większe. Przy¬ 
puszcza się, że nadobfitość tych jąder jest wynikiem 
reakcji jądrowych zachodzących między szybkimi 
cząstkami promieniowania kosmicznego i materią 
międzygwiazdową; w wyniku tych reakcji jądra 
ciężkie ulegają rozbiciu na jądra lżejsze. 

Jak dotychczas nie udało się wykryć jąder anty¬ 
materii w promieniowaniu kosmicznym. Istniejące 
dane obserwacyjne pozwalają na określenie górnej 
grasicy rozpowszechnienia antyjąder na 10~ 3 -10” 4 , 
zależnie od zakresu energii. Pozytony (antyelektrony 
obserwowane w promieniowaniu kosmicznym są 
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rozpowszechnienie względne N f$i = l0 6 ) 



Rys. 6. Porównanie rozpowszechnienia N pierwiastków w Ukła¬ 
dzie Słonecznym ze składem promieniowania kosmicznego w po¬ 
bliżu Ziemi (rys. 6 i 10 wg F. B. McDonald and C. E. Fichteł(ed.) 
High Energy Partictes and Quanta in Astrophysics, Cambridge 


cząstkami wtórnymi, powstającymi w wyniku reakcji 
jądrowych promieniowania kosmicznego z materią 
międzygwiazdową. 

protony Protony są w zasadzie jedynymi cząstkami w pro¬ 
mieniowaniu kosmicznym niosącymi pojedynczy ła¬ 
dunek elementarny. W liczbach bezwzględnych, cał¬ 
kowity strumień protonów o energiach większych 
od 10* eV jest równy ok. 2500 cząstek na m 2 steradian 
i sekundę. Obok protonów obserwuje się również 
trwały izotop wodoru — deuter. Drugi izotop wodo- 
ru — tryt — najprawdopodobniej nie występuje 
w promieniowaniu kosmicznym. Tryt jest izotopem 
nietrwałym i ulega przemianie w He 3 z okresem poło¬ 
wicznego zaniku 12,5 lat. W pobliżu Ziemi można 
by więc zaobserwować tylko te jądra trytu, które 
powstały nie dawniej niż kilka razy 12,5 lat. Ekspery¬ 
mentalna górna granica stosunku trytu do protonów 
jest rzędu 10 3 . Różniczkowe widmo energetyczne 
protonów i deutronów w promieniowaniu kosmicz¬ 
nym jest przedstawione na rys. 7. Protony o energiach 
mniejszych od 50 MeV (1 MeV = 10* eV) były ob¬ 
serwowane z satelitów i sond kosmicznych wybiega¬ 
jących poza magnetosferę Ziemi. Obecnie uważa się 
że protony te nie są pochodzenia galaktycznego lecz 
słonecznego, albo też są w jakiś sposób przyspieszane 
w pobliżu Słońca. 

hel Widmo energetyczne jąder He 4 i He 3 występujących 
w promieniowaniu kosmicznym jest przedstawione na 
rys. 8. Widmo He 3 jest określone tylko dla energii 
mniejszych od 300 MeV; jak dotychczas nie potrafi¬ 
my jeszcze rozdzielać izotopów o energiach większych 
od ok. 300 MeV na nukleon. 

Strumień jąder pierwiastków ciężkich jest średnio 
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Rys. 7. Energetyczne widmo protonów i deuteronów. Linią ciągłą 
przedstawiony jest przebieg widma teoretycznego, uzyskanego po 
uwzględnieniu efektów modulacji słonecznej 



Rys. 8. Energetyczne widmo jąder He‘ i He a . Linią ciągłą przed¬ 
stawiony jest przebieg widma teoretycznego, uzyskanego po 
uwzględnieniu efektów modulacji słonecznej 


kilka lub kilkanaście tysięcy razy niniejszy od stru- pierwiastki 
mienia protonów. Na rys. 9 przedstawione jest ciężkie 
widmo energetyczne jąder boru i berylu. Widma takie 
są typowe dla widm wszystkich jąder cięższych od 
helu. Szczególnie interesująca byłaby ewentualna 
obecność w promieniowaniu jąder pierwiastków 
transuranowych. 

Widmo energetyczne elektronów i pozytonów w po- elektrony 
bliżu Ziemi jest przedstawione na rys. 10. Uwagę i pozytony 
zwraca wzrost strumienia elektronów o energiach 
mniejszych od ok. 20 MeV. Nie zostało jeszcze wyja¬ 
śnione, czy elektrony o tych energiach są pochodzenia 
kosmicznego czy słonecznego. Badania czasowych 
zmian strumienia elektronów sugerują jednak, że 
elektrony te są pochodzenia galaktycznego. Pocho- 













energia kinetyczna na cząstkę 

Rys. 9. Energetyczne widma berylu i boru 



energia kinetyczna na cząstkę 

Rys. 10. Obserwowane widmo energetyczne elektronów i pozy¬ 
tonów w pobliżu Ziemi 


dzenie pozytonów wydaje się obecnie dobrze znane: 
pozytony o energiach powyżej kilku MeV powstają 
z rozpadu mezonów ti + produkowanych w reakcjach 
jądrowych zachodzących między promieniowaniem 
kosmicznym i jądrami materii międzygwiazdowej. 
Pozytony o energiach mniejszych od 1 MeV mogą 
być pochodzenia zarówno kosmicznego, jak i słonecz¬ 
nego. Badanie widma pozytonów w tym zakresie ener¬ 
gii może dostarczyć ciekawych informacji na temat 
innych (niż rozpad mezonów) źródeł pozytonów. 


Pochodzenie promieniowania kosmicznego 

Każda teoria mająca na celu wjaśnienie pochodzenia 
promieniowania kosmicznego musi uwzględniać 
trzy podstawowe fakty: 1) Gęstość energii promienio¬ 
wania kosmicznego jest rzędu 10" ł * J-cm" 3 , czyli 
jest tego samego rzędu co inne postacie energii wy¬ 
stępujące w przestrzeni międzygwiazdowej, takie jak 
energia związana z promieniowaniem reliktowym, 
energia pola magnetycznego, czy energia kinetyczna 
obłoków materii międzygwiazdowej. 2) Widmo ener¬ 
getyczne promieniowania kosmicznego można przy¬ 
bliżyć wyrażeniem E~ y 9 gdzie E oznacza energię, a wy¬ 
kładnik y jest równy około 2,5. 3) Średni czas życia 
cząstek promieniowania kosmicznego jest rzędu 10 8 
lat, po upływie tego czasu cząstki tracą znaczną część 
swej energii wskutek oddziaływań z rozproszoną ma¬ 
terią, polem magnetycznym i rozrzedzonym promie¬ 
niowaniem, występującymi w przestrzeniach między- 
gwiazdowych, a być może również — międzygalak- 
tycznych (-> Radioastronomia). Tempo utraty ener¬ 
gii jest tym większe, im większa jest energia cząstki. 

Jeżeli źródłem promieniowania kosmicznego są pro¬ 
cesy przebiegające w obrębie Galaktyki, wówczas 
należy jeszcze uwzględnić straty cząstek o bardzo 
dużych energiach wynikające z ich „wyciekania” 
z obszaru Galaktyki. 

Obserwowane obecnie promieniowanie kosmiczne 
należy więc uważać za wynik ustalenia się stanu sta¬ 
cjonarnego między procesami tworzenia nowych 
cząstek o dużych energiach i procesami, które pro¬ 
wadzą do zmniejszenia ich energii; jeżeli promienio¬ 
wanie kosmiczne nie jest zjawiskiem chwilowym, to 
jego źródła muszą istnieć również obecnie. Podsta¬ 
wowy problem, czy źródłami tymi są obiekty galak¬ 
tyczne czy pozagalaktyczne, nie został jeszcze osta¬ 
tecznie rozwiązany. Za galaktycznym pochodzeniem 
promieniowania kosmicznego przemawia fakt, że pochodzenie 
energia konieczna do podtrzymania obserwowanego galaktyczne 
strumienia promieniowania kosmicznego może być 
dostarczona przez znane nam obecnie obiekty galak¬ 
tyczne, w których przebiegają procesy gwałtownego 
wydzielania ogromnych ilości energii. Biorąc pod 
uwagę podaną wyżej gęstość energii promieniowania 
kosmicznego, jego średni czas życia, oraz objętość 
Galaktyki łącznie z halo galaktycznym (10* 8 cm 3 ), 
możemy ocenić energię konieczną do zachowania 
strumienia promieniowania kosmicznego na jego 
obecnym poziomie. Jest on rzędu 10 -19 * 10*^/3 • 10 1 * = 

= 3-10 33 J'S -1 . Energia ta może być wyzwalana 
podczas wybuchów supernowych Qeden wybuch super¬ 
nowej może prowadzić do wydzielenia energii rzędu 
10 43 J, przy czym wybuchy następują średnio co 50 
lat) oraz może być dostarczana w sposób ciągły kosz¬ 
tem energii rotacyjnej -* Pulsarów (energie rotacji 
pulsarów ocenia się na 10 4 * J. 

Z drugiej jednak strony wiadomo, że niektóre pochodzenie 
obiekty pozagalaktyczne (np. radiogalaktyki lub pozagalak- 
kwazary) emitują ogromne ilości energii, której część tyczne 
może mieć postać promieniowania kosmicznego. 

Izotropowość strumienia cząstek o energiach więk¬ 
szych od 10 17 eV sugeruje, że cząstki te, a przynaj¬ 
mniej ich część, mogą być pochodzenia pozagalaktycz- 
nego. Strumień takich cząstek w przestrzeni między- 
galaktycznej nie może być jednak zbyt duży, ponieważ 
ich oddziaływanie z protonami materii międzygalak- 
tycznej, nawet przy bardzo małej jej gęstości, byłoby 
źródłem' silniejszego niż się obserwuje izotropowego 
strumienia kwantów gamma o energiach większych 
od 10* eV. Ponadto, droga wysokoenergetycznych 
cząstek w przestrzeni międzygalaktycznej nie może 
być zbyt długa, ze względu na straty energii wynika¬ 
jące z oddziaływania z fotonami promieniowania 
reliktowego. Obecnie uważa się za bardziej prawdo¬ 
podobne, że promieniowanie kosmiczne jest pocho¬ 
dzenia galaktycznego. 

O. C. Allkofer Introduction to Cosmic Radiation, MUnchen 
1975; K. M. V. Apparao Composition of Cosmic Radiation, Lon¬ 
don 1975; A. M. Hillas Cosmic Rays y New York 1972. 
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Rozpowszechnienie pierwiastków 
chemicznych i molekuł we Wszechświecie 

Bronisław Kuchowicz 


W połowie ubiegłego stulecia twórca filozofii pozy¬ 
tywnej A. Comte głosił, iż nauki powinny ograniczyć 
się do badania zjawisk bezpośrednio dostępnych 
obserwacji, a zatem skład chemiczny gwiazd pozostać 
musi poza zasięgiem ludzkiego poznania. W kilka 
lat po tym stwierdzeniu powstała analiza widmowa 
(R. W. Bunsen i G. R. Kirchhoff — 1859 r.), która 
jest podstawą wyznaczania składu chemicznego atmo¬ 
sfer gwiezdnych. W 1868 r., podczas całkowitego 
zaćmienia Słońca, J. Janssen i N. Lockyer zaobser¬ 
wowali w widmie protuberancji słonecznych jasną 
odkrycie linię żółtopomarańczową, niepodobną do żadnej 
helu linii znanej z laboratorium. Tak odkryto hel; pier¬ 
wiastek ten dopiero po dwudziestu kilku latach wykry¬ 
to w laboratorium ziemskim. 

Rozwój analizy widmowej spowodował, że obecnie 
znacznie dokładniej znamy skład chemiczny atmosfer 
gwiazd oddalonych o milion lat świetlnych niż skład 
chemiczny wnętrza Ziemi. Metodami radioastronomii 
rozszyfrowano w ostatnim dziesięcioleciu skład che¬ 
miczny obłoków gazowo-pyłowych w przestrzeni 
kosmicznej (-► Radioastronomia). Pojęcie składu 



Rys. 1. Powiązanie badań kosmochemicznych z zagadnieniami 
wytwarzania energii w gwiazdach i nukleosyntezy pierwiastków. 
W kółkach umieszczono skróty nazw dyscyplin naukowych: 
FPK Fizyka promieniowania kosmicznego, MHD magnetohy- 
drodynamika, KRT kontrolowane reakcje termojądrowe (ra¬ 
czej krąg zagadnień, z którego może rozwinąć się odpowiednia 
dyscyplina techniczna), FP fizyka plazmy, FJ fizyka jądrowa, 
AJ astrofizyka jądrowa, K kosmologia, OT W ogólna teoria 
względności, APG astrofizyka powłok gwiezdnych, FA fizyka 
atomowa, SM spektroskopia molekularna, RA radioastronomia, 
KM kosmochemia molekularna, ChR chemia radiacyjna, ChO 
chemia organiczna, ECh ewolucja chemiczna (kompleks zagad¬ 
nień z pogranicza chemii, biochemii i biologii), S selenochemia 
(oraz chemia innych planet, do których docierają ludzie lub 
próbniki, np. chemia Marsa itp.), G geochemia, M meteorytyka, 
ChA chemia analityczna. Z lewej strony wymieniono niektóre 
nowoczesne urządzenia doświadczalne i metody badań, związane 
z przedstawioną tematyką 
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chemicznego nie jest jednoznaczne, można mieć 
bowiem na myśli zarówno skład pierwiastkowy jak 
i skład molekularny. W związku z tym w kosmochemii 
można wyróżnić: kosmochemię molekularną oraz 
kosmochemię pierwiastków i związaną z nią kosmo¬ 
chemię ich izotopów. Skład molekularny materii 
ziemskiej, meteorytowej, księżycowej wyznacza się 
stosując różne metody laboratoryjne chemii, nato¬ 
miast obecność połączeń chemicznych w atmosfe¬ 
rach gwiazd — wykorzystując widma molekularne 
znane z laboratoriów ziemskich. Identyfikację połą¬ 
czeń chemicznych obecnych w obłokach materii 
kosmicznej prowadzi się na podstawie detekcji ich 
linii widmowych w zakresie radiowym i mikrofalo¬ 
wym. Podkreślmy w tym miejscu, że kosmochemia 
molekularna zajmuje się kosmicznym rozpowszech¬ 
nieniem wszelkich połączeń chemicznych, nie tylko 
molekuł, ale także rodników i jonów molekularnych. 

Przy znikomych gęstościach materii w przestrzeni 
kosmicznej (obłoki gazowo-pyłowe uważane są za bar¬ 
dzo gęste, jeśli w objętości 1 cm 3 znajduje się 10 5 - 
-10 7 atomów!) rodniki i jony nie różnią się w zasadzie 
trwałością od normalnych molekuł. 

Kosmochemia zawiera także istotny element histo- rozpowsza- 
ryczny: opis procesów powstawania zasadniczch chnienie 
struktur chemicznych we Wszechświecie. Procesy a powsta- 
powstawania pierwiastków chemicznych (ściślej zaś: wanie 
procesy powstawania rozmaitych odmian jąder pierwia- 
atomowych) wyjaśnia się dziś reakcjami jądrowymi stków 
przebiegającymi w sposób naturalny we Wszech¬ 
świecie (czy to w rozszerzającym się Wszechświecie 
w pierwszych fazach jego rozwoju, czy też w gwiaz¬ 
dach). Analogicznie odwołujemy się do różnych reak¬ 
cji chemicznych (w znacznej części do tych, którymi 
zajmuje się w laboratoriach chemia radiacyjna) w celu 
wyjaśnienia sposobu powstawania połączeń chemicz¬ 
nych obserwowanych w Układzie Słonecznym, w at¬ 
mosferach gwiazd i obłokach gazowo-pyłowych. 

Powiązania między problematyką rozpowszech¬ 
nienia pierwiastków chemicznych i ich połączeń 
a powstaniem ich we Wszechświecie oraz różnymi 
kierunkami badań laboratoryjnych ukazuje rysunek I. 


Najogólniejsze dane o pierwiastkach 
chemicznych i ich izotopach 

Zestawienie liczby znanych pierwiastków i ich izo¬ 
topów wskazuje na znaczenie mechanizmów jądro¬ 
wych w powstawaniu pierwiastków chemicznych (ta¬ 
bela 1). Pierwiastek nazywa się trwałym, gdy przynaj¬ 
mniej jeden z jego izotopów jest trwały; w przeciw¬ 
nym razie pierwiastek nazywamy promieniotwórczym. 

Trwałymi są kolejne pierwiastki w układzie okreso¬ 
wym od wodoru do bizmutu, z wyjątkiem technetu 
i prometu. Istnieje 81 pierwiastków trwałych, na które 
przypadają 272 trwałe nuklidy (-> Jądra atomowe 
i ich wzbudzenia). Każdy pierwiastek trwały ma więc 
średnio po 3,36 trwałych izotopów. Jeśli podzielimy 
pierwiastki na nieparzyste (tzn. mające nieparzystą pierwiastki 
liczbę porządkową Z) i parzyste, natychmiast uwi- parzyste 
doczni się charakterystyczne uprzywilejowanie pier- i nieparzyste 
wiastków parzystych. Jest ich 41, mają zaś łącznie 
216 izotopów, tak więc na każdy pierwiastek parzysty 
przypada średnio po 5,27 trwałych izotopów. Jedy¬ 
nie trzy pierwiastki parzyste mają mniej niż po trzy 
izotopy trwałe. Grupa 40 pierwiastków nieparzystych 
składa się z 24 pierwiastków mających tylko jeden 
izotop trwały i z 16 pierwiastków mających po dwa 

































Tabela I. Znane pierwiastki i ich izotopy 



Liczba 


pier¬ 

wiast¬ 

ków 

nukli¬ 

dów 

Trwałe (od Z ~ 1 do 83. bez 43 i 61) 
Promieniotwórcze występujące na Ziemi 

81 

272 

a) Z < 83 i A < 206 

b) Z > 83 i 206 (od Z — 84 (Po) 


13* 

do Z “ 92 (U) i Z = 94 (Pu» 
Promieniotwórcze obserwowane poza Ziemią 

10 

46 

(Z = 43 (Tc), 61 (Pm), 95 (Am) i 96 (Cm)) 
Łącznie występujące w przyrodzie (trwałe 

4 

4** 

i promieniotwórcze) 

Sztuczne wytworzone (wyłącznie promienio¬ 

95 

335 

twórcze)— nuklidy wg zestawienia z 1968 r. 

12 

1192 

Ogółem 

107 

1527 


* Należą tu nuklidy długożyjące, które do dziś przetrwały 
w skorupie ziemskiej, np. l JJNd o okresie połowicznego zaniku 
ok. 2,1*10 I# lat, jak również krótkożyiący tryt JH (T ift = 12,346 
lat) i radiowęgicl *iC (T vz = 5730 lat), wytwarzane stale w gór¬ 
nych warstwach atmosfery przez promieniowanie kosmiczne. 

** Podajemy minimalną liczbę nuklidów, ponieważ nie jest do¬ 
kładnie znany skład izotopowy czterech wymienionych pierwia¬ 
stków w warunkach pozaziemskich. 


izotopy trwałe. Żaden pierwiastek nieparzysty nie ma 
większej liczby trwałych izotopów; średnia w tej 
grupie wynosi 1,40 trwałego izotopu na pierwia¬ 
stek. 

uprzywilejo- Uprzywilejowanie liczb parzystych staje się jeszcze 
wanie liczb bardziej widoczne, jeśli grupę 272 trwałych nuklidów 
parzystych podzielimy na cztery podgrupy zależnie od kom¬ 
binacji parzystej lub nieparzystej liczby protonów Z 
z parzystą lub nieparzystą liczbą neutronów N. Jest 
aż 161 nuklidów parzysto-parzystych (tj. o parzystych 
liczbach Z i N), 55 parzysto-nieparzystych, 50 nie- 
parzysto-parzystych i zaledwie 6 nieparzysto-nie- 
parzystych. Znaczną przewagę nuklidów parzysto- 
parzystych (prawie 60%) powiązać można ze znanym 
z fizyki jądrowej faktem: najtrwalej związane są 
jądra o parzystej liczbie protonów i parzystej liczbie 
neutronów, słabiej — jądra, w których tylko jedna 
7 tych liczb jest parzysta, najmniejszą wreszcie trwa¬ 
łością odznaczają się jądra nieparzysto-nieparzyste. 


Skład pierwiastkowy i izotopowy 
obiektów we Wszechświacie 

Najstarszym działem kosmochemii jest geochemia; 
obecnie znamy dokładnie średni skład chemiczny 
warstw powierzchniowych Ziemi. Analiza widmowa 
dostarczyła danych o obecności różnych pierwiastków 
chemicznych w atmosferach gwiazd i galaktyk. De¬ 
tektory promieniowania jonizującego umieszczane 
na pokładach rakiet i sztucznych satelitów umożliwiają 
badanie składu chemicznego i izotopowego pierwot¬ 
nego promieniowania kosmicznego i wiatru słonecz¬ 
nego. 

Z astrofizyki obserwacyjnej wiadomo, że wszędzie, 
gdzie materia występuje w postaci atomów, są to 
atomy pierwiastków, które znamy z laboratorium na 
Ziemi. (Zastrzeżenie „w postaci atomów’* jest ko¬ 
nieczne z uwagi na możliwość występowania tak nie¬ 
zwykłych form materii, jak materia nadgęsta (ją¬ 
drowa) w gwiazdach neutronowych (-+ Czarne dziury 
i zapadanie grawitacyjne, a także czarne dziury 
— produkt końcowy zapadania grawitacyjnego). 
Wszechświat jest właściwie jednolity, a zarazem nie¬ 
zwykle różnorodny. Niema dwóch gwiazd o identycz¬ 
nych widmach. Przy wszystkich jednak różnicach 
prawidło- składu chemicznego między indywidualnymi ciałami 
wości niebieskimi udało się znaleźć pewne wspólne dla nich 
rozpowsze- prawidłowości rozpowszechnienia pierwiastków. Są 
chnienia one widoczne dopiero po nagromadzeniu dużego 
pierwiastków materiału obserwacyjnego oraz po zrozumieniu me¬ 


chanizmów fizycznych związanych z powstaniem 
widm liniowych w atmosferach gwiazd. Występowanie 
linii (kształt i natężenie) widmowych określonych 
pierwiastków w obserwowanym przez nas widmie 
gwiazdy wywołane jest w pierwszym rzędzie takimi 
czynnikami jak temperatura i ciśnienie w obszarze, 
z którego promieniowanie to pochodzi. Stwierdzenie 
linii widmowych określonego pierwiastka nie wy¬ 
starcza do oceny ilości jego atomów w atmosferze 
gwiazdy, ze stosunku zaś natężeń^linii w widmach 
dwóch gwiazd o odmiennych temperaturach czy też 
różniących się ciśnieniem na ich powierzchni (np. 
biały karzeł i olbrzym) nie można bezpośrednio wnios¬ 
kować o stosunku rozpowszechnienia tegoż pierwia¬ 
stka w obu rozpatrywanych atmosferach. 

Najlepiej znamy skład pierwiastkowy Układu Sło- skład _ 
necznego: dotyczy to zwłaszcza pierwiastków o małym pierwiast- 
rozpowszechnieniu, których linii w odległych gwiaz- kowy 
dach nie da się zauważyć. Skład pierwiastkowy ma- Układu 
terii Układu Słonecznego zwykło się uważać za ty- Słonecznego 
powy dla materii kosmicznej z tej części Wszechświa¬ 
ta, która dostępna jest obserwacjom. Nasza obecna 
wiedza kosmochemiczna o składzie izotopowym pier¬ 
wiastków chemicznych w przeważającej części jest 
oparta na wyznaczeniu składu izotopowego tychże 
pierwiastków w materii ziemskiej — metodami spek¬ 
troskopii masowej. Skład izotopowy próbek materii 
meteorytowej, księżycowej, a w przyszłości chyba 
i próbek pobranych z różnych planet Układu Sło¬ 
necznego nieznacznie tylko różni się od składu izoto¬ 
powego próbek ziemskich. Wreszcie skład izotopowy 
pierwiastków chemicznych na Ziemi nie różni się 
w sposób istotny od składu tychże pierwiastków 
w atmosferach Słońca i większości gwiazd, a także 
w obłokach gazowo-pyłowych — przynajmniej 
w tych nielicznych wypadkach, w których analiza 
widmowa w optycznym, a nawet radiowym zakre¬ 
sie długości fal, pozwala na oznaczenie takiego 
składu. 

Analiza widm atomowych jedynie w nielicznych 
wypadkach, np. dla pierwiastków najlżejszych, ma¬ 
jących po dwa izotopy trwałe znacznie różniące się 
masą (wodór lub hel), pozwala ustalić skład izoto¬ 
powy. Przesunięcie izotopowe odpowiednich linii 
widmowych cięższej odmiany takiego pierwiastka 
w stosunku do lżejszej można jednak zaobserwować 
w widmie gwiazdy tylko wtedy, gdy zawartości obu 
odmian w atmosferze gwiazdy niewiele się różnią. 

Weźmy np. hel; jeśli skład izotopowy tego pierwia¬ 
stka w gwiazdach nie odbiega znacznie od składu 
jego na Ziemi, tzn. na milion atomów 4 He przypada 
mniej więcej jeden atom 3 He, nie ma praktycznie 
możliwości wykrycia tak znikomych ilości lekkiego 
izotopu helu 3 He w gwiazdach. Tak też jest istotnie ( 
dla większości gwiazd. Możliwość obserwacji 3 He 
istnieje natomiast dla pewnych gwiazd z anomaliami 
składu, jak gwiazda magnetyczna 21 Aąuilae, którą 
charakteryzuje względny nadmiar (w porównaniu 
z helem ziemskim i słonecznym) lekkiego izotopu 
helu 3 He. 

Oprócz pierwiastków najlżejszych, mierzalne war¬ 
tości przesunięć izotopowych w widmach atomowych 
wykazują także pierwiastki ciężkie, poczynając od 
lantanowców. W środkowej natomiast części układu 
okresowego, dla pierwiastków między wapniem a lan- 
tanowcami (20 ^ Z ^ 56), całkowite przesunięcie 
izotopowe (stanowiące wypadkową zwykłego i szcze¬ 
gólnego efektu masowego oraz efektu objętościo¬ 
wego, dających wkłady o różnych znakach) praktycz¬ 
nie równe jest zeru. Składu izotopowego powyższych 
pierwiastków nie dałoby się więc wyznaczyć na grun¬ 
cie analizy widmowej nawet wtedy, gdyby izotopy 
jakiegoś pierwiastka odznaczały się zbliżonymi war¬ 
tościami rozpowszechnienia. 

Nie ma powodu aby przypuszczać, iż materia ziem¬ 
ska odznacza się jakimś specyficznym składem izoto¬ 
powym. Przyjęcie, że Ziemia nie znajduje się w cen- zasada 
tralnej, specjalnie wyróżnionej pozycji, nazywa się Kopernika 
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w kosmologii zasadą Kopernika. Tylko mały krok 
dzieli tę powszechnie zaakceptowaną zasadę od stwier¬ 
dzenia, ze pozycja i skład chemiczny Układu Sio- 
necznego są typowe. Skład izotopowy niektórych 
pierwiastków w skorupie ziemskiej z umieszczonej 
niżej tabeli 2 uważać więc można, zgodnie z ową 
zasadą, za typowy dla pierwiastków w materii kos¬ 
micznej. 

Tabela 2. Skład izotopowy niektórych pierwiastków 
w skorupie ziemskiej 


Pierwiastek 

Zawartość poszczególnych izotopów (w%) 

Pierwiastki lekkie 
Wodór ,H 

JH^H *= 99,985:0,015 

Hel ,Hc 

He:*Hc = 0,00013:99,99987 

Węgiel 6 C 

- 98,893:1,107 

Krzem 14 Si 

JJSi:JJSi:’®Si «= 92,21:4,70:3,09 

Siarka , e S 

- 95 , 0 : 0 , 76 : 4 , 22 : 0,014 

Pierwiastki ciężkie 
Tellur M Te 

1 m T c: M Tc T«: «Te :^Te :™Tc : 12 2 *Tc: 


: ”jTc = 0,089:2,46:0,87:4,61:6,99:I8,71: 
:31,79:34,48 

Antymon 6 ,Sb 

MSb: ,2 5Sb - 57,25:42,75 

Dysproz #6 Dy 

« D yt^Dy.^Dy.^jDyr^Dy^JjDy: 
;, JJ D y = 0.052:0,090:2,29:18,88:25,53: 
:24,97,:28,I8 

Rtęć 80 Hg 



: uoHg = 0,146:10,02:16,84:23,13:13,22: 
29,80:6,85 


skład 
izotopowy 
C, O, S, H w 
materii 
międzygwia- 
zdowej 


Istnieją pewne grupy obiektów kosmicznych, 
w których skład pierwiastkowy i skład izotopowy 
pierwiastków różnią się istotnie od odpowiednich 
wartości dla materii ziemskiej; różnice te można wy¬ 
jaśnić na gruncie teorii ewolucji gwiazd i związanych 
z nią procesów nukleosyntezy pierwiastków chemicz¬ 
nych. Nie wnikając głębiej w to zagadnienie podajmy 
dla przykładu dane odnoszące się do składu izotopo¬ 
wego rtęci w dwu gwiazdach osobliwych typu A. 
Z analizy widma gwiazdy o numerze katalogowym 
HR 5883 wynika, że obecne są w niej tylko dwa naj¬ 
cięższe izotopy rtęci: 202 Hg (3%) i 204 Hg (97%). Pięć 
lżejszych izotopów rtęci, stanowiących ilościowo 
prawie 2 / 3 rtęci ziemskiej (patrz najniższy wiersz w ta¬ 
beli 2), w gwieździe owej praktycznie całkiem nie 
ma. A oto oceniony przez G.W. Prestona (1971 r.) 
skład izotopowy rtęci w innej gwieździe osobliwej 

o numerze katalogowym HR 4072: 200 Hg i 201 Hg_ 

łącznie ok. 4%, 202 Hg—37%, 204 Hg _ 59% , tu 
praktycznie nie ma wcale trzech najlżejszych izoto¬ 
pów rtęci. 

W ostatnim dziesięcioleciu wyznaczono metodami 
radioastronomii skład izotopowy wielu pierwiastków 
dość rozpowszechnionych i wchodzących w skład ob¬ 
serwowanych molekuł. Przesunięcie izotopowe w wid¬ 
mach molekularnych (w zakresie radiowym i mikro¬ 
falowym) jest czasami znacznie łatwiej stwierdzić niż 
w widmach atomowych. Szczególnie dobrze nadają 
się do tego celu proste molekuły dwuatomowe i rod¬ 
niki (jak OH, CO, CS). Tą drogą udało się oznaczyć 
skład izotopowy węgla, tlenu, siarki i wodoru w obło- 
kach materii międzygwiazdowej; skład ten niewiele 
różni się od składu ziemskiego. W analogiczny spo¬ 
sób wykorzystuje się pasma molekularne w widmach 
chłodniejszych gwiazd (typy widmowe GS i później¬ 
sze), w których oznaczać można skład izotopowy 
węgla lub tlenu. 

Skład izotopowy poszczególnych pierwiastków w 
materii ziemskiej niewiele różni się od składu materii 
Układu Słonecznego, natomiast nie można tego po¬ 
wiedzieć o składzie pierwiastkowym. Rozkład tem¬ 
peratur i ciśnień w obłoku gazowo-pyłowym, z które- 
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go powstały (drogą kondensacji, nukleacji i wzrostu 
przez akrecję) ciała Układu Słonecznego nie był rów¬ 
nomierny. Spadek temperatur i ciśnień w miarę od¬ 
dalenia się od ciała centralnego wywołał zróżnicowa¬ 
nie materii mgławicy pierwotnej, spowodowane różną 
lotnością pierwiastków, co szczególnie wpłynęło na 
lokalne przebiegi procesu kondensacji. W wyniku 
działania tych czynników planety bliższe Słońca 
(planety grupy ziemskiej) — Merkury, Wenus, Zie¬ 
mia i Mars są ubogie w pierwiastki najbardziej 
lotne wodór i hel, które dominują w materii Jo¬ 
wisza, bardziej oddalonego od Słońca. Nierównomier¬ 
ny rozpowszechnienia pierwiastków w Układzie 
Słonecznym odnosi się nie tylko do pierwiastków 
o rożnej lotności, ale i frakcjonowania metali i krze¬ 
mianów, które m.in. doprowadziło do utworzenia 
jąder metalicznych planet grupy ziemskiej. 

Uniwersalne krzywe rozpowszechnienia 
i pewne ogólne prawidłowości 

Od kilkudziesięciu lat trwają próby uogólnienia da- 
nych o rozpowszechnieniu pierwiastków i ich izoto¬ 
pów w materii ziemskiej, meteorytowej, słonecznej, 
atmosferach gwiazd i promieniowaniu kosmicznym 
Informacje uzyskane z różnych źródeł okazały się 
dość zbliżone i pozwoliły na ustalenie średniego roz¬ 
powszechnienia pierwiastków (i ich izotopów) w ma¬ 
terii naszej Galaktyki. Największa liczba najdokład¬ 
niejszych danych odnosi się do materii Układu Sło¬ 
necznego, stąd też otrzymane krzywe średniego roz¬ 
powszechnienia: pierwiastków (rys. 2) i izobarów 
(rys. 3) nazywa się niekiedy krzywymi rozpowszech¬ 
nienia dla Układu Słonecznego, choć stosowana jest 
i ogólna nazwa uniwersalnych krzywych rozpowszech¬ 
nienia. Tę drugą nazwę będziemy dalej stosować w ce¬ 
lu podkreślenia zasadniczej różnicy między tymi 
uśrednionymi krzywymi a konkretną krzywą roz- 
powszechnienia odnoszącą się do określonego ciała 
niebieskiego. 

Obie krzywe empiryczne przedstawione są przy rozpowsze- 
użyciu skali logarytmicznej dla osi rzędnych, różnica chnienie N(X) 
owiem między najwyższą i najniższą wartością roz- pierwiastka 
powszechnienia sięga niemal dwunastu rzędów wiel¬ 
kości. Rozpowszechnieniem N(X) jakiegoś pier- 
wiastka X nazywa się liczbę atomów tego pierwiastka 
przypadającą na milion atomów krzemu w danym 
ośrodku. Tak więc u podstaw skali rozpowszechnienia 
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Rys. 2 . Krzywa rozpowszechnienia pierwiastków chemicznych 
W 8 , ^ r V crona < l973 >; w górze na prawo — schematyczny kontur 
krzywej z zaznaczeniem lokalnych maksimówi minimum Li-Be-B 
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tkwi umowne przyjęcie W (Si) = 10 6 ; dogodność wy¬ 
boru takiej podstawy skali uzasadnia fakt, że roz¬ 
powszechnienie większości pierwiastków ciężkich 
wyraża się liczbami rzędu jedności. 

Podsumujmy kilka charakterystycznych prawidło¬ 
wości rozpowszechnienia pierwiastków chemicznych. 
Pierwsze trzy spośród nich odczytać można łatwo 

Z 7) S Pierwiastkiem najbardziej rozpowszechnionym 
jest wodór (mniej więcej 90% wszystkich atomów). 



6) Wśród jąder lekkich szczególnie dużym roz- jądra 
powszechnieniem odznaczają się te jądra, których o >4:4 
liczba masowa A jest wielokrotnością czwórki (np. 

‘He, 12 C, lc O, 20 Ne, 24 Mg, 28 Si, 32 S). Ostatnia grupa 
praw idłowości empirycznych jest związana ze składem 
izotopowym pierwiastków mających więcej niż jeden 
izotop trwały. Wymienimy tu jedynie dwie najważ¬ 
niejsze prawidłowości. 

7) Wśród pierwiastków lekkich (pierwiastki o Z < pierwiastki 
^ 30, tj. od wodoru do cynku włącznie) najbardziej o Z ^ 30 
rozpowszechnione są izotopy lżejsze; wyjątkami są 

tu hel He (Z = 2), lit Li (Z = 3), bor B (Z = 5), 
argon Ar (Z = 18) i wanad V (Z = 23). 

8) Pierwiastki ciężkie (o liczbie atomowej Z > 30, pierwiastki 
tj. 2 / 3 układu okresowego, nie licząc odległych o Z > 30 
transuranowców, w przyrodzie nie obserwowanych) 
charakteryzuje przewaga izotopów cięższych, przy 

czym przewaga ta jest tym wyraźniejsza, im więcej 
trwałych izotopów ma dany pierwiastek. Dla pier¬ 
wiastków o dwóch izotopach trwałych możliwe są 
niewielkie odstępstwa od tej reguły (patrz np. anty¬ 
mon Sb w tabeli 2). 

Skład izotopowy przykładowo wybranych pier¬ 
wiastków w tabeli 2 ilustruje dość dobrze dwie ostatnie 
prawidłowości. Można jeszcze wymienić jedną pra¬ 
widłowość empiryczną, mniej wyraziście uwypukloną 
(istnieje bowiem aż 6 wyjątków). 

9) Najlżejszy izotop parzystych pierwiastków cięż¬ 
kich jest z reguły izotopem o najniższym rozpowszech¬ 
nieniu, a zawartość jego w składzie danego pierwiastka 
jest zwykle rzędu 0,1%, niekiedy tylko dochodzi do 
ok. 2%. Wyjątkami są tu: german Ge (Z = 32), cyr¬ 
kon Zr (Z = 40), molibden Mo (Z = 42), ruten Ru 
(Z = 44), neodym Nd (Z = 60) i samar Sm (Z = 62). 


liczba masowa A 

Rys. 3. Krzywa rozpowszechnienia izobarów wg Camerona (1973) 
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Drugie miejsce zajmuje hel (o rząd mniej niż wodoru). 
Reszta pierwiastków stanowi łącznie mniej niż 1% 
całkowitej liczby atomów, a prawie 90% tej reszty, to 
atomy czterech lekkich pierwiastków: węgla C (Z = 
= 6), tlenu O (Z = 8), azotu N (Z = 7) i neonu Ne 
(Z = 10). 

2) Począwszy od węgla, pierwiastki parzyste mają 
na ogół większe rozpowszechnienie niż sąsiadujące 
z nimi pierwiastki nieparzyste. Różnica ta stopniowo 
maleje ze wzrostem liczby atomowej Z. 

3) Rozpowszechnienie pierwiastków (jeśli pominąć 
wspomniany przed chwilą efekt parzystości Z) maleje 
na ogół regularnie ze wzrostem liczby atomowej Z. 

4) Lokalne nieregularności na krzywej rozpowszech¬ 
nienia pojawiają się w kilku miejscach: a) Charakte¬ 
rystyczna nieciągłość występuje przy gwałtownym 
spadku rozpowszechnienia (o ok. 7 rzędów wielkości) 
dla trzech pierwiastków lekkich: litu, berylu i boru. 
Po przejściu przez tę nieciągłość krzywa rozpowszech¬ 
nienia biegnie tak, jak gdyby była przedłużeniem 
odcinka łączącego wartości rozpowszechnienia dla 
wodoru i helu. b) Dalej na opadającej krzywej roz¬ 
powszechnienia pojawiają się maksima lokalne: 
pewne pierwiastki czy też ich grupy odznaczają się 
rozpowszechnieniem znacznie większym niż sąsiednie. 
Pierwsze z tych maksimów oznaczone symbolem Fe 
związane jest z grupą żelazowców. Występowanie jego 
wiąże się ze znanym z fizyki jądrowej faktem, iż jądra 
pierwiastków z otoczenia żelaza mają największą 
wartość energii wiązania przypadającą na pojedynczy 
nukleon, są więc najtrwalsze. Dalsze maksima lokal¬ 
ne wiążą się z magicznymi liczbami neutronów i od¬ 
czytać je można wyraźniej z krzywej rozpowszechnie¬ 
nia izobarów, która zawiera więcej szczegółów niż 
krzywa rozpowszechniania pierwiastków. 

Dalsze prawidłowości empiryczne odczytać można 
z krzywej rozpowszechnienia izobarów. 

5) Izobary o parzystym A są na ogół bardziej roz¬ 
powszechnione niż sąsiednie izobary o nieparzystym 
A (analogicznie jak w punkcie 2). 


Prawidłowości rozpowszechnienia 
nuklidów a fizyka jądrowa 

Informacje podane w poprzednim punkcie oraz brak brak 
jakiejkolwiek okresowości w uniwersalnej krzywej okresowych 
rozpowszechnienia z rys. 2 (a więc brak związku mię- prawidło- 
dzy rozpowszechnieniem pierwiastków chemicznych wości 
we Wszechświecie a ich właściwościami chemicznymi) 
wskazują, że rozpowszechnienia pierwiastków niepo¬ 
dobna powiązać w sposób przyczynowy z chemią. Już 
od czasów Mendelejewa usiłowano bezskutecznie 
znaleźć okresowe prawidłowości w rozpowszechnie¬ 
niu pierwiastków chemicznych. Pierwiastki o tak po¬ 
dobnych właściwościach chemicznych jak metale alka¬ 
liczne różnią się dość istotnie rozpowszechnieniem 
(stosunek rozpowszechnienia w skorupie ziemskiej 
jest: Li :Na:K:Rb:Cs = 470:125 000:67100:137: 

: 3,8), natomiast pierwiastki o odmiennych właści¬ 
wościach chemicznych mają zbliżone wartości roz¬ 
powszechnienia (np. litu jest mniej więcej tyle co 
chloru). Nie dziwmy się, że tak jest. Wszak chemia nie 
opisuje powstania pierwiastków chemicznych, jej 
przedmiotem badań są właściwości tych pierwiastków 
oraz powstawanie i właściwości ich związków. Po¬ 
wstanie pierwiastków — to już właściwie metache- 
mia. 

Natomiast fizyka jądrowa, dziedzina zajmująca 
się przemianami promieniotwórczymi jednych pier¬ 
wiastków w inne oraz reakcjami jądrowymi prowadzą¬ 
cymi do przekształcania się jąder atomowych, wska¬ 
zuje nam od ponad pół wieku na mechanizm tworze¬ 
nia się pierwiastków chemicznych. To, co realizujemy 
dziś w laboratoriach jądrowych, co jest produktem 
ubocznym pracy reaktora jądrowego i eksplozji bomb 
atomowych i wodorowych, może równie dobrze prze¬ 
biegać w warunkach naturalnych, w przyrodzie. 

Reakcje jądrowe zachodzą bowiem we wnętrzach 
gwiazd, dostarczając im nieustannie energii, a jedno¬ 
cześnie zmienia się skład chemiczny materii we wnę¬ 
trzu gwiazdy, tworzą się nowe pierwiastki. 

Krzywe z rys. 2 i 3 są pewnym średnim wzorcem, 
z którym porównywać można rozpowszechnienie 


983 























połączenia 
chemiczne 
w kosmosie 


pierwiastków i izobarów w poszczególnych obiektach. 
Występujące indywidualne odchylenia można wytłu¬ 
maczyć odwołując się do przebiegających w danych 
obiektach procesów jądrowych i do ewolucji tych 
obiektów. Uniwersalne krzywe rozpowszechnienia 

nazywać można bowiem krzywymi historycznymi_ 

w tym znaczeniu, że zapisany jest w nich wynik pro¬ 
cesów ewolucji materii w naszej Galaktyce. Można 
sobie wyobrazić, iż analogiczne krzywe dla materii 
z jakiegoś odległego, na razie bezpośrednio naszemu 
wglądowi medostępnego zakątka Wszechświata prze¬ 
biegać będą nieco odmiennie. Jeśli jednak przyjąć, że 
wszędzie obowiązują te same prawa fizyki jądrowej 
(co chyba me budzi większych wątpliwości), to różnice 
przebiegu mogą być tylko niewielkie (szybszy lub 
wolniejszy spadek, wyższe lub niższe maksima), 
a maksima i minima lokalne wystąpić musza w tych 
samych miejscach. 


Kosmochemia molekularna 

Do niedawna niewiele wiedziano o występowaniu 
połączeń chemicznych w kosmosie. Badania labora¬ 
toryjne nad składem molekularnym obejmowały me¬ 
teoryty jako jedyne próbki materii pochodzenia poza¬ 
ziemskiego. W atmosferach chłodniejszych gwiazd 
stwierdzono obecność prostych cząsteczek i rodników 
kilkoatomowych, zdolnych oprzeć się rozerwaniu 
w wysokiej temperaturze; były to tlenki metali oraz 
połączenia zawierające tak rozpowszechnione pier- 
wmstki jak wodor czy węgiel (np. C 2 , CN, CH, A1H 
itp. A Na podstawie widm optycznych gwiazd stwier¬ 
dzono juz przed kilkudziesięciu laty, że w przestrzeni 
wyst ^P u ^ połączenia CH, CH + 
i CN. W1963 r. wykryto obecność rocjpika hydroksy¬ 
lowego OH w przestrzeni międzygwiazdowej. Wielka 
°f kryć >. ktore ^prowadziły do gruntownego 
przekształcenia naszych wyobrażeń o chemii prze¬ 
strzeni międzygwiazdowej, zaczęła się w 1968 r od¬ 
kryciem amoniaku i wody w obłokach materii ga¬ 
zowo-pyłowej. Odtąd, głównie dzięki wykorzystaniu 
radioteleskopów do obserwacji widmowych linii emi- 
syjnych i absorpcyjnych pochodzących od molekuł, 
rodników i jonów, nieustannie wzrasta liczba odkry- 
p °k?czeń. Krótkie ich zestawienie z początku 
977 r. zawiera rys. 4. Łatwo dostrzec, iż większość 
połączeń na nim występujących zaliczyć można do 
połączeń organicznych. Nie ma w tym nic dziwnego. 


jeśli spojrzeć na krzywe rozpowszechnienia z rys 2 
Obfitość występowania w przestrzeni kosmicznej za¬ 
sadniczych substratów potrzebnych do tworzenia 
złożonych molekuł nie może się przecież różnić w spo¬ 
sób istotny od wartości rozpowszechnień, z krzywej 
uniwersalnej. Najbardziej rozpowszechnionymi pier¬ 
wiastkami są kolejno: wodór, hel, tlen i węgiel (nie¬ 
którzy zmieniają kolejność tych dwóch pierwiast¬ 
ków), azot i neon. Wszystkie wymienione pierwiastki, 
z wyjątkiem gazów szlachetnych, występują w odkry¬ 
tych molekułach. W dalszej kolejności według roz¬ 
powszechnienia wymienić należy: magnez, krzem, 
zelazo, siarkę, glin i wapń. Wśród połączeń chemicz¬ 
nych, odkrytych w przestrzeni międzygwiazdowej, 
występują proste molekuły zawierające w swym skła¬ 
dzie atom krzemu lub siarki. Nieobecność połączeń 
zawierających atomy metali (magnezu, żelaza, glinu 
i wapnia) wydaje się tylko pozorna, spowodowana 
wchodzeniem tych pierwiastków do składowej pyło¬ 
wej ośrodka międzygwiazdowego, do której badania 
metody radioastronomii niewiele się przydają. 
Wszystkie natomiast zaobserwowane w przestrzeni 
międzygwiazdowej połączenia chemiczne wchodzą do 
składowej gazowej. 

Obecnie znamy już dwie molekuły dziewięcioato- 
mowe. Przypuszcza się, że jest tylko kwestią czasu 
i konstrukcji odpowiednio czułej aparatury, by zaob¬ 
serwować linie radiowe tak złożonych połączeń orga¬ 
nicznych, jak np. aminokwasy. Przemawiają za tym 
wypadki znalezienia przeróżnych aminokwasów 
w materii meteorytowej. Do niedawna podejrzewano, 
ze próbki meteorytowe były zanieczyszczone sub¬ 
stancjami organicznymi pochodzenia ziemskiego. 
Zastrzeżenia te rozwiało chromatograficzne rozdzie¬ 
lenie lorm lewo- i prawoskrętnych poszczególnych 
aminokwasów. Okazało się, że stosunek ich zbliżony 
jest do jedności, co przemawia na rzecz syntezy abio- 
gennej (me przebiegającej w organizmach żywych) 
Powstawanie złożonych substancji w ośrodku między- 
gwiazdowym wyjaśnić można w sposób naturalny 
jako rezultat reakcji chemicznych typu jon-molekuła 
między produktami oddziaływania wysokoenerge¬ 
tycznego promieniowania kosmicznego z materią 
międzygwiazdową, mającą skład pierwiastkowy zgod¬ 
ny z krzywą uniwersalną. W lokalnych zagęszczeniach 
owej matem, zawierających masy rzędu kilku do kil¬ 
kuset mas słonecznych, przebiega ciąg reakcji znanych 
z chemii radiacyjnej; nieustannie tworzą się i ulegają 
zniszczeniu złożone molekuły i rodniki. Przez dzie¬ 



lności. Najprostsze połącze^tz^^orem) według pierwiastków ciężkich i wzrastającej zlo- 

pferwiastków cięższych od wodoru P ą CWCj Str ° ny ’ obok “ 2w ^ zk * zawierające co najmniej dwa atomy rtónych 
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sięciolecia panowało przekonanie o niemożności ut¬ 
worzenia się złożonych molekuł w przestrzeni ko¬ 
smicznej. Ledwo molekuła taka zdążyłaby powstać, 
już jej dalszemu bytowi miałoby zagrażać wszechobec¬ 
ne promieniowanie ultrafioletowe. Gdy obecnie od¬ 
krycia wielu molekuł zadały kłam temu przekonaniu, 
sądzi się, iż istotną rolę odgrywa osłanianie wew¬ 
nętrznej części gęstego obłoku przez warstwę po¬ 
wierzchniową, pochłaniającą promieniowanie ultra¬ 
fioletowe. Jedynie wysokoenergetyczne promienio¬ 
wanie kosmiczne wnikać może do środka. Dominu¬ 
jąca część wodoru w centralnych obszarach gęstych 
obłoków występuje zatem jako wodór molekularny 
H 2 , a nie atomowy, i dzięki temu wiele reakcji w fazie 
gazowej staje się możliwymi. Obłoki gazowo-pyłowe 
uważane są za gęste, gdy I cm 3 zawiera od I0 4 do 10 7 
atomów. Kilka przybliżonych stężeń obserwowanych 
molekuł w różnych obłokach zawiera tabela 3. 

Obserwacje radioastronomiczne pozwalają na 
otrzymanie informacji o składzie molekularnym ma¬ 
terii obłoków gazowo-pyłowych także innych galak¬ 
tyk. Łatwa obserwowalność przesunięć izotopowych 
w zakresie radiowym umożliwia wyznaczenie sto¬ 
sunków izotopowych. Tak więc np. dla węgla, któ¬ 
ry ma dwa izotopy trwałe, stosunek ich rozpo¬ 
wszechnienia w materii ziemskiej wynosi: 13 C/ 12 C = 

== Vs 9 - Górna granica tego stosunku dla kilku ra¬ 
dioźródeł wynosi: centrum galaktyczne 1 / Z5t ob¬ 
szar- Ć Oph — ł /so, obłok w Orionie — V®. Podane 
wartości nie muszą wskazywać na sprzeczność z da¬ 
nymi ziemskimi; są to przecież tylko górne granice. 


Tabela 3. Ocena stężenia niektórych molekuł w Galaktyce 


Molekuła lub rodnik 

Obszar 

Gęstość 
liczba 
molekuł 
w cm* 

Wodór H, 

['obłoki 

J gęste 

10* 


(obłoki bar- 
Idzo gęste 

10* 

Hydroksyl: 

odmiana pospolita ,4 OH 

Sgr A 

10“* 

odmiana rzadsza ,8 Oh 

Sfer A 

10-* 

Amoniak NH, 

Sgr A 

io-» 

Tlenek węgla CO 

Sgr A 

io- Ł 

Alkohol metylowy CH*OH 

Orion 

0,25 


które dzięki dałszym pomiarom mogą ulec obniżeniu, 
zbliżając się do wartości znanej na Ziemi. 

Zwróćmy tu uwagę na aspekt biologiczny odkryć 
radioastronomicznych. W przestrzeni kosmicznej 
powstają samorzutnie w dużych ilościach złożone 
substancje chemiczne, w tym przynajmniej niektóre 
spośród związków chemicznych podstawowych dla 
życia organicznego. Stanowi to poparcie hipotezy 
powstawania życia w samorzutny sposób w różnych 
miejscach Wszechświata. 

B. Kuchowicz Kosmochemia, Warszawa 1979; B. Kuchowicz 
Problemy i osiągnięcia astrofizyki jądrowej. Część ł. Rozpowszech¬ 
nienie nuklidów i ich kosmiczna synteza, Post. Fiz. 22, 495 (1971); 
A. K. Ławruchina, G. M. Kolesow Powstawanie pierwiastków 
chemicznych we Wszechświecie. Warszawa 1965; Paul W. Mer¬ 
rill Chemia Kosmosu, Warszawa 1966. 


Reakcje jądrowe w gwiazdach 

Bronisław Kuchowicz 


aspekt Reakcje jądrowe w gwiazdach mają dwa aspekty: 
astrofizyczny astrofizyczny i kosmochemiczny. Wytwarzanie energii 
i kosmoche- w gwiazdach, czego przejawem jest ich świecenie, ma 
miczny aspekt astrofizyczny, natomiast przekształcanie jed¬ 
nych pierwiastków w drugie, nukleosynteza, ma 
aspekt kosmochemiczny. Powyższe aspekty są od 
siebie nieodłączne, albowiem reakcje jądrowe wy¬ 
twarzające energię prowadzą do nieustannej zmiany 
składu chemicznego materii wnętrza gwiazd; w wy¬ 
niku tego w wytwarzaniu energii odgrywają rolę coraz 
to inne reakcje jądrowe, zmienia się przy tym szyb¬ 
kość wytwarzania energii, zatem i jasność gwiazd. 
A więc ewolucja gwiazdy jest jednocześnie ewolucją 
energetyczną i ewolucją składu chemicznego i jest 
uwarunkowana reakcjami jądrowymi (-* Ewolucja 
gwiazd. Reakcje jądrowe. Rozpady jąder atomo¬ 
wych). 


Warunki realizacji 

reakcji jądrowych w gwiazdach 


reakcje 
termo¬ 
jądrowe 
— źródło 
energii 
gwiazd 


Zależność średniej energii wiązania nukleonu w ją¬ 
drze od liczby masowej jądra wykazuje maksimum 
w otoczeniu A — 60 (w otoczeniu jądra żelaza). 
Możliwe są zatem dwa kierunki przemian jądrowych 
prowadzących od jąder słabiej do jąder silniej zwią¬ 
zanych — reakcje termojądrowe (strzałka A na rys. 
1) oraz reakcje rozszczepienia jąder ciężkich (strzałka 
B). Oba rodzaje przemian jądrowych zachodzą z wy¬ 
dzieleniem energii (reakcje egzoenergetyczne), oba 
udaje się realizować w warunkach ziemskich (-> Ener¬ 
gia termojądrowa. Energia jądrowa). Natomiast 
w warunkach, które panują w gwiazdach, występować 
mogą tylko reakcje termojądrowe i one właśnie są 
źródłem energii gwiazd. 


Najprostszym i najważniejszym rodzajem reakcji 
jądrowych są reakcje dwuciałowe, czyli takie, w któ¬ 
rych dzięki wzajemnemu oddziaływaniu dwóch ją- 
der-substratów powstają jądra-produkty, np.: 

a z x+$y-* p+f,r. (i) 

Obowiązują przy tym zasady zachowania ładunku 
elektrycznego (Z+Z' — Ż+Ż') t liczby barionów 
( A+A' — AĄ-A') oraz energii i pędu. W reakcjach 
egzoenergetycznych suma mas spoczynkowych sub¬ 
stratów (jąder X i Y) jest większa niż produktów 
(jąder X i Y). Reakcje takie mogą zatem zachodzić 
przy dowolnie małej energii kinetycznej cząstki bom¬ 
bardującej (reakcje nie mają progu energetycznego). 
Mimo to — gdy reagującymi cząstkami są cząstki 
naładowane (protony, jądra), wydajność reakcji przy 
bardzo małej energii może być znikomo mała i zależy 
bardzo wyraźnie od energii cząstki bombardującej, 
a to z powodu występowania kulombowskiej bariery 
potencjału, utrudniającej zbliżenie się cząstek do 
siebie. W fizyce klasycznej bariera kulombowska zu¬ 
pełnie nie przepuszcza cząstek o energii kinetycznej 
mniejszej niż wysokość tej bariery. Natomiast me- 



Rys. 1. Schematyczny przebieg zależności średniej energii wią¬ 
zania nukleonu w jądrze Eod liczby masowej A. Strzałki wskazują 
dopuszczalne kierunki reakcji egzoenergetycznych 


reakcje 

dwuciałowe 
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chanika kwantowa (tkwiąca u podstaw współczesnej 
fizyki jądrowej) przewiduje zjawisko tunelowe — 
możliwość przeniknięcia cząstki przez barierę po- 
kolumbow- tencjału nawet wtedy, gdy energia cząstki jest znacznie 
ska bariera niższa od wysokości bariery. Prawdopodobieństwo 
potencjału pojedynczego aktu przeniknięcia cząstki przez ba¬ 
rierę silnie maleje ze wzrostem ładunku oraz ze spad¬ 
kiem energii kinetycznej lub prędkości tej cząstki. 
Przy prędkości bliskiej zera przenikalność bariery 
też spada do zera. 

Choć prawdopodobieństwo przeniknięcia przez 
barierę — gdy energia cząstki padającej jest znacznie 
mniejsza niż wysokość bariery—jest znikome, nie 
jest ono nigdy dokładnie równe zeru. Jest to istotne 
dla procesów jądrowych odbywających się wewnątrz 
gwiazd. Wpływ występowania bariery kulombowskiej 
na czas trwania ewolucji gwiazd zilustrujemy nastę¬ 
pującym przykładem. Przeciętna gwiazda zawiera co 
najmniej 10 50 jąder atomowych. Jeśli przyjąć ostroż¬ 
nie, że w obszarze centralnym, w których zachodzi 
wydzielanie energii, znajduje się zaledwie 0,1% masy 
gwiazdy, a prawdopodobieństwo zajścia reakcji 
między dwoma jądrami wynosi zaledwie 10~ 10 na 
rok, to w ciągu roku zachodzi 10 37 reakcji. Przy takim 
tempie „spalania” paliwo jądrowe może wystarczyć 
na miliardy lat! 

Oczywiście dla cząstek pozbawionych ładunku, jak 
neutrony czy kwanty y, bariera potencjału nie wystę¬ 
puje. Neutrony mogą się przedostawać do jądra 
atomowego przy dowolnie małej energii prawie z ta¬ 
kim samym prawdopodobieństwem jak neutrony 
o wielkiej energii. Dlatego wydajność reakcji wywoły¬ 
wanych przez neutrony przewyższa o kilka rzędów 
wielkości wydajność reakcji wywoływanych przez 
protony lub cząstki a o tej samej małej energii, nie 
mówiąc już o reakcjach powodowanych przez jądra 
cięższe, które mają wyższą barierę kulombowską. 

Bariera potencjału jest barierą dwustronną, działa 
nie tylko na cząstki wnikające do jądra, ale i na te, 
które usiłują się z niego wydostać (np. w przemianie 
a). Jądro powstające w wyniku przyłączenia neutronu 
do jądra początkowego z większym prawdopodobień¬ 
stwem pozbędzie się nadmiaru energii (równego 
energii wiązania owego neutronu) przez wysłanie 
kwantu y niż cząstki naładowanej. A zatem spośród 
reakcji wywoływanych przez neutrony największą 
rolę w gwiazdach odgrywają reakcje ( n , y). Reakcje 
jądrowe mogą przebiegać talie pod działaniem kwan¬ 
tów y o energii dostatecznie dużej na to, by z jądra 
atomowego wybić jeden lub kilka składników. Dwu- 
stronność bariery kulombowskiej sprawia, że jeżeli 
energia kwantu y jest mniejsza od wysokości bariery, 
to z największą wydajnością przebiega reakcja foto- 
jądrowa typu (y, ń). 

przekroje Przekroje czynne na różne reakcje jądrowe zależą 
czynne od rodzaju i energii cząstek oddziałujących; w reak¬ 
cjach endoenergetycznych równe są zawsze zeru, 
gdy energia jest mniejsza od progowej. Przekroje 



Rys. 2. Schematyczny przebieg przekroju czynnego przy małych 
energiach dla reakcji egzoenergetycznych wywołanych przez czą¬ 
stki naładowane 
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czynne na reakcje bombardowania jąder atomowych 
cząstkami naładowanymi, nawet o energii kinetycznej 
większej niż wysokość bariery kulombowskiej, wyno¬ 
szą zazwyczaj najwyżej dziesiętne części barna (1 b = 

= 10" 28 m 2 ). Natomiast największymi przekrojami 
czynnymi, niekiedy o wartościach rzędu kilkunastu 
i więcej barnów, odznaczają się reakcje wychwytu 
radiacyjnego neutronów powolnych («, y). Podczas 
gdy przekroje czynne na reakcje między cząstkami 
naładowanymi rosną zazwyczaj wyraźnie z energią, 
przekroje czynne na egzoenergetyczne reakcje (/i, y) 
na ogół maleją ze wzrostem energii (rys. 2). Neutron 
szybszy przebywa bowiem krócej w sąsiedztwie 
jądra niż neutron powolny, stąd mniejsze są szanse 
na jego wychwyt w wyniku działania sił jądrowych. 

Przekrój czynny na reakcję (1) może wzrosnąć o je¬ 
den rząd wielkości, a nawet i więcej (rezonans — występo- 
rys. 2), jeśli energia cząstek oddziałujących jest tak do- wanio 
brana, że w etapie pośrednim może powstać jądro rezonansu 
złożone V w jednym ze swoich stanów wzbudzonych: 

P+z’Y-* A zX A z'V*- ( 2 ) 

W przebiegającym w gwiazdach procesie spalania helu 
na węgiel właśnie występowanie rezonansu przy ener¬ 
gii 7,65 MeV jest przyczyną wydajnego tworzenia się 
węgla (-► Powstawanie pierwiastków chemicznych). 

Zwiększenie energii wiązania w jądrze o magicznej 
liczbie neutronów N przejawia się zmniejszeniem 
przekroju czynnego na wychwyt neutronu. Przekrój 
czynny jąder o N = 50, 82, 126 na wychwyt neutronu 
o energii rzędu 1 MeV jest 10-100 razy mniejszy niż 
jąder sąsiednich. Natomiast jądra o liczbie neutronów 
większej o jedność od liczby magicznej mają szczegól¬ 
nie duży przekrój czynny na reakcję fotojądrową 
(y> n). 


Reakcje jądrowe między 
cząstkami naładowanymi 

Pod względem wytwarzania energii najważniejszą rolę 
odgrywają w gwiazdach reakcje dwuciałowe, typu 
reakcji (1), między cząstkami naładowanymi —jądra¬ 
mi atomowymi. Liczba aktów reakcji zachodzących 
w jednostce objętości na jednostkę czasu jest tym 
większa, im większe są stężenia oddziałujących ze 
sobą jąder oraz im wyższa jest temperatura. Wyższa 
temperatura oznacza bowiem większą wartość śred¬ 
niej energii kinetycznej oddziałujących jąder, a zatem 
większe prawdopodobieństwo przeniknięcia przez 
barierę kulombowską. 

Uśrednione prawdopodobieństwo <cr, reakcji prawdopo- 
(1), odniesione do jednej pary cząstek reagujących na dobieństwo 
jednostkę czasu w zakresie energii, w którym nie reakcji 
występują rezonanse, można z dobrym przybliżeniem 
przedstawić w postaci całki iloczynu dwóch funkcji: 

<0-, t>> = C, r- 2 / 3 J e VEclE e~ mT dE. (3) 

0 

Funkcja e~EJkT przedstawia (z dokładnością do współ¬ 
czynnika) rozkład maxwellowski energii (prędkości) 

względnej, funkcja zaś e ”^ c/jy — prawdopodobień¬ 
stwo przeniknięcia przez barierę potencjału cząstki 
o energii E. Wartość energii Eg jest tzw. energią Ga- energia 
mowa; określa ją wzór Gamowa 

Eg = 2//(jcZZ'eW, (4) 

gdzie fi — masa zredukowana oddziałujących jąder 

x i y, 

fi = Mx • My/(Mx + A/y). (5) 

(W powyższych wzorach C, — współczynnik nieza¬ 
leżny od temperatury, T — temperatura bezwzględna, 
k — stała Boltzmanna, e — ładunek elementarny. 






fi — stała Plancka podzielona przez 2n). Przebieg 
obu czynników występujących pod znakiem całki 
przedstawiony jest na rys. 3. Iloczyn ich obu, tzn. 
funkcja podcałkowa, osiąga maksymalną wartość 
przy energii E 0 = (V z kT\/ Eg) 2 ^, która zazwyczaj 
przewyższa znacznie średnią energię kinetyczną 
s / 2 kT. Obszar zacieniowany na rysunku przedstawia 
iloczyn obu czynników pod znakiem całki (3). Widać 
że najwięcej jest cząstek o takich energiach, przy 
których przenikalność bariery kulombowskiej jest 



Rys. 3. Schematyczny przebieg zależności od energii dwóch 
czynników pod znakiem całki we wzorze (3) w wypadku, 
gdy w istotnym dla przebiegu reakcji termojądrowych zakresie 
energii nie ma żadnego rezonansu. Obszar zacieniowany odpo¬ 
wiada iloczynowi obu funkcji pod znakiem całki we wzorze (3) 

niemal równa zeru. Liczba cząstek spada natomiast 
do zera, gdy wzrasta ich zdolność przechodzenia 
przez ową barierę. Podstawowy wkład do całki we 
wzorze (3) wnosi stosunkowo wąski przedział energii 
w pobliżu energii E Q \ obszar ten nazywa się pikiem 
pik Gamowa. Gdy pik jest dość wąski, wtedy słuszne jest 
Gamowa w przybliżeniu wyrażenie postaci 

<<r, »> = C t (6) 

(stałe C t i C 3 nie zależą od temperatury). Największy 
wkład do uśrednionego prawdopodobieństwa reakcji 
termojądrowej pochodzi od zderzeń przy energiach 
znacznie mniejszych od wysokości bariery, a jedno¬ 
cześnie znacznie większych od energii średniej ( E 0 > 
>kT). Wynika to stąd, że bariera ma przenikalność 
różną od zera już przy stosunkowo małych energiach. 
Przybliżone wyrażenie (6) wskazuje na dość dużą za¬ 
leżność szybkości reakcji termojądrowych od tem¬ 
peratury. Dokładne obliczenie szybkości reakcji wy- 



Rys. 4. Analogiczna zależność jak na rys. 3 w wypadku, gdy 
w obszarze bardzo małych energii występuje niewielki rezonans. 
Obszary zacieniowane wskazują na wartość iloczynu dwóch 
funkcji podcałkowych ( \^E'F{E )—związanej z rozkładem pręd¬ 
kości i energii, oraz a{E )— przekroju czynnego) we wzorze sta¬ 
nowiącym uogólnienie wyrażenia (3). (Wzoru (3) nie stosujemy 
bezpośrednio w przypadku rezonansu). Wkład pochodzący od 
niskoenergetycznego rezonansu większy jest od wkładu z oto¬ 
czenia energii E 0 


maga całkowania numerycznego z uwzględnieniem 
rezonansów możliwych w danej reakcji. 

Jeśli w przekroju czynnym przy małych energiach 
w obszarze podbarierowym występuje rezonans (je¬ 
den lub kilka), to wkład do szybkości reakcji termo- 
nuklearnej z obszaru energii wokół tego rezonansu 
może się okazać większy od wkładu piku Gamowa. 

Sytuację taką przedstawia rys. 4. 

Między reakcjami jądrowymi w laboratorium a 
reakcjami termojądrowymi w gwiazdach występuje 
pewna istotna różnica. W gwiazdach oprócz jąder 
atomowych jest gęsty gaz elektronowy. Jeśli nawet 
atomy są całkowicie zjonizowane, to obecność gazu 
elektronowego obniża w pewnym stopniu wzajemne 
odpychanie kulombowskie jąder i przekroczenie 
bariery kulombowskiej jest łatwiejsze. 

Wstępna faza ewolucji gwiazdy, zwana fazą kontr- faza 
akcji grawitacyjnej, kończy się z chwilą, gdy w cen- kontrakcji 
trum gwiazdy osiągnięta zostaje temperatura wy- grawitacyjnej 
starczająca na to, by możliwe stały się reakcje jądrowe 
z udziałem najobfitszego paliwa — wodoru, odzna¬ 
czającego się zarazem (dzięki posiadaniu minimalne¬ 
go — w porównaniu z innymi pierwiastkami — ła¬ 
dunku elektrycznego) największą łatwością przenika¬ 
nia przez barierę kulombowską. Wodór może się 
więc spalać w takiej temperaturze (i energii średniej 
jąder!), w jakiej reakcje między jądrami innych pier¬ 
wiastków są jeszcze niemożliwe. 

Dwa zasadniczo różne sposoby spalania wodoru spalanie 
to: cykl p-p oraz cykl katalityczny CNO, zwany wodoru 
cyklem węglowo-azotowym albo cyklem Bethego- 
Weizsackera. W każdym z nich można rozróżnić tzw. 
gałąź główną i dwie gałęzie boczne (tabela 1). Względ¬ 
na częstość występowania poszczególnych cykli i ga¬ 
łęzi zależy od warunków fizycznych wewnątrz gwiaz¬ 
dy. Tak więc np. w gwiazdach pierwszego pokolenia, 
które się składały wyłącznie z helu i wodoru, bez do¬ 
mieszki węgla czy azotu, możliwy był jedynie cyk) p-p. 

Obecnie w gwiazdach o niewielkiej masie (np. w Słoń¬ 
cu) za wydzielanie energii odpowiada wyłącznie cykl 
p-p, w gwiazdach zaś bardzo masywnych, o masie 
rzędu kilkudziesięciu mas słonecznych, wodór wypala 
się wyłącznie w cyklu CNO. Przyczyna tego jest pro¬ 
sta. W gwiazdach o większej masie, dysponujących 
większym zapasem energii grawitacyjnej, wstępna 
kontrakcja grawitacyjna może doprowadzić do znacz¬ 
nie silniejszego ogrzania wnętrza gwiazdy. W wyższej 
zaś temperaturze jądra wodoru przenikają skuteczniej 
przez bariery kulombowskie wokół jąder węgla i azo¬ 
tu, a procesy (10, 12, 13 i 15) z tabeli 1 przebiegają 
znacznie szybciej od pierwszej reakcji cyklu /?-p, choć 
bariera kulombowską jest w niej nieporównywalnie 
niższa. Reakcja (1) jest bowiem jedyną (oprócz prze¬ 
mian £ + i wychwytów elektronu) reakcją jądrową 
z tabeli 1, wywoływaną oddziaływaniami słabymi. Stąd 
też przekrój czynny na tę reakcję jest mniejszy o kil¬ 
kanaście rzędów wielkości od przekrojów czynnych na 
inne reakcje jądrowe, wywoływane oddziaływaniami 
silnymi. Wartość jego przy tych energiach protonów, 
przyjakichoneze sobą w gwieździe reagują (tj. poniżej 
1 MeV), wynosi ok. 10~ 23 b, podczas gdy przekroje na 
inne reakcje (przy porównywalnych energiach) są 
zazwyczaj rzędu mikrobamów do milibamów. 

Aby scharakteryzować efektywność gałęzi głównych 
obu cykli spalania wodoru, podajemy w tabeli 1 czasy 
życia jąder ze względu na daną reakcję, oszacowane 
przy założeniu następujących warunków fizycznych 
w obszarze, w którym reakcje te zachodzą: gęstość 
wodoru równa 100 g/cm 3 , temperatura — ok. 1,3-10 7 
K. Wypadkową szybkość przebiegu cyklu określa 
najdłuższy czas życia. Na rys. 5 przedstawiono zależ¬ 
ność szybkości wyzwalania energii od temperatury 
przy ustalonym składzie chemicznym. Widać stąd, że 
cykl CNO dominuje w gwiazdach o dużej jasności, 
masie i temperaturze (znajdujących się po lewej górnej 
stronie ciągu głównego gwiazd). 

Podobnie jak przewaga określonego cyklu spalania 
wodoru, tak też przewaga różnych gałęzi danego cy- 
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Tabela 1. Reakcje spalania wodoru 


reakcje 
jądrowe 
w Słońcu 


Cykl 

Gałąź 

Reakcja (w nawiasie czas życia) 

Uwagi 

p-p 

Główna 

, H + 1 H — > a H + e + + v e (l,4•10 ł0 l) ( 1 ) 

a H + ł H —> 3 He 4- y(5,7s) (2) 

*Hc+ s He— * 4 He + 2*H(10* 1 ) ( 3 ) 

konkuruje reakcja: 

ł H + l H + e~ —► *H + v t (la) 

Boczna I 

Najpierw ( 1 ) i (2), potem: 

*He + 4 He ->■ 7 Be -f y (4) 

ł Be4-<r —»■ 7 Li-fv« ( 5 ) 

, Li + ł H 2*He ( 6 ) 


Boczna II 

Najpierw ( 1 ), (2) i (4), potem: 

7 Be+ , H — » 8 B+y ( 7 ) 

8 B —* 8 Be* + e + -f v« ( 8 ) 

8 Be -+ 2 4 He (9) 

lub 8 B + e~ — ¥ *Be + v« ( 8 a) 

CNO 

Główna 

ł, C+ t H , 3 N+y(l,3' 10 7 1 ) (10) 

ł3 H — * 13 C+e + + Vg(7m) (U) 

la C + —► ,4 N + y(2,7 *10* 1) (12) 

,4 N + ł H —> ls O + y« 3,2-10 8 1) (13) 

xs O —> lft N + e + + v« (82s) (14) 

,a N + ł H —»• “C-f 4 He ( 1,1 ‘10* 1) (15) 

lub ł3 N + —1 13 C + v« (lla) 

lub ,5 0 + <r->“N + ^ (14a) 

Boczna I 

,8 N + ł H —* ,e O + y (16) 

,8 0 + ł H —> 17 F + y (17) 

17 F— ► 17 0+e + + v« (18) 

,7 0 + ł H —► ,4 N + 4 He (19) 

teraz powrót do gałęzi głównej (reakcja (13)) 

lub ,7 F + e~ —► l7 0 + v 9 (18a) 

Boczna II 

,7 0 + ł H-+ l8 F + y (20) 

l8 F —> ,8 0 + e + + v* (21) 

, 8 0-f ł H —»• 16 N+ 4 He (22) 

teraz powrót do gałęzi głównej (reakcja (15)) 

lub l 8 F+ e~ 18 Q +ve (21 a) 



Rys. 5. Szybkość wyzwalania energii a cykli p-p i CNO w zależ¬ 
ności od temperatury T przy gęstości 100 g/cm* i zawartości 
wagowej: wodoru H — 80%, węgla C i azotu N (łącznie) — 
0 , 6 % 


klu zależy od warunków fizycznych wewnątrz gwiaz¬ 
dy. Tak więc np. w najniższych temperaturach (oczy¬ 
wiście powyżej temperatury „zapalania się” wodoru) 
przebiegają wyłącznie te reakcje cyklu p-p, które 
wchodzą w skład jego gałęzi głównej. Ze wzrostem 
temperatury włączają się kolejno obie gałęzie boczne. 
Taką sytuację ilustruje rys. 6. 

Oto kilka danych orientacyjnych dotyczących Słoń¬ 
ca. Wkład cyklu CNO do produkcji energii jest rzędu 
paru procent najwyżej. W cyklu p-p podstawową rolę 
odgrywa gałąź główna (względna częstość występo¬ 
wania ok. 91%). następnie gałąź boczna I (względna 
częstość ok. 9%). Temperatura centralna jest zbyt 
niska, by większą rolę mogła odgrywać gałąź boczna 
II (względna częstość poniżej 0,01%). Dodajmy, że 
choć energia wydzielona podczas przemiany wodoru 
w hel jest na każdej drodze taka sama, rozkłada się 
ona w rozmaity sposób między neutrina i promienio¬ 


wanie elektromagnetyczne; fakt ten tkwi u podstaw 
astronomii neutrinowej, dzięki której można jedno¬ 
cześnie wyznaczać temperaturę wnętrza gwiazdy 
i sprawdzać, czy i jakie reakcje jądrowe tam zachodzą. 
Wszystkie reakcje spalania wodoru prowadzą zatem 
do jednego tylko produktu końcowego: helu 4 He; 
zapisać je można schematycznie: 

4*H -> *Hc+2e++2v e +2y. (7) 

Gdy spalanie jest stacjonarne, wszystkie pozostałe 
jądra, występujące w kolejnych reakcjach (z wyjąt¬ 
kiem takich jąder katalizatorów jak np. 12 C), mają 
stężenie niewielkie. Tak więc procesy z tabeli 1 prawie 
nie zwiększają rozpowszechnienia litu, berylu czy boru 
w materii przechodzącej przez fazę spalania wodoru. 

Gwiazdy większą część swego życia spędzają w fazie 
spalania wodoru. Zarówno z tego względu, jak i dla¬ 
tego, że jest to proces największej wydajności energe¬ 
tycznej (największej wartości wydzielonej energii 
przypadającej na jednostkę masy paliwa), spalanie 
wodoru należy do najważniejszych reakcji jądrowych 
w przyrodzie. 

Następnymi reakcjami jądrowymi — i pod wzglę¬ 
dem ważności, i kolejności występowania w ewolucji 



Rys. 6. Wytwarzanie helu 4 He w warunkach stacjonarnych przy 
założeniu X — Y (X —zawartość wagowa wodoru, Y —za¬ 
wartość wagowa helu) w gałęzi głównej (G) i gałęziach bocznych 
(I i II) cyklu p-p w zależności od temperatury centralnej T. Po¬ 
dobne wykresy można przedstawić dla innych wartości stosunku 
XiY (wg Parker, Rahcall i Fowler, 1964) 


produkt 

reakcji 

spalania 

wodoru 

*He 
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spalanie helu gwiazdy — są reakcje spalania helu. Gdy w central¬ 
nych obszarach gwiazdy spalającej wodór zostanie 
on zupełnie zużyty, wtedy zmaleje udział ciśnienia 
promieniowania (bo mniej promieniowania powsta¬ 
je) w łącznym ciśnieniu przeciwstawiającym się kur¬ 
czeniu grawitacyjnemu. Następuje grawitacyjna kontr¬ 
akcja wnętrza gwiazdy, przy czym wzrasta gęstość 
(do ok. I0 5 g/cm 3 ) oraz — wskutek wydzielania się 
energii grawitacyjnej — temperatura (do ok. 10 8 K). 
W takich warunkach możliwe staje się zapalenie na¬ 
stępnego paliwa — helu. Wydawałoby się, że powin¬ 
na teraz nastąpić reakcja: 

jHeH jHe -► 8 Be. (8) 

Możliwość przebiegu tej reakcji można by zakwestio¬ 
nować w związku z tym, że jest to reakcja endoenerge- 
tyczna, o energii progowej rzędu 96 keV. Nie to jest 
jednak zasadniczą przeszkodą, gdyż w temperaturze 
10 8 K spora część jąder helu 4 He ma energię wyższą 
od tej wartości progowej. Natomiast z danych do¬ 
świadczalnych wiadomo, że jądro 8 Be z okresem poło¬ 
wicznego zaniku rzędu 2,6-10~ 16 s rozpada się z po¬ 
wrotem na dwa jądra 4 He. Czy wobec tego reakcja 
(8) może odgrywać jakąkolwiek rolę? 

. Okazuje się, że tak, bo jedynie w warunkach ziem¬ 
skich jądro 8 Be ma tylko jedną możliwość zaniku: 
rozpad na dwie cząstki a. W warunkach zaś bardzo 
gęstej materii wnętrza gwiazdy oraz w wysokiej tem¬ 
peraturze zachodzi tyle zderzeń między jądrami helu, 
że się w końcu ustala pewna równowaga między pro¬ 
cesami powstawania i rozpadu berylu, a więc i rów¬ 
nowaga między stężeniami helu i berylu. Równowaga 
ta zależy od gęstości i temperatury. Przy gęstości 
10 5 g/cm 3 i w temperaturze 10® K przypada jedno jądro 
8 Be na miliard jąder 4 He, co umożliwia wychwyt helu 
przez beryl (zanim ten ostatni zdąży się rozpaść): 

8 Be+ 4 He-* 12 C-fy. (9) 

Innymi słowy — w warunkach tak ogromnego stęże¬ 
nia cząstek a, jakie istnieje wewnątrz gwiazdy, zanik 
nietrwałego jądra 8 Be może następować również 
przez wychwyt cząstki a, co prowadzi do powstania 
trwałego jądra węgla ,2 C. Nic więc dziwnego, że węgiel 
jest czwartym pod względem rozpowszechnienia pier¬ 
wiastkiem (po wodorze helu i tlenie). 

Dwuetapowy proces złożony z reakcji (8) i (9) za¬ 
pisać można krótko: 

3a - 12 C+y, (10) 

proces 3a co uzasadnia jego nazwę: proces 3a. Należy pod¬ 
kreślić, że reakcja (9) jest reakcją rezonansową w tym 
przedziale wartości energii, jakimi dysponują jądra 
4 He wewnątrz gwiazd spalających hel. Przekrój czyn¬ 
ny na tę reakcję jest więc tak duży, że jądra węgla po¬ 
wstają z dużą wydajnością — mimo niewielkiego 
stężenia jąder berylu. Jednocześnie możliwe jest przy¬ 
łączanie dalszych cząstek a do wytworzonych już 
jąder węgla; powstaje przy tym tlen: 

”C+jHe - “O+y. (11) 

Gdy w centrum gwiazdy hel jest już całkowicie zu¬ 
żyty, sytuacja wygląda podobnie jak po wypaleniu 
wodoru. Raz jeszcze nastąpić musi kontrakcja grawi¬ 
tacyjna i zapalenie się kolejnego paliwa, będącego 
jednocześnie „popiołem” jądrowym z poprzedniej 
fazy spalania. Przykłady reakcji jądrowych spalania 
węgla i tlenu zawiera tabela 2. 

Wszystkie reakcje jądrowe wytwarzające energię 
w gwieidzie (z wyjątkiem lekko endoenergetycznej 
reakcji 8) są to dość podobne do siebie reakcje egzo- 
energetyczne między cząstkami naładowanymi. 
W każdej z nich z jąder słabiej związanych tworzą 
się jądra o większej energii wiązania, a jednocześnie 
wydziela się energia. Produkcji energii w gwieidzie 
towarzyszą zmiany składu chemicznego jej wnętrza, 
popioły poprzedniej fazy spalania stają się paliwem 
w następnej. Prowadzi to do jąder pierwiastków co¬ 
raz cięższych, aż do jąder żelazowców, które mają 


Tabela 2. Niektóre reakcje jądrowe zachodzące po wypa¬ 
leniu helu 

1. Spalanie węgla: 

"Na+jH 


“c+ 13 c-> 

>g +y 

J*Mg+n 

7> + 2 2 4 He 

(23) 

11. Spalanie tlenu: 

“Si + jHe 


, ;o+ , jo-» 

» S+B 

» s+ y 

*;Mg + 2 *He 

(24) 

III. Spalanie krzemu: 



»Si + jHe-.«S+y 


(25) 

“Si + ”Si — ‘jNi+y 

(praktycznie nie zacho¬ 
dzi, ze względu na 
wysoką barierę 
kulombowską) 

(26) 

!!si + y-+\ll * 

14 1;jai+jh 


(27) 


największą energię wiązania na jeden nukleon. Dal- powstawanie 
sze reakcje nukleosyntezy między jądrami żelazowców jąder 
(i ewentualnie pierwiastków cięższych) musiałyby być żelazowców 
reakcjami endoenergetycznymi i nie mogłyby stano¬ 
wić źródła energii gwiazdy (rys. 7). Ponadto z uwagi 
na coraz wyższą barierę kulombowską między od¬ 
działującymi ze sobą jądrami konieczny byłby coraz 
większy wzrost energii kinetycznej oddziałujących 
z sobą jąder, a temu musiałby towarzyszyć prawie 
nieograniczony wzrost temperatury centralnej. Spra¬ 
wia to, że powstania jąder atomowych o liczbach ma¬ 
sowych >4^65 nie da się powiązać z reakcjami ter¬ 
mojądrowymi między cząstkami naładowanymi. Wy¬ 
stępowanie w przyrodzie takich jąder (pierwiastki od 
cynku do uranu) wskazuje jednak na to, że pro¬ 
cesy ich powstawania odbywały się, a podstawową 
w nich rolę odgrywały reakcje z udziałem neutronów. 



Rys. 7. Ewolucja jądrowa gwiazdy. Odcinki poziome krzywej 
przedstawiają fazy kontrakcji grawitacyjnej, w których tempera¬ 
tura centralna rośnie, a skład chemiczny gwiazdy nie ulega zmia¬ 
nie; przy każdym z nich podano symbol pierwiastka, którego 
jądra ulegną „zapłonowi” po zakończeniu fazy kontrakcji. Pro¬ 
cesy spalania kolejnych paliw jądrowych przedstawiają odcinki 
niemal pionowe (spalanie izotermiczne). Krzywe C-O-Mg 
i O-Mg-S odpowiadają dwom przypadkom skrajnym; gdy jądro 
gwiazdy po wypaleniu helu składa się wyłącznie z węgla i gdy 
składa się wyłącznie z tlenu. Ej jest to całkowita energia jądrowa 
jaka została wydobyta z gwiazdy od chwili jej powstania, przy¬ 
padająca na jeden jej nukleon. Gdy w jądrze gwiazdy pozostają 
jądra żelaza, niemożliwe jest dalsze wydobywanie energii jądro¬ 
wej. Możliwe jest wtedy przejście fazowe Fe —► He; energii po¬ 
trzebnej do tego dostarcza kontrakcja grawitacyjna 
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Reakcje wytwarzania 
i wychwytu neutronów 

Neutrony mogą się pojawiać jako jeden z produktów 
końcowych w różnych reakcjach termojądrowych 
podczas ewolucji gwiazdy. W tabeli 2 podaliśmy przy¬ 
kładowo procesy powstawania neutronów podczas 
spalania węgla lub tlenu. Przedstawimy jeszcze kilka 
przykładów. 

Kiedy we wnętrzu masywnej gwiazdy, w której 
przebiegał cykl CNO, wypalił się wodór, wtedy obok 
jąder 4 He pozostaje pewna domieszka jąder 13 C — 
pozostałości katalizatora z tego cyklu. W fazie kontr¬ 
akcji grawitacyjnej wnętrza gwiazdy jądra helu wstę¬ 
pują w reakcję 

“C+jHe-^O+zi, (12) 

która jest znacznie bardziej prawdopodobna od dwu¬ 
etapowego procesu 3a. 

Niezależnie od tego, jaka była proporcja wzajemna 
różnych odmian węgla i azotu przed rozpoczęciem 
spalania wodoru w cyklu CNO, w czasie jego trwa¬ 
nia ustala się następujący stosunek ilościowy jąder- 
katalizatorów: 

<“N):«Q:C;0- 95:4:1. (13) 

Widać stąd, że najobfitszą pozostałością ciężką po 
zakończeniu cyklu CNO jest azot. Jądra jego wy¬ 
chwytują znaczną część neutronów powstających 
w reakcji (12), co obniża wydajność innych reakcji 
z neutronami. Ale już po zapaleniu śię helu, w wyż¬ 
szej temperaturze, możliwa jest reakcja wychwytu 
cząstki a przez jądro 14 N, w której się tworzy jądro 
ls O, zdolne do kolejnego wychwytu cząstki a. Oto 


ciąg dopuszczalnych procesów : 

ł jN+jHe -*■ l jF+y, (14) 

18 F^i 8 0+c+ + ^, (15) 

10 O-f- 4 He -* 22 Ne-fy, (16) 

w których się tworzą dwa jądra ( 10 O i 22 Ne), niezbęd¬ 
ne do dalszego wytwarzania neutronów. Obie reakcje 
produkcji neutronów: 

”0+;He-»Ne+«, (17) 

ioNe+jH e -> JjMg+«, (18) 


są endoenergetyczne. Progi ich są jednak tak niskie 
(0,705 MeV reakcji 17 i 0,48 MeV reakcji 18), że mogą 
one przebiegać wydajnie w temperaturze, jaka panuje 
w jądrze gwiazdy pod koniec fazy spalania helu. 

Powyższe procesy wytwarzania neutronów związa¬ 
ne są z fazą spalania helu. Można by jeszcze wymienić 
inne procesy produkcji neutronów, np. spalanie krze¬ 
mu, siarki, ale ograniczymy się do stwierdzenia, że 
neutrony pojawiają się wewnątrz gwiazdy w wyniku 
kilku stosunkowo rzadkich reakcji. Stanowi to kon¬ 
sekwencję albo niewielkiego rozpowszechnienia w ma¬ 
terii gwiazdowej tych jąder-substratów, które są 
źródłem neutronów (czyli jąder 13 C, ls O i 22 Ne), albo 
też niewielkiej stosunkowo częstości występowania 
kanałów neutronowych wśród kanałów wyjściowych 
zachodzących reakcji. Neutrony pojawiają się w nie¬ 
wielkich stosunkowo ilościach, ale w ciągu dość dłu¬ 
giego przedziału czasu. Można w zasadzie stwierdzić, 
że począwszy od fazy spalania helu istnieją w gwieź- 
dzie pewne stacjonarne źródła neutronów. Wytwarza¬ 
nie neutronów odbywa się w skali czasu rzędu milio¬ 
nów do setek milionów lat (w zależności od masy 
gwiazdy, a więc i od tempa jej ewolucji). 

„Losy” powstałych neutronów zależą od obec¬ 
ności w materii gwiezdnej jąder, które mogą je pochła¬ 
niać. Tak więc wspomniane już kilkakrotnie jądro 
,4 N w reakcji 

"N-f * - “C+ p (19) 


pochłania neutrony powstające w procesach (a, n ), 
np. w reakcji (12) i (17). Tworzące się w reakcji (19) 
nietrwałe jądro izotopu węgla 14 C ulega przemianie 
0“ (z okresem połowicznego zaniku / 1/2 ok. 5,5 tys. lat) 
i odtwarza „truciznę neutronową” 14 N. 

Do znacznie ciekawszych konsekwencji prowadzić 
może obecność jąder mających duże przekroje czynne 
na reakcje (/i, y). Jądrami takimi są jądra żelazowców 
i pierwiastków cięższych. Na przykład jądro najbar¬ 
dziej rozpowszechnionego izotopu żelaza, *jFe, po 
wychwycie pierwszego neutronu przekształca się 
w trwałe jądro *’Fe, po wychwycie drugiego — rów¬ 
nież w trwałe jądro JjFe, dopiero następny wychwyt 
neutronu tworzy nietrwałe jądro “Fe, rozpadające 
się przez przemianę /?- (/ 1/2 = 45 dni): 

”Fe :;Co+e-+T?,. (20) 

Istotne jest to, że trzy kolejne wychwyty neutronu 
wraz z następującą po nich przemianą /? doprowadzają 
do przemiany jądra żelaza w jądro następnego po 
nim w układzie okresowym pierwiastka. Wychwyt 
kolejnego neutronu przez jądro “Co tworzy nie¬ 
trwałe jądro “Co, z którego w wyniku przemiany 
powstaje trwałe jądro dalszego pierwiastka — niklu 
JjNi. Tak oto poprzez kolejne wychwyty neutronów 
tworzyć się mogą pierwiastki o coraz większych licz¬ 
bach atomowych (-* Powstawanie pierwiastków che¬ 
micznych). 

Zwróćmy jeszcze uwagę na to, że poza mechaniz¬ 
mem powolnego wychwytu neutronów, który się 
wiąże ze stacjonarnymi źródłami neutronów w gwieź- 
dzie, istnieje jeszcze inny sposób powstawania pier¬ 
wiastków ciężkich: szybki wychwyt neutronów wy¬ 
stępujący przy pojawieniu się dużego strumienia 
neutronów w ciągu krótkiego czasu. Właśnie taki 
strumień pojawia się w końcowej fazie ewolucji gwiazd 
o dużej masie, gdy eksplodują jako supernowe. W cen¬ 
trum takiej gwiazdy ciąg kolejnych reakcji egzoener- 
getycznych doprowadza prawdopodobnie do powsta¬ 
nia jąder najsilniej związanych — jąder żelazowców. 
Dalsza produkcja energii w reakcjach termonuklear- 
nych nie jest już możliwa, następuje kontrakcja grawi¬ 
tacyjna jądra gwiazdy, podwyższenie gęstości i tem¬ 
peratury. W efekcie możliwa się staje endoenerge- 
tyczna przemiana jąder żelazowców w hel i neutrony: 

«Fe- 13JH e+4*, (21) 

a wraz z dalszym zagęszczaniem się jądra gwiazdy 
możliwy jest i rozpad helu. W rezultacie powstają 
ogromne ilości neutronów, z których przynajmniej 
część opuszcza centralny obszar gwiazdy. Neutrony 
te napromieniają materię wyrzuconą z obszarów bar¬ 
dziej zewnętrznych, o niższej gęstości i temperaturze, 
zawierającą jądra żelazowców (i jądra cięższe), zdolne 
do wychwytu neutronów pochodzących z centrum 
gwiazdy. W tych warunkach w czasie rzędu minuty 
przypada od kilkudziesięciu do kilkuset neutronów na 
jedno jądro, które je może wychwycić. 


Astrofizyka neutrinowa 
i siedzenie reakcji 
jądrowych w gwiazdach 

Hipoteza jądrowych źródeł energii gwiazd wydaje się 
obecnie najbardziej przekonująca. Przemawia za nią 
zgodność wyprowadzonych na jej podstawie wnios¬ 
ków z obserwacją. Reakcje jądrowe przebiegają jed¬ 
nak w niewielkiej, całkowicie ukrytej przed obserwa¬ 
torem, centralnej części gwiazdy i nikt ich bezpośred¬ 
nio nie obserwował. 

Weźmy np. pod uwagę najbliższą gwiazdę — 
Słońce. Obserwowane promieniowanie dostarcza 
bezpośredniej informacji tylko o atmosferze Słońca 
mającej temperaturę ok. 6 tys. stopni, podczas gdy 
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pierwiast¬ 

ków 

ciężkich 


szybki 

wychwyt 

neutronów 
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promienie- temperatura w jego jądrze wynosi kilkanaście min 
wanie stopni. Wiemy poza tym, że Słońce wypromieniowuje 
Słońca 0 k. 3,86* 10 2 * J/s, ale obserwacje promieniowania elek¬ 
tromagnetycznego, wydobywającego się z jego po¬ 
wierzchni, nie mówią nic o reakcjach jądrowych 
w centrum Słońca, umożliwiających wy promieni o wy- 
wanie takiej energii. O tych reakcjach wnosić możemy 
jedynie pośrednio, na podstawie teoretycznego mo¬ 
delu wnętrza Słońca. Poprawny model musi uwzględ¬ 
niać to, że wkład każdej reakcji termojądrowej do 
łącznej produkcji energii zależy od temperatury, gę¬ 
stości w centrum, składu chemicznego itp. 

Udział poszczególnych gałęzi cykli p-p i CNO we 
wnętrzu Słońca można dopasować do jego jasności 
powierzchniowej, typu widmowego i innych znanych 
własności, pozostanie jednak pewna wątpliwość, nad 
którą przyrodnikowi nigdy nie wolno przejść do po¬ 
rządku dziennego: A może u podstaw teorii ewolucji 
gwiazd tkwi jakaś fałszywa przesłanka dotycząca 
procesów zachodzących w ich wnętrzu? Dylemat ten 
można by rozstrzygnąć, gdyby się udało uzyskać bez¬ 
pośrednią informację o procesach wewnątrz gwiazd. 
Źródłem takiej informacji mogą być neutrina, które 
powstają jako „produkt uboczny” w różnych reak¬ 
cjach spalania wodoru (tabela 1). Bez przeszkód 
opuszczają Słońce i poruszając się z prędkością świa¬ 
tła, docierają do Ziemi w ciągu mniej więcej 8 minut od 
chwili, gdy w jądrze słonecznym zostały wytworzone. 
Mają przy tym niemal tę samą energię i kierunek 
lotu co w chwili powstania. Wynika to z niezwykle 
słabego oddziaływania neutrin z materią (-* Oddzia¬ 
ływania słabe). 

średnia Średnia droga swobodna neutrin o energiach do 
droga kilku MeV w materii o normalnej gęstości (rzędu 
swobodna j g/cm 3 ) sięga milionów miliardów kilometrów. Na- 
neutrin tomiast średnia droga swobodna kwantu y pocho¬ 
dzącego z wnętrza Słońca jest miliardy razy mniejsza 
od rozmiarów Słońca. Zatem obserwowane widmo 
promieniowania elektromagnetycznego Słońca nie 
odzwierciedla widma kwantów y powstających w re¬ 
akcjach jądrowych w obszarach centralnych. Oddzia¬ 
ływania elektromagnetyczne fotonów, przedzierają¬ 
cych się z wnętrza Słońca ku jego powierzchni, opóź¬ 
niają o tysiące lat ostateczne wypromieniowanie przez 
Słońce energii wytworzonej w jego wnętrzu. Ponadto 
ewentualne oscylacje w wytwarzaniu energii w cen¬ 
trum Słońca ulegają znacznemu rozmyciu w czasie 
i mogą się w ogóle nie odbijać na jasności fotonowej 
Słońca. Natomiast obserwacje neutrin umożliwiłyby 
w zasadzie wyznaczenie udziału różnych procesów 


jądrowych w produkcji energii wewnątrz Słońca oraz 
śledzenie zmian tego udziału z upływem czasu. 

Neutrina z różnych reakcji w Słońcu charaktery¬ 
zują się różnym widmem energetycznym. Na przy¬ 
kład reakcja (1) z tabeli 1 jest wywoływana oddziały¬ 
waniem słabym, zbliżona jest więc swym charakterem 
do przemiany p. Widmo neutrin z tej reakcji jest ciąg¬ 
łe, podobnie jak widmo neutrin z przemiany £ + . 

Sięga ono od granicy dolnej, równej zeru, do energii 
maksymalnej, równej 0,42 MeV. Reakcja (1) wystę¬ 
puje we wszystkich gałęziach cyklu p-p, pochodzą 
z niej neutrina o stosunkowo małej energii. Z reakcją widmo 
(1) konkuruje proces (la), analogiczny do procesu energetyczno 
wychwytu elektronu. Prawdopodobieństwo procesu neutrin 
(la) jest mniej więcej 400 razy mniejsze od prawdo¬ 
podobieństwa reakcji (1). Proces (la) dostarcza 
neutrin monoenergetycznych, o energii 1,44 MeV. 

W porównaniu z liczbą neutrin otrzymywanych z reak¬ 
cji (1) jest ich jednak bardzo mało. 

W tabeli 3 zestawione są dane o procesach powsta¬ 
wania neutrin wewnątrz Słońca. Łatwo dostrzec, że 
gdyby głównym źródłem energii była II gałąź boczna 
cyklu p-p, to neutrina ze Słońca miałyby najwyższą 
możliwą wartość energii średniej — połowę neutrin 
stanowiłyby bowiem neutrina borowe, pochodzące 
z procesu (8), o energii maksymalnej 14,06 MeV. 

Neutrina takie najłatwiej byłoby wykryć, gdyż prze¬ 
krój czynny na oddziaływanie (słabe!) neutrin z ma¬ 
terią szybko rośnie ze wzrostem energii neutrin. Co do 
neutrin pochodzących z I gałęzi bocznej cyklu p-p, 
to energia jednego z neutrin (z reakcji 1) nie przekra¬ 
cza 0,42 MeV; drugie neutrino, pochodzące z wychwy¬ 
tu elektronu (5), może mieć energię 0,861 MeV albo 
0,383 MeV — zależnie od tego, czy jądro 7 Li tworzy 
się w stanie podstawowym czy też wzbudzonym. 

Oddziaływanie neutrin litowych z materią słabsze jest 
średnio od oddziaływania neutrin borowych, silniej¬ 
sze natomiast od neutrin pp lub pep. 

Bruno Pontecorvo, uczeń E. Fermiego i jeden z naj¬ 
wybitniejszych znawców problematyki neutrinowej, 
zaproponował ponad 30 lat temu wykorzystanie 
reakcji odwrotnej przemiany P do radiochemicznej 
detekcji neutrin docierających ze Słońca do Ziemi, detekcja 
W reakcjach tych wykrywane byłyby neutrina wywo- neutrin 
łujące przemianę neutronu w proton w jakimś trwa¬ 
łym jądrze atomowym. Zestawienie proponowanych 
reakcji zawiera tabela 4. Wszystkie reakcje odwrotne 
przemiany p są reakcjami progowymi, tj. wymagają 
pewnej minimalnej energii neutrina. Podaliśmy je 
w kolejności odpowiadającej zwiększaniu progu 


Tabela 3. Energia unoszona przez neutrina pochodzące z reakcji termojądrowych 


Cykl 

Reakcje (z tab. 1), w których powstają 
neutrina 

Nazwa grupy neutrin 
i rodzaj widma energe¬ 
tycznego 

Energia neutrin 
McV 

Energia (MeV) uno¬ 
szona średnio w 1 cy- 
lu przez 

Ułamek 
energii cał¬ 
kowitej 
unoszony 
przez neu¬ 
trina 

promie¬ 

niowanie 

elektro¬ 

magne¬ 

tyczne 

neutrina 

P m Pi 

gałąź główni 

0 ) 

(la) — nieznaczny udział w produkcji 
energii i neutrin 

neutrina pp (widmo ciąg¬ 
łe) 

neutrina pep (widmo li¬ 
niowe) 

0 do 0,42 

1,44 

26,22 

0,51 

2 % 

P‘P> 
gałąź 
boczna I 

<k) i (la) — nieznaczny udział (jw.) 

(5) 

neutrina pp i pep 
neutrina berylowe (wid¬ 
mo liniowe) 

0-0,42; 1,44 
(0,861 (90%) 

(i 0,383 (10%) 

25,67 

1,06 

4% 

P-P, 
gałąź 
boczna 11 

(1) i (ta) — nieznaczny udział (jw.) 

(8) 

(8a) — nieznaczny udział (jw.) 

neutrina pp i pep 
neutrina borowe (widmo 
ciągłe) 

(widmo liniowe) 

0-0,42; 1,44 
Odo 14,06 

15,08 

19,1 

7,63 

28% 

CNO, 

gałąź główn: 

(M) 

(14) 

(lla) i (14a) — nieznaczny udział 
w produkcji energii 

neutrina azotowe (wid¬ 
mo ciągłe) 

neutrina tlenowe (wid¬ 
mo ciągłe) 

(widmo liniowe) 

Odo 1,20 

Odo 1,74 

2,22 i 2,76 

24,97 

1,76 

6 % 
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Tabela 4. Reakcje odwrotnej przemiany zaproponowane do detekcji neutrin słonecznych 


Reakcje 

R upow¬ 
szechnianie 
wyjściowego 
nuklidu w % 
(w stosunku 
do danego 
pierwiastka) 

Energia pro¬ 
gowa reakcji 

MeV 

Rodzaj rozpadu i okres połowicz¬ 
nego zaniku powstającego w danej 
reakcji nuklidu promieniotwórcze¬ 
go 

Rząd wiel¬ 
kości masy 
pierwiastka 
(nie nukli¬ 
du), w któ¬ 
rej zachodzi 

1 wychwyt 
neutrina ze 
Słońca na 
dobę 

57 Rb + —► ss Sr + e~ (28) 

27,85 

0,115 

wychwyt elektronu, y, 2,8 h 

10 t 

+ SŚFe + r- (29) 

100 

0,231 

wychwyt elektronu, 2,6 lat 

300 t 

5iGa + v*-*;jGe + e- (30) 

39,6 

0,233 

wychwyt elektronu, II d 

10 t 

;jV + v.-*J iCr + e- (31) 

99,76 

0,752 

wychwyt elektronu y, 27,8 d 

3001 

i^Cl + v c —v ig Ar + e~ (32) 

24,47 

0,816 

wychwyt elektronu, 35,1 d 

450 t 

jLi + v,-> 7 Be + e- (33) 

92,58 

0,862 

wychwyt elektronu, y, 53,4 d 

4 t 

»Be + v, — *B-ł-*- (34) 

100 

0,884 

trwałe produkty końcowe: p + 2a 

7 


energetycznego. Tylko pierwsze trzy reakcje z tabeli 4 
pozwalają na wykrycie neutrin pp\ reakcja (34) i dal¬ 
sze (których nie podajemy) mają zbyt wysoką energię 
progową, by się nadawały do wykrycia nawet neutrin 
berylowych. Jeśli więc energia wytwarzana jest niemal 
tylko w cyklu p-p , to reakcja (34) i inne odbywać się 
mogą jedynie pod działaniem neutrin borowych (i nie¬ 
wielkiej liczby neutrin pep). 

Znając wartość energii wy promie nio wy wanej przez 
Słońce, możemy oszacować produkcję neutrin: po- 
strumień wstaje ich ok. 10 38 w ciągu sekundy. Ich widmo ener- 
neutrin getyczne po dotarciu do powierzchni Ziemi przed¬ 
stawia rysunek 8. Całkowity strumień neutrin pada¬ 
jących na powierzchnię Ziemi wynosi ok. 7-10 10 na 
1 cm 2 w ciągu sekundy. Wobec niezwykłej słabości 
oddziaływania neutrin z materią trzeba by użyć 
ogromnych ilości substancji do detekcji neutrin przez 
odwrotną przemianę /?. 



Rys. 8 . Przewidywane (na podstawie standardowych modeli 
Słońca) widmo neutrin słonecznych po dotarciu ich do po¬ 
wierzchni Ziemi. Linie ciągłe — neutrina z cyklu p-p, linie przery¬ 
wane — niewielka domieszka neutrin z cyklu CNO, odgrywają¬ 
cego podrzędną rolę w Słońcu. Strumienie neutrin podane są 
w l/(cm ł *S’Męy) dla widma ciągłego i w l/(cra ł, s) dla widma 
liniowego (neutrina monoenergetyczne z procesów (la) i (5) z ta¬ 
beli 3) 

Aby zobrazować, jak niezmiernie trudne jest do¬ 
świadczalne wykrycie neutrin słonecznych, przedsta- 
doświadcze- wimy w zarysie doświadczenie Davisa, trwające już 
nie Davisa od kilkunastu lat. Raymond Davis, wybitny radio- 
chemik z Brookhaven, wykorzystuje do detekcji 
neutrin reakcję (32). Detektor Davisa to ogromny 
zbiornik zawierający ok. 610 t (380 tys. 1) czterochlo- 
roetyłenu C 2 Cł 4 . Aby eliminować w maksymalnym 
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stopniu wpływ promieniowania kosmicznego, Davis 
umieścił ten zbiornik na głębokości ponad 1,5 km 
>v szybie kopalni złota w Południowej Dakocie. 
Czterochloroetylen został przedtem oczyszczony z 
ewentualnych, najmniejszych nawet domieszek argo¬ 
nu i innych zanieczyszczeń, zbadano również ekspe¬ 
rymentalnie możliwości wydzielania się argonu ze 
ścianek zbiornika. Montaż zbiornika (z części tran¬ 
sportowanych do szybu dźwigiem kopalnianym), 
sprawdzanie jego szczelności i inne prace przygoto¬ 
wawcze trwały ponad rok (rys. 9 oraz il. 220, tabl. 59). 

Idea doświadczenia jest prosta. Neutrina słoneczne przemiany 
przenikają bez trudu warstwę ziemi nad detektorem służące 
(a w nocy — warstwę pod nim, bo dochodzą wtedy detekcji 
z drugiej strony — od dołu) i wywołują przemianę neutrin 
chloru 37 C1 w argon promieniotwórczy 37 Ar (ty 2 = 

= 35,1 dni). Rozpad argonu to reakcja (32) biegnąca 
od strony prawej ku lewej. Po wychwycie elektronu 
przez jądro 37 Ar następuje emisja elektronu przez 
atom (zjawisko Augera); takie właśnie elektrony 
augerowskie służą w warunkach laboratoryjnych do 
rejestracji rozpadów argonu. 

Co 100-140 dni odbywa się przedmuchiwanie zbior¬ 
nika helem, który unosi ze sobą argon (oba pierwiast¬ 
ki są gazami szlachetnymi o podobnych właściwoś¬ 
ciach chemicznych). Do helu dodany jest trwały izo¬ 
top argonu 36 Ar, co ułatwia ocenę stopnia usunięcia 
argonu zc zbiornika (a przy tym — ze względu na nie¬ 
wielką ilość powstającego i nietrwałego argonu 
37 Ar — izotop trwały stanowi dla niego nośnik). Na¬ 
stępnie argon gazowy oddziela się od helu kondensu- 
jącego się na węglu drzewnym chłodzonym ciekłym 
azotem. Hel przepuszcza się przez zbiornik wielokrot¬ 
nie, aż się odzyska co najmniej 90% wprowadzonego 
niepromieniotwórczego argonu 38 Ar. Argon mierzy się 
licznikiem wewnętrznego napełnienia, połączonym 
z analizatorem energii impulsów (w celu eliminowa¬ 
nia impulsów o pochodzeniu innym niż od elektronów 
Augera). 

Liczba atomów argonu wytworzonych w zbiorniku 
przez neutrina ze Słońca w ciągu 100-140 dni ekspo¬ 
zycji jest od lat liczbą najwyżej dwucyfrową (!). 

Podkreślamy, że wartości otrzymywane przez Davisa 
okazują się wciąż niższe i to aż kilkakrotnie, od ocen 
teoretycznych, wynikających ze standardowych mo¬ 
deli wnętrza Słońca. A przecież wartości doświadczal¬ 
ne mogłyby być większe od teoretycznych uzyskanych 
przy założeniu, że argon 37 Ar tworzy się wyłącznie 
w oddziaływaniach neutrin słonecznych z chlorem 
57 C1. Łatwiej byłoby przystać na istnienie dodatko¬ 
wych mechanizmów wytwarzania jąder 37 Ar w zbior¬ 
niku Davisa niż na nieskuteczność normalnych spo¬ 
sobów jego powstawania, związanych z wielokrotnie 
już sprawdzonymi (w innych sytuacjach) mechaniz¬ 
mami oddziaływań jąder atomowych i cząstek elemen¬ 
tarnych. 

Wielokrotnie sprawdzano różne etapy doświadcze¬ 
nia, m.in. badano wydajność metody wydobywania 




















Rys. 9 Schemat ob¬ 
serwatorium neu- 
trinowego Davisa 


detektor 

Oavisa 



argonu ze zbiornika oraz badano niezależnie reakcje 
jądrowe związane choćby pośrednio z procesami pro¬ 
dukcji neutrin w Słońcu albo z procesem (32). Nic 
jednak nie wskazuje na to, aby w tym tkwiła przy¬ 
czyna niezgodności między przewidywaniami teore¬ 
tycznymi a wynikami doświadczenia Davisa. Raczej 
może za mało jeszcze wiadomo o wnętrzu Słońca 
i może w standardowych modelach Słońca przyjmuje 
się zbyt wysoką temperaturę centralną. Znaczyłoby 
to, że wnętrze Słońca jest zbyt chłodne, by protony 
mogły choć w niewielkim stopniu przechodzi przez 
wysoką barierę potencjału jądra berylu 7 Be w reakcji 
(7, tabela 1). W takim razie po prostu nie istniałyby 
wysokoenergetyczne neutrina borowe z procesu (8, 
tabela 1), które stanowią wprawdzie nieznaczną część 
strumienia neutrin słonecznych, ale które się powinny 
najbardziej przyczyniać do produkcji argonu (ok. 
90%) w reakcji (32). Wszystkie jednak proponowane 
dotychczas modele Słońca z niższą temperaturą w 
centrum wydają się sprzeczne z nagromadzoną do¬ 
tychczas informacją o Słońcu i z wyobrażeniami 
o ewolucji gwiazd. 

Najważniejsze wnioski z doświadczenia Davisa są 
następujące: 1) Cykl CNO nie może być podstawo¬ 
wym cyklem energetycznym Słońca. Gdyby bowiem 
tak było, to szybkość powstawania argonu w zbiorni¬ 
ku Davisa musiałaby o rząd wielkości przewyższać 
szybkość obserwowaną. 2) Temperatura centralna nie 
może przekraczać ok. 15 min stopni. Gdyby była 
wyższa, wtedy znacznie większą rolę odgrywałaby II 
gałąź boczna cyklu p-p i znacznie więcej powstawa¬ 
łoby wysokoenergetycznych neutrin borowych, które 
w zbiorniku Davisa produkowałyby dodatkowe jądra 
argonu 37 Ar. ... 

Obecnie rozważa się i próbuje konstruować detek¬ 
tory neutrin słonecznych wykorzystujące inne reakcje 
z tabeli 4. 

inne Detektor galowy np. miałby pewną przewagę nad 
detektory detektorem chlorowym, gdyż reakcja (30) ma stosun- 
neutrin kowo niski próg energetyczny, tak że neutrina pp, 
tj. z reakcji (I, tabela 1), które nie wytwarzają argo¬ 
nu w detektorze Davisa, produkowałyby w detekto¬ 
rze galowym prawie 2 / s łącznej ilości tworzącego 
się germanu. Neutrina pp muszą powstawać w Słońcu, 
niezależnie od temperatury jego wnętrza, jeśli tylko 
hipoteza jądrowych źródeł energii jest słuszna. Tak 
^ więc detektor galowy (albo rubidowy czy mangano- 

* i wy) o wiele bardziej niż obecnie stosowany chlorowy 


nadawałby się do wykazania, że reakcje jądrowe rze¬ 
czywiście muszą przebiegać wewnątrz Słońca. Nato¬ 
miast znacznie trudniejszy niż w detektorze Davisa 
byłby problem wydzielenia niewielkiej spodziewanej 
liczby atomów germanu 71 Ge z kilku czy kilkunastu 
ton preparatu galowego (wydzielenie argonu — gazu 
szlachetnego nie tworzącego związków — jest niepo¬ 
równanie łatwiejsze). 

Astrofizyka neutrinowa Słońca stawia dopiero 
pierwsze kroki. W sferze projektów jest astrofizyka 
neutrinowa innych gwiazd. Mó,wi się np. o możliwości 
wykrywania olbrzymich strumieni neutrin tworzących 
się w końcowych fazach ewolucji gwiazd, tuż przed 
ich eksplozją jako supernowych. Przewiduje się, że 
detektory, czy może raczej absorbenty owych neutrin 
będą miały rozmiary o rzędy wielkości przewyższa¬ 
jące niemały przecież zbiornik Davisa. 

Jak można jeszcze inaczej przekonać się bezpośred¬ 
nio lub prawie bezpośrednio, czy we wnętrzach gwiazd 
przebiegają reakcje jądrowe? Obsenvując nietrwałe 
produkty tych reakcji trafiające na powierzchnię 
gwiazdy. Przykładem jest odkrycie w widmach gwiazd 
typu S linii widmowych nietrwałego pierwiastka tech¬ 
netu wśród pasm ZrO i linii wielu pierwiastków cięż¬ 
kich. Gwiazdy typu S zalicza się do czerwonych 
olbrzymów, w których wnętrzach przypuszczalnie 
zachodzi proces powolnego wychwytu neutronów, 
prowadzący do stopniowego powstawania atomów 
pierwiastków coraz cięższych. W ten sposób tworzyć 
się może znaczna liczba trwałych jąder molibdenu 
4 9 ®Mo, które po wychwycie neutronu przekształcają 
się w cięższy izotop molibdenu, "Mo (/,/ 2 ok. 67 h). 
W przemianie tworzy się z niego technet "Tc: 

"Mo -* ”Tc-re~+ve, (22) 

którego / 1/2 wynosi 210 tys. lat. Jest to wartość nie¬ 
wielka w porównaniu ze skalą życia gwiazdy. Przy¬ 
jęcie hipotezy, że technet powstaje gdzieś we wnętrzu 
gwiazd-olbrzymów i wyniesiony zostaje na powierzch¬ 
nię, jest jedynym wyjaśnieniem, skąd się on bierze 
w atmosferach tych gwiazd. Przypuszczalnie duże 
rozpowszechnienie różnych pierwiastków ze środka 
układu okresowego (jak Sr, Y, Zr, Ba, La, Ce, Pr) 
w atmosferach gwiazd typu 5 jest wynikiem takiego 
samego procesu. 

W 1972 r. stwierdzono występowanie dwóch trans- 
uranowców, ameryku i kiuru, w gwieździe osobliwej 
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amse-yk i kaur oznaczonej numerem katalogowym HD 25354. Naj- 
w gwiaździe, dłużej żyjące izotopy obu tych pierwiastków znane są 
* D 25354 z laboratoriów ziemskich. Oto one: 

«Am —/ 1/2 = 7950 lat, “’Cm — /,/ 2 ^ 16,4 min lat. 
Te transuranowce mogły powstać jedynie w procesie 
szybkiego wychwytu neutronów, który się zazwyczaj 
wiąże ze stadium supernowej. Wątpliwe, by powstały 
one w tej gwieździe, w której widmie obserwuje się ich 
linie. Mogły jednak np. opaść na jej powierzchnię 
wraz z innymi produktami nukleosyntezy, wyrzuco¬ 
nymi w przestrzeń kosmiczną przez eksplodującą w 
pobliżu gwiazdę supernową. Obecność stosunkowo 
krótkożyjącego ameryku wskazuje na to, że proces 
szybkiego wychwytu neutronów musiał się odbywać 
niezbyt dawno. 

Zagadkę stanowi pochodzenie bardzo nietrwałego 
promet prometu w atmosferze gwiazdy osobliwej HR 465. 
w gwieździe Najdłużej żyjącymi izotopami prometu są ^Pm 
HR 4S3 (t.j 2 = 17,7 lat) i ^Pm (/^ — 5,5 lat). Skąd się bierze 
promet w takich ilościach, że spośród 153 znanych linii 
pojedynczo zjonizowanego prometu zaobserwowano 
w widmie tej gwiazdy aż 110? Albo jądra prometu 
tworzą się w gwieździe (i to na powierzchni lub niezbyt 
głęboko pod nią) w rezultacie reakcji jądrowych wy¬ 
wołanych neutronami, np. 

'"Sm-fK-K ^Pm + P> (23) 

lub protonami: 


\“Nd+p-* ł "Pm-f-«, (24) 

albo też stanowią one produkt rozszczepienia jąder 
pierwiastków poza uranowych. Oba wyjaśnienia wy¬ 
wołują dalsze pytania, np. skąd się biorą neutrony, 
protony o odpowiednio wysokiej energii, by się mogły 
wbić do jąder pierwiastka oZ = 60, oraz pierwiastki 
pozauranowe. Jeden wniosek jest niewątpliwy: obec¬ 
ność krótkożyjącego prometu w atmosferze gwiazdy 
można by wytłumaczyć tylko tym, że procesy jądrowe, 
w których promet powstaje, wciąż jeszcze trwają. 

Bezpośrednie dowody na to, że różne ważne re¬ 
akcje jądrowe dziś jeszcze przebiegają w- gwiazdach, 
nie są może kompletne. Istnieją jednak istotne argu¬ 
menty teoretyczne związane ze strukturą i ewolucją 
gwiazd. Na ich poparcie można przedstawić dowód „ skami©!iny ,ł 
rzeczowy: „skamieliny” pozostałe do dziś po owych 
reakcjach, czyli produkty reakcji jądrowych — różne 
jądra atomovve. Z dzisiejszego rozpowszechnienia 
pierwiastków i ich izotopów odczytać można historię 
materii, a historię tę w znacznym stopniu tw r orzyły 
procesy jądrowe przebiegające w gwiazdach. 

D.D. Clayton Principles of Stel lar EvoJution and Nucieo- 
synthesis, New York 1968; B. Kuchowicz Astronomia neutrinowa 
Słońca , Post. Astr. 18,149(!970) i 263 (1970), oraz 19,109 (!971); 

B. Kuchowicz Neutrinosfrom the Sun, Rep. on Prog.in Phys. 39, 

291 (1976); B. Kuchowicz Problemy i osiągnięcia astrofizyki ją¬ 
drowej. Część II. Nukleosynteza pierwiastków chemicznych jako 
rezultat wytwarzania energii w gwiazdach , Post. Fiz. 22,622 (1971); 

Fizika kosmosa , red. S. B. Pikelner), Moskwa 1976; H. Reeves 
Stel lar EvoIution and Nucleosynthesis, New York-London-Paris 


Powstawanie pierwiastków 
chemicznych 

Bronisław Kuchowicz 


Do połowy lat czterdziestych sądzono, że pierwiastki 
chemiczne powstały w pewnej określonej chwili przed 
^utworzeniem się gwiazd. Usiłowano więc wyjaśnić ich 
powstanie za pomocą jednego, uniwersalnego mecha¬ 
nizmu. Większość owych teorii uniwersalnej, kosmicz¬ 
nej syntezy pierwiastków (czy raczej nukleosyntezy — 
w odróżnieniu od syntezy chemicznej) może już dziś 
zainteresować jedynie historyków nauki. Przypuszcze¬ 
nia związane z różnymi hipotetycznymi mechanizma¬ 
mi powstania pierwiastków nie zgadzały się z wynika- 
teoria mi obserwacji. Próbę czasu przetrwała tylko teoria 
atfa-beta- ałfa-beta-gamma, wysunięta przez R. A. Alphera, 
gamma H. Bethego i G. A. Gamowa w 1948 r. Twórcy jej 
próbowali wyjaśnić przebieg uniwersalnej krzywej 
rozpowszechnienia (rys. 2 i 3 z artykułu -* Rozpo¬ 
wszechnienie pierwiastków chemicznch i molekuł we 
Wszechświecie) zachodzeniem reakcji jądrowych we 
wczesnych fazach ewolucji Wszechświata. Obecnie, 
teoria ta pozwala zrozumieć, na gruncie kosmologii 
oraz fizyki jądra atomowego i cząstek elementar¬ 
nych, jak utworzyły się we Wszechświecie pierwsze 
jądra atomowe. Były to jądra najlżejsze — tylko wo¬ 
dór i hel, z których, w kolejnych pokoleniach gwiazd, 
powstały i do dziś powstają dalsze pierwiastki. Procesy 
nukleosyntezy wciąż jeszcze trwają w przyrodzie, 
i wiążą się ściśle z reakcjami jądrowymi przebiegają¬ 
cymi w gwiazdach (-> Reakcje jądrowe w gwiazdach); 
(powołując się na wzory lub rysunki z tego artykułu 
podawać będziemy ich kolejny numer wraz z literą R). 

Kosmiczna synteza pierwiastków 

Dwa podstawowe fakty obserwacyjne (rozszerzanie 
się Wszechświata i wypełnienie przestrzeni kosmicz¬ 
nej promieniowaniem tła), w powiązaniu z ekstrapo¬ 
lacją znanych praw fizycznych na minione epoki, 
wskazują na ogromne zagęszczenie materii w pierw- 
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szych fazach ewolucji Wszechświata. Wówczas nie 
mogły istnieć ani atomy, ani oddzielne jądra atomo¬ 
we. Nie było oczywiście i tych struktur astronomicz¬ 
nych (gwiazd, galaktyk), które są tak istotnymi 
składnikami obecnego Wszechświata. Aktualny stan 
fizyki cząstek elementarnych, teorii grawitacji, kos¬ 
mologii i termodynamiki pozwala nam na cofnięcie 
w czasie do chwili, gdy gęstość materii sięgała nie¬ 
wyobrażalnej wartości rzędu 10 25 g/cm 3 . (Nie znamy 
praw opisujących materię wcześniejszą, o jeszcze 
większej gęstości). Była to gęstość o dziesięć rzędów 
wielkości przekraczająca gęstość materii jądrowej 
w centralnych obszarach pulsarów i w jądrach atomo¬ 
wych. Skład owej pierwotnej materii nadgęstej był nadgęsta 
znacznie bogatszy niż skład materii w jądrach pulsa- pramateria 
rów; występowały w niej różne nietrwałe cząstki ele¬ 
mentarne i w równowadze z nimi cząstki o zerowej 
masie spoczynkowej: fotony i neutrina czyli, jak bę¬ 
dziemy mówić, promieniowanie wysokoenergetyczne. 

W miarę jak Wszechświat się rozszerzał, obniżała się 
gęstość materii i temperatura, zmieniał się też skład 
materii nadgęstej. Rozpadały się krótkożyjące hipe¬ 
rony i mezony, zwiększał się udział nukleonów. 

W temperaturze ok. 10 21 K (i przy gęstości ok. 

10 10 g/cm 3 ) dominującym składnikiem ylemu (jak 
ową materię nadgęstą nazwał Gamow) były neutrony, 
gdy zaś temperatura opadła dc I0 9 K, protonów było 
już prawie siedmiokrotnie więcej niż neutronów. 

Nic w tym dziwnego, wraz z rozszerzaniem się 
Wszechświata trwał bowiem nieustanny rozpad 
neutronów (o których wiadomo, że w warunkach 
laboratoryjnych mają okres połowicznego zaniku 
ok. 10,8 min) na protony, elektrony i antyneutrina 
elektronowe: 

n->p+e-+v e . (1) 

Jednocześnie protony wychwytywały neutrony, two¬ 
rząc pierwsze jądra złożone — deuterony: 







n+p -> jD-f y. (2) 

Dopóki średnia energia fotonów znajdujących się 
w równowadze z innymi składnikami materii była 
większa od energii wiązania deuteronu (2,2 MeV), od¬ 
działywanie z fotonami niszczyło powstające deute- 
rony. Dopiero w temperaturze 10® K i niższej reakcja 
(2) prowadzi do szybkiego utworzenia deuteronów — 
kosztem szybko wyczerpujących się neutronów. Po¬ 
wstanie deuteronów umożliwia dalsze reakcje tzw. 
syntezy pierwotnej, odbywające się w ciągu pierwszej 
godziny ekspansji kosmicznej: 

synteza *D+/> -> 3 He+y, jD-f-n — 3 H-fy, 

pierwotna 

*D-f 3 D - *He+y, jD+*He -> ‘He-fp, (3) 

- jH-f jHe-f jHe - 7 4 Be-by. 

W miarę ekspansji Wszechświata rozpadają się neu¬ 
trony; już po upływie godziny zostaje zaledwie 7«t 
część ich początkowej ilości (faktycznie jest ich jeszcze 
mniej, bo ulegają wychwytom w reakcjach 2 i 3). 
Przeszkodę w powstawaniu kolejnych jąder przez 
wychwyt neutronów i protonów stanowi nieistnienie 
jakiegokolwiek, choćby krótkożyjącego, jądra o licz¬ 
bie masowej A — 5; następną przeszkodą jest nie¬ 
zwykła nietrwałość jąder o liczbie masowej A = 8. 
Gdyby kolejne pierwiastki miały się tworzyć w reak¬ 
cjach między jądrami złożonymi, w rodzaju czterech 
ostatnich reakcji z grupy (3), wtedy w kolejnych reak¬ 
cjach musiałaby być pokonywana coraz to wyższa 
bariera kulombowska. Tymczasem z upływem czasu 
Wszechświat stygnie, energia kinetyczna cząstek 
stale się obniża, tak że ciągu reakcji (3) nie da się już 
kontynuować. 

Choć przy obliczaniu wydajności syntezy pierwot¬ 
nej w rozszerzającym się Wszechświacie wzięto pod 
uwagę wszystkie możliwe reakcje jądrowe między 
kilkudziesięcioma lekkimi jądrami, okazało się, że w 
syntezie tej nie powstają właściwie jądra o liczbie 
masowej większej niż 7. Oto typowe wyniki pierwotnej 
syntezy kosmicznej podane w procentach wagowych 
składu otrzymanej materii: 3 He — ok. 0,00004%, 
4 He — ok. 30%, 7 Li — ok. 0,00004%, jądra o liczbie 
masowej A ^ 12 — ok. 0,000006%, reszta — wodór 
1 H. Wyniki liczbowe różnią się nieco, zależnie od 
szczegółów rozważanej wersji modelu rozszerzającego 
się Wszechświata (np. ułamek wagowy wytworzonego 
helu 4 He może się wahać od 0,25 do 0,40), ale zasad¬ 
nicze znaczenie ma to, że w syntezie pierwotnej mogły 
powstać jedynie wodór i hel oraz lit (ten ostatni głów¬ 
nie z przemiany wytworzonego berylu 7 Be). Więk¬ 
sza część obserwowanego dziś w gwiazdach helu — to 
nie hel powstały w ich wnętrzach, lecz produkt pro- 
powstani® cesów jeszcze dawniejszych, gdy gwiazdy nie istniały, 
jąder T rz y najlżejsze pierwiastki chemiczne — to „skamie- 
najlżejszych jj ny ” pochodzące z ery radiacyjnej ewolucji Wszech¬ 
świata (-* Kosmologia). 


Powstawanie pierwiastków chemicznych 
jako produkt uboczny wytwarzania 
energii w gwiazdach 

Gwiazda czerpie energię z egzoenergetycznych reakcji 
termojądrowych, z wyjątkiem krótkotrwałych faz 
kontrakcji grawitacyjnej (następujących po wypaleniu 
określonego rodzaju paliwa jądrowego w centrum). 

Gwiazdy pierwszego pokolenia powstały z materii 
zawierającej produkty kosmicznej syntezy pierwot- 
spalanie n ej. Najdłużej trwający etap ich ewolucji — to spalanie 
wodoru wodoru w cyklu pp (materia nie zawierała w swoim 
składzie jąder-katalizatorów cyklu CNO). Zależnie 
od masy gwiazdy (-> Ewolucja gwiazd), po wypaleniu 
wodoru, mógł przebiegać dłuższy lub krótszy ciąg 
procesów termojądrowych, w których z jąder lżej¬ 
szych tworzyły się jądra coraz to cięższe. Ale nawet 
w gwiazdach o największej masie nie mogły powstać 


tym sposobem jądra atomowe o liczbach masowych 
większych niż 60. W egzoenergetycznych reakcjach 
termonuklearnych jądra słabiej związane nie mogą 
się tworzyć z jąder silniej związanych. ^ . 

Spalanie wodoru w gwieździe zwiększa zawartość 
helu. Następny pod względem ważności proces ter- 
monuklearny to spalanie helu, podczas którego gwiaz¬ 
da opuszcza ciąg główny i zatacza charakterystyczne 
pętle na wykresie Hertzsprunga-Russella w obszarze 
olbrzymów (-► Ewolucja gwiazd, rys. 2), przechodząc 
przez fazy niestabilności pulsacyjnej. Jest wtedy na¬ 
wet możliwa powolna utrata materii przez gwiazdę. 

W procesie spalania helu tworzy się nie tylko naj¬ 
pospolitszy izotop węgla ,2 C w reakcjach (R-8) 
i (R-9), ale i najpospolitsze izotopy tlenu i neonu. 

Jądra 13 0 powstają przez przyłączenie dalszej cząstki 
a w reakcji (R-l 1) do już wytworzonego jądra węgla 
12 C; analogicznie, z tlenu 1<j O tworzy się neon 20 Ne. 

Powyższe procesy nukleosyntezy odbywają się w sta¬ 
dium olbrzymów, przez które przechodzi znaczna 
część gwiazd. Fakt ten tłumaczy większe rozpowszech¬ 
nienie jąder „alfowych” 12 C, lc O i 20 Ne niż jąder z ni¬ 
mi sąsiadujących. Jest też zrozumiałe, dlaczego tlen, 
węgiel i neon zajmują trzecie, czwarte i szóste miejsce 
w kolejności rozpowszechnienia (str. 982 rys. 2). 

Poza tym widać, dlaczego na uniwersalnej krzywej 
rozpowszechnienia występują charakterystyczne mi¬ 
nima lokalne dla trzech lekkich pierwiastków: litu, 
berylu i boru. Nie mogą one powstać z helu, który 
spala się od razu na węgiel i dalsze pierwiastki (pa¬ 
rzyste!). Nie mogą też powstać w większych ilościach 
podczas spalania wodoru, mimo że powstają np. w ga¬ 
łęziach bocznych cyklu pp , mają jednak duże prze¬ 
kroje czynne dla różnych procesów z tego cyklu i po¬ 
wstają jedynie przejściowo podczas przemiany wo¬ 
doru w hel. 

Produkty spalania helu w centrum gwiazdy mogą 
same „wstąpić” w reakcje jądrowe postaci (R-23 — 
tabela 2) i (R-24 — tabela 2), jeśli tylko masa gwiazdy 
jest wystarczająco duża, by pod wpływem sił grawita¬ 
cyjnych mogło nastąpić kolejne zagęszczenie i pod¬ 
grzanie jądra gwiazdy. Analogiczna sytuacja może się 
powtarzać jeszcze kilkakrotnie, po zużyciu kolejnego 
paliwa w jądrze gwiazdy. Do zapłonu następnego 
paliwa dochodzi tym łatwiej, im większa jest masa 
gwiazdy, przy czym stale rośnie temperatura i gęstość 
w centrum. W reakcjach między dwoma jądrami mogą 
powstawać coraz to bardziej różnorodne produkty 
końcowe. W reakcjach spalania węgla (R-23 — ta¬ 
bela 2) mieliśmy aż pięć końcowych możliwości; 
zwróćmy uwagę na pojawienie się swobodnych neutro¬ 
nów i fotonów. W dalszych fazach spalania termo- 
nuklearnego powstaje i oddziałuje z sobą coraz to 
większa liczba różnych rodzajów jąder, a także swo¬ 
bodne neutrony, protony i kwanty y, wreszcie zbliża¬ 
my się do równowagi między nimi, i w składzie mie¬ 
szaniny jąder zaczynają przeważać te, które są naj¬ 
trwalsze. Takimi najtrwalszymi jądrami są jądra że- 
lazowców. Zespół procesów, przebiegających w wa¬ 
runkach równowagi, nazwano procesem e (z ang. proces e 
eąuilibrium — równowaga). Wydaje się, że proces ten 
jest końcową fazą aktywnego okresu ewolucji gwiaz¬ 
dy. Faza ta przebiega bardzo szybko i kończy się 
wybuchem rozrzucającym w przestrzeń dużą część 
produktów tego procesu, a także procesów poprzed¬ 
nich, których produkty zawarte są w bardziej ze¬ 
wnętrznych warstwach gwiazdy (rys. 1). Dziś nazwa 
procesu e obejmuje nie jakiś hipotetyczny, odrębny 
od innych procesów jądrowych w gwieździe mecha¬ 
nizm powstawania jąder żeiazowców, lecz jest raczej 
skrótem, pod który podstawiamy wiele już poznanych 
i zlokalizowanych w różnych obiektach procesów 
spalania pierwiastków o liczbach atomowych Z ^ 14 
(a więc krzemu, siarki, wapnia itd.), w których po¬ 
wstają jądra coraz to cięższe aż do żeiazowców. 

Maksimum rozpowszechnienia żeiazowców (str. 

983, rys. 3) jest lokalne, a nie bezwzględne. Stąd wy¬ 
nika, że tylko niewielka część materii we Wszech- 
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świecie przeszła prze 2 proces e. Mimo że skład che¬ 
miczny materii zmienia się w określonym kierunku, 
oraz że stale wzrasta udział pierwiastków cięższych 
od wodoru i helu, to niepodona sobie wyobrazić, by 
nawet za sto miliardów lat rozpowszechnienie żela- 
zowców było największe ze wszystkich pierwiastków. 

przed wybuchem po wybuchu 



Rys. 1 . Struktura i skład chemiczny masywnej gwiazdy (10 A /0 
^ Af 60 Af 0 > tuż przed wybuchem (po lewej) oraz skład che¬ 
miczny materii po wybuchu (po prawej). Dla stanu przed wybu¬ 
chem podano (po lewej stronie): u góry — reakcje stacjonarnego 
spalania przebiegające w kolejnych warstwach; pośrodku — 
gęstość średnią i temperaturę każdej z tych warstw; u dołu — 
skład chemiczny warstwy. Dla stanu po wybuchu podano (z pra¬ 
wej strony): u góry — procent masy gwiazdy, zawarty w danej 
warstwie (wyrzucany w przestrzeń), a także ważniejsze nuklidy, 
które przeżyły wybuch; u dołu — nuklidy wytworzone w danej 
warstwie podczas wybuchu oraz odbywające się podczas niego 
procesy. 

Obszar ciemnoniebieski w środku oznacza ewentualną pozo¬ 
stałość po gwieździe (pulsar, czarna dziura). Litery p i r wskazują 
na odpowiednie procesy nukleosyntezy, litera s na obecność pro¬ 
duktów procesu s 

ewolucja Naszkicowany schemat powstawania pierwiastków 
gwiazd w . ^ ra ^ c ^ e ewolucji gwiazd I pokolenia można prze- 
fl pokolenia — z P ewn 4 modyfikacją — na dalsze pokolenia 
gwiazd, uwzględniając przede wszystkim zmianę skła¬ 
du chemicznego materii międzygwiazdowej, o której 
przyjmuje się, że powstają z niej kolejne pokolenia 
gwiazd. Różnego typu niestabilności w późnych sta¬ 
diach ewolucji gwiazd prowadzą do powolnej lub 
gwałtownej utraty masy (np. wybuch gwiazdy super¬ 
nowej), zatem ośrodek międzygwiazdowy wzbogaca 
się stopniowo w pierwiastki coraz cięższe. Gwiazdy 
drugiego pokolenia mogą już zawierać pierwiastki 
chemiczne aż do żelazowców włącznie. Jeśli gwiazda 
drugiego pokolenia ma dość dużą masę, to w jej wnę¬ 
trzu zawierającym jądra węgla, wodór będzie się 
spalał w cyklu CNO. Stosunek ilościowy jąder-kata- 
lizatorów ustala się wtedy zgodnie z wyrażeniem 
(R-13), czyli 95% początkowej liczby jąder węgla 12 C 
przechodzi w jądra azotu 14 N, 1% tej liczby — w jądra 
rzadszego izotopu węgla I3 C. Duże rozpowszechnienie 
azotu we Wszechświecie (piąte miejsce) jest wynikiem 
procesów spalania wodoru w gwiazdach II i następ¬ 
nych pokoleń. 

Istotną cechą jąder żelazowców są duże przekroje 
czynne na reakcje typu («, y). Zatem w gwieździe II 
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pokolenia neutrony powstające w reakcjach (R-23- 
24 — tabela 2) i innych mogą wytwarzać z jąder że¬ 
lazowców jądra jeszcze cięższe. 


Powstawanie pierwiastków ciężkich 
w reakcjach wychwytu neutronów 

Rozważanie procesów wychwytu neutronów ułatwia tablica 
tablica nuklidów — graficzne zestawienie wszystkich nuklidów 
znanych trwałych i nietrwałych odmian jąder atomo¬ 
wych. Tablicę taką w zmniejszeniu przedstawia rys. 2. 

Czarne kwadraciki oznaczają jądra trwałe i długo- 
żyjące, linia łamana otacza obszar, w którym znaj¬ 
dują się znane jądra promieniotwórcze. Dwie linie 
grube odpowiadają jądrom, w których energia wiąza¬ 
nia ostatniego neutronu bądź ostatniego protonu jest 
równa zeru ( B n — 0 lub B p = 0); obejmują one ob¬ 
szar, wewnątrz którego mogą istnieć jądra atomowe. 

Czarne kwadraciki łączą się z ścieżką trwałości (-*■ Ją¬ 
dra atomowe i ich wzbudzenia), która dzieii obszar 
istnienia jąder atomowych na dwie części. W części 
górnej (między linią Bp — Oa ścieżką trwałości) jądra 
promieniotwórcze mają na ogół za dużo protonów. 

Przemiana albo wychwyt elektronu sprowadzają 
jądra takie bliżej ścieżki. W części dolnej (między 
linią B n ~ 0 a ścieżką trwałości) jądra promienio¬ 
twórcze zawierają za dużo neutronów. Przemiana /?-, 
w której wyniku jeden z neutronów w jądrze za¬ 
mienia się w proton, przesuwa takie jądro skośnie 
w lewo ku gói*ze, zbliżając je ku ścieżce trwałości od 
dołu. 

Począwszy od liczby masowej A = 50 trwałe jądra 
atomowe mają zazwyczaj duże przekroje czynne (rzę¬ 
du barna i większe) na wychwyt neutronu (//, y). Wy¬ 
jątkowo małe przekroje charakteryzują jedynie nie¬ 
które jądra magiczne. Strzałka na rys. 2 wskazuje na 



Rys. 2. Tablica nuklidów w schematycznym ujęciu. Z liczba pro¬ 
tonów, N liczba neutronów 


trwałe jądra żelazowców — końcowe produkty łań¬ 
cucha reakcji termojądrowych, stanowiące zarazem 
punkt wyjściowy dla dalszej nukleosyntezy. Ponieważ 
procesy wychwytu neutronów zaczynają się od ją¬ 
der — zarodzi z grupy żelazowców, wystarczy w dal¬ 
szych rozważaniach ograniczyć się do tej części ta¬ 
blicy nuklidów, która zawiera jądra o liczbie proto¬ 
nów Z 25 i liczbie neutronów N ^ 30 (rys. 3). Wy¬ 
chwyt neutronów, zaczynający się od trwałych ją- 
der-zarodzi, prowadzi zawsze na prawo od ścieżki 
trwałości, tj. w obszar jąder promieniotwórczych ma¬ 
jących za dużo neutronów. Nawet jeśli po kilku 
pierwszych wychwytach neutronów jądro wychwytu¬ 
jące pozostanie trwałe, to i tak, w rezultacie któregoś 
z kolei wychwytu, powstanie jądro wykazujące pro¬ 
mieniotwórczość /? 
















powolny W poprzednim artykule rozważaliśmy sytuację, 
i szybki w której z trwałego jądra-zarodzi ^Fe dopiero po 
wychwyt wychwycie trzeciego neutronu utworzyło się nietrwałe 
neutronów jądro ^Fe. W przemianie (R-20) powstało z niego 
trwałe jądro kobaltu “Co, zdolne do wychwytu 
czwartego neutronu. Zwróćmy uwagę na wartość 
liczbową okresu połowicznego zaniku nietrwałego 
jądra “Fe: 45 dni. Fakt, że jądro to zdążyło się roz¬ 
paść, i* że dopiero trwały produkt jego przemiany 
wychwycił czwarty neutron, dowodzi powolności 
procesu wychwytu. Inaczej mówiąc, średni odstęp 
czasu tn między kolejnymi wychwytami neutronu 
przez to samo jądro jest dosyć duży. Oczywiście od¬ 
stęp ten musi być większy niż okres połowicznego za¬ 
niku jądra “Fe ze względu na przemianę fi~. Ale w 
innych przypadkach czas t n może wcale nie być więk¬ 
szy od tp — okresu połowicznego zaniku ze względu 
na rozpad p~ powstających w tych procesach jąder. 
Ze względu na relacje między t n i tp przebiegający ze¬ 
spół reakcji i rozpadów stanowi łącznie albo proces 
s (z ang. slow — powolny), albo proces r (z ang. rapid 
— szybki): 

1) Gdy tn > tp, to wychwyt kolejnych neutronów 
odbywa się stosunkowo powoli. Neutrony są wychwy¬ 
tywane przez jądro trwałe, gdyż jeśli powstanie jądro 
nietrwałe, to i tak zdąży się rozpaść przed wychwytem 
następnego neutronu. Jest to proces s. Jego ilustracją 
jest omówiony wyżej przykład. 

2) Gdy t n < tp, wtedy wychwyt odbywa się szybko. 
Odstęp czasu między kolejnymi aktami wycłwytu 
neutronów przez to samo jądro jest tak krótki, że 
jądro nie zdąży się rozpaść, dopóki trwa wychwyt. 
Sytuacja ta odpowiada procesowi r . 

Każdy z tych procesów przebiega w charakterystycz¬ 
nych dla siebie warunkach w odpowiedniej fazie ewo¬ 
lucji gwiazdy. 

proces 5 Nukleosynteza pierwiastków ciężkich w procesie 
s — to jak gdyby powolne wdrapywanie się jąder-za- 
rodzi z lewego dolnego rogu na rys. 3 wzdłuż ścieżki 
trwałości w górę na prawo, ku coraz wyższym war¬ 
tościom liczby masowej A i liczby porządkowej Z. 
Podczas trwania tego procesu jądra atomowe nie od¬ 
dalają się od ścieżki trwałości o więcej niż jedną lub 



liczba masowa A 

Rys. 3. Schemat ogólny przebiegu procesów s i r 

dwie wartości liczby neutronów N. Gdy tylko się od 
niej oddalą, przemiana sprowadza je na nią z po¬ 
wrotem. Proces ten, schematycznie przedstawiony 
linią łamaną „s” na rys. 3, ilustrujemy powiększonym 
fragmentem tablicy nuklidów, zawierającym odcinek 
ścieżki trwałości między liczbami masowymi 151 
i 161. Najlżejszym nuklidem na rysunku jest samar 
ł *°Sm. W rezultacie wychwytu neutronu tworzy się 
z niego nietrwały m, który może przed swym roz¬ 
padem wychwycić" następny neutron, przechodząc 



Rys. 4. Fragment tablicy nuklidów ze ścieżką procesu ^(—» oraz 
zaznaczeniem procesów r (strzałki ukośne) i p (strzałki pionowe 
i poziome i Liczba neutronów wzrasta od strony lewej 
ku prawej, liczba protonów — ku górze. Dla nuklidów trwałych 
podano rozpowszechnienie (zawartość procentowa poszczegól¬ 
nych izotopów danego pierwiastka), dla nietrwałych — okresy 
połowicznego zaniku w stanie podstawowym 

w trwały 3 “Sm. Jeśli natomiast jądro x “Sm zdąży się 
rozpaść przed wychwytem neutronu, tó dalszy neu¬ 
tron zostanie wychwycony już przez trwały europ 
3 “Eu. Dla jądra 3 “Sm należy uwzględnić dwa możliwe 
procesy — przemianę i reakcję ( n , y) — gdyż dla 
niego nie jest spełniony warunek t n > tp (natomiast 
oba charakterystyczne czasy są wielkościami niemal 
tego samego rzędu); w miejscu tym szlak procesu s 
rozgałęzia się. Na rys. 4 widać jeszcze jedno rozgałę¬ 
zienie procesu s. 

Rozgałęzienia nie zmieniają w istotny sposób prze¬ 
biegu procesu s. Jego cechą charakterystyczną jest 
pojawianie się przez dłuższy czas (setki tysięcy a na¬ 
wet miliony lat) niewielkiej liczby neutronów, tak że 
średnio na jedno jądro-zarodź przypada wychwyt 
neutronu raz na kilka miesięcy albo kilka do kilku¬ 
dziesięciu czy nawet kilkuset lat. Proces s nie wy¬ 
twarza jednak wszystkich izotopów pierwiastków cięż¬ 
kich. Trwałe izotopy pierwiastków parzystych, które 
znajdują się najdalej na prawo na rys. 4, nie mogą 
w nim powstać. Tak więc, np. najcięższy izotop gado¬ 
linu, 3 “Gd, nie może się wytworzyć z lżejszego izotopu 
gadolinu przez wychwyt neutronu, gdyż 3 “Gd jest 
jądrem o niezwykle krótkim okresie połowicznego 
zaniku i po powstaniu w procesie s przechodzi przez 
przemianę P~ w trwały izotop terbu 0“Tb). Z terbu 
A “Tb po wychwycie neutronu i przemianie /?“ tworzy 
się dysproz 3 *°Dy, nie może natomiast powstać ga¬ 
dolin 3 ®°Gd. Szlak procesu s nie przebiega także przez 
najlżejsze izotopy pierwiastków parzystych, w rodzaju 
gadolinu 3 “Gd czy l “Dy z rys. 4. 

Jak wynika z tego rysunku w procesie s nie mogą 
powstać ani najcięższe, ani też najlżejsze izotopy nie¬ 
których pierwiastków parzystych. Również nie mogą 
powstać nietrwałe pierwiastki ciężkie, tworzą się je¬ 
dynie pierwiastki trwałe (tj. takie, które mają przy¬ 
najmniej jeden trwały izotop). Ostatnim pierwiastkiem 
trwałym w układzie okresowym jest bizmut, który ma 
tylko jeden trwały izotop 2 “Bi. Obszar niezwykle krót- 
kożyjących pierwiastków między bizmutem a torem 
nie pozwala na przedłużenie szlaku procesu s do nie¬ 
trwałych wprawdzie, ale dlugożyjących izotopów 
uranu i toru, tworzących tak zwaną pierwszą wyspę pierwsza 
trwałości (oczywiście względnej), leżącą na przedłu- wyspa 
żeniu ścieżki trwałości. Przyczyną tego jest przemiana trwałości 
a — dominujący sposób rozpadu jąder nietrwałych 
cięższych od bizmutu. W wyniku tej przemiany 
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następuje „zawracanie” powstających jąder ciężkich 
w obszar jąder lżejszych, wytworzenie zamkniętej 
pętli, kończącej proces ,s. Spójrzmy na rys. 5. Jeśli 
trwałe jądro 2 ™Bi wychwyci neutron, wtedy powstaje 
w jednym z dwóch możliwych stanów izome¬ 
rycznych. Ze stanu o okresie połowicznego zaniku 
ok. 5 dni jądro to przechodzi przez przemianę 
w znany emiter cząstek a, polon 2 ™Po (f 1/2 « 138 dni). 
W przemianie cc tworzy się z niego ołów 2 j£Pb. Jeśli 
powstanie w stanie długożyjącym (/ 1/2 = 2,6 min 
łat), wtedy jeszcze przed rozpadem zdąży wychwycić 
następny neutron. W ten sposób powstałe jądro 211 Bi 




- L - 1 -i- «_ 1 _ , _ 

122 12 3 124 125 126 123 ” 

• - nuklidy trwałe □ - nuklidy długo żyjące 

o - nuklidy krótko żyjące,—► (Doziomo) reakcja (n,y) 

- (skośnie w lewo) przemiana ,9” 

-(skośnie w prawo) wychwyt elektronu 

(skośnie w dół) rozpad a 

Rys. 5. Przebieg końcowej części procesu s 

0i/2 — 2,15 min przez przemianę a przechodzi w tal 
to n zaś jądro przez przemianę przechodzi 
w ołów 2 ”Pb. Przyłączanie neutronów przez bizmut 
tworzy aż dwie pętle obiegu zamkniętego pod koniec 
szlaku procesu s. Choćby proces ten trwał miliony 
lat, w rezultacie powolnego dołączania neutronów do 
jąder o liczbie masowej A ^ 210 można z jąder tych 
otrzymać na koniec co najwyżej jądra ołowiu i biz¬ 
mutu, nigdy jednak nie uda się „przepompować” 
ich do obszaru pozabizmutowego. 

„Przepompowanie” takie jest natomiast możliwe 
proces r w procesie r. W rezultacie neutronizacji zagęszczają¬ 
cego się wnętrza gwiazdy przez reakcje typu (R-21) 
powstają ogromne ilości swobodnych neutronów, stę¬ 
żenie ich sięga wartości 10 25 neutn;r Ł w w 1 cm 3 
i większych. Część tych neutronów, . hodząca na 
zewnątrz, napromieniowuje jądra-zarodzie z wyrzu¬ 
canych w przestrzeń warstw zewnętrznych. Na jedno 
takie jądro może nawet przypadać kilkaset neutro¬ 
nów. Jeśli znów wystartujemy z lewego dolnego naroż¬ 
nika rys. 3, gdzie znajdują się trwałe jądra żelazow- 
ców, to w ciągu pierwszych paru sekund jądro-zarodź 
wychwyci kolejno tyle neutronów, że przesunie się aż 
pod granicę obszaru, w którym mogą jeszcze istnieć 
jądra, a więc energia wiązania ostatniego neutronu 
w tym jądrze będzie wielkością rzędu 1-2 MeV. Poło¬ 
żenie jądra odpowiadać będzie miejscu tuż przy krzy¬ 
wej B n — Oz rys. 2. Dopóki jądro się tak bardzo nie 
przesunęło w prawo, wciąż spełniony był warunek 
tn < ta. Jednak w owym skrajnym położeniu (które 
odpowiada miejscu oznaczonemu literą M na rys. 3) 
okres połowicznego zaniku przemiany ff- dla owego 
jądra staje się wielkością porównywalną z odstępem 
czasu między kolejnymi wychwytami neutronu, a obie 
te wartości nie przekraczają ułamków sekundy. Do 
jądra w tym miejscu nie da się już dołączyć dalszego 
neutronu, zanim nie nastąpi przemiana Produkt tej 
przemiany znów będzie mógł przyłączyć jeden lub parę 
neutronów w czasie rzędu ułamków sekundy, zanim 
stanie się tak krótkożyjący, że zdąży doznać następ- 
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nej przemiany 0- przed wychwytem kolejnego neutro¬ 
nu. Sytuacja przypomina w rezultacie przebieg pro¬ 
cesu 5 z pewną istotną różnicą. Szlak procesu r od¬ 
dala się najpierw od ścieżki trwałości i przybliża do 
hipotetycznej linii Bn = 0, by biec następnie wzdłuż 
tej ostatniej, mniej więcej równolegle do szlaku pro¬ 
cesu s. Na uwagę zasługuje stromy kształt przebiegu 
szlaku procesu r przy liczbach magicznych neutronów 
N = 50, 82 i 126. Wiąże się to z trudnością dołączania 
w tych miejscach kolejnego neutronu do zamkniętej 
powłoki. 

Podczas gdy szlak procesu s biegnie na przemian 
przez jądra trwałe i ^--promieniotwórcze, szlak pro¬ 
cesu r prowadzi przez jądra wyłącznie nietrwałe, o zni¬ 
komych okresach połowicznego zaniku. Gdy proces r 
się skończy (a trwa on zapewne nie więcej niż kilka 
minut poczas eksplozji gwiazdy), wszystkie jego pro¬ 
dukty są nietrwałe i dopiero po pewnej liczbie kolej¬ 
nych przemian p~ mogą się stać jądrami trwałymi. 

Ową stabilizację produktów procesu r zaznaczyliśmy 
na rysunku 3 linią przerywaną dla jednego jądra; nie 
sposób zrobić to dla wszystkich produktów procesu r, 
gdyż wtedy rysunku stałby się bardzo nieczytelny. 

Jeśli tylko strumień neutronów w procesie r był 
dostatecznie duży, wtedy mogły powstać jądra o du¬ 
żych wartościach liczby masowej, być może nawet 
A x 300. Z badań laboratoryjnych nad pierwiastkami 
transuranowymi wiemy, że im cięższe jest jądro, tym 
łatwiej ulega samorzutnemu rozszczepieniu, jak i roz¬ 
szczepieniu pod działaniem neutronów. Oba te zja¬ 
wiska nie pozwalają na przedłużanie szlaku procesu r 
ku dowolnie dużym wartościom liczb masowych. 
Ekstrapolacja danych laboratoryjnych pozwala przy¬ 
puszczać, że w wyniku rozszczepienia (samorzutnego 
i wywołanego przez neutrony) proces r kończy się 
gdzieś w pobliżu liczby masowej A X, 300. Na skutek 
rozszczepienia tworzą się jądra lżejsze — fragmenty 
rozszczepienia; to zawracanie fragmentów rozszcze¬ 
pienia w środkowe rejony tablicy nuklidów (zazna¬ 
czone strzałkami na rys. 3) stanowi odpowiednik pętli 
kończącej proces s. 

W wyniku procesu r i następujących po nim prze¬ 
mianach można dotrzeć w pobliże pierwszej wyspy 
trwałości. Tak też mogły powstać pierwiastki trans- 
uranowe, znacznie krócej żyjące niż uran i tor. Nie 
dotrwały one na Ziemi do dziś, mogą jednak wystę¬ 
pować w promieniowaniu kosmicznym (powstającym 
w eksplozjach gwiazd supernowych, podczas których 
tworzą się produkty procesu r), a może i gdzie indziej 
w kosmosie, gdzie proces r nie tak dawno się odbył. 

Proces r może doprowadzić do powstania pewnej druga 
grupy jąder z tzw. drugiej wyspy trwałości, w pobliżu wyspa 
hipotetycznego jądra podwójnie magicznego o Z = trwałości 
= 114 i N = 184. Istnienie takiej wyspy przewidują 
od lat teoretycy (->■ Jądra w stanie ekstremalnym). 

Hipotetyczne pierwiastki superciężkie z tej wyspy 
byłyby oczywiście nietrwałe, mogłyby jednak być na 
tyle długożyjące, że warto ich poszukiwać, jeśli nie 
w materii ziemskiej, to w’śród produktów reakcji ją¬ 
drowych w laboratorium, także w pierwotnym pro¬ 
mieniowaniu kosmicznym pochodzącym z eksplozji 
odległych gwiazd. 

Produkty procesu r po jego zakończeniu zbliżają 
się do ścieżki trwałości na rys. 3 skośnie w górę na 
lewo. Kierunki kilku końcowych przemian p są także 
zaznaczone na rys. 4. Łatwo zauważyć, że w' procesie r 
tworzą się najcięższe izotopy pierwiastków parzystych, 
które jak ^jSm, i J J°Gd z rys. 4 nie mogą powstać 
w procesie ś. Produktami procesu r jest też znaczna 
część tych jąder trwałych, przez które przebiega szlak 
procesu s. Ale niektóre jądra powstające w procesie s , 
jak np. ^Gd czy l *°Dy z rys. 4, nie mogą być produk¬ 
tami procesu r. Są one przed procesem r „osłaniane” 
przez swoje izobary o niższym ładunku, a w'ięc od¬ 
powiednio przez 15 e *Sm i ™° 4 Gd. Wreszcie najlżejsze izo¬ 
topy pierwiastków parzystych, które nie mogą po¬ 
wstać w procesie j, tym bardziej nie będą tworzyć się 
w procesie r. 
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Procesy nukieosyntezy trzeciego 
rzędu 

Pozostały jeszcze dwie nieliczne grupy jąder o nie¬ 
wielkim stosunkowo rozpowszechnieniu, których po¬ 
wstanie nie wiąże się ani z procesami pierwszego rzę¬ 
du — egzoenergetycznymi reakcjami termonuklear- 
nymi, ani też z procesami drugiego rzędu — wychwy¬ 
tem neutronów. Pierwszą grupę tworzą tzw. jądra po¬ 
minięte — najlżejsze izotopy niektórych parzystych 
pierwiastków ciężkich. Rozpowszechnienie każdego 
z nich jest małe (patrz np. wartości liczbowe dla *^Gd, 
1& «Dy i 168 Dy na rys. 4), co wskazuje na powstanie 
ich w jakimś procesie o niezbyt wysokim prawdopo¬ 
dobieństwie. Proces ten nazwano kiedyś procesem p, 
przypuszczano bowiem, iż w wyniku jednej lub dwóch 
reakcji przyłączenia protonu, tj. reakcji ( p , y), jądra 
te mogą powstać np. z produktów procesu 5 (niekiedy 
nawet i z produktów procesu r). Proces p byłby więc 
procesem trzeciego rzędu. Zasadniczą trudnością w 
analizie tego procesu jest wyjaśnienie, skąd biorą się 
w gwieździe protony o tak wielkiej energii, że mogą 
przejść przez wysoką barierę kulombowską wokół 
jąder ciężkich. 

Powstanie jąder pominiętych znacznie łatwiej wy¬ 
jaśnić, odwołując się do reakcji fotojądrowych, które 
mogłyby przebiegać w końcowych fazach ewolucji 
niektórych gwiazd po osiągnięciu wysokiej temperatu¬ 
ry rzędu kilku milionów stopni. W warunkach tych 
pojawiłaby się ogromna ilość kwantów' y, zdolnych 
do wywołania całego ciągu reakcji (y, n), (y, p ) 
i (y, a) w obecnych w materii gwiazdnej produktach 
wychwytu neutronów. Na rys. 4 podano jako przy" 
kład, w jaki sposób w wyniku dwóch kolejnych reakcji 
(y, n) jądro ł ™Dy przechodzi w jądro pominięte x “Dy. 
Chociaż obecnie przeważa pogląd, że jądra pominięte 
powstają raczej w reakcjach fotojądrowych niż przez 
wychwyt protonów, to nadal utrzymuje się nazwa 
procesu p \ odzwierciedla ona to, że proces/? prow r adzi 
do wytworzenia jąder ciężkich, o możliwie najwięk¬ 
szym udziale protonów. 

Następna grupa jąder o niewielkim rozpowszech¬ 
nieniu, która nie twarzy się ani w reakcjach termo¬ 
jądrowych, ani poprzez wychwyt neutronów — to 
jądra trzech pierwiastków lekkich: litu, berylu i boru. 
Do grupy tej zalicza się niekiedy dwa rzadkie izotopy 
dwu najlżejszych pierwiastków: *D i 8 He. Wszystkie 
jądra z tej grupy są bardzo nietrwałe ze względu na 
reakcje termonuklearne. Choć np. deuter, lekki izotop 
helu 3 He i lit mogły już powstać w niewielkich ilościach 
podczas kosmicznej syntezy pierwotnej, w zasadzie 
ulegają one całkowitemu wypaleniu we wnętrzu gwiaz¬ 
dy jeszcze przed rozpoczęciem spalania wodoru. Pod¬ 
czas spalania wodoru jądra z tej grupy odgrywają 
tylko rolę produktów pośrednich, stąd na krzywej 
rozpowszechnienia pierwiastków mamy wyraźne 
minimum lokalne dla litu, berylu i boru, a na krzywej 
rozpowszechnienia izobarów dołączają się minima 
dla A = 2 i A = 3. Występuje natomiast charaktery¬ 
styczne podwyższenie zawartości owych pierwiast¬ 
ków w pierwotnym promieniowaniu kosmicznym 
w takim stopniu, że wspomniane minimum w pro¬ 
mieniowaniu tym praktycznie nie występuje. 

Tworzenie się jąder wspomnianej grupy nazwano 
i krótko procesem / (z ang. llght — lekki). Jest to jedyny 
proces nukieosyntezy, którego miejscem jest przede 
wszystkim przestrzeń kosmiczna. Produkty nukieo¬ 
syntezy wyrzucane podczas eksplozji gwiazd w prze¬ 
strzeń ulegają zderzeniom z jądrami najbardziej roz¬ 
powszechnionego pierwiastka, wodoru. Są to zde¬ 
rzenia przy niezwykle wielkich energiach, jeśli więc 
już nastąpią, jądra cięższe ulegną pokruszeniu na 
fragmenty lżejsze. Gdy symulowano takie zderzenia 
w laboratoriach, stosując wysokoenergetyczne pro¬ 
tony z akceleratorów do rozbijania jąder tlenu, węgla, 
neonu i azotu (pierwiastków od trzeciego do szóstego 
w kolejności rozpowszechnienia), obfitymi produkta¬ 
mi kruszenia okazały się jądra “D, 3 He oraz izotopy 


litu, berylu i boru. Wszystkim tym jądrom nie „grozi” 
w przestrzeni kosmicznej wypalenie w procesach ter¬ 
mojądrowych, stąd też stężenie ich w materii między- 
gwiazdowej może być większe niż w gwiazdach. Do¬ 
dajmy, że analogiczne procesy kruszenia przebiegać 
mogą w w-arstwach powierzchniowych niektórych 
gwiazd, gdzie kruszenie mogą powodować np. proto¬ 
ny rozpędzone w zmiennym polu magnetycznym albo 
fala uderzeniowa. 

Za ostatni proces nukieosyntezy trzeciego rzędu, 
modyfikujący skład chemiczny materii otrzymanej 
z innych procesów, można uważać naturalne przemia¬ 
ny promieniotwórcze. W ich wyniku w skorupie 
ziemskiej wciąż powstają krótkożyjące pierwiastki 
pozabizmutowe (np. astat lub frans czy bardziej znany 
rad) z długożyjącego uranu i toru. Może dzięki sa¬ 
morzutnemu rozszczepieniu transuranowców na po¬ 
wierzchni gwiazdy osobliwej HR 465 wciąż na now r o 
tworzą się nader krótkożyjące jądra prometu? 
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Rys. 6. Schemat nukieosyntezy pierwiastków chemicznych we 
wczesnej fazie ewolucji rozszerzającego się Wszechświata oraz 
w gwiazdach i przestrzeni kosmicznej. W kilku miejscach umiesz¬ 
czono typowe produkty zaznaczonych na rysunku procesów, 
spotykane w przyrodzie. Trzy typy procesów’ w gwiazdach za¬ 
znaczone są odmiennymi typami linii: a) procesy pierwszego 
rzędu — reakcje egzoenergetycznc prowadzące do wytwarzania 
energii (strzałki pionowe), b) procesy wychwytu neutronów 
(strzałki poziome), c) procesy trzeciego rzędu (strzałki biegnące 
ukośnie) 


Rysunek 6 stanowi zaktualizowaną wersję schematu 
nukieosyntezy, wysuniętego w 1957 r. przez twórców 
współczesnej astrofizyki jądrowej: małżonków E. M. 
i G. Burbidge’ów, F. Hoyle ł a i W. A. Fowlera. 

R. J. Tayler The Origin of the Chemicai Elements , London 
1972 (ros. Moskwa 1975); B. Kuchowicz Problemy i osiągnięcia 
astrofizyki jądrowej. Część III. Powolny wychwyt neutronów w 
gwiazdach , oraz Część IV. Szybki wychwyt neutronów i procesy 
trzeciorzędowe nukieosyntezy. Post. Fiz. 24, 669 (1973) i 25,475 
(1974); B. Kuchowicz, Kosmochemia, Warszawa 1980. 
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— „drugi” 399, 651 
dźwięki materiałowe 693 

E 

efekt Błażko 946 

— Comptona —> zjawisko Comptona 

— Destriau 618 

— Dopplera 341 

— clastooptyczny 673 

— elektrostrykcyjny 665 

— Forbusha 977 

— Gunna 533 

— hypochromowy 701 

— inspektowy 829 

— izotopowy 290, 406 

— Kerra 497 

— Łosiewa 618 

— objętościowy 291 

— piezoelektryczny —> zjawisko piezo¬ 
elektryczne 

— połowy 568 
efektory 755 
egzosfera 829, S42 
A. Einstein 30 

ekran holograficzny 388 

— magnetyczny 431 

— nadprzewodnikowy 432 

— przeciwdźwiękowy 693 
ekscyton 195, 419, 562 
— Frenkla 563 

— polaronowy 563 

— Wannicra-Motta 563 
eksperyment 18 
eksterorecepcja 768 
ekstynkcja 303 
ekworyna 764 
elektret 523, 524 
elektrcdyfuzja 722 
elektrodynamika 64 

— klasyczna 65 

— kwantowa 32, 67, 144 
— Maxwclla 29 
elektrokardiogram 772 
elcktroluminescencja 532,617 
elektromagnesy bezrdzeniowe 604 

— dużej mocy 605 

— hybrydowe 605 

— impulsowe 606 

— kriogeniczne 605 

— nadprzewodnikowe 427, 605 
elektrometria wiertnicza 897 
elektromiogram 775 


elektron 84,89, 144, 151, 25S, 526, 978 
elektron gorący 532 

— konwersji 210 

— n 281 

— k 271,282 

— przewodnictwa 558 

— a 268 

— walencyjny 271 

— wirtualny 147 
elektronika kwantowa 346 

— półprzewodnikowa 607 
elektronograf 472 
clcktronografia 471 
elektronogramy 472 
elektrownie jądrowe 227 
elementy elektroniczne 625 
embriogencza 812 
emisja fotonu 531 

— promieniowania 302 

— wymuszona 352 

emiter tranzystora 532, 613, 627 
emulsja jądrowa 112 
energia aktywacji 276, 517 

— anizotropii magnetokrystalicznej 586 

— cząsteczek 300, 301,307, 317 

— dyslokacji 461 

— dysocjacji H 2 266 

— elektronu 210. 251,252. 512, 527 

— Fermiego 177. 510 

— Gamowa 986 

— grawitacyjna gwiazdy 929 

— jądrowa 219 

— kondensacji 409 

— korelacji 261 

— kulombowska 176 

— ładunku punktowego 69 

— magnet os ta tyczna 587 

— oddziaływania wymiennego 580 

— orbitali 259 

— pola elektromagnetycznego 73 

— separacji nukleonu 177 

— swobodna 50, 409 

— stanów stacjonarnych 285 

— stanu podstawowego jądra 163 

— symetrii 176 

— termojądrowa 228 

— wewnętrzna 47 

— wiązania 242, 265 

-hiperonu 217 

-jądra 164, 175-177 

— własna 250 

— wzbudzenia 557, 559 
-jądra 163, 166 

— zerowa układu 251 
energii wartości dozwolone 538 
entalpia swobodna 50 
entropia 48, 55 

— nadprzewodnika 408 
enzymy 711,724, 736—738,743 
epicentrum 819 

epigram 465 
epoka 846 

— progu 905 

EPR (ERP, ESR) -* rezonans paramag¬ 
netyczny elektronowy 
era galaktyczna 905, 906 

— hadronowa 905 

— lcptonowa 905, 906 

— Plancka 905 

— promienista 905, 906 
ergosfera 968 
cukarionty 708 
ewolucja gwiazd 929, 950 

— materii żywej 738 

— mięśni 769 

VŁ rttii ** ♦ n Q I 


F 

Fala kulista 191, 192 

— N 685 

— odniesienia 381 

— odtwarzająca 382 

— płaska 191 

— powodziowa 888 

— przedmiotowa 382 

— samotna 81 

— wzorcowa 385 

fale akustyczne 663, 667 

— Alfvćna 232 

— baryczne 862 

— Blocha 542 

— de Broglie’a 526 

— ciśnieniowe 682 

— dylatacyjne 643 

— elektromagnetyczne 66, 143 

— gęstościowe 937 

— giętne 643, 644 

— grawitacyjne 971,972 

— hel ikonowe 514 

— Lamba 643, 664 

— Love’a 664, 820 

— magnetohydrostatyczne 232 

— objętościowe 819 


fale płytowe 643, 664 

— podłużne 642, 819 

— poprzeczne 642. 819 

— powierzchniowe 643, 663, 819 

— prawdopodobieństwa 144 

— Rayleigha 643. 663. 820 

— sejsmiczne 820 

— skrętna 643 

— spinowe 582-584 

— sprężyste 639, 641,642, 646, 670 

— Stonlcya 643, 664 

— temperaturowe 399 

— tsunami 683, 862 

— uderzeniowe 206. 647, 682 

-w przestrzeni kosmicznej 684 

falowanie wewnętrzne 865 

— w-iatrowc 865 
fantom 797 

M. Faraday 66 

faser Ganapolskiego 681 

— Tuckera 680 

fasery akustoelektryczr.e 678 

— kwantowe 680 

faza mezomorficzna 490, 498 

— mieszana 417 

— Szubnikowa 417 
fazon 563 

fermiony 57, 88, 584 
fcrrielektryki 521 
ferrimagnetyki 585 
ferroelektryki 520, 521,523 
ferromagnetyzm 580 
fibroina 732 

figury homologiczne 501 

— mielinowe 499 
filamenty 760, 765, 770 

filtr częstości przestrzennych 387. 393 

— dopasowany Van der Lugta 394 

— dyspersyjny 666 

— jądrowy 208 
fizyka atmosfery 826 

— ciężkich jonów 202 

— cząstek elementarnych 32 

— jądrowa 32, 213 

— klasyczna 35 

— medyczna 790, 802 

— morza 860 

— roztw-orów- biopolimerów 698 

— wód śródlądowych 886 

— Ziemi 815 
fizykoterapia 802 
fiuksoidy 416-418 
flukson 408, 423 
fluktuacje eriksonowskic 195 

— konformacyjne 703 
fluktuon 563 

fiuoresccncja dwufotonowa 378 

— monomerowa 328 

— rezonansowa wzbudzona 293^ 

— sensybilizow-ana (uczulona) 329 
FMR (RFM) —► rezonans ferromagne¬ 


tyczny 
fon 690 

fonony 406, 522, 549, 550, 560, 668 
formy globularne 699, 703 

— helikalnc 699 
fosfolipidy 716 
fosforesccncja 327 

fotoadaptacja organizmów morskich 870 
fotodetektory półprzewodnikowe 620 
fotodioda 620 

— lawinowa 621 
fotoelektrety 523 
fotoemisja 570 

fotografia impulsu światła 379 


fotometria 926 
fotonika 394 

fotonv 67, 68. 73, 88, 84, 144, 350, 531 


— stokesowskie 372 

— wirtualne 79, 98, 144, 145 
fotoogniwo 620 
fotoopornik 609, 620 
fotoplastyczność 463 
fotoprzewodnictwo 532, 609 
fotosynteza 710, 870 
friedmanizacja świata S06 
front atmosferyczny 833 

— udarowy 648 
funkcja autokorelacji 195 

— Brillouina 581 

— falowa 39, 75, 250, 252 

-atomu w'odoru 252 

-kątowa 251 

-molekularna 315 

-radialna 251 

— gaussowska 278 

— korelacji 134,212 

— próbna 255 

— przenoszenia układu optycznego 390 

— radiacyjna (radiacja) 873 


— rozdziału 704 

— rozmycia układu optycznego 390 

— świecenia gwiazd 939 
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funkcja własna 250 
fuzja jader atomowych 197 

G 

gal, Gal S9J 

Galaktyka 916. 928, 936, 939, 942 
galaktyki 935, 940. 941.943 

— eliptyczne 939-94! 

— nieregularne 939 
— Seyferta 925, 942 

— soczc\\'kowatc 939 

— spiralne 939, 943 

— typu N 943, 952, 954 
G. G. Galileusz 27 

galwanometr z nadprzewodnikowa cew¬ 
ką 432 

gałąź akustyczna drgań 547 

— asymptotyczna 949 

— horyzontalna 949 

— optyczna drgań 547 
gałąź R 311 

gałąź /? 311 
gamma, y 893 
gaz doskonały 56 

— elektronów walencyjnych 506 

— elektronowy 505, 508, 525 
— Fermiego 176, 177, 195 

— fononowy 550, 668 

— fotonów 904 

— kwantowy 56 

— wzbudzeń elementarnych 401 
gen struktury 711 

generacja parametryczna światła 369 
generator Van de Graaffa podwójny 121 
— Gunna 632, 634 
— Hartmanna 652 

— laboratoryjny fal grawitacyjnych 972 
geoelektryka poszukiw-awcza 894 
geofizyka jądrowa 896 

— otworowa 897 

— poszukiwawcza 891 

— wiertnicza 897 
geoida 815 

gęstość elektronowa 260, 270, 272, 477 

— ładunków magnetycznych 587 

— ładunku jądra 163 

— materii jądrowej 163 

— optyczna 303 

— poziomów jądra 169 

— prawdopodobieństwa 53, 250 

— prądu dyfuzyjnego elektronów 610 

-dziur 610 

-krytyczna 408 

— stanów elektronowych 406 
-energetycznych 534 

-jądrowych 195 

giętkość łańcuchów polimerów 696 
glikoliza 710, 811 
globina 734 
globule 938 
glukoza 710 
gluony 96, 102 
głośniki 646 

— elektretowe 525 
głośność 689 
Gondwana 826 

goniometry rentgenowskie 467 
K. Godeł 37, 904 
gradiometr 433 
granica Chandrasekhara 933 

— jonowa 113 

— Roche’a 934 

grawimetria poszukiwawcza 891 
grawimetry 891 

grawitacyjne zapadanie 963, 965, 967 
grawitony 905 
grej, Gy 793 
gromada Virgo 940 
gromady galaktyk 925, 940 

— gwiazd 924, 937 
grupa Galileusza 43 

— koloru 96 

— Lorentza 73 

— Poincarćgo 43, 73 
grupy antysymetrii 503 

— dyfrakcyjne 469 

— graniczne 448 

— przestrzenne 451 

-homologii 501 

-symetrii magnetycznej 504 

— punktowe 447 

— symetrii 92 

— szubnikowskie 504 
grzanie elektronów stochastyczne 234 

— plazmy 233, 235 
guanina 284 
gwiazdy 930, 937 

— chłodne 927 

— gorące 927 

— neutronowe 934, 959, 960, 964 

— rozbłyskowe 915 

— supernowe 930 

— typu <5 Scuti 946 


gwiazdy typu fi Cephei 946 

- RR Lyrac 946 

-Mira Ccti 946 

- RV Tauri 946 

— zmienne pulsujące 944 
gyraza 754 


H 

hadron tomy 125 

hadrony 80* 84,88, 100, 124, 154 
hałas 689, 693 
hamiltonian 250 

— elektronowy 262, 278 

— oddziaływania 78 
harmonia 500 

hel I i II 396, 398 

— odkrycie 980 
heliks 699, 726, 748 

— Watsona-Cricka 747 
hem 734 

hemoglobina 489, 734 
hemoliza 715 
heteroładunck 523 
hcterozłącza 620 
hiperdźwięki 652 
hiperfragment 216 
hiperhel 216 
hiperjądro 215-217 
hiperładunek 89 
hipernuklid 216 
hiperon 89 

hipcrpłaszczyzny równoczesności 35 
hipertryt 216 
hipoteza atomowa 23 

— atomowo-molekularna 29 

— demokracji cząstek 83 

— kosmicznego cenzora 967 

— kwarków uwięzionych 80, 83, 95 

— rozsuwania się den oceanicznych 853 

— skalowania 63 

— du Toit 852 
histony 748 

hodograf fali sejsmicznej 895 
hodowanie monokryształów 459 
hodowla kwarcu 455 

— magnetytu 455 

— soli kuchennej 454 

— tytanianu baru 455 
holografia 380 

— akustyczna 666 

— w medycynie 801 
hologram 382, 383, 387, 666 
homcostat 785 
homologia 500, 501 
homoładunek 523 
hormony 744 
hybrydyzacja 280 
hydroakustyka 880 
hydroekstruzja 576 
hydrolazy 736 

hydroliza ATP 759, 763 
hydrolokacja 885 


\ 

immunochemiczne badania 765 
immunoglobulina 745 
implantacja jonów 208 
impulsy światła gigantyczne 375 

-pikosekundowe 377 

-ultrakrótkie 374 

indukcja nasycenia 589 
-- szczątkowa 589 

informacja genetyczna komórki 752, 755 

— optyczna 386, 389 
informacji kodowanie 782 

— odczyt 599 

— przesyłanie 359 

— selekcja 782 

— szyfrowanie 386, 387 

— wpisywanie 598 

— zapis 599 
informosomy 756 
infradźwięki 657 
inhibicja zwrotna 711 
inhibitory kompetytywne 736 
iniektory Halla 234 

— indukcyjne 234 

-— współosiowe 234 
interferencja 347 
interferometr 913 

— kwantowy nadprzewodnikowy 424, 
432 

— Michelsona 362 

— pierścieniowy Sagnaca 361 
interferometria 384 

— dwuekspozycyjna 385 

— holograficzna 384 

— natężeniowa 350 

— w czasie rzeczywistym 385 
inwersja 43, 47 

— po2a geomagnetycznego 851 
inżynieria genetyczna 757 


izobary 163 
izodozy 797 
izokliny 807 
izolator 516, 528, 541 
izolator (wentyl) 596 
izomerazy 736 

izomeria geometryczna polimerów 698 

— hiperjądrowa 219 
izomery geometryczne 696 

— jądrowe 181, 1*86, 188, 242 

— kształtu 198,202 

— makrocząsteczek 697 

— rotacyjne 696 
izoparzystość 90 
izopory 849 
izospin 46. 89, 170 
izoterma 51 

— van der Waałsa 51 
izotony 163 
izotopy 163, 997, 998 

J 

jama jodowa 224 
jasność galaktyk 941 

jądra atomowe dalekie od ścieżki trwa¬ 
łości 206 

-kuliste 177 

-magiczne 165, 168 

-neutronodeficytowe 206 

-neutrononadmiarowe 206, 207 

-nietrwałe 181, 182 

-promieniotwórcze 181, 182 

-superciężkie 182, 207 

-supergęstc 206 

-trw-ałe 182, 184 

-zdeformowane 165, 168, 178, 179 

-złożone 194 

-zwierciadlane 163, 171 

— atomowego kształty 165 
-rozmiar 163 

jądro galaktyki 942 

— komórki 708 

— konwektywne gwiazdy 932 
jednostka centralna komputera 636 
jednostki atomow-e 255 

— energii cząsteczki 301 
język symboliczny 636 

— wewnętrzny komputera 636 
języki algorytmiczne 636 

jon 267, 269 
jonizacja 792 
jonosfera 829 

jony ciężkie 196-198, 202, 204 

JRM —> rezonans magnetyczny jądrowy 

K 

kabel nadprzewodnikowy 430 
kalibrator laserowy 362 
kamera AGA 802 

— optyczno-elektroniczna 377 

— proporcjonalna wicloniciowa 470 

— Sokołowa 668 

— termowizyjna 802 
kamery rentgenowskie 464 
H. Kamcrtingh-Onnes 404 
kanaliki T 764 

kanał dźwiękowy 881 

— informacji 356, 357 

— optyczny 617 

— reakcji jądrowej 188 
kaon 84 

karboksypeptydazy A 488 
karcinotrony 632 
karotaż 897 

kaskady enzymatyczne 743 

— wewnątrzjądrowe 125 
kataliza enzymatyczna 739 
katodoluminesccncja półprzewodników 

617 

kawitacja 656 

kąty fazowe czynników struktury 479 

— wiązań 279 
kelwin, K 50 
J. Kepler 436 
a-keratyna 732 

kierunek dopasowania fazowego 366 

— łatwego magnesowania 586, 603 
kinaza 713 

kinezjologia 767 
klasa homologii 501 
klasy dyfrakcyjne 465 

— Lauego 465 
—■ symetrii 447 
klimatu ewolucja 837 

— modelowanie 837 

— stabilność 837 
klistron refleksowy 630, 632 
kłębek statystyczny 697 
koagulator laserowy 364, 801 
koalescencja 835 

kod genetyczny 756, 813 
koczyt 576 


koenzymy 740 
kolagen 732 

kolektor kosinusowy 877 
— Lamberta 877 

— tranzystora 532, 613, 627 
kolor 96 

— gluonów 102 

— kwarków 101 

— leptonowy 97 
komora drutowa 115 

— dryfowa 115 

— iskrowa 114 

— mgłowa 112 

— pęcherzykowa 113 

— proporcjonalna 115 

— strimerow-a 115 
— Wilsona 112 

komórka (biologiczna) 708, 713, 746 
— Crove’a 434 

— elektroluminescencyjna 618 

— elementarna 436, 437 
-Bravais’go 438 

— — prymitywna 437 

— informacyjna pola świetlnego 394 
— Kerra optyczna 379 

— mięśniowa 706 

— organizmów wyższych 708 

— prymitywna Wignera-Scitza 438, 439 

— roślinna 714 

— zwierzęca 714 
komórki aparat ruchowy 730 

— procesy życiowe 707 
kompleks międzycząsteczkowy 313 

— wieloenzymowy 742 

— z przeniesieniem ładunku 314 
komputery 635 

— optyczne 393 
kondensacji mechanizm 836 
konfiguracja elektronowa 257, 259, 270 

271,696 
— Faradaya 591 

— stanów jądra 167 

— stanu podstawowego 258 
— Voigta 591 

— wzbudzona 262 
konformacja 283 , 696 

— biopolimerów 702 
konformery 697 
koniugacja 713 
konstrukcja JMaxwclla 51, 62 
kontaktorcceptory 768 
kontrakcja grawitacyjna 987 

— gwiazdy 931 

konwersja wewnętrzna 181, 186,210 
kopolimer 746 
M. Kopernik 27 

korelacja elektronów- 261,405, 409 
korelator optyczny Van der Lugta 394 
kosmochemia molekularna 984 
kości 768 

kowadło Bridgmanna 572 

kowalność metali 507 

krawędź plazmowa 595 

kreacja pary elektron-pozyton 146-149 

kriotron 434 

krotność stanu 254 

kryptosymetria 505 

krystalit 436 

krystalizacja białek 486 

— hydrotermalna 455 
krystalizator Holdena 454 
krystalografia białek 485 

— matematyczna 505 

— rentgenowska 463 
kryształki prostujące 613 
kryształy 435, 450, 464, 475, 551 

— bezdyslokacyjne 462 

— idealne 450 

— kwantowe 560 

— półprzewodnikowe 435 

— rzeczywiste 450 

kryterium elementamości wzbudzeń 562 

— Jeansa 930 

— Landaua 401 

— Lawsona 230 
krzywe dyspersji 547, 548 

— energii potencjalnej 263, 265 

— izofoniczne 690 

— jednakowej hałaśliwości 689 

— namagnesowania 589 
krzywizna czasoprzestrzeni 38 
kwantowanie drgań sieci 549 

— oscylatora harmonicznego 549 

— pola 77 

— strumienia magnetycznego 408 
kwanty 73 

— strumienia wirowości 402 
kwantyzacja Landaua 513 
kwarki 80, 83, 95, 99, 101, 147 

— walencyjne 96 

kwas adenozynodwufosforowy 759 

— adenozynotrójfosforowy 710, 759 

— dezoksyrybonukleinowy 746-748, 752 

— nukleinowy 283, 746, 752 
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kwas rybonukleinowy 746, 749 

-informacyjny 749, 750 

-rybosomalny 749, 750 

-transportujący 749 

kwazary 925, 929, 951,952, 955 
kwaziantycząstki 560 
kwazicząstki 401,406. 550, 560. 668 
kwazihydrostatyczna aparatura 572 
kwazineutralność plazmy 231 
kwazipęd elektronu 527, 538, 559 
— fononu 550, 671 
kwazisymetria 505 


L 

laccrtydy 943 
lagrangian 74 
lamele 498 

lampki sygnalizacyjne 622 
laser argonowy 357 

— azotowy 357 

— barwnikowy 355, 357, 379 

— chemiczny 356 

— CO- 357 

— GaAs 357 

— gazowy 354, 357 
-He-Ne 351, 354. 357 

— heterozłączowy 619 

— homozłączowy 619 

— jonowy 355, 357 

— molekularny 355 

— neodymowy 354. 357 

— o pracy ciągłej 354 

— pierścieniowy 361 

— półprzewodnikowy 357 

— ramanowski 372 

— rubinowy 354, 357 

— z kryształem YAG 357 

— złączowy 618, 622 
lasera przestrajanie 356 
laserowe układy logiczne 623 

— —śledzące 363 

lasery sprzężone optycznie 623 
—zastosowanie w holografii 384 
—,— technologiczne 360 
—, — w geodezji 362 
—,— w biologii 363 
—,— w medycynie 363, 800 
—,— w metrologii 362 
lauegram 465 
Laurazja 826 
lecytyna 717 

G. W. Leibniz 35 

leki działające na układ nerwowy 499 
lepkość helu II 396 

— nematyków 495 

— powietrza 831 
leptony 84, 88 
liazy 736 

liczba atomowa jądra 163 

— barionowa 46. 88, 99 

— elektronowa 88 

— kwantowa addytywna 89 
-główna 285 

-magnetyczna 578 

-multiplikatywna 89 

-oscylacyjna 307 

-rotacyjna 263, 304 

— leptonowa 46, 88, 158 

— Macha 683 

— masowa 163 

— mionowa 88 
-Y691 

— obsadzenia 549, 550 

— porządkowa 163 

— stanów 57 

— stopni swobody 51 

— Strouhala 692 

— taonowa 88 

liczby kwantowe 88, 251,584 
-magiczne 165, 177, 178, 199. 200 
liczebność (krotność) pozycji 451 
licznik całego ciała 800 

— Czerenkow-a 115 

— Gcigera-Miillera 243 

— proporcjonalny 115, 243, 918 

— scyntylacyjny 798,919 
!igandv 729 

Iigaza 736, 758 
limfocyty 745 

linia antystokesowska 313. 556 

— lambda 396 

— przesyłowa nadprzewodnikowa 430 

— ruchu fali uderzeniowej 683 

— stokesowska 313, 556 

— widmowa 290, 298, 340 

— „yrast” 169 

linie emisyjne 7 i A' 921 
-słów 598 
lipidy 498,715,717 
liposomy 499, 719 
lizosomy 709 

H. A. Lorentz 30 
luka 507 


luka kwantowa 560 


Ł 

ładunek elektryczny 45, 91, 143. 146 

-cząstek 147 

-jako osobliwość pola 72 

-kwarków 99 

-przestrzenny 567. 611 

łańcuch oddechowy 711 
łącze optyczne 356 
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pasmo domieszkowe 542 

— oscylacyjne 311 
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— sprzężenia zwrotnego 781,783 
pierścień nadprzewodzący 408 
pierwiastki chemiczne ciężkie 207, 978 
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— Woodsa-Saxona 177, 178 

— Yukawy 145, 173, 174 

— zdeformowany 178 
powab 90, 99 

powielanie dyslokacji 461 

— paliwa 224 
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poziomy akceptorowe 541 

— domieszkowe 541 

— donorowe 541 
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— krzywoliniowa 501 

— ładunkowa 171 

— podobieństwa 502 

— pozorna 500 

— SU 92, 94,96, 100 

— teorii fizycznych 42 

— unitarna 100 

— zwierciadlana 43, 158. 159 
symetrie a prawa zachowania 91 

— przybliżone hadronów 100 
symulowanie zachowania się układu 636 
synchrocyklotron 122 

synchrotron 123 
syntetaza glutaminy 712 
synteza Fouriera 477 

— Pattersona 478 
system interakcyjny 638 
szereg perturbacyjny 78 
szerokość energetyczna stanu 166 

— linii w-idmowych 290, 340 

— przerwy energetycznej 407 
szumy własne 880 

ś 

ścianka izolująca 4S 
ścianki diatermiczne 48 
.ściany domenowe 586, 587, 589 
ścieżka trwałości jąder atomowych 164 
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ściśliwość izo termiczna 51 

— kryształów 575 
średnia równowagowa 54 

— w zespole statystycznym 53 
środek symetrii 442 
środowisko akustyczne 693 
światła natura kwantowa 351 

— własności statystyczne 350 
światło kwazitermicznc 351 

— laserowe 349. 351 

— termiczne 348 
światłowody 359 
światy promieniste 904 

T 

taon 84 

tautomeria 284 
technologia planarna 625 
tekstura Grandjeana 492 

— homcotropowa 492, 494 

— konfokalna 492 

— krystaliczna 471 

— molekularna 492 

— planarna 492, 494 

— skręconego nematyka 492 
tektonika płyt 826, 855 
telekomunikacja optyczna 356, 623 
telereceptory 768 

telewizja holograficzna 388 
temperatura Curie 581,850 

— czarnej dziury 970 

— elektronowa 232 

— jonowa 232 

— krytyczna 62 

— plazmy 232 

— Neela 582, 850 

— przejścia nadprzewodzącego 576 
temperatury rozkład w jeziorze 890 
tensory kartezjańskie 73 

— lorentzowskie 73 

teoria Abbego mikroskopu 3S0, 392 

— BCS 405 

— elektronowa Lorentza 30 

— fizyczna 21 

— Flory’cgo 698 
-GLAG 415 

— Glaubera 213 

— grawitacji 36 

— Huxleya 761 

— Huckla rozszerzona 278 

— informacji 782 

— katastrof Thoma 805 

— kinetyczna gazów 29 

— Lamba 342 

— Landaua i Lifszyca 586 

— Londonów 410 

— Maxwel!a-van der Waalsa 51 

— mezonowa sił jądrowych 172-174 

— nadpłynności 400, 403 

— nadprzewodnictwa 405 

— ośrodków ciągłych 639 

— pogłosowa Sabine'a 694 

— pola 70 

— ruchu kontynentów 825 

— samowzbudnego dynamo 856 

— Wegcnera 825 

— względności 31, 36, 38. 42 
teorie ab initio 278 

— geodynamiczne 823 

— półempirycznc 278 

— transportu neutronów 224 
terapia promieniami y i X 796 
termika wód 890 
termodynamiczna granica 55 
termodynamika fenomenologiczna 47 

— statystyczna 52 

-nierównowagowa 59 

termoelektrety 523 
termoemisja 420 
termograf 801.802 
termografia 497, 791, 802 
termometr 20 

— szumowy 434 
termometria wiertnicza 897 
termosfera 829, 830 
termoskop 20 
lermostatyka 52 
tłumienie dźwięku 649, 8S3 

— hałasu 693 
tokamak 240-242 

— tomograf 794, 795 
tomografia 794, 795 
topienie strefowe 457 
tor optyczny 390 
transdukcja 713 

transfer (przekaz) nukleonów 207 
transferazy 736 
transformacja 713 
-^-cechowania 45, 74 

— Fouriera 386, 389 

— odwrócenia czasu 89 
transformacje Galileusza 43 

— Lorentza 43 


transkrypcja 711,755 
translacja 756 

— cząsteczki 300 
translator 636 
transmisja 210 

— nieliniowa 376 

— radiacji 875 

— światła 875 
transoptory 622 
transport elektryczny 517 

— przez, błony 715 
transpozony 714 
tranzystor 532. 607, 608 

— bipolarny 614 

— boczny (lateralny) 627 

— impulsowy 616 

— MOS 615, 616 

— n-p-n 613, 626 

— overlay 616 
tranzystor p-n-p 614 

— podłożowy (wertykalny) 627 

— połowy 615 

— tyratronowy 615 
trening siłowy 777 

— szybkościowy 777 
tropopauza 829 
tropomiozyna 765 
troponina 765 
troposfera 828 
trucizny jądrowe 223 
try partycja 186 

trzecia harmoniczna światła 368 
trzęsienie ziemi 818-823 
tubulina 730 

tunelowanie elektronów 420 

— par Coopera 421 
turbulencja 943 
twardość akustyczna 895 
twierdzenie Blocha 538 

— ergodyczne 54 

— Gaussa-Ostrcgradskicgo 38 

— Nocther 42. 91 

— optyczne 136 

U 

układ adaptacyjny 781 

— Andronikaszwilicgo 398 

— ATC 235 

— autonomiczny 806 

— Baseball 235 
—- DCX 235 

— dwufazowy 60 

— dynamiczny 806 

— heksagonalny 447 

— homeostazy 784 

— inercjalny 35 

— izolowany 48 

— jednoskośny 447 

— krytyczny 222 

— kwantowy 250 

-dwupoziomowy 352 

— logiczny laserowy 623 

— Lokalny Galaktyk 940, 941 

— nadkrytyczny 222 

— NASA 363 

— osłonięty adiabatycznie 48 

— podkrytyczny 222 

— optoelektroniczny 617 

— optyczny 386, 389, 391 

— otwarty 48, 813 

— regulacji 782 

— regularny 447 

— rombowy 447 

— scalony 625-629 

— słoneczny, skład pierwiastkowy 981 

— sterowania mięśniami 789 
-oddechem 784 

— śledzący 363, 781 

— T 764 

— tctragonalny 447 

— termodynamiczny 47 

— uczący się rozpoznawania obrazów 
790 

— wegetatywny 783 

— wybierający 116 

— względnie odosobniony 779 

— zamknięty 48 

układy cyrkulacyjne wód 867 

— krystalograficzne 437, 447, 448 

— pamięciowe 624 

— podwójne gwiazd 923, 934, 935 

— wicloatomowe 275, 279 

— wielofazowe 51 

— związane kwarków 99 
ultradźwięki 652, 656, 658 
unifikacja fizyki 30 
unitarność 136 

uporządkowanie antyferromagnetyczne 
581 

— ferrimagnetyczne 581 

— ferromagnetyczne 580 

— stopów 63 
urządzenie TPC 116 


urzęd/cnie wiclokowadlowe Hałla 572 
uzwojenia nadprzewodnikowe 427 

W 

waga wejścia 787 
wakans (wakansje) 450, 507 
wakuole 709 
waraktor 612 
warstwa Bk mana 866 

— epitaksjalna 460, 615, 627 

— pełzająca 399 

— planetarna graniczna 829 

— zaporowa 612 

warstwicc uęstości elektronowych 260, 
270. 27 2 

warstwy cienkie 471 

— lipidowe 497, 717 
wartości własne 250 
wartość mierzona średnia 76 
warunek Bohra 302 

— dualności 141 

— Morrisona-Gribowa 131 

— stabilności mechanicznej 62 

— wykrywalności radioizotopu 243 
warunki Borna-K&rmina 57, 538, 540, 

548. 559 

wektor Burgersa 460 

— falowy 527, 539, 549, 582 
-Debyc'a 552 

— sieci odwrotnej 539 
wektory (kartezjańskie) 73 
wentyl 596 

wędrówka (dryf) kontynentów 824, 852 
węzeł nietrwały 807 

— sieciowy 436, 437 

— trwały 807 
wiatr akustyczny 646 

— geostroficzny 831 

— słoneczny 17, 843, 977 

— w atmosferze 841 
wiązanie chemiczne 271,282 

— dwuelektronowe 269 

— jonowe 273 

— metaliczne 506 

— peptydowe 725 

— *271,280 

— podwójne, układ sprzężony 320 

— o- 268,280 

— trójclektronowe 269 

— wiszące 46o 

— wodorowe 284, 314, 702, 727 
wiązek świetlnych mieszanie 367 
wńązki elektronowe 471 

— przeciwbieżne 125 
widma absorpcyjne 303, 319 

— atomów’ 285-287 

— elektronowe cząsteczki 315, 319 

— emisyjne 303 

— galaktyk 941 

— hi per jąder 219 

— kwazarów 952 

— oscylacyjne 307, 308 

— oscylacyjno-rotacyjnc 310-312 

— Ramana 312, 556 

— rentgenow-skie 105 

— rotacyjne 304, 305 
widmo cząstek 189 

— częstości drgań 550 

— elektronów konwersji 210 

— energetyczne helu II 401 
-neutrin 991 

— energii pulsarów 957 

— liniowe 285 

— mossbauerowskic 344 

— parowania cząstek 195 

— promieniowania y 211 
-Słońca 915 

— rozpadu fi 157, 210 

— wodoru 286 
wiek galaktyk 943 

— Wszechświata 907 

— zero gwiazdy 931 
wiekowe zmiany 849 
wielkości ekstensywne 55 

— fizyczne 18 

— intensywme 55 

— komplementarne 75 

— pochodne 20 

— podstawowe 20 

— zachowywane bezwzględnie 90 
wir makroskopowy 402 

wirusy 707 

wiry kwantowane 401 

— prądowe 416 
włos 733 

włókna mięśniowe 760, 764, 770 

— strumienia magnetycznego 415 
wodór metaliczny 419, 515, 577 
wody powierzchniowe 886 

— śródlądowe 886 
woltomierz nadprzewodnikowy 433 
wór skórno-mięśniowy 770 
wrzeciona mięśniowe 771 


wskaźniki alfanumeryczne 622 

— Millera 440 

współczynnik absorpcji molowy 303 

— Coriolisa 887 

— ekstynkcji 303 

— konwersji wewnętrznej 186. 210 

— kooperatywności 704 

— mnożenia neutronów 222 

— osłabiania światła 877 

— rozpraszania światła 876 

— rozszczepienia spektroskopowego 579 

— Saint-Vcnanta 887 

— skali 682 

— tłumienia dźwięku 648,649 

-fal sprężystych 670 

-relaksacyjnego 649 

— transmisji 193 

— wzmocnienia gazowego 115 

— zaniku 5 18 

współczynniki Einsteina 316. 325 

— fenomenologiczne 720 

— lepkości Mięsowicza 495 
współrzędne Eulera 642 

— kolekty w’ne 167 

— Lagrange’a 642 

— normalne 546 

Wszechświat przed wielkim wybuchem 
911 

— stacjonarny 904 
Wszechświata historia 904 

— wiek 907 

wybuchy radiowe na Słońcu 9J5 
w r ychwyt atomowy 104 

— elektronu 184, 185 

— neutronu 220, 990, 997 
wyciąganie monokryształu 456 
wykładniki krytyczne 63 
wykres Arganda 136 

— Chew-Frartschiego 139 

— fazowy 51 
__ H-R 932 

— stanu helu 395, 396 

-nadprzewodnika 413 

wypychanie pola magnetycznego przez 

nadprzewodnik 410 
wyspa jąder superciężkich 182 

— trwałości izotopów 997, 998 
wyspy Wszechświata 935 
wzbudzenia dobrze określone 558, 559 

— dwuelektronowe 299 

— elementarne 559 

— jąder atomowych 163 

— jednocząstkowe 167, 196 

— kolektywne 167, 196, 562 

— kulombow-skic 196, 202, 204 

— powierzchniowe 564 

— termiczne 406 

— wieloelektronowe 299 
wzbudzenie wiązka-laser 300 
wzmocnienie dryfowc 679 

— fali sprężystej 670 
wzorce sekundy 295 
wzorcowanie detektora 19 
wzorzec jednostki napięcia 434 
wzór Boltzmanna 579 

— de Broglic’a 144 

— Breita-Wignera 129 

— dyspersyjny 649 

— Gell-Manna-Nishijimy 89, 90, 99 

— Gell-Manna-Okubo 142 

— Graya 784 

— Stirlinga 57 

— Strouhala 692 

— Wcizsackera 164 

— Wróblewskiego 134 
wzrost kryształów' 462 

Y 

ylem materia 944 
ypsylon 85 
yrast linia 169 

Z 

zagadnienie krotności cząstek 134 

— pracy maksymalnej 50 
zakaz alternatywny 313 

zakaz Pauliego 77, 100, 167, 526 
zależność Max wella 520 

— okres-jasność 945 

załamanie podwójne światła 492, 593 
zanikanie polaryzacji 520 
zapachy kwarków 101 
zapis akustyczny 666 

— binarny (dwójkowy) 636 

— informacji 599, 636 

— obrazu 597 

— sygnałów akustycznych 597, 666 
zarodż kryształu 454 

zasada Curie 720 

— Francka-Condona 318, 319 

— Ffciscnberga 191,549 

— Huygensa 645 
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zasada Kopernika 981 

— korespondencji Bohra 76 

— kosmologiczna 900, 904 

— krzyżowania 157 

—: najmniejszego działania 74 

— nieokreśloności 191,549 

-czasu i energii 97, 144 

-pędu i położenia 98, 145 

— Onsagera 720 

— Pauliego 286 

— symetrii materii i antymaterii 908 

— wariacyjna 255 

— względności Galileusza 36 

— zachowania energii 41,42, 671 
-izospinu 46 

-liczby barionowej 46 

-leptonowej 46 

-ładunku elektrycznego 45, 91 

-masy nierelatywistycznej 41 

-momentu pędu 40, 44 

-pędu 40-42, 671 

zasady termodynamiki 29, 48-51, 56 
zasady zachowania 40, 42 

-lokalne 42 

-w rozpadzie (i 156 

-w zderzeniach fononów 671 

zasięg efektywny cząstek 137 

— korelacji 409 

— oddziaływań elektromagnetycznych 
145 

— widzenia w wodzie 879 
zdarzenia elementarne 24, 36 

— nieobserwowalnc 899 

— przyczynowo nic powiązane 24 

— obserwowalne 899 
zderzenia wymienne 296 

— z ciężkimi jonami 204 
2 espół kanoniczny 56 

— makrokanoniczny 56 

— mikrokanoniczny 54 

— statyczny 52-54 
zgęstki 134 
Ziemi budowa 815 

— jądro 821 

— kształt 815 

— płaszcz 821 

— pole magnetyczne 845 

— sejsmiczność 822 

— skorupa 82! 

— wnętrze 816, 821,856 
Ziemia, rozkład temperatury 817 
zjawiska akustomagnetycznć 676 

— akustyczne kwantowe 668 
-liniowe 644 

-nieliniowe 646 

-w hydrosferze 880 

— atmosferyczne 827, 838 

— geomagnetyczne 676 

— magnetooptyczne 590 

— optyczne nieliniowe 365 

— tunelowe w nadprzewodnikach 419, 
420 

zjawzsko Barn et ta 676 


zjawisko Comptona 67, 111,920, 955 

— Cottona-Moutona 593 

— Czerenkowa 111 

— Einsteina-de Hassa-Richarda 676 

— Faradaya 590-594, 599 

— fontannowe 397 

— fotoelektryczne 67, 350 
-wewnętrzne 925 

— — zewnętrzne 570 

— fotosprężystości 673 

— fotowoltaiczne złączowe 613 

— de Kaasa-von Alphcna 513 

— Halla 529 

— Joscphsona 421,425, 427 

— magnetostrykcji 665, 676 

— mechanckaloryczne 398 

— mechanostrykcji 676 

— Meissnera 410 

— naskórkowości anomalne 43! 

— piezoelektryczne 569, 664, 669 

— Szubnikowa-de Haasa 513 

— termodyfuzji 721 

— termomechaniczne 398 

— tranzystorowe 613 

— tworzenia par 112 

— Voigta 593, 594 

— Zeemana 288, 289, 590, 593, 594 

— Zen era 614 
złącza słabe 426 

złącze Josephsona 422, 425, 426 

— p-n 530,610, 612, 614 

— tunelowe Giacvera 425 
zmienne s , t, u 126, 127 
znaczniki 797 

zorze polarne 844, 858 
zrozumiałość mowy 692 
związek dyspersyjny 138 
związki przemienności 77 

— przyczynowe 24 
zwierciadło molekularne 374 


ź 

źródła dyskretne 938 

— energii na Ziemi 229 

— fal grawitacyjnych 972 

— galaktyczne 917 

— infradźwięków 657 

— podwójne 923 

— promieniowania otwarte 794, 800 
-zamknięte 794 

- X chwilowe 924 

- X pozagalaktyczne 924 

- X i y rozbłyskowe 924 

— światła elektroluminescencyjne 617 

-katodolumincscencvjnc 617 

źródło Cyg X-1 970 


Ż 

żyroskop laserowy 362 
— nadprzewodnikowy 431 







V Kryształy granatów otrzymane metodą Czochralskiego: b), d) i f) prawidłowe kształty kryształów, 
aj i c) widoczny wpływ zmiany temperatury tygla w czasie i asymetrii jej rozkładu 


2. Pierścienie barwne obserwowane w wyniku wymuszonego rozpraszania Ramana w benzenie (otrzymane 
przez R. W. Terhune'a) 























5. Wnętrze tablicy z DEL do wyświetlania cyfr przez 
w-łączenie do obwodu odpowiednich diod. Świecące 
diody tworzą tu cyfrę 5 (pow. 20 x) 



b. Diody elektroluminescencyjne (DEL) CQVP 
i CQYP 21 (pow. ok. 2 x; opracowane w ITE) 


31 7. Termistor NTC 230 (pow. ok. 2x; opracowany w ITE) 
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9. Mikrofotografia struktury układu scalonego mikroprocesora 8080 firmy Intel 
(słowo 8-bitowe, cykl rozkazowy 2 ps, 78 rozkazów). Pow. ok. 40 razy 


10. Zegarek elektroniczny firmy Unitra 
zbudowany na układzie scalonym 
MC X 1201 i układach optoelektro¬ 
nicznych opracowanych w Instytucie 
Technologii Elektronowe] 

11. Minikalkulator firmy Unitra zbu¬ 
dowany na układzie scalonym MC 
74007 i układach optoelektronicznych 
opracowanych w Instytucie Techno¬ 
logii Elektronowej 
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12. Laser barwnikowy zbudowany w Zakładzie Optyki IFD Uniwersytetu Warszawskiego 
pokazać przestrajanie lasera barwnikowego. Laser azotowy: moc 2 MW, czas błysku ok. 
długość fali od 560 do 640 nm. Zestaw używany jest do badań spektroskopowych 


pompowany laserem azotowym. Zdjęcie wykonano techniką wieloekspozycyjną, by 
12 ns, częstość powtarzania 30/s. Laser barwnikowy: rodamina 6G, moc 500 kW, 


i 


13. Powstanie akcji ląserowej w siłnie wzmacniającym barwniku 
organicznym (rodamina B) po wzbudzeniu silnym impulsem (w za¬ 
kresie nadfioletu) z lasera azotowego. Akcja laserowa rozwija się 
mimo małej dobroci rezonatora, który stanowią równoległe płytki 
kwarcowe — ścianki kuwety. (Górna plamka na ekranie powstała 
przez dodatkowe odbicie) 















14. Laser kadmowy w układzie do analizy widmowej 15. Cięcie blachy za pomocą lasera C0 2 


16. Koagulator laserowy 


17. Cięcie kwarcu za 
pomocą lasera C0 2 
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18. Związek pomiędzy zabarwieniem substancji i jej 
widmem. Widmo promieniowania elektromagnetyczne¬ 
go z wąskiego obszaru promieniowania widzialnego 
(światła) ilustruje rys. a. Jeżeli do oka trafia całe pro¬ 
mieniowanie z zakresu od ok. 360 do ok. 700 nm. to tę 
mieszaninę barw oko rejestruje jako barwę białą (świa¬ 
tło białe). Widmo absorpcyjne (elektronowe) substancji 
bezbarwnej, tzn. przepuszczającej całe promieniowanie 
z zakresu widzialnego, wygląda tak jak na rys. b. Jeżeli 
próbka absorbuje promieniowanie z pewnej części 
obszaru widzialnego, to promieniowanie to nie dociera 
do oka i próbka wykazuje zabarwienie zależne od tego, 
z jakiego obszaru promieniowanie zostało zaabsorbo¬ 
wane, tak jak to ilustrują rys. c, d i e 






21. Przekrój przez atmosferę 
Ziemi do wysokości 900 km, 
Trzy główne obszary atmosfe¬ 
ry — troposfera, stratosfera 
i termosfera — zaznaczone są 
różnymi odcieniami. Intensy¬ 
wność żółtego koloru pro¬ 
porcjonalna jest do gęstości 
ozonu, a intensywność koloru 
niebieskiego do koncentracji 
elektronów. W prawej kolum¬ 
nie różnymi kolorami za¬ 
znaczone są różne składniki 
atmosfery. Lewa kolumna: N 
koncentracja elektronów, Q 
gęstość gazu, <?o 3 gęstość 
ozonu, T temperatura, h wy¬ 
sokość. Prawa kolumna: z le¬ 
wej strony — nazwy różnych 
warstw jonosferycznych, po¬ 
środku — główne składniki 
chemiczne, po prawej stronie 
— nazwy obszarów w atmos¬ 
ferze. 

1 okno astronomiczne. 

2 okno radioastronomiczne, 

3 słoneczne promieniowanie 
rentgenowskie, 

4 linia helu (He II) Słońca 
(strzałki oznaczają miejsca 
lub obszary w atmosferze, 
gdzie promieniowanie o da¬ 
nej długości fali jest pochła¬ 
niane), 

5 linia wodoru (Z. a ) Słońca, 

6 promieniowanie ultrafiole¬ 
towe, 

7 promieniowanie widzialne 
(400-750 nm), 

8 promieniowanie podczer¬ 
wone, 

9 szumy kosmiczne i sło¬ 
neczne, 

10 szumy kosmiczne i sło¬ 
neczne odbite od jono- 
sfery, 

11 maksimum koncentracji 
elektronów, 

12 odbicie krótkich fal radio¬ 
wych od jonosfery, 

13 wielostopniowe rakiety, 

14 warstwa £1, 

15 sondowanie jonosfery, 

16 zorze polarne, 

17 jednostopniowe rakiety, 

18 warstwy D i £, 

19 świecące obłoki, 

20 odbicie fal krótkich od 
dolnej jonosfery (warstwa 
£ tylko w dzień: w nocy 
od warstwy £*) 

21 meteory, 

22 wielkie pęki promieniowa¬ 
nia kosmicznego, 

23 chmury perłowe, 

24 balony stratosferyczne, 

25 maksimum gęstości ozonu, 

26 Mount Everest, 

27 chmury cirrusy, 

28 Rów Mariański, 

29 antena paraboliczna do 
łączności z satelitami (tu¬ 
taj Sputnik I), 

30 samoloty, 

31 zorze polarne wzbudzone 
cząstkami słonecznymi, 

* tylko w dzień, latem, na 
średnich szerokościach 
geograficznych, 

•* warstwa £ tylko w dzień, 
*" warstwa D tylko w dzień 


20. Zorza polarna 
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24. Termogram powierzchni dłoni wykonany przy użyciu cholestero¬ 
lowych ciekłych kryształów 


25. Nowoczesny aparat do rentgenodiagnostyki. Zastosowanie 
wzmacniacza obrazu pozwała na zmniejszenie napromieniowania 
pacjenta i oddzielenie stanowiska lekarza do pacjenta 


22. Obraz przekroju jamy brzusznej człowieka otrzymany za pomocą tomografu komputerowego. Podana 
s *. f ,. ar Y v °°.Pp w| 3da kolejnym przedziałom wartości współczynnika pochłaniania promieni rentgenow¬ 
skich (kolor biały odpowiada wartości największej, czarny — najmniejszej). Biały obszar w środku zdję¬ 
cia to kręgosłup, duży jasny obszar po prawej stronie — wątroba, a biała plama na tym obszarze — pę¬ 
cherzyk żółciowy, dwa okrągłe jaśniejsze miejsca po obu stronach kręgosłupa to nerki 


23. Pola magnetyczne o indukcji powyżej 100 T wytwarza się metodami eksplozyjnymi. Zdjęcie przedsta¬ 
wia moment rozerwania cewki (Pracownia Impulsowych Pól Magnetycznych, Instytut Fizyki PAN, 


26. Hydrofon w toni morskiej (firmy Bruel i Kjaer) 











27. Pierwszy zarejestrowany przypadek rozpaau hiperonu 5 


28. Przykłady rejestracji oddziaływań w komorach a) wodorowej, b) propanowej 
i c) ksenonowej 




29. Kaskada elektronowo-fotonowa zare¬ 
jestrowana w komorze ksenonowej 















30 Śladv torów zarejestrowane w spektrometrze iskrowym 


31. Proces powstania i 
rozpadu hiperonu /1° 
zarejestrowany w wodo¬ 
rowej komorze pęche¬ 
rzykowej 



32. Elektron comptonow 
ski zarejestrowany w ko¬ 
morze freonowej 



33. Szklana komora pę¬ 
cherzykowa wypełniona 
izopentanem o tempera¬ 
turze 130 C 



34. Pierwszy akcelerator elektrostatyczny wy¬ 
korzystujący generator Van de Graaffa. Akcele¬ 
rator przyspieszał protony i deuterony do ener 
gii 0,6 MeV 


















35. Wielka Europejska Komora Pęcherzykowa wraz z zewnętrznym urządzeniem dc- 36 Licznik Czerenkowa 
dentyfikacji cząstek 












37 Spektrometr dwuramienny 


'•ylau 




38. Spektrometr Q 




39. Akcelerator elektrostatyczny z generatorem typu 
CockroMa i Waltona przyspieszający protony do energii 
10 MeV. Uzyskiwana wiązka protonów jest wprowa¬ 
dzana do synchrotronu celem dalszego przyspieszania 


40 Widok ogólny synchrotronu protonów Narodowego 
Laboratorium Akceleratorowego im. H. Fermiego w Ba* 
tavii (St. Zjednoczone' 


































42. Widok ogólny reaktora MARIA w Instytucie Badań Jądrowych w Świerku pod 
Warszawą 


41. Pierwszy reaktor jądrowy uruchomiony pod kierunkiem E. Fermiego 
w Chicago 



43. Zawieszenie napędów prętów regulacyjnych reak¬ 
tora MARIA 


44. Zestaw krytyczny pracujący w Instytucie Badań 
Jądrowych w Świerku pod Warszawą 


45. Reaktor EWA w Instytucie Badań Jądrowych w 
Świerku pod Warszawą 



46. Urządzenie DCX (zbudowane w St. Zjednoczonych), w którym osiągnięto re¬ 
kordowe temperatury rzędu 6 mld K. Obłok gorącej plazmy wytworzony był w pułapce 
magnetycznej (/) przez wiązkę D'^ o energii 600 keV. otrzymywaną ze specjalnego 
akceleratora (2) 



47. Columbus II — jedno z pierwszych urządzeń amerykańskich opartych na zjawisku 
pinchu liniowego. Na pierwszym planie widać dużą baterię wysokonapięciowych 
kondensatorów, które służą do zasilania wyładowania. Cylindryczna komora ekspe¬ 
rymentalna o osi skierowanej pionowo umieszczona jest w środku układu (widać 
tylko zakończenia jednej z elektrod) 










































48. Urugan — największy obecnie stellarator (Charków, 
ZSRR). Na zdjęciu widać komorę w kształcie toru wyści¬ 
gowego wraz z uzwojeniami służącymi do wytwarzania 
poła ograniczającego plazmę. U góry widoczna jest część 
rdzenia potężnego transformatora wykorzystywanego do 
wytwarzania i grzania plazmy 



50. Ogra II — pułapka zwiercia¬ 
dlana zbudowana w Instytucie 
Energii Atomowej w Moskwie. 
Na zdjęciu widać cylindryczną 
obudowę komory eksperymental¬ 
nej oraz umieszczonych wokół 
niej prętów stabilizacyjnych. Wi¬ 
doczne są również zgrubienia, w 
których umieszczono uzwojenia 
wytwarzające pole zwierciadlane. 
Na pierwszym planie widać kanał 
i urządzenia pomocnicze służące 
do iniekcji wiązek wysokoenerge¬ 
tycznych cząstek neutralnych 



49. Tokamak-ST. Powstał drogą przebudowy największego 
amerykańskiego stelłaratora (Stellarator-Model C) w Insty¬ 
tucie Plazmy w Princeton. Na zdjęciu widoczny jest frag¬ 
ment toroidalnej komory próżniowej otoczonej uzwojenia¬ 
mi wytwarzającymi stabilizujące pole magnetyczne. W gór¬ 
nej części zdjęcia jest widoczny również rdzeń wielkiego 
transformatora, który służy do indukowania w tej komorze 
prądów wyładowania 



51 Rozkład łimi sił pola magnetycznego (7) w pułapce 
typu SM opracowanej i zbudowanej w Instytucie Badań 
Jądrowych w Świerku. Widoczne są elektromagnesy (2). 
Dla pokazania wnętrza pułapki uwidoczniono tylko 3 płasz¬ 
czyzny symetrii (wybrane spośród 15-tu). Wokół środka 
układu zaznaczono granice (3) obszaru efektywnego ogra¬ 
niczenia plazmy 













52. Gammatron — urządzenie do naświetla¬ 
nia promieniami y (firmy Siemens) 










































































57 Wysokociśnieniowa komora optycz¬ 
na IF-024 skonstruowana w OBR Wy¬ 
sokich Ciśnień PAN „Unipress" (rze¬ 
czywista długość 10 cm) 




59. Kompresor helowy IF-012A skon¬ 
struowany w OBR Wysokich Ciśnień 
PAN ..Unipress" 


58. Laboratoryjny elektromagnes 
nadprzewodnikowy 


Z 


Z 




60. Elektromagnes hybrydowy wytwarzający pole magnetyczne 25 T (Instylut 
Energii Atomowej, Moskwa) 

61. Trzycewkowy elektromagnes bezrdzeniowy typu Bittera chłodzony wodą- 
wytwarza pole magnetyczne 20 T przy mocy zasilania 5,7 MW. (Międzynarodowe 
Laboratorium Silnych Pól Magnetycznych i Niskich Temperatur, Wrocław). Na 
elekromagnesie ustawiony jest kriostat pomiarowy 




























63. Symetria w przyrodzie — irys i widok makówki z góry 


64. Wirusy mozaiki tytoniu ułożone w sieó przestrzenną 
(obraz otrzymany w mikroskopie elektronowym) 
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67. Rentgonogram NaCI wykonany metodą Debye’a-Scherrera-Hulla: a) na płaskiej błonie foto¬ 
graficznej, b) na błonie fotograficznej zwiniętej w walec; promieniowanie CuK* 



68. Lauegramy: a) widoczna płaszczyzna symetrii (pionowo), symetria 
nr. b) widoczna dwukrotna oś symetrii, symetria 2 


69. Dyfraktogram Weissenberga; kryształ Zn(N0 3 ) 2 • 4C0(NH 2 ) 2 . 
* 2H 2 0 — układ jednoskośny, oś obrotu [001], warstwica zerowa; 
promieniowanie CuK* 
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70. Rentgenogram wykonany metodą obracanego kryształu (dyfraktogram warstwicowy); kryształ ZnB 2 * 
• 2C0(NH 2 ) 2 , oś obrotu [100], promieniowanie CuK« 
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71. Rentgenogramy polimerów wykonane metodą Debye'a- 
-Scherrera-Hulla: a)połimetylen nierozciągnięty, bjpolimetylen 
rozciągnięty do 500% w temperaturze 96°C, c) rentgenogram 
tekstury soli sodowej kwasu dezoksyrybonukleinowego 
(Na-DNA) 



72. Retigram kryształu CuS0 4 * 3CO(NH) ? , układ rombowy, oś obrotu (010); warstwica pierwsza 
brak wygaszeń systematycznych. W jednej ćwiartce pokazano sposób wskaźnikowania refleksów 
promieniowanie CuK* 



76. Kamera Weissenberga 

77. Ogólny widok dyfraktometru rentgenowskiego (firmy Philips); 
na stole dyfraktometru są ustawione dwa goniometiy (urządzenia 
zmieniające położenie preparatu i licznika), z lewej — poziomy, 
z prawej — pionowy; z prawej strony stołu — „szafa" z układami 

elektronicznymi i rejestratorem 78. Czterokołowy dyfraktometr automatyczny do monokryształów (firmy Rigaku) 




\ 















































79. Jamki trawienia ujawniające dyslokacje na 
granicy ziaren w germanie 



80. Pętle dyslokacyjne w ZnTe generowane przez wydzielenie Ag 2 Te 



81. Elektronogramy: a) cienkiej folii HgTe 
(monokryształ); b) drobnopolikrystalicznej 
folii Au (tekstura); c) próbki polikrystalicznej 
NaCI 



83. Dyfraktometr neutronów typu DN-520 przy reaktorze EWA w Świerku 
























84. Dwie siatki — molibdenowa i miedziana — na próbce krzemu pokrytej w połowie glinem; obraz uzyskany w skaningowym mikroanalizatorze elektronowym typu JXA-50A 
(pow. 80 x); a) w świetle elektronów odbitych (obszar pokryty glinem jest ciemniejszy), b) w świetle charakterystycznego promieniowania rentgenowskiego — linia CuK* 
(widoczna siatka miedziana); c) w świetle charakterystycznego promieniowania rentgenowskiego — linia MoL* (widoczna siatka molibdenowa) 





a 
b 
c 

85. Przekrój poprzeczny diody z GaAs; obraz uzyskany w skaningowym mikroskopie elektronowym typu JXA-50A (pow. 80 x): a) w świetle elektronów odbitych, b) obraz 
z kontrastem pochodzącym od siły elektromotorycznej — widoczne defekty struktury złącza p-n, c) obraz katodoluminescencji w bliskiej podczerwieni (800-1200 urn) w 
obszarze złącza 



86. Powierzchnia krzemu ze złączem p-n; obraz uzyska- 
ny w zwierciadlanym mikroskopie elektronowym 
(pow. 100x); w części ciemniejszej obszar typu p 


87. Dyslokacja helikoidalna w ZnTe:Ag zawierającym 
drobne wydzielenia Ag 2 Te; obraz uzyskany w transmi¬ 
syjnym mikroskopie elektronowym typu JEM-200A 
(jasne pole, napięcie 200 kV) 


88. Transmisyjny mikroskop elektronowy o dużej roz¬ 
dzielczości (typ JEM-200C) 
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89. Struktura domenowa cienkich warstw granatu Y^eGdo.eBio.aFSa.eGa^Ojj. Zdjęcia uzyskane metodą Faradaya, a) struktura przy H = O, b), c) i d) struktura odpowiednio 
przy// « 2170 A/m. 2900 A/m. 3790 A/m (pole skierowane prostopadle do warstwy) 


93. Struktury domenowe ferroelektryków: a) tytanianu baru, obraz 
otrzymany metodą optyczną (w mikroskopie polaryzacyjnym); 
b) siarczanu trójglicyny, obraz otrzymany metodą proszkową; c) siar¬ 
czanu trójglicyny, obraz otrzymany metodą trawienia; d) siarczanu 
trójglicyny, obraz otrzymany za pomocą elektronowego mikroskopu 
skaningowego; e) siarczanu trójglicyny, obraz otrzymany za pomo¬ 
cą mikroskopu elektronowego z zastosowaniem metody dekoracji 




c 


d 


e 



92. Struktura domenowa cienkich warstw amorficz 
nych (stop Gd-Co) 


90. Struktura domenowa ferrytu barowego BaFei 2 0 19 . Zdjęcia uzyskane: a) metodą proszkową, 
b) metodą Faradaya 


91. Siatka domen cylindrycznych w granacie 
Y 2,5 Gq, 5 GaOi 2 
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94. Figury proszkowe na powierzchni nadprzewodnika 
w stanie pośrednim (Faber, 1958 r.) 


95. Figury proszkowe na powierzchni nadprzewodnika 
typu II w stanie mieszanym, powierzchnia zdjęcia jest 
prostopadła do linii sił pola (Essman i Trauble, 1967 r.) 


96. Fragment struktury układu scalonego otrzymanego 
metodą dyfuzji i fotolitografii. Widoczne są paski alu¬ 
minium stanowiące połączenia elektryczne między 
elementami układu 



98. Moduł pamięci na domenach cylindrycznych. U dołu — powiększenia fragmentów części 
układu oznaczonych 1-5. Domeny widoczne na dolnej fotografii (jasne plamki) mają średnicę 
ok. 6 pm 




















101. Płytka krzemowa z gotowymi układami scalonymi 





99. Kryształy monokryształów krzemu i germanu z widoczną 
symetrią trójkątną w kierunku {111) 



100. Układ scalony kalkulatorowy (4 działania) MCX 74204 J. 
Ukazany jest sposób połączenia struktury układu scalonego z 
nóżkami (opracowany w ITE) 



102. Rejestr 2x 100 bitów — MCY 7506 L — pierwszy całko¬ 
wicie polski unipolarny układ scalony wielkiej skali integracji. 
Stosowany jako cyfrowa linia opóźniająca lub pamięć szerego¬ 
wa. a) Mikrofotografia struktury układu, b) wygląd zewnętrzny, 
c) z odsłoniętym układem scalonym; (opracowany w ITE) 





































































104. Widok sali z zainstalowanym komputerem Cyber 73-16; 1 konsola opera¬ 
torska z monitorem ekranowym, 2 stacje taśm magnetycznych, 3 podręczny stojak 
z taśmami, 4 ploteks, 5 stacje dysków magnetycznych (IBJ, Świerk) 






1 U 


\ i isr 



105. Konsola operatorska automatu pomiarowego Polly. Prawy monitor ukazuje obraz, 
lewy natomiast służy do wprowadzania informacji przez operatora na żądanie układu 



106. Porównanie wyniku modelowania (a) z obserwowaną galaktyką WGC-175 

(o) 




108. Interakcyjny tryb pracy: użytkownik wprowadza dane za pomocą ,,pióra świetlne¬ 
go ; obok obraz wyników na monitorze ekranowym 


107. Porównanie wyniku modelowania 
M -101 (b) 


(a) z obserwowaną galaktyką spiralną 
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109. Przenikanie się warstw w grubej próbce ciekłego kryształu cholesterolowego. 
Fotografia wykonana przy użyciu mikroskopu polaryzacyjnego (pow. 300 x) 

111. Uwarstwienie kropelek ciekłych kryształów cholesterolowych (mikroskop po¬ 
laryzacyjny. pow. 300 x) 




110. Upakowanie warstw cholesterolowych w cienkiej próbce (mikroskop polaryza¬ 
cyjny, pow. 300 x) 

112. Modelowanie tworów mielinowych za pomocą ciekłego kryształu cholestero¬ 
lowego (mikroskop polaryzacyjny, pow. 300 x) 








113. Obraz chromatyny otrzymany w mikroskopie elektronowym 


114. Mikrotubula — wewnętrzny białkowy element strukturalny komórki: a) przekrój poprzeczny mikrotubuli poje¬ 
dynczej i podwójnej; b) model mikrotubuli pojedynczej, skonstruowanej na podstawie badań krystalograficznych i za 
pomocą mikroskopu elektronowego. Ściana mikrotubuli zbudowana jest z helikalnie ułożonych cząsteczek tubuliny 
i białka dimerycznego (podjednostki ot i //) 


115. Obraz czerwonych komórek krwi ludzkiej otrzymany w 
skaningowym mikroskopie elektronowym (T. Hayes) 







116. Rzęski w nabłonku tchawicy (a) 
oraz przekroje przez rzęski (b-d) 
wskazujące, jak jedna połowa pod¬ 
wójnej mikrotubuli przesuwa się 
wzdłuż drugiej w czasie ruchu rzęski 








d 






117. Makrocząsteczka DNA: a) Model heliksu DNA zbudowany 
z kulkowych modeli atomów, b) Model heliksu DNA wykonany 
z drucikowych modeli atomów. Płaszczyzny zasad są prosto¬ 
padle do osi heliksu i dlatego widoczne są jako odcinki linii 
prostej. Skała ta sama jak a), c) Obraz wycinka makrocząsteczki 
DNA bakteriofaga X otrzymany w mikroskopie elektronowym 
powiększającym 82100x. d) Obraz wycinka makrocząsteczki 
DNA bakteriofaga X; widoczne miejsce, w którym dwie nici 
DNA zostały rozdzielone 


a 

b 

c 




118. Rentgenogram włókien DNA. Ciemne plamy układające się 
w kształt krzyża świadczą o spiralnej strukturze cząsteczki DNA, 
a ich umiejscowienie związane jest z parametrami spirali. Dwa 
łukowe zaciemnienia (u góry i u dołu) świadczą o wzajemnym 
równoległym ułożeniu zasad oraz o ich prostopadłości do osi 
heliksu (R. Franklin, 1953) 


119. DNA z oocytów żaby (obraz otrzymany w mikroskopie 
elektronowym, pow. 26000 x) w trakcie procesu transkrypcji 
rybosomalnego RNA(rRNA). Wzdłuż tej samej cząsteczki widać 
fragmenty DNA, które nie są transkrybowane. Na aktywnym 
odcinku DNA zachodzi jednoczesna transkrypcja wielu cząste¬ 
czek rRNA (poprzeczne niteczki tworzące ..choinkę*'), początek 
transkrypcji przypada na czubku „choinki”, u podstawy „choin¬ 
ki” transkrypcja się kończy i rRNA odłącza się od matrycy DNA. 
Przy większym powiększeniu można rozróżnić wzdłuż nici DNA 
globule polimerazy RNA 



















120. Fragment kilku włókien 
mięśnia poprzecznie prążkowa¬ 
nego; obraz otrzymany w mikro¬ 
skopie elektronowym, powiększe¬ 
nie 53000x (H E. Huxley) 


121. Polimer aktyny, obraz otrzy¬ 
many w mikroskopie elektrono¬ 
wym. Preparat kontrastowany ne¬ 
gatywowo octanem uranylu, po¬ 
większenie 455000 x (J. Hanson. 
J. Łowy) 





typu ".9 ro . tó X' l _ strzar utworzone w wyniku połączenia cząsteczek subfragmentu SI miozyny z fila 
octanem PrePara ' negatywowo 
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123. Filamant m.ozynowy; obraz otrzymany w mikroskopie elektronowym. Preparat kontrastowany negatywowo octanem uranylu (H. E. Huxley) 



124. Obraz podłużnego przekroju przez mięsień sartorius żaby w mikroskopie elektro¬ 
nowym. Strzałki wskazują kanaliki poprzeczne układu T (wg D.S. Smitha) 


125. Obrazy otrzymane w mikro¬ 
skopie elektronowym: a) agre¬ 
gatów filamentów czystej akty¬ 
ny, powiększenie 144 000x, b) 
kompleksu aktyny z tropomiozyną 
i troponiną, pow. 130000 x ; pre¬ 
paraty kontrastowane negatywo¬ 
wo octanem uranylu (A. H. Strze- 
lecka-Golaszewska 1972) 


126. Dyfrakcja niskokątowa pro¬ 
mieniowania rentgenowskiego na 
żywym mięśniu w stanie spoczyn¬ 
kowym. Dłuższa oś mięśnia prze¬ 
biega pionowo. Widoczne są li¬ 
nie warstwowe i refleksy połud¬ 
nikowe (dla uwidocznienia ref¬ 
leksów równikowych stosuje się 
krótszy czas ekspozycji) (H.E. 
Huxley. W. Brown) 
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127. Badanie mięśni obsługujących staw ramienny człowieka: a) stanowisko 
pomiarowe; b) mechanogram i elektromiogram mięśnia dwugłowego ramie¬ 
nia zapis oscylograficzny uzyskany podczas badań w warunkach sta¬ 
tycznych 



128. Obraz dojrzałego erytrocytu otrzymany w mikroskopie elektronowym; 
widoczna jest struktura trój warstwowa 


130. Dwuwarstwowa błona lipidowa, obraz otrzymany w mikroskopie elek¬ 
tronowym po wytrawieniu zamrożeniowym (pow. 100 000 x ) 




129. Błona erytrocytu, obraz otrzymany w mikroskopie elektronowym po wytrawieniu zamro* 
zemowym {pow. 100000 x) 



a 












131. Seria Balmera wodoru w widmach różnych obiektów 
gwiezdnych: a) widmo absorpcyjne za Pegaza, b) widmo 
absorpcyjne z a Liry, c) widmo emisyjne z chromosfery 
Słońca 


132. Wycinek widma elektronowego cząsteczki NCO 


437,5 nm 440,36 nm 




natężenie 


135. Fale rozchodzące się na powierzchni wody mogą 
tworzyć trwały układ miejsc wzmocnień i wygaszeń 





























































136. Różne typy laserów: a) lasery 
helowo-neonowe o mocy 50,15 i 5 W 
(typy 125 A, 124 A i 120 firmy Spec¬ 
tra-Physics); b) laser barwnikowy, za 
nim laser jonowy, pompujący (układ 
580 A firmy Spectra-Physics); c) laser 
jonowy (firmy Coherent Radiation) 
i d) jego wnętrze 
























137. Głowica żyroskopu laserowego (firma Honeywell, Inc.) 




139. Aparatura do badania generacji drugiej harmonicznej światła w sproszkowanych 
kryształach 




Uniwersalny przyrząd geodezyjny (firma ESSA) z laserem He-Cd 














































































140- Holograf©wanie przedmio¬ 
tów nieprzezroczystych: a) Układ 
zestawiony według schematu 
przedstawionego na rys. 8, str. 384 
(poszczególne elementy układu są 
mocowane do ciężkich podstawek 
spoczywających na masywnym 
stole), b) Układ odtwarzający; 
przez hologram widoczny jest 
obraz odtworzony 





























141. Holograficzne badanie opon metodą dwukrotnej ekspozycji: a) ogólny wygląd urządzenia; b) in- 
terferogram — obszar z gęstymi owalnymi prążkami świadczy o rozwarstwieniu opony 





142. Holograficzne badania z użyciem la¬ 
sera rubinowego: a) laboratoryjne stano¬ 
wisko holograficzne z laserami rubinowymi 
(generator 1 i wzmacniacz 2) do badań 
obiektów dynamicznych; b) interfero- 
gram drgań samochodowego zespohi na¬ 
pędowego; c) interferogram drgań gardła 































146. Mikrofotografie interferogramów ameby uzyskane w mikrointerferometrze holograficznym metodą czasu rzeczywistego przy różnych 
warunkach pracy urządzenia: a) w polu jednorodnym, b) w polu prążkowym 



147. Zdjęcia wirusa fd uzys¬ 
kane za pomocą mikroskopu 
elektronowego, ukazujące 
strukturę podwójnego heliksu 
wirusa: a) przed zastosowa¬ 
niem holograficznej metody 
wyostrzenia, b) po jej zasto¬ 
sowaniu (G. W. Stroke i in. 
1972) 










































148. Doświadczenie E. Abbego i A. Portera — pierwszy eksperyment z filtracją 
częstości przestrzennych sygnałów optycznych: a) schemat układu optycznego, b) 
obraz Fouriera przedmiotu-siatki i obraz wyjściowy, c) prz©filtrowany przez szczelinę 
poziomą obraz Fouriera siatki i obraz wyjściowy, d) przefiltrowany przez szczelinę 
pionową obraz Fouriera siatki i obraz wyjściowy 


przedmiot 



płaszczyzna obraz 

ogniskowa 




149. Filtracja przestrzenna: a) obraz przed filtracją, b) 
strzennego 


obraz po użyciu górnoprzepustowego filtru prze- 




150. Rastrowy portret K. E. Bethego, złożony z biało-czarnych 
plamek (a), został zamieniony w obraz tonowany (b) dzięki 
filtracji przestrzennej usuwającej najwyższe częstości (R. A. 
Philips, 1969) 













































































































151. Odbicie i załamanie fali ultradźwiękowej padającej na granicę rozdziału oleju i roztworu 
soli kuchennej. Strzałka oznacza kierunek fali padającej (wg W. A. Krasilnikowa) 


152. Dyfrakcja płaskiej fali ultradźwiękowej o długości X = 1,6 mm na walcu o średnicy 
1,8 mm (wg W. A. Krasilnikowa) 



153. Obraz cieniowy fali ultradźwiękowej 
generowanej przez strumień powietrza wy¬ 
pływający z dyszy (wg L. Bergmana) 


154. Odbicie i wtórne wypromieniowanie fali ultradźwiękowej z płytki mosiężnej, w której 
powstaje fala Lamba 



155 Fotografia cieniowa płaskiej fali ultradźwiękowej o częstości około 156. Interferencja dwóch fal na powierzchni wody: a) fale o częstości 
1,5 MHz w cieczy drgań mniejszej, b) — większej 
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158. Pęcherzyki kawitacyjne w polu ultra- 

nr^.^ k0 '7 V - m ^ Wod2ie po P^ekroczeniu 
progu natężenia 


159. Sonoluminescencja 
ultradźwiękowej w cieczy 
berga) 


w fontannie 
(wg Rosen- 



natężeni 1 ^* 15 , 1'^W/cm™ oczęstot^U ^58? kHz^UatTza nieliniow . 0 (° dużym 

harmońi«ną! a c) U tra^^'hamonicjna Z '^ł? n ° 

i Szutitowa) ą harm0r " C2n ^ d > harmoniczną (wg Michajlowa 






162. Fontanna oleju parafinowego wy- 
rzucona przez ciśnienie promieniowania 
tali ultradźwiękowej promieniowanej przez 
przetwornik kwarcowy (wg Bergmana) 


^£&d^^ O dużym natężeniu („wiatr akustyczny", uwidoczniony za 
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164. Układ do pomiarów prędkości i tłumienia fal ultradźwiękowych w cieczach metodą interferometrii impulsowo-fazowej (IPPT-PAN, Warszawa) 



165. Obrazy mikroskopowe odcinka płatka cebuli: a) otrzymane za pomocą mikroskopu świetlnego, 
b) otrzymany za pomocą mikroskopu ultradźwiękowego (częstość ultradźwięków 220 MHz, po¬ 
ziomy wymiar pola widzenia 750 um) 



166. Hologram i od¬ 
tworzony obraz płytki 
metalowej w kształcie 
litery R 


b 




167. Obraz ręki ludz¬ 
kiej uzyskany z holo¬ 
gramu otrzymanego i 
odtworzonego metodą 
elektronową 






















168. Płaska fala uderzeniowa S 0 
biegnąca perforowanym przewo¬ 
dem; 5 zakrzywiona fala uderze¬ 
niowa; C front gazu, W zaburzenie 
akustyczne; zdjęcie wykonane 
metodą smug 

169. Odbicie i dyfrakcja płaskiej 
fali uderzeniowej; S 0 fala płaska, 
Si fala zakrzywiona, S 2 fala odbi¬ 
ta, C powierzchnia nieciągłości, 
V wir, R fala rozrzedzeniowa; 
zdjęcie wykonane metodą cieni 





170. Struktura przepływu powietrza po pęknięciu szklanej kuli, S fala 
uderzeniowa, C wypływające powietrze, G ścianka kuli; zdjęcie wykona¬ 
ne metodą smug 









171. Skośne fale uderzeniowe w kanale; 
zdjęcie wykonane przy użyciu interfero¬ 
metru Macha-Zehndera 






172. Modelowe badanie lotu kabiny kosmicznej w atmosferze z prędko¬ 
ścią odpowiadającą liczbie Macha 10,2 (metoda smug, światło laserowe) 


173. Plaska fala uderzeniowa zwana dyskiem Macha w strumieniu gazu wypływającym 
z dyszy; zdjęcie wykonane metodą smug 








174. Wypływ gazów prochowych z lufy; S, fala uderzeniowa wychodząca z lufy 
przed pociskiem, S 2 fala uderzeniowa wywołana wypływem gazów prochowych; 
zdjęcie wykonane metodą smug 



175. Zmiany struktury przepływu spowodowanego przejściem fali uderzeniowej przez 
kanał 
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176. Opływ romboidalnego profilu z prędkością odpowiadającą liczbie Macha 1,7; zdję¬ 
cie wykonane metodą smug 
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179. Przebieg ciśnienia w czasie (u góry) w obszarze 
zastoju za dyszą i odpowiadające mu struktury przepływu 
pulsującego w kanale; zdjęcie wykonane przy użyciu in 
terferometru Macha-Zehndera 


180. Oftalmograf ultradźwiękowy konstrukcji L. Filip- 
czyńskiego i współpracowników (IPPT PAN War¬ 
szawa) 



tont^? W ^ ni0Wei * ,0rbie,<1 w p,e “ nWe i i * < p ™*'6i 



pęcherzyk płodowy 





















182 . Tomograf komputerowy EMI-CT 5000 (fragament). Pacjent jest ułożony w bramce skanin¬ 
gowej 


183 . Jeden z przekrojów mózgu u zdrowego człowieka: a) Zdjęcie wykonane za pomocą skenera 
rentgenowskiego. Widać (bez wprowadzania środka cieniującego) obie komory boczne oraz sza¬ 
rą i białą substancję, b) To samo zdjęcie po obróbce komputerowej (wymiar poziomy jest roz¬ 
ciągnięty w stosunku do zdjęcia a). Liczby odpowiadają wartościom współczynnika pochłamama 
promieni X przez tkankę w miejscach, przez które przechodzą promienie 
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188. Scyntygramy otrzymane za pomocą scyntykamery na ekranie oscyloskopu. Przedstawiają kolejne 
obrazy (a-h) rozmieszczenia w nerkach hipuranu znakowanego 131 J, rejestrowane co 3 min. od ieao 
podania. Widać nierównomierne wypełnianie się nerek 




186. Efekt oziębiania się palców przy paleniu papierosów u pacjenta 
z chorobą Raynauda: a) przed paleniem palce są ciepłe, b) po zapa¬ 
leniu jednego papierosa niektóre palce są zimne (brak zarysu 
palców) 


184. Scyntygramy tarczycy: a) 
Wykonany scyntykamerą po po¬ 
daniu * #m Tc. Widać guz „gorący" 
w tarczycy oraz zarys dolnej części 
głowy, szyi i ramion, b) Wykona¬ 
ny scyntygrafem po podaniu 
Na 13l J. Widać miejsca większej 
i mniejszej aktywności wewnątrz 
gruczołu 


185. Licznik scyntylacyjny do pomiaru in vivo jodochwytności tar¬ 
czycy 




















190. Fotografia satelitarna rozwiniętego układu cyklonałnego. Spiralne 
struktury chmurowe związane są z położeniem frontów 



191. Radiosonda produkcji fińskiej firmy „Vaisala" (wg Vaisala News) 
_jeden z kilkunastu typów radiosond używanych przez służby meteo¬ 
rologiczne całego świata. Unoszona przez balon na wysokości sięgającej 
35 km przekazuje drogą radiową informacje o ciśnieniu, temperaturze 
i wilgotności na trasie swojego lotu. Śledząc jej położenie można uzyskać 
dane o rozkładzie wiatrów na różnych wysokościach. Pomiary położenia 
radiosondy wykonuje się optycznie, radiolokacyjnie lub (w najnowszych 
rozwiązaniach) metodami radionawigacyjnymi. Do zapewnienia właści¬ 
wych informacji dla nowoczesnej numerycznej prognozy pogody stacje 
radiosondażowe powinny być rozmieszczone co 300—400 km. Jak dotąd 
tylko niektóre obszary świata mają sieć aerologiczną o takiej gęstości. 
Czynione są wysiłki by informacje uzyskiwane dotychczas przez radio¬ 
sondy otrzymywać z satelitarnych pomiarów promieniowania w różnych 
wycinkach widmowych 


192. Zdjęcie satelitarne mezoskalowego układu chmur. Choć przypomina 
ono chmury klębiasto-warstwowe, rozmiary poszczególnych „kłębków" 
są rzędu kilkudziesięciu kilometrów. Każdy kłębek zawiera wiele chmur 
kłębiastych (cumufus), kłębiasto-warstwowych (stratocumutus) 





















193. Główne rodzaje chmur: a) cirrus, b) cirrocumulus, c) cirrostratus nebułosus, d) altocumulus, e) niskie strzępy chmur „złej pogody" na tle chmur altostratus, f) stratocu- 
mulus, g) stratus, h) i ł) cumulusy, j) cumulonimbus 













195. Geostacjonarny satelita meteorologiczny Meteosat wykonany w wyniku współ¬ 
pracy państw Europy Zachodniej. Mapka ukazuje zasięg jego obserwacji (linia ciągła) 
1 'Aczności (lima przerywana). Wyposażenie satelity umożliwia rozróżnianie 

obiektów o średnicy 2,5 km w świetle widzialnym i o średnicy 5 km w podczerwieni 
(pasma 5.7-7,1 pm 1 10-12,5 pm). Obrazy satelitarne są przetwarzane przez centralną 
stację odbiorczą i rozsyłane użytkownikom. W uproszczonej postaci mogą być odbie¬ 
rane bezpośrednio z satelity przez wszystkie służby meteorologiczne dysponujące 
nieskomplikowanymi stacjami odbiorczymi w zasięgu nadajników satelity. Satelita 
meteoroU>g^cz St °^? Wany zbierania informacji z naziemnych automatycznych stacji 


196. Fotografia układu chmur cyklonu tropikalnego na wskaźniku panoramicznym. 
Koncentryczne kręgi — linie jednakowej odległości poziomej podane w milach 
morskich 



radar # 


centrunm 


tormu 


197. Morska baza doświadczalna IB W-PAN w Lubiatowie 












198. Falowanie wiatrowe 



199. Hydrauliczne modelowanie falowania wiatrowego w bazie badawczej IB W-PAN w Oliwie 

200. Falowanie sztormowe w strefie przybrzeżnej 




201. Sonda miernika funkcji rozpraszania światła w morzu, 
w której źródłem światła jest laser (G. Kullenberg 1968 r.); 
A laser, B ruchomy odbiornik światła rozproszonego pod 
dużymi kątami, C odbiornik światła rozproszonego pod ma- 
/i-'* n rtanza nrzewodów 



202. Sonda morska z zestawem mierników radiacji, przezna¬ 
czona do pomiarów strumieni światła przychodzącego 
z różnych kierunków w morzu. Na zdjęciu widoczne są: 4 
mierniki radiacji ustawione w różnych kierunkach, motor z 
turbiną do obracania układu w przestrzeni wodnej, pojemnik 
na połączenia przewodów, konstrukcja nośna oraz zawie¬ 
szenie na kablu doprowadzającym wyposażonym jedno¬ 
cześnie w linę nośną (N.G. Jerlov 1968 r.) 










203. Pęknięcie uskokowe w Mongolii, powsta¬ 
łe w wyniku trzęsienia ziemi 4 grudnia 1957 r. 



120 ° 


której zaznaczony jest uskok i kierunek 













205. W czasie trzęsienia ziemi może nastąpić wyraźne przesunięcie powierzchniowych warstw skorupy ziemskiej: a) jedna z ulic San Francisco po słynnym trzęsieniu 
ziemi w 1906 r.; b) szyny kolejowe w pobliżu Puerto Banios (Gwatemala) po trzęsieniu ziemi w lutym 1976 r. 



i•**'*«• • 

;*.*•» **»r*■* 

•**%**a 

*«**♦•** •*#*♦-%» »•«.« ® 

«<|e« 

»•***• «<*».. *** * m* ***** 

»♦« #>* » » *»mms**-* •»>«»*♦-» «• »•♦«* m 

• *•%***,, 

^ c* Ahitlfc m ń tb łMw* 

*T*r»* $ >#4 *’•«* * 0 *&».%< * 

****#«*Mft * ***-«*#*#v**#*#$« 
**"#«#*# *$#$*$ **;*# *#* * 

4M-r J"*****^^ »**4Ht4* * 

I ft»0 »*»**«»»% 

<W I »— *# »%»#* * 




».***••* 

I »i» » »m r & **4+4* 

i»*+%+0+**+% * ****m* *1 b++m*» 

•^UfNKMNM****#**♦* 

#*♦»» i» i » 


■** ■••* 




206. Zdjęci© lotnicze gaju cytrusowego 
zrobione po trzęsieniu ziemi w 1940 r. w 
Imperial Valley. Wyraźnie widać prze¬ 
sunięcie drzew w gaju. 






















207. Sejsmiczny przekrój 
czasowy i jego związek z 
budową geologiczną syn- 
klinarium łódzkiego w re¬ 
jonie Uniejowa; J jura, T 
trias, C cechsztyn, U utwo¬ 
ry podsolne 



208. Pomiary wartości gradientu pionowego siły cięż¬ 
kości dg/dz za pomocą grawimetru. Z lewej strony wieża 
pomiarowa, u dołu wykryta forma antropogeniczna (wy¬ 
robisko górnicze); h głębokość, na której znaleziono tę 
formę; wyniki pomiarów podane są na wykresie w etwe- 
szach E, 1 E * 1 (cm/s 2 )/cm 


209. Grawimetr — przyrząd do pomiarów względnych 
siły ciężkości 






































































































211. Fotografie Mgławicy Krab w św.etle spolaryzowanym (strzałki ukazu,, kierunek wektora elektrycznego). Wyraźna różnica w obrazie świadczy o synchrotronowym 
mechanizmie emisji promieniowania 



212. Ogniskujący teleskop rentgenowski. Owa zwierciadła o średnicach 23 ł 31 cm 
mają łączną powierzchnię zbierającą równą 44 cm 2 


213. Rentgenowskie zdjęcie korony słonecznej wykonane w miękkim promieniowa 
niu X 













215. Mgławica Krab. Kółkiem zaznaczony jesi 
obszar będący źródłem promieniowania X. Sko¬ 
śna linia przedstawia brzeg Księżyca w czasie za¬ 
ćmienia pulsara oznaczonego strzałką 


216. Odbiornik, za którego pomocą wykryto 
pierwsze kosmiczne źródło promieniowania X 



217. Jednowymiarowy rozkład promieniowania 
X mgławicy Vela X nałożony na jej zdjęcie wy¬ 
konane w świetle nadfioletowym. Symbolem 
PSR zaznaczone jest położenie pulsara 


218. Promieniowanie radiowe Wielkiej Mgławicy 
(M 31) w Andromedzie (względne natężenie 
promieniowania 1,415 MHz) 

219. Antena grawitacyjna zbudowana przez bra- 
ginskiego w Moskwie 












220. Podziemne obserwatorium neutrinowe 
Davisa — zbiornik z czterochloroetylenem 
zmontowany w szybie kopalni złota w Połud¬ 
niowej Oakocie (USA) 






224. Galaktyka spiralna widziana 
z boku. Ciemna smuga biegnąca 
wzdłuż równika jest utworzona z 
obłoków pyłu 






225. Różne typy galatyk: nieregularna (a Mały Obłok 
Magellana), spiralne (b Mgławica Trójkąta, c Mgławi¬ 
ca Andromedy, d Ml04); spiralne z poprzeczką (e, f, g), 
soczewkowate (h, i), eliptyczne {j M32, k NGC185, 
I M87), eliptyczne karłowate (m system Formax, n sy¬ 
stem Sekstans) 
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zdiecia^a>° na£!ui^r'lan/^ n ^l < ? n 2 e< ^y *^J^F ,e b J' które jest stokrotnie powiększonym wycinkiem środkowej częśc 
3'Muku ' aśw,etlano w,elokr otn'« krócej. Maksymalne zagęszczenie gwiazd na rys. b ma średnicę zaledwie 


226. Zewnętrzna część Mgławicy Andromedy rozdzielo¬ 
na na gwiazdy. Aby określić odległość Mgławicy trzeba 
wśród gwiazd wyszukać cefeidy i zmierzyć ich okresy 
zmian blasku 


227. Eksplozja w jądrze galaktyki M 87 Struga wypływa¬ 
jącej materii widoczna jest przy odpowiednio dobranym 
czasie naświetlenia. Zdjęcie 225 I przedstawia tę samą ga¬ 
laktykę (naświetlano je wielokrotnie dłużej) 



229. Centralna część gromady galaktyk Coma 


230. Kwintet Stefana. Przykład ciasnej grupy wzaiemnie oddziałujących galaktyk 


231. Wybuch w jądrze galaktyki (galaktyka M 82). Chmury materii oddalają się od jądra z prędkościami dochodzącymi do 3000 km/s 







tnai^e^^zwarfe iródlo^odclewon e e 1,aUrUS ^ Sklas V flkowana jako E2 ma nietypowy dla galaktyk eliptycznych równikowy pas ciemnej materii. W centrum galaktyk, 



